上海大学学报(自然科学版)

基于流形假设的骨架序列动作识别算法

彭亚新, 赵倩

2022, 28(2): 179-200. doi:10.12066/j.issn.1007-2861.2316

摘要 ( 1917 )

HTML ( 173)

PDF (6801KB) ( 394 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

骨架数据是通过对动作的空间几何位置进行编码获取,可以避免冗余背景信息的干扰, 是动作识别领域常用的数据类型之一.现有骨架数据的动作识别主要分为经典的骨架数据表征和基于深度学习的骨架动作识别应用.相较于传统欧氏度量下的识别方法,流形为更好地研究非线性结构提供了重要数学工具. 然而,目前仍缺乏利用流形假设对骨架数据进行动作识别的相关总结. 因此,从骨架表示、轨迹时间对齐、动作序列表征以及动作分类 4 个关键步骤出发,系统地总结了基于流形假设的动作识别工作,对比了各项工作在基准数据集上的表现. 最后,根据当前动作识别工作的发展趋势,对流形假设在动作识别方向上的进一步改进进行了展望.

考虑停车位置和步行成本的双起点单讫点通勤均衡分析

唐廷彩, 姜锐

2022, 28(2): 201-214. doi:10.12066/j.issn.1007-2861.2363

摘要 ( 1322 )

HTML ( 18)

PDF (1242KB) ( 126 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

考虑来自两处不同居住地的通勤者, 经由两条完全不重叠的含有瓶颈的道路,到达同一个工作地上班的问题, 引入两组通勤者对于停车位的竞争,在瓶颈模型的基础上, 构造停车位置函数,建立了考虑步行成本的出发时间选择模型.根据两组通勤者通勤高峰开始及结束的早晚关系, 将均衡状态分为 4 种情形, 并进一步考虑通勤者准点到达时刻, 分为 14 种子情形,推导得出了通勤者的出发和到达曲线. 最后,通过算例分析了两组通勤者时间价值相同且两条道路的瓶颈通行能力相同的条件下,均衡态随步行速度、出行人数变化的情况.

车辆进小区的瓶颈效应及其对路段交通流的影响

盛哲, 周文海, 高庆飞, 董力耘

2022, 28(2): 215-225. doi:10.12066/j.issn.1007-2861.2292

摘要 ( 1774 )

HTML ( 11)

PDF (2464KB) ( 172 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

车辆提前减速进入居民小区会形成一个交通瓶颈, 尤其在晚高峰期间会明显降低道路通行能力. 基于考虑慢启动效应的 VDR(velocity dependent randomization) 模型, 并引入期望时间反映车辆进入小区前的提前减速行为, 研究了单向单车道和双向两车道两种情况. 模拟结果显示: 当入区概率较大时, 存在一个临界进车概率, 当进车概率大于临界值时, 出现一个流量平台. 临界进车概率及其对应的流量值随入区概率的增加而减小; 当进车概率小于临界值时, 双向两车道系统流量要大于单向单车道. 双向两车道时路段上存在 3 个瓶颈, 即小区入口以及上下游路口. 小区入口与路口保持一定距离, 可减少瓶颈之间的干扰, 则小区入口位置的变化对道路通行能力的影响不明显.

基于语音能量比的解决频域ICA次序不确定性问题的算法

王志强, 王涛, 金志文

2022, 28(2): 226-237. doi:10.12066/j.issn.1007-2861.2239

摘要 ( 1554 )

HTML ( 10)

PDF (3504KB) ( 181 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

随着人工智能物联网(artificial intelligence & internet of things, AIoT)的发展, 硬件技术的飞速进步, 更多的智能音箱进入人们的生活, 人机交互方式也从早期的遥控变成了人声控制. 但设备中麦克风采集到的语音信号往往含有大量噪声和干扰人声, 为此需对麦克风采集到的语音进行语音分离处理. 常用的技术有频域独立成分分析(independent component analysis, ICA), 但是频域ICA存在次序不确定性问题, 即将分离出的源1分量分类到源2通道, 将分离出的源2分量分类到源1通道, 从而导致分离性能大大降低. 为此, 提出一种基于语音能量比来解决频域ICA中次序不确定性问题的算法, 有效地提高了分离性能. 在SiSEC(Signal Separation Evaluation Campaign)、ChiME(Challenge for Computational Hearing in Multisoure Environments)数据集上对分离性能进行实验, 所得结果比已有算法均有提升, 且针对强混响环境下的混合信号依然保持良好的分离性能.

基于改进樽海鞘群算法的到达时间差定位

马一鸣, 石志东, 赵康, 贡常磊, 单联海

2022, 28(2): 238-249. doi:10.12066/j.issn.1007-2861.2237

摘要 ( 4149 )

HTML ( 10)

PDF (991KB) ( 220 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

针对室内到达时间差(time difference of arrival, TDOA)位置估计中的非线性最优化问题, 提出用改进的樽海鞘群算法搜索目标位置. 通过选择最优主基站构造改进的适应度函数, 使适应度函数可以更好地反映解的优劣程度, 提高了搜索精度. 在初始樽海鞘种群中引入近似解, 使全局搜索的步骤得到简化, 加快了算法前期收敛速度. 采用自适应跟随策略更新追随者位置, 解决局部开发低效问题, 加快了算法后期收敛速度. 仿真结果表明, 基于改进樽海鞘群算法的 TDOA 定位技术相比其他元启发式算法具有更高的定位精度和更快的收敛速度.

基于颜色复杂度和结构张量的恰可察觉失真模型

王闯, 王永芳, 练俊杰

2022, 28(2): 250-260. doi:10.12066/j.issn.1007-2861.2276

摘要 ( 2011 )

HTML ( 11)

PDF (13888KB) ( 177 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

图像的恰可察觉失真(just noticeable distortion, JND)阈值是指人眼能够察觉的最小失真, 通常被用于去除图像/视频压缩中的视觉冗余. 针对 JND 模型对颜色和结构特征利用不充分的问题, 提出了一种基于颜色复杂度和结构张量的 JND 模型. 首先, 计算图像的颜色复杂度, 将其转换为与视觉敏感度相关的权值, 和对比掩蔽模型结合以提升模型的准确性; 然后, 利用结构张量对局部特征进行表示, 建立基于局部结构特征的调制因子, 估计结构不规则区域的视觉冗余程度; 最后, 将基于颜色复杂度的 JND 模型和基于结构张量的调制因子结合, 建立基于颜色复杂度和结构张量的 JND(complexity structure tensor based JND, CSJND)模型. 实验结果表明, 相比于已有的模型, 该模型在主观感知质量相同的前提下, 能使 PSNR 值明显降低; 该模型更加符合人眼的视觉特性, 能更准确地估计出 JND 阈值.

基于深度学习的图像抠图技术

王榕榕, 徐树公, 黄剑波

2022, 28(2): 261-269. doi:10.12066/j.issn.1007-2861.2287

摘要 ( 1928 )

HTML ( 54)

PDF (5423KB) ( 543 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

图像抠图(image matting)技术是图像编辑技术的基础, 广泛应用于影视后期制作和日常生活. 基于深度学习的图像抠图网络, 通过输入的原图和三元图来估计每个像素的 $\alpha$ 值. 在原下、上采样的图像抠图技术基础上, 针对抠图数据集图像差异较大容易造成网络收敛较慢的问题, 在每个卷积层后加入了批量标准化(batch normalization, BN)层, 对输入数据进行归一化操作, 加快模型收敛速度, 同时参数更新方向更符合数据集整体特性; 针对抠图任务需要更关注物体边缘部分的特点, 使用可变形卷积(deformable convolution)层替换普通卷积层. 可变形卷积层会根据不同输入数据自适应学习卷积核形状, 有效扩大感受野范围, 在细节部分有更好的预测效果.

基于分层标注的中文嵌套命名实体识别

金彦亮, 谢晋飞, 吴迪嘉

2022, 28(2): 270-280. doi:10.12066/j.issn.1007-2861.2283

摘要 ( 2040 )

HTML ( 34)

PDF (1410KB) ( 279 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

中文命名实体识别在中文信息处理中扮演着重要的角色. 在中文信息文本中, 许多命名实体内部包含着嵌套实体. 然而, 已有研究大多聚焦在非嵌套实体识别, 无法充分捕获嵌套实体之间的边界信息. 采用分层标注方式进行嵌套命名实体识别(nested named entity recognition, NNER), 将每层的实体识别解析为一个单独的任务, 并通过Gate过滤机制来促进层级之间的信息交换. 利用公开的1998年《人民日报》NNER语料进行了多组实验, 验证了模型的有效性. 实验结果表明, 在不使用外部资源词典信息的情况下, 该方法在《人民日报》数据集上的F1值达到了91.41%, 有效提高了中文嵌套命名实体识别的效果.

基于图拉普拉斯的多标签类属特征选择

吴喆君, 黄睿

2022, 28(2): 281-290. doi:10.12066/j.issn.1007-2861.2243

摘要 ( 4145 )

HTML ( 8)

PDF (794KB) ( 159 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

多标签特征选择能够有效去除冗余特征并提升分类精度, 是解决"维数灾难"问题的有效方法. 然而, 已有的多标签特征选择算法是对所有标签选择出相同的特征, 忽略了标签与特征之间的内在联系. 事实上, 每个标签都具有反映该标签特有属性的特征, 即类属特征. 提出一种基于图拉普拉斯的多标签类属特征选择(multi-label label-specific feature selection based on graph Laplacian, LSGL)算法. 对于每个类别标签, 基于拉普拉斯映射获得数据的低维嵌入, 再通过稀疏正则化获得数据空间到嵌入空间的投影矩阵, 接着通过分析矩阵系数确定每个标签相应的类属特征, 最后使用类属特征进行分类. 在 5 个公共多标签数据集上的多标签特征选择与分类实验结果证明了所提算法的有效性.

钨/石墨烷/钨第一壁材料缺陷与力学性能的第一性原理计算

郭顺, 张兆春, 谢耀平, 郭海波

2022, 28(2): 291-303. doi:10.12066/j.issn.1007-2861.2240

摘要 ( 1604 )

HTML ( 10)

PDF (9998KB) ( 220 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

托卡马克装置是实现可控热核聚变的主要装置之一, 而第一壁材料在确保托卡马克装置稳定运行的过程中起着至关重要的作用. 钨金属已被广泛使用作为第一壁材料, 但是聚变反应产生的氦原子在进入钨晶体后易形成"氦气泡"和点缺陷, 严重影响托卡马克装置第一壁材料的稳定性. 首次设计将钨/石墨烷/钨体系作为第一壁材料. 第一性原理计算结果表明, 钨/石墨烷/钨第一壁材料中的界面可以捕获氦原子和空位, 且能促进自填隙钨原子与空位复合, 从而降低钨体相中的缺陷密度; 弹性常数计算结果表明, 石墨烷层的存在可以提高钨金属的柯西压力值($C' $)和各向异性因子($A$), 使第一壁材料的延展性得以提高, 且不易出现裂纹, 但是在相同温度下钨/石墨烷/钨第一壁材料的力学模量有所下降; 利用准简谐德拜模型计算吉布斯自由能 $G^*$、定容热容$C_\mathrm V$、熵($S$)等热力学函数结果表明, 钨/石墨烷/钨第一壁材料的热力学稳定性与纯钨金属相比有所下降.

不同结构 ZnO 的可控合成及其对气敏性能的影响

李绅, 周荻雯, 何新华, 李飞, 宁珠凯, 焦正

2022, 28(2): 304-313. doi:10.12066/j.issn.1007-2861.2285

摘要 ( 2197 )

HTML ( 12)

PDF (13569KB) ( 254 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

材料的微观形貌是影响其气敏性能的主要因素. 低维结构材料因反应时的团聚问题, 极大地限制了其应用. 因此, 通过设计合成多级结构的纳米材料来提高性能至关重要. 通过控制水热时间、阴离子表面活性剂柠檬酸钠的浓度以及 pH 值来调节形貌, 在水热条件下成功合成了多级片球状、片花状以及馒头状 3 种形貌的 ZnO 纳米材料. 通过对气敏性能进行测试, 发现多级片球状形貌具有较好的气体敏感性. 在 340 ${^\circ}$C 时, 对 100$\times10^{-6}$ 正丁醇的气敏响应达到 238, 比相同条件下的乙醇高 2.12 倍, 显示出了较好的选择性. 通过研究多级结构的生长机理及传感机制, 为设计多级体系结构 ZnO 高性能气敏材料提供了数据依据.

面向遥感图像的小样本目标检测改进算法研究

李成范, 赵俊娟

2022, 28(2): 314-323. doi:10.12066/j.issn.1007-2861.2352

摘要 ( 1820 )

HTML ( 26)

PDF (6200KB) ( 323 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

针对传统的遥感图像目标检测中面临的小样本以及目标样本分布不均衡等问题, 提出了一种基于改进的卷积神经网络(convolutional neural network, CNN)的遥感图像小样本目标检测算法. 首先, 该算法利用 $K$ 近邻($K$-nearest neighbor, kNN)回归分别对每个点和卷积层提取特征构建局部邻域; 同时, 通过最大池化聚合所有局部特征进行全局特征表示; 最后, 采用全连接层与缩放指数型线性单元(scaled expected linear unit, SELU)激活函数计算各类别对应的概率并分类. 实验结果表明, 该算法能够更有效地融合局部特征, 提高了遥感图像小样本目标识别与检测的精度, 同时保持信息的非局部扩散.

磁耦合谐振式超导无线输电频率特性

代朋, 韩淑伦, 周迪帆, 郭艳群, 蔡传兵

2022, 28(2): 324-332. doi:10.12066/j.issn.1007-2861.2320

摘要 ( 1589 )

HTML ( 6)

PDF (2722KB) ( 208 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

传统无线输电系统在低频条件下的传输效率较低, 限制了其在电动汽车、水下潜艇等低频大功率无线输电场景的应用. 针对此问题, 提出使用高温超导线圈替代铜线圈的解决方案. 通过理论分析和实验验证, 研究了不同工作频率下超导与铜无线输电系统的传输特性. 结果表明, 超导线圈相比于铜线圈具有更低的电阻和更高的品质因数, 在低频条件下超导线圈具有独特优势, 同时证明了在低频工作的无线输电系统中, 使用超导线圈可大幅提升系统的输出功率和传输效率.

电荷比特的超强藕合实现及量子态转移

俞静, 周沫, 黄堂友, 郝敏佳, 陈玺

2022, 28(2): 333-346. doi:10.12066/j.issn.1007-2861.2345

摘要 ( 1361 )

HTML ( 7)

PDF (1951KB) ( 182 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

基于超导量子电路中光与物质相互作用强度的可调性, 研究了库珀对盒子(Cooper-pair box, CPB)与LC谐振电路耦合的电路模型, 证明了可以通过减小CPB的约瑟夫森能量和增加LC谐振子阻抗, 实现光与物质的超强耦合(ultra-strong coupling, USC)和深度强耦合(deep-strong coupling, DSC)相互作用. 在此基础上, 进一步提出了具有一定抗噪性的 USC 双比特超导电路模型, 并以该模型作为非相干中介实现了两个Transmon系统间的量子态转移(quantum-state transfer, QST). 研究结果为在超导量子系统中实现USC相互作用提供了新的方案, 并有望进一步应用于量子调控、量子模拟和量子信息处理等领域.

$\bf\Lambda _{\bf c} \textbf{(2880)}^{\bf +} \textbf{2}$D波激发态的强衰变

李阳, 张爱林

2022, 28(2): 347-356. doi:10.12066/j.issn.1007-2861.2324

摘要 ( 1363 )

HTML ( 38)

PDF (1851KB) ( 298 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

在$^3P_0 $模型框架下, 计算$\Lambda _{c} (2880)^+$作为2D波激发态的衰变宽度和分支比, 确定其量子态并探究内部激发模式. 计算结果表明: $\Lambda _{c} (2880)^+$有可能是2D激发态$\Lambda _{{c}2} \big(\frac{3}{2}^+\big)$, $J^P=\frac{3}{2}^+$, 且$n_\rho =1$、$l_\lambda =2$, 为径向$\rho $激发、轨道$\lambda $激发的激发模式, 总衰变宽度${\it\Gamma}_{total} =18.53$ MeV, 分支比比值$R={\it\Gamma}(\Lambda _{c}(2880)^+\to \Sigma _{c}(2520)\pi)$/${\it\Gamma}(\Lambda _{c} (2880)^+\to \Sigma _{c} (2455)\pi)=0.16$; 也可能是2D激发态$\Lambda _{{c}2}^{'}\big(\frac{3}{2}^+\big)$, $J^P=\frac{3}{2}^+$, 且$n_\lambda =1$、$l_\lambda =2$, 为径向$\lambda $激发、轨道$\lambda $激发的激发模式, 总衰变宽度${\it\Gamma} _{total} =1.69$ MeV, 分支比比值$R={\it\Gamma}(\Lambda _{c} (2880)^+\to \Sigma_{c}(2520)\pi )$/${\it\Gamma} (\Lambda_{c} (2880)^+\to \Sigma_{c}(2455)\pi )=0.10$.

当期目录