- 王海;李亚鸽;林愉萱;陆雪松;
卷积神经网络(CNN)在医学图像分割中取得了显著的进展,但其在捕捉长距离依赖信息方面存在局限性.虽然Transformer模型在处理远程依赖方面表现出色,但自注意力机制导致了较高的计算成本.为了解决这些问题,提出了多尺度医学图像分割网络VMA-UNet(VMamba ASPP U-Net),它融合了VMamba的VSS块结构和空洞空间卷积池化金字塔(ASPP)模块.VMA-UNet利用VSS块的线性复杂度特性,实现高效的全局信息建模,并结合ASPP模块在多个尺度上捕捉医学图像中的关键特征.通过在ACDC、COVID-19 CT和Synapse等数据集上的广泛实验,结果表明:VMA-UNet在分割精度和计算效率上均优于基于CNN和Transformer方法,显示了其在不同任务中的竞争力.VMA-UNet克服了CNN在捕捉远程信息方面的局限性,实现了高效的多尺度建模,展现了其在医学图像分割中的巨大潜力.
2026年01期 v.45;No.170 51-59页 [查看摘要][在线阅读][下载 1106K] [下载次数:564 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:8 ] - 张一帆;李响;周慧;田敏;高军峰;
为了研究重复性亚脑震荡(Repetitive Subconcussion,RS)患者的脑网络时空变异性和转换复杂性,对25名跳伞运动员和25名健康对照的微状态参数以及微状态转换序列的Lempel-Ziv复杂度、样本熵、排列熵进行分析。研究结果发现RS患者的微状态B的覆盖率显著升高、微状态D的覆盖率显著降低、微状态C和微状态D的相互转换概率显著降低,微状态转换序列的Lempel-Ziv复杂度、样本熵、排列熵显著升高。使用微状态参数和非线性特征参数作为特征集,结合特征重要性排序与特征选择,分类准确率、敏感性、特异性最高都能达到80%以上,表明以上特征向量可以作为识别RS人群较好的生物标志物。
2026年01期 v.45;No.170 60-68页 [查看摘要][在线阅读][下载 1190K] [下载次数:40 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ] - 谌潼;谢勤岚;
获取更深层次和更多维度的图像特征有助于3D医学图像分割网络更精确、更稳定地分割图像.现有的3D医学图像分割方法通过提取图像空间特征和通道特征来获取非局部的图像特征的能力有限.为了提取更全面的图像特征,提出了SC-UNet模型.该模型通过外部空间通道注意力块不仅可以捕获图像的空间特征和通道特征,还可以提取图像空间特征与通道特征之间的强相关性.通过并行卷积注意力块能从空间和通道的角度自动学习和获取空间和通道特征.将外部空间通道注意力块和并行卷积注意力块使用拼接的方式进行结合.实验使用MSD数据集进行评估,结果表明SC-UNet模型的DSC为85.51%,比基线模型UNETR++高0.85%,比nn-UNet高1.41%.
2026年01期 v.45;No.170 69-76页 [查看摘要][在线阅读][下载 1184K] [下载次数:118 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 李娅;周斌;胡波;
声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各自身份,该任务的关键在于提取具判别力的说话人特征.为此提出了多粒度特征融合模型(MGFF-TDNN),在MGFF-TDNN中,首先使用二维深度可分离卷积模块(DSM)作为前端特征提取器,以增强时频域特征的建模.其次,为了实现多粒度特征融合,设计了多粒度融合结构(M-TDNN),采用时延神经网络和音素级特征池化来捕获不同粒度的信息.在VoxCeleb数据集上的实验表明:MGFF-TDNN模型在使用了更少的参数量(4.78M)和计算资源(1.49G的浮点计算量)的情况下,仍表现出良好的性能.
2026年01期 v.45;No.170 77-85页 [查看摘要][在线阅读][下载 939K] [下载次数:176 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 李轩;李艳红;徐昊翔;黄健翔;陈亮亮;
高精度的交通流预测可以有效缓解智能城市道路的拥堵压力.然而,交通流预测面临着如何有效揭示交通流数据中隐藏的时空依赖关系的挑战.目前大多数方法都是基于图神经网络(GNN)或变压器模型.前者只考虑短程空间信息,无法捕捉长程空间依赖关系,而后者虽然能够捕捉长程依赖关系,但大多数研究都没有充分挖掘变压器架构的潜力.为此,提出了一种用于交通流预测的新型负载感知空间异质性变换器,即LSFormer.具体来说,为空间自注意力模块设计了相对位置编码以优化空间位置信息感知问题,使模型能更好地捕捉位置信息.然后,引入了负载感知模块,以突出周边交通流对中心点的影响,解决了现有方法对周边区域依赖关系建模不足的问题.在5个真实世界公共交通数据集上的广泛实验结果表明:文中所提模型可以达到先进的性能.此外,还将学习到的空间嵌入可视化,使模型具有可解释性.
2026年01期 v.45;No.170 86-96页 [查看摘要][在线阅读][下载 1184K] [下载次数:58 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ] - 雷建云;田祚汉;夏梦;雷瑞璠;
针对森林火灾检测对实时性要求较高的问题,提出了一种基于改进YOLOv8的森林火灾检测方法 .在YOLOv8的基础上,采用轻量化特征提取网络EfficientNet优化YOLOv8原主干网络CSPDarknet53,以减少计算量并提高模型的收敛速度,进而提高火灾检测速度.此外,融入了SENet注意力机制模块,以增强网络对火灾检测的准确性.使用α-IoU损失函数代替YOLOv8原始损失函数中的CIoU损失函数来计算定位损失,该函数能够自适应地调整IoU的阈值,更好地处理不同大小和形状的目标,同时提高模型对小目标的检测性能.结果表明:该方法的平均准确率(mA@0.5P)达到了87.2%,帧率(FPS)提升了17帧,显著提高了火灾检测的实时性.
2026年01期 v.45;No.170 97-105页 [查看摘要][在线阅读][下载 1138K] [下载次数:401 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]