近期,机械学位点2023级硕士研究生燕顺在Information Fusion(中科院一区TOP期刊,IF:14.7?)上以第一作者的身份发表题为“Multi-scale convolutional attention frequency-enhanced transformer network for medical image segmentation”的研究性论文,PP电子学院为唯一单元。
該論文針對解決傳統Transformer局部特征提取不足以及細節信息缺失的缺點,提出了一種結合小波變換的多尺度卷積注意頻率增強Transformer網絡。旨在利用小波變換在差异尺度下同時保留圖像的時頻特征,有效捕捉高頻信息,如紋理和邊緣細節,以此提高圖像支解的精度。

图1 多尺度卷积注意频率增强Transformer网络

图2 分组可疏散聚合卷积模块(GSACM)和高效频率增强Transformer模块(EFTM)
该研究结果提出了可应用于疾病诊断、智能影像分析及智能医疗等医疗康健场景的新Transformer网络模型,获得国家自然科學基金“基于生成反抗网络的融合听觉和视觉信息的多模态人格识别研究项目”的支持。
論文鏈接:https://doi.org/10.1016/j.inffus.2025.103019