我校颜成钢教授成果被信号处理及其应用领域顶级会议ICASSP录用

近日,我校颜成钢教授团队以杭州电子科技大学为第一单位发表的论文《IMPROVING RADIOLOGY REPORT GENERATION WITH D^2-NET: WHEN DIFFUSION MEETS DISCRIMINATOR》被信号处理及其应用领域顶级会议ICASSP录用。

此项研究由杭州电子科技大学、中国科学技术大学合作完成,该工作第一作者为2021级研究生金裕达,指导老师是中国科学技术大学的毛震东教授和杭州电子科技大学的颜成钢教授。作者金裕达表示,医学影像报告生成工作一直由自回归方法主导。但是医学影像报告的文本较长,自回归方法的计算量会随着文本长度立方倍增长。与此同时,训练阶段和推理阶段条件不一致,在文本推理过程中会累积错误。为了避免上述自回归方法带来的弊端,论文提出使用扩散模型的方式实现医学影像报告生成任务。首先,文本中的单词ID被映射成二进制01数字串,随后在01数字串的基础上进行加噪声过程和去噪声过程,解决了离散文本信息无法直接添加噪声的问题。拟合噪声的模型使用无掩码的Transformer,避免了张量堆叠。它包括一个图像编码器和文本解码器。论文遵循DDIM的采样方法,在训练阶段一次性恢复原始数据,在推理阶段通过循环迭代的方式恢复原始数据。此外,为了缓解非自回归方式导致的生成文本长度异常的问题,论文引入了一个判别器,用来约束生成文本中<EOS>Token的位置。论文在两个公开数据集上进行了广泛的实验,结果表明本方法优于大部分自回归方法。

杭州电子科技大学“智能信息处理实验室”(HDU IIPLab)主任为颜成钢教授。实验室现有在职教师30余名,含4位国家级人才及多位省级人才,包括“海外引才计划”特聘教授、“海外引才计划”青年学者、浙江省“钱江学者”特聘教授、浙江省杰出青年基金获得者、浙江省“151人才工程”第一层次、浙江省高校中青年学科带头人重点资助等多名国家及省部级人才。现有硕博生100余名,毕业生多就职于阿里巴巴、腾讯、字节跳动、海康威视、华为、网易等国内知名大公司。实验室采用与海内外知名高校、研究所(清华大学、北京大学、中国科学院、美国北卡罗来纳大学教堂山分校、澳大利亚悉尼科技大学等等)联合培养制,长期致力于智能信息处理方面的研究,主要研究方向包括:机器学习、模式识别、计算机视觉、计算机图形学、医学影像处理、生物信息学等。实验室为学校交叉创新团队,拥有自由开放的学术氛围和国际前沿的研究方向,可以在多个学院招生,包括但不限于通信、自动化、计算机、电子等学院。


联系我们

联系人:孙老师

电话:0571-86878691

工作电话:0571-86878691

电子邮箱:syq@hdu.edu.cn

智能信息处理实验室

浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学