2019年7月19日下午14:00,科研课题报告在杭州电子科技大学科技馆五楼会议室进行,参加人员包括实验室全体师生和本次会议的报告人王鑫超教授、袁霖博士和蒲晓博士(IIPL实验室合作老师)。
王鑫超教授是 Stevens Institute of Technology 计算机科学系的助理教授。他的主要研究兴趣包括计算机视觉,应用机器学习,多媒体和大数据分析。在加入Stevens Institute of Technology 之前,他是 University of Illinois Urbana-Champaign (UIUC) 贝克曼研究所形象与专业(IFP)小组的博士后。 2015年,他在洛桑联邦理工学院(EPFL)的计算机视觉实验室获得博士学位。于2010年在香港理工大学计算机系获得一流的荣誉学士学位。
多目标跟踪(MOT)是计算机视觉中的一项重要任务,其目标是在保留其身份的同时跟踪对象的状态。 在本次报告中,王鑫超教授讨论了MOT和他所提出的模型用来处理它们的几个主要挑战。 王鑫超教授展示了广泛的应用场景,从视频监控到体育分析,再到医学图像分析。
袁霖博士,2011年毕业于电子科技大学,于2013年和2017年从瑞士洛桑联邦理工学院分别获得电子工程专业硕士与博士学位。个人研究兴趣包括多媒体信号处理,图像视频编码,隐私保护与机器学习。现就职于荷兰Irdeto公司,从事媒体安全与视频内容保护的研发工作。曾在Technicolor德国研究所实习。
随着图像分析、人脸识别、深度学习技术广泛应用于社交媒体,照片隐私已经引起了越来越多的关注。如果部署得当,这些强大的技术可以反过来帮助人们增强他们的在线隐私。一种可能的方法是基于分析图像内容和学习用户共享行为来构建强大的自动和动态访问控制机制。袁霖博士的研究提出了一种基于机器学习的依赖于上下文和隐私感知的照片共享模型。所提出的模型利用图像语义和请求者上下文信息来决定是否在特定上下文中与特定请求者共享特定图片。为了评估所提出的模型,对23名受试者进行了用户研究,并收集了包含1018个手动注释图像的数据集,其具有12216个个性化的上下文共享决策。进行了评估实验,结果表明所提出的照片共享决策模型具有良好的性能。此外,研究了不同类型特征对决策的影响,其结果验证了预定义特征的有用性,并暗示了用户共享行为和隐私态度之间的显着差异。
蒲晓博士,2014年于德国亚琛工业大学获得计算机硕士学位,2014-2018年于洛桑联邦理工学院攻读博士学位,主要研究领域包括机器翻译,自然语言处理与机器/深度学习。目前就职于美国Nuance公司德国总部,在车载智能研发部担任Senior Research Engineer. 主要从事车载智能模型以及用户个人兴趣模型的设计研发工作。
多义词的正确翻译仍然是机器翻译的挑战。尽管一些翻译选项可以是可互换的,但是源词的基本上不同的感觉通常必须通过不同的翻译来呈现。蒲晓博士的工作证明了词义消歧(WSD)可以通过扩展在对潜在模糊词的感官建模时考虑的源上下文来改进神经机器翻译(NMT)。首先为基于k均值,中国餐馆流程和随机游走的WSD引入三种自适应聚类算法,然后将其应用于在低秩空间中表示的大词语境,并在SemEval共享任务数据上进行评估。然后,在最先进的NMT系统中,与最好的WSD方法定义的感知向量一起学习单词向量。蒲晓博士的工作证明了这些向量的连接,以及基于有义向量的加权平均的感知选择机制的使用,优于包括感知的几个基线。
实验室的学生认真聆听本次科研报告,并就相关领域的问题与与报告的老师进行了交流。
联系人:孙老师
电话:0571-86878691
工作电话:0571-86878691
电子邮箱:syq@hdu.edu.cn
智能信息处理实验室
浙江省杭州市杭州经济开发区白杨街道2号大街1158号 杭州电子科技大学