报告会主题:计算机视觉前沿技术及应用
报告地点:必赢bwin线路检测中心敬贤堂
报告时间:2024年11月30日09:00-12:00
报告专家:杨健、查正军、邹君妮、周连群、叶茫
学术报告(一)
报告专家:杨建
报告题目:《视觉感知:从2D图像到3D点云》
杨健,南京理工大学计算机学院教授,长期从事模式识别和智能系统方面的研究,在IEEE Transactions及Pattern Recognition等国际权威期刊和顶级会议上发表论文300余篇,谷歌学术被引50000余次。担任/曾担任国际学术期刊Pattern Recognition, IEEE Trans. on Neural Networks and Learning Systems等编委。2016年入选IAPR Fellow。曾获国家自然科学二等奖1项(第二完成人);省部级一等奖3项(第一完成人)。获2011年度国家杰出青年科学基金、2014年度教育部长江学者特聘教授;2018年入选万人计划科技创新领军人才。
报告内容:视觉感知是人工智能领域的前沿研究热点。本次报告将介绍课题组近期的部分工作,主要包括三个方面的内容:一、基于2D图像的底层视觉,如自动驾驶场景下视频去雾方法等;二、单目深度估计与补全,如基于离散余弦变换的渐进深度估计、点云引导的多视角分解深度补全方法等;三、基于3D点云的视觉感知,如基于扩散模型的点云目标配准方法等。
学术报告(二)
报告专家:查正军
报告题目:《真实场景低质量视觉增强与分析》
查正军,中国科学技术大学教授、博导,科研部部长、类脑智能国家工程实验室执行主任,国家杰出青年科学基金获得者、国家优秀青年科学基金获得者,入选国家创新人才引进计划青年项目、首届MIT TR35 China等。主要从事多媒体分析、计算机视觉、具身感知与交互、神经形态视觉等领域的研究,研究成果发表于一系列ACM/IEEE Transactions和CCF-A类会议长文。多次获得国际会议论文奖励,包括CCF A类会议 ACM Multimedia 最佳论文奖和最佳学生论文奖、AAAI 杰出论文奖等。获中国科学院青年科学家奖、安徽省自然科学一等奖、国家教学成果二等奖、安徽省教学成果特等奖等。先后主持科技部创新2030-新一代人工智能重大项目、基金委重点基金、联合重点基金等多项科研项目。担任IEEE Trans. PAMI、IEEE Trans. MM、IEEE Trans. CSVT、ACM Trans. MM等权威国际期刊编委。
报告内容:在诸多真实应用场景下,视觉数据在产生和获取的过程中受多种因素干扰而导致复杂的质量退化现象。低质量视觉数据严重影响视觉系统的性能和应用。本报告将介绍真实场景下低质量视觉数据质量增强和内容分析方面的研究工作。
学术报告(三)
报告专家:邹君妮
报告题目:《多媒体生成:从平面到流形》
邹君妮,上海交通大学特聘教授,博士生导师,国家杰出青年科学基金获得者(2021),国家优秀青年科学基金获得者(2016)。2008年在美国卡内基梅隆大学(CMU)从事研究;2011年-2012年,在美国加州大学圣地亚哥分校(UCSD)担任全职访问教授。2017年起,在上海交通大学计算机科学与工程系担任教授。先后获得上海市科技奖励一等奖4项,中国电子学会科技奖励二等奖3项,吴文俊人工智能科技奖励二等奖1项。主要研究领域:多媒体通信、高维视觉信息处理、几何深度学习等。主持国家自然科学基金重点等项目8项,共发表SCI、EI收录论文150 余篇,其中:IEEE Transactions汇刊论文50余篇,著名国际学术会议NeurIPS、ICML、CVPR、ECCV等45篇;合作出版专著2部,获中、美授权发明专利50项。曾担任国际期刊Digital Signal Processing编委。
报告内容:近年来,扩散模型在生成式建模任务中取得了巨大的成功。经典的扩散模型在正向过程中对输入信号不断添加高斯噪声,直至分布近似于标准高斯分布;生成过程从标准高斯分布中采样,逐步进行去噪,迭代生成图像。在基于二维图像的扩散模型启发下,许多研究开始关注高维流形结构的扩散模型。流形信号位于非欧式空间,为了实现精准的生成与重建,需要同时考虑原始数据的概率分布,以及流形信号的几何特征与拓扑结构。本报告将从几何学和深度学习的角度,介绍流形信号生成的最新进展,包括面向黎曼流形的去噪扩散模型、分数扩散模型、热扩散模型等方法;并进一步探讨在扩散模型中引入Ricci曲率流,学习流形信号内蕴几何特征的可能性。
学术报告(四)
报告专家:周连群
报告题目:《数字化生物医学检验技术医研产探索》
周连群,博士,研究员,博士生导师,现任中国科学院苏州生物医学工程技术研究所副所长,医学成像科学与技术系统重点实验室副主任,国家重点研发计划项目首席科学家,主要从事生物医学检验技术和装备研发。先后入选国家重大人才计划、中国科学院青年促进会优秀会员等。主持国家重点研发计划项目、国家自然科学基金面上项目、中科院重大科研仪器设备研制项目等国家/省部级项目10余项。担任“Biomedical Engineering Frontiers”、《光学精密工程》等期刊编委,任中国生物医学工程学会生物医学测量分会委员等委员。荣获科技部“全国科技系统抗击新冠肺炎疫情先进集体”、省科技进步一等奖等。发表SCI论文70余篇,申请发明专利70余项,授权发明30余项,国际PCT专利6项,获美国授权1项,专利转让/许可10余项。技术成果获批国家三类医疗器械注册证1项,作为重大创新成果入选中国科学院2024年度工作报告。
报告内容:生物医学检验为人体疾病的预防、诊断、治疗提供重要信息,是实现精准医疗、支撑分级诊疗的必要前提。检验手段灵敏度日益提升,特异性快速增强,应用范围迅速扩大,智能化渐趋成熟,价值日趋重要。新技术、新装备的研发和工程化一直制约着医学检验技术装备的临床应用和产业,如何突破新装备的工程化“瓶颈”,一直是医学界、科研界和产业界思考的问题。本团队面向生物医学检验的迫切临床需求,通过“医工融合、交叉探索”的研发方式,围绕生物医学检测技术的研发和工程化进行了思考和探索。本团队面向肿瘤液体活检的循环肿瘤细胞、核酸分子等检测对象聚焦基于数字化微孔的液体活检创新方法和检测新技术,以期对检验医学贡献新技术和新策略,助力重大疾病的基础研究和临床诊断。
学术报告(五)
报告专家:叶茫
报告题目:《基础模型驱动的多模态行人检索与生成》
叶茫,武汉大学教授,国家优青(海外)、中国科协青年托举人才。主要研究方向多媒体检索、多模态理解、联邦学习等,发表国际期刊会议论文 100 余篇,其中第一/通讯作者发表 CCF-A 类论文60余篇,谷歌学术引用 9000 余次。担任CCF-A类期刊IEEE TIFS等期刊编委,多次担任CVPR、ICLR、ACM MM、ECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021-2024斯坦福排行榜 “全球前2%顶尖科学家”、2022年度百度AI华人青年学者等荣誉。
报告内容:多模态行人检索在智慧城市等领域有重要应用,现有方法通常独立的去研究单一的跨模态检索任务,极大的限制了实际不确定场景的灵活性,本次报告将介绍如何利用多模态预训练模型,构建不确定多模态场景下的行人检索基础模型等相关工作,同时分享文本引导的人像生成相关研究进展及展望多模态行人理解未来趋势。