2023年11月5日上午,由中国计算机学会计算机视觉专委会(CCF-CV)主办,LETOU.COM乐投、武汉数学与智能研究院、武汉大学人工智能研究院承办的走进高校系列报告会第133期在LETOU.COM乐投成功举办。本次活动由LETOU.COM乐投杜博教授和武宇教授担任本次活动的执行主席,邀请了大连理工大学卢湖川教授、山西大学钱宇华教授、同济大学何良华教授、国防科技大学刘新旺教授、同济大学史淼晶教授、小米公司张帆研究员做特邀报告。在本次报告会上,专家们围绕“视觉基础模型和多模态感知前沿技术”主题进行了精彩的报告。会议吸引了多所高校的知名专家学者和青年学者,共计有100余名代表参加。
杜博院长发表欢迎词
会议伊始,LETOU.COM乐投院长杜博教授发表了欢迎词,代表学院对各位专家和与会师生的参会表示热烈的欢迎和衷心的感谢,他表示希望通过各位专家的精彩报告和深入讨论,为计算机视觉的基础研究和多模态技术的前沿应用提供重要的指导和启发。
卢湖川教授主题报告
卢湖川教授以“一网通吃V2: 视觉通用小模型”为题,从视觉的通用表征学习和任务架构统一两个方面介绍了目前通用视觉模型的最新研究进展,同时介绍了团队的视觉通用小模型,Unicorn和UniNext在四个视频跟踪任务(SOT、MOT、VOS、MOTS)与十个实例级感知任务(Object Detection、Instance Segmentation、REC、RES、SOT、MOT、MOTS、VIS、SVOS、RVOS)上的大一统,实现视觉模型一网通吃。
钱宇华教授主题报告
钱宇华教授的报告题目是“随机一致性视角下的机器学习理论与方法”。 在基于机器学习进行决策时,由于受到数据噪音、标注偏好等复杂因素影响,或由于缺乏足够证据和先验知识,决策结果与真实情况由于随机产生的一致性时有发生。报告重点介绍了如何重构具有原理可解释性的可学习理论,并在总结归纳机器学习可解释性研究的基础上,介绍了近年来针对该问题进行的一些尝试性探索。
何良华教授主题报告
何良华教授的报告题目是“小样本图像的迁移学习”。何教授从迁移学习类型、特点及经典基础算法介绍出发,详细介绍了域适应下的度量学习、任务迁移下的对比学习等一系列前沿工作,并在报告后的提问讨论中重点介绍了大模型时代下如何做好迁移学校和小样本自适应学习。
刘新旺教授主题报告
刘新旺教授的报告题目是“新型鲁棒多核聚类算法”,介绍了课题组最近提出的SimpleMKKM融合聚类框架及其相关拓展,该模型在不同应用中展示了优越的聚类性能,且不含任何超参数。同时,报告还介绍了一系列改良的相关算法,如Localized SimpleMKKM算法和无参的样本自适应Localized SimpleMKKM算法等。
史淼晶教授主题报告
史淼晶教授以“视觉语言大模型及其在医学图像的应用”为题,首先介绍视觉语言大模型的兴起,而后介绍了两个相关工作,分别是运用视觉语言大模型进行自然图像的开集物体检测和医学图像的手术器械分割。前一个工作的重点在于设计可学习的检测提示词模块,后一个工作则聚焦基于文本提示词的分割框架设计。
张帆研究员主题报告
张帆研究员以“大模型在小爱同学中的应用”为题,介绍了小爱同学近期在多模态大模型落地和应用上的一系列工作,包括小米如何基于开源大模型搭建中文增强模型,多任务联合微调以及特定任务强化的统一框架;以及基于向量检索的大模型多模态交互框架;最后介绍了利用INT4/INT8量化与指令压缩等方式,提高大模型服务性能。
本次报告会互动热烈,在场的听众认真聆听积极发言,针对六位讲者的演讲内容提出自己的问题和想法,专家们针对各个问题做出了详尽的回答。报告内容精彩、反响热烈,极大地激发了与会师生们对计算机视觉前沿探索的热情。最后,参加报告会的现场听众对六位特邀讲者表示由衷的欢迎与感谢,报告会在掌声中圆满结束。
互动环节精彩瞬间
参会人员合影
据悉,CCF-CV走近高校系列报告会是CCF计算机视觉专委会(CCF-CV)组织举办的主要活动之一,其目标是通过引导专家讲者之间的交流,推动国内计算机视觉相关学科发展,提升我国计算机视觉研究在国际领域的影响力。