17吃瓜

主页-->科学研究-->教学科研动态

IT讲坛2026年第1期:中国电子学会虚拟现实分会走进17吃瓜

时间:2026-01-16 10:32:54 文章来源 :学科 浏览量:142

会议主题:中国电子学会虚拟现实分会走进17吃瓜

讲座时间:2026年1月24日13:30

讲座地点:勤12-304

报告1题目:面向智能协作的去中心化神经计算框架及应用探索

内容:深度学习已取得巨大成功,然其以规模化为核心目标的技术体系存在过度中心化、计算复杂、能耗巨大等问题,并非模拟人脑机制的最优方式。本报告以马文-明斯基提出的“人类大脑为智能体心智社会”学说为出发点,从神经元连接建模角度出发,阐述了如何从哈密顿动力学视角将神经元系统解耦和去中心化,并将不同粒度的神经单元间的作用关系用路径积分进行建模计算,建立了基于欧氏/黎曼假设的神经元状态空间理论。从通讯角度,探讨神经元、组块、模型、模型智能体等不同层级的智能协作计算的可行性,介绍在语言、视觉、图等模态上的模型预训练和微调方法。结合工业场景需求,介绍多智能体协作的应用效果,最后对未来发展方向和应用前景进行讨论。

报告人简介:

王树徽,中科院计算所研究员,博导。从事多模态智能计算、神经计算理论方法、机器学习等方向研究,在人工智能领域顶级期刊和会议论文120余篇,申请专利20余项;承担科技部重点研发计划课题、基金委青年科学基金(B类)等十余项国家级/省部级项目;担任AAAI、ACMMM等顶级国际学术会议领域主席及多个国内外高水平学术期刊的编委或客座编辑,获得吴文俊人工智能自然科学一等奖、北京市科技进步二等奖等奖励,研究成果在智能制造、辅助设计、网络内容服务、视频分析等场景中得到验证和应用。


报告2题目:开放环境多模态预训练模型高效学习与应用

内容:多模态预训练模型通过自监督学习范式对不同模态的基础表征进行统一建模,能够有效抽取跨模态的抽象概念与共性知识,相较于单一视觉或语言预训练模型展现出更强的通用性与任务迁移能力。近年来,该类模型在多模态问答、跨模态生成等任务中取得了显著进展。然而,在开放环境的真实应用场景中,其跨模态关联建模能力与迁移泛化能力仍面临诸多挑战。本报告围绕多模态预训练模型在开放环境中的高效学习与应用问题,重点讨论两个关键方面:(1)在不破坏各模态固有信息结构的前提下,如何实现稳健且有效的跨模态关联建模;(2)在保持预训练模型泛化能力的基础上,如何实现面向下游任务的跨域迁移与小样本快速适配。报告首先从“理想视觉系统”的角度分析多模态预训练模型应具备的关键能力要素,并介绍一种基于解耦视觉表征的多模态预训练基础模型 Libra,以及其面向理解与生成统一建模的扩展版本 Libra-2。随后,报告进一步介绍在保持预训练泛化性的前提下,实现跨域迁移与小样本迁移的有效方法与实践经验,为多模态预训练模型在开放环境中的高效落地提供可行路径与参考思路。

报告人简介:

杨小汕,中科院自动化所多模态人工智能系统全国重点实验室研究员、博士生导师,国家自然科学基金青B项目(原优青)获得者。2016年博士毕业于中科院自动化所模式识别国家重点实验室,近年来聚焦开放环境多模态感认知智能开展研究,发表100余篇论文,其中TPAMI、IJCV、TMM等期刊和MM、CVPR、NeurIPS、AAAI等CCF-A类会议60+。曾获中科院院长奖、中科院优博、CCF-腾讯犀牛鸟卓创奖、中国多媒体大会最佳论文奖,入选科技部重点领域创新团队核心成员、中科院稳定支持基础研究领域青年团队核心成员。负责国家自然科学基金青B项目(原优青)、联合基金重点项目、面上项目、XXX委重点项目课题。

报告3题目:受限资源下的轻量化多模态学习

内容:以GPT-4o、Gemini为代表的多模态大模型技术正在全球范围内掀起一场人工智能的革命。这些大模型的训练依赖海量数据和算力,难以在相对资源受限的高校开展相关的研究。本报告聚焦受限资源下的轻量化多模态学习,分别从模型、计算框架、数据表征三个视角介绍课题组近期的相关研究工作。

报告人简介:

余宙,杭州电子科技大学计算机学院教授,博士生导师,计算机学院副院长、国家级青年人才、浙江省计算机学会副秘书长。研究方向是多模态理解与大模型、发表CVPR、ICCV、AAAI、MM等高水平论文60余篇,总引用5000余次,获浙江省自然科学一等奖(排2)、ACM杭州新星奖等。

报告4题目:

跨视域表观适应的层级特征学习行人重识别

内容:

围绕跨视域表观适应的层级特征学习行人重识别问题,针对图像低质、身份模糊与数据依赖三大挑战,提出了递进式学习方法,在底层,通过深度高分辨率表征、亮度统一与去雾增强等技术,提升低质图像的鲁棒表征能力;在中层,利用多生物特征融合、掩码感知聚合与跨模态身份增强,实现复杂外观下的细粒度身份解耦与推理;在高层,通过全局关联对比学习、可控仿真数据生成及多模态混合注意力机制,突破标注依赖,实现主动感知与生成式泛化学习。为国家“平安中国”战略需求提供关键技术支撑。

报告人简介:郑钰辉,教授、博导,青海师范大学计算机学院、网络空间安全学院院长、藏语智能全国重点实验室副主任、教育部重点实验室主任,国家青年人才计划入选者。现为中国图象图形学学会理事、中国人工智能学会智能服务专委会常务委员。围绕社会与空间视觉感知计算,主持国家自然科学基金重点项目、重大研究计划课题等。已在IEEE-TPAMI、IJCV、IEEE-TIP、IJCAI、AAAI等机器视觉领域顶刊与顶会上发表论文百篇以上。曾获2023年度江苏省高等学校科学技术研究成果奖一等奖、2022年度江苏省科学技术奖二等奖、2024年度CCF科技成果奖二等奖。