“与大师面对面”名师讲坛(2025-12-07)(鲍秉坤,细粒度解耦的跨模态视觉生成)

发布日期:2025-12-05


报告题目:细粒度解耦的跨模态视觉生成

时间:2025年12月7日  10:00-11:00

地点:九教北307B

主办单位:研究生工作部

承办单位:计算机科学与技术学院

 

主讲人介绍:鲍秉坤,南京邮电大学计算机学院、软件学院、网络空间安全院长,国家杰出青年科学基金获得者。研究方向为多媒体计算、计算机视觉、人工智能等,主持国家科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点项目等。担任IEEE TMM、IEEE TCSVT、ACM TOMM编委。

 

讲座内容介绍:当前,跨模态视觉生成方法普遍面临特征耦合的共性挑战,导致生成过程可控性弱、内容精准度低。细粒度解耦将原始数据中混杂的特征分解为独立且语义明确的因子,为实现精准可控的视觉生成提供了有效途径。本报告重点介绍针对跨模态生成过程构建的“语义粒度解耦-知识引导解耦-先验约束解耦”方法体系。首先,将跨模态输入中的耦合语义拆解至不同粒度的语义子空间,实现对象、属性、关系等多层次独立解耦生成;其次,在潜在表征空间中引入外部知识,增强表征解耦能力;最后,通过对多维度先验约束协同优化,实现基于内容、时序、空间等条件的独立控制。该体系为细节可控、高效灵活的跨模态视觉生成提供了系统化支撑。