报告题目:细粒度解耦的跨模态视觉生成
时间:2025年12月7日 10:00-11:00
地点:九教北307B
主办单位:研究生工作部
承办单位:计算机科学与技术学院
主讲人介绍:鲍秉坤,南京邮电大学计算机学院、软件学院、网络空间安全院长,国家杰出青年科学基金获得者。研究方向为多媒体计算、计算机视觉、人工智能等,主持国家科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点项目等。担任IEEE TMM、IEEE TCSVT、ACM TOMM编委。
讲座内容介绍:当前,跨模态视觉生成方法普遍面临特征耦合的共性挑战,导致生成过程可控性弱、内容精准度低。细粒度解耦将原始数据中混杂的特征分解为独立且语义明确的因子,为实现精准可控的视觉生成提供了有效途径。本报告重点介绍针对跨模态生成过程构建的“语义粒度解耦-知识引导解耦-先验约束解耦”方法体系。首先,将跨模态输入中的耦合语义拆解至不同粒度的语义子空间,实现对象、属性、关系等多层次独立解耦生成;其次,在潜在表征空间中引入外部知识,增强表征解耦能力;最后,通过对多维度先验约束协同优化,实现基于内容、时序、空间等条件的独立控制。该体系为细节可控、高效灵活的跨模态视觉生成提供了系统化支撑。




