当前位置: 首页 > 通知公告 > 正文

数智学院学术沙龙(第一期):多模态大模型研究及前沿应用

【来源: | 发布日期:2025-09-16 】

报告人:王荣,池州学院大数据与人工智能学院,讲师,生成式AI研究中心成员。

时 间:2025 年 9 月 17日(周 三)下午15:30

地 点:博奕南一楼会议室

主办单位:池州学院大数据与人工智能学院

报告摘要:多模态大模型聚焦图文音视等不同弱关联模态信息,借助自监督学习、模型微调等技术手段,构建多模态融合表征、关联协同及相互转化机制,被视作实现类人感知与认知能力的关键途径,在学术界和企业界均备受广泛关注。本报告将首先回顾当前多模态预训练模型在跨模态表征对齐(如图文语义精准匹配)、多模态协同生成(如文生图、图生文的高质量产出)、复杂场景理解(如视频内容多维度解析)等方面的最新进展,通过动态演示视频(展示多模态模型对不同模态信息的处理流程)、实际应用案例展示(涵盖智能交互、内容创作、工业检测等场景)直观呈现技术突破;随后,对多模态大模型领域未来在更高效的多模态融合架构、小样本下的多模态泛化能力提升、多模态伦理与安全等方向的发展趋势进行展望与思考,并介绍课题组在多模态大模型在图文理解、视频描述、跨模态检索、视觉问答、多模态推理、对话生成等核心方向,既是当前领域技术水平的集中体现,更暗藏多模态智能未来发展的关键路径。