一、学习活动概况
为进一步拓展科研视野,提升科研创新能力,重庆工程学院计算机与物联网学院智慧农业工程研究中心于2025年10月21日晚组织中心教师与学生开展了一次在线学习交流活动。本次学习以中国图象图形学学会(CSIG)主办的“文档图像微沙龙”直播报告为依托,围绕“基于模板引导的级联扩散模型用于风格化中文手写文本行生成”这一主题展开深入学习与讨论。
“文档图像微沙龙”是由中国图象图形学学会文档图像分析与识别专业委员会发起的系列学术交流活动,旨在促进文档图像分析、计算机视觉与机器学习领域的前沿技术传播与产学研合作。活动每月举办一次,形式灵活多样,为全国科研人员和技术开发者提供了高水平的学习与交流平台。
本次报告由中国科学院大学自动化研究所硕士研究生王鸿烈主讲,报告主题为《Template-Guided Cascaded Diffusion for Stylized Handwritten Chinese Text-Line Generation》。报告由中科院自动化所副研究员张燕明主持。
二、报告内容回顾
报告深入介绍了一种基于模板引导的级联扩散模型(Template-Guided Cascaded Diffusion),通过“Layout-Diff”与“Imitating-Diff”双阶段架构实现字符级与文本行级风格的解耦与融合。研究引入潜变量聚合模块与高频加权损失函数,以提升生成效率与结构一致性,显著优化了中文手写文本行生成的风格化效果。
该方法发表于国际权威会议 ICDAR 2025,并荣获“最佳论文奖(Best Paper Award)”。
三、学习交流与启发
中心教师与学生在学习过程中,就扩散模型在文档图像分析、农业智能识别及数据生成任务中的潜在应用展开了热烈讨论。大家一致认为,本次报告对中心在“农业图像生成”“智能识别模型优化”“多模态学习”方向的研究具有重要启发意义,尤其在构建高质量图像数据集与生成式AI模型方面提供了新的思路。
四、后续安排
智慧农业工程研究中心将以此次学习为契机,持续关注国内外人工智能与图像处理领域的前沿动态,计划定期组织“文献精读+专题研讨”活动,推动科研人员在学术交流与科研创新中不断提升。

官方微信
扫一扫