
“基于DeepSeek的报税数据虚假识别研究”项目组学生座谈会
在税务数据智能化监管需求日益迫切的当下,海量报税数据的真实性核查工作面临着数据规模庞大、虚假信息隐蔽性强等严峻挑战。在此背景下,基于DeepSeek大模型的报税数据虚假识别技术应运而生。该方法通过人工智能语义理解和行业知识融合,显著降低人工核查成本,为提升税务审计精准度、构建自动化风险防控体系提供了创新解决方案。大数据与人工智能学院人工智能研究所敏锐洞察到这一技术的广阔应用前景,精心筹备并举办了“基于DeepSeek的报税数据虚假识别研究”学生座谈会。
活动当日,学院会议室座无虚席,师生们怀着对前沿技术的热忱齐聚一堂,共同探索这一创新方法的奥秘。活动开场,刘呈云老师以当前税务数据处理的核心痛点切入,生动剖析了传统手段在应对海量、复杂且隐蔽性强的虚假报税数据时所面临的困境。他着重阐释了引入DeepSeek模型的重要意义——相较于传统规则引擎,DeepSeek模型突破预定义规则限制,不仅能显著提升识别准确率,更能大幅优化审计工作流程。随后,刘老师清晰勾勒出项目的全生命周期脉络:从多格式报税数据采集,到基于本地知识库的语义预处理,再到DeepSeek模型本地推理,生成结构化异常报告,最终实现高效、精准的虚假识别应用。这番系统性讲解,为在场同学构建了坚实的项目认知框架,清晰指明了项目的技术路径与发展方向。
随后,赵飞扬老师聚焦项目核心技术要点,展开深度讲解。他围绕DeepSeek模型的本地部署架构、多格式报税数据统一预处理技术、以及基于提示工程的异常核查策略等关键环节进行阐述。为了让同学们更直观地感受技术的实际应用,以含虚拟交易的纸质报税单为例,进行了精彩的现场实操演示。从数据的导入、处理,到模型的推理,再到最终可视化报告的输出,每一个步骤都清晰流畅。同学们目不转睛地盯着演示屏幕,亲眼见证了复杂的报税数据在技术的驱动下,迅速、准确地被自动转换成可视化报告,精准标识异常数据条目及关联字段,并联动本地知识库生成对应的政策依据,原本晦涩难懂的技术知识变得生动鲜活。这一演示极大地激发了同学们的学习热情和探索欲望。
在互动答疑环节,现场气氛达到高潮。同学们积极踊跃,纷纷就项目中的疑惑和创新想法展开交流。问题涵盖数据隐私保护、模型更新迭代机制、不同金融场景下的分类策略差异,以及该技术在新兴金融业务中的拓展应用等多个层面。刘呈云老师和赵飞扬老师认真倾听每一个问题,凭借扎实的专业素养和丰富的实践经验,耐心细致地为同学们一一解答。老师们不仅给予专业的指导意见,还充分肯定和鼓励同学们的创新思维,与同学们共同探讨潜在的研究方向,为同学们进一步深入研究提供了宝贵的思路和建议。
