当前位置: 学院首页 · 校园动态 · 正文

文学与历史文化学院古籍数智化平台建设多模态大模型“春秋”研发完成并进入内测阶段

发布时间:2025-10-22

阅读:

10月19日,文学与历史文化学院自主研发的多模态大模型“春秋”完成全部训练并进入内部测试阶段, 不久将作为学院古籍数智化平台的核心引擎投入使用。该模型是国内高校率先面向古籍版面整理的大模型,为后续大规模古籍端到端的数字化、智能化研究提供了关键工具支撑。

“春秋”模型采用ViT-MLP-LLM三阶段架构,在预训练阶段引入自回归语言建模、图像掩码、图文细粒度对齐及图像块排序四类损失函数,实现跨模态对齐学习;下游任务阶段,通过版面元素分析、文本行检测、文字识别、视觉问答、遮掩补全等八类指令微调,显著提升了古籍复杂版面的解析与识别精度。实验结果显示,该模型在SCUT-CAB、MTHv2、M5HisDoc、AncientDOC等公开数据集上的版面分割、文字识别、阅读顺序判定等任务中,主要指标均达到现有最优方法,字符识别准确率最高达98.98%。

学院古籍数智化平台以“春秋”模型为内核,规划“九大模块”并行推进:古籍数字化服务、古文基础服务、知识库建设、知识图谱构建、多模态大模型调用、智能体生成、数字人制作、虚拟古籍馆、地方特色系统。平台贯通“采集—标注—训练—服务—众包”全链路,形成教学、科研、地方文化传扬、知识共建共享闭环。据项目组测算,平台全面运行后,可减少教师传统备课时间70%,长期运维成本为商业方案的10%。

依托“春秋”模型,学院将完成德州方志、董仲舒文献、黄河运河文化、非遗技艺、方言语音等五类地方特色资源的结构化存储与可视化展示,并将进一步联合校内外科研机构,继续扩充甲骨、金文、地方志等特色语料,完善知识图谱与版本校勘功能,面向学界开放API接口与标注工具,推动古籍数字人文研究范式升级。

(作者:文学与历史文化学院 刘潇 供稿审核人:仲冲)

相关新闻

读取内容中,请等待...
2021-2022 山东德州学院 鲁ICP备15026974号-1 POWERED BY Rosion.net