学院举办“智能教育研究生学术月活动”专题系列学术报告之《藏文古籍文档图像分析与识别》

发布者:雷云飞 发布时间:2021-12-04浏览次数:299

2021124日晚,教育技术学院举办了举办“智能教育研究生学术月活动”专题系列学术报告(三),西北民族大学数学与计算机科学学院教授、博士生导师王维兰应邀做了题为“藏文古籍文档图像分析与识别”的线上报告。我院教师与博硕士研究生聆听了本场报告。

报告伊始,王维兰老师以模式识别领域的问题提出作为引言,提出纸张粗糙、手写体等以及训练的标记样本不足共同导致了古籍识别领成为了一大挑战。首先,王维兰老师介绍了藏文古籍的文档识别与分析任务主要包括拥有藏文古籍的数据、图像预处理过程、图像版面分析过程和区分不同的区域。介绍了预处理的三种不同的方法并通过实例进行优缺点比较分析。其次,介绍了藏文古籍文本行、字切分方案流程,基于实例讲解了不同的文本行切分方法。最后,提出了对于版面的描述与复原和进一步工作的重点。通过本次汇报我们可以了解到每一类古籍文档格式都是不同的场景,要定制性的开发交互式的分析与识别系统,建立基于多任务版面分割网络模型,对不同字体的古籍文档进行图像的分析与识别。用现代技术探寻古籍奥秘,复原悲欢离合的人类故事。



                                                  审核:贺相春