安阳师范学院甲骨文信息处理实验室:古老文字遇见现代科技 甲骨文插上智能化翅膀

2023-02-18 11:22 来源:光明网

  “一片甲骨惊天下”,代代学人焚膏继晷。

  1899年,沉睡地下3000多年的甲骨被发现,隐藏在神秘甲骨中的中华智慧和文明密码被一一破译。

  甲骨文是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉,值得倍加珍视、传承发展。

  自1899年甲骨被发现以来,相关的学术研究成果斐然。特别是新中国成立70多年以来,几代学人殚精竭虑接续努力,相关研究结出累累硕果。据不完全统计,目前已出土甲骨约16万片,甲骨文单字4500余个,出版甲骨著书约280种,发表各类论文3万余篇。甲骨文以其推动人类文明进程的巨大贡献入选“世界记忆名录”。

甲骨文发现120周年大会“殷契文渊”发布

  近年来,甲骨文研究与时俱进、大胆创新。云计算、大数据技术被运用到甲骨文研究中,甲骨文研究在信息化方面取得了飞速进步。

  地处甲骨文发源地的安阳师范学院,拥有国内唯一的甲骨文信息处理教育部重点实验室和甲骨文信息处理人才创新团队,建有甲骨文大数据平台“殷契文渊”、国家语言文字推广基地、甲骨文活化利用中心和汉字文化体验馆等专业平台,是全国甲骨文研究的重要单位和学术中心。

甲骨文信息处理教育部重点实验室

  其中,甲骨文信息处理教育部重点实验室建设以服务国家特殊需求、文理交叉为特色,把现代信息技术应用于甲骨文研究,已凝练形成“甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古”四个研究方向,以满足甲骨文研究急需信息技术支持与服务的迫切需求。

  实验室建设的甲骨文大数据平台“殷契文渊”目前已成为全球甲骨学家研究甲骨文的最重要数字资源平台,标志着甲骨学的研究进入了智能化的时代,该平台 2019 年 10 月 18 日面向全球免费开放。

甲骨文大数据平台“殷契文渊”首页

  甲骨文在埋藏的数千年间,由于受地层压力、水湿浸润和发掘翻动等原因,不少甲骨一片断裂为数片,给学术研究带来了诸多困难和不便。甲骨缀合是指根据甲骨形态和所刻写的甲骨文,复原甲骨碎片位置的拼接操作。拼接后的甲骨文成为历史考古的新材料,价值倍增,所以甲骨缀合称为甲骨文的“再发掘”。

  实验室利用深度学习技术对甲骨碎片进行自动缀合,目前为止,共缀合甲骨碎片37组。其中36组缀合结果发表在研究甲骨学的知名网站——中国社会科学院先秦史研究室,甲骨碎片的自动缀合给甲骨学研究提供了崭新的思路。

  此外,由于传统的甲骨文考释方法进入瓶颈期,随着信息技术的普及,甲骨文研究迫切需要信息技术的帮助,其最基本的问题就是甲骨文字自动检测与识别。而智能化甲骨学的研究依靠的是数字化的数据集。实验室构建了甲骨文的检测、识别、手写数据集。目前在甲骨文大数据平台首页即可下载手写甲骨字数据集(HWOBC数据集)、甲骨文字检测数据集、甲骨拓片识别数据集(OBC306数据集)。甲骨文数据集的发布能够加快甲骨文的研究,推动其走向数字化和自动化。

  多年来,实验室紧紧围绕服务国家特殊需求,遵嘱托、继绝学,致力于甲骨文研究,延续中华民族文化根脉,促进中华优秀传统文化传承发展。截至目前,共完成和获批国家级、省部级等纵向项目31项,其中国家级项目12项。并发表学术论文60篇,出版著作12部,申请发明专利10项和获批软件著作权25项。

甲骨文信息处理教育部重点实验室举办研学活动

  当前,实验室获批甲骨文信息处理河南省特色骨干学科群,开辟了甲骨学研究的新学科,保证了甲骨学研究有人做,有传承。并不断推进新的工作,开展甲骨三维建模及3D打印、携手腾讯公司助力甲骨文“破译”与传承活化等。

  一片甲骨惊天下,百年研究气象新。希望基于科技的力量,未来可以让更多人跨越时空,一窥流世千年的商朝日记,聆听古老契文的喃喃密语,感受中华文化永恒的魅力。

  策划:李政葳 统筹:雷渺鑫 制作:曾震宇 撰文/配音:雷渺鑫 海报设计:杜丹、孔繁鑫