合合信息赋能古籍数字化,携手上海大学共创传统文化的新生命

2023-08-18 04:34:14 来源: 牛华网


(资料图)

1950年,当代著名社会学家费孝通先生访问贵州毕节时,率先认识到彝文古籍对理解西南边疆历史的重要性,并鼓励筹建翻译机构,也为当下的古彝文研究提供了支持。我们知道古籍文献具有重要的历史、文化和学术价值,但由于时代变迁和物质老化等原因,它们容易受到损坏和丢失。而通过现代科技将古籍数字化,可以将古籍文献转化为电子形式,实现永久保存,避免进一步的磨损和损坏,以便后代能够访问和研究。合合信息“AI+OCR”融合下的智能文字识别技术则能够解决古籍中古文识别的版式检测、图像处理和文字识别等难题,为文字保护及古代文化的传承走出了里程碑式的一步。

据悉,2021年、2022年世界人工智能大会上,合合信息用AI技术对甲骨文、西周钟鼎文进行精准识别,受到包括央视、人民日报、新华社在内的上百家主流媒体的关注。在2022年12月21日,合合信息与上海大学社会学院正式签署校企合作协议,双方将合力完成以国家珍贵古籍《西南彝志》为中心的贵州古彝文图像识别及数字化校对项目(简称“古彝文数字化项目”)。

上海大学社会学院院长黄晓春、合合信息智能技术平台事业部副总经理郭丰俊共同出席签约仪式

古彝文传承至今已有数千年历史,是世界上最古老的文字之一。“汉文古籍识别所面对的页面残损、字形复杂、字迹模糊等问题,在彝文古籍识别中全部存在,还有一些任务是更加特殊的。”合合信息智能技术平台事业部副总经理郭丰俊博士提到,彝文古籍时常出现加字、替字、整句倒置、文字方向不统一等现象,给文字定位造成挑战。再加上古彝文从未经过统一,异体字、变体字众多。合合信息基于“AI+OCR”融合下的智能文字识别技术,能够将这些特殊的难题一一解决。

古籍数字化的过程同时也是保护古籍的过程。2017年,72位全国人大代表联名建议实施中华古籍数字资源总库体系建设工程,实现历史文明的有序传承。本次合合信息与上海大学共同研究的《西南彝志》共计26卷,有“彝族历史文化的百科全书”之誉,对研究彝族历史、经济、文化十分重要。

古彝文数字化的价值并不止步于学术研究。随着我国小康社会的全面建成,人们对精神文化关注度日益提升,以民俗为主题的现代文艺创作、娱乐活动让传统文化焕发新的生机,例如中央歌剧院演绎的柯尔克孜族英雄史诗《玛纳斯》,既尊重了民族文化特色,又体现了新时代的风采。智能文字识别技术“牵手”传统典籍研究,会是古彝文“传统的新生命周期”的开始。

标签:

[责任编辑:]

最近更新