
圖為安陽師範學院甲骨文信息處理實驗室副主任焦清局介紹情況。王宇 攝
中新網安陽5月15日電(王宇)登錄一個網站,掃描一個二維碼,就能快速查詢到需要的甲骨文資料。如今,甲骨文作為一門冷門學科已被數字“煥活”,開始進入智能化時代。
“行走河南·讀懂中國”文明探源集中采訪團近日走進河南省安陽市,來到安陽師範學院甲骨文信息處理實驗室,切身感受到甲骨文智能化時代的神奇魅力。
據了解,該實驗室把現代信息技術應用於甲骨文研究,凝練形成了“甲骨文大數據平台、甲骨文識別與字形分析、甲骨文語言計算、甲骨文與殷墟科技考古”四個研究方向。
在實驗室裏,安陽師範學院甲骨文信息處理實驗室副主任焦清局登錄"殷契文淵"網站,在字形庫中選擇甲骨字"人"字形,瞬間,所有包含該字形的甲骨片信息就全部顯示出來。
“殷契文淵”是由安陽師範學院和中國社會科學院甲骨學殷商史研究中心合作建設的非營利性網站,為甲骨學研究提供大數據支持,是了解、學習、研究甲骨文的互聯網窗口,破解了過去獲取甲骨文研究資料難的瓶頸。
“因(yin)為(wei)甲(jia)骨(gu)片(pian)材(cai)質(zhi)特(te)殊(shu),片(pian)多(duo)易(yi)碎(sui),並(bing)且(qie)分(fen)布(bu)全(quan)球(qiu)各(ge)地(di),語(yu)言(yan)信(xin)息(xi)多(duo)不(bu)完(wan)整(zheng)。以(yi)前(qian)甲(jia)骨(gu)碎(sui)片(pian)都(dou)是(shi)靠(kao)記(ji)憶(yi)和(he)手(shou)工(gong)來(lai)拚(pin)合(he),數(shu)據(ju)數(shu)字(zi)化(hua)以(yi)後(hou),可(ke)利(li)用(yong)人(ren)工(gong)智(zhi)能(neng)圖(tu)像(xiang)技(ji)術(shu)進(jin)行(xing)自(zi)動(dong)綴(zhui)合(he)。”焦清局介紹說。
截至目前,安陽師範學院甲骨文信息處理實驗室利用深度學習技術共綴合甲骨碎片41組,同時還發布了甲骨文的檢測、識別、手寫數據集,為計算機學者提供了檢測、識別甲骨文標準的數據集。
除了“殷契文淵”網站,該實驗室今年4月份還發布了麵向大眾的微信小程序“了不起的甲骨文”。該小程序通過故事性引入、遊戲化互動、社交化分享等方式吸引公眾了解甲骨文及漢字的演變,為甲骨文數字“煥活”提供了新的助力。
5月14日ri,甲jia骨gu文wen信xin息xi處chu理li實shi驗yan室shi主zhu任ren劉liu永yong革ge介jie紹shao,甲jia骨gu文wen蘊yun含han著zhe豐feng富fu的de造zao字zi智zhi慧hui和he文wen化hua價jia值zhi,急ji需xu將jiang冷leng門men的de文wen化hua資zi源yuan轉zhuan化hua成cheng大da家jia喜xi聞wen樂le見jian並bing願yuan意yi參can與yu的de普pu惠hui文wen化hua服fu務wu;甲骨文活化利用的素材有限、手段傳統、渠道不暢,急需係統化開展工作。
據介紹,當前已經出土的甲骨有15萬至16萬片,自然損壞速度較快,急需進行數據采集以實現在數字空間永久化保存;已經發現的約4500個甲骨字,其中約3000個尚未釋讀,甲骨文專家學者數量少,急需智能工具幫助提升字形匹配的搜索效率、推薦破譯的相關線索。
值得關注的是,“了不起的甲骨文”小程序所使用的甲骨文高質量數據,正源自“殷契文淵”,打造出甲骨文的全信息模型。這樣既可以為公眾提供參與甲骨文傳承活化的互動平台,也可以幫助專家學者進行甲骨文保護研究。
“我們把不同的甲骨圖片進行對齊疊加,每個圖層顯示不同的信息。因為甲骨裏麵好多字很難看到,所以我們通過紅外線攝影、光譜分析、微量元素分析產生不同的圖層,讓大眾真正了解甲骨文,看看甲骨文究竟長什麼樣。”劉永革說。