騰訊運用AI助研究人員破解甲骨文之謎

新產品 焦點新聞

騰訊攜手合作夥伴為甲骨文研究專家和愛好者打造了網上研究平台和數據庫「殷契文淵」甲骨文AI協同平台。其網站經全面升級後,不僅引入創新工具來識別刻痕較淺的甲骨文,還採用人工智能(AI)技術將甲骨文字形比對現代漢字,從而大幅提升文字辨識效率。

甲骨文最早發現於20世紀初。作為迄今為止所發現的中國最古老的文字,其歷史可追溯至數千年前。目前已出土的甲骨約為16萬片,發現的單字約4,500個。多年來,雖然學者們已經取得不少重要進展,但甲骨文的破譯工作仍面臨著極大的挑戰。在已發現的所有甲骨文單字中,已破譯的仍不足一半(約1,500個字)。

騰訊運用AI助研究人員破解甲骨文之謎,提高研究效率。

殷契文淵旨在提供更完善、更規範化的系統及技術工具,助力提高甲骨文研究效率。研究人員可使用互動式甲骨影像檢視器,以排比或堆疊的方式查看和比較不同數碼化版本的甲骨文,包括歷史照片、高解像度3D模型、數字摹本圖和增強的數碼拓片圖。

升級版殷契文淵平台提供多種工具,針對性解決甲骨文研究中遇到的主要難題:視覺化和文字識別。由於甲骨脆弱易碎,是名副其實的無價之寶,研究人員通常無法直接觸碰甲骨。此外,由於甲骨碎片分散在中國和世界各地,令研究難度進一步提高。長期以來,研究人員只能利用拓片及實物照片來破譯甲骨文,但最終結果與預期相差甚遠。運用騰訊的微痕增強技術,研究人員得以看清甲骨上較淺的刻痕,方便他們詳細分析甲骨文筆畫和甲骨背面輪廓分明的凹槽。

在此之前,要識別甲骨文字形,研究人員必須比對每張照片,有時甚至要借助手繪筆記來尋找重複出現的字形,這一過程耗時耗力。而如今AI輔助功能可以大大提高破譯甲骨文的效率和準確性。此外,為了便於搜索,每個甲骨文單字均已編入索引,無論是研究人員還是愛好者,都能夠快速找到相關的學術論文,開展進一步研究。利用這項技術,研究人員可以大大縮短甲骨文的處理時間。

騰訊可持續社會價值事業部數字文化實驗室負責人舒展表示:「殷契文淵為所有甲骨文研究專家及愛好者提供了一個平台,讓他們齊心協力朝著共同的目標邁進。我們希望將更多甲骨文數碼化,並誠邀研究專家和人類學愛好者一起來破譯這些古老文字的秘密。」

為促進甲骨文研究,騰訊還聯合開發了「了不起的甲骨文」微信小程序。該小程序通過「每日一字」、3D模型檢視圖和甲骨文知識問答遊戲,激發公眾對甲骨文研究的興趣和認知。此外,用戶還可以通過該小程序向研究人員提交他們對未釋字的解讀,為這項正在進行的破譯工作貢獻一份力量。

殷契文淵和「了不起的甲骨文」微信小程序均面向公眾開放。殷契文淵平台目前提供簡體中文版本供海內外公眾使用:點擊此處