AIピリカ – 人工知能によるネイティブスピーカーの復活

キャラクターデザイン:本田あまね

2019年から2023年までの進捗状況

AIピリカの過去5年間の成果としては、アイヌ語コーパスの構築、性淘汰型遺伝的アルゴリズムに基づく帰納的学習法(SeGA-ILSD、北海道大学荒木健二氏開発)を用いた音声対話法によるアイヌ語翻訳システムのプロトタイプ作成などを行ってきました。

AIピリカは一定の成果を上げていますが、アイヌ語翻訳システムの精度は未だ低く実用レベルには達しておらず、当初の目標であったアイヌ語対話システムも完成していません。

ご存じの通り、ChatGPTsなどの生成型AIは自然言語処理の分野で急速に進化し、大きな成果を上げています。現在、アイヌ語翻訳システムの精度向上と、ChatGPTsの最新バージョンであるChatGPTs4を用いたアイヌ語対話システムの開発に向けて、さまざまな試行錯誤を行っています。

具体的には、これまで構築してきたアイヌ語コーパスをChatGPTs4に学習させることで、アイヌ語翻訳システムの精度向上やアイヌ語対話システムの構築が可能になるのではないかと考えています。

背景

おそらく動物種の絶滅については聞いたことがあるでしょう。人間の民族も言語を失うと消滅する運命にあります。The Summer Institute of Linguistics’ Ethnologueのデータを使用すると、NettleとDanielは、世界の人口の90%が100の最も使用されている言語を話すと計算しています。地球上の人々の約10%が少なくとも6,000の言語を話しています[1]。

話者が100人未満の言語は絶滅に非常に近いため、日常的に使用するという復活はありそうにありません[1]。アイヌ語のネイティブスピーカーの数は、1996年に15人と推定されました[2]。 2020年、状況は絶望的です。私たちはこの状況を非常に心配しています。

私たちのメインのプロジェクトは、AI(人工知能)テクノロジーによるアイヌ語のネイティブスピーカーの復活です。彼女の名前は「AIピリカ」です。 「ピリカ」はかわいいアイヌの女の子を意味します。

AI ピリカは感情が持てないと心配している方もいるかもしれません。しかし、私たちはシステムに感情を組み込みます。

世界中の絶滅危惧言語に応用できることを楽しみにしています。

[1] Nettle and Daniel. 2000. Vanishing Voices. Oxford University Press.
Moseley, Christopher (ed.). 2010.
[2] Atlas of the World’s Languages in Danger, 3rd edn. Paris, UNESCO Publishing. Online version: http://www.unesco.org/culture/en/endangeredlanguages/atlas
[3] Proceedings of the IASTED International Conference COMPUTATIONAL INTELLIGENCE. November 20-22, 2006, San Francisco, CA, USA.