江戸時代の言葉を話すAIチャットボット「からまる」をSakana AIが公開

2025年4月1日、東京都港区のAIベンチャー企業Sakana AIが、江戸時代の古文風テキストで会話ができるAIチャットボット「からまる」を公開した。
現代日本語での質問に対し、江戸時代の世界観と当時の古文風テキストで回答するこの革新的なツールは、研究や教育の分野での活用が期待されている。
Sakana AIの新たな挑戦と「からまる」の特徴
Sakana AIは、AI技術の進化と日本文化の再生を目指して設立された企業である。
今回公開された「からまる」は、江戸時代の書物から約2500万文字のデータセットを構築し、大規模言語モデルを継続学習させることで開発された。
このデータセットは、AIによるOCR処理でテキスト化された約1200万文字の江戸時代の書物と、人間が修正した約1300万文字のデータから成り立っている。これにより、「からまる」は江戸時代の文化や世界観を忠実に再現した会話が可能となった。
たとえば、ユーザーが「あなたの名前はなんですか?」と尋ねると、「某が名はからまるにて候」といった古文風の返答が返ってくる。このような会話スタイルは、江戸時代の文体を忠実に再現している。
「からまる」の開発には、従来のRAG技術(※)に代わり、大規模言語モデルの継続学習が用いられている。これにより、江戸時代の文化や世界観を崩さず、一貫性のある回答が可能となった。
Sakana AIは、この技術によって過去の文化への没入感が高まると説明している。
今後の展望
Sakana AIが開発した江戸古文風チャットボット「からまる」は、過去の文化を現代に蘇らせる試みとして注目されている。今後、この技術はさらなる発展を遂げ、多様な分野での応用が期待される。
教育分野においては、「からまる」を活用した歴史教育の新たなアプローチが考えられる。
学生がAIとの対話を通じて、江戸時代の言語や文化を体験的に学ぶことで、理解が深まるだろう。
また、古文書の解読支援ツールとしての活用も視野に入る。AIが古文書の内容を現代語に翻訳することで、研究者や愛好家が過去の文献にアクセスしやすくなる可能性がある。
観光業界でも「からまる」の技術を応用したサービスが登場するかもしれない。
歴史的な観光地で、来訪者がAIと対話しながら当時の生活や出来事を学ぶことで、より深い体験が提供されると考えられる。「からまる」によって、文化遺産への興味喚起や理解促進につながることが期待される。
※RAG技術:Retrieval-Augmented Generationの略で、情報検索と生成を組み合わせたAI技術。