
控えめにそして謙虚にあるプロジェクトを応援し、あるいは再評価しすることをここで綴っていきます。そのプロジェクトとは、少なくとも欧米ではあまり理解されなかったものです。それでも、このゲームとそれに付随するすべての取り組みは、ビデオゲームにおけるAI応用という広大なテーマを統合する貴重なツールだと私には思えます。 そして、すべてのゲーム開発者、特にスタジオに集うストーリーテラーたちが抱く「生成系AIが登場した今、それで何ができるのか?」という未解決の問いに答える出発点としても理想的だと思います。
本と出会って
去年の夏、日本の滞在中に私は素晴らしいコンサートを楽しみ、バイオハザード関連の書籍や攻略本という私のコレクションを増やしていました。しかし、手に入れるのが難しい一冊の本、AIをビデオゲーム制作に活用する成果と可能性を探る論文や講演を集めた本を手に入れるチャンスがありました。その本は、至ってシンプルに「スクウェア・エニックスのAI」と題され、全編日本語で書かれています。そこには、スクウェア・エニックスAI部門のゼネラルマネージャーである三宅陽一郎氏が率いる、伝説的な日本のスタジオのAIに携わる精鋭たちが集結しています。

私はまず森友亮さんの仕事に注目しました。確かに彼の記事が、私のAIと物語に関する研究の延長線上にあるからという理由もありますが、それ以上に、数ヶ月前にサンフランシスコのGDCで彼と直接会ったことが大きいです。その時のことを鮮明に覚えています。
彼は私たちのゲーム「Cloudborn」をInworldのブースで試した後、短いAI会話のデモを見て、こう尋ねてきました。「AI NPCとの会話を通じて、ゲームの進行に役立つ情報や手がかりをどうやって引き出すつもりですか?」私はその時、「それはすでに実装済みで、『Goals and Actions』という機能を通じて実現しています」と答えました。これは嘘ではありませんでしたが、森さんがもっと有機的で自然なものを期待していることは、その時点で察していました。単なる類似語によるトリガーでは、彼が求めているものには程遠い。実際、それは革新的とは言えない機能で、森さんがスクウェア・エニックスで作り上げたものに比べれば物足りないものでした。彼の納得がいっていない反応からも、それがすぐわかりました。
GDCでは、森さんのバッジだけが彼の身元と役割を教えてくれました。謙虚な彼は、自分の仕事や「ポートピア」に関する研究について多くを語りませんでした。だからこそ、数ヶ月後にその本を手に入れ、森さんの名前を見たときにすべてのピースが繋がったのです。私は彼の記事を翻訳し始め(ChatGPT-4と4oに大いに助けられながら)、仕事用のPCに「ポートピア」を再インストールして、徹底的に研究しました。ここでは、そのテーマを私なりにまとめつつ、感想やコメントを添えてみます。
何も準備ができていない、時間を無駄にしないで
森さんの記事から浮かび上がる逆説的な感覚を理解するには、重要な事実を押さえておく必要があります。それは、「ポートピア」というゲームプレイヤーがテキスト入力で自由にキャラクターと会話し、殺人事件の捜査を進めるゲームが100%ローカルで動作することです。確信を得るため、私はPCを機内モードにしてゲームを起動してみましたが、体験に何の変化もありませんでした。さらに文脈を補足すると、「ポートピア」はChatGPT-3やそのAPIが広く公開される前の時代に開発されました。したがって、このゲームは、NLU(自然言語理解)や自動音声認識(STT、Speech To Text)などのモデルを含むさまざまな技術を動作させています。

この点について、時間を無駄にせず、シンプルに私の意見を述べます。これは一時的な問題だと確信しています。私の感覚は、1998年9月にリヨンの実家にインターネットが導入された時のものと同じです。当時14歳だった私は、テレビCMで見た初のインターネット契約《月20時間で99フラン(約16ドルかユーロ)》を覚えています。その契約で初めてMP3をダウンロードしたのも記憶に残っています。Cardigansの「My Favourite Game」で、約1時間半かかりました。
当時、インターネットの1分は貴重で、今の温かいきれいな水のように価値あるものでした。AIのトークンも同じ道をたどると私は思います。いずれインターネットやモバイルの定額プランに組み込まれるべきでしょう。最近、NetflixやDisney+、テレビ視聴アプリをプランに追加する以外に何もできないようなインターネットプロバイダーに、このメッセージが届くことを願います。ローカル推論に関しては、この記事を書いている時点で特別な努力が進められています。Inworldが私に教えてくれたように、これは彼らの研究の中心であり、Nvidiaとのパートナーシップもその方向で進んでいます。優秀な人材が集まれば必ず結果が出ます。Nvidiaやその周辺のカリフォルニアのスタートアップが支配的でも、もしかしたらフランスの頑固なガリア人たちがすでに成功しているかもしれません。
私自身、2025年1月にパリのX&Immersionのオフィスで、中級クラスのゲーミングPCで動作するUnreal Engineのゲームをテストしました。AIキャラクターと自由に会話でき、すべてローカルで動いていました。歴史に残るべき事実です。ローカル推論は手の届くところにあるようです。フランスのX&Immersionはそれを成し遂げました。しかし、この技術が広く採用されるまでは、森さんの記事にあるもう一つの主張に私も完全に同意します。ゲームデザイナー、ナラティブデザイナー、エンジニア、プロデューサーとして、私たちはNvidiaの次世代チップや仮説上のPlaystation 6、iPhone 19、Nintendo Switch 3を待つべきではありません。今、考え、コンセプトや設計図を紙に書き起こし、技術が民主化された時に展開できるようにすべきです。
言葉の錬金術
さて、森さんの記事で最も卓越している部分、《自然言語処理(NLP、LLMの祖先ですね)を通じて言葉の魔法がどう働くかを、私のような単純なデザイナーにもわかりやすく説明するところ》に踏み込みましょう。まず、言葉とその意味を数値データに分解し、再び新たな言葉に組み立て直すという発想自体が、純粋な錬金術に思えます。少なくとも私にはそう感じます。
科学的には、これが単なる数学的技巧だと正当化する声もあるでしょう。それに対して私は、この過程に詩的な何かを見続けたいと答えます。言葉を数字に変え、数字をまた言葉にする――まるで酸素を金に変えるようなものだと。
彼らもその詩情を認めてくれると信じています。

森さんにとって、これは少年時代の夢から始まっています。彼もまた詩的な何かを持っています。記事の中で彼は、子供の頃、未来から来たロボット猫ドラえもんに憧れ、ロボットを作りたいと思っていたと告白しています。そして彼の理想のロボットは、物語を作り、生成できるものでした。この無垢な動機が、彼を困難で規律ある道へと導き、後に情報通信工学の博士号を取得させるのです。彼は2013年からのword2vecへの関心を語ります。単語をベクトルに変換する技術です。
これを聞いて、高校(中学校?)のベクトルの授業をぼんやりと思い出しました。あの時もっと真剣に聞いていればと後悔します。4年生の時のフランス語の先生の言葉が蘇ります。「フランス語は数学で、数学はフランス語だ」と。彼女はその年、結婚をキャンセルして、同じ学校の数学教師と結婚しました。話が逸れましたね。でも、ちょっと立ち止まって考えてみてください。単語とその意味をコンピュータが扱える数値データに変換するなんて、科学的発見としてとんでもないことですよね? 森さんが言うように、word2vecが単語に識別番号やインデックス、軌跡を与え、足し算や引き算で新たな単語を得られるのは本当に魅力的です。彼の説明には、さらに詩的な感情を呼び起こすものがあります。例えば、「ポートピアでは、文単位の意味ベクトルを使えた」とか、「単語数がnなら、ベクトルはn次元になる」と述べる部分です。
「猫」「子猫」「こたつ」の近さを指摘する彼の言葉一見 absurd ですが、森さんの記事を読めば納得します)に、私は幼少期のテレビ番組「ピラミッド」を思い出しました。
若い読者のために少し背景を説明します。昔、公共テレビには知的なゲームがありました。参加者が知恵を競う番組です。「ピラミッド」もその一つでしたが、10歳の私には全く理解できませんでした。でも今思うと、コンセプトを説明されていれば、幼い頃から理解できたはずです。そのゲームは、隠された単語を他の単語との関連で導き出すものでした。関連は近接だったり対照的だったり、参加者や司会の戦略次第です。
奇妙に思えるかもしれませんが、森さんのNLPがプレイヤーに提示する単語を生成する様子を、私はこのようにイメージします。彼が「次に来る単語は0から1の確率で選ばれ、0.7のスコアの単語が0.5のものより選ばれる」と説明する時、私は「ピラミッド」を連想します。最近見直して、その質の高さに改めて感銘を受けました
「ポートピア」で遊ぶ
「ポートピア」そのものはどうでしょうか?まずプレイ条件を説明します。私はSteamで無料で入手できる「Portopia」を英語で遊びました(日本語版もあります)。仕事用のPCはASUS ROG STRIX 17ゲーミングノートで、16GBのDDR4 RAM搭載されています。起動時のデフォルトメモリ使用量は2GB強で、おそらくAIの管理に割り当てられているのでしょう。スクリーンショットを見ればわかるように、グラフィック負荷はほぼゼロです。ゲームは機内モードでWifiをオフにして遊びました。外部モデルへのAPI呼び出しは一切不可能です。
森さんの当初の約束は守られています。なお、このゲームは1983年にエニックスがNESなどで発売した「ポートピア連続殺人事件」のリメイクです。
驚くことに、私より年上です。

ゲーム開始時、パートナーが最近起きた殺人事件を報告し、実行可能なアクションのリストを提示します:
- 情報収集に行く
- アリバイを確認する
- 現場を調査する
- 容疑者を探す
最初から嬉しいのは、複数の選択肢ボタンを押すのではなく、ダイアログボックスに直接テキストを入力してアシスタントに「現場を調査して」と頼める点です。これで新たな容疑者への質問や犯罪現場へのアクセスが解放されます。ただし残念なのは、オープニングシーンで実行できるアクションがこれだけで、他の選択肢は後で特定の状況下でしか使えないと気づく必要がある点です。またUXの粗さが気になります。この影響はテストを通じてずっと感じられました。アシスタントを唯一の情報源とし、実行可能なアクションを示すのは、ナラティブゲームとして合理的です。特にAIをゲームプレイの中心に据え、プレイヤーに新たな自由を提供するタイトルではなおさらです。例えば、「let’s go to the port」と入力するだけで港に行けるのは素晴らしいですが、容疑者との会話を切り上げるのに正しいテキスト(具体的には「go back」)を見つけるのは面倒です。

ただし、「pause」キーで有効化できる「NLUビジュアライザー」(自然言語理解)モードがあります。このモードは、プレイヤーの入力の確率スコアをリアルタイムで表示し、システムがアクションを実行するのに受け入れ可能な入力との類似度をパーセントで示します。このモードは道を示してくれますが、システムの限界を露呈しているとも感じます。もっと自然にUXや会話の書き方で導いてほしかった。
これで気づいたのは、UIとUXが将来のナラティブ向けAI採用に決定的な役割を果たすということです。そうでなければ、革命は起こらないかもしれません。Inworldの「トリガー」機能も同様に、UXでサポートされていなかったことを思い出します。
さらに、NLUが示すシステムが期待するフレーズの確率は、プレイ中の場所やタイミングと一致せず、後で発見されるべきことを表示してしまうため、没入感がやや損なわれます。フィルター機能があれば良かったと思います。
結局、慣れが必要な部分もありますが、捜査が進むにつれて楽しさが感じられるようになりました。NLUを頼りに、容疑者について他の容疑者に質問する方法もわかりました。

ただ、システムには限界があります。例えば、容疑者にオブジェクトを見せて反応を引き出すことはできませんでした。幸い、背景に視覚的な手がかりが時折ありましたが、NLPがそれを上手く処理できない場合もあります。例えば、「look on the floor」は受け付けず、「look on the ground」を求められました。同様に、「Investigate Pendant」はダメで、「Investigate the pendant」を期待していました。繰り返しになりますが、森さんの意図を理解するUXデザイナーの協力があれば、このゲームは当初目指したポテンシャルをフルに発揮できたでしょう。彼は「コマンド入力式」という、今では忘れられたゲーム形式(記事では「Eliza」を例に挙げています)を現代に蘇らせようとしました。明らかに大きな一歩を踏み出しています。
それでも、AIがもたらす効果はまちまちです。自然な会話の楽しさを感じさせる一方で、ちょっとした入力ミスや文法の違いで拒否されると興ざめです。誤解しないでください。
「ポートピア」は大きな飛躍です。見た目にはわかりにくいかもしれませんし、妙な評判もありますが、ゲームプレイの多くの場面でAIを賢く活用し、没入感を高めています。業界全体がLLMを単なる「チャットボット」以上に活かそうと苦労する中で、これは大きな成功です。私自身の経験からも、その挑戦の大きさはよくわかります。「ポートピア」は最初の一歩、最初の礎です。ここに立ち戻り、次を考えるべきです。彼は、より高性能なモデルにすべてを委ねるのではなく、今、控えめなモデルで考えるべきだと促しています。
私たちは技術を少しずつ飼いならし、論理的な思考と既存のデザインコンセプトを応用していく必要があります。だからこそ、「ポートピア」はAIをゲームに取り入れようとするすべての人にもっと注目されるべきだと私は思います。
フィクション VS 現実
このテストを踏まえ、森さんが「ポートピア」の開発中にどんな思考プロセスをたどったのか、彼の記事のメモと照らし合わせて想像します。まず、彼の考察は「ポートピア」で実現できたものをはるかに超えていると感じます。彼が指摘する、モデルが訓練された現実世界のデータと、開発者が構築するフィクション世界の間の衝突には共感しかありません。
私が「Cloudborn」を初めてテストした時も同じ結論に至りました(数ヶ月後には改善が見られましたが)。彼は、RPGの「モンスター」という概念が現実世界の文脈で誤解される可能性を挙げます。
GPTのような堅牢で「政治的に正しい」モデルが、モラルの曖昧な悪役の言葉を正しく描けるでしょうか? RPGの悪役が現実で許されない発言をする姿を想像できますか?

この問題を解決するには、フィクション世界に豊富なデータを供給し、システムがそれに依存できるようにする必要があると彼は提案します。そうしないと、現実世界の知識に頼ってしまいます。また、NLPのハルシネーション(幻覚)が重大なバグとなり、システムの信頼性を損なう危険性も警告しています。彼の言葉に私の考えを重ねると、LLMは飼いならすべき怪物のように思えます。膨大なナラティブデータを与えてなだめ、外部データへの依存を最小限に抑え、意図しない発言を防ぐ必要があるのです。
これは私がChromawayでKayna Oliveiraと開発中の新プロジェクト「Aarda AI」の原理そのものです。「Aarda AI」はワールドビルディングソフトで、ユーザーにまず求めるのは、構築中の世界について可能な限り多くの情報を入力することです。それから初めて、リアルタイムチャットやゲームプレイへの応用でAIを試します。このワークフロー以外でこれらのツールを統合する方法は想像できません。だからこそ、このプロジェクトを進め、すでに成果を上げています。森さんが同じ原則を述べているのを読んだ時の喜びと、自分のアイデアが裏付けられた感覚は格別でした。森さん自身、「ポートピア」はすでに後衛の戦いだと認めています。彼が本に寄せた文章を書いた時、ChatGPT-3が世界の情報フローを席巻したばかりでした。彼の言葉の間には後悔の念が感じられます。しかし、今のような毎日の新モデル発表で他を圧倒するような馬鹿げた状況ではありません。この騒々しい陳腐化は、今日取り上げる先駆者の考察や努力を決して無効にしません。それは喜ばしいことです。
最後に同じことを繰り返しますが森友亮さんに敬意を表してこの言葉で締めたいと思います。この文章を読むすべてのデザイナーに、パワー競争の騒音に屈するのではなく、新しい技術を飼いならすシステムを考え、作り上げることを勧めます。その競争は関係者に任せておけばいい。なぜなら、明日の応用を考えるのは、ゲームデザイナー、ナラティブデザイナー、UI/UXデザイナーたちの役割だからです。そして、「ポートピア」はそのタイトルそのものに掲げられている通り、「テックプレビュー」に過ぎることを目指したものにすぎなかった。だからこそ、この体験が私たちにインスピレーションを与え、新たな実験やリスクを取る出発点となることを願います。



「スクウェア・エニックスのAI」を購入する:https://www.play-asia.com/square-enixs-ai/13/70hert?srsltid=AfmBOoqZpKZ2S0DwFmMwDHMTSNNmXZy0j37NSwkxstOt6SP_uT8DEYRP