登壇者
NTTコンピュータ&データサイエンス研究所
主幹研究員
竹内 亨 Takeuchi Susumu
Sakana AI
COO
伊藤 錬 Ito Ren
東京大学
特任教授
三宅 陽一郎 Miyake Youichiro
モデレーター
『WIRED』日本版
編集長
松島 倫明 Matsushima Michiaki
2024年11月28日にNTTコンピュータ&データサイエンス研究所 竹内亨 主幹研究員、Sakana AI 伊藤錬 COO、東京大学 三宅陽一郎 特任教授と『WIRED』日本版 松島倫明 編集長が登壇された技術セミナー「次世代のAIについて」の様子をお伝えします。
『WIRED』日本版編集長 松島 倫明
このセッションのきっかけは、NTTが開催した「AI
コンステレーション・ラウンドテーブル」( AIコンステレーションの未来の可能性を探る、有識者とNTT研究者による会議)にWIREDが参加したことです。
WIREDは「未来を実装する」ことをコンセプトにしており、Future(未来)をFuturesと複数形にして呼んでいます。それは「未来は1つではなく複数の可能性がある」ことを意図しています。
AIが自己改良を繰り返し人間を上回る「シンギュラリティ」という仮説がありますが、今の生成AIにそこまでの能力はありません。文化や地域性の違いなど複雑な人間社会でAIをどう適応させ、多元的なAIをどうつくるのか、という大きな課題設定をベースに「次世代のAI」についてお話を伺います。
NTTコンピュータ&データサイエンス研究所
主幹研究員 竹内 亨
私はAIとアルゴリズムに関する研究開発グループのリーダーを務めています。本日は昨年度から進めている「AIコンステレーション」についてご説明します。まず現代のAIはLLM (Large Language Models) のような大規模言語モデルが台頭しており、LLMを抜きに考えることはできません。ChatGPTが現れてからは、AIの研究業界や実業界も大きく変わり、今のオープンで汎用的な知識を獲得するAIもあれば、クローズドなドメイン・組織内データを活用する取り組みも進んでいます。この「クローズドな知識の活用」が非常に難しいことで、みなさんも感じるところだと思います。
その一方でLLMは大規模化による消費電力と計算コストの増加が問題視されています。また、LLMは大きくなると一般性は上がりますが、個性がなくなり差別化ができなくなる懸念もあります。そうしたことから、LLMは「何でも知っている巨大なLLM」から、「専門知識をもったリーズナブルなLLM」の流れになり、すでに医療や法律、製造、鉄道などがオリジナルのLLM開発に取り組んでいます。その各社が作った複数のLLMを組み合わせて使うのが今後のトレンドになると考えています。
我々も昨年度に「専門性や個性を持つ低コストのLLMを組み合わせて問題を解く」というコンセプトを立ち上げました。AI同士が相互に議論・訂正をして多様な視点で問題を解き、少数意見も尊重して議論を高度化する大規模なAI連携技術です。そのAI同士が星座(コンステレーション)のように連携する様子から「AIコンステーション」と命名しました。(図1)
続いて、AIコンステレーションが持つべき能力を人間の「創造性」と「個性」を軸に考えたとき、まず定型的業務があり、そこに創造性が加わると持続的イノベーションが生まれ、個性が加わることで破壊的イノベーションになります。今のLLMの適応範囲は定型的業務で、人の作業をAIに置き換えることにより適用領域の拡大が期待されています。それに対してAIコンステレーションは多様なAIによって「個性」を獲得しつつ、AI同士の議論によって「創造性」が増すことが期待され、人間の「置き換え」ではなく「支援」ができると考えています。(図2)
ユースケース(ユーザの要求や利用目的を明確に定義したもの)は2つあり、ひとつが「創造性や個性の拡大」です。何か物事を計画したり決めるときは、未来を想像してから逆算で考えるものですが、AIコンステレーションのように多様な視点で情報が提供できればユーザの視点拡大が期待できます。もうひとつはコミュニティ議論の高度化です。例えば会議で議論を広げたり深めたりするのは非常に難しいことですが、そこに多様な観点を追加することで知識や議論レベルが深まります。
今回のR&DフォーラムではAIコンステレーションに関する展示をしており、複数のLLMに議論させるデモンストレーションや、コミュニティ議論の高度化を目指して開催した、福岡県大牟田市の『会議シンギュラリティ』も紹介しています。(図3)これは実際の地域問題について議論する場にAIを導入したもので、AI同士で議論させてから住民同士が議論する取り組みです。その結果AIのアイデアにより議論が円滑にスタートし、自分にはない視点に気づけるなど、多くの効果がありました。
AIコンステレーションの実現にはAI同士の連携方法、学習や運用の改善、コストの削減などが課題です。また、今のLLMは自然言語の範囲は理解できても、世の中の情報理解には達していないため、非メディアの高度化も必要です。
我々はIOWNのネットワークやコンピューティング基盤などを活用して、「人とAIが協調するサービス環境」を提供し、社会貢献につなげたいと考えています。(図4)
Sakana AI
伊藤 錬 COO
我々は今年の3月にモデルをくっつけて繋いで利用する「進化的モデルマージ」を発表しました。これはモデルの作り方という意味で、AIコンステレーションのコンセプトを体現したものだと考えています。複数の小さなモデルをつないで、大きなモデルに比するパフォーマンスで課題を解決したり、AI同士が会話することで正しくカリブレーション(調整)していくことが次世代のAIの姿だと考えています。本日はAIコンステレーションのコンセプトのうえでどのようなAIをつくるべきか、いかに次世代のAIだと思っていただけるのかを、実例を含めてお伝えします。
モデルをつくるときに「ゼロ」から作り始めた場合、OpenAIよりも20〜30%ほど効率的にモデル作成ができる企業もあります。しかし我々は99.999%の効率化を目指しているため、ゼロスタートではなく既存モデル同士をくっつけることで効率化を図りました。人に例えると目はこの人、耳はこの人と良いところを集めて人間をつくるのではなく、目が4つあって足の裏にもあって、耳も4つあってもかまわないという「フランケンシュタインマージ」という手法でモデルを作ります。そうして10000通りのモデルマージを作り、その中のパフォーマンスの高い10個だけ残してあとは捨ててしまいます。その10個のモデルを第2世代モデルとしてまた10000個作り、トップの10個だけを残すという作業を繰り返します。これを999世代まで試したところGPT3.5くらいの性能を、24時間と24ドルでつくれました。これは我々にとって面白く大きな気づきでした。
またモデルの作り方もただデータを突っ込むだけでは限界があり、性能は上がってもコストに見合わなくなります。そのため「リーズニング」と呼ばれるモデル同士が会話できる技術を使ってサステナブルなモデル作りをする流れになってきています。今のChatGPTは何でもすぐに解決できる精度は無く、翻訳や要約が少しだけできてコールセンターが良くなって、というのが現実です。しかし我々が思い描く「革新的な未来を起こすために必要なAI」も、いくつかでてきました。そのひとつがワークフローオートメーションで、複数のステップに分かれているものを一気に自動化するテクノロジーです。
それを「学術論文を書く」という例で試してみました。通常のステップでは偉い先生から若い研究者にこんな論文を書いてごらんと助言があり、若い研究者は100個の面白そうなアイデアを考えて図書館に行って調べます。そうすると95個くらいは証明済みだったりするので、その残りの5個を証明して図表を作り論文にしていきます。
それをすべてAI化させたものを『AI scientist』という論文で証明しました。(図5)これは雑誌ネイチャーにAIで初めて取り上げられた論文となりました。方法としては100個のアイデアを100個の違う基盤モデルに問いかけて得られたものを、カリブレートするやり方です。このように我々はコンステレーションの考え方を使いながら、面白いモデルの構築や活用方法にチャレンジし続けています。
東京大学
特任教授 三宅 陽一郎
私からはゲーム分野とデジタルゲームAIについて説明します。この産業はまだ新しく2000年から盛り上がってきたもので、私は2004年くらいにゲーム産業に入りました。まず「ゲームAI」にはメタAI、キャラクターAI、空間AIの3種類があり、それぞれに役割があります。(図6)
そしてメタAIは生成AIと、キャラクターAIは言語AIと、空間AIは空間コンピューターと組み合わせができます。東京大学ではそれを実空間に応用するため、大牟田市全体を統べるメタAI、都市の中で活動するキャラクターAI、そして都市の空間的状況を把握する空間AIの3つのAIを組合せたスマートシティ(最先端のデジタル技術や情報を活用して都市機能の効率化・最適化をめざす都市)の仕組み作りをしています。本日はこれからキーワードになっていく空間AIとメタAIについて解説します。
まず空間AIは、特定の場所で取得した空間情報を渡したり、デジタルツインメタバース(デジタルと現実世界の仮想空間) をつくるときに空間に張り付いたAIが情報を渡すなど、現実から情報を吸い上げてメタバースに渡す役割を担っています。(図7)ほかにも環境の中に情報AIを埋め込むテクニックもあります。実はゲームではドアなどのオブジェクト自体がAIになってキャラクターの運動補助を担っており、それを積み上げてスマートシティを作ろうとしています。
メタAIは「人間を理解しようとするAI」です。ユーザにいろいろなデバイスをつけて生体情報を取得して心理状態が把握できますが、これはゲーム内だけではなく実空間でも同じです。
さらに、メタAI自体が3Dダンジョンなど、ゲームそのものを作り出すこともできます。ゲームコンテンツはこれまで100%人間が作っていましたが、メタAIが生成AIの力を借りてプラス20%の多様なコンテンツやゲームが作れるようになります。こういった技術を活用してさまざまコミュニケーションをとっていければと考えています。
この3つのAIでゲーム空間や実空間を変えていくには、仮想空間でシミュレーションしてから実空間に返す作業が必要です。今後は実空間と仮想空間をセットにし、メタバースそのものを人工知能として使うことがメタAIの役目となります。ほかにもシステムと人間をつなぐエージェント(データを統合する役)も必要になり、今後はAIコンステレーションが軸となる「AIで会話できる未来」がくると考えています。