突如現れた高性能LLM「gpt2-chatbot」の謎に迫る

#AI#OpenAI#ニュース#解説
投稿日:

大規模言語モデル(LLM)のベンチマークプラットフォームのLMSYS Chatbot Arena上に、突如として「gpt2-chatbot」というLLMが現れました。その名前と裏腹に、最新のLLMと張り合う性能が話題を呼んでいます。しかし、その詳細は謎に包まれており、さまざまな噂がささやかれています。

この記事では、gpt2-chatbotについて、現時点でわかっている情報を深掘りしていきます。

LMSYS Chatbot Arenaとは?

LMSYS Chatbot Arenaは、さまざまな開発元から提供されるLLM(Large Language Models) の性能を比較検証するためのプラットフォームです。プロンプトを入力すると、ランダムに選択された2つのモデルが生成した回答が表示されます。ユーザーはそれらの回答を見比べ、どちらが優れているかを投票するという仕組みです。

このプラットフォームの最大の特徴は、ブラインドテスト方式を採用している点です。いずれのLLMの名前も開示されず、純粋に出力内容のみで判断されるため、先入観なくモデルの品質を評価できます。2つのモデルの出力のどちらが優れているかを回答すると、モデル名が開示されます。

謎のLLM「gpt2-chatbot」の登場

LMSYS Chatbot Arenaに突如として登場したgpt2-chatbotは、他の多くのLLMと比較して非常に優れた性能を見せています。とくに文脈の理解や回答の正確性が高いうえに、他のLLMには解けない論理的な問題に解答できます。

gpt2-chatbotは、2019年に発表されたGPT-2を彷彿とさせる名前でありながら、その性能は天と地ほどの差があります。中には、OpenAIの最新モデル「GPT-4」と同等か、あるいはそれ以上の性能ではないかとする声も上がっています。

実際の出力

gpt2-chatbotの実際の出力例です。他のLLMとの出力の比較は、私のTwitterのスレッドを参照してください。なお、記事執筆時点では、gpt2-chatbotは利用できなくなっています

ユーザー:Aという会社がBという会社と相互後援契約を締結したという内容のプレスリリースの下書きを書いて
──────────
**プレスリリース**
**即時公開**
### A社とB社、相互後援契約を締結
【年月日】― 本日、A株式会社(本社:[A社の所在地]、社長:[A社社長名]、以下「A社」)とB株式会社(本社:[B社の所在地]、社長:[B社社長名]、以下「B社」)は、相互のビジネス拡張とサービス向上を目的として、相互後援契約を締結したことを発表します。
この契約により、A社とB社はそれぞれのリソースと技術を活用し合い、以下のような具体的な協力を進めていくことになります:
- **技術交流:** A社の[具体的な技術]とB社の[具体的な技術]を組み合わせ、製品開発を共同で行います。
- **マーケティング支援:** 互いの市場でのプロモーション活動を支援し合います。A社はB社の製品を[A社の市場]で、B社はA社の製品を[B社の市場]でそれぞれ推進します。
- **情報共有:** 市場動向や顧客からのフィードバックを共有し、サービスの質を向上させます。
A社の[A社社長名]社長は、「このたびB社との相互後援契約を締結できたことを大変嬉しく思います。B社の持つ独自の技術とリソースを組み合わせることで、お客様にとってさらに価値の高いサービスを提供できるようになると確信しています。」とコメントしています。
同様に、B社の[B社社長名]社長は、「A社とのこの新しいパートナーシップにより、私たちの製品とサービスが更に多くのお客様に届くことを期待しています。互いの強みを生かした協力関係を築けることを楽しみにしております。」と述べています。
### 会社概要:
**A株式会社**
- 所在地: [A社の所在地]
- 代表者: 社長 [A社社長名]
- 事業内容: [A社の事業内容]
**B株式会社**
- 所在地: [B社の所在地]
- 代表者: 社長 [B社社長名]
- 事業内容: [B社の事業内容]
このパートナーシップは、両社の製品とサービスの質を高め、顧客満足を一層促進するものと信じています。
**お問い合わせ先:**
A株式会社 広報部
Tel: [A社の電話番号]
Email: [A社のメールアドレス]
B株式会社 広報部
Tel: [B社の電話番号]
Email: [B社のメールアドレス]
**終わり**
---
この下書きを基に、具体的な情報や日付を適宜修正・追加してご使用ください。

gpt2-chatbotの正体は?OpenAIとの関連性

gpt2-chatbotは名前以外の情報が明かされておらず、その正体は謎に包まれています。

gpt2-chatbotが話題になった直後、OpenAIのCEOのサム・アルトマン氏は、自身のX(旧Twitter)で、「i do have a soft spot for gpt2(gpt2には愛着があるんだ)」と発言しました。サム・アルトマン氏は、当初は「i do have a soft spot for gpt-2」(『gpt2』ではなく『gpt-2になっている』)と投稿していましたが、すぐに「gpt2」に修正しました。このことから、gpt2-chatbotを意識しての発言とみられます。

gpt2-chatbotの性能とサム・アルトマン氏の発言から、同モデルはOpenAIで開発中のGPT-4.5やGPT-5のテストではないかとする噂も広がっています。

サム・アルトマン氏の投稿の編集履歴
サム・アルトマン氏の投稿の編集履歴

技術革新の可能性

もしgpt2-chatbotが名前通り従来のGPT-2ベースのモデルだった場合、パラメータ数に対する性能の大幅な進化が示され、これが実現すれば、LLMの低コスト化や効率的な運用が可能になると考えられます。

スマートフォンを含む各種端末のオンデバイスでの利用が現実的になることで、さらに幅広い用途にLLMを利用できるようになるでしょう。とくに企業や自治体では、個人情報や機密情報の保護の観点から、サードパーティ企業が提供するLLM(通常は提供元のサーバーにデータが送信される)への情報の入力に抵抗感があります。オンデバイスで高品質なLLMを利用できるようになれば、こうした場面での活用が進むと考えられます。また、通常のLLMは提供元によって入出力に「規制」をされる場合がありますが、ローカルで動作するLLMであればその懸念を軽減できるため、表現の自由の観点からも重要です。

ただし、gpt2-chatbotがGPT-2ベースかは不明ですし、仮にGPT-2ベースでもその仕組みやモデルの重み(モデル本体のデータ)が公開されるかは分からない点に注意が必要です。

まとめ

gpt2-chatbotは、突如としてLMSYS Chatbot Arenaに登場し、その高性能が話題となっています。その正体は謎に包まれており、OpenAIとの関連性を巡る憶測も広がっています。gpt2-chatbotがGPT-2ベースのモデルであれば、LLMの低コスト化やオンデバイスでの利用が可能になる可能性があります。今後の情報公開に期待しましょう。

Twitterのアイコン LINEのアイコン Threadsのアイコン Misskeyのアイコン Misskeyのアイコン
著者のアイコン画像