【ITニュース解説】Guess My Drawing: Can Gemini Read Your Mind in One Line?
2025年09月06日に「Dev.to」が公開したITニュース「Guess My Drawing: Can Gemini Read Your Mind in One Line?」について初心者にもわかりやすいように丁寧に解説しています。
ITニュース概要
AI「Gemini」が、あなたの描いた1本の線から何を描いたか当てるゲームが登場。まずGeminiが生成した4つの画像から1つ選び、制限時間内に1本の線で描画。Geminiはその線から元の画像を推測し、理由も説明。正解ならプレイヤーの勝ち、間違えればAIの勝ち。ラウンドが進むごとに画像は複雑化。Google AI Studioで開発され、テキストから画像を生成する機能と、画像からテキストを生成する機能を活用。
ITニュース解説
「Guess My Drawing」は、Google AI StudioのMultimodal Challengeのために開発されたゲームだ。プレイヤーは、AI(Gemini)が生成した4つの画像の中から1つを選び、それを一本の線で描く。制限時間は10秒。その後、Geminiがプレイヤーが描いた線画がどの画像に対応するかを推測する。正解すればプレイヤーの得点となり、不正解またはAIが判別不能と判断した場合はAIの得点となる。10ラウンド行い、最終的なスコアを競うシンプルなルールだ。
ゲームが進むにつれて、AIが生成する画像のテーマはより複雑で抽象的なものに変化する。例えば、最初は「サングラスをかけた笑顔の恐竜、ピクサー風」のような具体的な指示だが、ラウンドが進むと「バロック様式の不安なゴブリン」のような抽象的な指示になる。これにより、ゲームの難易度が上がり、プレイヤーはより創造的な表現を求められる。
このゲームは、Google AI Studio内で完結するように開発されている。画像生成とスケッチ分析のロジックはすべて、Google AI Studioに組み込まれたコードエディタを使用して実装された。外部ツールに切り替えることなく、プロンプトの設計からレスポンスの解析まで、すべての作業をGoogle AI Studio内で行うことができる。
ゲームの流れは以下の通りだ。まず、ラウンド開始時に、アプリケーションは「笑顔の恐竜」のような短いプロンプトをGemini 2.5 flash image previewモデルに送信する。モデルは、そのプロンプトに基づいて4つの画像を生成し、Base64エンコードされたPNG形式で返す。これらの画像はプレイヤーに選択肢として表示される。
プレイヤーが選択した画像を描いた後、そのスケッチはBase64形式に変換され、Geminiに送信される。Geminiは、そのスケッチが4つの画像のうちどれに最も似ているかを識別し、その理由を説明するよう求められる。モデルは、推測された画像のインデックスと簡単な説明を返す。これらの情報はゲーム内で結果として表示される。
このゲームは、Geminiの2つの主要なマルチモーダル機能、テキストから画像への変換(Text-to-Image)と画像からテキストへの変換(Image-to-Text)を活用している。Text-to-Image機能では、gemini-2.5-flash-image-previewモデルを使用して、各ラウンドの開始時に4つの画像を生成する。各画像は短い構造化されたプロンプトから作成され、Base64エンコードされたPNGとして返される。これらの画像は、プレイヤーが選択できるようにグリッド形式で表示される。
Image-to-Text機能では、プレイヤーが選択した画像を描いた後、そのスケッチをBase64形式に変換し、モデルに送信する。モデルは、スケッチが4つの選択肢のうちどれに最も近いかを識別するように求められる。応答には、推測されたインデックスと簡単な説明が含まれており、ラウンドの結果の一部として表示される。
このゲームの魅力は、プロンプトから画像、スケッチ、そしてAIの推測へと続く迅速なインタラクティブなサイクルにある。プレイヤーは単にボタンをクリックしたり、AIのパフォーマンスを観察したりするのではなく、一本の線を使ってAIとコミュニケーションを取ろうと積極的に試みる。AIがすぐに理解してくれることもあれば、プレイヤーの傑作を完全に誤解することもある。この予測不可能性こそが、このゲーム体験を楽しいものにしている。それはまるで、絵を使った会話をしているような感覚だ。
このゲームをプレイすることで、AIの画像認識能力や生成能力を体験できるだけでなく、プレイヤー自身の創造性や表現力も試される。シンプルなルールながら、AIとのインタラクションを通じて、新しい発見や驚きが得られるだろう。システムエンジニアを目指す上で、AIの可能性や限界を理解する良い機会になるはずだ。