【ITニュース解説】Cooking with Google AI
2025年09月10日に「Dev.to」が公開したITニュース「Cooking with Google AI」について初心者にもわかりやすいように丁寧に解説しています。
ITニュース概要
GoogleのAI「Gemini」を活用し、冷蔵庫の写真を撮るだけで食材を認識し、作れるレシピを提案するWebアプリが開発された。食品ロス削減に貢献するこのアプリは、Geminiの画像認識と自然言語生成というマルチモーダル機能を利用している。
ITニュース解説
冷蔵庫の中身を写真に撮るだけで、人工知能(AI)がその日の献立を提案してくれるWebアプリケーション「From Fridge to」が開発された。このアプリケーションは、家庭での食品ロスを減らし、日々の食事の準備をより創造的で楽しいものに変える可能性を秘めている。システム開発の根幹には、Googleが提供する最新のAIモデル「Gemini」が活用されており、AI技術が私たちの生活にどのように役立つかを示す具体的な事例となっている。
このシステムの心臓部であるGeminiは、「マルチモーダルAI」と呼ばれる種類のAIである。マルチモーダルとは、テキスト、画像、音声など、複数の異なる形式の情報を同時に理解し、処理できる能力を指す。従来のAIが主にテキストならテキスト、画像なら画像と、単一の形式の情報を扱うのが得意だったのに対し、マルチモーダルAIは人間のように、目から入る情報(画像)と、それに関連する知識(テキスト)を組み合わせて思考することができる。「From Fridge to」は、このGeminiのマルチモーダル能力を巧みに利用して、これまでにない便利な機能を実現している。
アプリケーションの動作原理は非常に直感的である。まず、利用者がスマートフォンのカメラで自宅の冷蔵庫の内部を撮影し、その画像をアプリケーションにアップロードする。すると、アップロードされた画像はインターネットを通じてGoogleのAIが稼働するサーバーに送られる。ここでGeminiの「画像認識」機能が働き、写真に写っている物体を一つひとつ識別していく。例えば、卵のパック、牛乳、数本のニンジン、キャベツの塊などを正確に特定し、それらを食材のリストとしてデータ化する。このプロセスは、人間が冷蔵庫を覗き込んで「何があるかな」と確認する作業を、AIが瞬時に代行してくれることに相当する。
次に、画像認識によって抽出された食材リストを基に、Geminiはもう一つの重要な能力である「自然言語生成」機能を発揮する。これは、与えられた情報や指示に基づいて、人間が読んで自然に理解できる文章を生成する技術である。このアプリケーションの場合、Geminiは特定された食材(卵、ニンジン、キャベツなど)を最大限に活用できるレシピを考案し、その材料と調理手順を具体的な文章として作成する。単に食材名をキーワードとしてレシピを検索するのではなく、食材の組み合わせや文脈を理解した上で、創造的で実用的なレシピを提案できる点が、このAIの優れた特徴である。最終的に、生成されたレシピが利用者の画面に表示され、利用者はその日の献立のヒントを得ることができる。
このようなアプリケーションの開発には、いくつかの技術的な要素が関わっている。開発者は「Google AI Studio」という開発者向けのツールを利用して、Geminiモデルを自身のアプリケーションに組み込んだ。これは、AIモデルの性能を試したり、アプリケーションと連携させるためのプログラムコードを効率的に作成したりできる、いわばAI開発のための作業台のようなものである。
そして、開発したアプリケーションがGeminiの機能を利用するためには、「API(Application Programming Interface)」と呼ばれる仕組みが不可欠となる。APIとは、あるソフトウェアやサービスが持つ機能を、外部の別のプログラムから呼び出して利用するための窓口や接続規約のことである。開発者はこのAPIを通じて、自分のアプリケーションからGoogleのサーバーに「この画像を分析して食材をリストアップしてほしい」「この食材リストでレシピを生成してほしい」といった要求を送り、その結果を受け取る。APIの活用により、開発者は複雑なAIモデルをゼロから構築することなく、既存の高度なAI機能を自分のサービスに部品として組み込むことが可能になる。
ただし、開発の過程は常に順風満帆というわけではない。開発者が直面した課題の一つに「APIのレート制限」があった。これは、サービスを提供するサーバーへの過度な負荷を防ぐため、一定時間内にAPIを呼び出せる回数に上限が設けられていることである。多くの利用者が同時にアクセスした場合などを想定し、この制限の中でいかに安定したサービスを提供するかを考える必要がある。また、完成したアプリケーションをインターネット上のサーバーに配置し、誰もがアクセスできるように公開する「デプロイ」という作業でも問題が発生したという。これは、開発環境と本番環境の違いなど、様々な要因で起こりうる問題であり、システムエンジニアが日常的に向き合う現実的な課題の一つである。
「From Fridge to」は、マルチモーダルAIという最先端技術をAPI経由で活用することで、食品ロスという社会課題の解決に貢献しつつ、人々の生活を豊かにするサービスを創出できることを示した好例だ。システムエンジニアを目指す者にとって、このようなAI技術の仕組みを理解し、APIを介して様々なサービスと連携させ、新たな価値を生み出していく能力は、今後ますます重要になっていくだろう。