最終更新日:
最新の生成AI「Gemini」とは?3つのモデルや利用料金、使い方などを解説
Gemini(ジェミニ)とは
Geminiとは、Googleが開発したマルチモーダル生成AIモデルです。テキスト、画像、音声、動画を入力として受け取り、テキストと画像を生成できます。音声による応答は、今後「Gemini Live」というサービスで提供される予定です。
Geminiが発表される前は、OpenAIのGPT-4が主力の生成AIモデルでした。しかし、Geminiは主要な指標の多くでGPT-4を上回っており、GPT-4を凌ぐともいわれています。そのため、2023年12月6日に発表されて以降、大きな注目を集めています。
そして2024年2月には、最新モデルの「Gemini 1.5 Pro」が発表されました。日本語を含む35以上の言語・150以上の国において、生成AIサービス「Gemini Advanced」で利用できます。
Gemini 1.5 Proは、一般ユーザー向けの会話型AIでは最長となる100万トークン以上のコンテキストウィンドウに対応しています。そのため、最大1,500ページのドキュメントを理解したり、100件の電子メールを要約したりすることが可能です。
GeminiとChatGPTの違い
GeminiとChatGPTは、開発している会社が異なります。GeminiはGoogle、ChatGPTはOpenAIです。Geminiは検索エンジンであるGoogleが開発しているので、リサーチに特化しており、専門性が高いという特徴があります。
ただし、今後は技術の進歩によって、それぞれの生成AIモデルの強みは変化していくでしょう。
ChatGPTの概要や活用方法については、「ChatGPTとは|始め方・使い方やできること、活用事例、おすすめ機能を紹介」の記事で詳しく紹介しています。
Geminiの特徴と強み
Geminiには、以下3つの大きな特徴・強みがあります。
- ネイティブマルチモーダル
- 優れた推論能力
- 高品質なコード生成
それぞれ具体的に説明していきます。
ネイティブマルチモーダル
Geminiは、テキスト、画像、音声など複数の種類のデータを同時に扱えるネイティブマルチモーダルが特徴です。この特徴によって、ニュアンスを含んだ情報をより理解し、複雑なトピックに関する質問に回答できます。特に、数学や物理学の推論の説明に優れた性能を発揮します。
引用:Google DeepMind「Gemini:AFamilyofHighlyCapable MultimodalModels」
優れた推論能力
Geminiは、膨大なデータの中から識別が難しい知識を発見する能力に長けており、この能力によって高度な推論性能をもちます。そのため、複雑な文字情報や視覚情報を理解することが可能です。
この強みによって、科学や金融などの多くの分野において、研究や調査が加速することが期待されています。
高品質なコード生成
PythonやJava、C++、Go などさまざまなプログラミング言語を理解しているGeminiには、高品質なコードを生成できる特徴もあります。実際にGoogleがほかの人工知能モデルと比較をしたところ、Geminiにはより高度なコード生成スキルがあることがわかりました。
このスキルは、コーディングを超えた複雑な数学や理論的なコンピュータサイエンスを含む、競技プログラミングに出題される問題の解決にも役立てられるでしょう。
Geminiの種類・モデル
Geminiは利用者のニーズに合わせて、以下3つのモデルを提供しています。
- Gemini Nano
- Gemini Pro
- Gemini Ultra
それぞれの特徴や活用シーンを見ていきましょう。
Gemini Nano
Gemini Nanoは、デバイス上のタスクに最も効率的なモデルです。スマートフォン、特にGoogle Pixel 8 Proでの実行を想定して設計されています。
外部サーバに接続せずに、効率的なAI処理を必要とするデバイス上のタスク(チャットアプリケーション内での返信の提案、音声からテキスト要約など)が実行できます。
Gemini Pro
Gemini Proは、幅広いタスクに対応する最良のモデルです。Gemini ProはGoogleの生成AIサービス「Bard」に搭載されました。現在、「Bard」は「Gemini」に名称が変更されています。「Gemini」はGoogleアカウントを持っていれば、誰でも無料で利用できます。
Gemini Ultra
Gemini Ultraは、非常に複雑なタスクに対応する、高性能かつ最大のモデルです。テキスト、画像、音声、動画、コードなどのさまざまな種類の情報を迅速に理解し、それにもとづいて動作するように開発されています。
Gemini Ultraは、Geminiの有料版であるGemini Advancedで提供されています。Gemini Advancedの利用料金は月額料金は2,900円であり、最初の2ヶ月は無料で利用可能です。
Geminiのパフォーマンス
Geminiのパフォーマンスが高いことは、Googleが実施した調査で明らかになっています。
Gemini Ultraのパフォーマンスは、自然な画像の理解から数学的推論、音声や動画の理解に至るまで、広く使用されている32項目の業界ベンチマークのうち、30項目において既存の最高水準の結果を上回りました。特に、MMLU(大規模マルチタスク言語理解)では90.00%を記録し、人間の専門家を上回るパフォーマンスを示したのです。
以下は、Googleが発表しているGeminiでのベンチマークのスコアです。テキストだけでなく、動画・画像・音声といった分野に関しても最高水準の結果を記録しています。ちなみに、ほぼすべての主要ベンチマークテストでGPT-4を上回っており、精度の高さが伺えます。
出典:Google Japan Blog: 最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに
Geminiの使い方
Geminiは、以下のステップで使い始めることができます。
- Geminiにアクセスする
- 利用規約に同意する
- Geminiのチャット画面でプロンプトを入力する
Google Geminiにアクセスすると、以下のページが開きます。左下の「Geminiと話そう」のボタンをクリックしてみましょう。
次に利用規約と注意事項が出てくるので、内容を確認したら、どちらも右下のボタンをクリックしてください。
ここまで完了したら以下の画面が開き、登録が完了です。一番下の欄にプロンプトを入力して、利用を開始してみましょう。また、Gemini Advancedを利用する場合は、右上の画面から登録できます。なお、Googleのアカウントを持っていない場合は、最初に取得しておく必要があります。
Geminiは、Googleのサービス・商品やその他関連サービスなどで利用できます。ただし、中には日本版がなかったり、リリース前のものがあるため、注意しましょう。
Geminiが搭載されている関連サービス
Vertex AI
Vertex AIとは、Google CloudのAI開発プラットフォームです。2023年12月から、Gemini ProがVertex AI上でGemini APIとして利用できるようになっています。
これにより、API経由でGeminiの基盤モデルを利用できるようになり、Geminiを利用したアプリケーション開発が行えるようになりました。
Google Pixel
Geminiは、Google Pixelにも導入されています。Geminiのモバイルデバイス向けのモデルであるGemini NanoがAndoroidに搭載され、ネイティブかつオンラインで実行できます。
具体的には、以下の機能に搭載されています。
- レコーダーアプリにおける自動要約機能
- Gboardキーボードのスマートリプライ機能
Google各種サービス
Google検索やGoogle広告、Chrome、Duet AIなどGoogleの主要な製品・サービスにおいて、順次Geminiが導入されています。
Genimiの安全性
Geminiの安全性を維持するために、Googleでは以下3つの取り組みを行っています。
- 開発段階での安全性対策
- 包括的な安全性評価
- レッドチームテスト
これらの対策によって、GeminiはほかのGoogleのAIモデルと比べて、最も安全性が高いと評価されています。
参考:Introducing Gemini: Built with responsibility and safety at the coreGenimiの今後
Geminiは今後、さまざまな製品・サービスに随時統合されていくことが予測されます。
例えば、Googleの検索結果には、現在生成AIによる回答が表示されています。これがGeminiに置き換わることで、さらに高度な回答を得ることができ、ユーザの利便性は向上するでしょう。
また、個人だけではなく企業における利便性も向上するはずです。例えば、Vertex AIの精度が高まることで、アプリケーションの開発をスムーズに行うことができます。その結果、企業の生産性は上がるでしょう。
このように、Geminiはさまざまなユーザに対して、利便性の向上をもたらしてくれることが期待されています。
まとめ
この記事では、Geminiの特徴やモデル、使い方や将来性について解説しました。
Geminiの最大の特徴はマルチモーダルである点であり、この性質によって生成AIの可能性が大きく広がることが予測されます。
Geminiは、順次Googleの製品やサービスなどに搭載されています。上手く活用して、業務や研究の生産性を高めていきましょう。
なお、生成AIについて詳しく学びたい方には、スキルアップAIの講座がおすすめです。ビジネスパーソン向けには、「ビジネスパーソンのための対話型生成AI講座」や「生成AIアイデアソン講座」などをご用意しています。
また、「プロンプトエンジニアコース」は給付金の対象となっています。給付金対象講座についての説明会を開催しているので、興味のある方はお気軽にご参加ください。
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: