Google I/O 2024が、2024年5月15日から開催されました。今年も、いろいろな新製品および新技術の発表がありましたので、その内容をまとめます。
Google I/Oとは
Googleが毎年開催する開発者向けの大規模イベントです。アメリカ合衆国カリフォルニア州のサンフランシスコで開催されています。
このイベントでは、Googleの最新技術や新サービスに関する発表、開発者向けのセッション、デベロッパー同士の交流などが行われます。AndroidやChrome、Web開発、機械学習、人工知能など、幅広いトピックが扱われます。
Google I/O 2024は、2024年5月15日に開催されました。
Google I/O 2024で行われた発表
Google I/O 2024で発表された内容は、「AIが中心」と考えても良いです。
Googleは各種デバイスもありますが、GooleのAI「Gemini」がこれから中心になっていくというのを感じる発表だったのではないかと思います。
Geminiの進化
Google I/O 2024にて、Googleは言語モデル「Gemini」の最新アップデートを発表しました。
今回のアップデートでは、長文コンテキスト理解の強化、、処理速度の向上、AIエージェント機能の強化など、様々な革新的な機能が追加されています。
長文コンテキスト理解の強化
Google Gemini Proは、翻訳やコーディングといったユースケース全体において、一連の品質が向上しています。また、プライベートプレビューでは200万トークンのコンテキストウィンドウで利用できるようになります。
どれぐらい凄いかというと、2時間のビデオ、22時間のオーディオ、6万行以上のコード、140万語以上の単語を同時に処理できるようになります。映画の要約を頼めるようになるレベルです。
処理速度の大幅向上
Gemini 1.5 Flashと呼ばれる速度と効率性を重視した軽量・高性能モデルが発表されました。
Chat GPT 4oに対抗したAIエンジンの発表を考えられます。
AIエージェント機能の強化
「Project Astra」と呼ばれるAIアシスタントの開発状況が発表されました。これは、高度な視覚と会話能力を備えたエージェントであり、複雑でダイナミックな世界を理解し、人間のように対応することができます。カメラを表示して、AIがリアルタイムに映像を把握してアシストしてくれます。
このアシスタント機能は、日常生活およb、ビジネス分野で、様々なアシストをしてくれるAIになると思います。
マルチメディアへの対応
GoogleのAIは様々なマルチメディア出力に対応しました。
画像生成(Imagen 3)
画像生成は、「Imagen 3」です。高品質な画像を生成できるようになりました。誕生日メッセージやプレゼンテーション資料、看板など、様々な用途に活用することができます。
音楽生成(Music AI Sandbox)
音楽生成は、Music AI Sandboxが発表となりました。
動画生成(Veo)
動画生成AIは、Veoが発表となりました。1分間の高画質な動画を作成してくれます。
その他の発表
その他の発表としては、GoogleのAI「Gemini」は、Workplaceとも連携できます。
Google フォト
Google フォトに保存されている画像や動画を分析し、自動的にタグ付けやキャプション生成を行うことができます。これにより、画像や動画を簡単に検索したり、思い出を振り返ったりすることが可能になります。
ワークプレイス
ワークプレイスのドキュメントやメールを分析し、重要な情報や関連する資料を自動的に抽出することができます。これにより、情報収集や意思決定の効率化が図れます。
また、「Gemini」を動作させる最適なハードウェア として、第6世代 TPU「Trillium」 が発表されました。
Trilliumは、前世代の TPUv4 よりも処理能力が 4 倍向上しており、Geminiのような大規模な言語モデルの処理に最適化されています。
まとめ
Google IO 2024の発表内容をまとめました。
今年は、AIが中心の発表でしたが、様々な発表に正直驚かされます。
Open AIの「ChatGPT 4o」が発表された直後のGoogle IOでしたが、
Gooleも対抗できるようなAIを持っていると感じました。
動画生成AI「Sora」や、「ChatGPT 4o」など、まだ少しOpenAIが先を走っている感じはしますが、
Googleには、Google Workplaceや、ハードウェアと連携しながら、AIを強化していると感じました。
コメント