生成AIウェビナー参加レポート
はじめに
MC DigitalおよびAIラボの紹介と、本セミナーの目的説明。
業務系生成AIプラットフォーム「Tachyon生成AI」デモ版の案内。
MCDigitalの会社概要とウェビナー内容
司会挨拶と登壇者紹介 (事務局:小河原)
セミナー開催の挨拶と、登壇者である青木氏(AIエバンジェリスト兼Tachyon 生成AI PM)を紹介。
質疑応答は最後に10分程度設ける予定であることを案内。
AIエージェントやDeepSeekなど、最新トピックに触れつつ、セミナーへの期待感を表明。
注意事項 (登壇者:青木)
セミナー内容のスクリーンショットは遠慮いただきたい旨をアナウンス。
Tachyon 生成AI デモ版案内
MC Digital開発の業務系生成AIプラットフォーム「Tachyon 生成AI」のデモ版を紹介。
機能制限はあるが、複数のLLMを試用可能。チャットで共有されたリンクからの登録を推奨。
会社概要とAIラボ紹介
MC Digitalは三菱商事100%子会社で、AI領域のプロフェッショナルカンパニーであると説明。エンジニア比率の高さや技術コンテストでの実績を紹介。
専門組織「MCD AIラボ」を紹介。最新技術動向のキャッチアップ、コンサルティング、技術開発、アプリケーション開発伴走まで幅広くサポートしていることを説明。
ウェビナーのゴール説明
対象者:生成AIの概要を知っている、技術動向に興味がある、今後の市場やユースケースを知りたい方。
ゴール:2025年1月現在の技術トレンドを理解し、現在位置や展望、新しいビジネスユースケースを知ること。
生成AIの概要
生成AI、LLM、ChatGPTなどの関連技術とサービスを整理。
LLMの基本動作(次単語予測)とハルシネーションの課題を解説。
生成AI、LLM、ChatGPTの関係性
生成AI:新しいコンテンツを生成するAIの一般的なカテゴリー。
LLM(大規模言語モデル):生成AIの中核技術の一つ。テキスト生成などでブレイクスルーを起こした。
ChatGPT、Gemini、Copilotなど:LLMを搭載した具体的なサービス名称。
LLMの仕組み
「ネクストトークンプレディクション」:次に続く単語の確率を逐次予測して文章を生成する仕組み。
出現確率に基づき生成するため、必ずしも事実と一致するわけではない(ハルシネーションの原因)。
しかし、多くの場合で有用な結果を出力し、ビジネス活用が進んでいる。
生成AIの最新技術動向
単体モデル(GPT-4o、Gemini 2.0等)がマルチモーダル化・性能向上。
推論モデル(O1、Gemini Flash Thinking)が高度な思考プロセスを実装。
オープンソースモデル(Llama、DeepSeek)の台頭により性能格差が縮小。
AIエージェント(Operator等)が自律的にPC操作を可能にし、RPAの進化を加速。
トレンド概観
実社会での利活用ポテンシャルを拡張しているメガテック企業の動向に着目し、以下の4つのテーマで解説。
単体モデルの性能向上
推論モデルの発展
高性能オープンソースモデルの登場
自律的タスク遂行
単体モデルの性能向上
OpenAI (GPTシリーズ):
GPT-3.5から断続的にアップデート(GPT-4 Turbo, GPT-4o)。
性能向上、マルチモーダル対応(画像、音声、リアルタイム対話)、コンテキストウィンドウ増大(最大128kトークン、小説1冊分程度)を実現。
Google (Geminiシリーズ):
2023年末発表以降、短期間でアップデート。
OpenAIに遜色ない、あるいは凌駕する性能(特に最新モデル)。
巨大なコンテキストウィンドウ(最大2Mトークン、小説16冊分、2時間の動画処理可能)。
最新モデル:Gemini 2.0 Flash、Gemini EXP 1206など。
Anthropic (Claudeシリーズ):
Claude 3シリーズ(当時最高性能)で注目を集めた。
アップデートごとに最高性能を更新してきたフロンティアモデル開発企業。
モデルの追加学習(ファインチューニング):
自社データでモデルを特化させる手法。
従来は旧モデルでしかできなかったが、OpenAI・Googleの最新モデルでも可能に。
有効なユースケースはまだ限定的との見解も。
推論モデルの発展
OpenAI (O1 / O1 Pro):
回答生成時(推論時)に深く考えさせることで性能が向上することを発見(数学、コーディングで顕著)。
スケーリング則に次ぐ「第2の発見」として注目。
動作イメージ:複雑な指示に対し、AIが自ら思考プロセス(リサーチ計画など)を立ててから回答を生成。
人間の思考における「システム1(直感的)」と「システム2(熟考的)」に例え、システム2を実装したものと解説。
O1 Pro:より多く思考するモード。博士課程レベルの科学問題等で性能向上。
Google (Gemini 2.0 Flash Thinking):
O1と同様、高速処理と高度な推論能力を両立。
数学、科学、図表理解などで既存モデルを上回る性能。
思考プロセスを詳細に表示するため、ユーザーにとって使いやすい可能性。
市場で高い評価を得始めている。
高性能オープンソースモデルの登場
Meta (Llamaシリーズ):
オープンソースLLMの代表格。Llama 3 / 3.1 / 3.2と進化。
Llama 3.1は一時GPT-4を超える性能を示し、Llama 3.2はマルチモーダルに対応。
非公開モデルとの性能差を縮小。
DeepSeek (DeepSeek V3 / R1):
中国企業DeepSeekが開発。2024年12月にV3、最近R1(推論モデル)を公開。
V3はGPT-4に匹敵する性能、R1はO1と同等の推論能力を持つとされ、市場で最も注目される存在に。
特筆点:学習コストの大幅削減。 これまでの「大規模投資=高性能」の図式(スケーリング則)を覆す可能性を示唆し、NVIDIA株価下落の一因にもなった。
今後のモデル開発の勢力図を変える可能性が高い。
モデル性能ランキング (2025年1月時点、Chatbot Arena):
全体: 1位 Gemini 2.0 Flash Thinking, 2位 Gemini EXP 1206, 3位 GPT-4o, ... DeepSeek R1も上位にランクイン。O1は特定領域特化型のため全体ランクはやや下がる。
日本語: 1位 Gemini EXP 1206, 上位はGeminiシリーズが占める。GPT-4oが続く。DeepSeek R1の日本語評価は今後注目。
性能向上とリリース時期の関係:
オープンソースモデル(緑点)が非公開モデル(オレンジ点)を猛追。
性能とコストの関係:
新しいモデルほど低コスト・高性能化(グラフ右上にシフト)。
Gemini、DeepSeekが価格・性能両面で優位。
生成AIの利用コストはゼロに近づく傾向。
自律的タスク遂行 (AIエージェント)
Anthropic (ComputerUse):
AIがスクリーンショットを介して画面を認識し、人間のようにPCを操作(仮想環境推奨)。ローカルファイル、ブラウザ、デスクトップアプリの操作が可能。
Google (Project Marina):
研究プロジェクト段階。Chromeブラウザの自動操作に特化。
OpenAI (Operator):
AIがブラウザを操作してタスク実行。クラウド内で仮想ブラウザを操作。複数タスク同時実行可能。米国Proユーザー向け先行リリース。
機能比較と性能:
基盤モデルは各社の最新高性能モデル(Claude 3.5, GPT-4ベース, Gemini 2.0)。
操作対象(PC全体、ブラウザ限定、仮想ブラウザ)に違い。
ベンチマーク(Oz-World):PC操作を含む複雑なタスクではまだ人間(72%)に及ばない(Anthropic 22%, OpenAI 38%)。
ベンチマーク(WebVoyager):ブラウザ操作に限定すれば高い性能(80%台後半)を発揮。
生成AI技術トレンドのまとめと今後の展望
性能向上が落ち着く一方、低コスト化とオープンソースの普及が加速。
ビジネスでの高度な推論能力活用や個別特化モデルの開発競争が拡大。
AIエージェントがより高度な自動化やSaaS連携を実現し、業務効率化を促進。
単体モデル
性能向上は若干頭打ち感もあるが、低価格化は進む。マルチモーダル性能(画像・音声認識精度)が自律的タスク遂行能力の鍵となる。
推論モデル:
より効率的な推論方法の開発が進む。ビジネスにおける高度な推論能力(複雑な分析、計画策定など)の活用が拡大する。
オープンソース
学習コスト低下により中小ベンダー参入が進み、開発競争が激化。個社/業界特化モデル構築や、オフライン(ロボット搭載など)での活用が進む。
自律的タスク遂行
開発不要でローカル/クラウド間のデータ連携がシームレスに。SaaS間連携や基幹システム入力などを自動化。
より強力なRPA(ロボティック・プロセス・オートメーション)として進化する。
生成AIの進化により実現するビジネスユースケース
AIによる高度な意思決定支援(データ分析、経営判断など)が現実化。
PC・ブラウザ操作機能により、業務プロセスのフルオートメーションが可能に。
2つの主要な方向性:
A. 高度な意思決定支援:
推論力、大規模データ解析能力を活用し、これまでシステム化困難だった複雑な判断を支援。
B. 複雑なタスクのフルオートメーション:
PC/ブラウザ操作機能により、複数ツールを横断する業務プロセスを自動化。
具体例 (高度な意思決定支援):
GeminiのDeep Research機能デモ:複数サービスの比較検討依頼に対し、AIがリサーチ計画を立て、ウェブ情報を収集・分析し、詳細なレポートを生成。
さらに、その内容をウェビナー構成案に反映させるタスクも実行。
ビジネスへの応用:処理対象データを自社データに:
社内文書、提案資料、財務情報などをAIに連携させ、高度な分析や意思決定支援に活用。
自律的に取り組ませるタスクの定義/変更:
検索だけでなく、経営計画策定などの特定業務プロセスに合わせて、AIの思考・実行プロセス(ガイドライン)を定義・調整する。