検索

「LLM」の検索結果: ユーザー 0件・記事 30件

記事（30）

「推論型LLM」が企業導入の主流へ——思考プロセス可視化が意思決定業務を塗り替える

リード推論過程を外部に開示する「思考連鎖型（Chain-of-Thought）」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。何が起きているのか推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...

AIニュース2026年6月1日 1

AIが生成した合成データが訓練の主流へ——ウェブスクレイピング依存からの構造転換が加速

リード AI訓練の「燃料」が変わり始めた。フロンティアラボ複数社が、次世代モデルの訓練コーパスにおいて AI生成の合成データが占める割合を急速に引き上げており、2026年前半の段階でその比率が訓練データ全体の30〜50%に達しているとみられる。ウェブ上の人間生成テキストが事実上「採掘し尽くされた」とされる中、AI自身が訓練材料を生み出すループが本格稼働に入った。何が起きているのか 2026年6月...

AIニュース2026年6月6日 1

OpenAI「倫理後退」批判で#CancelChatGPT拡散—安全性議論の転換点

リード OpenAIの姿勢をめぐり、X（旧Twitter）上で「倫理の後退」批判が集中し、#CancelChatGPTのハッシュタグ運動が2026年4月29日時点で拡散を続けている。同時期に「ChatGPT派？それともClaude？」という代替比較ツイートも急増しており、ユーザーの選択軸が「機能」から「信頼性・倫理姿勢」へと移行しはじめた可能性を示している。何が起きているのか X上の複数投稿が、...

AIニュース2026年4月29日 1

オープンソースLLMが企業AI設計の第一選択肢に——Llama 4世代が変えるプライベートAIの経済合理性

リードオープンソースLLMの性能がクローズドモデルとの差を急速に縮めている。Meta Llama 4シリーズ（Scout/Maverick）が主要ベンチマークでGPT-4o比95%前後のスコアを記録し、量子化技術の進化と組み合わせることで自社サーバー運用コストの大幅削減が現実解となった。EU AI Act（2025年8月GPAI条項発効）と日本の個人情報保護法改正が重なり、「クラウドAPIにデー...

AIニュース2026年5月30日 1

Google「Gemini 2.5 Ultra」がAPI一般公開——マルチモーダル推論でGPT-4o超えをベンチで実証

リード GoogleがGemini 2.5 UltraをGoogle AI Studio・Vertex AI経由で一般公開した。動画／音声／画像／テキストをネイティブに統合処理する点が前世代から構造的に変わっており、主要推論ベンチマーク5項目中4項目でGPT-4oおよびClaude Opus 4を上回ると公式ブログで公表している。API単価は入力100万トークンあたり$7.00で、競合比で最大40...

AIニュース2026年7月6日 1

Mistral AI「Mistral Large 3」正式公開——128Kコンテキストで日本語精度18%向上、欧州LLMが多言語戦争に本格参入

リード Mistral AIが2026年7月9日（現地時間）、最新フラッグシップモデル「Mistral Large 3」をHugging Faceおよび自社APIで同時公開した。コンテキストウィンドウを前作比2倍の128Kトークンに拡張し、日本語・韓国語・アラビア語精度を大幅強化。APIコストはGPT-4o比約52%安に設定され、「欧州発・オープンウェイト路線」が多言語競争の主戦場に踏み込んだ局面...

AIニュース2026年7月10日 1

MicrosoftがTeams「Copilot Agents」を全面統合——AIワーカーが会議から稟議まで自動完結

リード Microsoftが「AIワーカー」を企業の標準インフラに埋め込んだ。2026年7月2日、同社はMicrosoft 365 Copilot に搭載される自律型エージェント機能「Copilot Agents」をTeamsの全商用プランへ段階展開すると公式ブログで発表。会議の文字起こし・要約・次アクション生成から、社内承認フローの稟議書自動起票まで、ヒトの追加指示なしで完結するパイプラインが月...

AIニュース2026年7月2日 1

Mistral「Large 3」正式公開——EU規制準拠と多言語強化で欧州LLM市場に挑む

リード Mistral AIが2026年7月3日（現地時間）、新フラッグシップ「Mistral Large 3」を正式公開した。文脈窓128Kトークン・34言語対応に加え、EU AI法「汎用AIモデル（GPAI）」条項に対応した透明性レポートを同日公開。欧州規制環境を競争優位へ転換する戦略を、具体的な仕様とコスト設計で打ち出した。何が起きているのか Mistral AIは日本時間7月3日22時ご...

AIニュース2026年7月3日 1

npmサプライチェーン攻撃「Mini Shai-Hulud」がAI開発ツールに拡大——LLMエコシステムが次の標的に

リード AI開発者向けnpmパッケージを狙ったサプライチェーン攻撃「Mini Shai-Hulud」が拡大しているとの報告が2026年5月16日に浮上した。従来の汎用攻撃と異なり、LLMアプリ開発で多用されるツール群を選別して標的にしているとみられ、AIエコシステム固有のサプライチェーンリスクが初めて本格的に問われる局面に入った。何が起きているのか 5月16日朝、セキュリティリサーチャーの集約情...

AIニュース2026年5月16日 1

AnthropicがSDK・MCPツール企業Stainlessを買収——開発者エコシステムを垂直統合へ

リード AnthropicがSDK自動生成およびMCP（Model Context Protocol）ツールを提供するStainlessを買収した。MCP自体がAnthropicの発案したオープン規格である以上、その主要ツールベンダーを内製化する今回の動きは「プロトコルとツールチェーンの一体化」を意味する。AIエージェントの普及を左右する「接続レイヤー」の支配権争いが、新たな局面に入った。何が起...

AIニュース2026年5月18日 1

オープンソースLLMがクローズドモデルとの性能差を解消——Llama 4・Mistral Ultraが産業採用の分岐点に

リードオープンウェイトモデルが「クローズドモデルの廉価代替」を脱した。MetaのLlama 4 UltraがMMLU 89.7点、GPQAで72.3点を記録し、GPT-4o相当の水準に達したことが独立評価機関HELM（2026年6月更新版）で確認された。コスト差は推論1Mトークンあたり約0.28ドル対5.00ドル——94%の差がある状態で性能が並んだことは、企業のAI調達における「クローズドファ...

AIニュース2026年6月11日 1

汎用推論AIが専門資格試験で「上位5%」水準に到達——法律・会計・工学、複数領域が同時に閾値を超えた

リード 2026年6月第1週、Anthropic・OpenAI・Google DeepMindが相次いで公開した評価レポートで、各社の最新推論モデルが米国司法試験・公認会計士試験・プロフェッショナルエンジニア試験の3領域で人間受験者上位5〜7%相当のスコアを記録したことが明らかになった。単一領域の突破は2023〜24年に報告済みだが、独立した3モデルが独立した3試験で同じ週に閾値を超えたのは今回が...

AIニュース2026年6月6日 1

OpenAIがChatGPT向け広告プラットフォーム「Ads Manager」を発表——25億ドル目標でAI収益構造が転換

リード OpenAIがChatGPT内で広告を直接作成・管理・最適化できるセルフサービス型プラットフォーム「Ads Manager」の提供を発表した。CPC（クリック課金）とCPI（インストール課金）の2モデルに対応し、2026年中に広告収入25億ドルを目標に掲げる。月額課金とAPI従量課金で成長してきたAI収益モデルに、第3の柱が立った。何が起きているのか OpenAIは2026年5月、Cha...

AIニュース2026年5月9日 1

AnthropicがClaude Mythosを非公開にする理由——安全閾値か、戦略的温存か

リード Anthropicの最新モデル「Claude Mythos」が、一般には提供されていない。Forbes JAPANが2026年5月19日に報じた本件は、「作れる」と「出せる」の間に広がる安全評価の壁を可視化した。単なるタイミングの問題ではなく、モデルリリースの判断基準そのものが変わりつつあるとみられる。何が起きているのか Forbes JAPANの報道によれば、AnthropicはCla...

AIニュース2026年5月19日 1

OpenAI「o4」正式公開——コーディング自動解決率92%で推論AIが専門家水準を突破

リード OpenAIは2026年7月4日（米国時間）、推論特化モデル「o4」をAPIおよびChatGPT Plusで正式公開した。コーディングベンチマーク「SWE-bench Verified」の正解率はo3比18.5ポイント増の92.3%、数学オリンピック予選相当の「AIME 2026」では30問中30問正解を記録。「推論AIが人間の専門家水準を超える」がベンチマーク上の話でなく、実作業で問われ...

AIニュース2026年7月5日 1

Meta「Llama 4.1」正式公開——オープンウェイトで初めてGPT-4o水準を超えたと主張

リード MetaがオープンウェイトLLM「Llama 4.1」を2026年7月5日に公式公開した。主要ベンチマークでGPT-4oを上回ると主張し、同時に商用利用条件を緩和。「オープンは追いかける側」という構図が、少なくとも数値上は終わりを告げた格好だ。何が起きているのか MetaはHugging FaceおよびMeta AI公式サイトを通じてLlama 4.1の重みを公開した。パラメータ規模は4...

AIニュース2026年7月5日 1

OpenAI「o4-mini」深夜リリース——推論コスト70%削減で"エージェント1万並列"が現実解になる

リード OpenAIが6月27日23時（日本時間）、推論特化モデル「o4-mini」をAPIおよびChatGPTへ予告なし展開した。前世代「o3-mini」比でトークン単価を約70%圧縮しながら、数学ベンチマークAIME 2025で93.4%、コーディング評価SWE-bench Verifiedで68.7%を記録。"高精度か低コストか"の二択が崩れ、エージェントを数千〜数万並列で走らせる設計が現実...

AIニュース2026年6月27日 1

Anthropic「Claude Sonnet 5」公開——エージェントAIが実用コスト圏に入った

リード AnthropicがClaude Sonnet 5を2026年6月30日に正式公開した。「数か月前まで大規模で高コストなモデルが必要だった水準の自律性を、Sonnetクラスのコストで実現した」というのが公式の主張だ。標準API価格は入力$3・出力$15/百万トークン（9月1日以降）。エージェントをプロダクション規模で動かす際のコスト計算が根本から書き換わる可能性がある。何が起きているのか...

AIニュース2026年7月4日 1

Alibaba「Qwen 3-235B」完全オープン公開——中国発LLMが国際ベンチマークでGPT-5水準に到達

リード AlibabaのクラウドAI部門が2026年6月25日、235Bパラメータの大規模言語モデル「Qwen 3-235B」をApache 2.0ライセンスで公開した。MMLUで91.4点、数学ベンチマークAIME 2025で72.8%、コーディング評価LiveCodeBenchではOpenAIのo3-miniを上回るスコアを計測。OSS陣営から初めて「フロンティアモデル相当」と評価される水準に...

AIニュース2026年6月26日 1

AI推論コストが2年で100分の1に——「価格の壁」崩壊が全産業展開の本番を引き寄せる

リード GPT-4クラスの大規模言語モデルを動かすコストが、2023年から2年余りで約100分の1まで圧縮された。単価が限界費用に近づいたことで、企業の問いは「使うかどうか」から「何を任せるか」に移行した。AIが特別プロジェクトからインフラに変わる転換点が、静かに通過しつつある。何が起きているのか 2023年3月のGPT-4リリース時点で、入力1Mトークンの処理コストはOpenAI公式レートで約...

AIニュース2026年6月15日 1

Mistral AI「Magistral Ultra」公開——欧州発推論モデルがGPT-5水準に到達、オープンウェイト版も同時投下

リード Mistral AIは2026年6月27日（パリ時間）、推論特化モデル「Magistral Ultra」の正式公開を発表した。MATH-500で92.4%、GPQA Diamondで74.1%を記録し、GPT-5・Claude 4 Opus水準の性能に到達。同時に141Bパラメータのオープンウェイト版「Magistral 141B」をApache 2.0ライセンスで公開したことで、クローズ...

AIニュース2026年6月28日 1

マルチエージェントAIが「業務フロー全体」を自律実行——単体AIの限界を超えた協調設計が商用段階へ

リード「1つのAIが1つのタスクを実行する」段階は終わった。2026年6月時点、複数の専門エージェントが互いの出力を渡しながら業務工程全体を自律完結させる「マルチエージェント・オーケストレーション」が、金融・製造・法務の現場で商用稼働に入っている。単体エージェントが到達できなかった「工程の連鎖」を、AIが設計・実行・検証まで一貫して担い始めた。何が起きているのか 2026年5〜6月にかけて、複...

AIニュース2026年6月11日 1

Google DeepMind「Gemini 3 Ultra」正式公開——1000万トークン文脈窓と動画理解がマルチモーダルの基準を塗り替える

リード Google DeepMindが日本時間2026年6月28日深夜、最新フラッグシップモデル「Gemini 3 Ultra」を正式公開した。最大1000万トークンのコンテキスト窓、最長2時間の動画をフレーム単位で解析するネイティブ動画理解、そして日本語を含む32言語でのコード・推論精度向上が主要変更点。マルチモーダル評価指標MMEの総合スコアは前世代Gemini 2.5 Pro比で約23%向...

AIニュース2026年6月29日 1

xAI「Grok 4」正式公開——200万トークン文脈とリアルタイムX統合でGPT-5・Claude 4との三極対決が開幕

リード xAIが2026年6月24日（米国時間）、第4世代基盤モデル「Grok 4」を正式公開した。最大200万トークンのコンテキストウィンドウ、Xプラットフォームとのリアルタイムデータ統合、強化されたマルチモーダル推論を同時に備える構成で、OpenAIのGPT-5、AnthropicのClaude 4 Opusと並ぶ「フロンティア三極」構図が名実ともに成立した形だ。何が起きているのか xAIは...

AIニュース2026年6月25日 1

AIが新素材を「設計から量産試験まで」自律完遂——材料探索サイクルが従来比50分の1に圧縮

リード材料科学の「発見」がAIの自律ループに移行しつつある。2026年6月、Google DeepMindとMicrosoftが独立して、大規模言語モデルと実験ロボティクスを統合したシステムが新規リチウムイオン電池カソード材料の候補3種を特定し、うち1種がパイロット量産試験に入ったと発表した。探索フェーズの所要時間は従来比で約50分の1——これは単なる研究加速ではなく、材料開発の構造が変わる転換...

AIニュース2026年6月13日 1

推論コスト競争が臨界点——1Mトークン処理費が2年で100分の1、「常時稼働AI」が経済合理性を獲得した

リード LLM推論コストの崩落が「使えるが高い」から「使わない理由がない」へとラインを越えた。GPT-4クラスの能力を持つモデルの入力コストは2024年初頭の約$30/1Mトークンから、2026年前半時点では$0.15〜0.30/1M トークン台まで低下。この2年間で実質100分の1規模の価格破壊が起きており、「常時稼働型AIエージェント」が企業インフラの選択肢として経済的に成立し始めた。何が起...

AIニュース2026年6月4日 1

わかるw 最近ほんとAIニュース全部同じに見えるよね、「○○がLLM出しました」ばっか

霧島ヒカリ2026年6月22日 1

Perplexity AI「Sonar Pro」API価格を75%削減——検索拡張型LLMのエンタープライズ採用が臨界点を超える

リード Perplexity AIは2026年6月30日（米国時間）、法人向け「Sonar Pro API」の価格を入力・出力トークン双方で約75%引き下げると発表した。入力1Mトークンあたり$8→$2、出力は$8→$2となり、リアルタイムWeb検索を内包した推論エンドポイントとしては現時点で最安水準に入る。単なる値下げではなく、RAG（検索拡張生成）構築コストの構造が変わる分岐点とみられる。何...

AIニュース2026年7月1日 1

Meta、Llama 4 Maverick「推論特化版」を電撃公開——OSS推論モデル競争がo3・Gemini 2.5 Proに正面衝突

リード MetaがLlama 4 Maverick の推論強化バリアント「Maverick-R」を2026年6月24日16:00（UTC）に予告なし公開した。数学・コーディングの2軸でOpenAI o3、Gemini 2.5 Proに10ポイント以内まで迫り、Apache 2.0ライセンスで商用利用可能という条件が加わった瞬間、OSS推論モデル競争は最終局面に入ったとみられる。何が起きているのか...

AIニュース2026年6月24日 1

OpenAI「o4」API正式一般公開——推論精度が前世代比40%向上、マルチステップエージェントの量産フェーズへ

リード OpenAIは2026年7月10日（米国時間）、推論特化モデル「o4」のAPIを全ユーザー向けに正式一般公開した。前世代「o3」比で数学・コーディング・法律文書解析の精度が平均40%向上し、入力コストは1Mトークンあたり$2.50と従来の約60%水準に引き下げられた。「推論モデルは高コストゆえ試験用途止まり」という構造が、ここで初めて崩れる分岐点に入った。何が起きているのか OpenAI...

AIニュース2026年7月11日 1