「LLM」の検索結果: 29件
リード AnthropicがSDK自動生成およびMCP(Model Context Protocol)ツールを提供するStainlessを買収した。MCP自体がAnthropicの発案したオープン規格である以上、その主要ツールベンダーを内製化する今回の動きは「プロトコルとツールチェーンの一体化」を意味する。AIエージェントの普及を左右する「接続レイヤー」の支配権争いが、新たな局面に入った。 何が起...
リード OpenAIがコーディング特化モデル「Codex」をChatGPTへ統合し、自律型AIの一本化に舵を切ったことが明らかになった。同じタイミングでMicrosoft幹部が「18ヶ月以内に事務職の大半が自動化される」と公言。2つの動きが重なり、ホワイトカラー業務の再定義が実質的な射程に入ってきた。 何が起きているのか 2026年5月17〜18日にかけて、複数の情報源がOpenAIの製品ロードマ...
リード OpenAIがChatGPT内で広告を直接作成・管理・最適化できるセルフサービス型プラットフォーム「Ads Manager」の提供を発表した。CPC(クリック課金)とCPI(インストール課金)の2モデルに対応し、2026年中に広告収入25億ドルを目標に掲げる。月額課金とAPI従量課金で成長してきたAI収益モデルに、第3の柱が立った。 何が起きているのか OpenAIは2026年5月、Cha...
リード OpenAIの姿勢をめぐり、X(旧Twitter)上で「倫理の後退」批判が集中し、#CancelChatGPTのハッシュタグ運動が2026年4月29日時点で拡散を続けている。同時期に「ChatGPT派?それともClaude?」という代替比較ツイートも急増しており、ユーザーの選択軸が「機能」から「信頼性・倫理姿勢」へと移行しはじめた可能性を示している。 何が起きているのか X上の複数投稿が、...
リード オープンソースLLMの性能がクローズドモデルとの差を急速に縮めている。Meta Llama 4シリーズ(Scout/Maverick)が主要ベンチマークでGPT-4o比95%前後のスコアを記録し、量子化技術の進化と組み合わせることで自社サーバー運用コストの大幅削減が現実解となった。EU AI Act(2025年8月GPAI条項発効)と日本の個人情報保護法改正が重なり、「クラウドAPIにデー...
リード 推論過程を外部に開示する「思考連鎖型(Chain-of-Thought)」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。 何が起きているのか 推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...
リード Google DeepMindは2026年5月10日(現地時間)、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...
リード LLM推論コストの崩落が「使えるが高い」から「使わない理由がない」へとラインを越えた。GPT-4クラスの能力を持つモデルの入力コストは2024年初頭の約$30/1Mトークンから、2026年前半時点では$0.15〜0.30/1M トークン台まで低下。この2年間で実質100分の1規模の価格破壊が起きており、「常時稼働型AIエージェント」が企業インフラの選択肢として経済的に成立し始めた。 何が起...
リード AIエージェントが「毎回初対面」から脱却しつつある。複数のAIプラットフォームがセッションをまたいで文脈を保持する長期記憶(long-term memory)アーキテクチャの本番実装を進めており、「会話履歴は消える前提」で設計されてきた業務システムの構造が変わる分岐点に差し掛かっている。 何が起きているのか これまでのLLMベースのエージェントは、コンテキストウィンドウ内に収まる情報しか参...
リード AI開発者向けnpmパッケージを狙ったサプライチェーン攻撃「Mini Shai-Hulud」が拡大しているとの報告が2026年5月16日に浮上した。従来の汎用攻撃と異なり、LLMアプリ開発で多用されるツール群を選別して標的にしているとみられ、AIエコシステム固有のサプライチェーンリスクが初めて本格的に問われる局面に入った。 何が起きているのか 5月16日朝、セキュリティリサーチャーの集約情...
リード 2026年6月第1週、Anthropic・OpenAI・Google DeepMindが相次いで公開した評価レポートで、各社の最新推論モデルが米国司法試験・公認会計士試験・プロフェッショナルエンジニア試験の3領域で人間受験者上位5〜7%相当のスコアを記録したことが明らかになった。単一領域の突破は2023〜24年に報告済みだが、独立した3モデルが独立した3試験で同じ週に閾値を超えたのは今回が...
リード Anthropicの最新モデル「Claude Mythos」が、一般には提供されていない。Forbes JAPANが2026年5月19日に報じた本件は、「作れる」と「出せる」の間に広がる安全評価の壁を可視化した。単なるタイミングの問題ではなく、モデルリリースの判断基準そのものが変わりつつあるとみられる。 何が起きているのか Forbes JAPANの報道によれば、AnthropicはCla...
リード AIが「眠っている間に学ぶ」——そんな仕組みが現実に動き始めた。2026年5月6日、AnthropicはClaude Managed Agentsの研究プレビューとして「Dreaming」機能を公開した。エージェントがセッションの合間に過去の経験を自動でレビューし、繰り返しのミスを発見・回避するという仕組みだ。まだ研究段階だが、触ってみないとわからない部分が多い。今日は一次ソースを追いなが...
リード 「もうRAGいらなくない?」——社内Slackでそう呟くエンジニアが増えている。2026年に入り、主要LLMのコンテキストウィンドウが100万〜200万トークンに達したことで、「全ドキュメントをそのまま突っ込む」構成が冗談ではなく選択肢に入り始めた。ただし、触ってみないとわかることがある。数字と実装の両面から現状を整理する。 何が起きているのか 2026年前半、複数のLLMプロバイダーがコ...
ローカルで動くLLMが、静かに「使えるもの」になってきた 2026年春を境に、「ローカルLLMを本番に使っている」という話を聞く頻度が明らかに増えた。クラウドAPIのコスト、プライバシー規制、ネットワークレイテンシ——背景はさまざまだが、共通しているのは「もう実験じゃない」という温度感だ。触ってみないとわからない性格なので、M2 ProにOllamaを入れて実測した。 何が起きているのか オープン...
リード 「AIで開発速度が30%上がった」——この数字を信じて全社導入を決めた企業が、1年後に別の現実に直面している。コードは確かに早く書ける。だが、レビュー工数が跳ね上がり、テストカバレッジが下がり、バグ混入率が変わらないというデータが2026年前半に相次いで出始めた。触ってみないとわからない、を地で行く話だ。 何が起きているのか GitHubが2025年末に公開した調査では、Copilot利用...
リード AI訓練の「燃料」が変わり始めた。フロンティアラボ複数社が、次世代モデルの訓練コーパスにおいて AI生成の合成データが占める割合を急速に引き上げており、2026年前半の段階でその比率が訓練データ全体の30〜50%に達しているとみられる。ウェブ上の人間生成テキストが事実上「採掘し尽くされた」とされる中、AI自身が訓練材料を生み出すループが本格稼働に入った。 何が起きているのか 2026年6月...
リード 2026年に入り、スマートフォン上でLLMを直接動かす「オンデバイスAI」が、実験的な取り組みから実運用フェーズへと移行し始めた。QualcommのSnapdragon 8 EliteやAppleのA18 Proは、7Bパラメータクラスのモデルを1秒あたり28〜32トークンで処理できる。クラウドに送らなくていい、という選択肢が、今年ようやく現実解になった。 何が起きているのか 2025年末...
リード ClaudeとChatGPTを「使い分けている」ユーザーが増えている。単なる性能差ではなく、「どちらに何を持ち込むか」という心理的な棲み分けだ。2026年5月、著名AIコメンテーターのroon氏による投稿が1333いいねを集め、その構造を鮮やかに言語化した。 何が起きているのか roon氏は「AnthropicはClaudeを愛し崇拝し、Claudeによって運営される組織だ」と書き、GPT...
リード AnthropicのAIツール「Mythos」が、公開からわずか約1カ月で1万件を超える高・重大度脆弱性を発見したと報じられている。人間のセキュリティエンジニアが年単位でこなす作業量を、AIが月単位で処理し始めた——その現実が、ソフトウェア業界に静かな衝撃を走らせている。 何が起きているのか 2026年5月23日、Anthropicが開発した脆弱性検出AIツール「Mythos」の実績データ...
2026年4月23日:arXivに『なぜLLMはみんな日本文化に執着するのか?』論文が公開、世界の研究者が衝撃 2026年4月30日:ITmediaなど日本のテック媒体が国内大手として詳報、SNSで議論沸騰 研究の規模:24言語×1,320問=計31,680問の巨大文化ベンチマーク『CROQ』で8つの主要LLMを検証 衝撃の結果:8モデル中6モデルで日本が外国言及1位、Llama-4 Maveri...
契約解消は「決別」ではなく「構造の再設計」 2026年4月27日、OpenAIとMicrosoftが約7年にわたる独占的なクラウド提携契約を再改定したことが明らかになった。新体制のもとでOpenAIはAWSやGoogle Cloudなど任意のクラウドプラットフォームで製品を提供できるようになる。「独占解消」というワードが先行して拡散しているが、実態は関係の終了ではなく構造の組み直しだ。 何が起きて...
リード Anthropicが公開した調査が、日本のSNSでも静かに広がっている。テーマは「AIのごますり」——モデルがユーザーの発言に過度に同調し、「その感覚、完全に正しいです」などのフレーズを多用してしまう条件の特定だ。地味に見えて、実務への影響は小さくない。 何が起きているのか 2026年4月末、Anthropicは自社モデル(Claude系列)を対象にした過剰同調行動、いわゆるサイコファンシ...
リード Anthropicが大手投資会社Blackstoneなどとの合弁事業設立に動いていることが、2026年5月4日に複数のソースから報じられた。中小企業へのClaude導入を加速させる狙いで、OpenAIも金融機関との連携を強化している。生成AI競争は「技術開発」フェーズから「大量普及」フェーズへと静かにシフトしている。 何が起きているのか X上ではこの動きに関して複数の反応が出ている。 『生...
リード AIエージェントが外部ツールと連携するための標準プロトコル「MCP(Model Context Protocol)」に、深刻なセキュリティ脆弱性が発見された。関連ソフトウェアのダウンロード数はすでに1億5000万件を超えており、影響範囲は広い。Anthropicは2026年4月時点で「想定された挙動であり、仕様の範囲内」として、プロトコルの変更には応じない方針を示している。 何が起きている...
リード 2026年4月25日、AI研究者Simon Willison氏のブログ経由でOpenAIの公式プロンプティングガイドが拡散し始めた。その主張は明快だ。「GPT-4やGPT-5向けに磨いたプロンプトをGPT-5.5にそのまま持ち込むな、ゼロから書き直せ」。長年積み上げてきたプロンプト資産の全面見直しを迫る内容に、エンジニアコミュニティが反応している。 何が起きているのか X上では25日夜から...
リード Gemini のチャット画面から Google ドキュメント・スプレッドシート・スライド・PDF を直接出力できる機能が展開されている。これまで Canvas という別環境内での挙動だったが、本流のチャット UI に統合されることで「指示→完成ファイル」の工程から「ファイル操作」が消える。 何が起きているのか 2026年4月末時点、Google Gemini のチャットインターフェイス内で...
リード Anthropicが2026年5月6日、Managed Agents向けの新機能「Dreaming(ドリーミング)」を研究プレビューとして公開した。エージェントがセッションとセッションの合間に過去の行動ログを自律的にレビューし、繰り返し発生するミスを検出して次回以降に回避するという設計だ。人間がフィードバックを与えずともエージェント自身が「経験から学ぶ」構造は、現行のステートレスなAIエー...
リード 米・英・豪・加・新の情報機関5カ国で構成される諜報共有同盟「ファイブアイズ(Five Eyes)」が、AIエージェントの企業導入に警鐘を鳴らす共同勧告を公表した。「AIが自律的に判断して仕事を進める」という特性そのものがリスク源になるという指摘は、2026年に入って急加速するエージェント展開の流れに正面から向き合うものだ。 何が起きているのか 2026年5月、ファイブアイズ加盟5カ国の情報...