13 2月 2026

2026/02/13 - AI開発トレンド

本日のAI界隈は、中国、米国、そしてGoogleが相次いで新モデルや大規模アップデートを発表し、まさに「歴史的な一日」となりました。特に中国のZ.AIが発表した「GLM-5」と、OpenAIが放った超高速モデル「GPT-5.3-Codex-Spark」が、開発者コミュニティに大きな衝撃を与えています。

推論能力の飛躍的向上と、1秒間に1000トークンを超える驚異的な生成速度の両立により、AIエージェントの活用は「対話」から「自律的なエンジニアリング」へと完全にシフトしつつあります。これら最新モデルの導入方法や、現場での一次検証レポートが続々と報告されています。

それでは本日の注目トピックを詳しくご紹介します。

中国Z.AIが「GLM-5」をリリース、推論能力が大幅向上
OpenAI、秒速1000トークンの超高速モデル「Codex-Spark」発表
Google「Gemini 3 Deep Think」が大幅更新、数学・物理五輪級の知能へ
Claude Codeに「Plan Mode」追加、複雑なタスク設計が可能に
AIエージェントの「記憶」と「Skills」による品質担保の議論
電力インフラへの投資とAI開発の持続可能性

中国Z.AIが「GLM-5」をリリース、推論能力が大幅向上

中国のAI企業Z.AIより、最新モデル「GLM-5」が発表されました。 従来のGLM-4.7と比較してコーディング能力や日本語の表現力が著しく向上しており、一部のベンチマークではClaude Opus 4.6を上回る結果も報告されています。

低価格でありながら高い推論能力を持つため、実務におけるメインモデルの有力候補となる可能性があります。 ただし、APIの挙動が一時不安定であることや、推論速度が他の最新モデルに比べると低速であるという課題も指摘されています。

yugen_matuni（February 11, 2026 at 10:37PM）: GLM5ジャンルによってOpus4.6超えてるのか。それをあのサブスク料金で使えるなら、中国モデルすごい。素直に。

gosrum（February 11, 2026 at 10:47PM）: モデル名を「glm-5」にしたらClaude Codeで使えました。aliasを使うと切り替えが楽だと思います。

umiyuki_ai（February 12, 2026 at 02:30AM）: TransformersにGLM-5対応のプルリクが来ているらしい。じゃあその内オープンモデル確定か。安心しました。

OpenAI、秒速1000トークンの超高速モデル「Codex-Spark」発表

OpenAIは、リアルタイムコーディングに特化した超低レイテンシモデル「GPT-5.3-Codex-Spark」をリリースしました。 Cerebras社との提携により、1秒間に1000トークン以上という圧倒的な生成速度を実現しており、従来の「AIの待ち時間」をほぼゼロにする設計となっています。

精度面では上位モデルに譲るものの、完了時間の短さから「サブエージェント」としての利用に最適であると見られています。 開発者からは、コーディングにおける最大のボトルネックだった「遅さ」が解消されることへの期待が寄せられています。

MLBear2（February 13, 2026 at 03:15AM）: OpenAIが超高速モデルGPT-5.3-Codex-Sparkをリリース。Cerebrasとの提携によるハードウェアで1000トークン/秒以上を実現。性能はやや犠牲になってそう。

kenn（February 13, 2026 at 06:31AM）: 超高速なCodex Spark爆誕。速すぎて笑える。コンテキストサイズ小さめのモデルっぽいけど、サブエージェント利用が最適でしょうね。

Google「Gemini 3 Deep Think」が大幅更新、数学・物理五輪級の知能へ

Googleが「Gemini 3 Deep Think」のアップデートを公開し、科学・エンジニアリング領域での推論能力が飛躍的に向上しました。 ARC-AGI-2ベンチマークで84.6%という最高スコアを記録したほか、国際物理オリンピックや化学オリンピックの金メダルレベルに相当する成績を収めています。

高度な論理的思考を必要とするタスクにおいて、既存の競合モデルを大きく引き離す数値を叩き出しています。 AI Ultra会員向けに即日提供が開始されており、研究や複雑なシステム設計への応用が期待されます。

ctgptlb（February 13, 2026 at 01:55AM）: Googleが最高知能AIをリリース。ARC-AGI-2で84.6%と最高スコア。2025年国際物理オリンピックで金メダル級の成績。

hAru_mAki_ch（February 13, 2026 at 04:28AM）: Gemini 3 Deep Thinkが大幅アップグレード。Codeforcesで人間のGM級を超えるElo 3455を記録。全9ベンチマークで他モデルを上回る。

Claude Codeに「Plan Mode」追加、複雑なタスク設計が可能に

Anthropicは、Slack版Claude Codeにおいて、実装前に計画を練る「Plan Mode」を導入しました。 複雑な依頼に対してAIが自ら質問を行い、詳細な実装計画書を作成してから実行に移るワークフローが構築されています。

これにより、大規模な開発タスクにおける「指示の食い違い」や「手戻り」を最小限に抑えることが可能になります。 ユーザーの間では、単なるコード生成を超えた「プロジェクト管理」に近い挙動として注目されています。

nukonuko（February 12, 2026 at 07:53AM）: Slackから使えるClaude CodeにPlan Modeが追加。複雑なタスクを始める前にClaudeが質問をし、実装計画を立てるモード。

suna_gaku（February 12, 2026 at 08:03AM）: 実装計画書を作成してくれるので、複雑なタスクを依頼する時に使えそうです！

AIエージェントの「記憶」と「Skills」による品質担保の議論

AIエージェントの性能を安定させるための「Skills（スキル）」や「記憶管理」の重要性が改めて議論されています。 自由度の高い指示（Vibe Coding）では品質がバラつくため、特定のワークフローをパッケージ化する手法や、エージェントに「問題がある前提」で検証させるプロンプト設計が推奨されています。

単一の強力なモデルに頼るのではなく、適切な「手順書」と「実行環境」を組み合わせる設計思想が主流になりつつあります。 複数のエージェントを並列で動かす際のコンテキスト管理についても、具体的なノウハウが共有されています。

muscle_coding（February 12, 2026 at 04:03AM）: Anthropic公式の品質チェックプロンプトが面白い。「問題があると仮定しろ」「お前の仕事はそれを見つけることだ」というバグハントの思想。

kyutaro15（February 12, 2026 at 09:05PM）: エージェントは起動するたびに特定のファイルを読み込む。これが「人格」や「記憶」の仕組みになる。

電力インフラへの投資とAI開発の持続可能性

Anthropicは、AIデータセンターによる電気料金の上昇分を消費者に負担させない方針を発表しました。 送電網インフラの全額負担や、ピーク時の電力削減システムへの投資、さらには地域社会への影響を最小化するための取り組みが含まれています。

AIモデルの学習・推論に膨大な電力が必要となる中、企業の社会的責任と持続可能な開発体制が問われています。 この動きは業界の新たな基準になる可能性があり、電力リソースの確保が将来のAI開発のボトルネックになるとの予測も強まっています。

MLBear2（February 12, 2026 at 08:11AM）: Anthropicが電気料金上昇分を消費者に代わって負担すると発表。インフラコストの全額負担や節水型冷却技術などに投資するとのこと。

_nogu66（February 12, 2026 at 11:58AM）: フロンティアAIモデルの学習にはまもなくギガワット単位の電力が必要になる中、これは業界の新基準になるかも。

目次