2026/04/08 - AI開発トレンド
本日のAI・テクノロジー界隈は、Anthropicが発表した次世代モデル「Claude Mythos Preview」の衝撃的な性能と、それに伴うセキュリティリスクの議論が中心となりました。また、中国発の強力なオープンソースモデル「GLM-5.1」の登場や、開発ワークフローを根本から変えるエージェント活用の深化など、技術の進展が加速しています。
特に、AIが既存のOSやブラウザの脆弱性を自律的に特定し、悪用手法まで開発可能になったという報告は、開発者やセキュリティ担当者に大きな波紋を広げています。一方で、日々の業務を効率化する「Second Brain」構築や、スマホ上でのローカルLLM実行といった、より身近な活用事例も活発に共有されています。
それでは本日の注目トピックを詳しくご紹介します。
目次
- Anthropicが次世代モデル「Mythos」を発表、脆弱性検出能力が人智を凌駕
- 中国発のOSSモデル「GLM-5.1」が首位に、8時間の自律改善ループを実現
- Claude Codeの利用限界とOpenClawを巡る「検閲」インシデントの波紋
- AIによる「Second Brain」構築とナレッジ管理の自動化がトレンドに
- スマホでのローカルLLM実行が加速、NPU活用やビルド成功事例が続出
- エージェント設計の新潮流:巨大な人格より「職能の分解」が鍵に
Anthropicが次世代モデル「Mythos」を発表、脆弱性検出能力が人智を凌駕
Anthropicは、熟練した人間を凌駕するコーディング能力と脆弱性検出能力を持つ次世代モデル「Claude Mythos Preview」を公開しました。このモデルは既存の主要OSやブラウザから未修正の脆弱性を多数特定し、悪用手法まで開発できるレベルに達していると報告されています。
あまりに高い攻撃性能を持つため、一般公開は行わず、AWSやMicrosoft等のパートナーと設立した「Project Glasswing」を通じて防御側への提供に限定される方針です。AIがサイバーセキュリティにおける「核」のような存在になりつつあることが示唆されています。
nukonuko(April 8, 2026 at 03:15AM): Project Glasswing設立。Claude Mythos Previewは広く使われているOS等で数千件のハイリスク脆弱性を検出。安全性の検証を経て防御側にのみ公開予定。
bcherny(April 8, 2026 at 04:55AM): Mythosは非常に強力で、恐ろしく感じるはずだ。一般公開せず、サイバー防御者限定でプレビューする責任あるアプローチを誇りに思う。
yugen_matuni(April 8, 2026 at 06:45AM): 「最も熟練した人間を凌駕できるほどのコーディング能力」と明記。野に放たれるだけでリスクなため、一般開放は遅くなるだろう。
中国発のOSSモデル「GLM-5.1」が首位に、8時間の自律改善ループを実現
中国のZ. ai社が開発したオープンソースモデル「GLM-5.1」が、主要なベンチマークでOSS首位を獲得しました。特筆すべきは「粘り強さ」であり、8時間にわたって自律的にUIや機能を改善し続け、Linuxデスクトップ環境をゼロから構築するデモンストレーションが話題を呼んでいます。
クローズドモデルに迫る性能を持ちながら、安価な料金体系で提供されており、コーディングやエージェント用途での実用性が高まっています。特定のタスクにおいて既存のトップモデルを代替する可能性が指摘されています。
masahirochaen(April 8, 2026 at 01:35AM): GLM-5.1が全ベンチマークでOSS首位に。8時間自律稼働し、数千回のイテレーションで自己改善する能力を持つ。
nukonuko(April 8, 2026 at 01:27AM): コーディング性能はGemini 3.1 Pro以上、Claude Opus 4.6未満。Hugging Faceでリポジトリが公開されている。
MLBear2(April 8, 2026 at 01:42AM): Claude Sonnet 4.6の半額以下の価格設定。性能比としては非常に安価な印象を受ける。
Claude Codeの利用限界とOpenClawを巡る「検閲」インシデントの波紋
AnthropicのCLIツール「Claude Code」において、挨拶だけでセッション制限の4%を消費する仕様や、特定のシステムプロンプトの使用によるアカウント制限が問題視されています。特に「OpenClaw」という文字列を含むプロンプトに対して制限がかかった事象は、ユーザー間で「検閲」であるとの批判を招きました。
AI企業によるプラットフォームの独裁的な管理体制への懸念が強まっており、代替ツールへの移行を検討する動きも見られます。開発ツールとしての利便性と、提供企業のポリシーのバランスが問われています。
sora19ai(April 6, 2026 at 10:55PM): 挨拶1回で4%消費。Claude Codeユーザーから悲鳴が上がっており、Codexへの移行組も出始めている。
kenn(April 6, 2026 at 11:34PM): システムプロンプトにOpenClawと入れただけで制限をかけるのは検閲に該当する。AI企業として踏み越えてはいけない一線を越えた。
suna_gaku(April 7, 2026 at 10:12AM): Claudeのミスが増え、速度も低下しているため、Codexの出番が増えている状況。
AIによる「Second Brain」構築とナレッジ管理の自動化がトレンドに
Andrejs Karpathy氏が提唱した、YouTubeやSNS、AIとの会話をObsidianに集約し、LLMで自動Wiki化する「Second Brain(第二の脳)」構築が注目を集めています。個人の日記やメッセージを読み込ませ、自分専用のWikipediaを作成する試みが具体化しています。
これにより、膨大な非構造化データから「自分だけの知識体系」を即座に引き出せるようになります。単なる検索を超えた、パーソナライズされた知能の所有が現実的になりつつあります。
sora19ai(April 7, 2026 at 02:05AM): KarpathyのSecond Brain構築が話題。YouTubeやAI会話をObsidianに集約し、LLMが自動でWiki化して検索可能にする。
masahirochaen(April 8, 2026 at 12:50AM): Claude Code × Obsidian × OpenClawで、AIが勝手に記憶・整理・振り返りをしてくれるナレッジシステムを構築した。
sora19ai(April 7, 2026 at 02:47AM): 日記やiMessageなど2,500のエントリを読み込ませて自分専用のWikipediaを作る実装は、知識管理の新しい形だ。
スマホでのローカルLLM実行が加速、NPU活用やビルド成功事例が続出
スマートフォン上でLLMを動作させる試みが進展しており、llama.cppのビルド成功や、GPU/NPUを用いた推論速度の検証結果が共有されています。GoogleのGemma-4などの軽量かつ強力なモデルの登場が、この流れを後押ししています。
クラウドを介さないローカル実行は、プライバシー保護やオフライン利用の観点から期待されています。現在はハイエンド端末が中心ですが、今後はスマホ内蔵センサーと連携した新しい活用法が広がると見られます。
gosrum(April 7, 2026 at 11:57AM): スマホでllama.cppのビルドに成功。ベンチマーク評価も可能な状態になった。
gosrum(April 7, 2026 at 05:12PM): Gemma-4-E4Bの推論速度を検証。GPU処理がCPUに比べて大幅に速いことが確認された。
yugen_matuni(April 7, 2026 at 08:27PM): Gemma4級のモデルとメガネ型デバイスの組み合わせは、ソフトウェア単体とは違う新しい体験を生む。
エージェント設計の新潮流:巨大な人格より「職能の分解」が鍵に
AIエージェントの開発において、万能な「一人の天才」を作るのではなく、特定の職能(スキル)を細かく分解して積み上げる設計思想が重要視されています。Anthropicが提唱する「Don’t build agents, build skills」の考え方が現場に浸透しつつあります。
個々のタスクに特化した「サブエージェント」をオーケストレートする手法が、複雑な業務自動化において高い成果を上げています。開発者の役割は、プロンプト作成から「ワークフローの設計」へとシフトしている可能性があります。
sora19ai(April 8, 2026 at 06:00AM): AIは“人格”より“職能”を細かく分解してスキルとして積み上げた方が強い。巨大な1人を作ろうとするのは失敗の元。
yugen_matuni(April 7, 2026 at 08:50AM): GPT-5.4をオーケストレーター、Claudeをサブエージェントにするような混合部隊の運用が非常に便利。
sora19ai(April 7, 2026 at 01:18AM): サブエージェントはClaude Codeの自動化で必須の概念。公式が無料でこの手法を公開している意義は大きい。