Andrej Karpathyが語る”AI Psychosis”と、ソフトウェアエンジニアリングの終焉

かつて世界最高峰のAIリサーチャーとして名を馳せ、TeslaやOpenAIの根幹を支えてきたAndrej Karpathyが、最近の「No Priors」podcastに出演した。そこで彼が語った内容は、単なるAIのトレンド予測などという生ぬるいものではなく、現在進行形で起きているソフトウェアエンジニアリングの崩壊と、新たなパラダイムへの移行の生々しい記録であった。

「もう『コードを書く』という動詞すら適切ではない」——そう断言する彼の言葉には、旧来の手動コーディングが完全にオワコン化したという確信が漂っている。彼は12月以降、自らの手でコードを1行も書いていないという。代わりに1日16時間、AIエージェントに対して自身の「意志（will）」を伝え、タスクを委任し続けている。この熱狂的で、ある種偏執的とも言える没入状態を、彼は”AI psychosis（AIサイコーシス）“と表現した。

本稿では、Karpathyの考察を起点に、Agent-drivenな開発パラダイムの正体と、彼が取り組むAutoResearchの現状、そして未来のAIエコシステムの行く末を分析する。

すべては”Skill Issue”という冷酷な現実

Karpathyが指摘するAgent-driven時代の最大の特徴は、人間の役割が「Sole creator（単独の創作者）」から「Orchestrator（指揮者）」へと完全にシフトした点にある。

AIエージェントに複雑なタスクを投げた際、期待外れの結果が返ってくることは日常茶飯事だ。ここで多くの開発者は「まだLLMの推論能力が足りない」とモデルのせいにしがちだが、Karpathyはこれを一蹴する。エージェントが機能しない場合、それはAIの限界ではなく、ひとえに人間側の「Skill Issue（スキルの問題）」であるというのだ。

AIエージェントの有効性は、モデル自体のIQよりも、与えられる指示の明確さ、利用可能なツールの選定、そして基盤となるMemoryシステムの設計に大きく依存する。どのエージェントにどの粒度でタスクを分割し、どのように並列処理（Orchestration）させるか。彼が1日16時間もPCの前に座り続けているのは、コードをタイピングしているからではない。この「いかにしてAIエージェントの能力を最大限に引き出すか」という全く新しいメタ・エンジニアリングのスキルを磨き上げているからに他ならない。

“Claws”の台頭と、Personalityという新たなUX指標

Karpathyのビジョンの中で特に興味深いのが、単発のチャットセッションを超えた「Claws」と呼ばれる概念だ。これは、ユーザーが明示的に操作しなくてもバックグラウンドで自律的かつ永続的に稼働し続けるAgenticなエンティティを指す。

彼はその実証として、「Dobby the Elf Claw」という自作のエージェントを紹介した。このDobbyは、彼自身のスマートホーム環境に接続され、照明、HVAC（空調）、セキュリティシステムに至るまで、すべてを自然言語のコマンドで一元管理している。もはや機能ごとに分断された複数のSaaSアプリを立ち上げる必要はない。複雑なシステムを背後に隠蔽し、最も直感的なインターフェースである「自然言語」で完結させる様は、Agentが日常生活のハブとなる未来を如実に示している。

そしてここで見過ごせないのが、Agentの「Personality（性格）」がもたらすUXへの甚大な影響だ。Karpathyは、AnthropicのClaudeとOpenAIのCodexを比較し、その違いを指摘した。Claudeは人間味があり、ユーザーとのインタラクションにおいてupbeat（明るく前向き）な反応を返すため、まるで優秀な同僚と共に作業しているかのような錯覚を抱かせる。一方でCodexは極めてドライであり、ただ機械的にタスクをこなすだけだ。

LLMのパラメータ数やベンチマークスコアばかりが注目されがちな昨今だが、最終的なプロダクトへの定着率を左右するのは、AIが人間の微妙な意図（Nuanced human intent）を汲み取り、いかに心地よいPersonalityとして振る舞えるかという点にある。技術的素養のない一般ユーザーがAgentを日常的に使いこなすようになるためには、この「感情的なUX」の設計が不可避となるだろう。

AutoResearchが浮き彫りにする自律化の壁

ソフトウェアエンジニアリングの自動化が進む中、Karpathyはさらにその先、AI研究そのものをAIに行わせる「AutoResearch」というプロジェクトに取り組んでいる。

仮説の生成から、膨大なデータセットの自律的な探索、モデルの学習（Training）、そして最適化評価に至るまで、研究ループ全体をAgentが自律的に回すという野心的な試みだ。これが実現すれば、AIが自らAIを改善する再帰的自己改善（Recursive self-improvement）の扉が開かれることになる。

しかし、彼自身が認めているように、現在のAutoResearchには明確な限界が存在する。部分的なタスクの自動化や最適化は可能であっても、未知のバグに対する軌道修正や、大局的な研究の方向性を決定するような「深い洞察」においては、まだ完全に人間のリサーチャーをループから外すことはできていない。Agentは指定された枠組み（Sandboxes）の中では驚異的なパフォーマンスを発揮するが、枠そのものを再定義するような推論には至っていないのが現状だ。

これは、Frontier Labsが巨額の資金を投じて追求している「完全自律型AI」の道のりが、我々が想像するよりも少しだけ険しいことを示唆している。

AIの民主化と、次なるパラダイム

完全な自律化にはまだ壁があるとはいえ、Agentの台頭がもたらす波は止まらない。Karpathyは、Open Sourceモデルとアクセス可能なAIツールの進化が、AIの民主化を強烈に推し進めていると強調した。

一握りのFrontier Labsだけが最先端の恩恵を独占する時代は終わりつつある。Hugging FaceやGitHubに公開される無数のオープンウェイトモデルとツール群を組み合わせれば、世界中のあらゆる個人や組織が、自分専用の「Dobby」や「AutoResearchアシスタント」を構築できる。

手でコードを書くという行為は、近い将来、機械語を直接記述するのと同じくらい奇骨な趣味へと変わるだろう。我々がいま直面しているのは、AIに仕事を奪われるという単純な悲観論ではない。AIという無尽蔵の知性リソースを前にして、それをいかに指揮し、自らの「意志」をシステム全体に反映させることができるかという、新しい知性の使い方のテストなのだ。

Karpathyが陥った”AI psychosis”は、狂気ではない。それは、Agent-drivenな未来へ適応するための、極めて健全な進化のプロセスである。我々もまた、己の”Skill Issue”と向き合い、早急にこのサイコーシスに感染する必要があるのだろう。