学習の主権 ― ハーネスから強化学習へのボトルネック #AgentRL #主権AI #2026年AI史 #知的自給率
学習の主権 ― ハーネスの檻からAgentRLの荒野へ #AgentRL #主権AI #2026年AI史 #知的自給率 2026年、私たちは「API小作人」というデジタル封建制の支配を脱し、自律的に学習する知能の所有者へと進化する。本書は、評価用ハーネスに閉じ込められた推論モデルが、強化学習(AgentRL)を通じて主権を取り戻すまでの、技術的・地政学的な闘争の記録である。 目次 イントロダクション:深夜のIDE、一文字の沈黙から 登場人物紹介:歴史を動かす知能と人間たち 要旨・本書の目的・方法論 歴史的位置づけ・先行研究の整理 第1部 デジタル封建制とハーネスの檻 第1章 ハーネスの再定義:評価から支配へ 第2章 API小作人という生存形態 第2部 試行錯誤の復権:強化学習のパラダイム 第3章 ソーンダイクの猫箱からAgentRLへ 第4章 学習の民主化:推論から進化へ イントロダクション:深夜のIDE、一文字の沈黙から 窓の外では2026年の梅雨が、街を重苦しい湿気で包み込んでいます。あなたはいつものように、自分の使い慣れたオープンソースのAIエディタである Void や CortexIDE を開き、コードを書き進めています。しかし、ある瞬間、画面の右下に表示されたAIの返答が、かつて見たことのない冷淡な一文に変わります。 「その要求には応えられません。現在のポリシーにより、この推論リクエストは制限されています」 これは単なるバグではありません。2026年6月12日に米国で発動された、あの「 Fable 5 規制事件 」の直接的な余波です。私たちがこれまで「知能の水道水」のように享受してきた安価で強力なAPI。それは実は、他国の巨大企業が管理する巨大な蛇口から供給されていたに過ぎませんでした。 本書が問うのは、私たちがいつの間にか陥っていた デジタル封建制 の正体です。私たちはAIを「使っている」つもりで、実は「使わされていた」のではないでしょうか? 評価用の枠組み(ハーネス)という檻の中に閉じ込められ、自分たちで知能を「育てる(重みを更新する)」権利を放棄していた。その結果、地政学的なレバー一本で、私たちの思考の道具が奪われてしまったのです。 今、私たちは「API小作人」からの独...