Experiments

再現可能なデータで AI を検証する。

「やってみた」ではなく「N 回試した結果はこう」。Codex / Claude Code / Gemini をマルチエージェント合意で動かし、検証可能な実験ログを蓄積します。

方針

数字とコードで検証する、マルチエージェント合意の考察。

実験ごとに Claude(仮説検証視点)/ Codex(批判視点)/ 別エージェント(統合視点)を走らせ、 複数の AI が合意した点だけを最終考察として残します。 「ありふれた一般論」を排除し、データドリブンに次の判断を提示します。

実験自動化する

ChatGPT Automation × Codex Desktop App で AI Compass Journal の記事更新は自動化できるか?

PR #56 の実行結果をもとに、記事生成、ファイル編集、ローカル検証、GitHub 反映までのどこが自動化でき、どこで人間の介入が必要だったかを整理した初回実験です。

比較: ChatGPT Automation / Codex Desktop App / GitHub PR 作成 / Vercel Preview
#自動化#ChatGPT Automation#Codex#サイト運営#実験