用 AI 做數學研究？你都可以

數學研究向來被視為天才嘅專利——你要有 Fields Medal 級數嘅直覺，先可以喺抽象世界入面發現新嘢。但過去兩年發生咗一件反常識嘅事：OpenAI o3 喺數學 benchmark 上嘅表現唔單止超越咗大部分博士生，佢嘅推理過程仲可以俾任何人一一審視、重播、改進。Reasoning API 嘅開放意味住，你唔需要係 Grothendieck，都可以開始同機器一齊做數學。問題係：點樣先將呢個能力由 demo 變成真正嘅研究工具？

從 Aletheia 到 OpenAI：推理 API 嘅 democratisation

2022 年 Aletheia 仲係一個學術 prototype——用 GPT-3 嘗試自動化數學證明嘅部分步驟。當年嘅限制好明顯：模型唔識 backtracking，一錯就錯到底，而且 token limit 細到連一個完整嘅 lemma 都 handle 唔到。三年後嘅今日，OpenAI o3 嘅 reasoning API 已經可以輸出數千個 token 嘅逐步推理，仲識得自我糾正路徑。對 indie hacker 嚟講，呢個落差係一個訊號：基礎建設已經到位，真正嘅 gap 唔再係模型能力，而係點樣將呢啲能力包裝成可重複、可驗證嘅工作流程。你可以用十幾蚊美金嘅 API cost 就做到以前要成 team postdoc 先做到嘅 literature search 同 conjecture testing。呢個唔係科幻，係今時今日已經 deploy 到 production 嘅工具。

MVP 思維做數學：由 conjecture 到 automation

Indie hacker 最擅長嘅係「最小可行產品」思維——我哋唔會一嚟就做一個通用 AI mathematician，而係搵一個 specific 嘅數學問題 domain，建立端到端嘅 automation。舉例：你想探索數論入面某類質數分佈嘅 pattern。傳統做法係讀幾十篇 paper、用手寫 heuristic 做實驗、再慢慢歸納 conjecture。今日你嘅 MVP 可以係：一個 Python script 用 reasoning API 解析 arxiv 上相關 paper 嘅 abstract，另一個 agent 生成 synthetic data 做統計測試，再一個 agent 用形式邏輯幫你 check 初步推論嘅 consistency。Scout AI 嘅 Erdős agent 正正示範咗呢種 modular 設計——將數學家嘅 collaboration network 模仿成 agent communication graph，每個 agent 專注一個 subproblem，然後用類似 Erdős 嘅 random meeting 機制交換發現。MVP 做好之後，你可以逐個 module 迭代，而唔使等一個完美嘅全能系統。

工具鏈 modular design：Scout AI 與 Erdős 啟示

Paul Erdős 一生同超過五百位數學家合作，佢嘅方法論係「每個人做自己最擅長嘅部分，然後頻繁溝通交換結果」。Scout AI 嘅 modular agent 架構直接 borrow 呢個哲學：你唔需要一個模型識晒所有數學分支，而係用一個 orchestrator agent 將問題 decompose，然後 dispatch 俾 specialist agent。呢種做法對獨立開發者尤其友好——你可以逐個 agent 獨立開發、測試、甚至用唔同 provider 嘅模型。推理 API 嘅進步令呢個架構不再係理論：o3 嘅 chain-of-thought 長度已經足夠處理複雜嘅數學推論，而佢嘅 inconsistency detection 能力令 multi-agent 之間嘅結果驗證變得可靠。呢個 modular 思維，正正係 indie hacker 可以贏過 monolithic 大公司科研團隊嘅關鍵——速度更快、成本更低、iteration cycle 更短。

你嘅第一步

唔好等「準備好晒先開始」。揀一個你感興趣嘅數學問題——唔需要係 open problem，一個你一直想探討嘅 small conjecture 就夠。用 reasoning API 租一個 base agent，寫五十行 code 做 automated literature search，再用另一個 agent 做實驗性推論。成本唔會超過一餐 fine dining，但你會獲得一個完全屬於你嘅 AI 研究助手。數學研究嘅民主化唔係口號，係今日已經可以 run 嘅 code。你只需要開始。