用 AI 做數學研究?你都可以
數學研究向來被視為天才嘅專利——你要有 Fields Medal 級數嘅直覺,先可以喺抽象世界入面發現新嘢。但過去兩年發生咗一件反常識嘅事:OpenAI o3 喺數學 benchmark 上嘅表現唔單止超越咗大部分博士生,佢嘅推理過程仲可以俾任何人一一審視、重播、改進。Reasoning API 嘅開放意味住,你唔需要係 Grothendieck,都可以開始同機器一齊做數學。問題係:點樣先將呢個能力由 demo 變成真正嘅研究工具?
從 Aletheia 到 OpenAI:推理 API 嘅 democratisation
2022 年 Aletheia 仲係一個學術 prototype——用 GPT-3 嘗試自動化數學證明嘅部分步驟。當年嘅限制好明顯:模型唔識 backtracking,一錯就錯到底,而且 token limit 細到連一個完整嘅 lemma 都 handle 唔到。三年後嘅今日,OpenAI o3 嘅 reasoning API 已經可以輸出數千個 token 嘅逐步推理,仲識得自我糾正路徑。對 indie hacker 嚟講,呢個落差係一個訊號:基礎建設已經到位,真正嘅 gap 唔再係模型能力,而係點樣將呢啲能力包裝成可重複、可驗證嘅工作流程。你可以用十幾蚊美金嘅 API cost 就做到以前要成 team postdoc 先做到嘅 literature search 同 conjecture testing。呢個唔係科幻,係今時今日已經 deploy 到 production 嘅工具。
MVP 思維做數學:由 conjecture 到 automation
Indie hacker 最擅長嘅係「最小可行產品」思維——我哋唔會一嚟就做一個通用 AI mathematician,而係搵一個 specific 嘅數學問題 domain,建立端到端嘅 automation。舉例:你想探索數論入面某類質數分佈嘅 pattern。傳統做法係讀幾十篇 paper、用手寫 heuristic 做實驗、再慢慢歸納 conjecture。今日你嘅 MVP 可以係:一個 Python script 用 reasoning API 解析 arxiv 上相關 paper 嘅 abstract,另一個 agent 生成 synthetic data 做統計測試,再一個 agent 用形式邏輯幫你 check 初步推論嘅 consistency。Scout AI 嘅 Erdős agent 正正示範咗呢種 modular 設計——將數學家嘅 collaboration network 模仿成 agent communication graph,每個 agent 專注一個 subproblem,然後用類似 Erdős 嘅 random meeting 機制交換發現。MVP 做好之後,你可以逐個 module 迭代,而唔使等一個完美嘅全能系統。
工具鏈 modular design:Scout AI 與 Erdős 啟示
Paul Erdős 一生同超過五百位數學家合作,佢嘅方法論係「每個人做自己最擅長嘅部分,然後頻繁溝通交換結果」。Scout AI 嘅 modular agent 架構直接 borrow 呢個哲學:你唔需要一個模型識晒所有數學分支,而係用一個 orchestrator agent 將問題 decompose,然後 dispatch 俾 specialist agent。呢種做法對獨立開發者尤其友好——你可以逐個 agent 獨立開發、測試、甚至用唔同 provider 嘅模型。推理 API 嘅進步令呢個架構不再係理論:o3 嘅 chain-of-thought 長度已經足夠處理複雜嘅數學推論,而佢嘅 inconsistency detection 能力令 multi-agent 之間嘅結果驗證變得可靠。呢個 modular 思維,正正係 indie hacker 可以贏過 monolithic 大公司科研團隊嘅關鍵——速度更快、成本更低、iteration cycle 更短。
你嘅第一步
唔好等「準備好晒先開始」。揀一個你感興趣嘅數學問題——唔需要係 open problem,一個你一直想探討嘅 small conjecture 就夠。用 reasoning API 租一個 base agent,寫五十行 code 做 automated literature search,再用另一個 agent 做實驗性推論。成本唔會超過一餐 fine dining,但你會獲得一個完全屬於你嘅 AI 研究助手。數學研究嘅民主化唔係口號,係今日已經可以 run 嘅 code。你只需要開始。