AI 科研自動化已到轉折點：從 IMO 金牌到破解 Erdős 百年難題

反常識開場：當「解難能力」不再是人類專利

如果你仲以為 AI 只係識得生成懶人包、畫圖呃 like、或者幫你寫啲廢話電郵，咁你已經嚴重 outdate 咗。過去三個月，AI 科研自動化發生咗三件標誌性事件：AI 系統首次在國際數學奧林匹克（IMO）奪得金牌水平、Anthropic 的 Mythos 被 Mozilla 用嚟喺開源專案中自動尋找同修復 bug，以及最震撼嘅——AI 破解咗數學家 Paul Erdős 遺留超過一百年嘅難題。呢啲唔係科幻小說情節，而係 2026 年上半年已經發生嘅事實。

對我哋香港創業者同知識工作者而言，呢個拐點嘅意義遠超技術層面。佢直接挑戰一個根本問題：如果 AI 已經可以做到過去只有最頂尖人類才能做到嘅科研工作，咁我哋花咗幾十年建立嘅教育體系、科研評核制度、以至成個人才市場嘅價值邏輯，仲有幾多站得住腳？

IMO 金牌背後的深層信號：推理能力已跨越實用門檻

先講 IMO。國際數學奧林匹克係中學生數學競賽嘅最高殿堂，每年來自全球過百國家嘅天才少年喺六道極難嘅幾何、數論、組合數學題目上一決高下。一直以嚟學術界有個共識：IMO 題目需要真正嘅數學直覺同創造性思維，唔係簡單嘅模式匹配可以應付。但 2026 年嘅最新 AI 系統唔單止解晒全部題目，而且成績達到金牌線——即係超越咗絕大部分人肉參賽者。

呢個 breakthrough 嘅核心意義唔係「AI 好叻數學」，而係佢展示咗一個關鍵能力：長鏈條邏輯推理。IMO 題目通常需要多步推理，每步都要喺大量可能性中選擇正確方向，一旦中間出錯就全盤皆輸。傳統嘅機器學習模型擅長 pattern recognition，但喺呢種需要「如果 A 則 B，如果 B 則 C，然後考慮 D 嘅 edge case」嘅場景一直表現麻麻。今次嘅突破證明，現代 AI 嘅推理能力已經跨越咗實用門檻——佢唔再只係一部巨大嘅 autocorrect，而係一個真正能夠進行結構化推理解決問題嘅系統。

呢個能力嘅應用場景遠遠超出數學本身。軟體工程、科學研究、金融模型、供應鏈優化——任何需要多步驟決策同邏輯推理嘅領域，都會直接受惠。對香港創業者嚟講，呢個係一個重要提示：如果你嘅商業模式仲停留喺「靠人手做分析型 decision making」，你嘅競爭優勢嘅保鮮期可能比你諗嘅短得多。

Mythos 到 Mozilla：AI 從 QA 工具進化為開源協作者

Anthropic 嘅 Mythos 系統被 Mozilla 用嚟修復 Firefox 嘅 bug，呢件事表面上睇只係「AI 幫手做 quality assurance」。但深入啲睇，佢揭示嘅係一個更深層嘅 shift：AI 正從「被動工具」進化為「主動協作者」。

傳統上，開源專案嘅 bug 修復流程係：開發者寫 code → QA 或用戶回報 bug → maintainer 定位問題 → 開發者寫 fix → code review → merge。呢個 cycle 最花時間嘅往往唔係寫 fix 本身，而係「定位問題」——你要喺幾十萬行 code 入面搵出邊個 function、邊行 logic 出錯。Mythos 做到嘅係跳過呢個最痛苦嘅步驟：佢直接閱讀成個 codebase，理解架構，然後唔單止指出 bug 嘅位置，仲提供修復方案。Mozilla 嘅實際案例中，Mythos 成功修復咗多個一直困擾 maintainer 嘅歷史遺留 bug。

呢個案例對香港開發者社群有直接啟示。我哋好多本地 startup 同企業仲用緊半人手嘅 QA 流程，PM 畫完 spec，engineer 寫 code，QA team 人手測試，bug tracker 排滿晒 tickets。Mythos 呢類系統代表嘅唔係取代 QA engineer，而係成個 feedback loop 可以壓縮到近乎即時。你唔再需要等幾日甚至幾星期先發現問題，AI 喺你 commit 嘅嗰一刻已經幫你掃咗一次。

更重要嘅係，呢個趨勢意味住「寫 code」呢個技能嘅價值正在被重新定義。當 AI 可以自動修復 bug、自動生成 test case、甚至自動重構 code 嘅時候，開發者嘅核心價值會轉移到更高層次：系統架構設計、產品理解、同業務邏輯嘅定義。香港嘅編程 bootcamp 同大學 CS 課程如果仲係教緊學生點樣由零寫 sorting algorithm，而唔係教佢哋點樣同 AI 協作、點樣做 high-level 設計決策，咁畢業生好快就會發現自己嘅技能被市場貶值。

Erdős 百年猜想破解：科研自動化的「斯普特尼克時刻」

最後呢個 case 最值得深思。Erdős 係廿世紀最偉大嘅數學家之一，佢遺留嘅一堆未解猜想中有個困擾咗數學界超過一百年。AI 唔單止證明咗呢個猜想，仲喺證明過程中發現咗人類數學家從未考慮過嘅新方法同新結構——即係話，佢唔係用現有嘅數學工具「撞答案」，而係創造咗全新嘅數學 insight。

呢個意義極其深遠。一直以嚟，反對「AI 可以做科研」嘅主流論證係：AI 可以 brute force 搜尋答案，但唔會有真正嘅 insight 或者創造力。Erdős 猜想嘅破解直接推翻咗呢個論點。AI 展示咗一種人類從未見過嘅思考方式——佢唔受制於現有數學框架嘅 bias，能夠喺人類從未探索過嘅方向找到突破口。

呢個「斯普特尼克時刻」對香港科研體系嘅衝擊尤其巨大。香港嘅大學科研評核機制，本質上係一套工業時代嘅系統：論文數量、引用次數、影響因子、研究資助金額。呢啲指標嘅前提假設係「科研產出由人類科學家驅動」，但當 AI 可以每分鐘閱讀上千篇論文、自動設計實驗、生成 hypothesis、甚至創造新嘅數學工具嘅時候，呢套評核機制嘅核心邏輯就開始崩潰。

我見過香港唔少 professor 嘅研究模式係：帶住五六個 PhD student，每人負責一個細方向，逐個 experiment 做，逐篇 paper 寫。呢個模式嘅 throughput 如果同一個配備咗 AI 研究助理嘅小型團隊比較，效率差距隨時係一個數量級以上。唔係 PhD student 唔叻，而係人類嘅閱讀速度、分析速度、同實驗執行速度已經追唔上 AI。

對於香港嚟講，呢個挑戰同時係一個機遇。香港嘅優勢一向係「細而靈活」——我哋冇內地咁大嘅人才 pool，但勝在制度靈活、國際化、同市場敏銳。如果香港嘅大學同 startup 能夠率先擁抱 AI-native 嘅科研模式，將 AI 視為研究團隊嘅正式成員而唔係工具，咁我哋完全有可能喺呢一波轉型中彎道超車。反之，如果繼續抱住傳統嘅科研評核制度同人才培訓模式唔放，香港好快會發現自己嘅「國際競爭力」只係一個越來越空洞嘅口號。

對香港創業者同知識工作者的五個行動點

講咗咁多宏觀分析，最後落返 actionable 嘅建議。以下係我認為每一位香港創業者、開發者、同知識工作者應該立即開始做嘅五件事：

一、重新審視你團隊嘅 skill mix。 你團隊入面仲有冇人嘅 full time job 係做緊 AI 已經可以做得好更好嘅嘢？重複性數據分析、基本 code review、文獻回顧、test case 撰寫——呢啲工作應該盡快過渡俾 AI，將你嘅人類 talent 釋放去做更高層次嘅嘢。

二、開始用 AI 做 research 同 prototyping，而唔係淨係用嚟寫 email。 好多香港 entrepreneur 對 AI 嘅想像仲停留喺 ChatGPT 幫手寫 marketing copy。你要開始用 AI 做 competitive analysis、做技術可行性研究、做用戶行為分析。呢啲先係 AI 真正產生槓桿效應嘅地方。

三、如果你喺教育相關行業，重新設計課程內容。 教 coding 嘅話，focus 應該從 syntax 轉移到 system thinking；教數學嘅話，focus 應該從計算轉移到 problem formulation。未來最有價值嘅技能唔係「點樣做」，而係「點樣問」。

四、關注 AI safety 同 alignment。 當 AI 開始參與科研同工程決策，佢嘅錯誤可能唔再只係「推薦咗個錯嘅 product」，而係「推薦咗個錯嘅 research direction」甚至「生成咗有安全漏洞嘅 infrastructure code」。點樣確保 AI 嘅輸出係可靠、可解釋、可控嘅，將會係未來幾年最值錢嘅技術能力之一。

五、心態上做好準備：你最大嘅競爭對手唔再係另一個人類。 呢句說話聽落好 cliché，但係當 IMO 金牌同百年數學難題都已經被 AI 攻克嘅時候，呢個 reality 已經唔再係未來式，而係現在進行式。你嘅競爭優勢將取決於你同 AI 協作嘅效率，而唔係你同其他人類鬥多 hours 或者鬥聰明。

AI 科研自動化嘅轉折點已經到咗。香港可以選擇做旁觀者，記錄呢段歷史；亦可以選擇做參與者，改寫自己嘅未來。