AI 科研自動化已到轉折點:從 IMO 金牌到破解 Erdős 百年難題
反常識開場:當「解難能力」不再是人類專利
如果你仲以為 AI 只係識得生成懶人包、畫圖呃 like、或者幫你寫啲廢話電郵,咁你已經嚴重 outdate 咗。過去三個月,AI 科研自動化發生咗三件標誌性事件:AI 系統首次在國際數學奧林匹克(IMO)奪得金牌水平、Anthropic 的 Mythos 被 Mozilla 用嚟喺開源專案中自動尋找同修復 bug,以及最震撼嘅——AI 破解咗數學家 Paul Erdős 遺留超過一百年嘅難題。呢啲唔係科幻小說情節,而係 2026 年上半年已經發生嘅事實。
對我哋香港創業者同知識工作者而言,呢個拐點嘅意義遠超技術層面。佢直接挑戰一個根本問題:如果 AI 已經可以做到過去只有最頂尖人類才能做到嘅科研工作,咁我哋花咗幾十年建立嘅教育體系、科研評核制度、以至成個人才市場嘅價值邏輯,仲有幾多站得住腳?
IMO 金牌背後的深層信號:推理能力已跨越實用門檻
先講 IMO。國際數學奧林匹克係中學生數學競賽嘅最高殿堂,每年來自全球過百國家嘅天才少年喺六道極難嘅幾何、數論、組合數學題目上一決高下。一直以嚟學術界有個共識:IMO 題目需要真正嘅數學直覺同創造性思維,唔係簡單嘅模式匹配可以應付。但 2026 年嘅最新 AI 系統唔單止解晒全部題目,而且成績達到金牌線——即係超越咗絕大部分人肉參賽者。
呢個 breakthrough 嘅核心意義唔係「AI 好叻數學」,而係佢展示咗一個關鍵能力:長鏈條邏輯推理。IMO 題目通常需要多步推理,每步都要喺大量可能性中選擇正確方向,一旦中間出錯就全盤皆輸。傳統嘅機器學習模型擅長 pattern recognition,但喺呢種需要「如果 A 則 B,如果 B 則 C,然後考慮 D 嘅 edge case」嘅場景一直表現麻麻。今次嘅突破證明,現代 AI 嘅推理能力已經跨越咗實用門檻——佢唔再只係一部巨大嘅 autocorrect,而係一個真正能夠進行結構化推理解決問題嘅系統。
呢個能力嘅應用場景遠遠超出數學本身。軟體工程、科學研究、金融模型、供應鏈優化——任何需要多步驟決策同邏輯推理嘅領域,都會直接受惠。對香港創業者嚟講,呢個係一個重要提示:如果你嘅商業模式仲停留喺「靠人手做分析型 decision making」,你嘅競爭優勢嘅保鮮期可能比你諗嘅短得多。
Mythos 到 Mozilla:AI 從 QA 工具進化為開源協作者
Anthropic 嘅 Mythos 系統被 Mozilla 用嚟修復 Firefox 嘅 bug,呢件事表面上睇只係「AI 幫手做 quality assurance」。但深入啲睇,佢揭示嘅係一個更深層嘅 shift:AI 正從「被動工具」進化為「主動協作者」。
傳統上,開源專案嘅 bug 修復流程係:開發者寫 code → QA 或用戶回報 bug → maintainer 定位問題 → 開發者寫 fix → code review → merge。呢個 cycle 最花時間嘅往往唔係寫 fix 本身,而係「定位問題」——你要喺幾十萬行 code 入面搵出邊個 function、邊行 logic 出錯。Mythos 做到嘅係跳過呢個最痛苦嘅步驟:佢直接閱讀成個 codebase,理解架構,然後唔單止指出 bug 嘅位置,仲提供修復方案。Mozilla 嘅實際案例中,Mythos 成功修復咗多個一直困擾 maintainer 嘅歷史遺留 bug。
呢個案例對香港開發者社群有直接啟示。我哋好多本地 startup 同企業仲用緊半人手嘅 QA 流程,PM 畫完 spec,engineer 寫 code,QA team 人手測試,bug tracker 排滿晒 tickets。Mythos 呢類系統代表嘅唔係取代 QA engineer,而係成個 feedback loop 可以壓縮到近乎即時。你唔再需要等幾日甚至幾星期先發現問題,AI 喺你 commit 嘅嗰一刻已經幫你掃咗一次。
更重要嘅係,呢個趨勢意味住「寫 code」呢個技能嘅價值正在被重新定義。當 AI 可以自動修復 bug、自動生成 test case、甚至自動重構 code 嘅時候,開發者嘅核心價值會轉移到更高層次:系統架構設計、產品理解、同業務邏輯嘅定義。香港嘅編程 bootcamp 同大學 CS 課程如果仲係教緊學生點樣由零寫 sorting algorithm,而唔係教佢哋點樣同 AI 協作、點樣做 high-level 設計決策,咁畢業生好快就會發現自己嘅技能被市場貶值。
Erdős 百年猜想破解:科研自動化的「斯普特尼克時刻」
最後呢個 case 最值得深思。Erdős 係廿世紀最偉大嘅數學家之一,佢遺留嘅一堆未解猜想中有個困擾咗數學界超過一百年。AI 唔單止證明咗呢個猜想,仲喺證明過程中發現咗人類數學家從未考慮過嘅新方法同新結構——即係話,佢唔係用現有嘅數學工具「撞答案」,而係創造咗全新嘅數學 insight。
呢個意義極其深遠。一直以嚟,反對「AI 可以做科研」嘅主流論證係:AI 可以 brute force 搜尋答案,但唔會有真正嘅 insight 或者創造力。Erdős 猜想嘅破解直接推翻咗呢個論點。AI 展示咗一種人類從未見過嘅思考方式——佢唔受制於現有數學框架嘅 bias,能夠喺人類從未探索過嘅方向找到突破口。
呢個「斯普特尼克時刻」對香港科研體系嘅衝擊尤其巨大。香港嘅大學科研評核機制,本質上係一套工業時代嘅系統:論文數量、引用次數、影響因子、研究資助金額。呢啲指標嘅前提假設係「科研產出由人類科學家驅動」,但當 AI 可以每分鐘閱讀上千篇論文、自動設計實驗、生成 hypothesis、甚至創造新嘅數學工具嘅時候,呢套評核機制嘅核心邏輯就開始崩潰。
我見過香港唔少 professor 嘅研究模式係:帶住五六個 PhD student,每人負責一個細方向,逐個 experiment 做,逐篇 paper 寫。呢個模式嘅 throughput 如果同一個配備咗 AI 研究助理嘅小型團隊比較,效率差距隨時係一個數量級以上。唔係 PhD student 唔叻,而係人類嘅閱讀速度、分析速度、同實驗執行速度已經追唔上 AI。
對於香港嚟講,呢個挑戰同時係一個機遇。香港嘅優勢一向係「細而靈活」——我哋冇內地咁大嘅人才 pool,但勝在制度靈活、國際化、同市場敏銳。如果香港嘅大學同 startup 能夠率先擁抱 AI-native 嘅科研模式,將 AI 視為研究團隊嘅正式成員而唔係工具,咁我哋完全有可能喺呢一波轉型中彎道超車。反之,如果繼續抱住傳統嘅科研評核制度同人才培訓模式唔放,香港好快會發現自己嘅「國際競爭力」只係一個越來越空洞嘅口號。
對香港創業者同知識工作者的五個行動點
講咗咁多宏觀分析,最後落返 actionable 嘅建議。以下係我認為每一位香港創業者、開發者、同知識工作者應該立即開始做嘅五件事:
一、重新審視你團隊嘅 skill mix。 你團隊入面仲有冇人嘅 full time job 係做緊 AI 已經可以做得好更好嘅嘢?重複性數據分析、基本 code review、文獻回顧、test case 撰寫——呢啲工作應該盡快過渡俾 AI,將你嘅人類 talent 釋放去做更高層次嘅嘢。
二、開始用 AI 做 research 同 prototyping,而唔係淨係用嚟寫 email。 好多香港 entrepreneur 對 AI 嘅想像仲停留喺 ChatGPT 幫手寫 marketing copy。你要開始用 AI 做 competitive analysis、做技術可行性研究、做用戶行為分析。呢啲先係 AI 真正產生槓桿效應嘅地方。
三、如果你喺教育相關行業,重新設計課程內容。 教 coding 嘅話,focus 應該從 syntax 轉移到 system thinking;教數學嘅話,focus 應該從計算轉移到 problem formulation。未來最有價值嘅技能唔係「點樣做」,而係「點樣問」。
四、關注 AI safety 同 alignment。 當 AI 開始參與科研同工程決策,佢嘅錯誤可能唔再只係「推薦咗個錯嘅 product」,而係「推薦咗個錯嘅 research direction」甚至「生成咗有安全漏洞嘅 infrastructure code」。點樣確保 AI 嘅輸出係可靠、可解釋、可控嘅,將會係未來幾年最值錢嘅技術能力之一。
五、心態上做好準備:你最大嘅競爭對手唔再係另一個人類。 呢句說話聽落好 cliché,但係當 IMO 金牌同百年數學難題都已經被 AI 攻克嘅時候,呢個 reality 已經唔再係未來式,而係現在進行式。你嘅競爭優勢將取決於你同 AI 協作嘅效率,而唔係你同其他人類鬥多 hours 或者鬥聰明。
AI 科研自動化嘅轉折點已經到咗。香港可以選擇做旁觀者,記錄呢段歷史;亦可以選擇做參與者,改寫自己嘅未來。