AI 晶片嘅 open-source 變數:Tenstorrent 生態值唔值得賭?
tags:
- ai-chips
- tenstorrent
- open-source-hardware
- risc-v
- semiconductor
- hong-kong-tech cover_image: ”../../assets/heroes/ai-open-source-tenstorrent.jpg” draft: false lang: zh-Hant
香港做開發嘅都好清楚:NVIDIA CUDA 呢個 moat 唔單止係技術嘅,更加係生態嘅。過去十年,任何想挑戰 NVIDIA 嘅 AI 晶片公司——無論係 AMD、Intel,定係一眾 startup——都係死在軟件生態呢關。唔係硬件唔夠快,而係 developer 唔會為咗你嘅硬件 rewrite 成個 stack。
但最近有兩件事令我重新諗呢個問題:第一,Tenstorrent 嘅 open-source 軟件棧 tt-metal 開始吸引到真正嘅 community traction;第二,ChatGPT 嘅 traffic 首次跌到第二位,被某個 open-weight 嘅 competitor 爬頭。呢兩件事表面無關,但底層邏輯係同一條:AI 行業正喺度從「黑盒崇拜」轉向「開放可控」。
唔係 CUDA killer,而係 CUDA alternative
Tenstorrent 嘅策略同之前所有 challenger 最唔同嘅地方,係佢哋唔整「CUDA compatible」嘅方案。CEO Jim Keller 嘅講法好直接:CUDA 係 2007 年嘅設計哲學,硬要兼容只會俾 NVIDIA 嘅 legacy 綁死。所以 Tenstorrent 揀咗 RISC-V 做 instruction set,成個 software stack——from compiler to runtime——完全 open-source。
呢個決定嘅 strategic insight 在於:NVIDIA 最強嘅地方同時係最脆弱嘅地方。CUDA 嘅閉源性令佢更新慢、debug 難、community contribution 近乎零。而 Tenstorrent 嘅 tt-metal 同 tt-builder 採用 Apache 2.0 授權,developer 可以真正睇到 hardware abstraction layer 點運作,甚至 submit PR 改佢。
對於我哋呢啲 indie dev 同細 team 嚟講,呢個意味住:你唔使再等 NVIDIA 嘅 driver update 去 fix 某個 specific use case 嘅 performance bug。你可以自己落手改。
AI 應用層嘅「去 NVIDIA 化」已經開始
ChatGPT 跌到第二位呢個 signal,我認為唔單止係 chatbot 市場嘅 commodity化,更加預示緊一個更深層嘅趨勢:AI 應用嘅盈利模型正喺度同硬件成本脫鈎。
之前嘅邏輯係:OpenAI 用 NVIDIA GPU 行閉源 model → 你俾 API fee → OpenAI 俾 NVIDIA 買卡。成條價值鏈由 NVIDIA 食晒最大份。但而家 open-weight model 嘅 quality 已經追到 close-source,community 開始問一個好實際嘅問題:點解我要俾 NVIDIA 個 80% margin 去行 inference?
呢個就係 Tenstorrent 嘅機會窗口。當 model 本身係 open嘅,你想行喺乜嘢硬件上就係你自己嘅選擇。Open-source model + open-source hardware stack = 真正嘅 vendor independence。對於香港嘅 startup 嚟講,呢個唔係 ideological choice,而係純粹嘅 cost arithmetic。
硬件生態嘅「雞先定蛋先」仲未解決
講完 bullish 嘅部分,都要講 reality check。
Tenstorrent 目前最大嘅風險唔係技術——佢哋嘅 Grayskull 同 Wormhole 嘅 raw performance 其實好 impressive——而係 ecosystem adoption 嘅飛輪未轉起。硬件係 network effect business:越多 developer 用 → 越多 library → 越多 application → 越多 hardware sale。Tenstorrent 嘅 developer community 雖然增長緊,但基數太細。TT-Metalium 嘅 GitHub stars 大約 3k,同 CUDA 嘅百萬級 developer base 相距太遠。
另一個 risk 係 manufacturing 嘅 scalability。Tenstorrent 用 GlobalFoundries 嘅 12nm process,呢個 node 喺 AI workload 上唔係最理想。佢哋嘅下一代 Blackhole 會用 5nm,但 wafer allocation 同 NVIDIA 比完全唔同量級。
對於香港 developer 嚟講,現階段最實際嘅策略係:
-
唔好 all-in,但要開始 experiment。Tenstorrent 嘅 dev kit(Wormhole n300)賣緊大約 US$600,買一塊返嚟行你嘅 inference workload,benchmark 下 performance-per-dollar。數據自己嘅先係真。
-
留意住 PyTorch 同 HuggingFace 嘅 Tenstorrent backend 成熟度。呢兩個 platform 嘅 native support 係 ecosystem 嘅關鍵指標。一旦主流 model 可以 one-click deploy 上 Tenstorrent,就係真正嘅 tipping point。
-
準備好 migration path。如果你而家 build 緊 AI product,API 層 abstraction 做好啲,唔好俾自己 lock 死喺任何單一 hardware vendor。十年後 NVIDIA 可能仲係 leader,但 margin 肯定冇咁好——到時邊個俾到最佳性價比,你就要有能力跳過去。
AI 硬件生態嘅開放化唔係一定會贏,但係一定會發生。 Tenstorrent 係目前最有條件食呢個 trend 嘅公司,但距離 mainstream adoption 仲有一段路。對香港嘅開發者嚟講,而家就開始了解同試玩呢個 stack,成本極低,但 strategic optionality 好高。
呢個就係 indie developer 嘅優勢:你唔需要等 ecosystem 成熟先行動。你可以喺 ecosystem 仲喺早期嘅時候就 build 你嘅 expertise,等到主流先到,你已經領先其他人兩三年。