AI 晶片嘅 open-source 變數：Tenstorrent 生態值唔值得賭？

tags:

ai-chips
tenstorrent
open-source-hardware
risc-v
semiconductor
hong-kong-tech cover_image: ”../../assets/heroes/ai-open-source-tenstorrent.jpg” draft: false lang: zh-Hant

香港做開發嘅都好清楚：NVIDIA CUDA 呢個 moat 唔單止係技術嘅，更加係生態嘅。過去十年，任何想挑戰 NVIDIA 嘅 AI 晶片公司——無論係 AMD、Intel，定係一眾 startup——都係死在軟件生態呢關。唔係硬件唔夠快，而係 developer 唔會為咗你嘅硬件 rewrite 成個 stack。

但最近有兩件事令我重新諗呢個問題：第一，Tenstorrent 嘅 open-source 軟件棧 tt-metal 開始吸引到真正嘅 community traction；第二，ChatGPT 嘅 traffic 首次跌到第二位，被某個 open-weight 嘅 competitor 爬頭。呢兩件事表面無關，但底層邏輯係同一條：AI 行業正喺度從「黑盒崇拜」轉向「開放可控」。

唔係 CUDA killer，而係 CUDA alternative

Tenstorrent 嘅策略同之前所有 challenger 最唔同嘅地方，係佢哋唔整「CUDA compatible」嘅方案。CEO Jim Keller 嘅講法好直接：CUDA 係 2007 年嘅設計哲學，硬要兼容只會俾 NVIDIA 嘅 legacy 綁死。所以 Tenstorrent 揀咗 RISC-V 做 instruction set，成個 software stack——from compiler to runtime——完全 open-source。

呢個決定嘅 strategic insight 在於：NVIDIA 最強嘅地方同時係最脆弱嘅地方。CUDA 嘅閉源性令佢更新慢、debug 難、community contribution 近乎零。而 Tenstorrent 嘅 tt-metal 同 tt-builder 採用 Apache 2.0 授權，developer 可以真正睇到 hardware abstraction layer 點運作，甚至 submit PR 改佢。

對於我哋呢啲 indie dev 同細 team 嚟講，呢個意味住：你唔使再等 NVIDIA 嘅 driver update 去 fix 某個 specific use case 嘅 performance bug。你可以自己落手改。

AI 應用層嘅「去 NVIDIA 化」已經開始

ChatGPT 跌到第二位呢個 signal，我認為唔單止係 chatbot 市場嘅 commodity化，更加預示緊一個更深層嘅趨勢：AI 應用嘅盈利模型正喺度同硬件成本脫鈎。

之前嘅邏輯係：OpenAI 用 NVIDIA GPU 行閉源 model → 你俾 API fee → OpenAI 俾 NVIDIA 買卡。成條價值鏈由 NVIDIA 食晒最大份。但而家 open-weight model 嘅 quality 已經追到 close-source，community 開始問一個好實際嘅問題：點解我要俾 NVIDIA 個 80% margin 去行 inference？

呢個就係 Tenstorrent 嘅機會窗口。當 model 本身係 open嘅，你想行喺乜嘢硬件上就係你自己嘅選擇。Open-source model + open-source hardware stack = 真正嘅 vendor independence。對於香港嘅 startup 嚟講，呢個唔係 ideological choice，而係純粹嘅 cost arithmetic。

硬件生態嘅「雞先定蛋先」仲未解決

講完 bullish 嘅部分，都要講 reality check。

Tenstorrent 目前最大嘅風險唔係技術——佢哋嘅 Grayskull 同 Wormhole 嘅 raw performance 其實好 impressive——而係 ecosystem adoption 嘅飛輪未轉起。硬件係 network effect business：越多 developer 用 → 越多 library → 越多 application → 越多 hardware sale。Tenstorrent 嘅 developer community 雖然增長緊，但基數太細。TT-Metalium 嘅 GitHub stars 大約 3k，同 CUDA 嘅百萬級 developer base 相距太遠。

另一個 risk 係 manufacturing 嘅 scalability。Tenstorrent 用 GlobalFoundries 嘅 12nm process，呢個 node 喺 AI workload 上唔係最理想。佢哋嘅下一代 Blackhole 會用 5nm，但 wafer allocation 同 NVIDIA 比完全唔同量級。

對於香港 developer 嚟講，現階段最實際嘅策略係：

唔好 all-in，但要開始 experiment。Tenstorrent 嘅 dev kit（Wormhole n300）賣緊大約 US$600，買一塊返嚟行你嘅 inference workload，benchmark 下 performance-per-dollar。數據自己嘅先係真。
留意住 PyTorch 同 HuggingFace 嘅 Tenstorrent backend 成熟度。呢兩個 platform 嘅 native support 係 ecosystem 嘅關鍵指標。一旦主流 model 可以 one-click deploy 上 Tenstorrent，就係真正嘅 tipping point。
準備好 migration path。如果你而家 build 緊 AI product，API 層 abstraction 做好啲，唔好俾自己 lock 死喺任何單一 hardware vendor。十年後 NVIDIA 可能仲係 leader，但 margin 肯定冇咁好——到時邊個俾到最佳性價比，你就要有能力跳過去。

AI 硬件生態嘅開放化唔係一定會贏，但係一定會發生。 Tenstorrent 係目前最有條件食呢個 trend 嘅公司，但距離 mainstream adoption 仲有一段路。對香港嘅開發者嚟講，而家就開始了解同試玩呢個 stack，成本極低，但 strategic optionality 好高。

呢個就係 indie developer 嘅優勢：你唔需要等 ecosystem 成熟先行動。你可以喺 ecosystem 仲喺早期嘅時候就 build 你嘅 expertise，等到主流先到，你已經領先其他人兩三年。