上周和矽谷回來的朋友交流,他提到"現在美國的AI圈都在傳,中國出了個能把輝達(Nvidia)逼瘋的瘋子團隊"。這個瘋子,就是成立僅3年的DeepSeek。該公司在演算法層面實現極大創新,模型效率顯著提升。例如,其模型效率提升10倍後,單GPU服務用戶數從10人躍至100人,同樣的成本可以讓更多人使用。
十分之一成本的算力核爆
淩晨三點,我盯著DeepSeek-R1的開源代碼發呆。這個讓單日下載量破百萬的怪物,竟把AI推理成本壓縮到傳統方案的十分之一,就像突然有人宣佈能用自行車發動機造出超跑,整個矽谷的估值體系都在崩塌。
DeepSeek讓大模型從奢侈品變日用品正在應驗。免費開源的DeepSeek-R1推理模型能力和每月付20美金才能用GPT O1模型相當。從費用角度來看,DeepSeek API在輸入和輸出費用上都遠低於GPT-4。
具體來說,每百萬輸出tokens,DeepSeek的費用為8元人民幣,而GPT-4的費用為10美元(約70元人民幣)。因此,DeepSeek在成本效益方面具有顯著優勢,尤其適合預算敏感的用戶和開發者。這種暴力降維,讓全球科技巨頭們集體患上焦慮症。
演算法革命背後的算力暗戰
當所有人以為DeepSeek的演算法進步會降低算力需求時,但實際上卻讓全球算力饑渴症愈發嚴重。其開源的MoE架構,就像給AI世界安裝了永動機——模型越聰明,開發者越想嘗試更複雜的應用,算力黑洞反而越滾越大。
看著這些新聞及數據,我突然理解為什麼美國各家科技巨頭都如此重視Deepseek。當中國AI企業用20%的算力卡就能跑出頂尖模型,全球算力供應鏈正在經歷價值重估。就像智能手機時代,沒人料到聯發科會改寫高通神話。
對不同行業投資機會的影響
- 半導體行業:一方面,邊緣AI設備(如AI眼鏡、AI耳機、AI玩具)發展加速,中國國產晶片在推理任務上的競爭力提升,相關邊緣AI設備製造商和中國國產晶片企業及ASIC晶片企業可能獲得更多投資。但另一方面,整體供應仍受美國技術出口限制影響,投資決策時需綜合考慮這些不確定因素。
- 軟體行業:DeepSeek的開源特性使得幾乎所有軟體公司都能利用其技術,將AI功能嵌入產品中。尤其是Saas(軟體即服務)企業可能最先受益,這增加了軟體行業相關企業的投資吸引力,投資者可能會加大對有能力利用該技術提升產品競爭力的軟體公司的關注和投資。
- 雲計算與大數據企業:雲計算和大數據基礎設施是AI技術的支撐,相關企業將受益於AI技術的廣泛應用,如阿里巴巴、騰訊、華為雲等。隨著DeepSeek推動AI應用的發展,這些雲計算和大數據企業有望獲得更多投資,以進一步提升其基礎設施服務能力。
- AI應用程式公司:隨著DeepSeek演算法的改進,AI軟體的應用規模將明顯增長。B2B(企業對企業)和B2C(企業對消費者)的AI應用程式公司具有投資潛力。
例如,在金融行業可用於智能投顧、風險評估等;在醫療領域可用於輔助診斷、藥物研發等;在教育行業能夠開發個性化學習平台和智能輔導系統;在製造業可用於工業自動化和智能生產等。這些領域的AI應用程式公司可能吸引投資者的關注和資金投入。
- 算力產業鏈相關企業:DeepSeek推動行業從“訓練驅動”轉向“推理驅動”,長期會減少了對雲端算力的依賴,促進了邊緣計算的發展。因此,邊緣計算晶片、分佈式推理設備等相關產業值得關注,投資機會可能增加。
Deepseek對投資邏輯的重塑
過去兩年,全球AI投資的核心是硬體,輝達、超微(AMD)、台積電、阿斯麥(ASML)這些半導體巨頭一直是資本追捧的對象,市場邏輯以美國為先。
然而,DeepSeek的R1模型以不到600萬美元的成本實現了媲美GPT - O1的性能,直接衝擊了此前硬體為王的投資時代。未來的投資方向應該要由AI算力相關的轉變成多關注AI端側、ASIC晶片及AI應用的軟體和服務類公司。