在推出推理模型 R1 後,中國 AI 初創公司 DeepSeek 迅速引起了行業高管和立法者的廣泛關注,隨之而來的是全球科技股的劇烈波動。DeepSeek 的 R1 模型因其卓越的質量和成本效益而受到讚譽,該公司聲稱其模型在性能上能與 OpenAI 的 o1 模型相媲美,甚至在某些方面更勝一籌,並使用了更少的圖形處理單元(GPU)和更低的成本。
DeepSeek 的 AI 聊天應用程式免費提供 R1 的使用權,並一舉登上多個國家的應用商店排行榜。然而,這一成功也伴隨著質疑和警惕的聲音。OpenAI 指控 DeepSeek 侵犯其知識產權,並表示擁有證據證明該公司在訓練過程中使用了其 GPT 模型。
隨著對 DeepSeek 熱潮的降溫,關於其 AI 模型的開發過程及其影響的疑慮也逐漸浮現。以下是有關 DeepSeek 崛起的一些常見迷思及其真實情況。
迷思 1:DeepSeek 的 AI 模型預示著通用人工智慧(AGI)即將實現
真相: 雖然 DeepSeek 的 AI 模型在運行效率和成本方面有顯著改進,但這並不意味著 AGI 的出現指日可待。AGI 是指能在多種任務上超越或等同於人類智力的 AI 系統,迄今為止尚無人能聲稱已經實現這一目標。OpenAI 和其他競爭者仍在積極朝著 AGI 的方向努力。
DeepSeek 自 2023 年從中國對沖基金 High-Flyer 的 AI 研究部門轉型為 AI 公司,旨在開發大型語言模型以邁向 AGI。OpenAI 的 CEO 山姆·阿爾特曼對此表示讚賞,稱 R1 模型“令人印象深刻”。儘管 R1 標誌著 AI 競賽中的一個重要時刻,但專家指出,實現 AGI 仍需多次重大突破。
迷思 2:DeepSeek 的成功顯示出口管制沒有效果
真相: 美國對高端 GPU 的出口限制仍然可能對中國的 AI 發展產生深遠影響。DeepSeek 的成功被視為美國出口管制的意外結果,這些限制阻礙了中國科技公司獲得先進 GPU 的能力。DeepSeek 的研究人員因而被迫尋找提高 AI 模型效率的方法。
雖然有人認為出口管制是失敗的,但 DeepSeek 在限制實施之前已經儲備了大量舊款 Nvidia A100 GPU。專家指出,這些出口管制仍會限制中國在 AI 實驗和代理開發方面的進展。
迷思 3:DeepSeek 是 Nvidia 的重大威脅
真相: DeepSeek 的 R1 模型對 Nvidia 的影響可能沒有預想中那麼嚴重。DeepSeek 的崛起導致 Nvidia 股價在 1 月 27 日暴跌 17%,市值損失近 6000 億美元,儘管股價隨後略有回升,但仍然面臨壓力。
儘管 R1 模型可能降低了對某些特殊用途 AI 硬體的需求,但這並不意味著 Nvidia 將面臨毀滅性的打擊。微軟的 CEO 薩提亞·納德拉提到,DeepSeek 的發展可能反而提高了對高效能 GPU 的需求。
迷思 4:DeepSeek R1 是完全開源的
真相: DeepSeek R1 雖然可以免費下載並進行修改,但它未必符合真正的開源標準。DeepSeek 的成功常被視為中國在 AI 競爭中取得的進展,但其 R1 模型的開源性受到質疑。
R1 的模型架構和權重已根據 MIT 許可證公開,這使得其可以自由使用,但訓練過程中的數據和代碼並未公開。真正的開源模型應該提供詳細的訓練數據和代碼,而這些信息仍未對外透露。
迷思 5:DeepSeek 的 AI 模型存在額外的隱私風險
真相: DeepSeek 的 AI 在隱私方面的風險與其他大型語言模型並無本質區別。DeepSeek 的快速崛起引發了用戶和監管機構對數據隱私的關注,這些擔憂部分源於該公司的中國背景。
DeepSeek 在其隱私政策中清楚說明,會在中國的安全伺服器中存儲所收集的數據。然而,業內人士指出,DeepSeek 的 R1 模型可以在本地運行,這樣用戶的數據不會被公司存取。某些版本的 R1 模型在美國和歐盟的數據中心托管,並不受中國的審查限制。