DeepSeek備受全球關注。自中國人工智能公司深度求索(DeepSeek)本月20日發布了最新大語言模型DeepSeek-R1,市場相信發展AI毋須再投入大量成本。美國上市的晶片龍頭股Nvidia(英偉達)收市重挫16%。
●為何DeepSeek來勢洶洶?
根據多項第三方評測,DeepSeek-R1以極低成本實現與OpenAI去年底才發布的最新模型「o1」同等性能,對於一款中國大模型來說,能夠在美國力壓ChatGPT,業界評論是歷史性一刻。
●DeepSeek模型成本?
DeepSeek去年底釋出開源大型語言模型DeepSeek V3,到本月20公布DeepSeek-R1模型正式版。DeepSeek發布DeepSeek-V3時宣稱,依靠2048顆英偉達晶片H800完成6710億參數模型的訓練,成本約560萬美元(約4368萬港元),遠低於其他模型的訓練成本。據《華爾街日報》,AI開發商Anthropic首席執行官Dario Amodei去年表示,構建一個模型的成本在1億至10億美元(約7.8億至78億港元)之間。
內地紅星新聞報道,DeepSeek-R1的訓練只調用了2000餘塊顯卡,為期53天,總訓練成本為558萬美元(約4352萬港元),不到其他世界頂級大模型一次訓練成本的十分之一。
【DeepSeek低成本衝擊 AI股蒸發9萬億 登歐美App Store榜首 稱遭網攻停境外註冊】
●DeepSeek創始人梁文鋒
DeepSeek創始人梁文鋒1985年生於廣東吳川,曾以當地高考狀元身分考入浙江大學,對人工智能興趣濃厚,攻讀碩士期間將技術應用在量化交易上,畢業後創立的「幻方量化」成為內地量化私募基金龍頭。
2015年中證500股指期貨上市,梁文鋒緊貼潮流自立門戶,立志將幻方量化打造為世界頂級量化對冲基金。2018年,幻方量化首次獲內地私募證券領域最高獎項「私募金牛獎」,並確立以AI為發展方向。2023年DeepSeek正式成立,因訓練成本極低而被稱為「AI界的拼多多」。
●梁文鋒:OpenAI閉源也無法阻止被追趕
被問到DeepSeek為何只做研究,不似大部分中國企業兼顧應用,梁文鋒表示,目前階段是技術創新的爆發期,並非應用的爆發期,覺得現在最重要是參與全球創新的浪潮。DeepSeek有將自家技術開源,與大眾分享。梁文鋒稱:「在顛覆性的技術面前,閉源形成的護城河是短暫的。即使OpenAI閉源,也無法阻止被別人追趕。」
●DeepSeek團隊「90後」佔比逾75%
內地紅星新聞報道,DeepSeek團隊成員約超過一半為「95後」,「90後」佔比超過75%。梁文鋒曾表示,公司員工「都是一些Top高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人」。DeepSeek內部的團隊氛圍也較為寬鬆,梁文鋒曾稱團隊中每一個成員可以調用的資源都「沒有上限」,並且管理制度上非常推崇扁平化(即減少管理層級)。
【Deepseek 95後關鍵開發者「天才少女」羅福莉爆紅 羅福莉是誰?】
資料來源:明報、內地紅星新聞
相關字詞﹕人工智能 人工智能DeepSeek 編輯推介 熱門HOTPICK