DeepSeek，改變了AI的游戲規(guī)則

快訊 2025年01月27日 14:30 1 admin

專(zhuān)題：DeepSeek為何能震動(dòng)全球AI圈

　　炒股就看金麒麟分析師研報(bào)，權(quán)威，專(zhuān)業(yè)，及時(shí)，全面，助您挖掘潛力主題機(jī)會(huì)！

　　烏鴉智能說(shuō)

　　這兩天，中美AI領(lǐng)域發(fā)生了兩件大事：

　　在美國(guó)發(fā)布AI禁令后，特朗普隨即宣布了一項(xiàng)預(yù)算高達(dá)5000億美元的AGI計(jì)劃——星際之門(mén)，以保證其在AI領(lǐng)域的領(lǐng)先地位。

　　而在大洋彼岸的中國(guó)，一家名為Deepseek的中國(guó)創(chuàng)業(yè)公司，只用了2048塊顯卡，就訓(xùn)練出了一個(gè)能與頂級(jí)模型相媲美的Deepseek-V3模型。

　　Deepseek最引人注目的并不只是它的技術(shù)指標(biāo)，而是其所代表的效率革命，僅依靠少量的硬件配置和幾十名年輕的博士生，就打破了美國(guó)的AI資源限制，完成了跨越式的技術(shù)突破。

　　更重要的是，Deepseek選擇了完全開(kāi)源的路線，將代碼、模型權(quán)重和訓(xùn)練日志全部公開(kāi)。沒(méi)有人會(huì)忘記開(kāi)源的力量，雖然定義智能手機(jī)的是iOS，但安卓才是那個(gè)讓手機(jī)行業(yè)真正繁榮，普惠深入世界各個(gè)角落的人。

　　正如Perplexity CEO Aravind Srinivas所說(shuō)：歷史告訴我們，一旦開(kāi)源追上甚至超越閉源軟件，所有開(kāi)發(fā)者都會(huì)轉(zhuǎn)向開(kāi)源。

　　以此為轉(zhuǎn)折點(diǎn)，DeepSeek不僅改變了AI原有的競(jìng)爭(zhēng)規(guī)則，也讓美國(guó)和中國(guó)的AI路線走向了不同的兩個(gè)方向：巨額投入與追求效率、封閉與開(kāi)源。

　　/ 01 /

　　DeepSeek突破的三層意義

　　之所以DeepSeek能夠引起如此廣泛的討論，不僅在于其技術(shù)指標(biāo)，更在于其對(duì)于AI行業(yè)的重要意義。

　　首先，DeepSeek重新定義了大模型的競(jìng)爭(zhēng)壁壘。過(guò)去兩年里，OpenAI每年要花費(fèi)上百億美金，來(lái)維持自己在AI領(lǐng)域的優(yōu)勢(shì)地位。

　　而現(xiàn)在游戲規(guī)則變了?！癉eepSeek”證明，數(shù)千萬(wàn)美元的投資也能取得顯著成果。

　　不久前，UC伯克利博士生潘家怡和另兩位研究人員，在CountDown游戲中復(fù)現(xiàn)了DeepSeek R1-Zero。實(shí)驗(yàn)中，團(tuán)隊(duì)驗(yàn)證了通過(guò)強(qiáng)化學(xué)習(xí)RL，3B的基礎(chǔ)語(yǔ)言模型也能夠自我驗(yàn)證和搜索。

　　更夸張的是，整個(gè)實(shí)現(xiàn)成本僅不到30美金（約217元）。這意味著，低成本構(gòu)建具備推理能力的模型已成為可能，預(yù)訓(xùn)練模型的巨額投入不再是必需。

　　這背后也引出了一個(gè)深層次的問(wèn)題：

　　當(dāng)一家公司能在缺乏頂級(jí)芯片的情況下，以極低成本建立突破性的 AI 模型時(shí)，我們不得不重新思考：那些投入的數(shù)千億美元資本支出，真的物有所值嗎？

　　這是OpenAI需要回答的問(wèn)題。

　　其次，與OpenAI的閉源路線不同，DeepSeek選擇完全開(kāi)源的路線，將代碼、模型權(quán)重和訓(xùn)練日志全部公開(kāi)。

　　當(dāng)開(kāi)源模型性能媲美市場(chǎng)上最強(qiáng)大的模型，甚至在部分領(lǐng)域有所超越時(shí)，會(huì)吸引越來(lái)越多的開(kāi)發(fā)者參與。

　　原因很簡(jiǎn)單，開(kāi)源軟件成本低廉，成本越低，開(kāi)發(fā)者的吸引力就越大。因?yàn)檫@將大大降低構(gòu)建應(yīng)用程序的成本。

　　這有點(diǎn)像蘋(píng)果和安卓的故事?；仡櫼苿?dòng)互聯(lián)網(wǎng)時(shí)代，定義智能機(jī)0到1的是iOS，但讓手機(jī)行業(yè)真正繁榮普惠深入世界各個(gè)角落的是安卓。

　　在Meta 副總裁兼首席人工智能科學(xué)家楊立昆看來(lái)，DeepSeek的成功，與其說(shuō)是”中國(guó)超越美國(guó)”，倒不如說(shuō)是開(kāi)源模型正在超越專(zhuān)有模型。

　　第三，Deepseek的技術(shù)突破，背后是AI研發(fā)開(kāi)放性的勝利，這與美國(guó)的AI封鎖形成了鮮明對(duì)比。

　　具體來(lái)說(shuō)，在一個(gè)被GPU短缺和芯片禁運(yùn)困擾的環(huán)境中，一家從未被計(jì)入中國(guó)“AI 六小龍”的量化基金公司，用少量的硬件配置和幾十名年輕的博士生，就完成了跨越式的技術(shù)突破。

　　作為一個(gè)后來(lái)者，Deepseek的突破雖然離不開(kāi)自身的努力，但更重要的是，開(kāi)放的技術(shù)交流環(huán)境，包括論文、開(kāi)源代碼和各種正式或非正式的人才交流，為創(chuàng)新突破創(chuàng)造了條件。

　　這揭示了AI行業(yè)的另一個(gè)關(guān)鍵特性：模型研發(fā)具有很強(qiáng)的外部性。特別是在蒸餾與合成數(shù)據(jù)等技術(shù)存在的情況下，后來(lái)者的追趕和學(xué)習(xí)效應(yīng)異常強(qiáng)勁。這種內(nèi)卷加外卷的結(jié)果，也是模型能力變好，而成本快速下降的原因。

　　英偉達(dá)科學(xué)家Jim Fan也提到了開(kāi)放性對(duì)于AI發(fā)展的影響：

　　不管你喜歡與否，AI的未來(lái)不會(huì)是被“安全委員會(huì)”控制的瓶中精靈。每個(gè)互聯(lián)網(wǎng)用戶都將能在他們的“烤面包機(jī)筆記本”上運(yùn)行高階模型。這是歷史潮流，我們應(yīng)該順勢(shì)而為，而不是逆流而上。

　　當(dāng)美國(guó)不斷強(qiáng)化AI技術(shù)封鎖的當(dāng)下，Deepseek的突破又何嘗不是對(duì)于美國(guó)AI制裁的一種“反噬”。

　　/ 02?/

　　找到中國(guó)大模型的商業(yè)化答案

　　之前，李開(kāi)復(fù)一直在表達(dá)一個(gè)觀點(diǎn)：

　　中國(guó)做AI的優(yōu)勢(shì)從來(lái)不是在不設(shè)預(yù)算上限的情況下去做突破性研究，而是在好、快、便宜和可靠性之間找出最優(yōu)解。

　　在相當(dāng)長(zhǎng)時(shí)間里，國(guó)內(nèi)大模型一直處于很尷尬的處境，訓(xùn)練階段不僅被技術(shù)封鎖，還容易被海外開(kāi)源降維打擊。

　　如今，Deepseek的突破代表了一種新的可能性——即通過(guò)算力效率的提升，實(shí)現(xiàn)更繁榮的LLM應(yīng)用生態(tài)。

　　長(zhǎng)期來(lái)看，AI應(yīng)用生態(tài)能否跑通，取決于每個(gè)國(guó)家的成本結(jié)構(gòu)、商業(yè)模式、經(jīng)濟(jì)模型、產(chǎn)品供給能力，大家各有不同，是個(gè)復(fù)雜的商業(yè)問(wèn)題。

　　固然，中國(guó)買(mǎi)不到最新的芯片，單位Flops的推理成本永遠(yuǎn)比海外高，但這也倒逼中國(guó)infra出現(xiàn)了各種“工程式創(chuàng)新”，去探索更高效的算力優(yōu)化方式。

　　至少?gòu)哪壳翱?，?guó)內(nèi)推理優(yōu)化進(jìn)展比大家想象要快。一旦算力優(yōu)化這事跑通，國(guó)內(nèi)大模型在商業(yè)層面建立良性循環(huán)也不是沒(méi)有可能。

　　也就是說(shuō)，中美未來(lái)AI將是兩個(gè)完全不同的故事：美國(guó)押注模型能力提升，中國(guó)追求模型效率的極限。

　　一旦算力優(yōu)化這事跑通，國(guó)內(nèi)大模型在商業(yè)層面建立良性循環(huán)也不是沒(méi)有可能。

　　也就是說(shuō)，中美未來(lái)AI將是兩個(gè)完全不同的故事：美國(guó)押注模型能力提升，中國(guó)追求模型效率的極限。

　　這就很像當(dāng)年互聯(lián)網(wǎng)所發(fā)生的故事。過(guò)去十年，中國(guó)和美國(guó)在互聯(lián)網(wǎng)領(lǐng)域講了兩個(gè)完全不同的故事：硅谷加倍投入企業(yè)軟件，而中國(guó)則將賭注押在消費(fèi)者應(yīng)用上。

　　自谷歌和Meta后，美國(guó)科技業(yè)幾乎放棄了在消費(fèi)互聯(lián)網(wǎng)上再造流量入口的嘗試，轉(zhuǎn)而選擇全面擁抱SaaS。軟件也完美接力上一個(gè)十年中的消費(fèi)移動(dòng)應(yīng)用，成為新十年的主流投資趨勢(shì)，也跑出了很多優(yōu)秀公司。

　　而中國(guó)在消費(fèi)互聯(lián)網(wǎng)展現(xiàn)了非凡的生命力，字節(jié)跳動(dòng)把短視頻生意做到了全世界，美團(tuán)把本地生活做成了一個(gè)千億美元的生意，而拼多多也成長(zhǎng)為阿里、亞馬遜一外的電商新一極。

　　在GPT橫空出世之后，美國(guó)SaaS公司率先受益，紛紛開(kāi)始向客戶提供AI功能，通過(guò)之前建立的客戶基礎(chǔ)和產(chǎn)品場(chǎng)景直接產(chǎn)生商業(yè)回報(bào)，大大提升了在AI上創(chuàng)新投入的回報(bào)確定性。而中國(guó)的AI應(yīng)用卻因?yàn)槿狈?chǎng)景和商業(yè)模式而進(jìn)展緩慢。

　　隨著AI應(yīng)用的逐漸落地，模型效率將會(huì)成為打通中國(guó)大模型商業(yè)化循環(huán)的一把“鑰匙”。

　　文/林白

　　PS：如果你對(duì)AI大模型領(lǐng)域有獨(dú)特的看法，歡迎掃碼加入我們的大模型交流群。

標(biāo)簽：游戲規(guī)則 DeepSeek 改變