中美AI再對賬，DeepSeek這把真的超越硅谷了嗎？

时间：2025-02-18 【转载】

AI大模型“角斗場”，被來自中國的“黑馬”掀翻了天。

DeepSeek最新出品的R1模型，發(fā)布不到一周的時間，已經(jīng)成功躍升至全球模型排行榜第三名，與OpenAI的GPT-4o并列。

截至北京時間1月26日17:50分，DeepSeek在美區(qū)蘋果App Store免費榜升至第六位，超過谷歌Gemini、微軟Copilot。或是由于短期內(nèi)涌入用戶太多，今日下午還有網(wǎng)友反映DeepSeek出現(xiàn)了短時閃崩現(xiàn)象。

值得一提的是，R1不僅是開源模型，訓(xùn)練成本要比GPT-4o足足便宜20倍。

DeepSeek也因此獲得了不少新稱號，諸如“國產(chǎn)AI之光”、“AI屆的拼多多”等。

從DeepSeek公布的測試結(jié)果來看，在編碼、數(shù)學(xué)、通識等方面，R1的表現(xiàn)都與OpenAI的o1模型旗鼓相當(dāng)。

網(wǎng)友感嘆，“是時候取消我昂貴的OpenAI模型訂閱了。”也有在美網(wǎng)友刷屏評論，“美國的AI領(lǐng)先地位馬上要不保了？”

圖靈獎獲得者楊立昆，從另一個角度發(fā)文表示，“比‘中國超越了美國’更合適的說法是，開源模型這次真正取得了勝利�！�

硅谷好奇心不減

中國研發(fā)企業(yè)DeepSeek的“橫空出世”，引起硅谷AI界的一眾好奇。

無論是OpenAI、Meta、英偉達(dá)這樣的科技巨頭，還是楊立昆、吳恩達(dá)等頂尖AI學(xué)者，在對DeepSeek的評價中都出現(xiàn)了一個相同的形容詞——“不可思議”。

據(jù)外媒報道，“Meta 的 AI 部門正感受到壓力，工程師們正在瘋狂地剖析 DeepSeek，并從中復(fù)制能復(fù)制的一切�！�

DeepSeek“出圈”，到底做對了什么？

簡單來說，DeepSeek成功用低成本，訓(xùn)練出了高質(zhì)量的大模型。且最難得的是，其仍在保持追求AGI的初心。

《福布斯》提到，“它讓世界認(rèn)識到，中國并未退出這場競賽（AI）�！�

自DeepSeek掀起熱議以來，對其技術(shù)論文的解析很多。概括來看，DeepSeek沒有選擇搭已有模型架構(gòu)的“便車”，而是選擇了創(chuàng)新。

復(fù)旦大學(xué)教授、MOSS大模型項目負(fù)責(zé)人邱錫鵬向搜狐科技介紹，“DeepSeek這次主要是AI Infra（AI基礎(chǔ)設(shè)施，包括AI部署、算力管理等）做得好，高效利用了資源。”

在R1模型的訓(xùn)練過程中，DeepSeek直接將強化學(xué)習(xí)（RL）應(yīng)用于基礎(chǔ)模型，而非像以往依靠人類標(biāo)注數(shù)據(jù)進(jìn)行監(jiān)督微調(diào)（SFT）。這樣做的目的是，讓模型從零開始“自我進(jìn)化”，從而獲得推理能力。

有個比喻很得當(dāng)，“就像人學(xué)習(xí)語文，是從偏旁部首和拼音基礎(chǔ)知識學(xué)起，而不是在任何人的指導(dǎo)下直接學(xué)習(xí)造句。這樣打下的基礎(chǔ)更扎實�！�

此外，雖然DeepSeek和OpenAI都選用了Transformer架構(gòu)，但DeepSeek采用了全新的“多頭潛在注意力機制架構(gòu)（MLA）”，大幅減少了計算量，提升模型訓(xùn)練效率。

綜合以上，DeepSeek收獲的結(jié)果就是——絕對的性價比。便宜到什么程度？看其公布的一張價格對比圖便知。

無論是輸入還是輸出Token價格，DeepSeek都要比OpenAI的o1模型便宜數(shù)十倍，且性能表現(xiàn)與其相當(dāng)。

鮮為人知的是，在去年引燃的“大模型價格戰(zhàn)”，也正是由DeepSeek掀起的。

在DeepSeek宣布降價后，字節(jié)、阿里巴巴、百度等一眾國內(nèi)大廠跟進(jìn)，甚至不惜“燒錢補貼”。

在與暗涌的一場對話中，DeepSeek創(chuàng)始人梁文鋒對不斷降價的“打法”解釋道，“搶用戶并不是我們的主要目的。降價一方面是因為我們在探索下一代模型的結(jié)構(gòu)中，成本先降下來了，另一方面也覺得無論 API，還是 AI，都應(yīng)該是普惠的、人人可以用得起的東西�！�

一群“瘋狂”的人

DeepSeek既不在中國大模型“六小虎”之列，也不像百度、阿里巴巴等科技大廠，在AI競賽一開始就備受矚目。

DeepSeek真正在AI圈內(nèi)闖出名聲，是在2024年5月發(fā)布高性價比模型DeepSeek V2，在激烈競爭中為自己占得了“一席之地”。

與很多外界的猜測不同，DeepSeek沒有高深莫測的“奇才”，都是一些Top高校的畢業(yè)生，或是博四、博五沒畢業(yè)的實習(xí)生。

如今，DeepSeek正在掀起新的一場“復(fù)刻狂潮”，只有強化學(xué)習(xí)，沒有監(jiān)督微調(diào)。

Meta、UC伯克利、香港科技大學(xué)等一眾產(chǎn)學(xué)界機構(gòu)，正在用“放大鏡”深研DeepSeek論文，并嘗試復(fù)現(xiàn)�；蛟S，全世界正在進(jìn)入AI的下一分水嶺。

談及對突然“出圈”的看法，梁文鋒給出的解釋是，“在美國每天發(fā)生的大量創(chuàng)新里，這是非常普通的一個。之所以驚訝，是因為這次中國是以創(chuàng)新者的身份出現(xiàn)，而不是刻板印象中的follow（跟隨者）�！�

對于未來，梁文鋒和團(tuán)隊想的很清楚，“要參與到全球創(chuàng)新浪潮中去，而不是習(xí)慣于拿別人的創(chuàng)新過來，做應(yīng)用變現(xiàn)�！�

在他看來，“中國并不缺人才，DeepSeek的V2模型沒有海外的人參與，都是本土的。前 50 名頂尖人才可能不在中國，但也許我們能自己打造這樣的人�！�

前面提到， DeepSeek最難得的是仍在堅持追求AGI的純粹技術(shù)初心。

北京智源人工智能研究院副院長兼總工程師林詠華曾向搜狐科技介紹，“放眼當(dāng)下AI市場，大家對應(yīng)用的追求是強烈的，反觀仍在追求AGI的研究團(tuán)隊數(shù)量卻在不斷減少，高昂的科研成本勸退了很多人。”

DeepSeek的身上，背負(fù)著同樣的壓力。在梁文鋒的表述中，能夠清晰感受到創(chuàng)新就是昂貴且低效的。投資人也會出于商業(yè)利益的考量對項目信心時而不定。

但這一切，似乎并未影響梁文鋒和他的年輕團(tuán)隊成為一群“瘋狂”的人，在泥濘的道路上，堅持追尋掛在天邊的“技術(shù)理想”。

中美AI差距不存在了嗎？

DeepSeek的成績可觀，是否意味著中國AI發(fā)展已經(jīng)趕超了美國？

360集團(tuán)創(chuàng)始人周鴻祎在最新發(fā)布的視頻中表示，“中美現(xiàn)在AI競爭日益激烈，但最終一定是中國勝利。就像中國在制造業(yè)領(lǐng)域已經(jīng)戰(zhàn)勝了美國一樣，中國AI公司的創(chuàng)造力已經(jīng)剎不住車了�！�

“將來如果要對抗美國的AI技術(shù)霸權(quán)，中國大模型技術(shù)復(fù)仇者聯(lián)盟戰(zhàn)隊里一定有DeepSeek的一份，因為這家公司和它的創(chuàng)始人非常低調(diào)，他們技術(shù)能力和未來前景被市場嚴(yán)重低估了�！敝茗櫟t說。

清華大學(xué)計算機系長聘副教授劉知遠(yuǎn)認(rèn)為，“中國和美國的AI差距明顯縮小了，很多人不信服，現(xiàn)在DeepSeek等用實例讓大家看到了這點。”

但他強調(diào)，“最近看到越來越多‘中國AI已經(jīng)超過美國’、‘DeepSeek羞辱OpenAI’的說法，我覺得不太好。要警惕從極度悲觀轉(zhuǎn)向了極度樂觀。覺得我們已經(jīng)全面超越、遙遙領(lǐng)先了，遠(yuǎn)遠(yuǎn)沒有�！�

他提到，“AGI新技術(shù)還在加速演進(jìn)，未來發(fā)展路徑尚不明確。我們?nèi)栽谧汾s階段，已經(jīng)不是望塵莫及，但也只能說是望其項背�！�

“在別人已經(jīng)探索出來的路上跟隨快跑是相對容易的，接下來我們要面對一團(tuán)未來迷霧，如何先人一步探出新路，是更困難和有挑戰(zhàn)的事，需要百倍投入、百倍努力�！�

在劉知遠(yuǎn)看來，DeepSeek出圈的意義是，“非常好的讓人們看到中國AI的希望，但遠(yuǎn)未到勝券在握、優(yōu)勢在我的地步。我們在人才儲備、算力資源和創(chuàng)新生態(tài)方面還有巨大差距。只有頭腦清醒、發(fā)揮自身優(yōu)勢，不斷彌補差距，才能走好后面更有挑戰(zhàn)的路�！�

上一篇美國“星際之門”計劃拆解，中美AI競賽白熱化？下一篇梁文鋒現(xiàn)身背后，DeepSeek如何加速國產(chǎn)算力進(jìn)程？

日本55丰满熟妇厨房伦,天天躁日日躁狠狠躁AV中文,久久精品99无色码中文字幕,欧美中文字幕无线码视频

中美AI再對賬，DeepSeek這把真的超越硅谷了嗎？

中美AI再對賬，DeepSeek這把真的超越硅谷了嗎？