首页 >> 動(dòng)態(tài) >> 對(duì)話杜克大學(xué)教授陳怡然：從“1到100”也很難，說DeepSeek只是技術(shù)拼接無創(chuàng)新，不公平

详细内容

對(duì)話杜克大學(xué)教授陳怡然：從“1到100”也很難，說DeepSeek只是技術(shù)拼接無創(chuàng)新，不公平

所謂“人紅是非多”，國(guó)產(chǎn)AI“黑馬”DeepSeek，在震驚海內(nèi)外科技圈后，正在引發(fā)爭(zhēng)議和質(zhì)疑。

隨著市場(chǎng)逐漸平靜下來，業(yè)界質(zhì)疑DeepSeek技術(shù)創(chuàng)新性的聲音不斷襲來，以及中美之間的AI差距是否真的在縮小找齊。

DeepSeek被捧得太過了嗎？馬斯克、奧特曼等對(duì)其訓(xùn)練產(chǎn)生的質(zhì)疑，該作何解釋？中美在AI競(jìng)技打法上有哪些新思考，差距幾何？

近日，搜狐科技與有著近20年學(xué)術(shù)積累，身處AI浪潮一線的，美國(guó)杜克大學(xué)電子與計(jì)算機(jī)工程系杰出教授陳怡然，進(jìn)行了深度對(duì)話。

以下為對(duì)話實(shí)錄（經(jīng)整理編輯）

搜狐科技：外界對(duì)DeepSeek有很多不同的聲音。Scale AI創(chuàng)始人認(rèn)為，“DeepSeek的出現(xiàn)或?qū)⒁桓拿绹?guó)在過去十幾年的AI領(lǐng)先位置�！� 但谷歌DeepMind 首席執(zhí)行官卻直言，“其技術(shù)無本質(zhì)創(chuàng)新，是外界炒作過頭了�！� 您怎么看？

陳怡然：DeepSeek是工程上的成功，它用到的技術(shù)基本沒有什么是大家以前都不知道的，或者說是“石破天荒”的。

搜狐科技：該怎么理解“工程上的成功”？

陳怡然：目前對(duì)于大模型訓(xùn)練，有很多種方法，當(dāng)然不同的方法也會(huì)組合到一起，嘗試訓(xùn)練效果。

DeepSeek其實(shí)是把這點(diǎn)做到了極致，不斷嘗試不同的方法組合、方法優(yōu)化，最后能把訓(xùn)練成本降到現(xiàn)在這么低的水平，并且愿意把找到的好方法開源分享，我覺得這其最主要的貢獻(xiàn)。

搜狐科技：您更傾向于強(qiáng)調(diào)它在工程上的成功，是暗指技術(shù)創(chuàng)新上沒做出太多貢獻(xiàn)嗎？

陳怡然：不能這么說，工程上的成功也是建立在技術(shù)創(chuàng)新基礎(chǔ)之上的。

就算用到的技術(shù)大家都知道，但怎么有效地組合在一起，變成一個(gè)真實(shí)可用的優(yōu)秀架構(gòu)，實(shí)際上是很難的一件事。

大家常說“從0到1”難，但“從1到100”其實(shí)也一樣難。只認(rèn)為DeepSeek是工程上的技術(shù)拼接，并不公平。

搜狐科技：大家認(rèn)為DeepSeek這次用到的“MoE”等亮點(diǎn)技術(shù)，之前早有企業(yè)用到，技術(shù)本質(zhì)并無創(chuàng)新，沒任何科學(xué)進(jìn)步，您怎么看？

陳怡然：“MoE”是很早之前就有的技術(shù)，我們團(tuán)隊(duì)在研究中也用過，這都不是秘密。但不能說，有人現(xiàn)在用更好的方式去重新用一遍就不是創(chuàng)新。

尤其現(xiàn)在很多技術(shù)都是開源的，很難說誰(shuí)能找到一本大家從未見過的“武林秘籍”，大多技術(shù)都是有跡可循的，這也是科研過程中的正常軌跡。

搜狐科技：對(duì)DeepSeek提出質(zhì)疑的還有馬斯克，不相信他們只有極少的芯片，也不相信官方披露的只用了600萬美元訓(xùn)練成本。您怎么看？

陳怡然：整體研發(fā)成本肯定是高于600萬美元的，這個(gè)毫無疑問。因?yàn)橄氚涯Ｐ妥龀涩F(xiàn)在這樣，肯定是經(jīng)過了無數(shù)次試錯(cuò)的。

就像做菜，你之前試菜用了多少食材，多少成本并不清楚。600萬美元指的是最后一次把菜炒成功，用了這么多錢。

搜狐科技：有人認(rèn)為DeepSeek的團(tuán)隊(duì)整體很年輕，DeepSeek的領(lǐng)先優(yōu)勢(shì)也很快可能被其他人超越。您覺得呢？

陳怡然：后面有團(tuán)隊(duì)會(huì)做出超越DeepSeek的模型是肯定的，而且不會(huì)太久。現(xiàn)在相關(guān)技術(shù)已經(jīng)開源，很多人已經(jīng)上手研究這個(gè)事，做出來不奇怪。

但從年齡角度講，機(jī)器學(xué)習(xí)做的好的人都很年輕。比如何愷明那群人，很多有影響力的想法都是他們?cè)诙鄽q時(shí)就提出來的。

搜狐科技：回到對(duì)技術(shù)的討論，奧特曼說“DeepSeek用低成本訓(xùn)練大模型只是小打小鬧，要想做最智能的模型，就需要繼續(xù)在資金和算力上投入�！苯沂玖薕penAI與DeepSeek在技術(shù)路線上的分歧。您怎么看中美在AI競(jìng)技打法上的博弈？

陳怡然：我覺得很多人對(duì)DeepSeek有一個(gè)很深的誤解，DeepSeek從來沒想過“彎道超車”。他的想法很簡(jiǎn)單，就是要找到一個(gè)方法，在保證大模型性能的前提下，把高昂的訓(xùn)練成本打下來。

整體而言，DeepSeek和OpenAI走的不是一條路。OpenAI仍然相信用Scaling Law “大力出奇跡”，目標(biāo)是造出新模型解決當(dāng)前模型解決不了的問題。而DeepSeek實(shí)際是在已有框架下，探尋解決問題的更好方法，比如造出同樣性能模型的前提下，怎么做得更便宜。

搜狐科技：硅谷一直推崇“燒錢模式”，堆資金和算力訓(xùn)練大模型。DeepSeek的出圈有改變硅谷的風(fēng)向嗎？

陳怡然：我其實(shí)不覺得。準(zhǔn)確來說，在找到極簡(jiǎn)的有效模型表達(dá)前，通常會(huì)先使用一個(gè)比較復(fù)雜帶有冗余的模型來完成想要表達(dá)的事，就像OpenAI最早公布的模型，再由繁化簡(jiǎn)。

為了探究AI的下一階段水平，這個(gè)事肯定還是要有人來做的。且新技術(shù)探尋的開始階段，肯定還是傾向于用更大的模型和數(shù)據(jù)進(jìn)行訓(xùn)練，硅谷仍然在做這件事。

搜狐科技：所以像OpenAI這類玩家，更像技術(shù)“開拓者”，沖在最前面。像DeepSeek這類玩家，更像是工程師，來優(yōu)化現(xiàn)有解決方案？

陳怡然：可以這么理解，但不能說工程師好像沒有開拓者重要。因?yàn)殚_拓往往意味著要消耗大量資源成本，要想讓技術(shù)真正做到普惠，讓大眾大規(guī)模使用，還要靠工程師多下功夫。

所以完全沒有像大家想的有一個(gè)什么高下之分，無論是開拓還是優(yōu)化，都需要有人去做。

搜狐科技：聊一個(gè)比較輕松的話題，為什么感覺這一波西方的反應(yīng)比國(guó)內(nèi)更夸張？

陳怡然：我覺得中美都挺上頭的。從國(guó)內(nèi)來講，希望讓大家都看到中國(guó)出現(xiàn)了一個(gè)特別好的技術(shù)，尤其是在訓(xùn)練效率和開源方面，是非常自豪的一件事。

從美國(guó)來講，有一部分是對(duì)之前策略的反思，復(fù)盤之前AI技術(shù)策略的對(duì)與錯(cuò)，并規(guī)劃下一步需要更多投入的是什么。再有就是華爾街的操作，要去炒作散播這些事，從而影響美股來掙錢。

我覺得大家還是要保持一個(gè)相對(duì)客觀冷靜的頭腦去看這個(gè)事，尤其是做技術(shù)的人。

搜狐科技：美國(guó)、日本、印度等國(guó)家法案提議，要限制DeepSeek的下載使用，最高處罰面臨監(jiān)禁。這又是一次技術(shù)制裁嗎，您怎么看？

陳怡然：不排除這種可能性，但也有邏輯在里面。一方面是出于安全的考慮，另一方面是DeepSeek火的太突然，可能連這個(gè)團(tuán)隊(duì)都沒想到能到今天這個(gè)地步，像數(shù)據(jù)合規(guī)等操作可能并沒來得及做完，其他國(guó)家在審核的時(shí)候材料不全。

搜狐科技：總的來看，您覺得DeepSeek的出圈，預(yù)示著中美AI差距在縮小嗎？

陳怡然：我覺得這其實(shí)是一個(gè)偽命題。從技術(shù)角度來說，唯一的差距可能就是誰(shuí)先一步做出來了，但這又不是其他團(tuán)隊(duì)真正的落后。因?yàn)槠渌丝赡茉谀Ｐ突A(chǔ)上加以改進(jìn)，過段時(shí)間又做出了更好的作品。永遠(yuǎn)是這樣交替的，很難有人永遠(yuǎn)領(lǐng)先。

未來就是看誰(shuí)能夠在商業(yè)模式上，或者在不斷的技術(shù)創(chuàng)新上能持續(xù)的往下走。

至于算力和芯片，是另外一個(gè)問題。中國(guó)的算力肯定還是遠(yuǎn)小于美國(guó)的，但不至于說就把國(guó)內(nèi)的研發(fā)進(jìn)度鎖死了。國(guó)產(chǎn)芯片也正在努力做AI訓(xùn)練的適配工作，并且大模型訓(xùn)練所需的成本后面一定會(huì)繼續(xù)周期性下降。

搜狐科技：您怎么看AGI（通用人工智能），現(xiàn)在又近了一點(diǎn)嗎？

陳怡然：如果你看過一些采訪，比如李飛飛，她覺得談?wù)揂GI沒有任何意義，這是一個(gè)Moving Target（永遠(yuǎn)在變動(dòng)的目標(biāo)）。

什么是AGI？每個(gè)人都有不同的理解。之前說是通過圖靈測(cè)試就可以，現(xiàn)在又要用更高階的測(cè)試來考驗(yàn)。我覺得大家對(duì)這個(gè)不用太上心。

搜狐科技：前兩天看您在微博上又提起了“AI人才”話題，您覺得當(dāng)前中國(guó)的AI人才儲(chǔ)備怎么樣？

陳怡然：中國(guó)人才很多，這是肯定的。那如果說是一個(gè)開放的環(huán)境，一個(gè)開放的心態(tài)，一個(gè)寬松的研發(fā)場(chǎng)所，相信這些人才能做得更好。

我覺得科研就是這樣的，如果你用一個(gè)KPI給研究人員“拴死”在那，“帶著腳鐐跳舞”，他一定跳得不好。相反，當(dāng)讓他去自由發(fā)揮的時(shí)候，反而會(huì)帶來更多驚喜。

搜狐科技：最后一個(gè)問題，您認(rèn)為DeepSeek的爆發(fā)，給中國(guó)AI大模型發(fā)展帶來了什么啟發(fā)？百度、騰訊、阿里、“AI六小龍”，可以在哪些方面多下功夫，多些思考？

陳怡然：這是一個(gè)特別好的問題。我個(gè)人判斷，會(huì)讓很多大廠更關(guān)注于模型的效率，而不是一味地追求模型的大和高性能。

很多模型可以說已經(jīng)超過人類智能水平，但可能受運(yùn)行效率影響，讓用戶難以抉擇用不用。其實(shí)對(duì)于普通用戶來說，模型的準(zhǔn)確率是71.9%還是72%并沒那么重要。

反觀訓(xùn)練和使用成本，如果一下降了10倍，這可能是一個(gè)巨大的影響。我覺得大家會(huì)對(duì)這種實(shí)際的成本問題更加敏感，這也會(huì)在一定程度上影響模型的鋪開應(yīng)用。

就是大家別老想著說做一個(gè)像“天網(wǎng)”似的supercomputer（超級(jí)計(jì)算機(jī)），實(shí)際上我們需要的是千千萬萬個(gè)跟人類一樣聰明的AI在身邊，執(zhí)行不同的任務(wù)，各有所長(zhǎng)。

上一篇個(gè)稅收入十強(qiáng)省份榜單出爐廣東上海北京位居前三下一篇《哪吒2》成春節(jié)檔大贏家：光線傳媒市值日增56億，哪吒2或?qū)?/a>

日本55丰满熟妇厨房伦,天天躁日日躁狠狠躁AV中文,久久精品99无色码中文字幕,欧美中文字幕无线码视频

對(duì)話杜克大學(xué)教授陳怡然：從“1到100”也很難，說DeepSeek只是技術(shù)拼接無創(chuàng)新，不公平

對(duì)話杜克大學(xué)教授陳怡然：從“1到100”也很難，說DeepSeek只是技術(shù)拼接無創(chuàng)新，不公平