日本55丰满熟妇厨房伦,天天躁日日躁狠狠躁AV中文,久久精品99无色码中文字幕,欧美中文字幕无线码视频

首页 >> 動(dòng)態(tài) >> 對(duì)話杜克大學(xué)教授陳怡然:從“1到100”也很難,說DeepSeek只是技術(shù)拼接無創(chuàng)新,不公平
详细内容

對(duì)話杜克大學(xué)教授陳怡然:從“1到100”也很難,說DeepSeek只是技術(shù)拼接無創(chuàng)新,不公平

所謂“人紅是非多”,國(guó)產(chǎn)AI“黑馬”DeepSeek,在震驚海內(nèi)外科技圈后,正在引發(fā)爭(zhēng)議和質(zhì)疑。

隨著市場(chǎng)逐漸平靜下來,業(yè)界質(zhì)疑DeepSeek技術(shù)創(chuàng)新性的聲音不斷襲來,以及中美之間的AI差距是否真的在縮小找齊。

DeepSeek被捧得太過了嗎?馬斯克、奧特曼等對(duì)其訓(xùn)練產(chǎn)生的質(zhì)疑,該作何解釋?中美在AI競(jìng)技打法上有哪些新思考,差距幾何?

近日,搜狐科技與有著近20年學(xué)術(shù)積累,身處AI浪潮一線的,美國(guó)杜克大學(xué)電子與計(jì)算機(jī)工程系杰出教授陳怡然,進(jìn)行了深度對(duì)話。

以下為對(duì)話實(shí)錄(經(jīng)整理編輯)

搜狐科技:外界對(duì)DeepSeek有很多不同的聲音。Scale AI創(chuàng)始人認(rèn)為,“DeepSeek的出現(xiàn)或?qū)⒁桓拿绹?guó)在過去十幾年的AI領(lǐng)先位置! 但谷歌DeepMind 首席執(zhí)行官卻直言,“其技術(shù)無本質(zhì)創(chuàng)新,是外界炒作過頭了! 您怎么看?

陳怡然:DeepSeek是工程上的成功,它用到的技術(shù)基本沒有什么是大家以前都不知道的,或者說是“石破天荒”的。

搜狐科技:該怎么理解“工程上的成功”?

陳怡然:目前對(duì)于大模型訓(xùn)練,有很多種方法,當(dāng)然不同的方法也會(huì)組合到一起,嘗試訓(xùn)練效果。

DeepSeek其實(shí)是把這點(diǎn)做到了極致,不斷嘗試不同的方法組合、方法優(yōu)化,最后能把訓(xùn)練成本降到現(xiàn)在這么低的水平,并且愿意把找到的好方法開源分享,我覺得這其最主要的貢獻(xiàn)。

搜狐科技:您更傾向于強(qiáng)調(diào)它在工程上的成功,是暗指技術(shù)創(chuàng)新上沒做出太多貢獻(xiàn)嗎?

陳怡然:不能這么說,工程上的成功也是建立在技術(shù)創(chuàng)新基礎(chǔ)之上的。

就算用到的技術(shù)大家都知道,但怎么有效地組合在一起,變成一個(gè)真實(shí)可用的優(yōu)秀架構(gòu),實(shí)際上是很難的一件事。

大家常說“從0到1”難,但“從1到100”其實(shí)也一樣難。只認(rèn)為DeepSeek是工程上的技術(shù)拼接,并不公平。

搜狐科技:大家認(rèn)為DeepSeek這次用到的“MoE”等亮點(diǎn)技術(shù),之前早有企業(yè)用到,技術(shù)本質(zhì)并無創(chuàng)新,沒任何科學(xué)進(jìn)步,您怎么看?

陳怡然:“MoE”是很早之前就有的技術(shù),我們團(tuán)隊(duì)在研究中也用過,這都不是秘密。但不能說,有人現(xiàn)在用更好的方式去重新用一遍就不是創(chuàng)新。

尤其現(xiàn)在很多技術(shù)都是開源的,很難說誰(shuí)能找到一本大家從未見過的“武林秘籍”,大多技術(shù)都是有跡可循的,這也是科研過程中的正常軌跡。

搜狐科技:對(duì)DeepSeek提出質(zhì)疑的還有馬斯克,不相信他們只有極少的芯片,也不相信官方披露的只用了600萬美元訓(xùn)練成本。您怎么看?

陳怡然:整體研發(fā)成本肯定是高于600萬美元的,這個(gè)毫無疑問。因?yàn)橄氚涯P妥龀涩F(xiàn)在這樣,肯定是經(jīng)過了無數(shù)次試錯(cuò)的。

就像做菜,你之前試菜用了多少食材,多少成本并不清楚。600萬美元指的是最后一次把菜炒成功,用了這么多錢。

搜狐科技:有人認(rèn)為DeepSeek的團(tuán)隊(duì)整體很年輕,DeepSeek的領(lǐng)先優(yōu)勢(shì)也很快可能被其他人超越。您覺得呢?

陳怡然:后面有團(tuán)隊(duì)會(huì)做出超越DeepSeek的模型是肯定的,而且不會(huì)太久。現(xiàn)在相關(guān)技術(shù)已經(jīng)開源,很多人已經(jīng)上手研究這個(gè)事,做出來不奇怪。

但從年齡角度講,機(jī)器學(xué)習(xí)做的好的人都很年輕。比如何愷明那群人,很多有影響力的想法都是他們?cè)诙鄽q時(shí)就提出來的。

搜狐科技:回到對(duì)技術(shù)的討論,奧特曼說“DeepSeek用低成本訓(xùn)練大模型只是小打小鬧,要想做最智能的模型,就需要繼續(xù)在資金和算力上投入!苯沂玖薕penAI與DeepSeek在技術(shù)路線上的分歧。您怎么看中美在AI競(jìng)技打法上的博弈?

陳怡然:我覺得很多人對(duì)DeepSeek有一個(gè)很深的誤解,DeepSeek從來沒想過“彎道超車”。他的想法很簡(jiǎn)單,就是要找到一個(gè)方法,在保證大模型性能的前提下,把高昂的訓(xùn)練成本打下來。

整體而言,DeepSeek和OpenAI走的不是一條路。OpenAI仍然相信用Scaling Law “大力出奇跡”,目標(biāo)是造出新模型解決當(dāng)前模型解決不了的問題。而DeepSeek實(shí)際是在已有框架下,探尋解決問題的更好方法,比如造出同樣性能模型的前提下,怎么做得更便宜。

搜狐科技:硅谷一直推崇“燒錢模式”,堆資金和算力訓(xùn)練大模型。DeepSeek的出圈有改變硅谷的風(fēng)向嗎?

陳怡然:我其實(shí)不覺得。準(zhǔn)確來說,在找到極簡(jiǎn)的有效模型表達(dá)前,通常會(huì)先使用一個(gè)比較復(fù)雜帶有冗余的模型來完成想要表達(dá)的事,就像OpenAI最早公布的模型,再由繁化簡(jiǎn)。

為了探究AI的下一階段水平,這個(gè)事肯定還是要有人來做的。且新技術(shù)探尋的開始階段,肯定還是傾向于用更大的模型和數(shù)據(jù)進(jìn)行訓(xùn)練,硅谷仍然在做這件事。

搜狐科技:所以像OpenAI這類玩家,更像技術(shù)“開拓者”,沖在最前面。像DeepSeek這類玩家,更像是工程師,來優(yōu)化現(xiàn)有解決方案?

陳怡然:可以這么理解,但不能說工程師好像沒有開拓者重要。因?yàn)殚_拓往往意味著要消耗大量資源成本,要想讓技術(shù)真正做到普惠,讓大眾大規(guī)模使用,還要靠工程師多下功夫。

所以完全沒有像大家想的有一個(gè)什么高下之分,無論是開拓還是優(yōu)化,都需要有人去做。

搜狐科技:聊一個(gè)比較輕松的話題,為什么感覺這一波西方的反應(yīng)比國(guó)內(nèi)更夸張?

陳怡然:我覺得中美都挺上頭的。從國(guó)內(nèi)來講,希望讓大家都看到中國(guó)出現(xiàn)了一個(gè)特別好的技術(shù),尤其是在訓(xùn)練效率和開源方面,是非常自豪的一件事。

從美國(guó)來講,有一部分是對(duì)之前策略的反思,復(fù)盤之前AI技術(shù)策略的對(duì)與錯(cuò),并規(guī)劃下一步需要更多投入的是什么。再有就是華爾街的操作,要去炒作散播這些事,從而影響美股來掙錢。

我覺得大家還是要保持一個(gè)相對(duì)客觀冷靜的頭腦去看這個(gè)事,尤其是做技術(shù)的人。

搜狐科技:美國(guó)、日本、印度等國(guó)家法案提議,要限制DeepSeek的下載使用,最高處罰面臨監(jiān)禁。這又是一次技術(shù)制裁嗎,您怎么看?

陳怡然:不排除這種可能性,但也有邏輯在里面。一方面是出于安全的考慮,另一方面是DeepSeek火的太突然,可能連這個(gè)團(tuán)隊(duì)都沒想到能到今天這個(gè)地步,像數(shù)據(jù)合規(guī)等操作可能并沒來得及做完,其他國(guó)家在審核的時(shí)候材料不全。

搜狐科技:總的來看,您覺得DeepSeek的出圈,預(yù)示著中美AI差距在縮小嗎?

陳怡然:我覺得這其實(shí)是一個(gè)偽命題。從技術(shù)角度來說,唯一的差距可能就是誰(shuí)先一步做出來了,但這又不是其他團(tuán)隊(duì)真正的落后。因?yàn)槠渌丝赡茉谀P突A(chǔ)上加以改進(jìn),過段時(shí)間又做出了更好的作品。永遠(yuǎn)是這樣交替的,很難有人永遠(yuǎn)領(lǐng)先。

未來就是看誰(shuí)能夠在商業(yè)模式上,或者在不斷的技術(shù)創(chuàng)新上能持續(xù)的往下走。

至于算力和芯片,是另外一個(gè)問題。中國(guó)的算力肯定還是遠(yuǎn)小于美國(guó)的,但不至于說就把國(guó)內(nèi)的研發(fā)進(jìn)度鎖死了。國(guó)產(chǎn)芯片也正在努力做AI訓(xùn)練的適配工作,并且大模型訓(xùn)練所需的成本后面一定會(huì)繼續(xù)周期性下降。

搜狐科技:您怎么看AGI(通用人工智能),現(xiàn)在又近了一點(diǎn)嗎?

陳怡然:如果你看過一些采訪,比如李飛飛,她覺得談?wù)揂GI沒有任何意義,這是一個(gè)Moving Target(永遠(yuǎn)在變動(dòng)的目標(biāo))。

什么是AGI?每個(gè)人都有不同的理解。之前說是通過圖靈測(cè)試就可以,現(xiàn)在又要用更高階的測(cè)試來考驗(yàn)。我覺得大家對(duì)這個(gè)不用太上心。

搜狐科技:前兩天看您在微博上又提起了“AI人才”話題,您覺得當(dāng)前中國(guó)的AI人才儲(chǔ)備怎么樣?

陳怡然:中國(guó)人才很多,這是肯定的。那如果說是一個(gè)開放的環(huán)境,一個(gè)開放的心態(tài),一個(gè)寬松的研發(fā)場(chǎng)所,相信這些人才能做得更好。

我覺得科研就是這樣的,如果你用一個(gè)KPI給研究人員“拴死”在那,“帶著腳鐐跳舞”,他一定跳得不好。相反,當(dāng)讓他去自由發(fā)揮的時(shí)候,反而會(huì)帶來更多驚喜。

搜狐科技:最后一個(gè)問題,您認(rèn)為DeepSeek的爆發(fā),給中國(guó)AI大模型發(fā)展帶來了什么啟發(fā)?百度、騰訊、阿里、“AI六小龍”,可以在哪些方面多下功夫,多些思考?

陳怡然:這是一個(gè)特別好的問題。我個(gè)人判斷,會(huì)讓很多大廠更關(guān)注于模型的效率,而不是一味地追求模型的大和高性能。

很多模型可以說已經(jīng)超過人類智能水平,但可能受運(yùn)行效率影響,讓用戶難以抉擇用不用。其實(shí)對(duì)于普通用戶來說,模型的準(zhǔn)確率是71.9%還是72%并沒那么重要。

反觀訓(xùn)練和使用成本,如果一下降了10倍,這可能是一個(gè)巨大的影響。我覺得大家會(huì)對(duì)這種實(shí)際的成本問題更加敏感,這也會(huì)在一定程度上影響模型的鋪開應(yīng)用。

就是大家別老想著說做一個(gè)像“天網(wǎng)”似的supercomputer(超級(jí)計(jì)算機(jī)),實(shí)際上我們需要的是千千萬萬個(gè)跟人類一樣聰明的AI在身邊,執(zhí)行不同的任務(wù),各有所長(zhǎng)。


seo seo