首頁 計劃 > 正文

專訪英特爾中國研究院院長:中國半導(dǎo)體市場將大爆發(fā),用開源對決英偉達

“如果沒有中國客戶的訂單,英特爾在俄亥俄州建設(shè)工廠等項目的必要性就會大大降低?!庇⑻貭朇EO帕特·基辛格,在游說拜登政府放棄對華半導(dǎo)體新限制政策時直言不諱。

英特爾原本計劃投資至少2000億美元,在美國俄亥俄州哥倫布市外新建“全球最大芯片制造基地”,如果美國繼續(xù)加強對華芯片出口限制,全球最大的半導(dǎo)體制造商之一的英特爾可能要因此丟掉約三分之一的營收。

英特爾研究院副總裁、英特爾中國研究院院長宋繼強博士在接受《深網(wǎng)》專訪時稱,中國有許多其他國家無法復(fù)制的新增機遇,這跟中國的標準化建設(shè),還有中國電動車產(chǎn)業(yè)的一枝獨秀相關(guān)?!安还庥⑻貭?,其他在中國有相對重量級業(yè)務(wù)的公司,都要努力抓住中國市場新展現(xiàn)出來的機遇。”


(相關(guān)資料圖)

據(jù)報道,日前,英特爾與深圳合作,在南山區(qū)啟動設(shè)立了一個新的科技創(chuàng)新中心,以加強與中國的商業(yè)關(guān)系,并幫助中國初創(chuàng)企業(yè)發(fā)展。而美國半導(dǎo)體公司AMD首席執(zhí)行官也在電話會議上表示,決定效仿英偉達調(diào)整芯片規(guī)格,以維持對華出口。

在和拜登政府表明立場前,帕特·基辛格還來了趟中國。這是他近三個月來第二次訪華,行程頗緊。

帕特·基辛格一面四處拜訪,參加第十四輪中美工商領(lǐng)袖和前高官對話、趕赴英特爾成都工廠20周年生日會、拜訪了新華三、超聚變等多家客戶;一面吹響反擊英偉達的號角,推出與英偉達A100、H100 GPU對打,專供中國市場的Gaudi2深度學(xué)習(xí)加速器芯片,與英偉達爭奪中國大模型市場。

ChatGPT點燃了新一波人工智能(AI)熱潮,也讓全球AI芯片市占率超90%的英偉達身價水漲船高,達萬億市值。英偉達CEO黃仁勛甚至放言:CPU已經(jīng)是過去式,而GPU才是未來。言下之意,英特爾(全球最大的CPU制造商)已是過去式,英偉達才是未來。

在英偉達不斷攻城略地的同時,英特爾也在思考破局之道,AI時代的排兵布陣之法。

“在這一波大模型浪潮當中,什么樣的硬件更好并沒有定論?!彼卫^強告訴《深網(wǎng)》,GPU并非大模型唯一的硬件選擇,半導(dǎo)體廠商更重要的戰(zhàn)場在軟件生態(tài)上。芯片可能花兩三年時間就做出來了,但是要打造芯片生態(tài)需要花兩倍甚至三倍的時間。英特爾的開源生態(tài)oneAPI比閉源的英偉達CUDA發(fā)展可能更快。

宋繼強認為,“半導(dǎo)體的好日子還在后面,英特爾還要繼續(xù)推動摩爾定律的發(fā)展。萬億晶體管的時代是一定會到來的,否則真的支撐不了未來需要把AI、虛擬現(xiàn)實、元宇宙這些都整合在一起的數(shù)字化時代?!?/p>

某種意義上,從成本和市場需求來看,單靠英偉達遠遠無法支撐下一輪的技術(shù)革命。

在與《深網(wǎng)》的專訪中,宋繼強分享了英特爾對大模型硬件選擇的思考、半導(dǎo)體行業(yè)未來趨勢預(yù)測以及對中國發(fā)展新機遇的理解。以下是《深網(wǎng)》對話宋繼強實錄整理,在不影響其原意的基礎(chǔ)上有所調(diào)整刪減。 

“做大模型不一定要用GPU”

《深網(wǎng)》:做大模型,一定要用GPU嗎?英偉達CEO黃仁勛認為CPU已經(jīng)是過去式,而GPU才是未來。過去半年中,做大模型和想做大模型的公司也都在盡量囤更多的高性能GPU。

宋繼強:在這一波大模型浪潮當中,什么樣的硬件更好并沒有定論。

現(xiàn)在仍在早期,大家都在比我的模型有多大?多少參數(shù)在訓(xùn)練?硬件能不能支持它快速訓(xùn)練完?還沒有真正到相對穩(wěn)定,開始去做真正的部署、優(yōu)化,甚至做一些裁剪到客戶端去做相應(yīng)的應(yīng)用的那個階段。

就像當年深度學(xué)習(xí)一樣,2013、2014年剛剛開始的時候,大家都在比誰能把這個模型做到1000層,每層還很寬。后來沒人在乎了,變成比誰能用更好的性價比落地,把真正的應(yīng)用業(yè)務(wù)做起來。

現(xiàn)在是大模型發(fā)展初期,因為GPU本身相對靈活的設(shè)計,又有這些計算資源和大容量內(nèi)存,它剛好可以用來做大模型的加速。

但我們很快會看到,在大模型這塊有很多種不同的、可以加速的硬件會出現(xiàn)。

現(xiàn)在如果對于AI的負載要求不那么強,又不想專門去買一個GPU或者AI加速卡,可以用英特爾的CPU完成AI運算。如果需要更大規(guī)模的AI加速,可以外接一個獨立顯卡或者再加一個AI加速卡,英特爾Gaudi2就是一種AI加速卡。

我實際上就是想說明針對AI這么廣泛的領(lǐng)域,對硬件的加速需求是多種多樣的。

《深網(wǎng)》:AI對硬件的需求是多樣化的,但更多人擁擠在GPU這條道路上。

宋繼強:這很正常。因為技術(shù)突破會來一波商業(yè)機會,大家都有可能在這里勝出,所以不管是投資還是產(chǎn)業(yè)的資源都會匯聚,把這件事情做大??凑l可以真正做出好的成果、做出好的技術(shù)方案。對做大模型的初創(chuàng)企業(yè)來說,現(xiàn)在大算力的計算芯片是一個有限資源,大家都去搶也是很正常的。

大家做GPU,當然是很好的嘗試,但硬件做出來之后,它的軟件能不能很好的嵌入到常用的開發(fā)生態(tài)里,就變得非常關(guān)鍵。         

“搭建應(yīng)用生態(tài)比做硬件更難”

《深網(wǎng)》:做GPU的難點不在硬件,在軟件生態(tài)搭建上?就像技術(shù)上做一個手機操作系統(tǒng)不難,難的是建立和安卓一樣龐大的應(yīng)用生態(tài)。

宋繼強:芯片領(lǐng)域一直都有這樣一個問題:芯片可能花兩三年時間就做出來了,但是你要打造芯片的生態(tài)需要花兩倍甚至三倍的時間。

現(xiàn)在AI加速卡這個級別的GPU,從設(shè)計到能力來講,都沒有很高的門檻,很多團隊確實可以做。問題是做出來之后,怎么能讓它真正被用好。現(xiàn)在比較多的情況是一些公司會針對英偉達CUDA的某一個版本做一個自己的對接轉(zhuǎn)換,這樣實際上會有一定的滯后性,生態(tài)上會受一些牽制。

所以做GPU一定要想好怎么樣在軟件這一塊發(fā)力,不要讓生態(tài)碎片化。最好是說大家雖然都做各種各樣不同的GPU,但軟件能夠保持一個通用開放的標準,這就會事半功倍。否則10家做出10個GPU,每一家都有自己的開發(fā)包、開發(fā)環(huán)境,到最后用戶誰的也不敢用,因為畢竟都是初創(chuàng)公司,對未來的路線圖、成熟度都是有疑問的。

《深網(wǎng)》:英特爾oneAPI和英偉達CUDA相比優(yōu)勢是什么?如何說服已經(jīng)在用CUDA的廠家轉(zhuǎn)用oneAPI?

宋繼強:CUDA是封閉的平臺(閉源),oneAPI是開放的(開源),這個差別很多。

oneAPI實際上是一個開放的產(chǎn)業(yè)標準,英特爾是主要的發(fā)起方和貢獻者。截止2022年3月,已經(jīng)有近70家企業(yè)和科研高校表示支持oneAPI的架構(gòu)和開發(fā)。你可以用英特爾提供的庫,也可以不用,可以找自己合適的版本用,也可以自己開發(fā)一個版本。

所以oneAPI能夠?qū)雍芏喾N不同的硬件,不需要管到底運行在誰家的硬件上。CPU可以是英特爾的、AMD、國產(chǎn)的,GPU也可以是來自英偉達、英特爾、AMD、寒武紀等等。這樣可以保證應(yīng)用開發(fā)出來之后,再過十年上面的程序也不用改,底下這些硬件可以更新迭代,每三年一換都沒有問題。

CUDA花了差不多十年的時間,才真正讓它變成了一個可以在很多領(lǐng)域應(yīng)用的軟件生態(tài)。

oneAPI到現(xiàn)在已經(jīng)做了4年了,也升級了好幾個版本,它可能發(fā)展會比CUDA快一些,因為它畢竟是很多廠商一起貢獻的。

“半導(dǎo)體的好日子還在后面”

《深網(wǎng)》:在AI爆發(fā)時期,半導(dǎo)體公司最應(yīng)該抓住的機遇是什么?

宋繼強:現(xiàn)在AI的爆發(fā)得益于半導(dǎo)體行業(yè)的發(fā)展,對半導(dǎo)體行業(yè)來講,我們就是要緊跟時代的潮流去做符合趨勢需要的硬件。

AI這個領(lǐng)域,它的興衰取決于最后這波技術(shù)能否真正的落到大規(guī)模應(yīng)用的閉環(huán)上。如果說能夠讓商業(yè)利潤回饋前期的巨量投入,這就能運轉(zhuǎn)起來。要不然,雖然說它能用,但是應(yīng)用規(guī)模非常的小,無法匹配前期這兩年的巨量投入的話,就會有一大批的公司倒掉。

前一波的深度學(xué)習(xí)(引起的AI熱潮)已經(jīng)過了5年多了,真的能夠回饋的也就是計算機視覺領(lǐng)域的一些應(yīng)用。自然語言在深度學(xué)習(xí)模型時期沒做成,大語言模型才算是做成了,但是內(nèi)容的真實性、邏輯性、完整性、正確性還不達標,在很多領(lǐng)域沒有辦法用它去做一些工作。

現(xiàn)在大語言模型達到了一定程度,但是并不代表在應(yīng)用上真的爆發(fā)了。等到應(yīng)用爆發(fā)的時候,它需要的計算量那又是比現(xiàn)在大非常多,很多行業(yè)都可以受益于此。

比如計算機視覺可以了,自然語言也可以,理解和邏輯推理方面也可以了,能夠在很多行業(yè)催生出新的應(yīng)用。這個時候,不管是云端也好,邊緣計算也好,都需要更多數(shù)量和種類的處理器、內(nèi)存等等。

這也是為什么英特爾一直說,半導(dǎo)體的好日子還在后面,還要繼續(xù)推動摩爾定律的發(fā)展。萬億晶體管的時代是一定會到來的,否則真的支撐不了未來需要把AI、虛擬現(xiàn)實、元宇宙這些都整合在一起的數(shù)字化時代。

《深網(wǎng)》:大語言模型預(yù)計什么時候會在應(yīng)用上真正爆發(fā)?

宋繼強:兩三年左右就可以知道,現(xiàn)在這一波大模型能夠在哪些領(lǐng)域發(fā)揮比較大的用處,并且我們也應(yīng)該能夠知道大模型后面下一波的增長點,以及技術(shù)方面的提升會在哪些領(lǐng)域。

一般來講,早期這種火熱的狀態(tài)通常不超過兩年。因為第一批沖進去瘋狂燒錢的也就是燒個一年半到兩年就燒完了。那個時候相對實際的應(yīng)用以及架構(gòu)的優(yōu)化,也開始做出來東西了。

這一波大模型會帶來很大的轉(zhuǎn)折點,因為它是基于語言的,而我們這個世界上各種各樣的應(yīng)用都可以轉(zhuǎn)換成語言、語義的表達。

現(xiàn)在唯一的挑戰(zhàn)是:準確性怎么樣?可不可以依賴它?真正商業(yè)應(yīng)用的要求是要能用在一些關(guān)鍵任務(wù)上,讓它產(chǎn)生足夠的商業(yè)價值。

我們可以預(yù)計,三到五年的發(fā)展周期后,就可以看到大模型能夠催生出什么樣的嶄新應(yīng)用。

《深網(wǎng)》:現(xiàn)在半導(dǎo)體未來的發(fā)展趨勢是不是已經(jīng)很明確了?

宋繼強:我們就是兩條路線:一方面繼續(xù)推動摩爾定律,把晶體管做得更小,讓單位面積上能有更多更高效的晶體管。

英特爾的愿景是到2030年,單一設(shè)備里面有一萬億個晶體管,現(xiàn)在是1200億到1300億,還有8倍,要繼續(xù)按照摩爾定律的速度去翻番。

另一方面,需要更多種類的硬件集成在一起,以異構(gòu)的方式,甚至是以芯粒(Chiplet)互相整合的方式放在一起。

不可能所有的計算部件都用最先進的制程節(jié)點去做,那樣太貴了,不符合性價比。半導(dǎo)體行業(yè)是非常尊重經(jīng)濟規(guī)律的,你做得太貴了,大家就用不起來,所以它一定會選擇一個在能效比、性價比上合適的方案。

未來異構(gòu)計算肯定是針對很多不同的領(lǐng)域有專門的、定制性的加速器出現(xiàn)。未來CPU加一些定制的加速部件,會是一個很正常的組合模式。

“不同的元宇宙用不同的數(shù)字人”

《深網(wǎng)》:英特爾中國研究院一直在研究數(shù)字人,在你看來,未來數(shù)字人與人類的關(guān)系是怎樣的?

宋繼強:大部分時間里,數(shù)字人可以由AI驅(qū)動完成工作,甚至跟人去做交互、對接,也可以隨時切換成由真人驅(qū)動。這有點像我們做自動駕駛分級(自動駕駛分為5級),在前面的1、2級,AI只是一個輔助驅(qū)動,人要替數(shù)字人做所有決策。但到了3、4、5級,可以逐漸讓AI驅(qū)動數(shù)字人主動做事,人只在需要的時候介入。

比方說4、5級的數(shù)字人,可以處理80%-90%的日常事務(wù)。特別是我們未來都要去數(shù)字世界里工作,大部分的時候,我們的數(shù)字人替身可以幫我們?nèi)ジ珊芏嗍?,到了真正需要人類動用他的知識、腦力、關(guān)系去處理的時候,才由真人來驅(qū)動數(shù)字人。

《深網(wǎng)》:數(shù)字人相當于人類的數(shù)字分身?這是為元宇宙做準備嗎?

宋繼強:元宇宙里一定需要數(shù)字人,相信未來會有多個元宇宙,我們會在不同的元宇宙用不同的數(shù)字人。

現(xiàn)在我們能看到醫(yī)療場景里有很多相對流程化的事情,比如說初步的問診、記錄和分診,這些數(shù)據(jù)人就可以在它的知識范圍內(nèi)搞定,來大幅度減輕醫(yī)生的負擔。到病人做完檢查要詢問病情的時候,真人醫(yī)生上陣。

《深網(wǎng)》:如何理解大模型、數(shù)字人、機器人間的關(guān)系?

宋繼強:數(shù)字人可以成為機器人的大腦,當數(shù)字人交互中涉及自然語言對答等情況時,大模型可以讓數(shù)字人看起來更真實,減少錯誤的發(fā)生。但數(shù)字人除此之外還有一整套技術(shù),比如說表情、手勢的展現(xiàn)能力等等,這些和大模型沒有什么關(guān)系。機器人的智能也比數(shù)字人更復(fù)雜。

《深網(wǎng)》:4、5級別的數(shù)字人大概什么時候能實現(xiàn)?

宋繼強:如果我們僅限于語言、表情、手勢這方面的交互,很可能在三五年內(nèi)就可以取得一個很好的成果。我們現(xiàn)在正在研究一些高保真、高精度的數(shù)字人,從外觀上來看已經(jīng)算是可以接受了,現(xiàn)在差的是探索數(shù)字人可以在哪些領(lǐng)域內(nèi)提供服務(wù)。目前遠程醫(yī)療是有相關(guān)需求的,很多醫(yī)生都認為數(shù)字人很有用、很方便。

“把握好中國市場的新機遇”

《深網(wǎng)》:最近業(yè)界普遍認為,英特爾對決英偉達的關(guān)鍵在中國市場。你認同這個觀點嗎?

宋繼強:不光英特爾,其他在中國有相對重量級業(yè)務(wù)的公司,都要努力抓住中國市場新展現(xiàn)出來的機遇。

對英特爾而言,一方面,比較重要的筆記本、臺式機、服務(wù)器市場,都要把握好中國市場恢復(fù)的機遇。另一方面,中國有好幾個新增領(lǐng)域在全球都是相對領(lǐng)先的。第一個就是5G,中國的5G基站的部署是全球發(fā)展最快,總量占比最大的,現(xiàn)在路都修好了,后邊就是推各種各樣的落地應(yīng)用,這些都是新的機會。

還有,“東數(shù)西算”這么大規(guī)模的國家級的戰(zhàn)略,是全球任何地方都沒有的,這是一個真正算力網(wǎng)級別的基礎(chǔ)設(shè)施建設(shè),也是一個很大的“計算+網(wǎng)絡(luò)+存儲”的機會。還有電動車以及后續(xù)的車內(nèi)娛樂體驗,自動駕駛,車路協(xié)同等等,都是新增的市場機遇。

目前我們講到的這些機遇在其他國家都沒有辦法復(fù)制,這跟中國的標準化建設(shè),還有中國電動車產(chǎn)業(yè)的一枝獨秀相關(guān)。

中國的電動車產(chǎn)業(yè)已經(jīng)達到了可以快速推動智能化改造的水平,包括基于5G、V2X做車路協(xié)同,都在開始做標準化,推動試點,我們看到有些城市已經(jīng)在搶先試點了,北京就是其中走得比較快的一個。

這些機會對于半導(dǎo)體行業(yè)來講非常重要,因為里面每一個功能都需要新的芯片。

英特爾CEO帕特·基辛格提到的五大超級技術(shù)力量,其中之一就是AI,它是一種新的技術(shù)生產(chǎn)力。但不能忽視的是,除了AI之外還有很多其他東西,比如無所不在的計算、無處不在的連接、從云到邊緣的基礎(chǔ)設(shè)施,以及傳感和感知。

編輯/lambor

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3