大模型扎堆「趕考」,語文還是國產(chǎn)AI行,文言文能力超過95%考生_環(huán)球訊息
魚羊 蕭簫 發(fā)自 凹非寺
【資料圖】
量子位 | 公眾號(hào) QbitAI
ChatGPT誕生后的第一場全國高考,考生忙,大模型們也很忙。
這不,高考還沒結(jié)束,AI挑戰(zhàn)高考題就成了刷屏熱搜話題,各家大模型都被拉出來寫起了高考作文,甚至是參與整場考試。
(不知是不是巧合,Bard還在下午數(shù)學(xué)高考后,緊急升級(jí)了一波數(shù)學(xué)推理能力……)
結(jié)果,竟然有大模型寫的作文,把資深高中老師都騙過了!
就在考試當(dāng)天,百度搜索正在內(nèi)測的“AI伙伴”,現(xiàn)場直播挑戰(zhàn)了一套語文試題。
從“基礎(chǔ)題”文言文翻譯、閱讀填空、古詩詞賞析,到“拉分題”微寫作和作文,AI伙伴全部上手做了一遍。
結(jié)果,當(dāng)9份“混進(jìn)”了AI伙伴作品的高考作文送到語文老師莊臨旭手上時(shí),他完全沒發(fā)現(xiàn)有篇是AI寫的:
我是真沒想到,AI還能寫文言文作文。
緊接著,AI伙伴展現(xiàn)的文言文理解能力,更是把資深老師嚇了一跳:
憑借我的教學(xué)經(jīng)驗(yàn)來看,超過95%的同學(xué)沒問題。
一整場直播下來,就連圍觀了AI伙伴考試全程的畢導(dǎo)都感慨:
再來一次高考語文,我可能考不過它……
所以,集成了百度語義檢索技術(shù)+大模型能力于一身的AI伙伴,整場考試表現(xiàn)具體如何?
咱們一項(xiàng)一項(xiàng)展開來看。
“AI考生”現(xiàn)場挑戰(zhàn)語文高考
先來看看大模型的“基礎(chǔ)題”——古詩詞賞析。
面對(duì)情感和寫法的“找不同”問題,百度搜索AI伙伴胸有成竹,不僅給出了明確的修辭手法,還進(jìn)一步分析了古詩的來歷和情感,屬實(shí)是閱讀理解十分到位了:
再到閱讀填空。面對(duì)文章解讀和“續(xù)寫句子”能力,AI伙伴同樣毫不遜色:
那么,來看看大模型的“拉分題”寫微作文,依舊沒什么問題!
要是小作文體現(xiàn)不出來,再來看看AI伙伴作詩的能力。不僅現(xiàn)代詩手到擒來,甚至連藏頭詩都能搞定:
不過,要是再仔細(xì)一點(diǎn)搞搞提示詞工程,AI伙伴似乎就答得更好了。
以高考語文題目中的古詩詞理解為例,這里我們先在不給提示詞的情況下,把題目原樣“喂”給AI伙伴:
AI伙伴給出來的答案雖然也不錯(cuò),但對(duì)于高考題目來說,這答案著實(shí)有億點(diǎn)長,也有點(diǎn)太仔細(xì)了:
接下來,給AI伙伴換上強(qiáng)調(diào)“最重要的三個(gè)意象”的提示詞。
果然,AI給出了更精準(zhǔn)的回答,指出包括病柏、丹鳳和鴟鸮在內(nèi)的三個(gè)意象,是最關(guān)鍵的:
但是,上述都還只是直播中展現(xiàn)出來的效果。像AI伙伴這類有大模型加持的功能,其使用效果是否真的和提示詞工程強(qiáng)相關(guān)?
為了測測AI伙伴的“真正實(shí)力”,我們親自上手測了測它做高考題的效果。
直播中已經(jīng)做過了全國甲卷的作文題目,那么我們?cè)賮碓囋嚱衲晟虾>淼淖魑摹?/p>
第一輪,我們直接把題目甩過去:
看起來,AI伙伴雖然理解了文章“主旨”,但寫出來還差點(diǎn)意思:論點(diǎn)不夠明確,作文的結(jié)構(gòu)也不太清晰。
第二輪,我們?cè)囍鴵Q了一下提示詞,給AI伙伴設(shè)置一個(gè)“角色扮演”效果。
首先,強(qiáng)調(diào)它是一名高考考生,然后給它“灌輸”一些高考作文的寫作技巧:
這一輪,AI伙伴寫得就有高考作文內(nèi)味了。
不僅給出了10字以內(nèi)的標(biāo)題,還按照總分總、夾敘夾議的方式,很好地寫出了一篇議論文:
看起來,挖掘大模型的潛力,很大程度上確實(shí)要依靠提示詞工程。
在直播中,百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽還給我們列舉了一個(gè)非常簡潔的提示詞公式:
提示詞 = 任務(wù) + 角色 + 上下文背景 + 細(xì)節(jié)補(bǔ)充。
有了它,不用再擔(dān)心大模型輸出和設(shè)想無關(guān)的答案了。
當(dāng)然,作為百度“用大模型重塑搜索能力”的終極殺器,AI伙伴能實(shí)現(xiàn)的功能,也遠(yuǎn)不止是做做高考題而已。
最早在2023萬象·百度移動(dòng)生態(tài)大會(huì)上官宣發(fā)布的AI伙伴,目前已經(jīng)開啟內(nèi)測,獲得試用資格后,可以直接從百度搜索界面進(jìn)入:
它的本職工作,更像是一個(gè)搜索引擎端的全能AI助理,不僅具有智能搜索能力,還兼具創(chuàng)作生成技藝:
一方面,AI伙伴相當(dāng)于一個(gè)對(duì)話版智能搜索工具。用它查資料,不需要再按關(guān)鍵詞搜索,直接“用人話”提問就行:
不僅如此,每一句回答都有理有據(jù),如果想要“追根溯源”,直接點(diǎn)鏈接就能跳轉(zhuǎn)到對(duì)應(yīng)的網(wǎng)站:
這樣一來,就不用擔(dān)心它會(huì)出現(xiàn)像ChatGPT整理文件那樣,出現(xiàn)“無中生有”一些案件的操作了。
另一方面,它又相當(dāng)于一個(gè)多模態(tài)大模型創(chuàng)作助手。
不僅可以幫助查資料、寫周報(bào)、畫頭像,還能陪你模擬面試、甚至替你約會(huì)(?)。
這里我們借助AI伙伴的“程序猿小助手”,來試試生成一段代碼的能力。
以面試可能會(huì)考到的冒泡排序算法為例。
很快啊,幾乎沒有怎么思考,AI伙伴就給出了一段帶注釋的冒泡排序算法,最關(guān)鍵的是,它自己已經(jīng)運(yùn)行過,并成功輸出了一段結(jié)果!
這意味著我們不需要再自己去跑一遍這段代碼,而是能直接將它交給面試官了(doge)
從上面這些展現(xiàn)的能力來看,AI伙伴所能做到的,遠(yuǎn)非僅僅提供高考試題“參考答案”而已。
這次選擇用它挑戰(zhàn)高考題,大家伙可能看的是個(gè)新鮮勁兒,但“術(shù)”的表象之外,更值得關(guān)注的是“道”的變化:
使得AI伙伴能在高考題面前依舊“神采飛揚(yáng)”的大模型技術(shù),正在以搜索引擎的代際變革為基點(diǎn),席卷各行各業(yè),甚至改變每個(gè)人的工作方式。
正如ChatGPT攪動(dòng)風(fēng)云之初,微軟CEO納德拉預(yù)測的那般:搜索正面臨巨變。
并且變化的不僅僅是搜索的技術(shù)、產(chǎn)品本身,這一次,更與每一個(gè)個(gè)體有了更緊密的關(guān)聯(lián)。
搜索三變
百度CEO李彥宏同樣認(rèn)為,“大模型即將改變世界”?;谶@樣的判斷,李彥宏2023年一季度OKR,便指向了“引領(lǐng)搜索體驗(yàn)的代際變革”。
現(xiàn)在,三個(gè)月過去,大模型究竟如何變革搜索,現(xiàn)在答案已經(jīng)越來越清晰。
從技術(shù)的角度出發(fā),大語言模型的爆發(fā),正在重新定義人機(jī)交互。
對(duì)于人類而言,最自然的交流方式就是語言溝通。而大模型的代際突破,最直觀的一點(diǎn)體現(xiàn),就是機(jī)器自然語言聆聽和表達(dá)能力的飛速提升。
△回答來自百度搜索AI伙伴
搜索本身,就是一種人機(jī)交互的核心方式。其本質(zhì)的技術(shù)追求,就是要讓機(jī)器更高效地理解、推理、表達(dá),化復(fù)雜問題為直觀的第一條搜索結(jié)果。
因此可以說,大語言模型的突破,正在全面激發(fā)搜索全新的潛能。
值得關(guān)注的一點(diǎn)是,伴隨著AI的發(fā)展,搜索始終都是最前沿AI技術(shù)最先落地的場景。
以百度搜索為例,圍繞“降低用戶表達(dá)需求門檻”、“降低用戶獲取內(nèi)容和服務(wù)的門檻”、“豐富搜索引擎的內(nèi)容供給”這三個(gè)目標(biāo),百度搜索一直在AI技術(shù)上大量投入。
引入大模型之前,百度搜索已經(jīng)實(shí)現(xiàn):
千億級(jí)全網(wǎng)索引;
全球領(lǐng)先的深度語義理解技術(shù),相關(guān)成果曾獲2020年國家技術(shù)發(fā)明獎(jiǎng)二等獎(jiǎng);
最大中文知識(shí)圖譜,覆蓋50億實(shí)體。
從產(chǎn)品的角度看,過去三個(gè)月,數(shù)據(jù)已經(jīng)證明,對(duì)話式搜索正在成為搜索引擎市場的一個(gè)新變量。
百度集團(tuán)副總裁、搜索平臺(tái)負(fù)責(zé)人肖陽就透露,大模型加持下的AI伙伴,在內(nèi)測階段就已爆火,相關(guān)搜索問答量激增。
這進(jìn)一步佐證大模型帶來的新人機(jī)交互方式,更能滿足人們對(duì)搜索“快速”、“有效”的訴求。
牽一發(fā)而動(dòng)全身,在現(xiàn)在這個(gè)時(shí)間節(jié)點(diǎn),圍繞搜索的內(nèi)容生產(chǎn)和創(chuàng)作領(lǐng)域,創(chuàng)新模式也開始逐漸顯現(xiàn),并被積極地探索實(shí)踐。
同樣是在萬象大會(huì)上,百度搜索還配合AI伙伴,推出了AI BOT解決方案。目的就是向內(nèi)容、服務(wù)生產(chǎn)者釋放大語言模型和AI技術(shù)能力,降低其與新搜索模式融合的門檻。
具體來說,百度搜索提供了創(chuàng)作者、商家、機(jī)構(gòu)、服務(wù)和品牌等各類型的AI BOT,讓他們能夠利用自身優(yōu)勢和獨(dú)特的內(nèi)容、知識(shí)、服務(wù),創(chuàng)造虛擬分身,直接回答用戶的問題。
在技術(shù)和產(chǎn)品之外,更與每個(gè)人息息相關(guān)的,是用戶搜索方式的改變。
正如前文所展示的,大模型時(shí)代,“提問題”的能力正在變得越來越關(guān)鍵。
體現(xiàn)在現(xiàn)階段,就是提示詞寫得好不好,會(huì)直接影響搜索生成結(jié)果的質(zhì)量。是否掌握提示詞工程能力,就像互聯(lián)網(wǎng)時(shí)代開啟時(shí),是否掌握搜索能力一樣關(guān)鍵。
對(duì)此,肖陽提到了“搜商”的概念:
未來不僅要卷智商、情商,還要卷“搜商”。
更好地使用提示詞,更好地使用AI伙伴,獲得的優(yōu)勢會(huì)越來越大。
也就是說,找到合適提示詞的能力越強(qiáng),越能在大模型落地應(yīng)用的時(shí)代里,充分利用大模型的強(qiáng)大生產(chǎn)力。
可以說,大模型刮起的時(shí)代風(fēng)暴之下,搜索三變,既是內(nèi)在技術(shù)瓶頸的代際突破,亦是外在人類接觸信息方式的徹底變革。
無怪乎肖陽作為技術(shù)變革的一線親歷者,會(huì)有這樣的判斷:
語義檢索技術(shù)與大語言模型結(jié)合,促進(jìn)搜索的理解、推理、組織和創(chuàng)作潛能進(jìn)一步釋放,有望在多方面催生顛覆式創(chuàng)新,促成搜索奇點(diǎn)降臨。
并且這一次,或許每一個(gè)人都會(huì)真真切切感受到這種代際變革帶來的影響。
One More Thing
說起來,就在高考這兩天,AI加持下的百度搜索,忙的還不止有刷題這件事兒。
每年此時(shí),百度都會(huì)啟動(dòng)專門的高考服務(wù),通過搜索和AI核心技術(shù),為考生和家長提供便利。
今年,百度還基于AI技術(shù),首次推出了高考搜索指數(shù),涵蓋專業(yè)搜索熱度及變化趨勢、“院校PK”等信息??忌议L在擇校選專業(yè)的時(shí)候,可以更方面地參考對(duì)比。
AI志愿助手也進(jìn)行了重大升級(jí),能更直觀地展示志愿預(yù)測結(jié)果,提供相關(guān)數(shù)據(jù)來輔助考生家長做決策。
對(duì)了,利用高考搜索指數(shù)和其他高考相關(guān)搜索數(shù)據(jù),百度還聯(lián)合中國教育在線掌上高考發(fā)布了不少有意思的數(shù)據(jù):
高校方面,搜索熱度最高的本科院校里,南方高校霸榜雙一流和非雙一流大學(xué)前十。
??圃盒V?,山東是搜索職業(yè)教育最多的省份。
專業(yè)方面,醫(yī)學(xué)搜索熱度斷層第一,航空航天熱度攀升最快。
而最有“錢”景的,是船舶電子電氣工程……
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
機(jī)票里面包含保險(xiǎn)嗎?飛機(jī)保險(xiǎn)有必要買嗎?
遼寧擴(kuò)大緩繳社保費(fèi)政策實(shí)施范圍 補(bǔ)繳期間免收滯納金
更多
- 每日關(guān)注!迪進(jìn)國際為SkyCloud引入創(chuàng)新功能,以增強(qiáng)工業(yè)監(jiān)控解決方案
- Kioxia開始運(yùn)營兩個(gè)新的研發(fā)機(jī)構(gòu)
- 僅使用一個(gè)電感即可設(shè)計(jì)出更緊湊的電源
- e絡(luò)盟開售來自意法半導(dǎo)體和伍爾特電子的1kW高效模擬無橋PFC
- 米爾新品!國產(chǎn)高安全性車規(guī)級(jí)平臺(tái),芯馳D9多核Cortex-A55核心板
- 運(yùn)用升降壓充電芯片IU5180實(shí)現(xiàn)Type-c給1-4節(jié)鋰電池快速充電_焦點(diǎn)
- 引領(lǐng)邊緣計(jì)算創(chuàng)新,英特爾正式發(fā)布公測版“英特爾? Develop...
- 浪潮信息發(fā)布G7系列SAP HANA一體機(jī),挑戰(zhàn)內(nèi)存計(jì)算極限性能_...
更多
- 全球快資訊丨《大空頭》原型:硅谷銀行危機(jī)或許很快就能解除
- 當(dāng)前熱訊:蕪湖宜居投資20億元小公募債券狀態(tài)更新為“已反饋”
- Kaiko:3月份Coinbase的市場深度腰斬,幣安下降13%
- 環(huán)球快資訊:汪濤:2月信貸增速再超預(yù)期
- 世界今日?qǐng)?bào)丨武漢地鐵發(fā)行10億元公司債 票面利率3.38%
- 利率下調(diào)仍受熱捧 年內(nèi)首批儲(chǔ)蓄國債開售即告罄
- 全球滾動(dòng):北京城建集團(tuán)10億短期融資券即將兌付 利率1.76%
- 全球即時(shí):美的置業(yè)9.84億公司債將付年息 票面利率4.20%
排行
- 曹文軒的作品有哪些主人公是誰 曹文軒的作品有哪些
- 兩部門印發(fā)辦法明確 消防員面向社會(huì)公開招錄
- 低價(jià)出售410萬旅客信息?12306回應(yīng):為第三方泄漏
- 2019年這些新規(guī)將落地 又一次普惠“加薪”
- 北京8家醫(yī)院試點(diǎn)將推錯(cuò)峰就診 率先開展“治堵”
- 數(shù)字化的城商行們?cè)趺礃恿???shù)字化轉(zhuǎn)型背后的故事
- 四川省稅務(wù)系統(tǒng)將推出10大類舉措服務(wù)納稅人、繳費(fèi)人
- 長三角禁限塑新規(guī)實(shí)施尚存3個(gè)堵點(diǎn) 仍需多方合力推進(jìn)
- 中國鐵建高溢價(jià)溫州奪地 去年毛利率低于行業(yè)約10個(gè)百分點(diǎn)
- 推行郵件快件包裝“綠色革命” 從根源上解決問題
最近更新
- 大模型扎堆「趕考」,語文還是國產(chǎn)AI行,文言文能力超過95%考...
- 王傳福最新判斷!新能源車行業(yè)供大于求
- 冀光恒將全面負(fù)責(zé)平安銀行各條線業(yè)務(wù) 包括零售條線
- 廣州浪奇發(fā)布重大資產(chǎn)置換方案 將轉(zhuǎn)型為食品及園區(qū)運(yùn)營雙主...
- 榮盛發(fā)展:擬收購榮盛盟固利76.44%股權(quán)
- 2300多人涉刑事,啥罪?
- 天天百事通!郵儲(chǔ)銀行:副行長牛新莊任職資格獲批
- 廣汽將搭載中興通訊車規(guī)級(jí) 5G 模組,首款車型預(yù)計(jì) 2024 年量產(chǎn)
- ChatGPT設(shè)計(jì)出首個(gè)機(jī)器人_每日熱訊
- OpenAI面臨一項(xiàng)誹謗訴訟
- 環(huán)球速讀:理想ONE已在全國范圍內(nèi)正式售罄 官方網(wǎng)站也無法訂購
- 東風(fēng)集團(tuán)股份:今年1-5月累計(jì)汽車銷量為766365輛
- 【視頻】直擊富順高考現(xiàn)場!來看看這些讓人動(dòng)容的真實(shí)畫面…...
- 湖北棗陽:愛心助考 圓夢起航|環(huán)球今日訊
- 最新消息:定了!本周六!_全球微頭條
- 全球微動(dòng)態(tài)丨黃桃已上市,就在東西湖
- 湖北交投運(yùn)營集團(tuán)舉辦“楚道杯”安全技能比武_環(huán)球時(shí)訊
- 每日速看!五社聯(lián)動(dòng)情滿青山,共同繪就幸福古鎮(zhèn)
- 微速訊:Enclustra瑞蘇盈科FPGA核心板在無線電視系統(tǒng)中的應(yīng)用
- 去年年報(bào)至今未披露,交大昂立高管稱公司不會(huì)退市 全球速看
- 臨投產(chǎn)熱點(diǎn)項(xiàng)目被轉(zhuǎn)讓會(huì)通股份信披豈能敷衍了事 全球熱點(diǎn)評(píng)
- 熱點(diǎn)在線丨長春高新股價(jià)再遭傳言暴擊 及時(shí)準(zhǔn)確信披是破局良策
- 【世界報(bào)資訊】一汽解放:5月中重卡銷量同比增長137.9% 保持...
- 一家基金公司三天內(nèi)兩只FOF募集失敗 年內(nèi)已有5只 反向指標(biāo)...
- 世界動(dòng)態(tài):招商添福1年定開債基分紅
- 人大代表進(jìn)社區(qū) 崗位送到家門口 最資訊
- 【護(hù)航高考 交警同行|交警正能量】考生腳扭傷 交警護(hù)送其進(jìn)考場
- 環(huán)球即時(shí)看!【文明守法 平安回家】“三夏”搶收忙 交警說安全
- 千陽縣氣象臺(tái)發(fā)布雷電黃色預(yù)警【Ⅲ級(jí)/較重】【2023-06-08】
- 發(fā)涉臺(tái)不當(dāng)言論,香港這個(gè)主持人被換掉了!-世界今日訊
今日要聞
- 天天百事通!郵儲(chǔ)銀行:副行長牛新莊任職資格獲批
- 大模型扎堆「趕考」,語文還是國產(chǎn)AI行,文言文能力超過95%考生_環(huán)球訊息
- 微速訊:Enclustra瑞蘇盈科FPGA核心板在無線電視系統(tǒng)中的應(yīng)用
- 【視頻】直擊富順高考現(xiàn)場!來看看這些讓人動(dòng)容的真實(shí)畫面……_全球速訊
- 世界動(dòng)態(tài):招商添福1年定開債基分紅
- 續(xù)航超1200公里,4.9秒破百,定價(jià)超30萬,魏牌藍(lán)山是智商稅嗎?|環(huán)球動(dòng)態(tài)
- 曹文軒的作品有哪些主人公是誰 曹文軒的作品有哪些
- 【環(huán)球時(shí)快訊】能源沖擊終使歐元區(qū)陷技術(shù)性衰退 但最艱難時(shí)刻可能已過
- 當(dāng)前視訊!近日上海養(yǎng)老金上調(diào)方案公布了嗎?養(yǎng)老金4500的人漲200元很容易嗎?
- 親子京劇《大鬧天宮》將亮相天通苑文化藝術(shù)中心中新社北京分社-全球熱文