首頁 生活 > 正文

我們對(duì)AI大模型的誤解有多深?|天天信息

大模型可以無所不能嗎?怎樣讓模型少犯錯(cuò)?企業(yè)應(yīng)該部署多大的模型,一個(gè)超級(jí)大模型還是一堆專業(yè)模型?


(資料圖片僅供參考)

對(duì)于這些問題,第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉認(rèn)為:類GPT模型是高級(jí)復(fù)讀機(jī),有多少“人工”就有多少“智能”,絕非無所不能。模型100%會(huì)犯錯(cuò),一味地追求算力和數(shù)據(jù)并不能解決這個(gè)問題,因此模型之上必須要有運(yùn)營(yíng)兜底機(jī)制,知錯(cuò)就改。算力決定參數(shù)規(guī)模,一堆專業(yè)模型比一個(gè)超級(jí)大模型更有落地可行性。

上述觀點(diǎn)源于6月10日新金融聯(lián)盟舉辦的“金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型與大模型技術(shù)應(yīng)用”內(nèi)部研討會(huì)。會(huì)上,新金融聯(lián)盟學(xué)術(shù)理事、工商銀行首席技術(shù)官呂仲濤,民生銀行數(shù)據(jù)管理部總經(jīng)理沈志勇、平安銀行數(shù)字資產(chǎn)管理與研發(fā)中心總經(jīng)理劉錦淼也做了主題發(fā)言。新金融聯(lián)盟理事長(zhǎng)、中國(guó)銀行原行長(zhǎng)李禮輝及中國(guó)信通院金融科技研究中心副主任趙小飛進(jìn)行了點(diǎn)評(píng)交流。

56家銀行及非銀機(jī)構(gòu)、55家科技公司的170多位嘉賓通過線上線下參會(huì)。會(huì)議由新金融聯(lián)盟秘書長(zhǎng)吳雨珊主持,中國(guó)金融四十人論壇提供學(xué)術(shù)支持。會(huì)議實(shí)錄詳見→《如何釋放大模型對(duì)金融行業(yè)的價(jià)值?以下為胡時(shí)偉的發(fā)言全文,已經(jīng)本人審核。

企業(yè)大模型落地的幾個(gè)關(guān)鍵問題

文 | 胡時(shí)偉

大模型并非“無所不能”

現(xiàn)在各行各業(yè)都十分關(guān)注大模型這一話題。第四范式在自己的大模型產(chǎn)品“式說”2月份發(fā)布以來,與17個(gè)行業(yè)的114家企業(yè)進(jìn)行了密集與深入的溝通,發(fā)現(xiàn)業(yè)界普遍對(duì)大模型存在一些誤解,需要糾偏。

第一,要相信科學(xué)。大家普遍認(rèn)為大模型已經(jīng)具備“涌現(xiàn)”能力,可以無師自通。大模型的能力主要還是源于給它提供了什么樣的數(shù)據(jù),并不是直接“涌現(xiàn)”出來的。本質(zhì)上講,類GPT模型的背后還是機(jī)器學(xué)習(xí),需要高質(zhì)量的數(shù)據(jù)訓(xùn)練而來,并通過Fine-tuning(微調(diào))進(jìn)行調(diào)優(yōu)才能實(shí)現(xiàn)一些特定的能力。

第二,有多少人工,就有多少智能。生成式AI到底能解決什么問題?通俗地講,從基礎(chǔ)大模型到行業(yè)大模型甚至到場(chǎng)景定制,我們目前認(rèn)為它可以用以完成一份文檔。在一個(gè)特定場(chǎng)景下正確地完成一個(gè)文檔,一定來自于人反饋的數(shù)據(jù)。就像GPT要用到非常多維基百科的數(shù)據(jù),是因?yàn)樵摂?shù)據(jù)質(zhì)量更高。我們行業(yè)要做的是,一定要對(duì)大模型形成反饋閉環(huán)和迭代,即告訴大模型什么是好的,訓(xùn)練它達(dá)到更好的效果。這件事情本質(zhì)還是依賴人工。

第三,大模型生成一定會(huì)出錯(cuò)。哪怕是GPT-4,在行業(yè)專業(yè)、嚴(yán)肅場(chǎng)景的應(yīng)用也遠(yuǎn)未達(dá)到工業(yè)可用的效果。這是技術(shù)本身的缺陷所致,靠算力和數(shù)據(jù)也無法從根本上解決這個(gè)問題。目前大部分企業(yè)的共識(shí)是模型之上必須加一層運(yùn)營(yíng)機(jī)制來兜底。

企業(yè)應(yīng)該部署多大的模型?

企業(yè)在大模型落地過程中會(huì)面臨一個(gè)現(xiàn)實(shí)問題——預(yù)算有限,預(yù)算決定了算力,算力決定了參數(shù)規(guī)模。

因此,我們需要抉擇:應(yīng)該部署一個(gè)超級(jí)大模型,期待它能夠把能力上升到一定程度,還是應(yīng)該從解決問題出發(fā),部署一堆專業(yè)模型,讓它們各司其職。這里面涉及兩個(gè)不同的思路。

第一個(gè)思路是通過增加參數(shù)和堆砌算力,把所有參數(shù)都給NLP模型。但從實(shí)際落地的角度來看,根據(jù)No Free Lunch(沒有免費(fèi)的午餐)定理,沒有哪一個(gè)模型能以最優(yōu)的方式解決所有問題。如果我們把所有的東西都放在一個(gè)模型里,最后會(huì)花出極大的代價(jià),超級(jí)英雄成本很高,也很難管理。

因此,我個(gè)人認(rèn)為會(huì)走向另外一個(gè)方向,即Learnware(學(xué)件)的思路,我們要做一堆參數(shù)過億的專業(yè)模型,來組成整體企業(yè)系統(tǒng),這種方式更利于模型迭代、維護(hù),同時(shí)更利于控制成本。就如同一家公司里不能都是董秘,還得有銷售、產(chǎn)研、市場(chǎng)等各個(gè)專業(yè)線。

大模型可實(shí)現(xiàn)傳統(tǒng)軟件兩大升級(jí)

“介質(zhì)”同樣是企業(yè)落地大模型的關(guān)鍵要素。

想象一下,如果沒有APP,推薦算法 能用嗎? 沒有搜索,廣告算法能用嗎?APP和搜索就是推薦算法和廣告算法的介質(zhì)。同樣, 大模型在企業(yè)落地時(shí),企業(yè)軟件就是大模型的介質(zhì)。如果介質(zhì)沒有革新,只有算法革新,就像是一個(gè)人只有腦沒有手。

因此,我們非常需要關(guān)注介質(zhì)層面的革新。企業(yè)中大部分工作的完成都需要使用軟件,但是大量軟件交互的方式都非常低效、復(fù)雜,現(xiàn)在我們可基于大模型解決兩個(gè)升級(jí):

第一,由生成式大模型負(fù)責(zé)軟件界面的升級(jí)。人機(jī)交互要變成多模態(tài),通過大模型更強(qiáng)的語義理解能力,可以更直接調(diào)用企業(yè)內(nèi)部各種形式的信息、數(shù)據(jù)和模型。

第二,由判別式大模型負(fù)責(zé)軟件內(nèi)核的升級(jí)。以前的軟件主要圍繞數(shù)據(jù)庫做增刪 改查,現(xiàn)在可由判別式大模型對(duì)軟件進(jìn)行智能化升級(jí)。

讓大模型成為知錯(cuò)就改的小助手

由于GPT在技術(shù)上存在局限性,因而無法做到百分之百準(zhǔn)確,尤其在應(yīng)用于嚴(yán)肅的金融場(chǎng)景時(shí),大模型之上必須要加一層運(yùn)營(yíng)體系兜底,讓模型的輸出和操作從不可用變成可用,并且能做到知錯(cuò)就改。

知錯(cuò)就改有三個(gè)機(jī)制疊加保障:一是專家給答案。雖然聽起來不是那么智能,但在專家能給答案的地方一定要給答案,因?yàn)檫@個(gè)是最準(zhǔn)確的。二是專家給示例,模型進(jìn)行一定的上下文學(xué)習(xí)也可以表現(xiàn)更好。三是模型自主學(xué)習(xí),基于專家生成的知識(shí)反饋給模型,讓模型少犯錯(cuò)。

生成式大模型加上“執(zhí)行可控、知錯(cuò)能改”的運(yùn)營(yíng)體系,我們可以期待有一位善于理解、準(zhǔn)確執(zhí)行的工作助手。這位助手需要讓用戶可以清晰了解哪些內(nèi)容是“100%準(zhǔn)確”,哪些是“不確定的”,并且知錯(cuò)能改。

總體來說,底層大模型不能解決所有問題,介質(zhì)層及運(yùn)營(yíng)機(jī)制的革新對(duì)于數(shù)字化推動(dòng)作用同樣重要。企業(yè)需重新打造決策類AI、生成式AI、應(yīng)用層、介質(zhì)層。我們目前探索落地的重點(diǎn)是讓生成式大模型結(jié)合介質(zhì),圍繞企業(yè)數(shù)字化轉(zhuǎn)型的目標(biāo),在企業(yè)里生成一堆Agent,分別用以查資料、查數(shù)據(jù)、準(zhǔn)確操作軟件等,這可能是當(dāng)下一個(gè)更加貼合實(shí)際、可落地的方向。

本文源自:新金融聯(lián)盟NFA

作者: 胡時(shí)偉

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3