我們對(duì)AI大模型的誤解有多深？|天天信息

2023-06-22 00:07:08 來源: 金融界

大模型可以無所不能嗎？怎樣讓模型少犯錯(cuò)？企業(yè)應(yīng)該部署多大的模型，一個(gè)超級(jí)大模型還是一堆專業(yè)模型？

(資料圖片僅供參考)

對(duì)于這些問題，第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉認(rèn)為：類GPT模型是高級(jí)復(fù)讀機(jī)，有多少“人工”就有多少“智能”，絕非無所不能。模型100％會(huì)犯錯(cuò)，一味地追求算力和數(shù)據(jù)并不能解決這個(gè)問題，因此模型之上必須要有運(yùn)營(yíng)兜底機(jī)制，知錯(cuò)就改。算力決定參數(shù)規(guī)模，一堆專業(yè)模型比一個(gè)超級(jí)大模型更有落地可行性。

上述觀點(diǎn)源于6月10日新金融聯(lián)盟舉辦的“金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型與大模型技術(shù)應(yīng)用”內(nèi)部研討會(huì)。會(huì)上，新金融聯(lián)盟學(xué)術(shù)理事、工商銀行首席技術(shù)官呂仲濤，民生銀行數(shù)據(jù)管理部總經(jīng)理沈志勇、平安銀行數(shù)字資產(chǎn)管理與研發(fā)中心總經(jīng)理劉錦淼也做了主題發(fā)言。新金融聯(lián)盟理事長(zhǎng)、中國(guó)銀行原行長(zhǎng)李禮輝及中國(guó)信通院金融科技研究中心副主任趙小飛進(jìn)行了點(diǎn)評(píng)交流。

56家銀行及非銀機(jī)構(gòu)、55家科技公司的170多位嘉賓通過線上線下參會(huì)。會(huì)議由新金融聯(lián)盟秘書長(zhǎng)吳雨珊主持，中國(guó)金融四十人論壇提供學(xué)術(shù)支持。會(huì)議實(shí)錄詳見→《如何釋放大模型對(duì)金融行業(yè)的價(jià)值？》以下為胡時(shí)偉的發(fā)言全文，已經(jīng)本人審核。

企業(yè)大模型落地的幾個(gè)關(guān)鍵問題

文 | 胡時(shí)偉

大模型并非“無所不能”

現(xiàn)在各行各業(yè)都十分關(guān)注大模型這一話題。第四范式在自己的大模型產(chǎn)品“式說”2月份發(fā)布以來，與17個(gè)行業(yè)的114家企業(yè)進(jìn)行了密集與深入的溝通，發(fā)現(xiàn)業(yè)界普遍對(duì)大模型存在一些誤解，需要糾偏。

第一，要相信科學(xué)。大家普遍認(rèn)為大模型已經(jīng)具備“涌現(xiàn)”能力，可以無師自通。但大模型的能力主要還是源于給它提供了什么樣的數(shù)據(jù)，并不是直接“涌現(xiàn)”出來的。本質(zhì)上講，類GPT模型的背后還是機(jī)器學(xué)習(xí)，需要高質(zhì)量的數(shù)據(jù)訓(xùn)練而來，并通過Fine-tuning（微調(diào)）進(jìn)行調(diào)優(yōu)才能實(shí)現(xiàn)一些特定的能力。

第二，有多少人工，就有多少智能。生成式AI到底能解決什么問題？通俗地講，從基礎(chǔ)大模型到行業(yè)大模型甚至到場(chǎng)景定制，我們目前認(rèn)為它可以用以完成一份文檔。在一個(gè)特定場(chǎng)景下正確地完成一個(gè)文檔，一定來自于人反饋的數(shù)據(jù)。就像GPT要用到非常多維基百科的數(shù)據(jù)，是因?yàn)樵摂?shù)據(jù)質(zhì)量更高。我們行業(yè)要做的是，一定要對(duì)大模型形成反饋閉環(huán)和迭代，即告訴大模型什么是好的，訓(xùn)練它達(dá)到更好的效果。這件事情本質(zhì)還是依賴人工。

第三，大模型生成一定會(huì)出錯(cuò)。哪怕是GPT-4，在行業(yè)專業(yè)、嚴(yán)肅場(chǎng)景的應(yīng)用也遠(yuǎn)未達(dá)到工業(yè)可用的效果。這是技術(shù)本身的缺陷所致，靠算力和數(shù)據(jù)也無法從根本上解決這個(gè)問題。目前大部分企業(yè)的共識(shí)是模型之上必須加一層運(yùn)營(yíng)機(jī)制來兜底。

企業(yè)應(yīng)該部署多大的模型？

企業(yè)在大模型落地過程中會(huì)面臨一個(gè)現(xiàn)實(shí)問題——預(yù)算有限，預(yù)算決定了算力，算力決定了參數(shù)規(guī)模。

因此，我們需要抉擇：應(yīng)該部署一個(gè)超級(jí)大模型，期待它能夠把能力上升到一定程度，還是應(yīng)該從解決問題出發(fā)，部署一堆專業(yè)模型，讓它們各司其職。這里面涉及兩個(gè)不同的思路。

第一個(gè)思路是通過增加參數(shù)和堆砌算力，把所有參數(shù)都給NLP模型。但從實(shí)際落地的角度來看，根據(jù)No Free Lunch（沒有免費(fèi)的午餐）定理，沒有哪一個(gè)模型能以最優(yōu)的方式解決所有問題。如果我們把所有的東西都放在一個(gè)模型里，最后會(huì)花出極大的代價(jià)，超級(jí)英雄成本很高，也很難管理。

因此，我個(gè)人認(rèn)為會(huì)走向另外一個(gè)方向，即Learnware（學(xué)件）的思路，我們要做一堆參數(shù)過億的專業(yè)模型，來組成整體企業(yè)系統(tǒng)，這種方式更利于模型迭代、維護(hù)，同時(shí)更利于控制成本。就如同一家公司里不能都是董秘，還得有銷售、產(chǎn)研、市場(chǎng)等各個(gè)專業(yè)線。

大模型可實(shí)現(xiàn)傳統(tǒng)軟件兩大升級(jí)

“介質(zhì)”同樣是企業(yè)落地大模型的關(guān)鍵要素。

想象一下，如果沒有APP，推薦算法能用嗎？沒有搜索，廣告算法能用嗎？APP和搜索就是推薦算法和廣告算法的介質(zhì)。同樣，大模型在企業(yè)落地時(shí)，企業(yè)軟件就是大模型的介質(zhì)。如果介質(zhì)沒有革新，只有算法革新，就像是一個(gè)人只有腦沒有手。

因此，我們非常需要關(guān)注介質(zhì)層面的革新。企業(yè)中大部分工作的完成都需要使用軟件，但是大量軟件交互的方式都非常低效、復(fù)雜，現(xiàn)在我們可基于大模型解決兩個(gè)升級(jí)：

第一，由生成式大模型負(fù)責(zé)軟件界面的升級(jí)。人機(jī)交互要變成多模態(tài)，通過大模型更強(qiáng)的語義理解能力，可以更直接調(diào)用企業(yè)內(nèi)部各種形式的信息、數(shù)據(jù)和模型。

第二，由判別式大模型負(fù)責(zé)軟件內(nèi)核的升級(jí)。以前的軟件主要圍繞數(shù)據(jù)庫做增刪改查，現(xiàn)在可由判別式大模型對(duì)軟件進(jìn)行智能化升級(jí)。

讓大模型成為知錯(cuò)就改的小助手

由于GPT在技術(shù)上存在局限性，因而無法做到百分之百準(zhǔn)確，尤其在應(yīng)用于嚴(yán)肅的金融場(chǎng)景時(shí)，大模型之上必須要加一層運(yùn)營(yíng)體系兜底，讓模型的輸出和操作從不可用變成可用，并且能做到知錯(cuò)就改。

知錯(cuò)就改有三個(gè)機(jī)制疊加保障：一是專家給答案。雖然聽起來不是那么智能，但在專家能給答案的地方一定要給答案，因?yàn)檫@個(gè)是最準(zhǔn)確的。二是專家給示例，模型進(jìn)行一定的上下文學(xué)習(xí)也可以表現(xiàn)更好。三是模型自主學(xué)習(xí)，基于專家生成的知識(shí)反饋給模型，讓模型少犯錯(cuò)。

生成式大模型加上“執(zhí)行可控、知錯(cuò)能改”的運(yùn)營(yíng)體系，我們可以期待有一位善于理解、準(zhǔn)確執(zhí)行的工作助手。這位助手需要讓用戶可以清晰了解哪些內(nèi)容是“100％準(zhǔn)確”，哪些是“不確定的”，并且知錯(cuò)能改。

總體來說，底層大模型不能解決所有問題，介質(zhì)層及運(yùn)營(yíng)機(jī)制的革新對(duì)于數(shù)字化推動(dòng)作用同樣重要。企業(yè)需重新打造決策類AI、生成式AI、應(yīng)用層、介質(zhì)層。我們目前探索落地的重點(diǎn)是讓生成式大模型結(jié)合介質(zhì)，圍繞企業(yè)數(shù)字化轉(zhuǎn)型的目標(biāo)，在企業(yè)里生成一堆Agent，分別用以查資料、查數(shù)據(jù)、準(zhǔn)確操作軟件等，這可能是當(dāng)下一個(gè)更加貼合實(shí)際、可落地的方向。

本文源自：新金融聯(lián)盟NFA

作者：胡時(shí)偉

關(guān)鍵詞：

我們對(duì)AI大模型的誤解有多深？|天天信息

您可能也感興趣:

今日熱點(diǎn)

oppor15手機(jī)官網(wǎng)報(bào)價(jià)|世界滾動(dòng)

鳴志電器(603728)：自動(dòng)化浪潮蘊(yùn)藏機(jī)遇空心杯電機(jī)國(guó)內(nèi)稀缺_最新消息

全球今頭條！北京協(xié)和醫(yī)院白明做的雙眼皮好嗎?擅長(zhǎng)項(xiàng)目及收費(fèi)報(bào)價(jià)表...

更多

更多

排行

最近更新

今日要聞

我們對(duì)AI大模型的誤解有多深？|天天信息

您可能也感興趣:

今日熱點(diǎn)

oppor15手機(jī)官網(wǎng)報(bào)價(jià)|世界滾動(dòng)

鳴志電器(603728)：自動(dòng)化浪潮蘊(yùn)藏機(jī)遇 空心杯電機(jī)國(guó)內(nèi)稀缺_最新消息

全球今頭條！北京協(xié)和醫(yī)院白明做的雙眼皮好嗎?擅長(zhǎng)項(xiàng)目及收費(fèi)報(bào)價(jià)表...

為您推薦

連續(xù)虧損21億的順豐，終于撐不住了！背后扶持他的男人浮出水面_速遞

歐股集體低開 英國(guó)富時(shí)100指數(shù)跌0.5%

第三方支付流程說明|快訊

某職業(yè)技術(shù)學(xué)院怎么就成上海職業(yè)技術(shù)學(xué)院了？-環(huán)球熱資訊

更多

更多

排行

最近更新

今日要聞

鳴志電器(603728)：自動(dòng)化浪潮蘊(yùn)藏機(jī)遇空心杯電機(jī)國(guó)內(nèi)稀缺_最新消息

全球今頭條！北京協(xié)和醫(yī)院白明做的雙眼皮好嗎?擅長(zhǎng)項(xiàng)目及收費(fèi)報(bào)價(jià)表...

連續(xù)虧損21億的順豐，終于撐不住了！背后扶持他的男人浮出水面_速遞

歐股集體低開英國(guó)富時(shí)100指數(shù)跌0.5%

某職業(yè)技術(shù)學(xué)院怎么就成上海職業(yè)技術(shù)學(xué)院了？-環(huán)球熱資訊