首頁 生活 > 正文

我們對AI大模型的誤解有多深?|天天信息

大模型可以無所不能嗎?怎樣讓模型少犯錯(cuò)?企業(yè)應(yīng)該部署多大的模型,一個(gè)超級大模型還是一堆專業(yè)模型?


(資料圖片僅供參考)

對于這些問題,第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉認(rèn)為:類GPT模型是高級復(fù)讀機(jī),有多少“人工”就有多少“智能”,絕非無所不能。模型100%會犯錯(cuò),一味地追求算力和數(shù)據(jù)并不能解決這個(gè)問題,因此模型之上必須要有運(yùn)營兜底機(jī)制,知錯(cuò)就改。算力決定參數(shù)規(guī)模,一堆專業(yè)模型比一個(gè)超級大模型更有落地可行性。

上述觀點(diǎn)源于6月10日新金融聯(lián)盟舉辦的“金融機(jī)構(gòu)數(shù)智化轉(zhuǎn)型與大模型技術(shù)應(yīng)用”內(nèi)部研討會。會上,新金融聯(lián)盟學(xué)術(shù)理事、工商銀行首席技術(shù)官呂仲濤,民生銀行數(shù)據(jù)管理部總經(jīng)理沈志勇、平安銀行數(shù)字資產(chǎn)管理與研發(fā)中心總經(jīng)理劉錦淼也做了主題發(fā)言。新金融聯(lián)盟理事長、中國銀行原行長李禮輝及中國信通院金融科技研究中心副主任趙小飛進(jìn)行了點(diǎn)評交流。

56家銀行及非銀機(jī)構(gòu)、55家科技公司的170多位嘉賓通過線上線下參會。會議由新金融聯(lián)盟秘書長吳雨珊主持,中國金融四十人論壇提供學(xué)術(shù)支持。會議實(shí)錄詳見→《如何釋放大模型對金融行業(yè)的價(jià)值?以下為胡時(shí)偉的發(fā)言全文,已經(jīng)本人審核。

企業(yè)大模型落地的幾個(gè)關(guān)鍵問題

文 | 胡時(shí)偉

大模型并非“無所不能”

現(xiàn)在各行各業(yè)都十分關(guān)注大模型這一話題。第四范式在自己的大模型產(chǎn)品“式說”2月份發(fā)布以來,與17個(gè)行業(yè)的114家企業(yè)進(jìn)行了密集與深入的溝通,發(fā)現(xiàn)業(yè)界普遍對大模型存在一些誤解,需要糾偏。

第一,要相信科學(xué)。大家普遍認(rèn)為大模型已經(jīng)具備“涌現(xiàn)”能力,可以無師自通。大模型的能力主要還是源于給它提供了什么樣的數(shù)據(jù),并不是直接“涌現(xiàn)”出來的。本質(zhì)上講,類GPT模型的背后還是機(jī)器學(xué)習(xí),需要高質(zhì)量的數(shù)據(jù)訓(xùn)練而來,并通過Fine-tuning(微調(diào))進(jìn)行調(diào)優(yōu)才能實(shí)現(xiàn)一些特定的能力。

第二,有多少人工,就有多少智能。生成式AI到底能解決什么問題?通俗地講,從基礎(chǔ)大模型到行業(yè)大模型甚至到場景定制,我們目前認(rèn)為它可以用以完成一份文檔。在一個(gè)特定場景下正確地完成一個(gè)文檔,一定來自于人反饋的數(shù)據(jù)。就像GPT要用到非常多維基百科的數(shù)據(jù),是因?yàn)樵摂?shù)據(jù)質(zhì)量更高。我們行業(yè)要做的是,一定要對大模型形成反饋閉環(huán)和迭代,即告訴大模型什么是好的,訓(xùn)練它達(dá)到更好的效果。這件事情本質(zhì)還是依賴人工。

第三,大模型生成一定會出錯(cuò)。哪怕是GPT-4,在行業(yè)專業(yè)、嚴(yán)肅場景的應(yīng)用也遠(yuǎn)未達(dá)到工業(yè)可用的效果。這是技術(shù)本身的缺陷所致,靠算力和數(shù)據(jù)也無法從根本上解決這個(gè)問題。目前大部分企業(yè)的共識是模型之上必須加一層運(yùn)營機(jī)制來兜底。

企業(yè)應(yīng)該部署多大的模型?

企業(yè)在大模型落地過程中會面臨一個(gè)現(xiàn)實(shí)問題——預(yù)算有限,預(yù)算決定了算力,算力決定了參數(shù)規(guī)模。

因此,我們需要抉擇:應(yīng)該部署一個(gè)超級大模型,期待它能夠把能力上升到一定程度,還是應(yīng)該從解決問題出發(fā),部署一堆專業(yè)模型,讓它們各司其職。這里面涉及兩個(gè)不同的思路。

第一個(gè)思路是通過增加參數(shù)和堆砌算力,把所有參數(shù)都給NLP模型。但從實(shí)際落地的角度來看,根據(jù)No Free Lunch(沒有免費(fèi)的午餐)定理,沒有哪一個(gè)模型能以最優(yōu)的方式解決所有問題。如果我們把所有的東西都放在一個(gè)模型里,最后會花出極大的代價(jià),超級英雄成本很高,也很難管理。

因此,我個(gè)人認(rèn)為會走向另外一個(gè)方向,即Learnware(學(xué)件)的思路,我們要做一堆參數(shù)過億的專業(yè)模型,來組成整體企業(yè)系統(tǒng),這種方式更利于模型迭代、維護(hù),同時(shí)更利于控制成本。就如同一家公司里不能都是董秘,還得有銷售、產(chǎn)研、市場等各個(gè)專業(yè)線。

大模型可實(shí)現(xiàn)傳統(tǒng)軟件兩大升級

“介質(zhì)”同樣是企業(yè)落地大模型的關(guān)鍵要素。

想象一下,如果沒有APP,推薦算法 能用嗎? 沒有搜索,廣告算法能用嗎?APP和搜索就是推薦算法和廣告算法的介質(zhì)。同樣, 大模型在企業(yè)落地時(shí),企業(yè)軟件就是大模型的介質(zhì)。如果介質(zhì)沒有革新,只有算法革新,就像是一個(gè)人只有腦沒有手。

因此,我們非常需要關(guān)注介質(zhì)層面的革新。企業(yè)中大部分工作的完成都需要使用軟件,但是大量軟件交互的方式都非常低效、復(fù)雜,現(xiàn)在我們可基于大模型解決兩個(gè)升級:

第一,由生成式大模型負(fù)責(zé)軟件界面的升級。人機(jī)交互要變成多模態(tài),通過大模型更強(qiáng)的語義理解能力,可以更直接調(diào)用企業(yè)內(nèi)部各種形式的信息、數(shù)據(jù)和模型。

第二,由判別式大模型負(fù)責(zé)軟件內(nèi)核的升級。以前的軟件主要圍繞數(shù)據(jù)庫做增刪 改查,現(xiàn)在可由判別式大模型對軟件進(jìn)行智能化升級。

讓大模型成為知錯(cuò)就改的小助手

由于GPT在技術(shù)上存在局限性,因而無法做到百分之百準(zhǔn)確,尤其在應(yīng)用于嚴(yán)肅的金融場景時(shí),大模型之上必須要加一層運(yùn)營體系兜底,讓模型的輸出和操作從不可用變成可用,并且能做到知錯(cuò)就改。

知錯(cuò)就改有三個(gè)機(jī)制疊加保障:一是專家給答案。雖然聽起來不是那么智能,但在專家能給答案的地方一定要給答案,因?yàn)檫@個(gè)是最準(zhǔn)確的。二是專家給示例,模型進(jìn)行一定的上下文學(xué)習(xí)也可以表現(xiàn)更好。三是模型自主學(xué)習(xí),基于專家生成的知識反饋給模型,讓模型少犯錯(cuò)。

生成式大模型加上“執(zhí)行可控、知錯(cuò)能改”的運(yùn)營體系,我們可以期待有一位善于理解、準(zhǔn)確執(zhí)行的工作助手。這位助手需要讓用戶可以清晰了解哪些內(nèi)容是“100%準(zhǔn)確”,哪些是“不確定的”,并且知錯(cuò)能改。

總體來說,底層大模型不能解決所有問題,介質(zhì)層及運(yùn)營機(jī)制的革新對于數(shù)字化推動作用同樣重要。企業(yè)需重新打造決策類AI、生成式AI、應(yīng)用層、介質(zhì)層。我們目前探索落地的重點(diǎn)是讓生成式大模型結(jié)合介質(zhì),圍繞企業(yè)數(shù)字化轉(zhuǎn)型的目標(biāo),在企業(yè)里生成一堆Agent,分別用以查資料、查數(shù)據(jù)、準(zhǔn)確操作軟件等,這可能是當(dāng)下一個(gè)更加貼合實(shí)際、可落地的方向。

本文源自:新金融聯(lián)盟NFA

作者: 胡時(shí)偉

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3