滾動(dòng):OpenAI、谷歌雙標(biāo)玩得溜:訓(xùn)練大模型用他人數(shù)據(jù),卻決不允許自身數(shù)據(jù)外流
編輯:杜偉、梓文
你的就是我的,我的還是我的。
在生成式 AI 盛行的全新時(shí)代,大型科技公司在使用在線內(nèi)容時(shí)正在奉行「照我說(shuō)的做,而不是做我所做的」策略。在一定程度上,這種策略可以說(shuō)是一種雙標(biāo)以及話語(yǔ)權(quán)的濫用。
(資料圖片)
同時(shí),隨著大語(yǔ)言模型(LLM)成為 AI 發(fā)展的主流趨勢(shì),無(wú)論是大型還是初創(chuàng)公司,都在不遺余力地開發(fā)自己的大模型。其中訓(xùn)練數(shù)據(jù)是大模型能力好壞的重要前提。
近日,根據(jù) Insider 的報(bào)道,微軟支持的 OpenAI、谷歌及其支持的 Anthropic 多年來(lái)一直在使用其他網(wǎng)站或公司的在線內(nèi)容來(lái)訓(xùn)練他們的生成式 AI 模型。這些都是在沒有征求具體許可的情況下完成的,并將構(gòu)成一場(chǎng)醞釀中的法律斗爭(zhēng)的一部分,決定了網(wǎng)絡(luò)的未來(lái)以及版權(quán)法在這一新時(shí)代的應(yīng)用方式。
這些大型科技公司可能會(huì)爭(zhēng)辯說(shuō)他們是合理使用,是否真的如此有待商榷。但是他們卻不會(huì)讓自己的內(nèi)容被用來(lái)訓(xùn)練其他 AI 模型。所以不禁要問,為什么這些大型科技公司卻能在訓(xùn)練大模型時(shí)使用其他公司的在線內(nèi)容呢?
這些公司很聰明,但也非常虛偽
大型科技公司使用他人在線內(nèi)容卻不允許他人使用自己的,這種說(shuō)法是否有確切證據(jù),這可以從他們一些產(chǎn)品的服務(wù)和使用條款中看出端倪。
首先來(lái)看 Claude,它是 Anthropic 推出的類似于 ChatGPT 的 AI 助手。該系統(tǒng)可以完成摘要總結(jié)、搜索、協(xié)助創(chuàng)作、問答、編碼等任務(wù)。前段時(shí)間再次升級(jí),將上下文 token 擴(kuò)展到了 100k,處理速度大大加快。
Claude 的服務(wù)條款是這樣的。你不得以下列方式(這里列舉出部分)訪問或使用本服務(wù),如果這些限制的任何一項(xiàng)與可接受使用政策不一致或不明確,則以后者依從為先:
開發(fā)與我們的服務(wù)競(jìng)爭(zhēng)的任何產(chǎn)品或服務(wù),包括開發(fā)或訓(xùn)練任何 AI 或機(jī)器學(xué)習(xí)算法或模型
未經(jīng)條款允許,從我們的服務(wù)中抓取、爬取或以任何其他方式獲取數(shù)據(jù)或信息
Claude 服務(wù)條款地址:/s/9f502c93-cb5c-4571-b205-1e479da61794/#terms
同樣地,谷歌的生成式 AI 使用條款也是如此,「你不得使用本服務(wù)來(lái)開發(fā)機(jī)器學(xué)習(xí)模型或相關(guān)技術(shù)?!?/p>
谷歌生成式 AI 使用條款地址:/terms/generative-ai
OpenAI 的使用條款又怎樣呢?與谷歌類似,「你不得使用本服務(wù)的輸出來(lái)開發(fā)與 OpenAI 競(jìng)爭(zhēng)的模型。」
OpenAI 使用條款地址:/policies/terms-of-use
這些公司很聰明,他們知道高質(zhì)量的內(nèi)容對(duì)于訓(xùn)練新的 AI 模型至關(guān)重要,所以不允許別人用這樣的方式使用他們的輸出也是合情合理的。但他們卻無(wú)所顧忌地利用他人數(shù)據(jù)來(lái)訓(xùn)練自己的模型,這又該如何解釋呢?
目前,OpenAI、谷歌和 Anthropic 拒絕了 Insider 的置評(píng)請(qǐng)求,并且沒有做出任何回應(yīng)。
Reddit、推特和其他公司:受夠了
實(shí)際上,其他公司意識(shí)到正在發(fā)生的事情時(shí)并不高興。今年 4 月,多年來(lái)一直被用于 AI 模型訓(xùn)練的 Reddit 計(jì)劃開始對(duì)其數(shù)據(jù)的訪問收費(fèi)。
Reddit 首席執(zhí)行官 Steve Huffman 表示,「Reddit 的數(shù)據(jù)語(yǔ)料庫(kù)非常有價(jià)值,因此我們不能把這些價(jià)值免費(fèi)提供給世界上最大的公司?!?/p>
同樣今年 4 月,馬斯克指責(zé) OpenAI 的主要支持者微軟非法使用 Twitter 的數(shù)據(jù)來(lái)訓(xùn)練 AI 模型?!冈V訟時(shí)間到」,他在推特上寫道。
不過(guò)在回復(fù) Insider 的置評(píng)時(shí),微軟表示「這個(gè)前提有太多的錯(cuò)誤,我甚至不知道從何說(shuō)起。」
OpenAI 首席執(zhí)行官 Sam Altman 試圖通過(guò)探索尊重版權(quán)的全新 AI 模型來(lái)深化這個(gè)問題。據(jù) Axios 報(bào)道,他于近期表示,「我們正在嘗試開發(fā)新的模式,如果 AI 系統(tǒng)使用了你的內(nèi)容,或者使用了你的風(fēng)格,你就會(huì)因此獲得報(bào)酬?!?/p>
Sam Altman
出版商(包括 Insider)都會(huì)是既得利益獲得者。此外,包括美國(guó)新聞集團(tuán)在內(nèi)的一些出版商已經(jīng)在推動(dòng)科技公司付費(fèi)使用其內(nèi)容訓(xùn)練 AI 模型。
目前 AI 模型的訓(xùn)練方式「打破」了網(wǎng)絡(luò)
有前微軟高管表示這一定有問題。微軟老將、著名軟件開發(fā)者 Steven Sinofsky 認(rèn)為,目前 AI 模型的訓(xùn)練方式「打破」了網(wǎng)絡(luò)。
Steven Sinofsky
他在推特上寫道,「過(guò)去,爬取數(shù)據(jù)是用來(lái)?yè)Q取點(diǎn)擊率的。但現(xiàn)在只是用來(lái)訓(xùn)練一個(gè)模型,沒有給創(chuàng)作者、版權(quán)所有者帶來(lái)任何價(jià)值?!?/p>
也許,隨著更多公司的覺醒,生成式 AI 時(shí)代這一不均衡的數(shù)據(jù)使用方式會(huì)很快被改變。
原文鏈接:/openai-google-anthropic-ai-training-models-content-data-use-2023-6
?THE END
轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)
投稿或?qū)で髨?bào)道:content@
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
新資訊:真的值!16G內(nèi)存跌破150元
環(huán)球觀速訊丨舞臺(tái)陷爭(zhēng)議、私生活被議論,誤解楊麗萍從說(shuō)她“不雅”開始
熱文:離異夫妻上演“奪子戰(zhàn)”,法院傾情調(diào)解護(hù)童權(quán)
更多
- 中國(guó)海警艦艇編隊(duì)6月21日在我釣魚島領(lǐng)海內(nèi)巡航
- “二手房直售”利于降低交易費(fèi)用
- 全球即時(shí):屈原故里看高峽平湖龍舟競(jìng)渡
- 古裝劇《長(zhǎng)風(fēng)渡》開播 眾星齊聚重現(xiàn)古商傳奇 天天時(shí)訊
- 環(huán)球微頭條丨高中數(shù)學(xué)知識(shí)易錯(cuò)點(diǎn)梳理,高考數(shù)學(xué)易錯(cuò)點(diǎn),高考...
- 小的們,速來(lái)拜見大圣!北京的西游記主題樂園開放
- 全球快報(bào):廈門海悅山莊酒店附近有什么
- 失聯(lián)的“泰坦”載人潛水器是什么樣?
更多
- 今明兩日這些景區(qū)周邊易堵 請(qǐng)合理規(guī)劃出行路線 當(dāng)前關(guān)注
- 重點(diǎn)聚焦!無(wú)線電視機(jī)頂盒接收器_無(wú)線電視接收器
- 全球觀焦點(diǎn):德州夏津組建山東首個(gè)社會(huì)治理最小應(yīng)急單元 筑...
- EDG中下雙C發(fā)力,連下兩局零封AL,UZI再獲MVP!-環(huán)球快資訊
- 鮮土茯苓煲豬展湯_關(guān)于鮮土茯苓煲豬展湯簡(jiǎn)述|環(huán)球時(shí)訊
- 團(tuán)代表故事丨張常江:青年科技團(tuán)隊(duì)助力中國(guó)制造走上更高水平-...
- 今日觀點(diǎn)!中國(guó)平安:寧夏銀川燒烤店爆炸事故已排查到11名出險(xiǎn)客戶
- ATP挑戰(zhàn)賽 | 商竣程擊敗前世界TOP10 期待溫網(wǎng)大賽_速遞
排行
- 汽車零部件板塊表現(xiàn)活躍,中馬傳動(dòng)錄得4天3板,主力大手筆加...
- 地方政府推動(dòng)企業(yè)IPO 最高獎(jiǎng)勵(lì)3000萬(wàn)元
- 新三板精選層公司披露去年業(yè)績(jī)快報(bào),七成公司實(shí)現(xiàn)凈利潤(rùn)增長(zhǎng)
- 遠(yuǎn)洋集團(tuán)前2月銷售同比增54% TOP100房企排52按年直降11名
- 丸美股份就業(yè)績(jī)下滑回應(yīng):線下渠道占比較大等因素導(dǎo)致
- Huobi Ventures全球品牌發(fā)布 一億美金聚焦區(qū)塊鏈行業(yè)前沿布局
- 海南首家科創(chuàng)板公司上市 或?qū)⑾破鹨徊ㄉ鲜腥谫Y熱潮
- 保利東莞溢價(jià)率23.46%以47.36億奪得東莞黃江57萬(wàn)平商住地
- 廣州、深圳兩地將“放寬汽車限購(gòu)政策”以促進(jìn)汽車消費(fèi)
- 長(zhǎng)三角“第一日資高地”:日企相繼迎來(lái)“高光時(shí)刻”
最近更新
- 滾動(dòng):OpenAI、谷歌雙標(biāo)玩得溜:訓(xùn)練大模型用他人數(shù)據(jù),卻決...
- 電手女郎真人出鏡,618手拉手教你搞機(jī)
- 宋德勇|世界時(shí)訊
- 全球?qū)崟r(shí):上海麗思卡爾頓酒店怎么預(yù)訂便宜
- 中國(guó)十大最美草原
- 重要提醒!事關(guān)達(dá)州人出行
- 全球關(guān)注:“鏈”接未來(lái)!葉縣新材料產(chǎn)業(yè)從“整體起勢(shì)”到“...
- 天天微頭條丨禹州市文殊鎮(zhèn):情系端午佳節(jié) 關(guān)愛特困老人
- 焦點(diǎn)速遞!大摩:予藥明生物增持評(píng)級(jí) 目標(biāo)價(jià)121港元
- 幻想紋章4.6怎么解鎖人物(幻游格斗如何解鎖人物)
- 當(dāng)前看點(diǎn)!肝硬化最佳治療方法多少錢(肝硬化最佳治療方法)
- 環(huán)球報(bào)道:LONGi Green Energy Plans to Go Public in Switzerland
- excel2007使用教程(excel2007教程全集)-播資訊
- 44殺人游戲(殺人游戲網(wǎng)頁(yè)版)_世界播資訊
- 當(dāng)前信息:三花控股集團(tuán)計(jì)劃退出房地產(chǎn)業(yè)務(wù) 去年地產(chǎn)收入逾16億
- 天天通訊!同根同祖 中華共祭 2023(癸卯)年公祭中華人文...
- 6·22川觀用戶日特別策劃丨青年合伙人,“職”引前程
- 客車票必須實(shí)名制么 長(zhǎng)途汽車購(gòu)票實(shí)名制 熱點(diǎn)聚焦
- 王布萊克皮膚(王布萊克)|世界熱門
- 環(huán)球?qū)崟r(shí):洛克王國(guó)星辰寶寶技能搭配(洛克王國(guó)星辰寶寶)
- 石榴快播|第十三屆“喀交會(huì)”與“文博會(huì)首屆新疆展”開幕_世...
- 本人懷孕三十六天到*醫(yī)院看病,醫(yī)生給我做整刮術(shù),結(jié)果寶寶沒...
- 每日速看!交通事故
- 每日熱門:勞務(wù)派遣離職,提前走人,公司要凍結(jié)社保
- 6月中旬開始,運(yùn)勢(shì)抽中上上簽的3大生肖,事業(yè)高升桃花盛開,...
- 歌手蔡依林助陣吳青峰_歌手總決賽蔡依林幫唱吳青峰 當(dāng)前信息
- 單創(chuàng)是什么|天天微速訊
- 即時(shí)看!揪心的極限生存:“泰坦”號(hào)氧氣22日19:08耗盡,艙內(nèi)...
- 觀焦點(diǎn):室內(nèi)不適合養(yǎng)什么花草植物(室內(nèi)不可以養(yǎng)什么花)
- 網(wǎng)傳男子太湖放生外來(lái)物種珍珠鱉 當(dāng)?shù)貪O業(yè)部門回應(yīng)
今日要聞
- 宋德勇|世界時(shí)訊
- 魔卡少女櫻第四季_魔卡少女櫻劇場(chǎng)版3 mdash mdash 前世的宿愿 到底有沒有 沒有的話請(qǐng)告訴
- 中國(guó)海警艦艇編隊(duì)6月21日在我釣魚島領(lǐng)海內(nèi)巡航
- 第162期福彩3D曬票,在意志面前,決無(wú)辦不到的事
- 北礦科技: 公司已在微信公眾號(hào)平臺(tái)開通官方賬號(hào)“北礦科技”_全球即時(shí)看
- 拉夫羅夫:美國(guó)正密謀干涉俄羅斯明年大選 手段為大搞“顏色革命”_天天短訊
- 今明兩日這些景區(qū)周邊易堵 請(qǐng)合理規(guī)劃出行路線 當(dāng)前關(guān)注
- 天天觀天下!國(guó)足“試水”兩連勝之后,是時(shí)候約戰(zhàn)亞洲強(qiáng)隊(duì)了?
- 每日信息:包粽子、秀才藝、品粽香……江陵縣天橋社區(qū)居民端午共話鄰里情
- 滾動(dòng):OpenAI、谷歌雙標(biāo)玩得溜:訓(xùn)練大模型用他人數(shù)據(jù),卻決不允許自身數(shù)據(jù)外流