首頁 資訊 > 創(chuàng)新 > 正文

揭秘真實的「AI民工」:為生存機(jī)械地「做任務(wù)」 時薪低至1美元

核心提示:


【資料圖】

1.即使是最厲害的AI背后也是人,它需要大量人力標(biāo)注數(shù)據(jù)來訓(xùn)練它。AI標(biāo)注員是人們希望自動化的工作,而且通常認(rèn)為它們已經(jīng)自動化了,但是仍需要人類的輔助。

2.他們把這份工作稱為“做任務(wù)”,自己也不知道干的是什么。

3.收入微薄,時薪低至1-3美元。

4.標(biāo)注員抱怨稱“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費生命?!?/p>

人工智能(AI)的火熱不僅取代了一批工作崗位,也造就了新的產(chǎn)業(yè),一支以“做任務(wù)”為生的龐大AI民工大軍正在悄然崛起中。

喬(Joe)今年30歲,幾個月前從肯尼亞首都內(nèi)羅畢的一所大學(xué)畢業(yè),找到了一份數(shù)據(jù)標(biāo)注員的工作。這份工作單調(diào)乏味,整天就是處理用于訓(xùn)練AI的原始信息。AI通過在海量數(shù)據(jù)中尋找模式來學(xué)習(xí),但是這些數(shù)據(jù)首先必須由人類進(jìn)行分類和標(biāo)記。人類就是隱藏在這些機(jī)器背后的龐大勞動力。

以喬為例,他的工作就是為自動駕駛汽車標(biāo)記視頻,一幀一幀地從每個可能的攝像頭角度標(biāo)記每輛車、行人、騎自行車的人以及任何車主需要注意的東西。這是一項艱難而又重復(fù)性的勞動。一個只有幾秒鐘的視頻片段需要8個小時來標(biāo)注,喬忙活半天只能賺到大約10美元(約合72元人民幣)。

不過,到了2019年,喬迎來了一個“發(fā)財機(jī)會”。由于一家新公司迫切需要標(biāo)注員,他們成立了一個訓(xùn)練營,培養(yǎng)新的標(biāo)注員。喬成了這個訓(xùn)練營的負(fù)責(zé)人,報酬是之前做標(biāo)注員的四倍。

每隔兩周時間,50名新手就會排隊進(jìn)入內(nèi)羅畢的一棟辦公樓,開始他們的學(xué)徒生涯,這讓人感覺市場對標(biāo)注員的需求似乎是無限的。他們被要求從那些對著鏡子自拍的照片中看到的衣服進(jìn)行分類,通過機(jī)器人吸塵器的視角來確定他們所在的房間,并在激光雷達(dá)掃描的摩托車周圍畫出正方形。

喬的一半以上學(xué)生通常在訓(xùn)練營結(jié)束前就退學(xué)了。“有些人不知道如何長時間待在一個地方?!彼竦亟忉尩?。他承認(rèn),“這很無聊”。

稀里糊涂“做任務(wù)”

但是,在一個工作稀缺的地方,這好歹是一份能夠糊口的工作。最終,喬還是培養(yǎng)出了數(shù)百名畢業(yè)生。訓(xùn)練營結(jié)束后,這些學(xué)生回到家里,獨自在臥室和廚房里工作,被禁止告訴任何人他們在做什么。其實,保密性并不是什么問題,因為他們也幾乎不知道自己在干什么。

對于這些剛出師的學(xué)生來說,為自動駕駛汽車標(biāo)記障礙物很好明白,但是對那些不知道是機(jī)器人還是人類說的扭曲對話片段進(jìn)行分類,就沒那么輕松了。他們要上傳自己的照片:先是一臉茫然地盯著攝像頭,然后咧著嘴笑,還要戴上摩托車頭盔。每個項目都是某個更大程序的一個很小組成部分,所以很難說他們到底在訓(xùn)練AI做什么。他們也無法從這些項目的名稱中尋找蛛絲馬跡:“蟹的傳人”、“鯨魚段”、“林地陀螺儀”和“藥盒香腸”,這些都是不著邊際的項目代號。

那么,他們到底是在為誰打工呢?大多數(shù)人只知道它叫Remotasks,是一家面向英語流利者提供工作的網(wǎng)站。和大多數(shù)標(biāo)注員一樣,喬并不知道Remotasks是美國AI標(biāo)注公司Scale AI旗下的外包公司。Scale AI是一家價值數(shù)十億美元的硅谷數(shù)據(jù)供應(yīng)商,客戶包括OpenAI和美國軍方。不過,Remotasks和Scale AI的網(wǎng)站都沒有提到雙方的關(guān)系。

許多人對于ChatGPT等大語言模型的關(guān)注都集中在AI通過自動化取代的工作崗位上。但是,即使是最厲害的AI背后也是人,它需要大量人力標(biāo)注數(shù)據(jù)來訓(xùn)練它,并在它感到“困惑”時對數(shù)據(jù)進(jìn)行澄清。只有那些有錢購買這些數(shù)據(jù)的公司才能參與競爭,這些公司在得到數(shù)據(jù)后會極力防止數(shù)據(jù)外泄。結(jié)果就是,除了少數(shù)例外情況以外,人們對于塑造AI系統(tǒng)行為的信息知之甚少,對于塑造這些系統(tǒng)行為的人就更不了解了。

對喬的學(xué)生來說,這是一份“十分不正?!钡墓ぷ鳎簺]有時間表、沒有同事、不知道自己在做什么、也不知道為誰工作。實際上,他們很少把這項勞動稱之為工作,只是稱之為“任務(wù)”,他們是任務(wù)工作者。

人類學(xué)家大衛(wèi)·格雷伯(David Graeber)曾經(jīng)給那些沒有意義的工作起了一個名字:“狗屁工作”,指的是那些本應(yīng)該被自動化取代,但由于官僚主義、地位或惰性等原因而沒有自動化的工作。AI標(biāo)注員的工作則與之相反:這是人們希望自動化的工作,而且通常認(rèn)為它們已經(jīng)自動化了,但是仍需要人類代替。這些工作確實有一個目的,只是工作者通常不知道它是什么。

標(biāo)注大生意

當(dāng)前的AI熱潮,就是源自這種前所未有的大規(guī)模單調(diào)乏味、重復(fù)性勞動。

2007年,時任普林斯頓大學(xué)教授的AI研究員李飛飛懷疑,改善圖像識別神經(jīng)網(wǎng)絡(luò)的關(guān)鍵是使用更多數(shù)據(jù)進(jìn)行訓(xùn)練,需要數(shù)百萬標(biāo)記圖像而不是數(shù)萬張。但問題是,她的本科生團(tuán)隊需要花費數(shù)十年時間和數(shù)百萬美元才能給這么多照片貼上標(biāo)簽。

不過,當(dāng)時亞馬遜已經(jīng)擁有了一個眾包平臺Mechanical Turk,世界各地的人們在這里以低廉的價格完成小任務(wù)。于是,李飛飛在Mechanical Turk上找到了數(shù)千名數(shù)據(jù)標(biāo)注工作者,創(chuàng)造了標(biāo)注數(shù)據(jù)集ImageNet。它讓機(jī)器學(xué)習(xí)取得了突破,讓這一領(lǐng)域煥發(fā)新機(jī),迎來了十年進(jìn)步。

如今,標(biāo)注仍然是AI開發(fā)的基礎(chǔ)組成部分。但是,工程師們經(jīng)常覺得,對于構(gòu)建大模型這一更迷人的工作而言,標(biāo)注是一個短暫的、不方便的先決條件。你可以盡可能便宜地收集盡可能多的標(biāo)記數(shù)據(jù)來訓(xùn)練模型,如果它有效,至少在理論上你就不再需要標(biāo)注員了。但是,標(biāo)注永遠(yuǎn)不會真正完成。在研究人員眼里,機(jī)器學(xué)習(xí)系統(tǒng)是“脆弱的”。當(dāng)遇到訓(xùn)練數(shù)據(jù)中沒有充分解釋的東西時,它很容易失敗。這些失敗被稱為“邊緣情況”,可能會產(chǎn)生嚴(yán)重的后果。

例如,2018年,網(wǎng)約車巨頭Uber的一輛自動駕駛測試車撞死了一名女性。盡管該汽車的自動駕駛系統(tǒng)被進(jìn)行了編程,要求避開騎自行車的人和行人,但它不知道該如何對待騎自行車過馬路的人。隨著越來越多的AI系統(tǒng)被投入到世界中提供法律咨詢和醫(yī)療幫助,它們面臨的邊緣情況就越多,需要更多人類來協(xié)助解決。這已經(jīng)催生了一個全球性產(chǎn)業(yè),由像喬這樣的人組成,他們用自己獨特的人類能力來幫助機(jī)器。

標(biāo)注是一門大生意。Scale AI由當(dāng)年19歲的亞歷山大·王(Alexandr Wang)在2016年創(chuàng)立,2021年的估值已達(dá)到73億美元,這讓他登上了《福布斯》“最年輕的白手起家億萬富翁”榜單。不過,自那以后,他的股份在二級市場的價值已經(jīng)下跌。

“標(biāo)注生意擁有一套完整的供應(yīng)鏈,”非營利組織AI伙伴關(guān)系(Partnership on AI)的項目和研究負(fù)責(zé)人索南·金達(dá)爾(Sonam Jindal)表示,“業(yè)內(nèi)普遍認(rèn)為,標(biāo)注不是開發(fā)的關(guān)鍵部分,也不會長時間需要它。所有的興奮之情都圍繞著人工智能,一旦我們建立了它,就不再需要標(biāo)注,所以為什么要考慮它呢?但標(biāo)注是AI的基礎(chǔ)設(shè)施。人類智慧是AI的基礎(chǔ),我們需要將其視為AI經(jīng)濟(jì)中的真正工作,這些工作將在一段時間內(nèi)存在。”

OpenAI、谷歌和微軟等知名AI公司都有各自的數(shù)據(jù)供應(yīng)商。一些私人外包公司擁有類似呼叫中心的辦公室,比如肯尼亞和尼泊爾的CloudFactory。喬就是在那里做標(biāo)注,每小時1.2美元,之后他才轉(zhuǎn)投Remotasks。還有像Mechanical Turk和Clickworker這樣的“眾包”網(wǎng)站,任何人都可以注冊來完成任務(wù)。中間層是Scale AI之類的服務(wù),任何人都可以注冊,但每個人都必須通過資格考試和培訓(xùn)課程,并接受績效監(jiān)控。

怎么接活?

今年早些時候,記者在Scale AI的外包公司Remotasks網(wǎng)站上進(jìn)行了注冊。過程很簡單,輸入電腦配置、網(wǎng)速和一些基本的聯(lián)系信息后,記者就來到了“培訓(xùn)中心”。為了獲得付費任務(wù),記者首先必須完成一個相關(guān)的無償入門課程。

培訓(xùn)中心展示了一系列課程,但是這些課程的名字令人費解,比如“膠水泳衣”和“海報夏威夷”。記者點開了一個叫“GFD模塊化”的課程,這項課程是給社交媒體照片中的衣物進(jìn)行標(biāo)注。

不過,課程的指令很奇怪。例如,它們基本上是由相同的指令組成的,并用特殊的顏色和大寫字體進(jìn)行強(qiáng)調(diào),旁邊是用來警示的炸彈威脅拼貼畫。

“一定要給真實的、可以讓人類穿著或打算給真人穿著的物品貼上標(biāo)簽?!敝噶钍沁@么要求的。

“下面的所有物品都應(yīng)該貼上標(biāo)簽,因為它們是真實的,可以被現(xiàn)實生活中的人穿著?!敝噶钤俅螐?qiáng)調(diào)。這些物品來自一個AJ品牌廣告、一個戴著星球大戰(zhàn)凱洛倫頭盔的人,以及一個穿著裙子的人體模型。這些圖片上面有一個石灰綠色的方框,里面的文字再次解釋說,“給真實的人可以穿的真實物品貼上標(biāo)簽”。

對于不能被標(biāo)記的物品,指令也給了醒目的提示:“以下物品不應(yīng)該被貼上標(biāo)簽,因為人類在實際生活中不可能穿著這些物品!”

記者對于自己的分辨能力感到自信,于是就開始了測試。首先是一張雜志的照片,上面的女人穿著裙子。照片上的服裝是真實的服裝的嗎?記者認(rèn)為不是,因為人不能穿照片中的服裝。但是,錯了!在AI看來,真實服裝的照片就是真實服裝。接下來是一張在昏暗臥室中,一個女人站在全身鏡子前自拍的照片。她穿著的襯衫和短褲是真實的。那么倒影呢?同樣是真實的!真實服裝的倒影也是真實服裝。

經(jīng)過尷尬的大量嘗試和錯誤后,記者終于開始了實際工作,卻驚恐地發(fā)現(xiàn)他一直在努力遵循的指令已經(jīng)被更新和澄清了很多次,現(xiàn)在已經(jīng)變成了一本有43頁的指令書:不要標(biāo)記裝滿衣服而且打開的行李箱;標(biāo)記鞋子但不要標(biāo)記腳蹼;標(biāo)記緊身褲但不要標(biāo)記連緊身褲襪;即使有人穿著毛巾也不要標(biāo)記它;標(biāo)記服裝但不要標(biāo)記盔甲。

收入微薄

Remotasks上的大部分工作都是按件計酬的,一項任務(wù)的收入從幾美分到幾美元不等。因為任務(wù)可能需要幾秒鐘或幾個小時,所以工資很難預(yù)測。標(biāo)注員們稱,當(dāng)Remotasks剛進(jìn)入肯尼亞時,他們的報酬相對較高。根據(jù)任務(wù)的不同,平均每小時大約為5到10美元。但隨著時間的推移,報酬會下降。

Scale AI發(fā)言人安娜·弗蘭科(Anna Franko)表示,該公司的經(jīng)濟(jì)學(xué)家會分析項目的細(xì)節(jié)、所需的技能、地區(qū)生活成本和其他因素,“以確保公平和有競爭力的薪酬”。Scale AI的前員工還表示,標(biāo)注員的薪酬是通過一種類似動態(tài)定價的機(jī)制確定的,該機(jī)制根據(jù)可用的標(biāo)注員數(shù)量和數(shù)據(jù)需要的迫切度進(jìn)行調(diào)整。

根據(jù)記者的采訪和招聘公告,美國的Remotasks標(biāo)注員通常每小時能掙10到25美元,一些專業(yè)標(biāo)注領(lǐng)域的專家報酬更高。今年年初時,接受采訪的肯尼亞標(biāo)注員的報酬已經(jīng)降到了每小時1到3美元。

這還是能賺錢的時候。標(biāo)注員對于Remotasks的工作最常見的抱怨就是它的不穩(wěn)定性。它或許能在很長一段時間內(nèi)給標(biāo)注員提供足夠穩(wěn)定的工作,可以作為全職工作,但也充滿了不可預(yù)測性,使人無法依賴它。標(biāo)注員花費數(shù)小時閱讀指令和完成無償培訓(xùn),結(jié)果只能完成幾十個任務(wù),隨后項目就結(jié)束了。接著,標(biāo)注員可能幾天都沒有新任務(wù),然后再突然出現(xiàn)一項完全不同的任務(wù),可能持續(xù)幾個小時到幾周時間不等。任何任務(wù)都有可能是他們的最后一項任務(wù),他們永遠(yuǎn)不知道下一個任務(wù)何時到來。

工程師和數(shù)據(jù)供應(yīng)商稱,這種時有時無的工作取決于AI開發(fā)的節(jié)奏。訓(xùn)練一個大模型需要大量標(biāo)注,然后是更多的迭代更新。工程師們希望所有這些都盡可能快地完成,這樣他們就能趕上目標(biāo)發(fā)布日期,可能在幾個月的時間里就需要數(shù)千名標(biāo)注員,然后減少到幾百名,接著只需要十幾名特定類型的專家,然后又需要數(shù)千名。“問題是,誰來承擔(dān)這些需求波動的成本?”AI伙伴關(guān)系的金達(dá)爾說,“因為目前承擔(dān)這些成本的是標(biāo)注員們。”

抱團(tuán)取暖

為了取得成功,標(biāo)注員們會相互合作。維克多(Victor)在內(nèi)羅畢上大學(xué)時就開始為Remotasks工作。當(dāng)記者告訴他自己在交通導(dǎo)向員任務(wù)中遇到的困難時,他表示大家都知道要遠(yuǎn)離那個任務(wù):任務(wù)太棘手、報酬還低,不值得做。

和許多標(biāo)注員一樣,維克多使用非官方的WhatsApp群聊,在有好任務(wù)時通知大家。當(dāng)他弄清楚一個新任務(wù)時,他會即興使用谷歌視頻會議服務(wù)Meets與其他人分享如何完成任務(wù)。任何人都可以加入會議,一起研究,分享技巧。“這是我們培養(yǎng)起來的相互幫助的文化,因為我們知道,單憑一個人是無法掌握所有技巧的?!彼f道。

由于工作會毫無征兆地出現(xiàn)又消失,所以標(biāo)注員們總是需要保持警惕。維克多發(fā)現(xiàn),項目會在深夜突然出現(xiàn),所以他習(xí)慣每三個小時左右醒來檢查一下他的任務(wù)隊列。當(dāng)有任務(wù)時,他會保持清醒,只要能讓自己工作。有一次,他熬夜36個小時,在人群照片中給肘部、膝蓋和頭部做標(biāo)記,他也不知道這么做是干什么。還有一次,他熬夜太久,媽媽問他眼睛怎么了。他照鏡子后才發(fā)現(xiàn),眼睛腫了。

標(biāo)注員通常只是模糊地知道他們正在為其他地方的企業(yè)訓(xùn)練AI,但有時這種神秘感會消失,因為指令中提到了某個品牌或聊天機(jī)器人說得太多了。“我讀了一些資料,并通過谷歌搜索發(fā)現(xiàn),我正在為一位25歲的億萬富翁工作?!币幻麊T工說,他當(dāng)時正在給打電話訂購達(dá)美樂披薩的人的情緒貼標(biāo)簽。

“如果我讓某人成為億萬富翁,而我每周只賺幾美元,我真的是在浪費我的生命?!彼粷M地說。

沒人會記住我們

維克多自稱是一名AI“狂熱者”。他開始做標(biāo)注,是因為他想幫助實現(xiàn)一個完全自動化的后工作未來。但是今年早些時候,有人在他的WhatsApp群里發(fā)了一篇《時代》雜志的報道,內(nèi)容是標(biāo)注員訓(xùn)練ChatGPT識別有毒內(nèi)容,但是Scale AI支付給他們的時薪不到2美元。

“這些公司利潤豐厚,但支付給標(biāo)注員的薪酬卻如此之低,這讓人感到憤怒。”維克多說。當(dāng)被告知Remotasks與Scale的關(guān)系時,他才知道自己參與的其中一項任務(wù)的指令與OpenAI使用的幾乎相同,這意味著他可能也在訓(xùn)練ChatGPT,時薪大約3美元。

“我記得有人發(fā)帖說,我們將來會被人銘記,”他說,“然后,另一個人回復(fù)說,我們的待遇比步兵還差,未來我們什么也不會被記住。這段話我記得很清楚。沒有人會認(rèn)可我們所做的工作和付出的努力。”

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3