能聊天、代寫論文、作詩編程樣樣不在話下,ChatGPT發(fā)布不到一周便收獲了百萬用戶。其鋒芒從美國(guó)席卷到中國(guó),但在地球另一邊的非洲大陸上,一群為OpenAI工作的外包數(shù)據(jù)標(biāo)注員,曾遭受過非人的精神折磨。
【資料圖】
坐在電腦前、閱讀一段文本、給出相應(yīng)的標(biāo)注、緊接著切換到下一段……這就是數(shù)據(jù)標(biāo)注員的日常。在這場(chǎng)席卷中美兩個(gè)市場(chǎng)的資本狂歡中,他們是邊緣化的、被遺忘的卻又至關(guān)重要的一個(gè)群體。
據(jù)美國(guó)《時(shí)代周刊》報(bào)道顯示,為了訓(xùn)練ChatGPT,OpenAI雇傭了時(shí)薪不到2美元的外包肯尼亞勞工,他們所負(fù)責(zé)的工作就是數(shù)據(jù)標(biāo)注。
數(shù)據(jù)標(biāo)注的工作流程包括數(shù)據(jù)標(biāo)注、打標(biāo)簽、分類、調(diào)整和處理等,是構(gòu)建AI模型的數(shù)據(jù)準(zhǔn)備和預(yù)處理工作中不可或缺的一環(huán)。對(duì)于ChatGPT這樣的語言模型,如果沒有人工標(biāo)注來篩除一些不恰當(dāng)?shù)膬?nèi)容,那么它不僅會(huì)給出一些錯(cuò)誤的信息,更會(huì)對(duì)用戶造成心理不適。
更何況,類似ChatGPT這樣的預(yù)訓(xùn)練模型在訓(xùn)練過程中需使用的數(shù)據(jù)樣本較多,數(shù)據(jù)標(biāo)注的需求較高。
那么如何規(guī)避上述問題,篩查出有害內(nèi)容呢?OpenAI效仿了Facebook等社交媒體公司的做法——構(gòu)建一個(gè)額外的AI模型,向它提供暴力、仇恨等帶有攻擊性的言論,從而讓它學(xué)會(huì)識(shí)別相應(yīng)內(nèi)容。這樣的模型會(huì)被內(nèi)置到ChatGPT中,幫助后者過濾掉一些有害的文本。
在這個(gè)過程中,需要大量的人力來給攻擊性言論做標(biāo)注。于是,OpenAI在2021年底與一家外包公司Sama達(dá)成了合作。兩者簽署了三份總價(jià)值約20萬美元的合同,OpenAI向Sama發(fā)送了數(shù)萬個(gè)文本片段,包含大量的有關(guān)謀殺、自殘、虐待甚至其他更加不堪的內(nèi)容。Sama公司的每一個(gè)數(shù)據(jù)標(biāo)注員的日常工作流程就是閱讀文本并為其添加相應(yīng)的標(biāo)簽。
“那是酷刑”Sama是一家主營(yíng)數(shù)據(jù)訓(xùn)練的公司,專注于為人工智能算法注釋數(shù)據(jù),客戶包括沃爾瑪、谷歌、通用汽車和微軟等多個(gè)海外大廠。
Sama官網(wǎng)
據(jù)《紐約時(shí)報(bào)》早年報(bào)道和維基百科注釋,Sama標(biāo)榜自己為一家有道德的公司:“Sama的使命是在數(shù)字經(jīng)濟(jì)時(shí)代為低收入人群增加就業(yè)機(jī)會(huì)?!贝送猓韭暦Q已幫助超五萬人擺脫了貧困。
而Sama數(shù)據(jù)標(biāo)注員的真實(shí)工作情況如何?據(jù)《時(shí)代周刊》披露,根據(jù)資歷和表現(xiàn),Sama為OpenAI雇用的數(shù)據(jù)標(biāo)注員的實(shí)際工資約為每小時(shí)1.32美元至2美元。有三位員工透露,在Sama,三十余名工人被分成三個(gè)小組,他們每九小時(shí)輪班閱讀和標(biāo)記150至250段文字,每段文字大約100詞到1000詞不等。
上述被采訪員工均表示,這份工作給他們留下了“精神創(chuàng)傷”,雖然他們能夠參加公司組織的團(tuán)體心理輔導(dǎo),但輔導(dǎo)并沒有提供任何的幫助。此外,由于Sama對(duì)員工工作效率要求極高,所以公司很少組織心理輔導(dǎo)活動(dòng)。有員工曾提出想與心理輔導(dǎo)員一對(duì)一進(jìn)行咨詢,但被Sama的管理層拒絕。
其中一位數(shù)據(jù)標(biāo)注員坦言,在閱讀了一些過于不堪的內(nèi)容后,他反復(fù)出現(xiàn)幻覺?!澳鞘强嵝獭!彼硎荆罢麄€(gè)一周,你會(huì)反復(fù)的閱讀這樣的內(nèi)容。等到周五,你會(huì)不停想象與它相關(guān)的場(chǎng)景?!?/p>Sama的回應(yīng)
低薪、高強(qiáng)度、創(chuàng)傷性的標(biāo)注工作折磨著肯尼亞工人的身心。對(duì)于來自《時(shí)代周刊》等媒體的“控訴”,Sama回應(yīng)外媒Quartz稱,其支付給標(biāo)注員的薪資幾乎是東非其他內(nèi)容審核公司的兩倍,并給員工提供福利和養(yǎng)老金,并聲稱這樣的待遇在東非并不常見。
據(jù)了解,肯尼亞并沒有統(tǒng)一的最低薪資規(guī)定。但在內(nèi)羅畢(肯尼亞首都),一個(gè)接待員的最低時(shí)薪是1.52美元,而Sama的數(shù)據(jù)標(biāo)注員最低薪資僅為1.32美元。在Sama與OpenAI的合同中,OpenAI向Sama支付每小時(shí)12.5美元的工作費(fèi)用,是Sama數(shù)據(jù)標(biāo)注員最低薪資的9倍以上。
Sama的發(fā)言人還表示,在每九小時(shí)的輪班工作里,標(biāo)注員只需要標(biāo)記70段文字,而不是上文所述的150至250段文字。此外,數(shù)據(jù)標(biāo)注員的稅后時(shí)薪為1.46美元至3.74美元。合同中每小時(shí)12.5美元的工作費(fèi)用覆蓋了包括基礎(chǔ)設(shè)施、質(zhì)檢、管理團(tuán)隊(duì)薪資等在內(nèi)的所有成本。
針對(duì)員工遭受心理折磨的情況,Sama的發(fā)言人則聲稱,公司十分重視員工的心理健康?!拔覀?yōu)閱T工提供一對(duì)一的心理咨詢。在審核、標(biāo)注工作過程中,員工可以隨時(shí)退出工作,且不會(huì)受到任何的懲罰?!痹摪l(fā)言人補(bǔ)充道,“員工標(biāo)注有害內(nèi)容的時(shí)間是有限的,敏感信息會(huì)有專人處理?!?/p>違法、解約和失業(yè)
2022年2月,OpenAI與Sama加深了合作,OpenAI要求Sama收集數(shù)千張暴力和黃色的圖片,其中包括一些違法美國(guó)法律的內(nèi)容。據(jù)《時(shí)代周刊》、《布魯塞爾時(shí)報(bào)》等外媒報(bào)道,當(dāng)月,Sama給OpenAI交付了一批1400張圖像的樣本,后者向前者支付了787.5美元。
但很快,兩者的合作破裂。Sama在一份聲明中表示,有關(guān)圖像收集工作的原始合同并未包含違法內(nèi)容,但工作開始后,OpenAI向其發(fā)送了一份附加說明,其中提及到一些涉嫌違法的內(nèi)容。因此,Sama決定終止與OpenAI的合作。
在2022年2月下旬,陸陸續(xù)續(xù)有Sama的員工收到了轉(zhuǎn)崗和裁員的通知。一位員工無奈的表示:“對(duì)我們來說,這是一份養(yǎng)家糊口的工作。而現(xiàn)在,僅有30多名工人被迫轉(zhuǎn)到更低薪的崗位,其他人都面臨失業(yè)。”
今年1月10日,Sama宣布取消所有涉及到敏感內(nèi)容的工作,并表示不會(huì)與Facebook續(xù)簽價(jià)值390萬美元的內(nèi)容審核合同。據(jù)了解,F(xiàn)acebook也曾被指控雇傭外包勞工來審核有害內(nèi)容。
Sama表示,經(jīng)團(tuán)隊(duì)多次討論后,公司決定剝離自然語言處理和內(nèi)容審核業(yè)務(wù),專注于構(gòu)建計(jì)算機(jī)視覺數(shù)據(jù)標(biāo)注解決方案。