這大概是2023年全世界最賠錢的一款產(chǎn)品了。2月8日,谷歌在巴黎發(fā)布一款類ChatGPT的聊天機(jī)器人——Bard(巴德),結(jié)果遭遇翻車:當(dāng)天晚上,谷歌的市值便蒸發(fā)1020億美元,折合人民幣約6932.5億元。
按照理想計(jì)劃,谷歌想用該產(chǎn)品諷刺ChatGPT“胡說八道”、“不負(fù)責(zé)任”,并稱Bard不僅能有問必答,還要真實(shí)、負(fù)責(zé)地回答,不摻雜虛假信息。
(資料圖片僅供參考)
骨感的現(xiàn)實(shí)是:在發(fā)布會上,Bard自己率先胡說八道了。
會上,Bard被問了一個(gè)問題:我可以告訴我9歲的孩子關(guān)于詹姆斯·韋伯太空望遠(yuǎn)鏡(簡稱“JWST”)的哪些新發(fā)現(xiàn)?
Bard的回答確實(shí)精彩,但卻隱藏著一個(gè)嚴(yán)重的事實(shí)錯(cuò)誤:它稱JWST拍攝到了太陽系外行星第一張照片。而事實(shí)的情況是,該照片實(shí)際由VLT望遠(yuǎn)鏡于2004年拍攝。
而該錯(cuò)誤在資本市場引起較大反響,直接或間接地導(dǎo)致了1020億美元市值蒸發(fā)——這件事給了創(chuàng)新創(chuàng)業(yè)者哪些啟發(fā)?
鉛筆道認(rèn)為,自去年12月份ChatGPT爆火以來,投資人開始由技術(shù)的炫酷,而轉(zhuǎn)向關(guān)注技術(shù)的“實(shí)用性”。
鉛筆道認(rèn)為,這種實(shí)用性包含2個(gè)層面:1,提供真實(shí)無誤的事實(shí)信息;2,提供科學(xué)準(zhǔn)確的決策參考——而前者是后者的決策依據(jù)。
一位長期關(guān)注ChatGPT的投資人向鉛筆道透露,如果2個(gè)價(jià)值均無法實(shí)現(xiàn),該技術(shù)最終只能淪為一個(gè)扯淡神器,供用戶娛樂消遣,但無法幫助用戶解決大部分工作、生活問題。
當(dāng)然,這確實(shí)對ChatGPT提出了更高的要求。據(jù)一部分ChatGPT用戶向鉛筆道反饋,在產(chǎn)品發(fā)布初期,該產(chǎn)品給人留下最驚艷的印象是:1,它能聽懂人話;2,它能理解字面背后的需求;3,有模有樣地提供事實(shí)及建議。
但一個(gè)現(xiàn)實(shí)問題是,這類產(chǎn)品并不能保證內(nèi)容的真實(shí)與客觀性:不僅僅是Bard,ChatGPT也是如此。
一位ChatGPT用戶曾提問:請用一張表列舉納斯達(dá)克-100指數(shù)從創(chuàng)立到今天的年均回報(bào)率。ChatGPT很流暢地給出了答案,但實(shí)際對比后發(fā)現(xiàn):結(jié)果是錯(cuò)的。
真實(shí)與準(zhǔn)確一直是AI長期追求但難以企及的目標(biāo)。
以語音AI為例。8年前,一位語音領(lǐng)域獨(dú)角獸公司的CTO曾向鉛筆道編輯交流:作為一個(gè)語音機(jī)器人,該怎樣充分解決用戶的實(shí)際問題。
他談到,產(chǎn)品的核心分為3個(gè)環(huán)節(jié):語音識別、語音分析、知識圖譜。語音識別即“聽懂字面意思”,語音分析即“聽懂字面意思背后的需求”,知識圖譜即“提供準(zhǔn)確的解決方案”。
舉個(gè)例子,用戶向語音機(jī)器人輸入“北京天氣”。在識別環(huán)節(jié),它需要聽懂:這是“北京地區(qū)天氣”的意思;在分析環(huán)節(jié),它需要聽懂字面意思背后的需求:用戶可能是想查詢未來3日北京天氣,而不是10年前的北京天氣。
而在知識圖譜環(huán)節(jié)就復(fù)雜了,它需要給出真實(shí)客觀的答案:比如從氣象局調(diào)取真實(shí)資料,以圖表形式呈現(xiàn)陰晴、氣溫等元素。
在2014年前后,語音AI的階段還停留在“識別階段”,行業(yè)的平均準(zhǔn)確性約為94%;而知識圖譜的準(zhǔn)確性偏低,達(dá)到80%就算優(yōu)質(zhì)產(chǎn)品。
即便到了2023年,“識別”環(huán)節(jié)的準(zhǔn)確性也僅從94%提升至98%(頂級水平)——這是一個(gè)長期追求但不可一蹴而就的目標(biāo)。
綜上,鉛筆道可以將其類比總結(jié)為:ChatGPT在“識別+分析”環(huán)節(jié)有著驚艷的表現(xiàn),但在“知識圖譜”的表現(xiàn)不達(dá)資本預(yù)期——這一點(diǎn),可能很大程度上將阻礙其商業(yè)化進(jìn)程。
就好比圍棋機(jī)器人AlphaGo——如果它是一款很炫酷但總下臭棋的機(jī)器人,必然是無法引得全世界矚目的。AlphaGo的商業(yè)價(jià)值在于,它不僅會下棋,而且能夠戰(zhàn)勝99.9999%的人類。
AlphaGo之所以能夠取得如此成績,關(guān)鍵的要素之一在于它的訓(xùn)練集:它學(xué)習(xí)了1萬多幅專業(yè)棋手對決的棋譜,完成了3000萬盤自我對弈棋局。
這些訓(xùn)練集有真實(shí)及科學(xué)性,有明確的學(xué)習(xí)目標(biāo)(勝?。鳦hatGPT不同。
ChatGPT是一個(gè)通用人工智能產(chǎn)品(AGI),它訓(xùn)練集主要來自四大模塊:
第一塊是Common Crawl(占60%)。簡而言之,這是一個(gè)“爬蟲爬取的巨大互聯(lián)網(wǎng)數(shù)據(jù)庫”。
第二塊是WebText2(占20%)。簡而言之,這是一個(gè)社交媒體數(shù)據(jù)庫(如Reddit)。
第三塊是書籍(占16%)。
第四塊是維基百科(占3%)。
以上四點(diǎn)可以發(fā)現(xiàn),前2個(gè)模塊是未經(jīng)“真實(shí)+科學(xué)”檢驗(yàn)的內(nèi)容。由此便可以理解:ChatGPT提供的內(nèi)容,并不能100%達(dá)到用戶預(yù)期。
這也側(cè)面說明一個(gè)問題,當(dāng)下的類ChatGPT產(chǎn)品,并不能完美地創(chuàng)造兩大主流商業(yè)價(jià)值:1,提供真實(shí)無誤的事實(shí)信息;2,提供科學(xué)準(zhǔn)確的決策參考。
當(dāng)然,這并非一個(gè)完全無法攻克的問題。若要追求接近100%的真實(shí)與科學(xué)性,行業(yè)可以推出更多垂直版ChatGPT機(jī)器人,它們的訓(xùn)練集可以盡可能地來自書籍、百科科學(xué)內(nèi)容。
但令人欣慰的是,業(yè)內(nèi)終于不再就技術(shù)討論技術(shù),而是真正開始關(guān)注技術(shù)的實(shí)用性。在這股用戶需求之下,各類ChatGPT產(chǎn)品才能持續(xù)行駛在正軌,離商業(yè)化越來越近。