不到三個月,國內(nèi)大模型已經(jīng)遍地開花。
百度文心一言,阿里巴巴通義千問、商湯日日新、SenseNova體系、華為云盤古、知乎“知海圖 AI”、360GPT、昆侖萬維“天工”大模型、京東言犀…互聯(lián)網(wǎng)各個領(lǐng)域的巨頭們爭相推出了自家的大模型,伴隨而來的還有大佬之間許久未見的口水戰(zhàn)。
(資料圖片僅供參考)
跨界而來的更是不少。4月14日,專注造車的雷軍發(fā)微博稱小米要全力以赴、堅決擁抱大模型和生成式人工智能(AIGC),而由美團聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場創(chuàng)始人李開復(fù)、搜狗創(chuàng)始人王小川等企業(yè)高管領(lǐng)銜的“AI大模型創(chuàng)業(yè)軍團”,也早對AI大模型風(fēng)口“虎視眈眈”。
互聯(lián)網(wǎng)正在迎來“人人都做大模型”的時代。據(jù)不完全統(tǒng)計,截至目前,我國已有超過40家公司、機構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。
這一幕似曾相識。前兩年,無論是車企還是手機廠商又或是互聯(lián)網(wǎng)大廠,接二連三地扎進“造芯”賽道,甚至于連地產(chǎn)、家電、百貨、水泥廠等企業(yè)也直接橫跨到科技業(yè),開始了造芯之路。這些造芯企業(yè)發(fā)展得如何?一個不樂觀的消息是,2022年國內(nèi)注銷吊銷的芯片企業(yè)高達5746家,同比2021年增長68%。
可以說,風(fēng)口之下難免導(dǎo)致整個產(chǎn)業(yè)魚龍混雜,而在劣幣驅(qū)逐良幣的效應(yīng)下,過熱可能并不利于產(chǎn)業(yè)發(fā)展和技術(shù)突破。
風(fēng)口里的“燈下黑”轟轟烈烈的全民造芯運動,一度把國民對于芯片行業(yè)實現(xiàn)國產(chǎn)替代的期待推向高潮,在這種熱烈的氛圍之中,“造芯”企業(yè)如雨后春筍般涌出。
根據(jù)企查查數(shù)據(jù)顯示,2020年新增芯片相關(guān)企業(yè)2.37萬家,同比增長160.69%,2021年新增4.79萬家,同比增長102.30%,而僅2022年上半年,新增芯片相關(guān)企業(yè)就高達3.08萬家。
圖片來源:每經(jīng)記者
當前的大模型熱潮,一如當初的芯片產(chǎn)業(yè),盡管技術(shù)壁壘極高,但并不妨礙巨頭及創(chuàng)業(yè)者們一擁而入。4月18日,僅一天,6個關(guān)于大模型的重要消息密集公布:釘釘宣布正式接入阿里“通義千問”大模型;字節(jié)跳動旗下火山引擎發(fā)布自研DPU(數(shù)據(jù)處理單元)芯片;斑馬智行宣布接入“通義千問”大模型,智己汽車成為首個上車品牌…
這場全球性技術(shù)浪潮由ChatGPT的爆火而起,ChatGPT在聊天對話、創(chuàng)作劇本、撰寫研報、應(yīng)用編程等方面表現(xiàn)出的能力驚艷四座,讓外界看到了生成式AI在生產(chǎn)力和生產(chǎn)效率提升上的巨大變革性力量?;蛟S也是因為在應(yīng)用層的率先破局,最初國內(nèi)互聯(lián)網(wǎng)的關(guān)注點更多聚焦在誰能創(chuàng)造出下一個類ChatGPT產(chǎn)品,然而,現(xiàn)在國內(nèi)的風(fēng)口卻明顯轉(zhuǎn)向了大模型。
這其中不單單是阿里、字節(jié)跳動、百度等巨頭,像商湯科技、昆侖萬維等不具備足夠數(shù)據(jù)體量和資金規(guī)模的企業(yè)也紛紛下場。
在海外,其實切入大模型賽道的還是原來那么幾家,而在國內(nèi),短短兩個月內(nèi)搞大模型的比美國多出幾倍。這固然是因為通用大模型極高的技術(shù)門檻讓其擁有最大化的價值,吸引了企業(yè)的進入,可另一個更為現(xiàn)實的緣由是相比ChatGPT這種能夠應(yīng)用到場景、用戶可以看得見摸得著的產(chǎn)品,大模型的認知度較低,顯然更容易講故事、炒概念,獲得資本的青睞。
股市已然說明了這一點。昆侖萬維宣布聯(lián)合奇點智源共同研發(fā)國產(chǎn)大語言模型“天工”3.5后,次日股價最高漲近16%,兩個交易日累計最大漲幅超22%;周鴻祎高調(diào)宣布擁抱大模型后,三六零股價也終于擺脫了長期的低迷狀態(tài)。
根據(jù)Wind數(shù)據(jù)顯示,截至4月24日收盤,三六零、昆侖萬維、云從科技今年以來股價漲幅達153.52%、287.23%、155.58%。另外,招銀國際發(fā)表研報指出,因近3個月ChatGPT對相關(guān)概念股股價的拉動,芯片、光模塊、PCB、服務(wù)器年初至今已各漲65%、146%、45%、62%。
虛火過旺,市場泡沫就越大,渾水摸魚的投機者就越多。當初全民造芯如火如荼,無論大小企業(yè)都給自己帶了頂“自研”的帽子,但如今那些高喊著實現(xiàn)國產(chǎn)替代口號的企業(yè),早已把所謂斥巨資的造芯計劃拋之腦后。而各地產(chǎn)業(yè)園,則留下了越來越多爛尾的芯片項目。
自研AI大模型并不比自研芯片容易,且不說當前存在的技術(shù)差距,過熱的大模型開發(fā)賽道,一方面容易衍生出造假騙局,一旦造假成風(fēng),真正想搞自研的會越來越少。更重要的是,在圍繞生成式AI的龐大產(chǎn)業(yè)生態(tài)中,當大小巨頭們都集中搞大模型去了,相互內(nèi)耗,反而可能導(dǎo)致停滯。芯片產(chǎn)業(yè)便是如此。
內(nèi)耗“扼殺”科技ChatGPT的成功得益于微軟慷慨的資金和算力支持。美國市場研究機構(gòu)TrendForce推算稱,處理ChatGPT的訓(xùn)練數(shù)據(jù)需要2萬枚GPU芯片,隨著OpenAI進一步展開ChatGPT和其他GPT模型的商業(yè)應(yīng)用,其GPU需求量將突破3萬張(該報告計算以A100芯片為主)。
而除了微軟,還有一家開源公司幫著做部署,也有專門的公司來進行數(shù)據(jù)清洗,OpenAI只聚焦在模型上。這是基于龐大的產(chǎn)業(yè)鏈和生態(tài)所需,從通用大模型到模型訓(xùn)練再到應(yīng)用開發(fā),以及與特定場景的融合,一家公司根本難以全部包攬,由專攻各個環(huán)節(jié)的企業(yè)之間相互協(xié)同,才更有可能實現(xiàn)突破。
在這點上,芯片產(chǎn)業(yè)與之極為相似,芯片架構(gòu)、芯片設(shè)計、芯片制造的設(shè)備和材料、封測…圍繞不同領(lǐng)域、不同行業(yè)、不同環(huán)節(jié),經(jīng)過多次競爭、重組和整合,已經(jīng)形成了專業(yè)的、規(guī)?;陌雽?dǎo)體巨頭,各司其職,上下游相互配合,共同推動半導(dǎo)體產(chǎn)業(yè)前進。
然而,國內(nèi)的造芯進程并沒有沿著這種脈絡(luò)推進,大小公司涌入芯片產(chǎn)業(yè),哪種芯片的市場熱度高、哪個環(huán)節(jié)的技術(shù)門檻低、哪種芯片項目更容易獲得當?shù)卣龀?,他們就一窩蜂似的跑到哪里,因此導(dǎo)致眾多芯片企業(yè)或跨界造芯的企業(yè)往往集中在一個領(lǐng)域搶奪市場和人才,造成內(nèi)耗,最后誰也無法從國外芯片廠商的口中分到蛋糕。
這尤為表現(xiàn)在相互挖角上。在國內(nèi)芯片產(chǎn)業(yè)存在嚴重人才缺口的背景下,高精尖人才或者經(jīng)驗豐富的工程師本就不多,全民造芯運動讓這個行業(yè)又涌入了一大批參與者,他們用盡各種辦法從半導(dǎo)體企業(yè)挖人。
“在某些關(guān)鍵崗位上,薪資翻了兩倍甚至三倍”,一位曾經(jīng)在中國大陸頭部晶圓代工廠的研發(fā)人員表示,他所在的大廠,在過去幾年里,研發(fā)人員流失了近七成。而很多時候,受高薪酬的刺激,一名主管跳槽后可能會帶走一群人,這群人負責的項目就會被耽誤,從而影響到生產(chǎn)進度。
在國內(nèi),大模型掀起的資本和創(chuàng)業(yè)浪潮才不過兩三個月,也已拉開了人才爭搶的序幕。
2月14日,脈脈創(chuàng)始人、CEO林凡在自己的社交媒體上發(fā)了一段話:“ChatGPT帶動的AIGC創(chuàng)業(yè)熱潮要來了!獵頭已經(jīng)開出10萬月薪搶人?!倍鴵?jù)一位業(yè)內(nèi)人士透露,“在一個算法團隊中,對領(lǐng)頭的Leader來說10萬月薪并不高,畢竟如果沒有Leader,再多薪資也有點賭博的成分”。
近日還有傳言稱,字節(jié)跳動開出140萬美元年薪,挖角了ChatGPT的研發(fā)公司OpenAI團隊成員。
“聚是一朵花,散是滿地沙”,一位半導(dǎo)體咨詢機構(gòu)首席分析師曾在文章中這樣表述國內(nèi)的芯片產(chǎn)業(yè),而如果看向當前的大模型風(fēng)口,可以發(fā)現(xiàn),主力集中在大模型或大模型概念的現(xiàn)狀,讓國內(nèi)巨頭之間有了直接的競爭關(guān)系,這是“散”,而不是“聚”,每個巨頭都想做大模型,可能每家都做不大。
更困惑的是,國產(chǎn)大模型進入井噴期,但沒有一個能打過GPT-4的,再做這種重復(fù)性的工作究竟有沒有價值呢?
資本不長情,國內(nèi)“無微軟”2015年左右,當互聯(lián)網(wǎng)經(jīng)濟在創(chuàng)新力量的帶動下熱火朝天,資本的目光幾乎全部放在互聯(lián)網(wǎng)商業(yè)上,此時的半導(dǎo)體則是投資圈的“冷門項目”。轉(zhuǎn)折發(fā)生在制裁事件之后,芯片技術(shù)被卡脖子的痛楚讓行業(yè)不得不走向國產(chǎn)替代的計劃,全民造芯的推動下,資本聞風(fēng)而動。
數(shù)據(jù)顯示,2021年,中國芯片半導(dǎo)體融資事件達超800起創(chuàng)下歷史記錄,進入到2022年,截至11月22日,行業(yè)融資事件為675起,融資規(guī)模達1116億元。
而從中國芯片半導(dǎo)體行業(yè)單筆事件融資平均金額來看,2013 年及以前行業(yè)平均單筆融資較少,未超過4000萬,2014 年之后單筆平均融資金額邁向億元級別,而在2017年,創(chuàng)下至今最高歷史記錄,單筆平均融資達到 8億元。
芯片行業(yè)燒錢,甚至遠超過互聯(lián)網(wǎng)風(fēng)口的燒錢大戰(zhàn),資本的進入和追逐,可以說是國內(nèi)芯片產(chǎn)業(yè)發(fā)展的一大助力。但是龐大的造芯“大軍”,讓不斷增長的資金體量似乎顯得仍然有些不足,人才、生產(chǎn)線、場地、設(shè)備都需要持續(xù)的投入,且資本無情,一旦長時間看不到回報,或市場突變,很少會繼續(xù)堅持。
如射頻芯片,被股民稱為“半導(dǎo)體茅臺”射頻前端巨頭卓勝微,股價在2021年下半年開始暴跌,如今,卓勝微的市值已經(jīng)縮水至657億元,僅約為其最高點時的三分之一,受其影響,射頻行業(yè)中的資本正在全面撤退。
論燒錢,大模型及大模型訓(xùn)練自然不遑多讓。單是運營成本,半導(dǎo)體研究公司SemiAnalysis稱,以GPT-3模型推算,ChatGPT每天的運營成本高達70萬美元,按每日70萬美元計算,則ChatGPT一年的運營成本高達2.555億美元(約17.6億人民幣),因此,新一代的GPT-4模型只會更燒錢。
一位投資經(jīng)理表示,過去,團隊健全的大佬創(chuàng)業(yè)項目,一般第一輪估值2-3億元就已經(jīng)很高,但放到大模型創(chuàng)企來說,光1年租1000張GPU卡就要花大幾千萬到1億元的支出。
過高的進入門檻,讓很多投資機構(gòu)望而生畏,不過基于大模型構(gòu)建的各類生成式AI創(chuàng)業(yè)項目,以及在這場技術(shù)熱潮中被重新捧紅的相關(guān)AI企業(yè),還是讓各路資本心動不已。權(quán)威數(shù)據(jù)統(tǒng)計機構(gòu)之一PitchBook的數(shù)據(jù)顯示,全球?qū)ι墒紸I的投資從2020年到現(xiàn)在增長了425%,僅2022年的投資額就多達21億美元。
雖然從融資主體來看,當前獲得較高資本注入的多是海外企業(yè),但國內(nèi)大模型之戰(zhàn)已然拉開序幕,這場科技浪潮必然會裹挾更多的資本。當然,資本是把雙刃劍,從芯片產(chǎn)業(yè)來看,資本的輸血,造成了射頻行業(yè)的內(nèi)卷,過度競爭的趨勢下,使得國產(chǎn)射頻芯片仍然擺脫不了高端不足、低端過剩的現(xiàn)狀。
另一方面,國內(nèi)資本固然雄厚,可對大模型及模型訓(xùn)練賽道而言,互聯(lián)網(wǎng)或其他行業(yè)巨頭能否像微軟一樣“培育”出下一個“OpenAI”,著實令外界質(zhì)疑。從區(qū)塊鏈到元宇宙再到Web3.0,國內(nèi)巨頭們對技術(shù)性風(fēng)口的追逐和熱愛,似乎總不怎么堅定,也缺乏足夠的耐心。
二三十年前,我們抓住了互聯(lián)網(wǎng)的變革時機,二三十年后,我們還能立于新一代技術(shù)變革的潮頭上嗎?