從1956年的達特茅斯會議起,人工智能就深深地烙印在了IT技術(shù)的發(fā)展史上。60余年的發(fā)展、沉淀,已是"AI技術(shù)萬口傳,至今已覺不新鮮"。從概念到實踐,從技術(shù)到產(chǎn)品,AI技術(shù)已經(jīng)在智能客服、智能家居、醫(yī)療診療、工業(yè)機器人、無人駕駛等領(lǐng)域多點開花。
計算機視覺技術(shù)堪稱AI皇冠上的一顆明珠,不論是在技術(shù)深度還是商業(yè)應用方面都走在了行業(yè)的前沿。9月5日,騰訊云TVP AI技術(shù)閉門會遍邀計算機視覺領(lǐng)域的技術(shù)大咖、專家學者、資深從業(yè)者們一起線上論道,層層深入解構(gòu)計算機視覺技術(shù),從個性化的商業(yè)化實踐中探索共性化的發(fā)展方向,為行業(yè)進一步發(fā)展勾勒出潛在的藍圖。
面向規(guī)?;涞氐囊曈XAI技術(shù)
"視覺AI技術(shù)嚴謹?shù)慕蟹ㄊ怯嬎銠CCV,在過去,AI是AI,CV是CV。最近幾年伴隨著深度學習的火爆,開始逐漸有了統(tǒng)一融合的趨勢,所以有了現(xiàn)在的視覺AI。在To B領(lǐng)域,視覺AI技術(shù)已經(jīng)滲透到了眾多行業(yè),開啟了一輪規(guī)模化的落地之旅。"
優(yōu)圖實驗室-昊天研究中心負責人 & 專家研究員郭曉威老師向與會者介紹了視覺AI技術(shù)的歷史起源。他表示,視覺AI的基本任務就是讀懂圖像,目前為大眾所熟知的商業(yè)化應用案例包括人臉核身、內(nèi)容理解與廣告推薦、泛娛樂、內(nèi)容審核等方向。目前尤其是在教育、工業(yè)、支付、廣電等行業(yè)有深度結(jié)合。
郭曉威表示,影響AI規(guī)模化、商業(yè)化落地的因素無非就三個:成本、安全和數(shù)據(jù)。
· 成本:數(shù)據(jù)、設(shè)備、人才、市場培育與開拓,這些都需要大量資金的投入,成本高昂。
· 安全:精度和可靠性,在某些領(lǐng)域比如醫(yī)療行業(yè),AI能給的只是參考,對解決醫(yī)生痛點的幫助不夠大。
· 數(shù)據(jù):AI需要的數(shù)據(jù)尤其是細分場景數(shù)據(jù)的獲取難,標注難,此外數(shù)據(jù)隱私的問題也是一大掣肘。
細分之下,又有5大規(guī)?;涞靥魬?zhàn)需要解決。
挑戰(zhàn)一:標注成本過高,如何降本增效
業(yè)界曾有過一種自嘲的說法叫有多少人工,就有多少智能。這一句話道出了標注成本過高的痛點,如何用技術(shù)的手段實現(xiàn)降本增效?郭曉威表示主動學習是一個有效的解決方式。主動學習的好處是不需要進行全量標注,經(jīng)驗下只需要小于標注總量的一半即可,這個過程可以邊學習,邊篩選,直至收斂。為此,他舉了一個優(yōu)圖實驗室在智慧醫(yī)療場景下糖網(wǎng)分級識別的案例。在這個案例中,騰訊優(yōu)圖基于信息熵與特征空間密度的主動學習,做到了同等效果下,標注成本節(jié)省超過一半,標注量級達到數(shù)十萬時,節(jié)省成本可達百萬級。
挑戰(zhàn)二:數(shù)據(jù)量太少,訓練效果差,怎么辦
第二個挑戰(zhàn)在于數(shù)據(jù)量太少,影響到訓練效果。在To C場景下,數(shù)據(jù)的獲取方式相對容易,數(shù)據(jù)量也比較大,但在To B場景下卻完全相反。這種情況下,樣本增強,小樣本學習(Few shot learning),GAN等技術(shù)就比較值得推薦。尤其是小樣本學習,支持極少量樣本訓練,最大化利用存量的樣本,以實現(xiàn)最大可能性的泛化效果。在貨架商品識別與小樣本學習技術(shù)方面,騰訊優(yōu)圖提出了樣本構(gòu)成、損失函數(shù)和后處理三個相對業(yè)界主流方案的創(chuàng)新點,實現(xiàn)了相對優(yōu)化前提升10-30個百分點,與全量樣本差距小于10%的顯著效果。
挑戰(zhàn)三:數(shù)據(jù)太少,偽造行不行?
第三個問題其實是對第二個的追問,能不能通過數(shù)據(jù)生成的手段,或者說偽造數(shù)據(jù)的方式來彌補數(shù)據(jù)的不足。GAN是最近幾年比較火的對抗生成技術(shù),它的本質(zhì)其實就是通過生成器來學習符合目標分布的數(shù)據(jù),也就是所謂的"無中生有"。郭曉威表示,如果GAN的結(jié)果符合目標的真實分布,還是能起到一些作用。但是這種作用可能還是分場景,不見得每個場景都一定會有很好的效果,所以需要小心的設(shè)計。
郭曉威提到一個車型識別的案例:白天場景下的車型識別對AI而言相對輕松,但在夜晚場景就難度陡增。一是因為這類數(shù)據(jù)量相對較少,另一個是光線昏暗也不利于人工標注。優(yōu)圖實驗室的解決方案是利用CycleGAN的技術(shù),通過大量使用白天數(shù)據(jù)自動生成、模擬夜晚數(shù)據(jù),然后將模擬后的夜晚數(shù)據(jù)與真實夜晚數(shù)據(jù)混到一起訓練,最終成功使夜晚識別效果大幅提升。
挑戰(zhàn)四:商業(yè)場景多變,AI泛化能力差,調(diào)優(yōu)又太慢
技術(shù)上而言,在一個特定場景下訓練出的表現(xiàn)效果可以做到非常好,但換了場景以后效果就直線下降。解決方案上,技術(shù)手段要做場景遷移,常用的手段就是遷移學習,最簡單的就是把目標數(shù)據(jù)標完之后再進行訓練。但這種情況下需要大量的標注數(shù)據(jù),從采集標注到訓練,通常也需要較長周期。郭曉威推薦了領(lǐng)域自適應技術(shù),可以快速適應新場景,具有成本低、效果好、普遍適用等優(yōu)勢。
優(yōu)圖實驗室針對領(lǐng)域自適應技術(shù),提出了一個創(chuàng)新的ReID技術(shù),具體原理及效果如下圖所示:
挑戰(zhàn)五:AI需要海量數(shù)據(jù),如何保護客戶/用戶隱私?
AI的成長需要海量的訓練數(shù)據(jù),從場景中來的數(shù)據(jù)能讓效果最大最優(yōu)化。但通常場景中的數(shù)據(jù)也涉及一個隱私問題,很多時候用戶數(shù)據(jù)不能離開本地。有沒有辦法既能滿足AI的訓練,又能夠保護用戶的隱私呢?郭曉威分享了一個名為AceCV系統(tǒng),它可以支持本地數(shù)據(jù)訓練,模型自主進化與集成,實現(xiàn)方案基于領(lǐng)域自適應與模型集成等技術(shù),完成端+云升級。
與聯(lián)邦學習相比,AceCV系統(tǒng)不需要傳數(shù)據(jù)和梯度,只需低頻進行模型回傳,同時具備自主進化模塊和模型集成模塊,保證場景模型持續(xù)低成本迭代、聯(lián)合多場景優(yōu)勢升級云端模型。優(yōu)圖實驗室去年創(chuàng)新地提出了濾波器嫁接技術(shù)(Filter Grafting),可支持多模型之間取長補短,互助升級。
分享結(jié)束后,郭曉威老師還針對留言區(qū)提出的問題作了精彩解答,篇幅所限,此處不再贅述。
騰訊云視覺AI的商業(yè)化產(chǎn)品實踐探索
"頂天還是立地,改變世界還是努力賺錢?這是我本次分享的副標題,也是我們想與業(yè)界一起探討的問題。"
騰訊云AI視覺產(chǎn)品中心總經(jīng)理王磊向與會者完整地分享了騰訊云AI目前所處的位置與所做出的成果。他介紹到,騰訊云AI是騰訊AI的商業(yè)化出口,在底層的算法、云資源層面,有包括騰訊優(yōu)圖、微信AI、AI Lab、音視頻實驗室在內(nèi)的一系列頂級實驗室和海量的服務器、GPU/CPU等資源;在平臺和產(chǎn)品層面,包含泛娛樂平臺、工業(yè)AI平臺、廣電傳媒AI中臺、內(nèi)容審核平臺四大平臺,提供文字識別、人臉識別、圖像識別、知識圖譜、AR/VR等一系列豐富產(chǎn)品;在生態(tài)層面,圍繞開發(fā)者社區(qū)、培訓、競賽、AI加速器、眾創(chuàng)空間、專項合作計劃為行業(yè)提速。
騰訊云AI在商業(yè)化落地的探索中,不斷踩坑填坑,一路成長,積累了可供業(yè)界參考的寶貴經(jīng)驗。王磊將其總結(jié)為四大階段:確定方向、孵化產(chǎn)品、打造標桿、推廣復制。
確定方向
確立方向是第一個環(huán)節(jié)的工作,簡單來說就是選擇做什么。道路千萬條,勝利第一條。選擇方向錯,團隊兩行淚。騰訊云AI的做法是首先對行業(yè)的關(guān)鍵流程或重點問題進行深入的分析,推演應用方式和商業(yè)模式。比如在教育行業(yè),可以從核心的教、考、管、育的教學流程中去尋找AI的應用場景,最后發(fā)現(xiàn)使用人臉識別可以幫助學生非常方便的完成網(wǎng)課的登錄,不需要再去設(shè)置密碼,而且天然地帶有身份認證,避免了代打卡、替考等情況。
除了對行業(yè)的洞察之外,在確立方向的時候也可以參考業(yè)界主要玩家的情況,特別是已經(jīng)存在的頭部玩家。騰訊云在做AI的產(chǎn)品開發(fā)設(shè)計的時候會去調(diào)研市場主要玩家的情況,這直接影響該市場未來競爭的激烈程度。
孵化產(chǎn)品
這里主要考慮兩個問題,一是技術(shù)是否可行;二是產(chǎn)品的價值是什么,特別是和競品比,產(chǎn)品的差異化或者優(yōu)勢是什么。王磊以騰訊慧眼的案例拆解了孵化產(chǎn)品這一步的核心問題,可以看到,慧眼人臉核身的四層設(shè)計形成了這樣一整套立體化豐富的安全的刷臉系統(tǒng),具備較高的商業(yè)價值和廣泛的應用場景。目前國內(nèi)市場上,慧眼是份額第一的人臉核身產(chǎn)品。
打造標桿
標桿的打造也是檢驗產(chǎn)品的過程,產(chǎn)品是不是一個好的產(chǎn)品,關(guān)鍵要看產(chǎn)品是不是真正為客戶創(chuàng)造了價值。只有好的價值才能獲得客戶的認同,才會有后續(xù)的、持續(xù)的、健康的使用和付費。
騰訊云AI的標桿客戶不勝枚舉,王磊表示微眾銀行是一個比較典型的客戶案例。微眾銀行是國內(nèi)首家互聯(lián)網(wǎng)銀行,微眾的遠程核身流程應用了騰訊云慧眼人臉核身技術(shù),經(jīng)過媒體報道以后慧眼有了更多的客戶慕名而來。
王磊指出,標桿的打造不是一錘子買賣,所謂隔行如隔山,在某些重要的行業(yè)仍舊需要頭部企業(yè)的背書以為產(chǎn)品帶來更高的認可度。中國聯(lián)通就是騰訊云AI在電信運營商領(lǐng)域拿下的首個頭部標桿客戶,騰訊云AI也為其提供了顯著的降本效果。
除此以外,王磊還提到了深圳市的政務場景以及直播場景中的斗魚公司等案例,揭示了騰訊云AI在增效、合規(guī)等方面提供的客戶價值。
推廣復制
推廣復制環(huán)節(jié)背后的問題很復雜,但核心提煉下來其實就一個詞:增長。它和市場的供需、產(chǎn)品的價值和產(chǎn)品的特點都密切相關(guān)。王磊表示,想要做好增長首先需要想清楚三個問題:
1. 目標客戶:目標客戶是誰?目標客戶所在的行業(yè)是哪些?客戶是什么類型?是誰在使用它?是誰在給它付費?
2. 定價策略:策略是利潤最大化還是收入最大化,是要去搶占市場份額還是要去拉動活躍用戶?
3. 復制效率:如何把產(chǎn)品快速地賣給新客戶,并完成交付。
只有想清楚了這幾個問題,并做好針對性的設(shè)計,才有可能在商業(yè)化產(chǎn)品的實踐探索中找到可持續(xù)發(fā)展的方向。
王磊總結(jié)道,確定方向、孵化產(chǎn)品、打造標桿、推廣復制背后有一條暗含的邏輯,企業(yè)在不同的階段、不同的場景下所應采取的做法也不盡相同,要隨著變化而變化。AI技術(shù)的商業(yè)化產(chǎn)品實踐是一個循環(huán)演進的過程,要不斷地理解行業(yè)、提供價值、優(yōu)化價值、找尋新方向、孵化新產(chǎn)品,不斷地向前探索。
"在AI生態(tài)建設(shè)上,騰訊云AI致力于連接產(chǎn)業(yè)和開發(fā)者,共建開放生態(tài),共建共贏。我們希望有更多的合作伙伴能加入到騰訊云AI的生態(tài)里面來,一起加速人工智能行業(yè)應用的落地。"
分享結(jié)束后,王磊老師還對評論區(qū)提出的騰訊內(nèi)部AI平臺差異和落地等問題作了進一步解答。
計算機視覺技術(shù)在服裝行業(yè)的落地實踐
"從創(chuàng)業(yè)公司維度看AI在行業(yè)的落地,可能會有不一樣的視角。在人工智能落地的所有行業(yè)里面,可能服裝或者時尚這樣的一些行業(yè)是相對來講大家偏陌生的一個行業(yè)。為什么我們要選擇在服裝行業(yè)來落地人工智能,今天希望跟大家一起分享探討。"
知衣科技聯(lián)合創(chuàng)始人兼CEO鄭澤宇老師作為AI領(lǐng)域的創(chuàng)業(yè)者,帶來了一些不同于騰訊云AI落地的思考與視角。鄭澤宇老師此前曾供職于Google,也是國內(nèi)知名的TensorFlow專家。他提到,從2015年起人工智能概念開始火爆,大家都希望拿著技術(shù)的錘子去找場景的釘子,AI領(lǐng)域的初創(chuàng)企業(yè)也特別多,不同的技術(shù)方向會孵化出不同的AI企業(yè)。這個階段被他稱之為AI技術(shù)落地的第一階段,技術(shù)尋找場景。
第一階段經(jīng)過一段時間的發(fā)展以后,AI領(lǐng)域的初創(chuàng)公司撞上了一堵"南墻":巨頭公司下場,競爭激烈;創(chuàng)業(yè)公司資金緊張,AI燒錢太快。這個時候,如何讓AI技術(shù)在更多其他行業(yè)、場景下得到應用并產(chǎn)生商業(yè)價值,成了AI商業(yè)化落地的新主題,也就進入了人工智能落地的第二個階段,場景結(jié)合技術(shù)。
以服裝行業(yè)為例,其實在這個行業(yè)里面要用到的技術(shù)特別多,除了CV這樣的技術(shù)之外,自然語言處理、關(guān)聯(lián)推薦、以圖搜圖、數(shù)據(jù)分析、趨勢預測等都是關(guān)聯(lián)技術(shù)。鄭澤宇表示,每個行業(yè)的數(shù)據(jù)非常多,不同的數(shù)據(jù)需要用到不同的整理方式方法和算法技術(shù),基于這樣的技術(shù)和應用場景深度融合、綁定以后,才發(fā)現(xiàn)技術(shù)對一個行業(yè)的影響是可以做到深遠的。
鄭澤宇提到,很多AI創(chuàng)業(yè)者們的初心和愿景就是要去顛覆自己選擇的行業(yè),反而忽視了對行業(yè)的理解。他認為只有真正地去理解了行業(yè),才能在最關(guān)鍵的地方做出改變,才更有顛覆行業(yè)的可能,這也是知衣科技創(chuàng)業(yè)的實現(xiàn)路徑和價值觀。
很多人對服裝行業(yè)的感知是時尚、藝術(shù),而這很難被AI所理解。但在對服裝行業(yè)做了深入理解以后,鄭澤宇發(fā)現(xiàn)它是一個99%商品+1%藝術(shù)的場景。在這個行業(yè)做AI創(chuàng)業(yè)并不是要去取代設(shè)計師,而是要利用AI技術(shù)去做好服裝的選款,這是一個偏理性同時也可以被AI理解的方向。傳統(tǒng)的選款方式通常會遇到各種問題,而AI技術(shù)要解決的也恰恰就是這些無法被數(shù)據(jù)量化的主觀問題。
在互聯(lián)網(wǎng)場景下,海量數(shù)據(jù)的獲取讓基于數(shù)據(jù)的分析不再是難事,但也恰恰是因為數(shù)據(jù)量太大導致無法形成有效解讀。特別是圖像等非結(jié)構(gòu)化數(shù)據(jù),由于難以直接由計算機識別理解,需要經(jīng)過人工智能圖像分析后,得到結(jié)構(gòu)化的數(shù)據(jù)標簽,才能有效利用。如何讓機器理解時尚,就成了知衣科技需要解決的核心痛點。
鄭澤宇表示,計算機視覺最經(jīng)典的三個問題,首要解決的就是讀懂圖,第二是要做好分類,第三要解決搜索問題。但理解時尚,并不屬于以上三個類別。為了能夠有效地讓計算器理解商品圖,知衣科技將商品圖分為12個維度,超過500個標簽,把人工能夠歸納和整理的標簽全部窮盡以后,讓深度學習模型進行嘗試。
在不斷地調(diào)整模型、增加容錯、優(yōu)化標簽和長期的人工智能算法打磨以后,最終實現(xiàn)了比較不錯的準確率:
基于這些數(shù)據(jù)和特征,延展出了以圖搜圖、趨勢預測、智能試衣等功能。鄭澤宇表示,目前服裝行業(yè)的知名線上/線下品牌基本都已成為知衣科技的客戶,公司也實現(xiàn)了自負盈虧,在AI創(chuàng)業(yè)公司中屬于現(xiàn)金流比較健康的一批。
分享最后,鄭澤宇老師還針對計算機如何理解美的定義以及服裝場景下3D建模等問題做了精彩回答。
圓桌論道:新基建背景下給人工智能帶來的挑戰(zhàn)和機遇
在本次技術(shù)閉門會的圓桌討論環(huán)節(jié),優(yōu)圖實驗室-昊天研究中心負責人 & 專家研究員郭曉威、騰訊云AI視覺產(chǎn)品中心總經(jīng)理王磊、知衣科技聯(lián)合創(chuàng)始人兼CEO鄭澤宇、海深科技CEO戴劍彬、香港科技大學助理教授陳啟峰以及本場主持人騰訊優(yōu)圖實驗室AI高級研究員彭湃針對新基建時代主題下給人工智能帶來的挑戰(zhàn)和機遇分享了各自的看法與思考。
王磊:2017年底到2018年初,當時還沒有新基建的提法,騰訊云AI要往哪個方向走要做很多的探索和決策。一路走過來之后再反思過去的那些探索過程,其實核心就是幾個方面:你對行業(yè)是否足夠的理解,你對技術(shù)是否有合理的判斷,你對自身的差異和優(yōu)勢是否有正確的認知。從這幾個維度去剖析自身,基本都能得到一個明確的答案,這個答案未必自身愿意接受,卻是對行業(yè)的深刻理解。從現(xiàn)在這個時間節(jié)點看,騰訊云AI做得還不錯,這一路的探索和實踐也積累了很多經(jīng)驗和方法論,在新基建時代下同樣受用。
鄭澤宇:服裝行業(yè)本身就比較注重線下場景,從設(shè)計到生產(chǎn)到營銷無不如此?,F(xiàn)在很多技術(shù)也在試圖打通線上線下,讓數(shù)據(jù)充分流通,廠商提供的智能化設(shè)備也有非常廣泛的應用。在這樣的背景下,其實從后端的生產(chǎn)到品牌的運營再到前端的營銷,其實都是新基建的組成部分。知衣科技在這個過程中希望沉淀的最核心的能力就是數(shù)據(jù)打通和收集的能力。通過新興技術(shù)比如人工智能、5G、邊緣計算所帶來的新基建成果,讓數(shù)據(jù)收集能力越來越強大,通過有效的處理最終形成更加科學的數(shù)據(jù)決策,這是新基建為行業(yè)提供的可能性,我們也在做積極的布局,去迎接這樣的變化。
戴劍彬:智能安檢是海深科技從2019年至今的重點發(fā)展方向,也符合現(xiàn)在的新基建時代背景。我們目前對智能安檢的投入相當大,而且后續(xù)的衍生領(lǐng)域也挺多,比如安防方向等。新基建的大前提對我們的益處還是比較大的,三四年前找企業(yè)合作比較困難,但現(xiàn)在不管是To B場景還是To G場景,都能很好地觸達客戶,對新技術(shù)的開放能力和接受的心態(tài)都不可同日而語。海深科技后續(xù)的發(fā)展重點還是要專注在這個領(lǐng)域內(nèi)做深、做出突破。
陳啟峰:新基建背景可能促生的更多是線下AI能力的落地,我很多研究的項目也都會跟實際的應用會有結(jié)合。比如現(xiàn)在有一個研究的方向是怎么去設(shè)計新的下一代的深度的攝像頭。然后我們在學校里做一個東西出來,證明它的可行性。我們在學校里面搭建了一個這樣的模板,但是如果到線下要去落地,可能還需要工業(yè)界的配合,把相關(guān)的深度的攝像頭用起來。這個技術(shù)主要是用在汽車上,尤其是無人車。除了室外場景,我們也有室內(nèi)的研究項目。在學術(shù)界,我們的重點可能是要證明一些新技術(shù)的可行性,如果有一些學生感興趣,他們會做自己的產(chǎn)品,然后我們?nèi)ヌ峁┲С帧?/p>
郭曉威:我們看到新基建這個詞是今年新提出來的,它包含了5G、人工智能、交通、能源還有工業(yè)這些領(lǐng)域,勢必會催生大量的線下AI需求。目前優(yōu)圖實驗室在這幾個方向都有研究投入,比如工業(yè)互聯(lián)網(wǎng)、比如政務民生等方面。但是,其實我們也可以看到,在這個過程中對AI也提出了一個更高的挑戰(zhàn)。優(yōu)圖實驗室還是希望能夠解決一些業(yè)界普遍存在的落地問題,希望能夠解鎖更多的限制。另外也需要政府去推動打通一些數(shù)據(jù)層面的分享,打破數(shù)據(jù)的孤島,從政策層面去降低AI的準入門檻,這是我對新基建的一些觀點。
最后,圓桌大咖們針對目前社會熱議的限制出口技術(shù)目錄與國外技術(shù)封鎖等問題做了深入的思想碰撞。本場閉門會主持人騰訊優(yōu)圖實驗室AI高級研究員彭湃也給風口和挑戰(zhàn)面前的AI從業(yè)者們送出了寄語與自勉。
AI的價值,要從實踐中找尋。但TVP還十分清楚,技術(shù)的價值,一定是普惠大家。本次計算機視覺技術(shù)閉門會的圓滿結(jié)束,在給AI業(yè)界以落地參考的同時,也帶來了更多的深入思考,或是新的創(chuàng)新點子、或是新的商業(yè)模式,最終都將為整個行業(yè)的落地加油助力。
從概念到實踐,從云端到落地,從現(xiàn)在到未來。AI還有很長的路要走,新基建也還有很多的事要做,但在這條路上,我們放眼看去都是同路人,眾行者遠。
關(guān)于TVP技術(shù)閉門會
TVP技術(shù)閉門會,是為TVP打造的專屬技術(shù)閉門研討會,旨在為大家提供一個開放、平等、知無不言的交流環(huán)境,便于 TVP們針對熱門技術(shù)、前沿科技、技術(shù)管理等話題進行深入探討。