■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行業大模(mo)(mo)型(xing)(xing)正在爆炸(zha)式集中推出,關注大模(mo)(mo)型(xing)(xing)的人士都知道了行業大模(mo)(mo)型(xing)(xing)的簡(jian)單公式,通(tong)用大模(mo)(mo)型(xing)(xing)+行業場景+訓練調(diao)(diao)優=行業大模(mo)(mo)型(xing)(xing),因此訓練調(diao)(diao)優是企業自研大模(mo)(mo)型(xing)(xing)不可(ke)避開的重要環節(jie)。
然在其(qi)他企業(ye)還在觀望,推出,演(yan)示或者調優的當下,宇視作(zuo)為推出AIoT行(xing)業(ye)大模(mo)型的第一人,6月9號,其(qi)小范圍(wei)召開(kai)了(le)大模(mo)型“梧(wu)(wu)桐”種子合作(zuo)伙伴簽約(yue)會并(bing)公開(kai)了(le)“梧(wu)(wu)桐”未來的規(gui)劃。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練(lian)、AI在線學習等服務,預計(ji)將在7月底上線,現階(jie)段已(yi)經在小范圍測試(shi)。
l NLP(自然語言處理)行業大模型
提(ti)供資(zi)料中(zhong)心、大(da)數據平(ping)臺、代碼開發等服務(wu),這(zhe)是一款自(zi)用(yong)行業大(da)模型,目前階段只(zhi)在宇視內部使用(yong),主要用(yong)在內部生產,精準度要求更高。
l MM(多模態)行業大模型
提供Vlog等(deng)服(fu)務(wu),目前(qian)已在樂園景區、鄉村(cun)振興等(deng)場景的視頻(pin)宣傳上有(you)豐富的落(luo)地(di)案例。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安網作為特邀媒體就此疑問與(yu)部分宇視核心高(gao)管面(mian)(mian)對面(mian)(mian)進行(xing)了“圓(yuan)桌對話”。
1、大模型趨勢下
中小型企業怎么用好數據?
中(zhong)小(xiao)企(qi)業作(zuo)為中(zhong)國經(jing)濟(ji)發展的(de)重要主(zhu)體之一(yi),據工信部公布的(de)數(shu)據,2022年我國日均(jun)新(xin)設(she)企(qi)業達2.38萬戶(hu),中(zhong)小(xiao)微企(qi)業數(shu)量(liang)已超過5200萬戶(hu),在如今大(da)模(mo)型熱潮下,不少中(zhong)小(xiao)企(qi)業都(dou)在關注行業大(da)模(mo)型將(jiang)會如何(he)為自(zi)身企(qi)業真正做到降本(ben)增效(xiao)。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這兩大(da)疑(yi)慮把大(da)部分(fen)中(zhong)小企業攔在了車(che)門外。
除此(ci)之外,雖說行業都在認可“ALL in AI”這一現狀(zhuang),但不少中(zhong)小型企業對(dui)于(yu)AI的理解可能仍局限(xian)性(xing)停留(liu)在人臉識別。
宇視(shi)云智能產品(pin)部部長湯利(li)波告訴CPS中安網,作(zuo)為直接接觸到市場動向(xiang)脈搏的(de)中小型企業,其完全可以利(li)用數據針對(dui)性訓練一些細(xi)分(fen)業務(wu)場景(jing)(jing)的(de)算法(fa)。“通過場景(jing)(jing)化算法(fa)指標能力的(de)提(ti)升,有(you)機會去提(ti)升解(jie)決方案的(de)增(zeng)值性,包括服務(wu)收益(yi)的(de)增(zeng)值性。”
舉個(ge)簡(jian)單的例子,在游樂(le)園娛樂(le)等(deng)場(chang)所(suo),大部(bu)分人(ren)可(ke)能(neng)認為(wei)攝(she)像(xiang)頭只是(shi)起到(dao)安全防控(kong)的作用(yong),但(dan)假設負(fu)責(ze)這(zhe)個(ge)場(chang)景(jing)業(ye)(ye)務(wu)的企業(ye)(ye),愿意讓攝(she)像(xiang)頭搭載(zai)上(shang)提前訓(xun)練(lian)好(hao)的大模(mo)型,訓(xun)練(lian)好(hao)的大模(mo)型經過(guo)推理(li)后,將其視頻數(shu)據進行(xing)自動分割(ge)、自動識別(bie)、剪(jian)輯(ji)美化,游樂(le)園就能(neng)從原(yuan)有的出(chu)售游客(ke)圖片的業(ye)(ye)務(wu)升級到(dao)游客(ke)專(zhuan)屬vlog,這(zhe)便讓原(yuan)本只是(shi)躺在存儲(chu)里的數(shu)據得(de)到(dao)了進一步調(diao)動應用(yong)。
可以明顯(xian)看到(dao),在(zai)大模(mo)型(xing)(xing)趨(qu)勢下,對于中小型(xing)(xing)企業(ye)而言,其如何通過大模(mo)型(xing)(xing)利用(yong)數據達到(dao)降本增效的(de)作(zuo)用(yong),結果還是開源或(huo)者節流,省下人力、時(shi)(shi)間、精力成本的(de)同(tong)時(shi)(shi)對現有業(ye)務進行(xing)升級(ji)賦能,將服(fu)務收(shou)益最大化或(huo)許才(cai)是正解。
基于此(ci),對(dui)于判斷(duan)市(shi)場(chang)上(shang)任意一項新(xin)技術或(huo)者新(xin)產品是(shi)否值得應用(yong),中小型企業往(wang)往(wang)更加在意實(shi)際(ji)投(tou)入(ru)成(cheng)本幾(ji)何。關于成(cheng)本問(wen)題,會上(shang),宇視(shi)的大模(mo)型也(ye)給出了階段性答(da)案。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我們需要更(geng)(geng)多的(de)渠道能夠有(you)這種能力,更(geng)(geng)好的(de)和(he)宇(yu)視(shi)合(he)作,而不(bu)是只有(you)幾家壟斷的(de)市場(chang)。”宇(yu)視(shi)CPO朱兵(bing)說。
具體來說,宇視(shi)(shi)的賦能之道是,在訓(xun)練(lian)(lian)側上(shang),用(yong)戶企(qi)業(ye)可以遠(yuan)程(cheng)通(tong)(tong)過互聯網(wang)訪問之后來訓(xun)練(lian)(lian)算法,宇視(shi)(shi)會承擔云的租用(yong)費用(yong),為用(yong)戶企(qi)業(ye)省(sheng)去前期訓(xun)練(lian)(lian)需要的成本(ben),企(qi)業(ye)可以幾乎0成本(ben)獲得宇視(shi)(shi)開通(tong)(tong)的大模(mo)型訓(xun)練(lian)(lian)賬(zhang)號,在訓(xun)練(lian)(lian)過程(cheng)中,會有宇視(shi)(shi)專門的技術團(tuan)隊進行支持(chi)。
在(zai)推(tui)理側(ce)上(shang)(shang),宇視通過將場景化的算(suan)(suan)法進行剝離,也就是(shi)將相對小模型的算(suan)(suan)法部署到宇視邊(bian)緣端(duan)的設備上(shang)(shang),一定程(cheng)度上(shang)(shang)避免合作伙(huo)伴為此(ci)額外部署一個幾千萬(wan)起步的超算(suan)(suan)機房。
此外,算法拓(tuo)展在目前階(jie)段仍屬于煙囪式(shi),即使(shi)用戶需求很(hen)相近(jin),但由于對象的不同還是需要重(zhong)新生成算法,容易導致投入產出比和客(ke)戶需求之(zhi)間的矛盾,而預計7月底(di)正式(shi)上線的“梧桐CV行業大模型”可以(yi)較好解決這個問題。
舉個例子(zi),假設(she)現(xian)在(zai)有60多(duo)(duo)萬(wan)(wan)個體(ti)育館(guan),300多(duo)(duo)萬(wan)(wan)套(tao)器(qi)材,這60多(duo)(duo)萬(wan)(wan)個體(ti)育館(guan)的(de)器(qi)材放置(zhi)地點都不同,此時項目方(fang)需要(yao)知(zhi)道所(suo)有館(guan)的(de)器(qi)材的(de)使用(yong)頻率和大眾愿(yuan)意使用(yong)哪(na)類(lei)健身器(qi)材,這時候(hou)如(ru)果用(yong)小模型(xing)就需要(yao)采(cai)集(ji)各個體(ti)育館(guan)的(de)數據進行對比再針對性(xing)地多(duo)(duo)次(ci)訓(xun)練,而“梧桐CV行業大模型(xing)”卻能在(zai)比較小的(de)數據量(liang)情況下,做到泛化識別和推理,即使器(qi)材對象千差萬(wan)(wan)別,但省去了二次(ci)訓(xun)練、學習的(de)環(huan)節。
場景多N倍,算法(fa)獲(huo)得率提升80%,算法(fa)精準度(du)從85%提升至95%,讓IT工程訓練師訓練算法(fa),更(geng)容易解決行(xing)業(ye)Know-How問(wen)題,入門(men)門(men)檻(jian)更(geng)低,大(da)模型梧(wu)桐的優(you)勢也(ye)由此(ci)凸顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相信在未來,大(da)模型(xing)的(de)(de)“訓練(lian)”“推理”兩個(ge)關(guan)鍵詞優勢將(jiang)會日益凸顯,據了解,為(wei)保障(zhang)大(da)模型(xing)的(de)(de)順利運行(xing),宇視目前部署在云(yun)邊(bian)端芯(xin)片款型(xing)超(chao)過(guo)(guo)50款,支持的(de)(de)算法(fa)種(zhong)類(lei)超(chao)過(guo)(guo)1000個(ge),模型(xing)數過(guo)(guo)萬,產品款型(xing)過(guo)(guo)千(qian)。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳(chuan)統意義上(shang),做了(le)一個軟件(jian),投入(ru)100萬,就要力爭賣到200萬,最后賺100萬,光(guang)明正大的(de)追(zhui)求利潤是企業繞不開的(de)話題。
但(dan)這次,宇視(shi)并沒有打算使(shi)(shi)用傳統的賣軟(ruan)(ruan)件(jian)直接獲利(li)策(ce)略,而(er)是(shi)通(tong)過(guo)讓(rang)利(li)給(gei)合(he)作伙伴,讓(rang)合(he)作伙伴通(tong)過(guo)使(shi)(shi)用“梧桐(tong)”得到多個專屬(shu)的“行業軟(ruan)(ruan)件(jian)工程師(shi)”。“讓(rang)宇視(shi)的渠道盈利(li),讓(rang)他們有進入(ru)一些(xie)新的業務模式的可能(neng)。”朱(zhu)兵說道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權時代,最大(da)的競爭力(li)在(zai)(zai)于你(ni)的效率,在(zai)(zai)于公司看清楚自己的定位之后能夠第一時間全力(li)撲上(shang)去做。”
2012年,宇(yu)視(shi)(shi)捕捉到人工智(zhi)能的(de)發展趨勢(shi),同年便(bian)開始在(zai)深度(du)學習領域進行投(tou)入,2016年,宇(yu)視(shi)(shi)推出(chu)初代基于DL的(de)AIoT產品,如今來到大模型爆(bao)炸階段,宇(yu)視(shi)(shi)又(you)成為第一個推出(chu)“AIoT行業大模型”的(de)第一人。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微軟將(jiang)GPT-4對接Office、金山將(jiang)其大模型產品“WPS AI”接入WPS,大模型最(zui)終的落地還得(de)是在硬(ying)件上。
那宇視怎么快速落地實現工程(cheng)化(hua)?總(zong)結為以下幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放能(neng)力給(gei)合作伙伴,同時(shi)有專門(men)的培訓和技術服務體系(xi)保障
也許正(zheng)如此次宇視(shi)簽約種子伙(huo)伴之一的(de)萬(wan)店掌所言,眾多行業(ye)大模(mo)型中為什么選擇(ze)宇視(shi),其(qi)(qi)(qi)實占比很大一部分(fen)原因是其(qi)(qi)(qi)本身已經和宇視(shi)有過合作,對(dui)宇視(shi)這(zhe)(zhe)個品牌已經存在(zai)一定的(de)認知(zhi)力(li)和認可度(du),剛(gang)好宇視(shi)在(zai)這(zhe)(zhe)個階段(duan)推出了大模(mo)型就(jiu)相當于為合作伙(huo)伴提供了一條龍服(fu)務,省去了對(dui)其(qi)(qi)(qi)他(ta)新品牌的(de)學習、切換(huan)成本,選擇(ze)宇視(shi)會(hui)適(shi)配度(du)更高。
當然,在這個(ge)數據量爆炸的(de)(de)時代(dai)下,不少(shao)企業(ye)還(huan)是會(hui)十分在意保密性(xing),而目前由于大部分中小企業(ye)不具備私(si)有云(yun)(yun)的(de)(de)部署能(neng)力,因(yin)此(ci)愿意上(shang)云(yun)(yun)的(de)(de)企業(ye)的(de)(de)數據會(hui)相對集中在公有云(yun)(yun)上(shang),一旦(dan)拿出來訓練是否(fou)會(hui)產生泄漏的(de)(de)風險?
“我們前(qian)期在接觸合作伙伴過程中,也有(you)客(ke)戶(hu)有(you)安(an)(an)全(quan)(quan)性的疑慮(lv),主(zhu)要疑慮(lv)在原有(you)數據(ju)是否(fou)外(wai)泄和訓練(lian)成(cheng)果(guo)收(shou)否(fou)會被無償占用兩方面”湯利(li)波說道。而宇視“梧桐(tong)”也將通過相關技(ji)術進行分(fen)(fen)權、分(fen)(fen)域,建立完善的權限管理和安(an)(an)全(quan)(quan)管控制度(du),融(rong)合等方式保證訓練(lian)成(cheng)果(guo)的安(an)(an)全(quan)(quan)性和獨享性。
4、大模型戰場已開局
是開始還是結束?
風起(qi)于青萍之末,浪成于微瀾之間。
相(xiang)對之前企業拼(pin)數據樣本,拼(pin)私有的訓練(lian)(lian)平(ping)臺,拼(pin)技術(shu)架構的小模(mo)(mo)型AI時(shi)代,如今隨著(zhu)(zhu)大(da)模(mo)(mo)型相(xiang)繼開(kai)源(yuan)后(hou),有基(ji)礎的企業大(da)都可以基(ji)于開(kai)源(yuan)組件進(jin)行(xing)(xing)自身大(da)模(mo)(mo)型的自研,先用通(tong)用大(da)模(mo)(mo)型把(ba)原始的大(da)量行(xing)(xing)業場(chang)景的知(zhi)識數據清洗(xi)一遍,再把(ba)顯著(zhu)(zhu)目標值給提取出(chu)來,去重后(hou)形成行(xing)(xing)業數據庫,最終投(tou)喂給通(tong)用大(da)模(mo)(mo)型訓練(lian)(lian)出(chu)一個行(xing)(xing)業大(da)模(mo)(mo)型。
Open AI用了(le)上萬塊英偉達(da)GPU喂(wei)出了(le)一(yi)個ChatGPT,浪潮掀到(dao)中國(guo),國(guo)內千模大戰已拉(la)開,行業大模型或將(jiang)是未(wei)來各個領域(yu)都會去追尋的模式(shi)。
縱(zong)觀安(an)(an)防行業(ye)幾十年的(de)發(fa)展(zhan),從模擬階(jie)(jie)段(duan)的(de)爭奪(duo)攝像頭代(dai)理權,到(dao)網絡數字階(jie)(jie)段(duan)的(de)系統(tong)業(ye)務成焦點,再到(dao)智能化階(jie)(jie)段(duan)的(de)ALL in AI,如(ru)今已到(dao)大模型卷入(ru)階(jie)(jie)段(duan),或(huo)許正如(ru)宇視(shi)CEO張(zhang)鵬國曾在深圳安(an)(an)博(bo)會(hui)舉辦期間抒發(fa)的(de)經典(dian)語錄所言:“意識(shi)到(dao)這是場戰(zhan)(zhan)爭的(de)時(shi)候,戰(zhan)(zhan)爭已經結束了,機會(hui)不會(hui)等待后(hou)知后(hou)覺的(de)傲慢。”
[出處] 思文, 算法訓(xun)練幾乎(hu)0成本!梧(wu)桐(tong)大模型讓首批用(yong)戶吃上(shang)“螃(pang)蟹”.CPS中安網(wang), 2024-06-14