—
(資料圖)
大模型能力要從云入端,究竟什么時(shí)候做、怎么做?
來源 /腦極體 (ID:unity007)
作者 /藏狐
大家是不是對GPT、對話式AI、生成式AI之類的話題,已經(jīng)有點(diǎn)審美疲勞了?
寫這篇文章之前,我有點(diǎn)猶豫,究竟還要不要接著討論GPT了。最終決定寫,是覺得個(gè)人用戶、開發(fā)者,以及正在緊鑼密鼓訓(xùn)大模型的AI公司和云廠商,還是有必要提前琢磨一下這個(gè)事情——大模型能力要從云入端,究竟什么時(shí)候做、怎么做?
ps:微信公眾號(hào)又改版了……為防止失聯(lián),請大家把我們 設(shè)為星標(biāo),否則可能無法再收到我們的推送。點(diǎn)擊下圖 即可三步完成星標(biāo)
· · ·01
AIGC熱潮帶來Web復(fù)興
但大眾更愛移動(dòng)端
我們看到,大多數(shù)基于大模型的AIGC應(yīng)用,都選擇了Web端接入。
微軟第一時(shí)間推出了帶有對話(Chat)功能的必應(yīng)(Bing),更新了Edge瀏覽器,嵌入到Microsoft 365 應(yīng)用中。國內(nèi),高校機(jī)構(gòu)推出的MOSS(復(fù)旦大學(xué))、SegGPT(智源),企業(yè)推出的文心一言(yiyan.baidu.com)、通義千問(tongyi.aliyun.com),都要從官網(wǎng)入口訪問。
圖像和視頻類的生成式AI,比如Midjourney、Stable Diffusion、DALLE2,以及視頻平臺(tái)Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。
有業(yè)內(nèi)人士認(rèn)為,生成式AI帶來了Web的復(fù)興。
當(dāng)然,市面上也有通過小程序、App等訪問的AIGC產(chǎn)品,大多通過調(diào)用基礎(chǔ)模型的API來提供服務(wù)。
但受限于網(wǎng)絡(luò)傳輸、算力等,領(lǐng)先的技術(shù)能力都不得不打折扣,比如只能生成很短的一句話文本,手機(jī)app的作圖效果一般,加載速度很慢經(jīng)常排隊(duì)掉線卡頓……
這是因?yàn)榇竽P偷拇罅坑?jì)算,還是要通過云服務(wù)來完成,Web頁面的承載能力比較大,加載速度快,還不用考慮流量損耗。
所以,想體驗(yàn)大模型強(qiáng)大的能力,目前還是以PC Web端+云服務(wù)更佳。
但是,大模型的商業(yè)化潛力,還是在移動(dòng)端。
大家可能都記得,去年底AI作圖就火爆過,意間 AI 繪畫、YUAN 初等多款具有 AI 作圖功能的移動(dòng)端小程序,用戶量和付費(fèi)激增。意間 AI 繪畫的官方數(shù)據(jù)顯示,上線不到兩個(gè)月,用戶量增長了 117 萬人。
大部分人也都更希望,便捷、低門檻地體驗(yàn)AIGC。要使用GPT-4、New bing、DALLE等應(yīng)用,注冊、登錄、付費(fèi)的一系列操作,都非常麻煩,勸退了不少人。
國內(nèi)的大模型應(yīng)用,移動(dòng)端也明顯很受期待。比如就有人抓住了“官方?jīng)]有app”這個(gè)“時(shí)間差”,造出了“文心一言”盜版 App,嚇得百度趕緊出來聲明:凡是在App Store和各種應(yīng)用商店看到的“文心一言”App都是假的,凡是“文心一言”收費(fèi)下載、付費(fèi)會(huì)員都是騙子!
顯而易見,場景化、輕量化的移動(dòng)端應(yīng)用,用戶又喜歡,又能付費(fèi)賺到錢,如果官方不搞,投機(jī)客/騙子都要來搞。
無論是從用戶體驗(yàn)的角度,還是大模型服務(wù)普及化的需要,以及回收訓(xùn)練成本的商業(yè)化考量,移動(dòng)端應(yīng)用都是一塊不能輕言放棄的陣地。
既然如此,為什么各大基礎(chǔ)模型服務(wù)商,就是不早點(diǎn)抓住這個(gè)機(jī)會(huì)呢?我們什么時(shí)候才能用上和Web版一樣強(qiáng)大的移動(dòng)AI應(yīng)用呢?
02
千呼萬喚不出來
基礎(chǔ)模型服務(wù)商在想啥?
基礎(chǔ)大模型的服務(wù)商,比如OpenAI、谷歌、百度、阿里以及各類研究院所,就是不去吃移動(dòng)端應(yīng)用這塊蛋糕。
除了大家都知道的移動(dòng)端側(cè)計(jì)算能力限制之外,還有其他考量:
1.產(chǎn)品?;A(chǔ)模型往往技術(shù)和能力比較超前,產(chǎn)品化不是最優(yōu)先考慮的,尤其移動(dòng)端應(yīng)用要適配各種系統(tǒng)、機(jī)型、配置,更不可能投入太大的人力、物力。
OpenAI 的聯(lián)合創(chuàng)始人 Sam Altman就說過,ChatGPT 是一個(gè)糟糕的產(chǎn)品,只是這個(gè)產(chǎn)品蘊(yùn)含著很大價(jià)值,所以人們愿意忍受。覺得Web不好用?那你先忍忍吧。
2.用戶。別看全民熱議生成式AI,但真正堅(jiān)持使用并愿意付費(fèi)的,還是一小撮早期客戶,包括技術(shù)狂熱者和專業(yè)人士,比如程序員、插畫師。
他們大多會(huì)將生成式AI當(dāng)作生產(chǎn)力工具,用于研究、編程、辦公、設(shè)計(jì)、游戲制作、軟件開發(fā)等,還要跟其他專業(yè)軟件相結(jié)合來使用,比如生成圖片之后再通過Photoshop增強(qiáng),還是要用到PC、一體機(jī)等設(shè)備,PC Web端比移動(dòng)App有更強(qiáng)的可編輯性,更能滿足這部分群體的需求。
3.商業(yè)化。目前基礎(chǔ)大模型的商業(yè)模式,以API為主,需要一定的開發(fā)經(jīng)驗(yàn),更適合極客和開發(fā)者,深度開發(fā)集成部署等工作,很少會(huì)通過移動(dòng)端來完成,所以模型服務(wù)商自然也就沒有緊鑼密鼓去適配移動(dòng)端的動(dòng)力。
03
大模型千帆競渡
移動(dòng)端是商業(yè)化必爭之地
既然如此,為什么還要做移動(dòng)端呢?一個(gè)很表層的答案是:大眾需要。
能夠真正引發(fā)全民體驗(yàn)熱潮的,還是那些能夠通過社交軟件分享、小程序、App等形式,低成本快速觸達(dá)的能力,不需要什么“智能涌現(xiàn)”,更在乎有趣、好玩。
往深了說,大模型技術(shù)被視為“新工業(yè)革命”的引擎,要發(fā)揮效應(yīng),必須將技術(shù)能力更好地集成到產(chǎn)品和服務(wù)中去。此時(shí),移動(dòng)端能夠提供至少三重價(jià)值:
第一,規(guī)模落地。
中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布第51次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》中,我國10.67億網(wǎng)民,使用手機(jī)上網(wǎng)的比例為99.8%,移動(dòng)端用戶已經(jīng)遠(yuǎn)遠(yuǎn)超過了PC端的用戶,要提升生成式AI的應(yīng)用范圍,移動(dòng)端應(yīng)用必不可少。
第二,商業(yè)潛力。
高科技行業(yè)的主流市場,是由“實(shí)用主義者”組成的,相比技術(shù)的前沿性、炫酷感,他們更看重技術(shù)解決方案的可靠、穩(wěn)定、性價(jià)比、配套服務(wù)等。移動(dòng)端的廣泛普及度、即時(shí)訪問、便捷低成本的優(yōu)勢,可以讓AI以更短的路徑觸達(dá)用戶,在移動(dòng)端應(yīng)用AI技術(shù)是大勢所趨。
開發(fā)者眼中的AIGC應(yīng)用是這樣的:
(OpenAI發(fā)布會(huì)演示的編程能力)
大眾眼中的AIGC應(yīng)用是這樣的:
(某GPT類應(yīng)用平臺(tái)截圖)
第三,市場壁壘。
大模型的商業(yè)化路徑之一,是走向產(chǎn)業(yè),走向ToB,將大模型能力封裝為AI解決方案,參與到千行百業(yè)的數(shù)字化、智能化進(jìn)程中。
如今頭部科技公司、云廠商都在煉大模型,很多直接對標(biāo)GPT-3.5,沒有顯著的差異化價(jià)值,很難與業(yè)界領(lǐng)先水平拉開差距。
云廠商要打開ToB市場,移動(dòng)端應(yīng)用工具與能力是非常有吸引力的。
近年來,不僅消費(fèi)類、服務(wù)型企業(yè),在不斷加強(qiáng)移動(dòng)端側(cè)的布局和產(chǎn)品能力,一些傳統(tǒng)的企業(yè)和機(jī)構(gòu),比如工業(yè)制造、政務(wù)銀行等,無論是在內(nèi)部生產(chǎn)管理中移動(dòng)化,也推出了更多移動(dòng)應(yīng)用來更好地服務(wù)終端用戶。
如果直接在云上端到端用好大模型,比如訓(xùn)練開發(fā)環(huán)節(jié)直接調(diào)用云端的大模型和AI算力資源,完成后,一鍵分發(fā)到智能手機(jī)等終端上,可以大大減少工作量。
(某GPT 類應(yīng)用開發(fā)平臺(tái))
互聯(lián)網(wǎng)的演進(jìn)之路,已經(jīng)說明,無論ToB還是ToC行業(yè),都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口、越來越輕盈的軟件應(yīng)用。
所以說,大模型從云入端,是模型服務(wù)商實(shí)現(xiàn)商業(yè)化的必爭之地。
04
從云入端,一條天路
高瞻遠(yuǎn)矚如OpenAI和DeepMind,照樣有商業(yè)化的要求。賺錢嘛,不寒摻。可是,大模型由云入端,這個(gè)錢還真沒那么好賺。非不為也,實(shí)不能也。
云計(jì)算、AI能力要進(jìn)入移動(dòng)終端設(shè)備,所面對的是一條天路:
首先,一些大型的生成式AI應(yīng)用,運(yùn)行環(huán)境在云上,要經(jīng)過網(wǎng)絡(luò)傳輸,而移動(dòng)端的設(shè)備能力、網(wǎng)絡(luò)環(huán)境,是很多樣且不穩(wěn)定的,比如從5G蜂窩網(wǎng)絡(luò)轉(zhuǎn)移到室內(nèi)寬帶,或者在高架橋、地鐵等特殊環(huán)境,都有可能讓生成過程中斷或失敗,影響到端側(cè)體驗(yàn)。
其次,生成式AI應(yīng)用的計(jì)算量比較大,在端側(cè)加載渲染運(yùn)行時(shí),比如智能手機(jī)CPU會(huì)有比較高的負(fù)載,出現(xiàn)卡頓、發(fā)熱、電量損耗等情況,如果讓AI改一篇文檔畫一張圖就咔咔掉電,當(dāng)然不能接受。
此外,把AI深度集成到業(yè)務(wù)中,必須通過云計(jì)算,而云端開發(fā)環(huán)境和端側(cè)是不同的操作系統(tǒng)。這意味著,開發(fā)者要進(jìn)行二次開發(fā)或迭代開發(fā),完成之后才能進(jìn)行不同終端下的觸達(dá),同時(shí)要考慮不同終端的兼容性,這就提升了AI云應(yīng)用的風(fēng)險(xiǎn)成本、人力成本、時(shí)間成本。要保證集成之后的應(yīng)用效果,需要云平臺(tái)有一整套完整的產(chǎn)品服務(wù)和工具來支撐快速搭建、驗(yàn)證、部署分發(fā)。
另外,云側(cè)和端側(cè)的架構(gòu)不同,也導(dǎo)致算力割裂,云端一體的AI應(yīng)用開發(fā)要充分結(jié)合端側(cè)算力和云上算力,一部分應(yīng)用場景搭建在端,一部分搭建在云,這就給云廠商帶來了比較大的技術(shù)難題:如何提供穩(wěn)定一致的底層環(huán)境?
天路難行亦需行。大家都知道,云計(jì)算靠基礎(chǔ)設(shè)施IaaS層是很難賺到錢的,云廠商煉大模型,本質(zhì)上是希望提升軟件的先進(jìn)性,進(jìn)而調(diào)動(dòng)SaaS服務(wù)的商業(yè)價(jià)值。
要讓個(gè)人用戶和企業(yè),都得到簡單、易用、低門檻的大模型能力,云廠商不僅要訓(xùn)練基礎(chǔ)模型,還需要在產(chǎn)業(yè)鏈上游,就解決AI應(yīng)用從云到端的一系列技術(shù)難題,為開發(fā)者和產(chǎn)業(yè)用戶提供移動(dòng)AI開發(fā)能力,才能讓大模型在端側(cè)爆發(fā)。
各種形態(tài)的大模型應(yīng)用百花齊放,這個(gè)新技術(shù)才能真正迎來商業(yè)化的奇點(diǎn)。
加入我們
專題推薦
點(diǎn)個(gè)「在看」,和我們一起聊聊關(guān)鍵詞: