都在說大模型,都不會用大模型。
AI 創(chuàng)業(yè)者陳冉,發(fā)現(xiàn)行業(yè)里有一些 " 怪現(xiàn)象 "。
很多客戶向他反饋,自己很困惑。一方面,大模型更新速度太快,搞不清楚到底哪個好用;同時,自己也不知道大模型怎么跟業(yè)務(wù)結(jié)合;另外,自己的數(shù)據(jù)集究竟能不能精調(diào)出一個好用的大模型,心里也沒譜。
最后的結(jié)果就是,愿意投入大模型,但不知如何下手,即便下定決心了,也摳摳搜搜拿不出太多預(yù)算來。
這進(jìn)而導(dǎo)致,大模型公司開始卷價格,打起了價格戰(zhàn)。" 拼到最后就是,又燒錢、價格還低、還沒人用的狀態(tài)。"
陳冉是人工智能社區(qū)和生態(tài)公司開放傳神(OpenCSG)的創(chuàng)始人、CEO,他認(rèn)為大模型行業(yè)的無效內(nèi)卷是一種消耗。去年一哄而上做大模型的公司們,最終沒能避免掉進(jìn)當(dāng)年 ofo 們踩過的陷阱。
這逼得行業(yè)大佬、零一萬物創(chuàng)始人李開復(fù)放話," 如果中國市場就是這么卷,大家寧可賠光、通輸也不讓你贏,那我們就走外國市場 "。
做了多年技術(shù)開發(fā),很早就開始 AI 創(chuàng)業(yè)的李友峰,同樣對今天的現(xiàn)象感到不解。" 以前我們討論一個項(xiàng)目,會關(guān)注它有什么價值,但到了 AI 大模型,大家很少討論價值,都在討論領(lǐng)先。"
鋪天蓋地的榜單,五花八門的排名,自吹自擂的營銷,讓這個行業(yè)顯得浮躁喧囂。廠商們最后花了很多錢,產(chǎn)品落地不了,技術(shù)實(shí)際上也沒有太領(lǐng)先。
5 月下旬,清華系大模型公司銜遠(yuǎn)科技被曝?fù)Q帥,創(chuàng)始人周伯文將離開公司。消息傳出后,有創(chuàng)業(yè)者稱:聚焦算法,或許是一條彎路。
大模型創(chuàng)業(yè),在中國是一條窄路,對某些團(tuán)隊也許是不歸路。
如今,2024 年過半," 百模大戰(zhàn) " 也過去一年多了,行業(yè)發(fā)展到哪了?接下來又會往哪卷?
卷技術(shù):
考高分的太多,能干活的太少
國內(nèi)大模型行業(yè),今年明顯比去年 " 安靜 "。去年是 " 阿貓阿狗 " 都來參與,幾百個大模型面世,今年除了幾個科技大廠和頭部的創(chuàng)業(yè)公司,其他大部分都消停了。
因?yàn)榇蠹野l(fā)現(xiàn),吆喝再大聲,落不了地都是白搭。
國內(nèi)的大模型不是太少,而是太多,尤其是吹牛的多。
" 廠商總是宣傳大模型能干啥,卻不說不能干啥,客戶就有點(diǎn)被誤導(dǎo),以為大模型什么都能干,想著把原來的業(yè)務(wù)顛覆重做一遍,這不現(xiàn)實(shí)。" 陳冉對「定焦」說。
回看過去一年大模型行業(yè)的發(fā)展,我們會發(fā)現(xiàn),最先打起來的不是價格戰(zhàn),甚至也不是技術(shù)戰(zhàn),而是營銷戰(zhàn)。
營銷是為了搶聲量。開發(fā)布會、刷榜、投廣告甚至碰瓷對手,能吸引更多關(guān)注,讓大家 " 覺得 " 自己領(lǐng)先。至于好不好用,真實(shí)的技術(shù)實(shí)力如何,可以后期再補(bǔ)課。
李友峰告訴「定焦」,現(xiàn)在國內(nèi)所有的所謂自研大模型,基本都是基于開源架構(gòu)改的,沒有真正意義上的原創(chuàng)和全自研。這意味著,大模型公司之間的技術(shù)差距并不大。
這也是為什么一家創(chuàng)業(yè)公司,能在兩三個月內(nèi)從零到一推出一款全新大模型。最好的例證是,去年李開復(fù)的零一萬物發(fā)布 "Yi" 系列模型,被指使用了 LLaMA 的架構(gòu),只對兩個張量進(jìn)行了重命名。
陳冉認(rèn)為,國內(nèi)大模型還沒有形成完整的創(chuàng)業(yè)生態(tài),大家一蜂窩沖上來,發(fā)布幾個模型證明不了什么。他以智能汽車行業(yè)早期做類比:大家都想造車,做輪胎的、造發(fā)動機(jī)的、甚至做雨刷的,都想親自下場,但最基本的電池、電控甚至輪子座椅都還沒準(zhǔn)備好。
單純從技術(shù)層面,時至今日,國內(nèi)沒有哪個團(tuán)隊處于絕對領(lǐng)先位置。
AI 大模型有三大要素:算法、數(shù)據(jù)、算力,國內(nèi)廠商們過去一直在啃算法,大家發(fā)布模型,本質(zhì)上是發(fā)布一套算法和系統(tǒng)。大家比拼誰的算法更先進(jìn),誰的模型參數(shù)更大,推理效率更高。但現(xiàn)在越來越多從業(yè)者發(fā)現(xiàn),算法其實(shí)沒有壁壘。陳冉更是直言 " 大模型不值錢 "。
" 我認(rèn)為企業(yè)級的大模型沒意義,開源企業(yè)級就行了,因?yàn)樽钪匾氖菙?shù)據(jù)。" 他說。
數(shù)據(jù)是比算法更稀缺的資源。算法可以通過修改開源模型和人海戰(zhàn)術(shù)迭代,算力可以通過砸錢買卡獲得,但優(yōu)質(zhì)的數(shù)據(jù)沒有渠道售賣,花錢不一定能買來。
訓(xùn)練模型跟訓(xùn)練學(xué)生類似,數(shù)據(jù)相當(dāng)于教材或教育資源,過程就叫預(yù)訓(xùn)練。偏遠(yuǎn)山區(qū)的孩子和一線城市的孩子,從小獲得的教育資源不同,訓(xùn)練過程不同,最后高考考上重點(diǎn)大學(xué)的概率也必然不同。某種意義上,擁有優(yōu)質(zhì)數(shù)據(jù),預(yù)訓(xùn)練就成功了一半。
過去一年,行業(yè)里評估一個大模型好壞的標(biāo)準(zhǔn),是通過測評,相當(dāng)于考試。既然是考試,就有作弊的空間,或者可以通過刷題得高分。這就導(dǎo)致,很多大模型其實(shí)是 " 應(yīng)試教育 " 的產(chǎn)物——參數(shù)大、得分高、性能強(qiáng),但沒啥實(shí)踐能力。
李友峰認(rèn)為,算法有很大局限性,如果脫離具體的應(yīng)用場景,算法沒有意義。" 比如模型的參數(shù)大,計算能力很強(qiáng),做數(shù)學(xué)題也許表現(xiàn)很好,但這并不意味著它能在實(shí)際業(yè)務(wù)里產(chǎn)生價值。"
今年以來,大模型拼參數(shù)的風(fēng)氣有所改觀,各種雜七雜八的 " 野榜 " 也有所收斂,說明公眾不好糊弄了。問題是,如果不比參數(shù),大家還能比啥?
卷價格:
C 端不敢收,B 端收不起
一個模型或一個項(xiàng)目要證明自己有價值,最直接的方法是從市場上賺到錢。今年以來,越來越多 AI 創(chuàng)業(yè)者和投資人,開始將商業(yè)模式掛在嘴邊。
大模型行業(yè)的商業(yè)化有兩大類—— To C 和 To B,即向個人用戶收費(fèi),和向企業(yè)(包括政府、開發(fā)者)收費(fèi)。去年行業(yè)達(dá)成共識,To C 收費(fèi)很難,先從 B 端入手。
B 端企業(yè)是大模型的最大客戶。一家做系統(tǒng)集成公司的員工曾對「定焦」說,他們很早就接入了百度的千帆大模型平臺,擁抱大模型的意愿很強(qiáng),不過他們不是因?yàn)槟P托Ч枚褂?,僅僅是怕被 AI 落下。而一旦模型收費(fèi),他們就得再考慮考慮了。
這代表了很多企業(yè)的心態(tài):能白嫖就白嫖,付費(fèi)就必須得看到效果。用陳冉的話說:" 讓客戶花錢,就得讓他看到成倍的增效,不見兔子不撒鷹。"
李友峰認(rèn)為,真正用大模型的企業(yè),都關(guān)注業(yè)務(wù)數(shù)據(jù)而不是算法指標(biāo)。" 比如轉(zhuǎn)化率、點(diǎn)擊率和其他關(guān)鍵指標(biāo),分別提升了幾個百分點(diǎn),如果不能做到這些,即便算法有 1 萬億參數(shù),價格低至 1 毛錢,客戶也不會買單。"
5 月的這一波價格戰(zhàn),大模型 API 的調(diào)用價格直降超過 90%。以字節(jié)跳動、阿里、百度為例,每百萬 token 推理輸入量的價格,降到了 8 毛、5 毛和免費(fèi)。
然而這更多被市場解讀為營銷行為,有點(diǎn)清倉大甩賣的意味。
Lepton AI 創(chuàng)始人、阿里原副總裁賈揚(yáng)清說:" 今天不是說 API 貴才沒有人用,而是因?yàn)?,企業(yè)首先得搞清楚到底怎么用起來產(chǎn)生業(yè)務(wù)價值,否則的話,再便宜也是浪費(fèi)。"
出門問問創(chuàng)始人李志飛更是直言:" 將 API 價格降到無限逼近零,說明 OpenAI 對消費(fèi)者收費(fèi)和對企業(yè)收費(fèi)的兩種商業(yè)模式在中國競爭環(huán)境下都不可持續(xù)。"
百度是 C 端 B 端兩手抓,其中面向 C 端的文心一言 4.0 是付費(fèi)版,連續(xù)包月 49.9 元,百度一直沒有公布文心一言的付費(fèi)率數(shù)據(jù)。據(jù) AI 產(chǎn)品榜的數(shù)據(jù),后起之秀月之暗面的 Kimi,網(wǎng)頁版的訪問量在 4 月超過了文心一言。Kimi 沒有選擇用收會員費(fèi)的形式 " 自廢武功 ",而是非常另類地推出了打賞功能,非強(qiáng)制,在高峰期算力不足時可獲得優(yōu)先使用的權(quán)益。
這還是 C 端大模型的頭部選手,由此可見收費(fèi)之難。歸根到底,當(dāng)前的大模型產(chǎn)品還不夠好用,不是那么剛需,需要給人們一個付費(fèi)的理由。
AI 初創(chuàng)公司語核拿到了奇績創(chuàng)壇的投資,它一開始的產(chǎn)品都是面向 C 端,解決各種實(shí)用需求。創(chuàng)始人池光耀告訴「定焦」,其中一款主力產(chǎn)品 CopyAsk,既能免費(fèi)使用,也可以付費(fèi)解鎖更多功能,但超過 99% 的用戶在白嫖免費(fèi)額度,收上來的錢很難養(yǎng)活公司。
今年初,語核進(jìn)行轉(zhuǎn)型,開始做面向 B 端的 Agent 產(chǎn)品,目前已經(jīng)拿下兩個訂單," 客戶付費(fèi)意愿還不錯,現(xiàn)在有錢賺了蠻好。" 不過,要徹底跑通某個垂類的 B 端業(yè)務(wù),還需要一段時間探索。
有極少部分公司,抓住了市場需求,并打通了業(yè)務(wù)場景,率先賺到錢。
陳冉想做生態(tài),他的 OpenCSG 線上做社區(qū),線下賣軟件 CSGHub 和 Starship,客戶以 B 端企業(yè)和 D 端開發(fā)者為主,已探索出應(yīng)用分傭和用戶訂閱兩個變現(xiàn)模式,未來還可以增加算力分傭模式。他告訴「定焦」,公司今年預(yù)期營收幾千萬,盈利大幾百萬。
卷應(yīng)用:
爆款應(yīng)用未出現(xiàn),產(chǎn)品和工程落地難
大模型發(fā)展到今天,從業(yè)者一方面想辦法賺錢,同時也在等待爆款應(yīng)用出現(xiàn)。之前我們見證了妙鴨相機(jī)、Kimi、Suno 等應(yīng)用的走紅,但這都還稱不上爆款。而只有出現(xiàn)爆款,才能說明 AI 不是紙上談兵。
大模型廠商打響 API 價格戰(zhàn)之時,有人不以為然,有人嗤之以鼻,也有人格外興奮。
作為一個獨(dú)立應(yīng)用開發(fā)者,池光耀認(rèn)為API 降價是巨大利好。API 降價之前,他每個月要花 200 元左右的預(yù)算在模型調(diào)試上,現(xiàn)在他調(diào)用降價之后的深度求索 DeepSeek-V2 模型,半個多月只花了 1.11 元。
他去年開發(fā)了好幾款應(yīng)用,受限于高頻調(diào)用帶來的高額推理成本,而用戶又不愿意付費(fèi),導(dǎo)致至今產(chǎn)品沒有推出去?,F(xiàn)在他迫不及待想讓這些應(yīng)用 " 跑 " 起來," 要不是現(xiàn)在手上有 B 端的單子推不掉,我就直接去做 C 端產(chǎn)品了。" 同時,那些以前因?yàn)樨?fù)擔(dān)不起 API 調(diào)用費(fèi)而做不了的 B 端訂單,現(xiàn)在也可以做了。
他認(rèn)為,接下來幾個月,會有海量關(guān)于大模型的應(yīng)用場景的探索,很可能會帶來應(yīng)用場景的大幅增加。一些過去需要依靠人工或工程化的手段判斷的高頻的、低邏輯需求的,且延時不敏感的應(yīng)用場景,或許可被免費(fèi)的大模型 API 取代掉。
大模型落地,一定是從場景開始突破。無論大模型 API 是否降價,找場景都會成為下半年的共識。
李友峰認(rèn)為,下半年出圈的應(yīng)用會越來越多,找到合適的場景,在規(guī)模產(chǎn)出的基礎(chǔ)上覆蓋規(guī)模的成本。" 大家應(yīng)該拼命去找價值,而不是卷價格。"
目前的 AI 應(yīng)用中,有兩類已經(jīng)顯現(xiàn)出了價值,并獲得了不錯的反饋。
一類是提效,Kimi 幫助職場打工人搜索資料、整理文獻(xiàn);造物云給品牌用 AI 做產(chǎn)品設(shè)計和營銷物料,創(chuàng)始人邱懿武告訴「定焦」,他們用 AI 給某咖啡品牌做了 2000 個杯子的設(shè)計方案,不算模型投入,算力成本只要 10 塊錢。
另一類是娛樂,比如 Suno 這種 AI 寫歌軟件,以及很多創(chuàng)業(yè)公司在做的 AI 陪伴、角色扮演。
目前行業(yè)里普遍認(rèn)為,Agent AI 是下半年行業(yè)的重點(diǎn),國內(nèi)外從業(yè)者都在往這方面卷。
隨著對產(chǎn)業(yè)的探索加深,李友峰發(fā)現(xiàn),AI 真正難的是產(chǎn)品和工程(指構(gòu)建、開發(fā)和部署大型機(jī)器學(xué)習(xí)模型的一系列技術(shù)和實(shí)踐)。" 不斷讓大模型走向產(chǎn)品、工程、商業(yè)、產(chǎn)業(yè),是中國創(chuàng)業(yè)公司成長的唯一路徑。"
一旦工程問題解決了,模型反而不重要了,用戶在使用產(chǎn)品的過程中,不關(guān)心底層用的是哪個模型,自研占多大比重,效果好比說啥都強(qiáng)。
現(xiàn)在的情況是,大模型在具體應(yīng)用時,還不能百分之百保證效果。以大語言模型為例," 胡說八道 " 的毛病一直沒有克服。" 這種不可控的狀態(tài),很難讓它在生產(chǎn)中發(fā)揮很大作用,還需要時間打磨。對于大部分 B 端客戶,如何跟上社區(qū)和大模型生態(tài)發(fā)展和進(jìn)化才是應(yīng)該關(guān)注的。" 陳冉說。
他認(rèn)為,之前行業(yè)對大模型過于樂觀,總有 " 訓(xùn)練一個大模型改變世界 " 這種不切實(shí)際的幻想,事實(shí)上大模型還沒有真正形成生產(chǎn)力。在 AI 1.0 到 AI 2.0 之間,還有一個過渡的過程。" 就是如何通過 AI 先賦能已有體系,而不是全盤否認(rèn)。"
在向上爬的過程里,必然有一些公司會摔下去被淘汰,尤其是那些還不具備造血能力的公司。斯坦福大學(xué)以人為本人工智能研究院在一份報告中稱,2023 年全球?qū)θ斯ぶ悄艿耐顿Y連續(xù)第二年下降。
在國內(nèi),以阿里、百度為代表的科技大廠還在持續(xù)投資,比如阿里就耗資 8 億美金,投資了 Kimi 的母公司月之暗面,占股 36%,市場傳聞騰訊也在洽談跟進(jìn)。
然而,對于推動原始創(chuàng)新和產(chǎn)品落地,這些大廠究竟發(fā)揮了多大作用、扮演著什么角色,我們越來越難以評估。大廠一方面自己做大模型,同時又投資了市面上幾乎所有的明星創(chuàng)業(yè)公司,用股權(quán)把對手綁定。甚至這一波被開發(fā)者稱贊的 API 降價,也不是由大廠發(fā)起,而是一個叫幻方量化的私募巨頭,以及創(chuàng)業(yè)公司智譜 AI 帶頭,隨后的大廠跟進(jìn),充滿了被動和營銷的味道。
下半年,行業(yè)依然會很卷,畢竟國內(nèi)大模型從一開始就是競爭驅(qū)動的。也許,我們能卷出來幾個贏家,爆款應(yīng)用也不遠(yuǎn)了。
來源:定焦