對話小冰李笛、螞蟻徐鵬:大模型最大問題是“雷同”,API商業模式已落伍
時間:2023-09-09 13:53:23
智東西
【資料圖】
作者 | ZeR0
編輯 | 漠影
智東西9月7日報道,2023Inclusion·外灘大會今日開幕,在下午的“AI前沿技術發展與應用的新浪潮”論壇期間,來自高校、科研單位、科技企業及投資機構的學者專家們齊聚,分別從算法、算力、產業、應用、場景等不同視角,探討生成式AI和大模型產業現存的挑戰與發展趨勢。
會后,螞蟻集團副總裁徐鵬與小冰公司CEO李笛接受智東西等媒體的采訪,就大模型及AIGC應用同質化問題、開源與閉源路線的選擇、數據及算力稀缺情況等焦點議題進行深入交流。
徐鵬在致辭中談道,當前,AI大模型技術正高速迭代,新模型、新算法、新應用、新場景正不斷涌現,挑戰也隨之而來,比如算力能耗問題、中文公開數據集語料不足問題、大模型應用安全問題,解決這些問題,需要產學研各界力量協同創新。技術的公平普惠性也要關注,無論是大型還是中小企業,都能借助AI大模型技術提升企業智能化水平,為用戶帶來更好的服務和體驗。
一、大模型雷同問題嚴重,應用創新才能實現大發展關于大模型同質化問題,李笛和徐鵬都認為,從應用入手,可以做出非常多不一樣的東西。
在論壇圓桌環節,李笛談道,自己最大的憂慮是國內大模型的多樣性,大家用同樣的數據集、同樣的訓練方法、同樣的master,對比同樣的對象、類似的方法,多樣性確實有很大問題。“現在處于技術百花齊放的狀態,應該嘗試不同的東西,而不是馬上數理化外語卷起來了。”
“我覺得現在行業里面最大的問題其實就是「太雷同了」,大家都沿著同一條路徑在往前走,沒有多樣性,這和創新精神是違背的。”李笛認為,創新不是追趕,而是有自己新的方法,去實現自己的優勢。他告訴智東西,大模型首先得追及格,再去嘗試多樣化、差異化,重復造輪子沒有必要,在應用上才能實現大的發展。
徐鵬非常認可李笛的觀點,大家都是在追趕,首先要及格,及格后才有機會發展的更好,大模型技術上沒有本質的差異,但側重點不一樣,像Llama是做一個通用的開源基礎模型,GPT本身是閉源的,主要是做ChatGPT對話能力,達到通用人工智能(AGI),在對齊方面要做的很好、上下文長度做的很長,每個既有雷同的地方,又有自己的特色。
他相信像這樣非常基礎的底層技術,開源是未來。中國形成自己的大模型開源生態,還需給一定的時間。開源模型給應用創新帶來便利,不用從頭開始浪費大量的財力去訓練基礎模型,如果大家都將力量放在應用創新上,應用生態更加繁榮,會反過來推動大模型技術的發展。
據他觀察,美國很多公司放棄走基礎模型這條路,直接在上面做能夠創造附加價值的應用,而應用多樣性才能給人類、給社會帶來價值。
徐鵬感覺,這一波大模型的能力,還不能做出來真正讓人人都能夠獲益的agent,但可能是可以真正往前推進的方向。至于爆款AIGC應用,在他看來,這是可遇不可求的東西,即便如ChatGPT,也會有一定的審美疲勞,能夠持續增長的應用非常少。
在李笛看來,開源模型生態過去已經證明了非常旺盛的生命力,但大模型開源目前為止把整個戰場變得更加混亂。至于未來到底是閉源還是開源,取決于在行業中的角色定位,如果做大模型,肯定是閉源,如果是一家云計算公司,要兼容各種模型,開源和閉源都是好的生態。
二、建高質量中文數據集是苦力活,英偉達GPU并非無可取代大模型不能解決所有的事情,需要組合更多技術、靠整個系統不停幫它彌補。李笛聯想到他最欽佩的一家公司任天堂,跟微軟和索尼相比,任天堂不是堆最先進的硬件,而是榨干1080P成熟技術的最后一點能力,這很重要。
他認為,數據并不是問題,中文語料如果做了好好清洗,還是可以的。把語料真正挖清楚,清洗得足夠好,篩選得足夠好,這是苦力活。徐鵬補充說,這個苦力活,誰都逃不開,但是中文本身數據的量級應該是夠的。
除了需要更多高質量數據,算力也永遠緊缺。
李笛說,算力消耗合不合理,取決于商業模式效果,比如游戲NPC,拿很多算力陪人聊天,游戲掙得錢都被NPC聊沒了,算力再多也不合理;如果消耗的算力被用于通過生成式AI得到高附加值的收益,算力消耗則是合理的。
根據徐鵬今日的演講內容,螞蟻基礎語言大模型采用Transformer架構,使用英偉達GPU、螞蟻自研的模型架構、高效訓練和推理引擎。
作為AI訓練芯片的首選,英偉達GPU是當前生成式AI算力紅利的大贏家。但徐鵬并不認為英偉達GPU具有非常強的不可替代性,他告訴智東西,這更多是個效率問題,因為英偉達發展的最快、有很強的軟件優勢、用它的產品效率最高,開箱可用。
應用方采購硬件,有兩個因素影響決策買哪些硬件、買多少因素:一是性價比高不高,二是能不能買到。其他公司并不是說沒有機會,只是現在還不及英偉達那么成熟,除了硬件本身能力外,還需努力追趕英偉達的軟件銜接能力。
李笛相信,恰恰因為大模型太貴了,大家很快會走到一條好的道路上,因為不可能燒錢燒很久,他相信很快就會有變化。
三、從技術信仰轉向產品驗證,AIGC亟待探索全新商業模式“很高興看到整個行業開始進入到了從技術的信仰到產品的驗證狀態,在未來一年里面的時間,大部分的產品應用會進入到證偽階段。”李笛在發表演講時談道,生成式AI創造的價值與技術所對應的公司實際獲得的價值之間存在巨大的鴻溝,這是他看到的當前商業模式最大問題,無論是To C還是To B都應考慮這一問題。
在他看來,目前為止在全球范圍內,沒有一個成功的AI To C的產品,也沒有To B的產品。
過去API調用的商業模式,很大的問題是直接把技術的特點輸出了,相當于把科學家手頭工作直接懟到客戶面前,中間缺少產品化的階段,也就沒有體現出生成式AI的創造力價值。
很多人已經開始探索新的AIGC商業模式。小冰積極嘗試Revenue Share的方式,以高附加值作為價值回報的考量依據,李笛認為,大模型創造了一個高附加值的一次交互或一次調用,比期待算力成本下降更加有效,用最貴的GPU、最好的技術都是合理的。
以小冰通過合作幫助動漫工作室打造的生成作品為例,如果按照傳統商業模式,游戲廠商總計一次性技術開發收費為幾十萬人民幣,而通過Revenue Share的新方式,3分鐘《人和狗》短片上架,小冰獲得了15萬美元的回報。此外,小冰和網易合作推出了一個新的平臺,每一個AI歌手都享有全部生命周期里全部收益的比例,這樣的方法才有可能使得真正獲得創造力價值。
結語:中國已經有好的高原,接下來一定會產生自己的高峰李笛強調說,技術發展不是一飛沖天的,都是進入波峰,很多人有創新,又卡住了,突然不知是誰解決了行業難題,大家一起又繼續前進。
面對持久的大模型熱潮,徐鵬建議要冷靜看到它長期能帶來什么樣的價值、它的能力邊界在什么地方,而不是盲目地做太多不切實際的幻想。但又不能離開幻想,因為有幻想才有動力,才有更多的人愿意去做一些看上去不靠譜的事情。
他希望有一定機制去支持有人長期在這個方向做進一步地投入,然后找到核心應用場景,找到它真正能夠帶來變化的東西,有了這些,就可以反哺AI技術的發展。
這與清華大學計算機科學與技術系副教授劉知遠的觀點不謀而合。劉知遠在今日的圓桌論壇期間談道,為什么ChatGPT被美國做出來了,中國做不出來?結論是“中國有高原、沒高峰”,最原始創新的工作目前仍缺少相應穩定支持的機制,但無論怎樣,一切還是在向好的方向發展。
現在百模大戰有一些內卷的傾向,但他相信隨著內卷不斷進行,會變成大家開始尋找差異化的過程,“我們有了這么一個非常好的高原,接下來一定會產生自己的高峰。”劉知遠說。
相關稿件
對話小冰李笛、螞蟻徐鵬:大模型最大問題是“雷同”,API商業模式已落伍
路人鏡頭下的章小蕙,穿牛仔變五五分肚子還大,但60歲長得像30
石英股份:9月8日融券賣出5.06萬股,融資融券余額10.89億元
“救火英雄”、航天人、全科醫生……這些不平凡的閔行故事暖心人!
世界上最坑的5個景點,九寨溝上榜,網友:這是沒來過九寨溝吧?
福建艦核心戰力,不是殲35,老將改裝上馬,搭載鷹擊21更兇猛
收起你的緊身裙吧!今年最流行的是“背帶裙”,不挑年齡不挑身材
假面騎士:檀黎斗演員巖永徹也發生活照,黃色衣服長發蝦餃真的好看
泉州率先推出“清單+分類處置”措施 可盤活利用新舊海岸線間土地5萬畝
騰訊助力襄陽打造全國首個“智能網聯+智慧交管”全域融合應用城市
筠誠和瑞過會:今年IPO過關第232家 中金公司過13.5單
激光投影之戰落下帷幕!ALPD5.0超級全色激光真的無人能比
拓寬舉報獎勵渠道和發放方式 山東修訂生態環境違法行為舉報獎勵規定