所有語言
分享
文章來源:硬AI
作者 | 張逸凡
編輯 | 硬 AI
24Q1財報會議上,百度集團透露了公司AI業務的最新進展。
百度,一家在PC時代嶄露頭角的科技巨頭,面臨了在移動互聯網時代的挑戰和競爭,似乎未能完全抓住時代的機遇,相比於其他科技公司在這一階段的快速發展,百度顯得有些落後。
隨着時間進入人工智能(AI)時代,百度希望能夠藉此機會彌補過去在移動互聯網時代的失地,重新確立自己在技術領域的領導地位。
在剛剛結束的百度最新財報會上,公司透露了AI業務的最新進展:
·AI雲服務營收同比增長12%;
·百度搜索11%內容由AI生成;
·大模型API調用量激增:近五個月,從5000萬增長至2億;
·AI模型性能大幅優化:訓練效率提高到 5.1 倍,推理成本降低到百分之一;
百度董事長兼首席執行官李彥宏在電話會中表示,公司正在從以互聯網為中心轉向人工智能優先,推進用文心大模型重構To C和To B業務。目前,文心大模型日均處理Tokens文本約2500億,日均調用量2億次。
李彥宏特彆強調:搜索最有可能成為AI時代的“殺手級”應用(killer app),而百度搜索的AI重構工作仍處於早期階段。
此外,百度CFO羅戎稱,在未來幾個季度,百度將繼續支持AI業務高質量增長。公司認為,隨着中國生成式 AI 的新時代展開,將為百度帶來更多機遇。
“All in AI”——百度的新機遇?
為了實現李彥宏“以互聯網為中心轉向人工智能優先”這一目標,百度正大力投資於AI技術的研發和應用,特別是在自動駕駛、深度學習、自然語言處理等領域。
百度正試圖搶回在移動互聯網時代失去的陣地。
·PC時代,憑藉著獨特的搜索引擎技術,百度成為了國內的搜索龍頭;
·移動互聯網時代,用戶流量從PC端轉移到移動端,公司雖多方位布局,但相較於騰訊/阿里仍顯遜色;
·在推薦算法時代,又大幅落後於字節信息去中心化模式;
·邁入AI時代,百度基於其在AI領域擁有的深厚積累,希望能夠在此浪潮中突圍;
AI效果在財報中已逐漸突出,今年一季度智能雲業務的收入達到47億元,同比增長12%,來自生成式人工智能和基礎模型的收入占智能雲業務收入的6.9%。
AI雲服務,從芯片到平台
2016年,百度CEO李彥宏提出“AI+雲+大數據”的雲服務戰略。
此後,百度智能雲構建了“芯片—框架—模型—MaaS平台”的全棧式AI基礎設施,這一基礎設施支持從數據存儲到模型訓練、部署、運行的全鏈路AI服務。
值得一提的是,百度飛槳平台已經兼容了50多種不同芯片,許多是本土設計的,開發者社區已經增長至1300萬。
這種AI基礎設施布局模式,也讓百度在受制外部環境情況下,更好的匹配國內AI雲需求。李彥宏認為,這種模式使得百度能夠將不太先進的芯片用於高度有效的模型訓練和推理。
李彥宏在電話會中稱,百度把來自不同供應商的GPU集成到統一的計算集群中,以訓練大語言模型,“我們的平台在GPU集群上展示了非常高的效率,該集群由成百上千的GPU組成,這是在進口GPU受到限制的背景下取得的重要突破。”
1)自主研發芯片
公司自主研發了 AI 芯片(崑崙)和語音交互芯片(鴻鵠),用於優化語音、自然語言處理、圖像等 AI 技術,並支持公司的深度學習框架。
芯片最新進展:
·AI芯片:迭代到崑崙2,相比崑崙1代性能提升了2-3倍,提供128TFLOPS算力,內存帶寬512GB/s;
·語音交互芯片:迭代到鴻鵠900,較上一代鴻鵠818芯片,CPU性能提升200%,GPU提升160%,搭載於華為智慧屏V5 Pro;
2)深度學習框架 —— Paddle Paddle
Paddle Paddle是百度基於BERT自研的深度學習框架,集成了深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件。
該框架服務企業遍布能源、金融、工業、醫療、農業等多個行業。例如,連心醫療基於PaddlePaddle平台開發的“基於CT影像的肺炎篩查與病情預評估AI系統”已在湖南郴州湘南學院附屬醫院投入使用。
Paddle Paddle採用了開源的形式,方便百度更好的建立自己的AI生態圈。
根據公司披露的信息:
·截至 2024 年 4 月中旬,PaddlePaddle 開發者社區已經擁有了 1300 萬名成員;
·截至2023年底, PaddlePaddle 為 23.5 萬家企業提供服務,開發社區已經創建了 86萬個模型;
此外,數據显示,Paddle Paddle 在 Github 使用人數、貢獻者人數和技術迭代速度上,僅次於海外一線平台 Pytorch 和 TensorFlow。
3)AI大模型 —— 文心繫列模型(Ernie)
基於強大的基礎模型(Paddle Paddle),百度研發了文心繫列模型Ernie(有趣小故事:文心一言的英文名為“Ernie”, 源於美國兒童節目《芝麻街》中的角色的名字,而節目中Ernie的好朋友正是Bert,Bert是谷歌2018年發布的AI模型)。
目前迭代至文心 4.0,參數規模可能超1萬億,約為文心 3.5 的4-5倍。
根據公司披露,截至今年4 月,文心模型每天處理的 API 調用約為 2 億次,遠超去年 12 月的約 5000 萬次調用,表明百度文心模型正被越來越多的人所採用,並預示着未來模型推理具備強勁的收入潛力。
此外,為了讓模型更具性價比,公司通過獨有的四層人工智能架構和強大的端到端優化能力,不斷提高模型的效率。與 3 月 23 日的版本相比,文心模型的訓練效率提高到 5.1 倍,推理成本降低到百分之一。
4)MaaS(AI開發雲平台)
為了讓開發者更簡單的開發AI模型,百度在雲平台上提供了三套工具:
·AppBuilder 和 ModelBuilder:供企業和個人開發者開發應用程序和搭建模型;
·AgentBuilder:可以輕鬆創建一個AI Agent;
盈利方面,百度從 2022 開始將業務重點放在提升 AI 智能雲業務的利潤率上,廢除了低質量業務,同時致力於為不同行業的客戶定製標準化 AI 解決方案。
24Q1的業績會上,公司表示,智能雲收入增長主要由生成式 AI 和模型訓練驅動。目前,大部分收入來自模型訓練,但來自模型推理的收入增長很快。
展望未來,百度認為模型推理是最重要的長期機遇之一,也是未來人工智能雲收入的主要增長動力。
“AI+”業務賦能
AI技術在百度內部廣泛應用於搜索引擎、信息流推薦、百度翻譯等多個領域。
在電話會中,李彥宏對未來AI賦能搜索支柱業務信心更足,認為搜索是AI時代最可能成為殺手級應用的產品:“AI搜索能使用戶能夠做到以前做不到的事,並且百度暫時還沒打算對這部分收費。”
去年第二季度開始,百度就已經使用文心一言重建百度搜索,現在越來越多的搜索結果是文心一言以不同格式如文本、圖像、第三方鏈接等組合而成的。
在模型構建上,百度使用了3種輕質模型和2種針對特定任務的模型,並且搭配專家混合模型,用來給大模型分配任務,在性能和成本上找到了更好的平衡。
從數據上看,AI確實正在提升百度各個業務的效率:
1)AI+百度搜索:截至24Q1,百度搜索有11%的內容由AI生成,同時,AI搜索推動了廣告收入的增長;
2)AI+百度文庫:通過引入生成式AI功能,吸引了18%的新付費用戶。這些功能包括內容總結、創作、擴展以及將靈感一鍵轉化為Powerpoint等。24Q1 百度文庫付費用戶數量實現了兩位數的同比增長。
3)AI+百度地圖:引入了“AI嚮導”功能,在理解用戶需求的基礎上,智能調用眾多地圖功能及服務,快捷準確地給出解決方案;
4)AI+百度網盤:推出了基於文心大模型的智能助理“雲一朵”,幫助用戶實現一句話快速搜索文件和視頻、總結知識、翻譯文檔、甚至進行內容創作的功能。截至23Q3“雲一朵”的用戶已達到2000萬。
終端廠商合作AI手機/AI PC
AI除了對內提升效率,本季度百度也進一步擴大了對外合作。
根據公司披露,上季度,公司已與三星中國、榮耀等手機廠商達成合作。本季度,合作擴展到更多領先智能手機廠商,包括Oppo、VIVO和小米。
業務範圍也從智能手機擴展到PC和電動汽車領域,進一步擴大了百度的AI生態圈。聯想正利用Ernie API為其默認瀏覽器中的AI助手提供支持,蔚來汽車開始使用Ernie API增強車內體驗。
此外,公司吸引了許多新客戶,包括攜程、高途、招聘、作業幫和新加坡旅遊局,通過AI技術,幫助他們重構所有面向消費者的產品,以提供更好的用戶體驗。
對外投資
除了自主研發,百度也通過對外投資來不斷擴展自家的AI生態,覆蓋了芯片-模型-模型應用三大環節。但很明顯,與阿里不同,百度的對外投資更偏向於上下兩端。
這個原因也不難理解,因為百度未來將依靠搜索這類應用端支撐收入,完成商業模式閉環的。
最有代表性的一個證明來自李彥宏對大模型開源還是閉源的判斷:“大模型開源意義不大,閉源才能走通商業模式,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。”
“閉源在成本上反而是有優勢的,只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定更快”,這也是與阿里雲不同的商業模式的思考。
所以,按照百度的思路,未來的路已經比較清晰,但AI時代的競爭顯然會比PC時代更加激烈。