所有語言
分享
文章來源:有新Newin
Meta 剛剛公布了其定製 AI 芯片的最新進展。Meta 在上一年度首次公布了其第一代 AI 推理加速器,即 Meta 訓練與推理加速器(MTIA)v1,專門設計用於 Meta 的 AI 工作負載。它特別適用於改善其應用和技術中各種體驗的深度學習推薦模型。
MTIA 旨在為 Meta 獨有工作負載提供最高效的架構。隨着 AI 工作負載在其產品和服務中變得越來越重要,這種效率成為 Meta 能夠為全球用戶提供最佳體驗的關鍵。MTIA v1 是提高基礎設施計算效率、更好支持軟件開發人員構建新的、改善用戶體驗的 AI 模型的重要一步。
Meta 的下一代大規模基礎設施正在建設中,考慮到了人工智能的需求,包括支持新的生成式 AI 產品、推薦系統和先進的 AI 研究。隨着支持 AI 模型的計算需求及模型複雜性的增長,預計這方面的投資在未來幾年將會增加。
下一代 MTIA 是 Meta 定製、特定領域芯片的全棧開發計劃的一部分,該計劃旨在解決其獨特的工作負載和系統。這個新版本的 MTIA 在計算和內存帶寬上是先前解決方案的兩倍多,同時保持對工作負載的緊密聯繫。
它旨在有效服務於提供高質量推薦的排名和推薦模型。這款芯片的架構專註於為排名和推薦模型提供計算、內存帶寬和內存容量之間的正確平衡。
MTIA 已部署在 Meta 的數據中心,並正在生產環境中提供服務。通過這個項目,Meta 能夠為更密集的 AI 工作負載投入更多的計算能力。
到目前為止的結果表明,這款 MTIA 芯片能夠處理低複雜度和高複雜度的排名和推薦模型,這些模型是 Meta 產品的關鍵部分。因為 Meta 控制了整個技術棧,它能夠實現比商業可用的 GPU 更高的效率。
Meta 正在持續投資定製芯片。MTIA 將成為 Meta 為其獨特 AI 工作負載構建和擴展最強大、最高效基礎設施的長期路線圖的重要組成部分。
Meta 正在設計其定製芯片,以便與現有基礎設施以及未來可能利用的新的、更先進的硬件(包括下一代 GPU)合作。實現定製芯片的目標意味着投資不僅在計算芯片上,還包括內存帶寬、網絡和容量以及其他下一代硬件系統。
目前,Meta 正在進行幾個項目,旨在擴大 MTIA 的應用範圍,包括對生成式 AI 工作負載的支持。這一旅程才剛剛開始。
PS:回顧 2023 年至今,大部分 AI 炒作都集中在基礎模型的橫向能力上,但 AI 的真正機會在於 AI 以及 Agent 如何重新配置與創造 B2B 價值鏈。
Reference:
https://about.fb.com/news/2024/04/introducing-our-next-generation-infrastructure-for-ai/