YouToCoin報道:
a之後破紀錄2024英偉達(Nvidia)以一場盛大的活動拉開了2025年的序幕,推出了一系列產品,可以鞏固其在人工智能開發和遊戲領域的主導地位。
首席執行官黃仁勛(Jensen Huang)在拉斯維加斯的消費电子展(CES)上上台展示了從個人人工智能超級計算機到下一代遊戲卡的各種新硬件和軟件產品。
Nvidia最大的公告:Project DIGITS,一款價值3000美元的個人人工智能超級計算機,將千萬億次的計算能力裝入台式機大小的盒子里。
這台機器是圍繞新的——到目前為止,還是秘密的——GB10 Grace Blackwell超級芯片建造的,它可以處理多達2000億個參數的AI模型,同時從標準插座供電。
對於較重的工作負載,用戶可以鏈接兩個單元來處理多達4050億個參數的模型。
就上下文而言,最大的Llama 3.2模型,Meta最先進的開源LLM,有4050億個參數,不能在消費類硬件上運行。
到目前為止,它需要大約8個Nvidia A100/H100超級芯片,每個芯片的成本約3萬美元,僅在處理硬件方面就總計超過24萬美元。
Nvidia的兩台新型消費級AI超級計算機將耗資6000美元,能夠運行相同的量化模型。
英偉達首席執行官黃仁勛在一份官方聲明中表示:“人工智能將成為每個行業每個應用程序的主流。通過Project DIGITS,Grace Blackwell超級芯片將惠及數百萬開發者。”博客文章“將人工智能超級計算機放在每個數據科學家、人工智能研究人員和學生的桌子上,使他們能夠參与並塑造人工智能時代。”
對於那些喜歡技術細節的人來說,GB10芯片代表了與聯發科合作取得的重大工程成就。
片上系統將Nvidia最新的GPU架構與通過NVLink-C2C互連連接的20個節能ARM內核相結合。
每個DIGITS單元配備128GB統一內存和高達4TB的NVMe存儲。同樣,就上下文而言,迄今為止最強大的GPU每個都包含約24GB的VRAM(運行AI模型所需的內存),而H100 Superchip的VRAM從80GB開始。
Nvidia計劃主導人工智能代理
公司正急於部署人工智能代理,Nvidia知道這一點,這可能就是為什麼它開發Nemotron,一個有三種尺寸的新型號系列,並於今天宣布推出兩款新型號:Nvidia NIIM用於視頻摘要和理解,Nvidia Cosmos用於賦予Nemotron視覺功能——理解視覺指令的能力。
到目前為止,LLM只是基於文本的。然而,這些模型在以下指令方面表現出色:聊天、函數調用、編碼和數學任務。
它們可以通過Hugging Face和Nvidia的網站獲得,企業可以通過該公司的AI enterprise軟件平台訪問。
再次,就上下文而言,在LLM競技場Nvidia的Llama Nemotron 70b的排名高於Meta開發的原始Llama 405b。它還擊敗了不同版本的Claude、Gemini Advanced、Grok-2 mini和GPT-4o。
英偉達的代理推動現在也與基礎設施有關。該公司宣布與LangChain、LlamaIndex和CrewAI等主要代理技術提供商合作,在Nvidia AI Enterprise上構建藍圖。
這些準備部署模板處理特定任務,使開發人員更容易構建高度專業化的代理。
一個新的PDF到播客藍圖旨在與谷歌的NotebookLM競爭,而另一個藍圖則有助於構建視頻搜索和摘要代理。開發人員可以通過新的Nvidia可發布產品該平台支持一鍵式原型製作和部署。
玩家們,歡呼吧!新款GeForce RTX 5000顯卡性能強勁
Nvidia將其遊戲公告留到了最後,發布了備受期待的GeForce RTX 5000系列旗艦RTX 5090擁有920億個晶體管,每秒可執行3352萬億次AI操作,是當前RTX 4090性能的兩倍。整個陣容包括第五代Tensor Core和第四代RT Core。
新卡引入了DLSS 4,通過使用AI每次渲染生成多幀,可以將幀率提高到8倍。人工智能引擎Blackwell已經為PC遊戲玩家、開發人員和創意人員而來說“Blackwell融合了人工智能驅動的神經渲染和光線追蹤,是自25年前我們引入可編程着色以來最重要的計算機圖形學創新。”
新顯卡還採用了變壓器模型進行超分辨率處理,承諾提供高度逼真的圖形,並以其價格提供更高的性能——這並不便宜,順便說一句:RTX 5070為549美元,5070 Ti為749美元,5080為999美元,5090為1999美元。
如果你沒有那麼多錢,想玩遊戲,別擔心。
AMD也今天宣布Radeon RX 9070系列。這些卡基於新的RDNA 4架構,採用4nm製造工藝,並具有專用的AI加速器,可與Nvidia的張量內核競爭。
雖然完整的規格仍在保密中,但AMD最新的Ryzen AI芯片在峰值性能下已經達到了50 TOPS。
可悲的是,Nvidia仍然是人工智能應用的王者,這要歸功於其CUDA技術,Nvidia專有的人工智能架構。
為了解決這個問題,AMD已與惠普和華碩建立了系統集成合作夥伴關係,到2025年,100多個企業平台品牌將使用AMD Pro技術。
Radeon顯卡預計將於2025年第一季度上市,為Nvidia在遊戲和AI加速方面帶來一場有趣的戰鬥。
編輯人塞巴斯蒂安·辛克萊