所有語言
分享
文章來源:AIGC開放社區
1月26日凌晨,OpenAI在官網對ChatGPT模型進行了大更新,發布了兩款全新大、小文本嵌入模型,全新的GPT-4 Turbo模型(修復懶惰行為),免費的審核模型,並對新的GPT-3.5 Turbo模型API進行了大幅度降價。
OpenAI還將推出全新的API秘鑰和可視化管理方法,幫助開發人員更簡單、直觀地觀察API使用情況,並對API密鑰設置更詳細的使用權限。
值得一提的是,全新的嵌入模型可以為ChatGPT 、Assistants API中的知識檢索以及很多檢索增強生成式開發工具提供技術支持。
「AIGC開放社區」先簡單介紹一下嵌入模型:嵌入是一串数字,代表了自然語言或代碼等內容中的概念。嵌入也使得機器學習模型和其他算法更容易理解內容之間的關係,並執行分類、內容檢索、搜索、推薦等任務。
同時嵌入是GPT系列模型的核心組成部分,用於將輸入的文本(單詞或字符)轉換為數值向量,例如,詞嵌入、位置嵌入、上下文嵌入,這些向量能夠表示輸入數據的豐富信息,提供更深層次的語義理解。
本次OpenAI發布了小文本嵌入模型text-embedding-3-small和大文本嵌入模型text-embedding-3-large,主要特色性能如下。
1)性能更強:根據OpenAI公布的性能測試,小文本嵌入模型的多語言檢索(MIRACL)常用基準的平均得分從 31.4% 增加至 44.0%;英語任務(MTEB)常用基準的平均得分從 61.0% 增加到 62.3 %。
大文本嵌入模型在MIRACL上,平均得分從 31.4% 增加至54.9%,而在 MTEB 上,平均得分從 61.0% 提高到 64.6%,整體性能比小文本更強悍。
2)支持縮短嵌入節省成本:與較小的嵌入式相比,開發者在使用較大的嵌入式(例如,將其存儲在向量存儲區以進行檢索)通常會花費更多的成本,消耗更多的AI算力、內存和存儲空間。
為了幫助開發者節省成本,OpenAI允許開發人員通過傳遞維度API參數,來縮短嵌入模型(從序列末尾刪除一些数字),而不會使嵌入模型失去其表示特性。
例如,在MTEB基準上,大文本嵌入模型可以縮短到256大小,但性能依然優於大小為1536的未縮短的小文本嵌入模型。
3)API價格:雖然全新的嵌入文本模型性能非常強,但OpenAI對API的價格進行了大降價,小文本嵌入模型的API價格與之前模型相比降了5倍,每1000 tokens價格為0.00002美元。大文本嵌入模型是,每每1000 tokens價格為0.00013美元。
自 OpenAI發布GPT-4 Turbo模型以來,超過70%的GPT-4 API客戶已轉換為GPT-4 Turbo。這是因為GPT-4 Turbo可以提供更大的上下文以及性能。
現在,OpenAI發布了全新的GPT-4 Turbo預覽模型——gpt-4-0125-preview。
與之前相比,該模型能更好地完成代碼生成等任務,同時修復了用戶非常關注的懶惰行為,還修復了影響非英語 UTF-8 生成的錯誤問題。
對於那些希望自動升級到最新GPT-4 Turbo 預覽版模型的開發者,將始終指向OpenAI最新的 GPT-4 Turbo 預覽版。
免費審核模型
為了幫助開發者降低ChatGPT的非法內容輸出,提升安全性,OpenAI提供了免費的審核模型API。
此外,OpenAI還將發布一款迄今為止最強大的審核模型text-moderation-007,進一步提升模型的安全性。
API價格大降價
下周,OpenAI將推出GPT-3.5 Turbo系列的全新模型——gpt-3.5-turbo-0125,同時對API價格大降價。
新模型的輸入價格大降50%,每1000 tokens價格為0.0005美元;輸出價格降低25%,每1000 tokens價格為0.0015美元。
同時該模型進行各種功能改進,包括,提高響應所要求格式的準確性,以及修復導致非英語語言函數調用出現文本編碼錯誤的問題。
為了幫助開發人員更高效地管理API,OpenAI提供了兩種全新管理方法。
1)開發人員現在可以從API密鑰頁面,為API密鑰分配詳細權限。例如,可以為密鑰分配只讀訪問權限以支持內部跟蹤儀錶板,或限製為只能訪問某些特定端點。
2)在開啟跟蹤功能后,使用詳情、導出功能現在可以显示API密鑰級別的指標。因此,開發者只需為每個功能、團隊、產品或項目設置單獨的 API 密鑰,就能輕鬆查看每個功能、團隊、產品或項目級別的詳細使用情況。
在未來幾個月內,OpenAI將進一步提升開發人員對API的使用、觀察和控制能力,這對於大型企業來說非常重要。