12 月 6 日,谷歌宣布推出其認為規模最大、功能最強大的人工智能模型 Gemini。
谷歌首席執行官皮查伊表示,Gemini 1.0 是目前為止谷歌能力最強的通用人工智能模型,Gemini 是原生多模態打造,是谷歌通往 Gemini 模型時代的第一步。

據介紹,Gemini 1.0 是谷歌籌備了一年之久的 GPT4 真正競品,將包括三種不同的套件:Gemini Ultra、Gemini Pro 和 Gemini Nano。其中 Ultra 的能力最強,復雜度最高,能夠處理最為困難的任務;Pro 能力稍弱,可以用來處理多任務;Nano 則更注重于端側的處理能力。
和市面上現有大模型相比,Gemini 從一開始就被創建為多模態的模型。因為從最初的預訓練數據開始,Gemini 就在針對不同模態的模型進行訓練,這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。在靈活度上,從數據中心到移動設備上,它都能夠運行。

谷歌表示,對 Gemini 模型進行了嚴格的測試,并評估了它們在各種任務中的表現。從自然圖像、音頻和視頻理解到數學推理,在被大型語言模型(LLM)研究和開發中廣泛使用的 32 項學術基準中,Gemini Ultra 的性能有 30 項都超過了目前最先進的水平。
在權威 MMMU 基準測試中,Gemini Ultra 獲得了 59.4% 的 SOTA 分數。作為對比,人類專家的得分率為 89.8%,GPT4 得分率為 86.4%。但是谷歌并沒有透露 Ultra 和 Pro 版本的具體參數規模。

此外,谷歌還基于 Gemini 模型開發了專業的代碼模型 AlphaCode 2。與前一代相比,AlphaCode 2 的性能提升了至少 50% 以上。
谷歌表示計劃通過谷歌云將 Gemini 授權給客戶,供他們在自己的應用程序中使用。從12 月 13 日開始,開發者和企業客戶可以通過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 訪問 Gemini Pro。來源:新浪VR