他們說它更聰明、更快速、更適合Vibe Coding(透過自然語言生成程式碼)。
Google 於11/18(二)宣布推出 Gemini 3,這是其旗艦大型語言模型的最新版本,Google稱之為迄今為止最聰明的模型,並提供了一系列基準測試數據來佐證其說法。該公司表示,Gemini 3 Pro 將從今天起在包括搜尋在內的多款Google產品中面向用戶提供預覽版,而「增強型推理模型」Gemini 3 Deep Think 將在完成安全測試後開始向 Google AI Ultra 訂閱用戶推出。
如果你在社群媒體上關註一些人工智慧愛好者,就會知道Gemini 3一直備受期待,他們一直在私下討論這款模型將如何顛覆遊戲規則。它是否真的能做到這一點,時間會給出答案,但Google已經提供了大量指標來證明,從理論上講,這款模型比之前的版本更加出色。該公司自豪地宣稱,Gemini 3在LMArena(一款用於比較邏輯邏輯模型的基準測試工具)的排行榜上名列榜首,取代了Grok 4.1 Thinking。Google還聲稱,Gemini 3 Pro在Humanity’s Last Exam和GPQA Diamond測試中展現了“博士級別的推理能力”,並在MathArena Apex測試中創造了數學性能的新紀錄。當然,Gemini 3 Deep Think的得分還會更高。
許多人說,人工智慧基準測試被認為不可靠且具有誤導性,這重要嗎?如果你是盲目跟風的人,那就無關緊要了。
所以 Gemini 3 更智能,這通常是新一代 LLM 車型的主要升級之處。但Google也為這款模型引進了一些新功能。該公司發布了Google Antigravity,這是一個整合開發環境 (IDE),內建 AI 代理,旨在最大程度地提升您的程式設計體驗。簡而言之,它可以讓您更輕鬆地將編碼任務交給 AI,AI 可以根據使用者的命令在編輯器、終端和瀏覽器中運行。雖然 Gemini 3 Pro 將是預設版本,但Google表示 Antigravity 也支援 Claude Sonnet 4.5 和 GPT-OSS 代理程式。 Antigravity 將於今日在 Windows、Mac 和 Linux 系統上提供測試。
除了新推出的 Antigravity 之外,開發者還可以透過 Google 的 Vertex AI 和 AI Studio 存取 Gemini 3 Pro。該公司還聲稱 Gemini 3 的編碼基準測試也堪稱世界一流——在WebDev Arena排行榜上名列榜首,並在Terminal-Bench 2.0 測試中創下新高。當然,這些測試結果對你而言是否具有實際意義,或者只是測試中的數字,則可能因人而異。
Gemini 3 的最大特色在於,你根本無法避免使用它。該公司首次將該模型直接整合到搜尋功能中。因此,你從 AI 模式獲得的任何答案,都經過了 Gemini 3 的計算。
Gemini 3 是Google 迄今最強大的模型系列,以最先進的推理技術為基礎建構而成。這項產品旨在協助使用者掌握代理式工作流程、自主編碼和複雜的多模態工作,將任何想法付諸實現。Gemini 3 Pro 的預設會使用動態思考功能,根據提示進行推理,如果使用者不需要複雜的推理,可以將模型的思考層級限制為 low,加快回應速度並縮短延遲時間。
當然,Gemini 應用將是該車型的主要運行平台。用戶將體驗到Google所謂的“生成式介面”,該介面提供兩種輸出模式:視覺佈局和動態視圖。視覺佈局是一種較傳統的體驗,它會根據使用者的提示自動產生圖像。而動態視圖則能讓 Gemini 快速產生類似網站的功能性介面,包含可操作的按鈕,並允許使用者與不同的資訊頁面進行互動。
Google的Gemini 3是人工智慧領域巨頭競相超越的最新成員,11月初,OpenAI發布了GPT-5.1模型,而就在隔週的週一(11/17),馬斯克的xAI發布了Grok 4.1;然後僅僅24小時之後,Google就以其聰明又快速的模型再次搶佔了先機。且讓我們拭目以待,看看Google能維持多久的領先地位,得以免於其他模型的超越。



