Google 發表全新 Gemini 3.5 系列模型,標誌著其在人工智慧代理(AI Agent)技術上的重要里程碑;這次首發登場的 Gemini 3.5 Flash 模型是針對 AI 代理運作與程式碼編寫進行了深度最佳化,能夠穩定處理需要長時間執行的複雜任務;目前,該模型已全面開放應用,一般使用者可透過 Gemini 應用程式與 Google 搜尋的 AI 模式直接體驗;開發者則能利用全新的代理式開發平台 Google Antigravity、Google AI Studio 以及 Android Studio 中的 Gemini API 進行串接;企業用戶亦可透過 Gemini Enterprise 及其專屬的代理平台導入業務流程;Google 也透露目前內部正積極測試更高階的 Gemini 3.5 Pro 模型,預計將於 2026 年 6 月正式對外發布。

效能與速度雙重突破,跑分數據超越前代旗艦

在效能表現上,Gemini 3.5 Flash 不僅維持了 Flash 系列一貫的極致運算速度,其智慧能力更達到媲美大型旗艦模型的水準;根據 Google 提供的基準測試數據,該模型在多項指標中皆超越了前一代的 Gemini 3.1 Pro,包括 Terminal-Bench 2.1 達到 76.2%、GDPval-AA 達到 1656 Elo,以及 MCP Atlas 獲得 83.6% 的優異成績。在多模態理解能力方面,其 CharXiv Reasoning 表現也高達 84.2%。值得注意的是,Gemini 3.5 Flash 的每秒詞元(Token)輸出速度是其他前沿模型的 4 倍之多,並在 Artificial Analysis 的評估指標中名列前茅,成功在運算速度與生成品質之間取得平衡。
專為大規模任務設計,大幅降低企業與開發成本
針對冗長且多步驟的任務,Gemini 3.5 Flash 展現出高度的實用價值;過去開發人員或稽核人員需要耗費數天至數週才能完成的繁瑣工作,如全新應用程式開發、既有程式碼資料庫維護或財務報表整理,現在皆能透過該模型在極短時間內完成,且運行成本不到其他同級模型的一半,搭配更新後的 Antigravity 開發架構,開發者能部署多個相互協作的子代理(subagents)來應對龐雜的應用場景。
在企業應用端,Shopify 已率先部署多個子代理進行長期的複雜數據分析,協助全球商家精準預測業績;同時也有銀行與金融科技公司成功將耗時數週的流程自動化,大幅提升數據團隊的洞察效率;此外,基於強大的多模態基礎,Gemini 3.5 Flash 亦能在 AI Studio 中生成更豐富的網頁使用者介面(UI)與互動式動畫圖表。
走入日常生活的 AI 助理,Gemini Spark 同步登場
隨著 Gemini 3.5 Flash 成為全球 Gemini 應用程式和 Google 搜尋 AI 模式的預設模型,Google 在 I/O 大會上進一步展示了由其驅動的全新個人 AI 代理「Gemini Spark」;這款助理能夠全天候運行,並根據使用者的引導主動執行各項跨平台操作,目前已向受信任的測試人員釋出,預計下週起對美國的 Google AI Ultra 訂閱戶開放 Beta 測試。
在搜尋功能方面,強大的代理能力也催生了全新的「資訊代理(information agents)」,能 24 小時為使用者查找資料,並生成具備互動性的視覺圖解(例如解釋迴轉體 Gyroid 圖案),提供更直覺的搜尋體驗。
導入先進安全防護機制,降低有害內容與誤判率
在追求強大效能的同時,Google 強調 Gemini 3.5 是基於其前沿安全架構(Frontier Safety Framework)所開發。新模型進一步強化了資訊安全以及針對化學、生物、放射性與核子(CBRN)等敏感領域的防護機制。
透過導入更先進的安全訓練與可解釋性工具(interpretability tools),開發團隊能更精準地檢視 AI 產生回應前的推理過程。
這項更新不僅大幅降低了模型生成有害內容的風險,也有效減少了過去因系統誤判而拒絕回答安全提問的情況,為使用者提供更具信任度的 AI 服務環境。
