2026 年 Google I/O 大會上,Google Cloud 執行長 Thomas Kurian 將焦點轉向了「代理式企業(Agentic Enterprise)」的全新願景,會中不僅亮相了第八代 TPU 與全新 Agentic Data Cloud,更透過新一代 Gemini 3.5 模型、主攻影音生成的大模型 Gemini Omni,以及全天候運作的個人 AI 代理 Gemini Spark,宣告 AI 已經從單純的文字輔助工具,跨越至能自主執行複雜任務的決策代理人時代。

模型算力再進化!Gemini 3.5 與影音生成利器 Omni 亮相
在底層技術方面,Google 首波釋出專為代理與程式碼編寫優化的 Gemini 3.5 Flash 模型,得益於 Google 基礎架構的軟硬體協同設計,這款新模型在處理需長期且複雜推理的任務上展現了極高的效能;根據官方公布的基準測試數據,3.5 Flash 在多項指標中超越了前代的 Gemini 3.1 Pro,不僅在多模態理解上保持絕對優勢,其運算成本更是同級別模型的一半不到;目前開發者已可在多個 Google 平台上進行測試,而更高階的 Gemini 3.5 Pro 則預計於下個月接棒登場。
除了純粹的推理能力提升,Google 也推出了主攻影音創作的全新模型 Gemini Omni,這款被視為視覺處理重大突破的模型,能無縫融合文字、音訊、圖片與影片素材;對於需要大量產製視覺內容的電商、行銷或影音後製團隊而言,Omni 提供了一種極為直覺的自然語言編輯模式,讓使用者只需透過簡單的文字指令,就能快速生成高品質的互動式虛擬體驗或完成複雜的後期剪輯作業。
開發者與企業雙贏!Antigravity 平台與專屬代理 Spark
為了讓這股強大的 AI 算力真正落地,Google 針對開發者推出了 Antigravity 2.0 桌面版應用程式與更為輕量的命令列介面(CLI),這套工具讓開發團隊能夠在統一的工作區內,自訂並協調多個 AI 代理同步執行任務,從自動撰寫網站程式碼、產出行銷素材到發送客製化信件一氣呵成;目前包含 AirAsia 與勤業眾信(Deloitte)等國際企業,都已實際導入並大幅縮短了專案開發時程,搭配全新的「託管代理 API」,開發者現在只需一次呼叫,就能在高度安全的代管環境中,啟動具備獨立推理與程式碼執行能力的自訂代理。
而在終端使用者端,最具顛覆性的發表莫過於 Gemini Spark,這是一個能 24 小時全天候運作的個人 AI 代理,它不僅能深入 Google Workspace 運作,還能串接 Microsoft OneDrive、Salesforce 與 ServiceNow 等第三方工具;Spark 會持續學習使用者的工作習慣與寫作風格,在獲得明確授權後,它能自主執行如比對數據、建立除錯工單、撰寫事件報告並發布跨部門信件等多步驟任務;為了消弭企業對資料外洩的疑慮,Spark 的每一次任務都會在短暫且嚴格隔離的虛擬機器中執行,確保資訊流動的絕對安全。
辦公生態系重塑與 AI 資安防護雙管齊下
在日常辦公場景中,Google Workspace 也迎來了極具實用性的功能升級;全新推出的圖片生成與編輯工具 Google Pics 被直接內建於雲端硬碟、文件與簡報中,使用者可以輕鬆移動圖片物件、調整背景尺寸,甚至單獨翻譯圖片中的文字,大幅提升了跨國行銷素材的製作效率。
同時,Gmail 與 Keep 也導入了進階語音功能,讓行動辦公族能用語音快速梳理專案思緒並轉化為結構化的待辦清單。
隨著 AI 權限的擴張,系統安全毫無懸念地成為本次大會的另一防護重點;Google 將由 DeepMind 開發的 AI 程式碼安全代理 CodeMender 整合至企業平台中,CodeMender 能夠自主掃描程式碼中的漏洞、提出精確的修復建議,並在開發者允許下自動完成修補與安全測試。
此外,Google 也釋出了全新的 AI 內容檢測 API,協助企業精準識別來自各方模型的 AI 生成內容,在擁抱高效能代理工作流的同時,也為負責任的 AI 治理奠定穩固基礎。
