Google 近期宣布將旗下的生成式 AI 服務 Bard 正式更名為 Gemini,這不僅是名稱的改變,更代表了 Google 在人工智慧領域的策略重心轉移;這次更新的核心在於將最強大的 AI 模型帶入使用者的口袋,透過專屬的手機應用程式,讓 AI 不再僅限於網頁瀏覽器,而是成為能夠隨時隨地提供協助的個人化智慧助理。

行動優先的 AI 互動體驗
隨著 Gemini 應用程式的推出,使用者在手機上與 AI 互動的方式迎來了重大改變;對於 Android 使用者而言,下載專屬應用程式後,Gemini 能夠與作業系統深度整合。
使用者可以透過長按電源鍵或說出「Hey Google」來喚醒 Gemini,讓它在當前的應用程式畫面上方直接提供協助。這種整合意味著 AI 能夠理解螢幕上的內容(例如針對正在閱讀的文章進行摘要),或是在不離開當前畫面的情況下生成圖片與文字。
而對於 iOS 使用者,Google 則選擇將 Gemini 直接整合進既有的 Google App 中,使用者只需在 App 內切換標籤,即可無縫使用相同的 AI 功能,無需額外下載獨立軟體。
多模態能力與生活場景應用
Gemini 的核心優勢在於其多模態(Multimodal)的處理能力,這讓它不僅僅是一個文字聊天機器人;使用者可以透過語音對話、輸入文字,甚至是上傳圖片來尋求協助。
在實際生活場景中,這意味著當車輛輪胎發生問題時,使用者只需拍一張照片上傳,Gemini 就能辨識問題並提供維修建議;或是針對室內裝潢的圖片,提供具體的擺設與採購清單。這種結合視覺與邏輯推理的能力,大幅拓展了 AI 在解決日常疑難雜症時的實用性,使其更接近真實的「個人助理」角色。
Gemini Advanced 與 Ultra 1.0 模型的進階應用
為了滿足對 AI 效能有更高需求的使用者,Google 同步推出了訂閱制的 Gemini Advanced 服務。此服務搭載了 Google 目前最先進的 Ultra 1.0 模型;與標準版相比,Ultra 1.0 在處理複雜任務上展現了更優異的性能,特別是在程式編寫、邏輯推理、執行複雜指令以及創意協作方面。
這項服務被整合在 Google One AI Premium 方案中,讓專業工作者或重度使用者能夠利用更強大的算力來輔助高難度的專案執行,或是進行更深度的學習與創作。
擴充功能與生態系整合
Gemini 的另一個重要特性在於其「擴充功能」(Extensions)的支援。透過這項功能,AI 能夠存取並整合 Google 生態系中的即時資訊;這表示使用者在詢問旅遊行程時,Gemini 不僅能提供建議,還能直接從 Google 航班(Flights)和飯店(Hotels)抓取即時報價與資訊;在規劃路徑時能調用 Google 地圖;在尋找教學內容時能連結 YouTube。
這種跨平台的資訊整合能力,省去了使用者在不同 App 之間反覆切換查詢的繁瑣步驟,實現了一站式的資訊獲取與決策輔助。
