Google 釋出 Gemini Omni Flash！用對話就能剪影片，YouTube Shorts 免費體驗

在 Nano Banana 成功將生成式 AI 導入影像編輯領域，幫助全球數百萬使用者修復老照片並實現設計草圖後，Google 為其原生多模態技術揭開全新篇章；Google 在 Google I/O 2026 大會上推出了具備強大邏輯推理與內容創作雙重能力的全新模型 Gemini Omni，讓 AI 創作不再侷限於單一媒材的轉換，而是真正邁向了「全模態」融合的全新階段。

內容目錄 隱藏

以對話重塑影片編輯的想像

不同於以往需要繁複指令或專業剪輯技術的工具，Gemini Omni 最大的創新在於其強大的上下文承接能力，使用者只需透過日常的自然語言與系統對話，就能針對影片進行極為細緻的微調；無論是將畫面中的雕塑轉化為細緻的泡沫、將平凡的鏡面抽換為流動的液體，甚至是讓主角的手臂化為具反射質感的鏡面材質，Omni 都能在保持角色外觀一致性的前提下，記住前後場景的細節，實現過去難以親自拍攝的魔幻視覺效果。

當深層知識庫遇上物理常識

除了視覺上的震撼，Gemini Omni 的核心優勢在於將真實世界的知識庫與影像生成相結合，該模型大幅提升了對重力、動能與流體力學等物理法則的理解，讓滾動的彈珠或複雜的物理運動在畫面上呈現出極高的擬真度；更重要的是，它能超越傳統的模式比對，深入理解語言與影像背後的文化、科學與歷史意涵。例如，它能精準理解極具挑戰性的黏土動畫（Claymation）風格，並將複雜的「蛋白質折疊」等科學概念視覺化，製作出生動且準確的解說短片。

跨越素材限制的混搭創作

在實際應用層面，Omni 展現了強大的「全素材融合」實力，創作者可以自由混搭圖像、文字、影片甚至語音檔等不同來源的素材，並將它們融合成風格連貫的全新作品。例如，系統能夠根據一張靜態科幻圖片、一段特定的動態特效影片，再搭配一段音訊的節奏，自動產出一段影音同步的流暢短片。

此外，創作者也能基於手繪草圖或特定場景圖，直接要求 AI 隨著鏡頭推進將世界逐步轉化為帶有復古未來主義（Retro-futuristic）風格的影像。

數位分身與責任 AI 的安全防護

隨著影片生成技術的躍進，版權與真偽辨識成為不可忽視的議題，Gemini Omni 允許使用者透過「虛擬化身（Avatars）」功能，建立在聲音與外貌上都極具個人特色的數位分身；為了防止技術遭到濫用，Google 在安全機制上採取了嚴格的預防措施，目前對於可修改音訊與語音的進階編輯功能仍處於審慎測試階段。

同時，所有由 Omni 創作的影片都將自動嵌入肉眼無法察覺的 SynthID 數位浮水印，使用者未來可透過 Google 搜尋、Chrome 瀏覽器或 Gemini 應用程式輕鬆驗證影片來源，確保內容的透明度。

跨平台生態圈的全面佈局

作為 Omni 系列的先鋒，首款模型「Gemini Omni Flash」已正式登場；Google 採取了相當激進的佈局策略，不僅首波對 Google AI Plus、Pro 與 Ultra 等付費方案訂閱用戶開放體驗，更同步下放至 YouTube Shorts 和 YouTube Create 應用程式，讓一般大眾也能免費感受影片生成的魅力。

隨著未來幾週內 API 逐步對開發人員與企業客戶開放，這款率先支援影片輸出的全新模型，預期將為全球內容創作生態系帶來顛覆性的改變。

以對話重塑影片編輯的想像

當深層知識庫遇上物理常識

跨越素材限制的混搭創作

數位分身與責任 AI 的安全防護

跨平台生態圈的全面佈局

相關文章:

更多報導

迎向「史普尼克時刻」！聯發科技董事長蔡明介定調半導體新世代：多重物理量與太空軌道運算崛起

Android 17 正式推出！6 月 Pixel Drop 功能更新釋出，Pixel 手機獲 Gemini AI 加持，5 大重點新功能一次看

終於打破系統隔閡！Google 宣布 Quick Share 的 AirDrop 擴充功能將支援更多 Android 手機，完整名單一次看

Pixel 11 真的會發光？Google I/O 影片「Pixel Glow」意外曝光真相解析