Google 釋出 Gemini Omni Flash!用對話就能剪影片,YouTube Shorts 免費體驗

在 Nano Banana 成功將生成式 AI 導入影像編輯領域,幫助全球數百萬使用者修復老照片並實現設計草圖後,Google 為其原生多模態技術揭開全新篇章;Google 在 Google I/O 2026 大會上推出了具備強大邏輯推理與內容創作雙重能力的全新模型 Gemini Omni,讓 AI 創作不再侷限於單一媒材的轉換,而是真正邁向了「全模態」融合的全新階段。

 

 

以對話重塑影片編輯的想像

 

不同於以往需要繁複指令或專業剪輯技術的工具,Gemini Omni 最大的創新在於其強大的上下文承接能力,使用者只需透過日常的自然語言與系統對話,就能針對影片進行極為細緻的微調;無論是將畫面中的雕塑轉化為細緻的泡沫、將平凡的鏡面抽換為流動的液體,甚至是讓主角的手臂化為具反射質感的鏡面材質,Omni 都能在保持角色外觀一致性的前提下,記住前後場景的細節,實現過去難以親自拍攝的魔幻視覺效果。

 

當深層知識庫遇上物理常識

 

除了視覺上的震撼,Gemini Omni 的核心優勢在於將真實世界的知識庫與影像生成相結合,該模型大幅提升了對重力、動能與流體力學等物理法則的理解,讓滾動的彈珠或複雜的物理運動在畫面上呈現出極高的擬真度;更重要的是,它能超越傳統的模式比對,深入理解語言與影像背後的文化、科學與歷史意涵。例如,它能精準理解極具挑戰性的黏土動畫(Claymation)風格,並將複雜的「蛋白質折疊」等科學概念視覺化,製作出生動且準確的解說短片。

 

跨越素材限制的混搭創作

 

在實際應用層面,Omni 展現了強大的「全素材融合」實力,創作者可以自由混搭圖像、文字、影片甚至語音檔等不同來源的素材,並將它們融合成風格連貫的全新作品。例如,系統能夠根據一張靜態科幻圖片、一段特定的動態特效影片,再搭配一段音訊的節奏,自動產出一段影音同步的流暢短片。

 

此外,創作者也能基於手繪草圖或特定場景圖,直接要求 AI 隨著鏡頭推進將世界逐步轉化為帶有復古未來主義(Retro-futuristic)風格的影像。

 

數位分身與責任 AI 的安全防護

 

隨著影片生成技術的躍進,版權與真偽辨識成為不可忽視的議題,Gemini Omni 允許使用者透過「虛擬化身(Avatars)」功能,建立在聲音與外貌上都極具個人特色的數位分身;為了防止技術遭到濫用,Google 在安全機制上採取了嚴格的預防措施,目前對於可修改音訊與語音的進階編輯功能仍處於審慎測試階段。

 

同時,所有由 Omni 創作的影片都將自動嵌入肉眼無法察覺的 SynthID 數位浮水印,使用者未來可透過 Google 搜尋、Chrome 瀏覽器或 Gemini 應用程式輕鬆驗證影片來源,確保內容的透明度。

 

跨平台生態圈的全面佈局

 

作為 Omni 系列的先鋒,首款模型「Gemini Omni Flash」已正式登場;Google 採取了相當激進的佈局策略,不僅首波對 Google AI Plus、Pro 與 Ultra 等付費方案訂閱用戶開放體驗,更同步下放至 YouTube Shorts 和 YouTube Create 應用程式,讓一般大眾也能免費感受影片生成的魅力。

 

隨著未來幾週內 API 逐步對開發人員與企業客戶開放,這款率先支援影片輸出的全新模型,預期將為全球內容創作生態系帶來顛覆性的改變。