2025/08/28

Google27日正式推出Gemini最新一代影像編輯技術,主打能在更換造型或場景時,仍精準保留人物與寵物的神韻,解決以往人工智慧生成影像常見「相似卻失真」的問題。這項由DeepMind團隊開發的模型,已率先在Gemini應用程式中上線,讓用戶能透過對話不斷修正圖片,甚至將多張照片融合成新畫面,呈現更自然的效果。
新功能的最大特色,在於能維持角色外觀一致性,即使經過多輪修改,臉部特徵、比例及服裝細節仍能延續原貌,避免出現「變臉」情況。使用者不僅能隨意調整背景、物件與風格,也能將某張照片的色調或質感套用到另一張影像,創造個人化的視覺風格。所有經Gemini處理的圖片,系統都會自動加上明顯水印與SynthID數位標記,確保來源可追溯,回應外界對假資訊與深偽影像的疑慮。
除了影像功能升級,Google同步強化了NotebookLM的筆記助理工具。原本的「影片摘要」功能已擴展至超過八十種語言,包括繁體中文,讓學生、研究人員或自學者都能快速掌握重點。語音摘要也從簡短的重點提示,進化為更有深度的完整分析,帶來與英文版相同的結構與細緻度,協助用戶更全面理解內容。
此次更新顯示Google正積極在生成式AI市場中強化競爭力。相比其他對手如OpenAI的DALL·E 3、Adobe Firefly與Stable Diffusion,Gemini憑藉角色一致性、編輯靈活性與透明機制,尋求建立差異化優勢。未來這套工具能否在創作、教育與娛樂領域獲得更多使用者青睞,仍是值得持續關注的焦點。【記者 鄒弘整理報導】