Google推出Veo 3.1影像生成模型 強化圖像轉影片能力

Google宣佈其AI影片生成模型Veo更新至3.1版本,標榜在遵循提示詞,以及將圖像轉爲影片方面的表現更加出色。目前Veo 3.1已經可透過Google的Gemini API試用,並且已經整合進Google的Flow影片編輯工具內。

Veo 3.1技術升級

Veo 3.1建立在今年Google I/O大會上推出的Veo 3基礎上,根據Google官方說法,新模型在提示詞遵循方面的表現更佳,能更輕鬆地根據用戶上傳的圖像「素材」結合文字提示來創建影片。此外,Veo 3.1還新增可同時將圖像轉換爲影片,並且生成音訊的功能,這是Veo 3所不具備的能力。

Flow編輯器功能增強

在Flow影片編輯器中,Veo 3.1支持名爲「畫面到影片」的新功能,讓用戶能對生成的影片進行更精細的控制。使用者可以上傳起始畫面和結束畫面,然後由AI自動生成中間的影片內容。

雖然Adobe的Firefly也提供類似功能,但Flow的獨特之處在於能夠同時生成音訊,而這項音訊生成能力同樣適用於該編輯器的影片延伸和物件插入功能。

技術現狀與應用前景

從Google分享的樣本來看,透過Veo 3.1生成的影片仍帶有些許不真實感,而且效果會根據提示詞和主題而有很大差異。儘管在真實感方面可能還不及OpenAI的Sora 2,但Google試圖讓Veo對實際從事影片工作的專業人士更加實用,而非僅是社交媒體垃圾內容的來源。

隨着AI影片生成技術快速發展,各科技巨頭在此領域的競爭日益激烈,而Google透過持續更新Veo模型,展現了在創意工具市場保持競爭力的決心。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》