Google stawia na twórców filmowych ze swoim nowym modelem wideo opartym na sztucznej inteligencji generatywnej Veo
Podczas dzisiejszej konferencji dla deweloperów I/O Google ogłosił Veo, swój najnowszy model wideo oparty na sztucznej inteligencji generatywnej, który „może generować filmy o rozdzielczości 1080p, dłuższe niż jedna minuta, w szerokim spektrum wizualnych i filmowych stylów” - donosi The Verge.
Z raportu: Veo posiada „zaawansowane zrozumienie języka naturalnego”, według komunikatu prasowego Google, umożliwiając modelowi zrozumienie terminów filmowych, takich jak „timelapse” czy „powietrzne ujęcia krajobrazu”. Użytkownicy mogą kierować działaniem modelu za pomocą tekstowych, wizualnych lub wideo-podobnych poleceń, a Google twierdzi, że tworzone filmy są „bardziej spójne i koherentne”, przedstawiając bardziej realistyczne ruchy ludzi, zwierząt i obiektów w trakcie ujęć. Dyrektor generalny Google DeepMind, Demis Hassabis, powiedział podczas zapowiedzi prasowej w poniedziałek, że wyniki wideo można doskonalić za pomocą dodatkowych poleceń i że Google eksploruje dodatkowe funkcje, aby umożliwić Veo produkcję storyboardów i dłuższych scen.
Podobnie jak w przypadku wielu takich prezentacji modeli AI, większość osób, które chciałyby wypróbować Veo samodzielnie, najprawdopodobniej będzie musiała poczekać. Google twierdzi, że zaprasza wybranych filmowców i twórców do eksperymentowania z modelem, aby określić, jak najlepiej wspierać kreatywnych i będzie rozwijać te kolaboracje, aby zapewnić, że „twórcy mają wpływ” na to, jak rozwijane są technologie AI Google. Niektóre funkcje Veo będą również dostępne dla „wybranych twórców w nadchodzących tygodniach” w prywatnym podglądzie wideoFX - można zapisać się na listę oczekujących, by mieć wcześniejszą możliwość przetestowania możliwości.
Google planuje również dodać niektóre z możliwości platformy do YouTube Shorts „w przyszłości”. Oprócz nowych modeli i narzędzi AI, Google powiedział, że rozszerza swoją technologię znakowania wodnego i wykrywania treści AI. Nowy ulepszony system znakowania wodnego SynthID firmy „może teraz oznaczać wideo, które zostało wygenerowane cyfrowo, jak i teksty wygenerowane za pomocą AI”, donosi The Verge w osobnym raporcie.
ELI5: Google ogłosił nowy model wideo o nazwie Veo, który może tworzyć filmy o wysokiej jakości, dłuższe niż jedna minuta, w różnych stylach filmowych. Można komunikować się z Veo za pomocą tekstu, obrazów lub filmów, aby stworzyć filmy bardziej spójne i realistyczne. Google zaprasza filmowców do eksperymentowania z modelem i planuje wprowadzić go do YouTube Shorts w przyszłości. Google również rozwija technologię znakowania wodnego i wykrywania treści AI.
Źródła:
- https://www.theverge.com/2024/5/14/24156255/google-veo-ai-generated-video-model-openai-sora-io
- http://deepmind.google/technologies/veo
- http://labs.google/VideoFX
- https://tech.slashdot.org/story/24/05/14/1822200/googles-invisible-ai-watermark-will-help-identify-generative-text-and-video
- https://www.theverge.com/2024/5/14/24155927/google-ai-synthid-watermark-text-video-io