Колко близо са моделите, които ще генерират видео, неразличимо от човека? Нека проверим заедно с един важен експеримент.
Генеративните модели се развиват с изумителна скорост. Преди 2 години направих същия опит с изображения – подадох на Midjourney класически български стихове, за да видим колко добре ще се справи – ще улови ли посланието, ще създаде ли достойни изображения? Постепенно алгоритмите се оказаха все по-добри в тази задача, дотолкова, че днес се оказваме неспособни да различим създадените от генерираните изображения.
Но как стоят нещата с видеото? Какви ли филмчета може да създаде изкуственият интелект по избрани класически стихове? Избирам две платформи, които предлагат доста различен подход към генерирането. И резултатите, поне за мен, определено са впечатляващи…
История в картинки
Първо е ред на няколко важни уточнения. Алгоритмите вече са доста добри в това да „раздвижат“ подадена им илюстрация, дори да добавят звук. Не чак толкова зле се справят дори и на български:
Тук обаче ще проверяваме нещо съвсем друго. Колко успешни са тогава, когато ги оставим сами да създават, без допълнителни указания, очаквания, без човешка намеса. Вземайте пуканките, време е за неочаквано кино!
1. Пролет моя…
Задание:
Пролет
още неживяна, непразнувана,
само в зрачни сънища сънувана,
как минуваш ниско над тополите,
но не спираш тука своя полет.
Пролет моя, моя бяла пролет –
знам, ще дойдеш с дъжд и урагани,
бурна страшно, огненометежна
да възвърнеш хиляди надежди
и измиеш кървавите рани.
Как ще пеят птиците в житата!
Весели ще плуват във простора…
Ще се радват на труда си хората
и ще се обичат като братя.
Пролет моя, моя бяла пролет…
Нека видя първия ти полет,
дал живот на мъртвите площади,
нека видя само твойто слънце
и – умра на твойте барикади!
Никола Вапцаров
(Кликнете върху заглавието, за да прочетете съответния стих.)
Видео (генерирано от InVideo):
Може да е горещо лято, но, както виждаме, генеративните технологии вече изживяват своята пролет, ето защо започваме с класиката на Вапцаров. Избирам за експеримента по препоръки на хора с опит в бранша платформата InVideo. Опитвам първо на български… резултатът е далеч от добър, затова се примирявам, че трябва да давам преводи на английски. Избирам стихове, които имат според мен достатъчно добър вариант на този език, почти всички са в превод на Кристофър Бъкстон, който ни е гостувал със своята запомняща се Дигитална история.
Имам възможност за някои допълнителни настройки – избирам колко точно да е креативен ИИ режисьорът, за каква аудитория е предназначен клипът…
Иииии… резултатът е забележително добър! Да, може би няма бури и урагани, но пролетта е толкова изразителна, четецът доста се старае с емоционалните стихове.
Тук е време за важно уточнение. В случая използвам платформа, която включва изкуствения интелект именно в ролята на режисьор. Той интерпретира подадения му текст, избира на базата на него готови кратки клипчета и снимки, които монтира, като добавя и гласа зад кадър.
И резултатът е забележителен, ще видим още няколко интересни примера след малко.
Но докъде са стигнали другите алгоритми, онези, които могат да създават видео, без да използват за основа готови кадри? Наследниците на генераторите на изображения…
2. …хубави очи
Задание:
Две хубави очи
в две хубави очи; – музика – лъчи
Не искат и не обещават те…
Душата ми се моли,
дете,
душата ми се моли!
Страсти и неволи
ще хвърлят утре върху тях
булото на срам и грях.
Булото на срам и грях –
не ще го хвърлят върху тях
страсти и неволи.
Душата ми се моли,
дете,
душата ми се моли…
Не искат и не обещават те! –
Две хубави очи. Музика, лъчи
в две хубави очи. Душата на дете…
Пейо Яворов
Видео (генерирано от KlingAI):
Има ли очи? Има. На дете ли са? Са.
Разбира се, с пълно право можете да сте разочаровани – някакви си 5 секунди, при това с толкова буквално тълкувание. Те обаче показват, че вече сме напът да извървим една огромна стъпка.
В средата на февруари тази година OpenAI отново привлече погледите на цял свят с поредния си зашеметяващ модел на име Sora. Бяха показани забележително убедителни видеа, генерирани изцяло от изкуствения интелект. По всичко личеше, че моделът вече разбира триизмерността, което наистина е огромна крачка напред. После беше обявено, че Sora ще бъде допълнително тествана и след това ще стане достъпна за всеки потребител.
Е, мина половин година и това още не се е случило. Дали моделът се е оказал не толкова добър, колкото изглеждаше по демонстрираните клипове, дали са се появили нови етични въпроси, или просто компанията се е пренасочила към други, по-важни проекти, като например дългоочаквания GPT-5… Както често се случва с уж „отворения“ по името си OpenAI отговорът си остава зад широко затворените му врати.
И все пак, може би генерирането на видео е по-близо от това, което си представят песимистите? Постепенно се появяват и други модели, които обещават същото – изцяло генерирано видео. Именно това виждате тук.
3. Хубаво е, но не е готово
Задание:
Господи, колко си хубава!
Господи,
колко си хубава!
Колко са хубави ръцете ти.
И нозете ти колко са хубави.
И очите ти колко са хубави.
И косите ти колко са хубави
Не се измъчвай повече – обичай ме!
Не се щади – обичай ме!
Обичай ме
със истинската сила на ръцете си,
нозете си, очите си – със цялото
изящество на техните движения.
Повярвай ми завинаги – и никога
ти няма да си глупава – обичай ме!
И да си зла – обичай ме!
Обичай ме!
По улиците, след това по стълбите,
особено по стълбите си хубава.
Със дрехи и без дрехи, непрекъснато
си хубава… Най-хубава си в стаята.
Във тъмното, когато си със гребена.
И гребенът потъва във косите ти.
Косите ти са пълни с електричество –
докосна ли ги, ще засветя в тъмното.
Наистина си хубава – повярвай ми.
И се старай до края да си хубава.
Не толкова за мене, а за себе си,
дърветата, прозорците и хората.
Не разрушавай бързо красотата си
с ревниви подозрения – прощавай ми
внезапните пропадания някъде –
не прекалявай, моля те, с цигарите.
Не ме изгубвай никога – откривай ме,
изпълвай ме с детинско изумление.
Отново да се уверя в ръцете ти,
в нозете ти, в очите ти… Обичай ме!
Как искам да те задържа завинаги.
Да те обичам винаги –
завинаги.
И колко ми е невъзможно… Колко си
ти пясъчна… И моля те, не казвай ми,
че искаш да ме задържиш завинаги,
да ме обичаш винаги,
завинаги.
Колко си хубава!
Господи,
колко си хубава!
Колко са хубави ръцете ти.
И нозете ти колко са хубави.
И очите ти колко са хубави.
И косите ти колко са хубави.
Колко си хубава!
Господи,
колко си истинска.
Христо Фотев
Видео (генерирано от KlingAI):
Да, виждам и аз, нека зарадвам скептиците. Моделът си избра това, което най-силно затруднява и до днес генераторите на изображения – ръцете. Да, видеото без съмнение е неубедително, веднага се забелязва, че е генерирано… Аз обаче си спомням как точно така се случваше и със създаването на изображения. Имахме по 7-8 пръста, нямаше усет за анатомичните детайли…После обаче моделите с изумителна скорост станаха по-добри в решаването на тази задача. Не че и сега не допускат грешки, но се случва рядко и не толкова грубо.
И така, тук платформата се опита да улови нежността в стиховете на Христо Фотев, но се препъна в естетиката.
Впрочем, за тази част от експеримента, използвам модела KlingAI. Както отеква от името му, той идва от Китай. А това е още една важна тема, за която малко се говори. На фона на напредъка на изкуствения интелект в западния свят, доста малко научаваме за огромните постижения в същата област и на изтока…
Как ли ще се справи „китайският режисьор“ със следващите задания?
4. Спи ИИ в безшумните тъми
Задание:
Спи градът
На нощта неверна верен син,
аз бездомен и самин –
а дъждът ръми, ръми, ръми…
Трепнали край черните стени,
стъпките размерено кънтят
и след мен невидими вървят
жалби за преминалите дни.
Образът на милото дете,
нявга озарило моя праг,
в спомени възкръсва – чист и драг –
и скръбта расте, расте, расте…
Тя дойде – дете – с пробуден жар,
с пламенна усмивка на уста,
на възжаждал вечна красота,
аз отвъргнах тленния й дар.
Миналото – ах, остана то
тъмен край, от скърби заледен,
и оттам отпраща тя към мен
своя скърбен вик: защо, защо?
Спи градът в безшумните тъми.
На нощта неверна верен син,
бродя аз бездомен и самин –
а дъждът ръми, ръми, ръми…
Димчо Дебелянов
Видео (генерирано от KlingAI):
Доста добре, поне според мен. С изключение на леко кривите тук-таме стълбове на уличните лампи, аз поне не му откривам друга слабост. Като че ли я има и дебеляновската меланхолия… или пък аз си внушавам, как ви се струва?
Неслучайно генерирането на видео е толкова важна следваща стъпка в развитието на ИИ и технологиите като цяло. Докато при създаването на изображение задачата е просто то да бъде изрисувано – пиксел по пиксел, за да се получи генерирането на логични последователни картинки, които се преливат гладко и имат логика, е нужно моделите да имат по-добро разбиране за триизмерността, за устройството на физическия свят. Когато това се постигне, то ще е изключително важна стъпка и в напредъка на много други области, от които очакваме големи новини – като се почне от самоуправляващите се коли и се стигне до роботиката…
Но стига нездрав оптимизъм, време е за малко здрав нихилизъм с добрия стар Петко Славейков.
5. Културна революция
Задание:
Не сме народ
хора, дето нищо не щат да вършат.
Всичко тежко, всичко мъчно е за нас!
„Аз не зная! Аз не мога!“ – общ е глас.
И не знаем, не можеме, не щеме
да работим за себе си със време.
Само знаем и можеме, и щеме
един други злобно да се ядеме…
Помежду си лихи, буйни, топорни,
пред други сме тихи, мирни, покорни…
Все нас тъпчат кой отдето завърне,
щот сме туткун, щото не сме кадърни…
Всякой вика „Яман ни е нам хала!“ –
а всякому мерамът е развала…
Не сме народ! Не сме народ, а мърша,
пак ще кажа и с това ще да свърша.
Петко Р. Славейков
Видео (генерирано от KlingAI):
Хахахаха. Дали в Китай си имат еквивалент на дядо Петко от времената на Културната революция? Тук колегата изобщо не разбра контекста, има я само бунтовността.
Алгоритми от всички страни, обединете се!
6. Хора, къщи, салтанати
Задание:
Горда Стара планина
до ней Дунава синей,
слънце Тракия огрява,
над Пирина пламеней.
Мила Родино,
ти си земен рай!
Твойта хубост, твойта прелест,
ах, те нямат край!
Цветан Радославов
Видео (генерирано от KlingAI):
Видео (генерирано от InVideo):
А какво ли ще стане в следващия момент, когато двете платформи, които тестваме, обединят силите си? Ако ги превърнем в ИИ агенти – платформи като KlingAI генерират кратки видеа, а „колеги“ като inVideo ги подреждат, сглобяват, озвучават и доосмислят?
Небето е границата, както често обичат да повтарят програмистите.
Е, да, още е далеч, но аз поне виждам огромен напредък. Първата платформа успя да генерира типична българска красота, втората ни отведе на цяло виртуално пътешествие из България, макар да не цитира конкретно думите на химна, които ѝ подадох… И макар да имаше очевидно несполучливи и далечни решения с кадри от Азия, като цяло се получи нещо доста по-добро от немалко реклами на родния туризъм, които съм виждал.
ИИ прави грешки? Е, то и естественият интелект по нашите ширини понякога бърка Скалистите планини с Витоша. Само че той няма да е по-„умен“ с всяка следваща версия…
7. Какви е неща раждала…
Задание:
Септември
вековната злоба на роба:
своя пурпурен гняв –
величав.
Гео Милев
Видео (генерирано от KlingAI):
Видео (генерирано от InVideo):
Тези строфи включих в експеримента със снимките преди 2 години, давам ги и на двете платформи тук. Според мен успехът при тях е доста показателен за това доколко добре се справят алгоритмите в търсенето на контекст, на метафора, как четат между редовете…
Силен е според мен образът от напълно генерираното клипче, има и метафора. Втората платформа пък намери доста странни и неочаквани асоциации. Да, вече ми прави впечатление, че дикторът се справя със сходна интонация (но безгрешно!) с повечето стихове, но пък това е много малка и лесно решима следваща стъпка…
Откъде, по дяволите, ги взе обаче тези бейзболни асоциации? Да, личи си американският почерк на „режисьора“…
8. „Искам на всички заспали да кажа“
Задание:
Вечерен тромпет
и трием нозе от горещия камък…
Но щом вечерта от небето се спусне,
ще взема тромпета и ще седна на прага.
Стига край тия стени съм се лутал
като звън на пробита камбана.
Трябва да свиря, трябва да срутя
тишината – само викът да остане.
Искам да гръмне горещия вятър
и докрай да отвори вратите.
Искам да тръгне отново земята
след кръстоносния марш на щурците.
Искам бодливата тел пред дома ви
с моята песен да скъсам.
Искам съседа, който се прави
на глух, да възвърне слуха си.
Искам да върже своите пръсти
крадецът, сърце да си купи пазача.
Искам да капна от моите сълзи
в окото, което ръждясва.
Искам отново при нас да се върне
панаирът – прахта да издуха.
Искам от смях да умре и от гъдел
този, който умира от скука.
Искам над мъртвите като на стража
до сутринта да стоиме.
Искам на всички заспали да кажа,
че има време да се наспиме…
Трябва да свиря в глухата вечер,
докато не дочуя към мене да иде
гласът на хиляда тромпета далечни.
Или на някой архангел невидим.
Борис Христов
Видео (генерирано от InVideo):
Доста симпатично. Имаме си нов, доста подходящ по интонация диктор.
Готин тромпет! ИИ вече се справя (почти) за шестица на матурата по литература, проверявал съм го. Тук, на „видео матурата“ още е далеч от истината, но пък видимо напредва и дава интересни посоки за размисъл…
9. Романтиката е днес в роботите
Задание:
Стон
Душата ми е стон. Душата ми е зов.
Защото аз съм птица устрелена:
на смърт е моята душа ранена,
на смърт ранена от любов…
Душата ми е стон. Душата ми е зов.
Кажете ми що значат среща и разлъка?
И ето аз ви думам: има ад и мъка –
и в мъката любов!
Миражите са близо, – пътя е далек.
Учудено засмяна жизнерадост
на неведение и алчна младост,
на знойна плът и призрак лек…
Миражите са близо, – пътя е далек:
защото тя стои в сияние пред мене,
стои, ала не чуе, кой зове и стене, –
тя – плът и призрак лек!
Пейо Яворов
Видео (генерирано от InVideo):
Тук май се справи най-добре, какво ще кажете?
10. ИИ на гости на дявола
Задание:
На гости у Дявола. Приказка за честта
на толкова мил комплимент:
покани ме Дявола – старият Дявол –
дома си на чашка абсент.
Свещта очертаваше острия профил
със ивица златни лъчи
и пускайки кръгчета дим, Мефистофел
ме гледаше с влажни очи.
В очите му есенна горест бе скрита,
но все пак бе горд и засмен,
и махна с ръка той „In vino veritas!
Ще бъда пред теб откровен!“.
Омръзна ми вече все тоя ярем на
притворство и помисъл зла –
да пием за мойта сърдечност неземна
и сивите земни тела!
Преди векове аз възпрях на земята
и тук устроих си шега:
веичах се за земната Истина свята,
но тя увенча ме с рога.
Възпламнах от ревност, и в черна омраза
за своята стъпкана чест –
човешката чест неуморно аз газя,
но с чест не сдобих се до днес.
Намислих чрез подвизи чудни да блесна –
умирах по сто пъти в бран,
но винаги рицар на кауза честна,
не бидох пак с чест увенчан.
Отчаян, окаян, веднъж в булеварда
аз тръгнах неземно злочест.
И вдигнах над себе си ярка плакарда:
„Човек без капчица чест!“.
Но странно: презрение няма ни капка!
Посрещат ме вред с интерес,
любезно отвсякъде свалят ми шапка:
„Без чест ли си? – Прави ти чест!“.
Един господин ме целуна: „Ах, братко,
и ти ли!… Ей, кой да те знай!“.
Две хубави дами ми казаха сладко:
„Елате в нас утре на чай!“.
Чудесно! Невиждано! С почести редки
изпратен бях чак до дома.
Министри, царе и придворни кокетки
ми писаха мили писма.
И ето ме: важен, блестящ, елегантен,
богат като истински Крез!
И знам аз: крадец съм, лъжец, спекулантин,
безчестник; но… винаги с чест!…
И Дявола млъкна. Наля от абсента,
сърдечно се чукна със мен,
и пускайки пушек на синкави ленти,
прониза ме с поглед зелен.
Христо Смирненски
Видео (генерирано от InVideo):
Дяволът е в детайлите, знам…
И все пак, впечатляващо е колко са напреднали алгоритмите за генериране на видео и със сигурност са много близо следващите интересни новини в тази посока.
Ами ако си представим бъдещето, в което алгоритмите вече четат мислите ни? Знаят по настроението ни какъв филм ни се гледа, кои са любимите ни актьори, сцени, режисьори. И ни приготвят за всяка минута нещо, създадено така че да ни хареса, удовлетвори, да е само за нас?
Може би няма нужда да си го представяме. Може би това бъдеще ще е тук съвсем скоро. Освен, ако, разбира се, не се окаже невъзможно…