GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.

Най-нови публикации:

Експеримент: умее ли вече ИИ да превежда?

Експеримент: умее ли вече ИИ да превежда?

През последните години технологиите, свързани с обработка на естествени езици, се развиват главозамайващо. Създаването на текст, генерирането на изображения по описание са примери, които се...

повече информация
„Днес и любовта се случва бързо. А бавната любов е по-красива…“

„Днес и любовта се случва бързо. А бавната любов е по-красива…“

Къде се крие магията днес? Ще изгубим ли някога силата на словото? Кога връзката с миналото ни помага да разберем кои сме и защо сме тук? Защо журналистиката вече изглежда предадена на алгоритмите?...

повече информация
„Най-жалко е да се откаже дете, което има талант“

„Най-жалко е да се откаже дете, което има талант“

Децата и компютрите – как тази среща да се случи по най-добрия начин? Елица Цонева работи като журналист, преди да се прехвърли към света на информационните технологии. Цели 15 години e в тази...

повече информация
На кавала – Дядо Коледа

На кавала – Дядо Коледа

Какво е да си чешит днес? Може ли съдбата да е щастлива, когато вървиш срещу течението и стереотипите? Тази дигитална история е за двама души, разделени от няколко поколения и обединени от любовта...

повече информация
Стани програмист!

Стани програмист!

Чудите се дали си струва да опитате с програмирането? Ще се опитам да ви отговоря. Тази Дигитална история не е като другите. Ако имате опит в тази област или пък тя ви е безинтересна, не губете...

повече информация

„Колкото сме по-напреднали технологично, толкова по-страшни грешки забравяме“

Людмила Филипова е сред най-четените български автори през последните две десетилетия. Романите ѝ обхващат огромен кръг от теми, тя не спира да търси нови литературни предизвикателства, свързани с...

повече информация

Още публикации по темата:

От рубриката:

Експеримент: умее ли вече ИИ да превежда?

Експеримент: умее ли вече ИИ да превежда?

Тук ли са вече технологиите, които да позволяват качествен превод, включително от и на по-редки езици като българския?
Време е за прелюбопитен експеримент. DeepL не само се хвали, че е „най-точният преводач на света“, а и доста хора вече го използват в ежедневието си.
Как ли ще се справи с преводите на класически текстове от Толстой, Мураками, Ремарк или Господинов?
Дали накрая ще се окажем изгубени в превода… или ще стане ясно, че преводът е още едно поле, в което вече можем да разчитаме на изкуствения интелект? А парите, дадени за частни уроци по чужд език на детето ще се окажат хвърлени на вятъра…

повече информация
Анонимен или трол. Кой се крие зад профила?

Анонимен или трол. Кой се крие зад профила?

Кой си ти? Този зад уж автентичния профил насреща? Стои ли човекът зад истинското си име, или се крие? Дали анонимността е свободата, или обратното – тя идва тогава, когато винаги знаеш кой е насреща?
Първо бяхме анонимни по подразбиране, после се наложи като стандарт да стоим с истинската си личност зад хейта, който бълваме в социалните мрежи, а анонимната роля се оказа маргинална.
Как извървяхме този път и какво се очертава напред? Къде минава днес разделителната линия и накъде се насочва? Дали повече хора ще се вливат в анонимните батальони или хегемоните ще направят така, че да си прикрит онлайн да стане невъзможно?

повече информация
Бъдеще без престъпления или дигитален концлагер?

Бъдеще без престъпления или дигитален концлагер?

Алгоритмите, оказва се, вече могат да предскажат кога и къде ще се случи престъпление. По този начин безброй животи може да бъдат съхранени. Човечеството да бъде принудено да се сбогува с тази изконна негова черна страна – престъпността.
Ами съдебната система? В Китай вече официално част от присъдите се определят от изкуствен интелект, чиито решения се оспорват само ако има сериозни доказателства. Значи ли това краят на съдебните грешки, юридическите хватки, несъвършенствата в тази област?
Ще оставим ли Джон Гришам без работа? Или ще се озовем в ужасната последна сцена на един знаменит роман – мъж и жена си приказват, когато зад тях един стоманен глас изрича: „Вие сте покойници“?
Ако всяко престъпление може да бъде предсказано или справедливо наказано, ще стане ли животът ни невероятно спокоен? Или ще се озовем в свръхконтролиран световен концлагер?

повече информация

Най-новите:

Експеримент: умее ли вече ИИ да превежда?

Експеримент: умее ли вече ИИ да превежда?

Тук ли са вече технологиите, които да позволяват качествен превод, включително от и на по-редки езици като българския?
Време е за прелюбопитен експеримент. DeepL не само се хвали, че е „най-точният преводач на света“, а и доста хора вече го използват в ежедневието си.
Как ли ще се справи с преводите на класически текстове от Толстой, Мураками, Ремарк или Господинов?
Дали накрая ще се окажем изгубени в превода… или ще стане ясно, че преводът е още едно поле, в което вече можем да разчитаме на изкуствения интелект? А парите, дадени за частни уроци по чужд език на детето ще се окажат хвърлени на вятъра…

повече информация
„Днес и любовта се случва бързо. А бавната любов е по-красива…“

„Днес и любовта се случва бързо. А бавната любов е по-красива…“

Къде се крие магията днес? Ще изгубим ли някога силата на словото? Кога връзката с миналото ни помага да разберем кои сме и защо сме тук? Защо журналистиката вече изглежда предадена на алгоритмите? Трябва ли изкуственият интелект да учи за нас от книги като „Братя Карамазови“? А какво ли би разбрал от историите на днешния ни гост?
Николай Терзийски е млад писател, който дава свой, задълбочен и съвременен поглед към вечни теми. Асоциират стила му с магическия реализъм и има защо. Той владее забравеното умение да рисува с думи вълнуващи, преплетени, реалистични и вълшебни истории. В книгите му се срещат исторически пластове, градят се паралели между поколенията и съдбите. И, преди всичко, личи майстор на словото с магичен поглед, който дава много на читателя.
Всички ли имаме звезди под клепачите си?…

повече информация
„Най-жалко е да се откаже дете, което има талант“

„Най-жалко е да се откаже дете, което има талант“

Децата и компютрите – как тази среща да се случи по най-добрия начин?
Елица Цонева работи като журналист, преди да се прехвърли към информационните технологии. Цели 15 години e в тази сфера, а после най-неочаквано и непланирано… става учител.
Само за няколко години децата, на които преподава, печелят впечатляващи награди на национални и световни надпревари по информатика и информационни технологии.
Тя въвежда редица иновации. Вместо учебници, предпочита да използва конкретни проекти, които децата да разработват като екип, в организация, подобна на тази в софтуерните фирми. Често комбинира уроците по няколко предмета, за да стимулира мисленето и творческия потенциал на децата за сметка на зазубрянето и преповтарянето.
Защо у нас образованието така и не се превръща в приоритет? Как учителят може да спечели вниманието на учениците си и да ги мотивира? Има ли деца с хуманитарно и такива с алгоритмично мислене, или това са стереотипи от миналото? Как да пробудим искрата на любопитството в погледа на детето, така че то да учи и да се развива пълноценно?

повече информация
На кавала – Дядо Коледа

На кавала – Дядо Коледа

Какво е да си чешит днес? Може ли съдбата да е щастлива, когато вървиш срещу течението и стереотипите?
Тази дигитална история е за двама души, разделени от няколко поколения и обединени от любовта си към България и фолклора ни. Един чешит, изоставил корпоративна кариера, за да се посвети на любимото си изкуство ни разказва за последните години на друг чешит, събрал в себе си десетки образи. На музикант, създател на музикални инструменти, мъдрец, свещеник и… дори Дядо Коледа.
Богдан Дарев е режисьор на филма „Кавал Парк“, в него за почти два часа ни представя сюрреалистичния образ на Александър Еплер, американец от руски произход, българин по душа. Ще потърсим заедно нишките, които свързват смислените истории. Късмета и проклятието да си чешит в този все по-унифициран земен свят.

повече информация
Стани програмист!

Стани програмист!

Дали програмирането е за вас? Струва ли си да опитате в тази професия? Какви знания и умения ви трябват, за да започнете? Кога е късно? Какви са основните решения, които трябва да вземете в началото? Как да изберете език за програмиране? Къде да го учите? Как да си намерите първа работа? Кои са другите професии в тази сфера, към които може да се насочите?
Ще се опитам да ви отговоря от собствената си гледна точка.
Айти секторът изживява разцвет, особено на фона на икономиката ни като цяло. Аз реших, че ще ставам програмист на 33, вече имах сериозен опит в друга професия. Има толкова много неща, които бих се радвал някой да ми каже в онзи момент, когато взех решението да се пренасоча. Именно тях ще се опитам да събера тук.

повече информация

„Колкото сме по-напреднали технологично, толкова по-страшни грешки забравяме“

Людмила Филипова е сред най-четените български автори през последните години. Романите ѝ обхващат огромен кръг от теми, тя не спира да търси нови литературни предизвикателства, свързани с далечното минало на хората по нашите земи, с днешните им предизвикателства, с големите загадки, които ни отправя животът.
След толкова пъстра палитра от интереси, време е и за нейните дигитални истории. Насочваме се първо към миналото, за да погледнем към бъдещето. И накрая, най-важното, ще помечтаем за момента, когато хората отново ще се вълнуват не от злободневното. А от звездите…

повече информация
Share This