GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

Как да надникнем в „мислите“ на изкуствения интелект?

Как да надникнем в „мислите“ на изкуствения интелект?

Озовахме се във време, в което чатботът не е просто помощник, а и „психотерапевт“. Преди още да го познаваме достатъчно добре, преди да сме заложили етичните рамки. Вече виждаме първите...

повече информация
5 г. Дигитални истории! Ще решите ли куиза с награди?

5 г. Дигитални истории! Ще решите ли куиза с награди?

Точно преди 5 години излезе „Робот с мартеничка“, първият материал на сайта Дигитални истории! Оттогава всяка седмица се появяват по един или два дълги текста, рисуващи историята на самите Дигитални...

повече информация
Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

Вярвахте ли преди няколко години, че изкуственият интелект ще създава толкова изпипани изображения? От свръхреалистични „фотографии“ до персонализирани карикатури в поредната модна тема, която...

повече информация
Денят, в който програмистите спряха да пишат код

Денят, в който програмистите спряха да пишат код

Представяте ли си какво им е било на кочияшите, когато видели първите автомобили? Сигурно в началото са се чувствали в безопасност. „Кой ли ще се качи в тези странни кубчета? Вместо да се наслаждава...

повече информация
Поет + ИИ = Apollo ex Machina. Кои са победителите?

Поет + ИИ = Apollo ex Machina. Кои са победителите?

Дойде време да обявим победителите в първия у нас (и един от първите по света) конкурс за поезия, генерирана с помощта на изкуствен интелект – Apollo ex Machina. На церемония в Столична библиотека...

повече информация

Още публикации по темата:

От рубриката:

5 г. Дигитални истории! Ще решите ли куиза с награди?

5 г. Дигитални истории! Ще решите ли куиза с награди?

Точно преди 5 години излезе първият материал на сайта Дигитални истории! Моят скромен подарък е един забавен и неочакван куиз с награди. Опитайте да се справите с 30 въпроса и ще се включите в жребия за 10 книги, свързани по един или друг начин с историята на начинанието. Куизът отнема не повече от 10 минути, опитайте! А после ви чака изключително любопитната му история…

повече информация
Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

През 2022 г. призовах първия впечатляващ ИИ модел за изображения MidJourney да изпълни неочаквана задача. Подадох му 10 цитата от любими български поети, за да видим какво ще нарисува той. Резултатите бяха впечатляващи и замислящи, това се превърна в една от най-четените и обсъждани Дигитални истории.
Оттогава мина почти петилетка. Как ли ще изглеждат картинките, които днес ще нарисуват най-модерните модели по същите тези стихове? ИИ несъмнено ще покаже повече умения, но дали ще покаже и творчество, разбиране? Дали илюстрациите му ще са по-близко до изкуство? Преценете сами…
„В живота си нивга не бях се надявал
на толкова мил комплимент:
покани ме AI – най-новият AI –
дома си на чашка абсент.“

повече информация
Денят, в който програмистите спряха да пишат код

Денят, в който програмистите спряха да пишат код

Само за месец някои от безспорните авторитети от различни поколения и области на компютърния свят се обединиха зад една и съща идея. Днес не е нужно човекът да пише компютърен код. Защото изкуственият интелект вече го прави по-добре от нас.
Тази Дигитална история е важна не само за десетките милиони програмисти, но и защото е силен пример. Тя се случва в софтуерния свят, но няма причина да не се повтори във всяка друга област, където ИИ навлиза по-бавно, но също толкова неумолимо.
Май е време да „слизаме“ от клавиатурите. Но… какво да захванем тогава? Какво ще правят програмистите, когато вече не пишат код?

повече информация

Най-новите:

Как да надникнем в „мислите“ на изкуствения интелект?

Как да надникнем в „мислите“ на изкуствения интелект?

„Работата, професионалния живот, устремът да постигаме корпоративни успехи и позиции, това се е превърнало в масова култура на обществото ни в световен мащаб. Много хора осмислят по този начин живота си и до момента. Оттук нататък ще трябва да го променим. Ще трябва да търсим смисъл.“
Озовахме се във време, в което чатботът не е просто помощник, а и „психотерапевт“. Преди още да го познаваме достатъчно добре, преди да сме заложили етичните рамки. Вече виждаме първите предизвикателства от това, а тепърва се задават истинските проблеми.
Доника Боримечкова е психолог и психотерапевт с над 15 години опит. Този път решихме заедно да поканим на психотерапевтичен сеанс… изкуствения интелект. Защото, както казва Доника, вече много от клиентите ѝ получават съвети от него, преди да я срещнат. Така и не открихме начин и подход, с който да направим подобен експеримент, затова решихме да обсъдим темата, да поставим основите, след което да поканим всеки от вас да ни даде идеи как да продължим. Ето как започва този разговор.

повече информация
5 г. Дигитални истории! Ще решите ли куиза с награди?

5 г. Дигитални истории! Ще решите ли куиза с награди?

Точно преди 5 години излезе първият материал на сайта Дигитални истории! Моят скромен подарък е един забавен и неочакван куиз с награди. Опитайте да се справите с 30 въпроса и ще се включите в жребия за 10 книги, свързани по един или друг начин с историята на начинанието. Куизът отнема не повече от 10 минути, опитайте! А после ви чака изключително любопитната му история…

повече информация
От Floor-а до Quizza. Предизвикай знанията си!

От Floor-а до Quizza. Предизвикай знанията си!

Представям ви Quizza! Сайт, който създадохме с доброволен труд. В който можете да се предизвикате, като решите някой от многобройните ни постоянни куизове на какви ли не теми. Можете да се изправите в седмично състезание срещу някои от познатите ви от он- и офлайн състезания герои! И, не на последно място, да срещнете каузи, зад които всеки от нас застава с името си!
Не се съмнявам, че снощи сте гледали първия епизод от The Floor, новото и иновативно състезание по NOVA. Ако не сте, изобщо не е късно, тепърва остават цели 12 епизода. Само по себе си е повод за празник, че игра за знание, а не за скандали, се появява в праймтайма и вярвам, че ще бъде хитът на сезона. Слуховете (и ChatGPT) мълвят, че и аз съм там.
Тук сме обаче за една малко по-различна дигитална история, която е тясно свързана с играта. Тя идва да ни покаже, че когато сме заедно, сме способни на чудеса. Че щом хора, събрани уж да се състезават и побеждават един друг, могат да си протегнат ръка за нещо по-голямо, значи и обществото ни може да го направи.
Обичате ли да провокирате и проверявате знанията си? Търсите ли смислени каузи, на които да помогнете, като сте сигурни, че помощта отива на точното място и помага за нещо важно и устойчиво?
Ако отговорът ви е „да“ дори на един от тези въпроси, то тази Дигитална история е точно за вас!

повече информация
Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

Как ИИ нарисува 10 класически стиха? 2022 срещу 2026 г.

През 2022 г. призовах първия впечатляващ ИИ модел за изображения MidJourney да изпълни неочаквана задача. Подадох му 10 цитата от любими български поети, за да видим какво ще нарисува той. Резултатите бяха впечатляващи и замислящи, това се превърна в една от най-четените и обсъждани Дигитални истории.
Оттогава мина почти петилетка. Как ли ще изглеждат картинките, които днес ще нарисуват най-модерните модели по същите тези стихове? ИИ несъмнено ще покаже повече умения, но дали ще покаже и творчество, разбиране? Дали илюстрациите му ще са по-близко до изкуство? Преценете сами…
„В живота си нивга не бях се надявал
на толкова мил комплимент:
покани ме AI – най-новият AI –
дома си на чашка абсент.“

повече информация
Денят, в който програмистите спряха да пишат код

Денят, в който програмистите спряха да пишат код

Само за месец някои от безспорните авторитети от различни поколения и области на компютърния свят се обединиха зад една и съща идея. Днес не е нужно човекът да пише компютърен код. Защото изкуственият интелект вече го прави по-добре от нас.
Тази Дигитална история е важна не само за десетките милиони програмисти, но и защото е силен пример. Тя се случва в софтуерния свят, но няма причина да не се повтори във всяка друга област, където ИИ навлиза по-бавно, но също толкова неумолимо.
Май е време да „слизаме“ от клавиатурите. Но… какво да захванем тогава? Какво ще правят програмистите, когато вече не пишат код?

повече информация
Поет + ИИ = Apollo ex Machina. Кои са победителите?

Поет + ИИ = Apollo ex Machina. Кои са победителите?

Дойде време да обявим победителите в първия у нас (и един от първите по света) конкурс за поезия, генерирана с помощта на изкуствен интелект – Apollo ex Machina.
На церемония в Столична библиотека бяха обявени избраниците на журито. Там бе представена и стихосбирката с избрани творби от надпреварата, дело на издателство Scribens. След малко ще можете да прочетете стиховете на най-добрите и да прецените сами колко добри са те.

повече информация
Share This