GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

Чергар, който свали правителството (без да иска)

Чергар, който свали правителството (без да иска)

Можем ли да променяме средата? Страната си, света…ако просто напишем онлайн това, което ни вълнува? Можем. Ето го най-силното доказателство, което съм срещал. „Все едно си говориш с призрак“, описва...

повече информация
„Разумен ИИ? Само ако направим следващата голяма стъпка“

„Разумен ИИ? Само ако направим следващата голяма стъпка“

Виктор Ботев и екипът му разработват успешен продукт в едно от най-високотехнологичните направления на изкуствения интелект. Но защо ли ентусиазмът му за близкото бъдеще, в което ИИ ще промени...

повече информация
Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме...

повече информация
„ИИ вече промени работата на преводачите“

„ИИ вече промени работата на преводачите“

Знаете ли, че автоматизираните системи за превод се използват навсякъде около нас? Че огромна част от административните и комерсиални текстове се превеждат на всички езици с изкуствен интелект, а...

повече информация
„Всеки може да е програмист. Време е да сме повече инженери!“

„Всеки може да е програмист. Време е да сме повече инженери!“

Ивайло Кенов е вдъхновяващ учител, помогнал на толкова много хора да станат програмисти. Насочва се към тази професия случайно, след като разбира, че строителното инженерство не е за него. Решава да...

повече информация

Още публикации по темата:

От рубриката:

Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме едновременно представителите си в националния ни и в Европейския парламент. Ключови избори има в 8 от 10-те най-големи държави на планетата, поне 2 милиарда души се очаква да се озоват пред урните (ако не отидат за гъби).
И ако за нас през последните години това се превърна в повтарящо се често, не особено атрактивно и мотивиращо задължение, то ето че за първи път демократичните процедури от подобен мащаб се случват в епохата след ChatGPT. Във времето, когато изкуственият интелект се превърна в голямата възможност и предизвикателство. И всичко това – на фона на цялостния упадък на интереса към демократичните процеси. В зората на зараждащите се обществени сътресения, които, няма как, са свързани изключително пряко с технологичната революция, в която живеем.
Може ли изкуственият интелект да се превърне в ключов фактор, който ще решава задаващите се избори? Има ли как да намалим риска да бъдем манипулирани в избора си, на фона на и без това манипулативните форми на комуникация онлайн? Как ще изглежда и колко е далеч моментът, когато технологиите ще ни позволят да направим следващите стъпки от развитието ни като вид, от начина, по който е организирано и управлявано обществото ни? Ето осем повода за замисляне.

повече информация
Stack Overflow. Спасителят на програмистите си отива

Stack Overflow. Спасителят на програмистите си отива

Много е лесно да различиш човек, който някога е програмирал от останалите – „докосвал“ ли си код, просто няма как да не си виждал Stack Overflow. Само за 15 години сайтът с въпроси и отговори промени из основи начина, по който работят програмистите. Превърна се в Мека за софтуерните инженери, в спасителен пристан за почти всеки ежедневен техен проблем.
Днес обаче легендата върви към своя залез. При това, по ирония на съдбата, заради напредъка в технологиите, който сама направи възможен…
Нещо повече – заради упадъка на проекта мнозина вещаят сериозни проблеми, с които ще се сблъскват следващите програмисти.
Историята на Stack Overflow е показателна за това къде сме днес в света на технологиите. За стремителната скорост, с която се променяме. За семенцата, за добрите идеи, които могат да покълнат само ако попаднат в подходящата среда и в точния момент. И за бързината, с която до вчера непоклатимият гигант се превръща в сянка на себе си.

повече информация
Как DALL·E „прочете“ любими български книги?

Как DALL·E „прочете“ любими български книги?

Чукчата не е читател, а писател, знаете сигурно, ами… ChatGPT? Време е за поредния прелюбопитен експеримент, който да ни покаже на какво са способни днес алгоритмите в областта както на създаването на изображения, така и на разбирането на контекст.
Ще призова алгоритъма DALL·E 3, който е част от платената версия на ChatGPT, да ми илюстрира класически български литературни произведения от различни периоди.
Защо това е интересно? От една страна, ще ни покаже колко добре работи големият езиков модел на български. Ще стане ясно доколко разпознава някои от безспорните наши класически произведения.
Не на последно място просто защото… е интересно дали пък няма да ни покаже някакви по-неочаквани, различни, атрактивни гледни точки? Дали не можем да говорим за някаква форма на колективно неосъзнато? Дали картините ще се припокрият поне донякъде с образите, които всеки от нас има за тези книги в главата си?

повече информация

Най-новите:

Чергар, който свали правителството (без да иска)

Чергар, който свали правителството (без да иска)

Можем ли да променяме средата? Страната си, света…ако просто напишем онлайн това, което ни вълнува?
Можем. Ето го най-силното доказателство, което съм срещал.
„Все едно си говориш с призрак“, описва срещата ни събеседникът. А не ми прилича на призрак, същински Шерлок, върлинест, с шахматно карирани каскет и сако. После, в разговора, повече ми заприличва на друг знаменит литературен герой, един идалго.
Срещу мен е легендарният блогър Чергар, създал незабравими текстове и мистификации, които и до днес стоят на почетно място в дигиталния фолклор и колективната памет. Авторът на сайта neverojatno, от определен момент познат и като „Бъзикилийкс“. За „Истината такава, каквато можеше да бъде!?“
Но как един анонимен блогър се превърна в честа тема за разговор между политици и медии? И как негов текст доведе до… оставката на българското правителство, при това… без той да го иска или очаква?
„Ако младите имат желание, имат идея, имат нещо, в което вярват и искат да постигнат, винаги трябва да положат усилия…“

повече информация
„Разумен ИИ? Само ако направим следващата голяма стъпка“

„Разумен ИИ? Само ако направим следващата голяма стъпка“

Виктор Ботев и екипът му разработват успешен продукт в едно от най-високотехнологичните направления на изкуствения интелект. Но защо ли ентусиазмът му за близкото бъдеще, в което ИИ ще промени всички ни…, е далеч от ширещите се огромни очаквания? Предстои ни да срещнем една неочаквана, задълбочена гледна точка към голямата тема на нашето време.
Вече 8 години гостът ни е главен технологичен директор на Iris.ai. Норвежко-българският стартъп разработва системи за прилагането на изкуствен интелект в обработката на масиви с научни данни.
Защо не изглежда да сме чак толкова близо до генералния изкуствения интелект? Обречени ли сме да се съобразяваме с пристрастията и халюцинациите на моделите, преди да измислим следващата голяма стъпка?
Надценихме ли ефекта от появата на ChatGPT и това кои области могат да бъдат променени из основи от големите езикови модели? Защо според госта ни сме близо до предела на възможностите им и е време за следващата голяма стъпка?
Защо според него ерата на сървиз компаниите у нас приключи безвъзвратно? Изпуснахме ли ключовия момент да изведем IT индустрията си на следващото ниво и има ли шанс да наваксаме?
Очаква ни един дълъг технологичен разговор по човешки за ценители…

повече информация
Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме едновременно представителите си в националния ни и в Европейския парламент. Ключови избори има в 8 от 10-те най-големи държави на планетата, поне 2 милиарда души се очаква да се озоват пред урните (ако не отидат за гъби).
И ако за нас през последните години това се превърна в повтарящо се често, не особено атрактивно и мотивиращо задължение, то ето че за първи път демократичните процедури от подобен мащаб се случват в епохата след ChatGPT. Във времето, когато изкуственият интелект се превърна в голямата възможност и предизвикателство. И всичко това – на фона на цялостния упадък на интереса към демократичните процеси. В зората на зараждащите се обществени сътресения, които, няма как, са свързани изключително пряко с технологичната революция, в която живеем.
Може ли изкуственият интелект да се превърне в ключов фактор, който ще решава задаващите се избори? Има ли как да намалим риска да бъдем манипулирани в избора си, на фона на и без това манипулативните форми на комуникация онлайн? Как ще изглежда и колко е далеч моментът, когато технологиите ще ни позволят да направим следващите стъпки от развитието ни като вид, от начина, по който е организирано и управлявано обществото ни? Ето осем повода за замисляне.

повече информация
„ИИ вече промени работата на преводачите“

„ИИ вече промени работата на преводачите“

Знаете ли, че автоматизираните системи за превод се използват навсякъде около нас? Че огромна част от административните и комерсиални текстове се превеждат на всички езици с изкуствен интелект, а задачата на хората е да проверяват и поправят?
Вече дори не ги наричат „преводачи“, а „постредактори“.
След като хората станаха постредактори на алгоритмите… тук ли е някъде и срещата с постистината? Ще влезе ли изкуственият интелект в ролята на вавилонска рибка, или ще създаде новия Вавилон?
Познавате Рада Ганкова от гостуването ѝ преди година, когато си поговорихме за залинялото ни словотворчество. За лекотата, с която вземаме думи като „еърфрайер“, докато някога сме били достатъчно оригинални да измислим „чушкопек“. Днес ще поговорим за основната ѝ работа – превода, и начина, по който я променя навлизането на изкуствения интелект.

повече информация
Stack Overflow. Спасителят на програмистите си отива

Stack Overflow. Спасителят на програмистите си отива

Много е лесно да различиш човек, който някога е програмирал от останалите – „докосвал“ ли си код, просто няма как да не си виждал Stack Overflow. Само за 15 години сайтът с въпроси и отговори промени из основи начина, по който работят програмистите. Превърна се в Мека за софтуерните инженери, в спасителен пристан за почти всеки ежедневен техен проблем.
Днес обаче легендата върви към своя залез. При това, по ирония на съдбата, заради напредъка в технологиите, който сама направи възможен…
Нещо повече – заради упадъка на проекта мнозина вещаят сериозни проблеми, с които ще се сблъскват следващите програмисти.
Историята на Stack Overflow е показателна за това къде сме днес в света на технологиите. За стремителната скорост, с която се променяме. За семенцата, за добрите идеи, които могат да покълнат само ако попаднат в подходящата среда и в точния момент. И за бързината, с която до вчера непоклатимият гигант се превръща в сянка на себе си.

повече информация
„Всеки може да е програмист. Време е да сме повече инженери!“

„Всеки може да е програмист. Време е да сме повече инженери!“

Ивайло Кенов е вдъхновяващ учител, помогнал на толкова много хора да станат програмисти. Насочва се към тази професия случайно, след като разбира, че строителното инженерство не е за него. Решава да опита като преподавател, въпреки че е срамежлив по природа.
Дълги години е начело на екипа програмисти в СофтУни, води лекции по безброй технологии. Преподава, увлича и дава занаят, от него и аз съм научил основите на технологията, с която днес си изкарвам хляба.
Днес Ивайло е изправен пред ново начинание. Екипът му се превърна във фирма, която се е устремила към амбициозната задача да припомни, че създаването на софтуер все повече трябва да бъде инженерен процес, а не просто кодене.
Наистина ли всеки може да стане програмист, както казва учителят, помогнал на мнозина да изпълнят тази мечта? Какви са основните трудности, които спират хората?
Кои са големите проблеми, с които се сблъскват днешните програмисти? Защо си струва те вече да са не просто кодери, а да подхождат инженерно и към останалите страни от работата си?
Дали наистина е толкова трудно да си намериш първа работа в тази област? Кои са най-честите грешки?
Как Ивайло, на когото лекарите предричат, че няма да може да ходи, днес вдига 150-килограмови тяги благодарение на… инженерния подход?

повече информация
Share This