GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

Асанж и свободата

Асанж и свободата

Къде е днес свободата? Където е била винаги, в идеалите. И в делата на все по-малкото хора, за които тя продължава да бъде кауза, а не кухо клише. След 14-годишна битка, която в много моменти...

повече информация
„Светът е по-хаотичен, отколкото ни се иска. И науката не е тук, за да ни утеши“

„Светът е по-хаотичен, отколкото ни се иска. И науката не е тук, за да ни утеши“

„Струва ми се по-просто хората да запомнят кое е измама и заблуда. Кратък и съвсем неизчерпателен списък: хомеопатия, холистична медицина, натуропатия, антиваксърство, хидроколонтерапия, детокс...

повече информация
Агент GPT. Когато изкуствените интелекти заиграят в отбор

Агент GPT. Когато изкуствените интелекти заиграят в отбор

Какво ли ще стане, ако обърнем стереотипа за изкуствен интелект? Нямаме насреща си един модел, с който например да си чатим, а безброй отделни „индивиди“. Раздаваме им задачи, всеки от тях работи...

повече информация
„ИИ вече може да помогне в абсолютно всяка човешка задача“

„ИИ вече може да помогне в абсолютно всяка човешка задача“

Николай Марков е сред специалистите, които проправят пътя към все по-масовото навлизане на изкуствения интелект във всяка област от живота ни. Макар повече от 2 десетилетия да е в света на...

повече информация
„До 5 години ще слеем реалното и виртуалното“

„До 5 години ще слеем реалното и виртуалното“

Говорим си в Техническия университет в София, а… можем да сме навсякъде. Защото в лабораторията, в която се срещаме, се развиват следващите поколения средства за добавена и виртуална реалност. Те...

повече информация

Още публикации по темата:

От рубриката:

Агент GPT. Когато изкуствените интелекти заиграят в отбор

Агент GPT. Когато изкуствените интелекти заиграят в отбор

Какво ли ще стане, ако обърнем стереотипа за изкуствен интелект? Нямаме насреща си един модел, с който например да си чатим, а безброй отделни „индивиди“. Раздаваме им задачи, всеки от тях работи автономно, специализира се в дадена работа, трупа знания по нея, контролира другите…
Целта например е да създават софтуер. Единият модел ще се научи да формулира изискванията, друг да пише програмния код, трети ще подготви визуалната страна, четвърти ще тества кое и как се е получило… и така ще се събере цяла софтуерна фирма, работеща милиони пъти по-бързо от обичайните, защото е изградена не от хора, а от алгоритми.
Колко далечно е днес това бъдеще?
Неотдавна Сам Алтман каза, че именно в тази посока се задават много сериозни пробиви. ИИ агентите са една от областите в компютърните науки, където очакваме големи новини. Следващите поколения изкуствен интелект, способни да решават значително по-сложни и комплексни задачи, допускащи много по-малко грешки. Мнозина от най-големите специалисти казват, че чрез този подход ще извървим следващата голяма стъпка в развитието на изкуствения интелект. Ето защо.

повече информация
Името на Apple-а. Историите зад големите марки онлайн

Името на Apple-а. Историите зад големите марки онлайн

Братовчеди ли са Java и JavaScript и ако нямат нищо общо… защо носят толкова подобни имена? Защо в название и символ на Apple се превръща толкова експлоатиран символ като ябълката? Какво ли е… Adobe? А Google? Има ли Lenovo общо с Ленин?
„Туй, което зовем ний „роза“, ще ухае сладко под всяко друго име“, казва Жулиета, цитирана от Шекспир. А туй, което зовем Apple или Amazon, щеше ли да ухае сладко под друго име?
Можем само да гадаем. Но зад названията на най-големите в онлайн света понякога се крият забавни истории. В следващите редове ще минем набързо през някои от най-поучителните и неочакваните.

повече информация
„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

Ще облекчат ли живота ни технологиите, или ще създадат огромна криза, разтърсвайки пазара на труда? Ще се радваме на благата на развития изкуствен интелект, помогнал ни за драстично удължаване на човешкия живот, в опознаването на Космоса, в развитието на следващите технологии? Или ще се събудим в свят под тотален контрол, предсказан от антиутопиите?
Как ще изглежда животът през 2050 г.? Време е да надникнем в бъдещето и да обсъдим прелюбопитните прогнози на един автор, който има смелостта да прогнозира в толкова динамичен период от историята. При това вече го е правил веднъж със завиден успех.
Можем ли да предскажем бъдещето? Никакъв шанс, всяка малка стъпка може да обърне посоката. А струва ли си да опитваме? Според мен е задължително, колкото и далеч да се окажем в идеите си, самият поглед, опитът за осмисляне е първата стъпка към това да се подготвим за него. Да избегнем някои опасности.

повече информация

Най-новите:

Асанж и свободата

Асанж и свободата

Къде е днес свободата? Където е била винаги, в идеалите. И в делата на все по-малкото хора, за които тя продължава да бъде кауза, а не кухо клише.
След 14-годишна битка, която в много моменти изглеждаше обречена, Одисей най-накрая се завърна в Итака. Частният самолет кацна в австралийската столица Канбера. От борда му слезе добре познатият по цял свят белокос харизматичен мъж и помаха на събралите се журналисти и посрещачи. После прегърна двете си малки деца, които за първи път виждаше на свобода, далеч от потискащите решетки…
Героите от миналото се борят за свободата. За независимостта на своите народи, срещу робството и несправедливостите. А днешните герои, които ще почитат следващите поколения? Ако го има утрешния ден, значи те ще са победили, колкото и да изглежда невероятно.
Днешните герои също се борят за свободата. Уви, нито са толкова много, нито са толкова познати. Но ако има един, чиято битка за истината е стигнала до мнозина, това несъмнено е днешният ни герой. Джулиън Асанж се превърна в легенда, в символ. А историята му е толкова вълнуваща и пълна с перипетии, че си струва да се заровим в нея. Като междувременно му дадем думата за някои важни цитати, които, надявам се, ще накарат повече хора да се замислят за истински важните теми на днешния ден. Тези, заради които ги има и Дигитални истории…

повече информация
„Светът е по-хаотичен, отколкото ни се иска. И науката не е тук, за да ни утеши“

„Светът е по-хаотичен, отколкото ни се иска. И науката не е тук, за да ни утеши“

„Струва ми се по-просто хората да запомнят кое е измама и заблуда. Кратък и съвсем неизчерпателен списък: хомеопатия, холистична медицина, натуропатия, антиваксърство, хидроколонтерапия, детокс диети, астрология, екстрасензорни възприятия, ясновидство, телекинеза (и всички измислени феномени, които включва „парапсихологията“), НЛО базирани древни цивилизации, графология, медиумни способности, квантов мистицизъм, вечни двигатели, безенергийни двигатели, креационизъм, биоритми, криптозоология…“
Вярвате ли в астрологията, в силата на чакрите, в рептилите, в плоската Земя? Може би сте от малцинството днес, за което всичко това са несериозни посоки? Или пък не можете да отречете, че зодиите влияят на поведението, докато другите ви се струват крайни? Да, днес, както никога преди, имаме нужда от репери, за да не потънем в океана от онлайн лудост. Докато в същото време е все по-трудно да говорим помежду си.
Разделени от поредния разлом, спорим кой се занимава с псевдонаука и кой се е оставил да бъде подведен от авторитетите. Пътя към този труден, но назрял разговор – за конспирациите и псевдонауката, за науката и авторитетите, ще потърсим с днешния гост.
Стефан Марков е преподавател по теория на масовата комуникация, мениджмънт на комуникацията и маркетинг и реклама в Софийския университет, познат онлайн като The Science Guy. В издадената неотдавна книга „Алгоритми на заблудата“ той навлиза именно в сърцето на тази тема. След любопитните му начинания (и много значими за самия него) е и подкастът „Модерен стоицизъм“, който води заедно с Петър Теодосиев от „Българска наука“.

повече информация
Агент GPT. Когато изкуствените интелекти заиграят в отбор

Агент GPT. Когато изкуствените интелекти заиграят в отбор

Какво ли ще стане, ако обърнем стереотипа за изкуствен интелект? Нямаме насреща си един модел, с който например да си чатим, а безброй отделни „индивиди“. Раздаваме им задачи, всеки от тях работи автономно, специализира се в дадена работа, трупа знания по нея, контролира другите…
Целта например е да създават софтуер. Единият модел ще се научи да формулира изискванията, друг да пише програмния код, трети ще подготви визуалната страна, четвърти ще тества кое и как се е получило… и така ще се събере цяла софтуерна фирма, работеща милиони пъти по-бързо от обичайните, защото е изградена не от хора, а от алгоритми.
Колко далечно е днес това бъдеще?
Неотдавна Сам Алтман каза, че именно в тази посока се задават много сериозни пробиви. ИИ агентите са една от областите в компютърните науки, където очакваме големи новини. Следващите поколения изкуствен интелект, способни да решават значително по-сложни и комплексни задачи, допускащи много по-малко грешки. Мнозина от най-големите специалисти казват, че чрез този подход ще извървим следващата голяма стъпка в развитието на изкуствения интелект. Ето защо.

повече информация
„ИИ вече може да помогне в абсолютно всяка човешка задача“

„ИИ вече може да помогне в абсолютно всяка човешка задача“

Николай Марков е сред специалистите, които проправят пътя към все по-масовото навлизане на изкуствения интелект във всяка област от живота ни. Макар повече от 2 десетилетия да е в света на информационните технологии, той е завършил инженерна физика и макроикономика. Опитът му минава от разработването на облачни решения през киберсигурността до изследването и внедряването на изкуствен интелект.
Днес е начело на екипа по ИИ, девопс и облачни практики на SoftServe. Заедно с това в TeamLandi разработва система, с чиято помощ малкият и среден бизнес ще получи достъп до пълния спектър възможности, които дава изкуственият интелект.
Защо тези технологии са тук, за да останат и да променят живота ни? Как така изкуственият интелект е първата технология, която може да навлезе в абсолютно всяка област? Как ще изглежда бъдещето?

повече информация
PC Mania, Gamers Workshop… Легендите се завръщат!

PC Mania, Gamers Workshop… Легендите се завръщат!

Обичаш компютрите и за да можеш да ги ползваш… си купуваш списания!?
Ама не е ли странно? Та нали онлайн има всичко? Днес е така, но тази дигитална история се ражда в едновременно близкото и толкова далечно компютърно минало. Едно хлапе мечтае да получи непознато списание с лика на Джеймс Бонд, което е привлякло погледа му. Лишава се от джобните си, за да го купи, но само няколко часа по-късно му го вземат „батковците“. Така обаче се пробужда интересът му към култовите компютърни списания от края на миналия век, любими четива на цяло едно поколение.
Десетилетия по-късно момчето отново „среща“ същия Бонд, списанието отприщва историята нататък. Минават хиляди упорити часове, докато днес проект „Лазарус“ е завършен, всеки може да разгледа пълната колекция от легендарните компютърни списания от 90-те и първите години на 21-и век. Един своеобразен културен феномен, който трудно може да може да бъде обяснен на следващите млади…
Вие кое списание обичахте? PC Mania, Gamers Workshop или някое друго от дългия списък?

повече информация
„До 5 години ще слеем реалното и виртуалното“

„До 5 години ще слеем реалното и виртуалното“

Говорим си в Техническия университет в София, а… можем да сме навсякъде. Защото в лабораторията, в която се срещаме, се развиват следващите поколения средства за добавена и виртуална реалност. Те все по-убедително ще ни водят към съвършената имитация на света около нас.
Доц. Агата Манолова е декан на Факултета по телекомуникации на ТУ, преподавател с огромен опит. Специалист в компютърното зрение и невронните мрежи, но също и в разработването на добавена и виртуална реалност, холографски комуникации.
Защо въпреки очакванията на Марк Зукърбърг все още не сме в метавселената, където щяхме да прекарваме цялото си време? Колко далеч е моментът, когато ще постигнем съвършената, неразличима виртуална реалност? Кои са най-важните стъпки по този път и възможно ли е да се окаже невъзможно? Защо българските специалисти в тази област са толкова търсени и уважавани по света?
Време е за един съвсем инженерен и реален разговор за виртуалното и големите въпроси, които се задават в тази посока.

повече информация
Share This