GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

Можем ли да предскажем бъдещето? Никакъв шанс, всяка малка стъпка може да обърне посоката. А струва ли си да опитваме? Според мен е задължително, колкото и далеч да се окажем в идеите си, самият...

повече информация
Радиевите момичета. Когато технологията се окаже ужас

Радиевите момичета. Когато технологията се окаже ужас

Открито е невероятно мощно явление, създаващо ново вещество! Не само че лекува дори нелечимите случаи на рак, но ще отвори очите на науката в толкова много посоки. Например… да освети тъмната нощ!...

повече информация
Василискът на Роко. Ами ако „то“ прочете как го обсъждаме?

Василискът на Роко. Ами ако „то“ прочете как го обсъждаме?

Живеем си спокойно, забавляваме се с баналните издънки на изкуствения интелект, подиграваме се на създателите му. Докато той става все по-добър, в един момент се научава да взема решения, започва да...

повече информация
Чипс с ракия. Оптимистична теория за ИИ и изкуството

Чипс с ракия. Оптимистична теория за ИИ и изкуството

Виждали ли сте чипс с вкус на шкембе чорба или на ракия? А лего, в което се сглобяват катедралата „Александър Невски“ или стара жигула? Представяте ли си българските знаменитости като част от играта...

повече информация

Още публикации по темата:

От рубриката:

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

Ще облекчат ли живота ни технологиите, или ще създадат огромна криза, разтърсвайки пазара на труда? Ще се радваме на благата на развития изкуствен интелект, помогнал ни за драстично удължаване на човешкия живот, в опознаването на Космоса, в развитието на следващите технологии? Или ще се събудим в свят под тотален контрол, предсказан от антиутопиите?
Как ще изглежда животът през 2050 г.? Време е да надникнем в бъдещето и да обсъдим прелюбопитните прогнози на един автор, който има смелостта да прогнозира в толкова динамичен период от историята. При това вече го е правил веднъж със завиден успех.
Можем ли да предскажем бъдещето? Никакъв шанс, всяка малка стъпка може да обърне посоката. А струва ли си да опитваме? Според мен е задължително, колкото и далеч да се окажем в идеите си, самият поглед, опитът за осмисляне е първата стъпка към това да се подготвим за него. Да избегнем някои опасности.

повече информация
Доверявай, но проверявай онлайн!

Доверявай, но проверявай онлайн!

Ако не сте чували какво е „социално инженерство“ или „инженерия“, както казва, че е правилно да го наричаме днешният ни гост, сигурно си представяте сюжет като от „Франкенщайн“ – инженерът си прави човек… Или пък от конспиративните теории за контрол на масите.
Независимо дали сте го чували обаче, важно е все повече да си говорим по тази тема. Защото става дума за най-опасната и най-ефективната атака в дигиталния свят. Която не засяга компютри, мрежи, сървъри или програми, а най-слабото звено във веригата: човека.
„Днес пробивите в киберсигурността стават все по-често през социалната инженерия – метод, който използва манипулации и манипулативни техники, така че хората да бъдат измамени и така да бъде получен достъп до чувствителна информация“, казва специалистът по киберсигурност Пламен Цветанов.
Но кои са най-важните стъпки, за да се предпазим? Какви са най-големите рискове да подценим човек, от другата страна? Защо доверието онлайн трябва да бъде дефицитна стока? Темата е важна за всеки, дори да не си дава сметка…

повече информация
Радио-тв-грамофон. 5 неочаквани БГ технологии

Радио-тв-грамофон. 5 неочаквани БГ технологии

Знаете ли, че невинаги напрежението в мрежата у нас е било 220 волта? А че една прелюбопитна българска компютърна игра от началото на 80-те направо се превръща в… пророчество още със заглавието си? Как ли изглеждат първите български електрически скутери? А дали „хипстърите от 60-те“, които са ги ползвали, са имали как да си вземат и радио-тв-грамофон… достатъчно е било да са способни да носят 120 кг на рамо.
Отново се отправяме из пъстрата история на българската техника с най-точния и увлекателен гид. Вече 15 години Антон Оруш събира море от информация (и експонати), разказващи за миналото и настоящето ѝ. Невероятната му съдба, достойна за роман, бе една от първите дигитални истории.
Ето, качваме се в машината на времето за 5 спирки назад в историята, 5 интересни истории, свързани с миналото на технологиите по нашите земи.

повече информация

Най-новите:

Евгений Замятин. Забравеният пророк

Евгений Замятин. Забравеният пророк

„Ние“ на Евгений Замятин е блестящ роман, защото в него наднича онова бъдеще, в което технологиите са победили човека. Вкарали са го в математическата си хватка, превърнали са го в цифра, в инструмент. Една от най-силните метафори на онова, което може би се задава и за което все повече си струва да си говорим. Технологиите определят правилата, а ние сме се превърнали в безсмислените части на един суров механизъм…
Често споменаваме Оруел и Олдъс Хъксли. И с пълно основание! Антиутопичните възможни светове, които си мислехме, че са останали в ХХ век, се завърнаха като тема, като заплаха.
Този писател е вдъхновител и на двамата, единственият му роман е антиутопия, не по-малко замисляща и осмисляща от тези на двамата класици. Защото се вглежда не толкова във възможния осъществен тоталитаризъм, а в една още по-актуална днес посока.

повече информация
„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

„Светът през 2050 г.“ Можем ли да надникнем в бъдещето?

Ще облекчат ли живота ни технологиите, или ще създадат огромна криза, разтърсвайки пазара на труда? Ще се радваме на благата на развития изкуствен интелект, помогнал ни за драстично удължаване на човешкия живот, в опознаването на Космоса, в развитието на следващите технологии? Или ще се събудим в свят под тотален контрол, предсказан от антиутопиите?
Как ще изглежда животът през 2050 г.? Време е да надникнем в бъдещето и да обсъдим прелюбопитните прогнози на един автор, който има смелостта да прогнозира в толкова динамичен период от историята. При това вече го е правил веднъж със завиден успех.
Можем ли да предскажем бъдещето? Никакъв шанс, всяка малка стъпка може да обърне посоката. А струва ли си да опитваме? Според мен е задължително, колкото и далеч да се окажем в идеите си, самият поглед, опитът за осмисляне е първата стъпка към това да се подготвим за него. Да избегнем някои опасности.

повече информация
Радиевите момичета. Когато технологията се окаже ужас

Радиевите момичета. Когато технологията се окаже ужас

Открито е невероятно мощно явление, създаващо ново вещество! Не само че лекува дори нелечимите случаи на рак, но ще отвори очите на науката в толкова много посоки. Например… да освети тъмната нощ!
Мария Кюри открива радиоактивността, получава цели две Нобелови награди и проправя пътя на бъдещето.
Тя отваря вратите на една нова технология, която се оказва неочаквано успешна… До момента, когато става ясно, че силно сме подценявали опасностите от нея. Това ще струва живота на хиляди хора, които просто са търсели препитание.
Дали познаваме достатъчно технологиите, на които се доверяваме? Може ли и прословутият изкуствен интелект или пък някое от другите днес модерни направления да се окаже по-опасно, отколкото изглежда на пръв поглед?
Най-важното е да се замисляме, да обмисляме, да обсъждаме. Да си разказваме.
Истории като тази на радиевите момичета си струва да се четат по-често. За това са историите – да ни карат да подлагаме на съмнение, да имаме едно наум. Уви, не всичко, което блести, е злато…

повече информация
„Толкова ли ще е лош светът, в който няма да работим?“

„Толкова ли ще е лош светът, в който няма да работим?“

Чували ли сте за… киберпсихология? Най-накрая се появява тази област на науката, която изучава как си взаимодействаме с технологиите. Променят ли ни те като вид? Кои са най-големите предизвикателства, пред които ни изправят? Дали бързото им развитие е нечовешко предизвикателство, или обратното – естествен ход в еволюцията? Все въпроси, чиито отговори търся в повече от 300 дигитални истории, а ето че дойде време за гледната точка на киберпсихологията.
Елена Цанкова е доктор по психология, завършва в Германия, в Бремен продължава и изследователската си работа като постдокторант. През 2020 г. се връща у нас и започва работа като изследовател в БАН с амбициозната идея да проправи пътя на това ново и толкова важно направление.
През последните години изучава процесите на опознаване в интернет средата, също и общуването между човека и изкуствения интелект (ИИ). Изследва човешкото поведение в контекста на развиващите се технологии и се определя като експериментален киберпсихолог.
Ще поговорим за бързането и осъзнаването. За „зловещата долина“, в която възприятието за технологията става все по-положително с нарастващото ѝ подобие на човек, докато в един момент става толкова близка до човека, че бива възприета като зловеща… И за спокойната, философска гледна точка, която ни помага да осмисляме и приемаме големите промени.

повече информация
Василискът на Роко. Ами ако „то“ прочете как го обсъждаме?

Василискът на Роко. Ами ако „то“ прочете как го обсъждаме?

Живеем си спокойно, забавляваме се с баналните издънки на изкуствения интелект, подиграваме се на създателите му. Докато той става все по-добър, в един момент се научава да взема решения, започва да следи интернет и да се намесва тук-там, първо лекичко, после по-смело…
Василискът на Роко е идея, според която ИИ ще се развие в нещо, способно да взема решения. После да се зарови в интернет и да потърси кой какво е казал за него… А след това да се погрижи да бъде представен в най-добра светлина. И тихомълком да започне да създава проблеми на хората, които по един или друг начин му пречат…
Сигурни ли сте, че не си струва да имаме предвид този мисловен експеримент?

повече информация
Чипс с ракия. Оптимистична теория за ИИ и изкуството

Чипс с ракия. Оптимистична теория за ИИ и изкуството

Виждали ли сте чипс с вкус на шкембе чорба или на ракия? А лего, в което се сглобяват катедралата „Александър Невски“ или стара жигула? Представяте ли си българските знаменитости като част от играта Mortal Kombat – Сънчо срещу Дънов и хан Кубрат срещу Гала?
Е, няма нужда да отпускате въображението си, всички тези идеи оживяват благодарение на впечатляващото сътрудничество между днешния ни гост и алгоритмите.
Росен Дуков е графичен дизайнер със забележителен опит – създава плакатите на някои от най-популярните български филми през последните години, автор е на кориците на книги, които стоят във всяка уважаваща себе си библиотека. Той е неколкократен победител в международни състезания по Photoshop, не е пресилено да го наречем световен шампион. През последните години преподава тези умения в СофтУни – и в дизайна, и в обработката на снимки, и в изкуствения интелект.
Защо визуалният артист не се бои в съревнованието с изкуствения интелект? Защо според него е важно час по-скоро да опознаваме новите възможности, които ни дават алгоритмите? Кои са следващите оригинални идеи, с които ще ни покаже докъде са стигнали генеративните модели?

повече информация
Share This