GAN. ИИ започна да си измисля… хора

юли 8, 2022 | Технологии

GAN. ИИ започна да си измисля… хора

8 юли 2022 | Технологии

Изкуственият интелект има много измерения в днешния ден, за него се говори често с неоправдан оптимизъм, докато той вече е готов за чудеса в много области. Едно от основните предизвикателства, които определено ще предопределят мястото му в живота ни, е това дали ще може да създава нещо свое, различно. Своеобразно или не, но което може да бъде наречено изкуство.

Една от основните технологии, които през последните години дадоха нов поглед към темата, предлага особено интересно решение. Изправя една срещу друга двете страни на невронните мрежи – следващото поколение на компютърните алгоритми. Първата се опитва да изпълни задачата си, а втората се старае да познае доколко добре се е справила тя.

Как ли се случва всичко това? Защо именно GAN мрежите са един от фаворитите в състезанието за това кога изкуственият интелект ще е способен да създава човешко изкуство? Какви други чудеса… и проблеми могат да ни донесат?

 

 

Добро момче

Йън Гудфелоу е само на 30, младши специалист в „Гугъл“, когато, през 2014-а публикува заедно с колеги фундаменталния си научен труд, в който предлага идеята за GAN. През следващите години той създава и други впечатляващи иновации в областта на изкуствения интелект. След като се катери постепенно по кариерната стълбица в „Гугъл“, през 2019-а приема предложението да оглави звеното, което се занимава с изкуствения интелект в „Епъл“.

Младият учен, чието презиме се превежда като „добър колега“ или „добър приятел“, днес е един от най-известните учени в света на изкуствения интелект, като си остава най-разпознаваем именно с идеята си за GAN.

Съкращението идва от Generative Adversarial Networks или „генеративни състезателни мрежи“.

Какво ли генерират? Какво ли не!

А с какво ли се състезават? Само със себе си!

 

 

Добрият, лошият и алгоритъмът

Невронните мрежи представляват комбинации от алгоритми, разпределени в слоеве, които обработват една по една подадените единици информация и я предават на следващите. По този начин е възможно изключително прецизното откриване на всякакви закономерности.

Това направление в някои посоки напредва с изумителна скорост, в други никак не се справя с покриването на неоправданите очаквания. И все пак, през последните десетилетия това със сигурност е една от най-динамично и главоломно развиващите се области на науката.

Големите пробиви не започнаха веднага, когато се появиха на бял свят дълбоките невронни мрежи. За същинското им начало се смята прословутият прототип на Ян Лекун от 1989 г. Тогава обаче компютрите бяха далеч от нужните възможности, революцията трябваше да почака 20-ина години. През последното десетилетие тя е факт, раждат се нови и нови мащабни направления. Вече е ставало дума за любопитните халюциногенни „сънища“ на алгоритмите, за системите за препоръчване, за лицевото разпознаване.

Е, смело може да се каже, че концепцията за генеративните мрежи откри изцяло нови парадигми.

Идеята им е следната. Невронната мрежа получава достатъчно голям обем от данни, на базата на които успоредно да тренира два модела. Единият е генеративен – анализира получените данни, а другият дискриминативен – работата му е да оценява доколко добре първият модел успява да улови и пресъздаде закономерностите. Той приема само частта от резултатите, които според него са толкова прецизни, че би могъл да „сбърка“ с такива от истинската база данни.

 

GANиална идея

Казано с други думи, в рамките на модела имаме два познати от зората на човечеството образа – твореца и критика. Първата част от алгоритъма прави всичко по силите си, за да открие и пресъздаде по свой начин закономерностите в базата данни, а втората преценява какво се е получило както трябва и „изхвърля“ останалото.

Днес човешките лица се разпознават прекрасно от дълбоките невронни мрежи. Какво ли ще стане обаче, ако задачата се усложни и се промени на това на базата на намерените закономерности да се създаде ново човешко лице, което не съществува?

 

 

Ето едно такова. „Измислила“ си го е една GAN мрежа. Ето и още едно:

 

 

Ако ви е станало забавно, можете да дойде тук и сами да продължите. Всяко обновяване на страницата ще ви покаже нова физиономия. В някакъв момент ще забележите някои дребни неточности, по които да се види, че има нещо нереално, но те като цяло са изключения.

Случват се най-вече защото алгоритъмът не възприема като едно цяло например бижута от типа на обеците и ги „разпарчетосва“ в търсенето на по-големи закономерности.

Така или иначе, в огромния процент от случаи ще се убедите, че GAN мрежата се справя безупречно.

GAN котка

А как ви изглежда това коте? Сигурно вече се досетихте, то също не съществува.

Същият принцип може да се използва за какво ли още не. С котета опитайте тук, с коне – тук. Резултатите определено ще ви изненадат.

 

Бай GANьо

И всички те са получени по начина, предложен от Гудфелоу и колегите му. Невронната мрежа е получила огромен брой снимки на котки. Генераторът е опитал да анализира закономерностите и да създаде сам нови котки, а дискриминаторът е успял прецизно да прецени кои отговарят на критериите и наистина изглеждат като котките, представени в основната база данни.

Ако го погледнем по-отблизо, това е поредица от алгоритми, които слой след слой анализират изображенията и изпълняват двете поставени задачи. А по-отдалеч: програма, която успешно може да генерира някакви единици информация – не задължително снимки, които с доста сериозен успех наподобяват тези, които са подадени, без да ги повтарят.

Този пробив в изкуственият интелект със сигурност е впечатляващ. Няма да се впускаме в това да обсъждаме дали създаденото ново коте е произведение на изкуството и кой носи авторските права за него, защото вече сме се спирали на темата тук.

 

GAN

GAN мрежите се затрудняват сериозно да създават някои на пръв поглед лесни обекти, като например часовници.

 

GAN Гог

По-интересно в случая е на какво са способни GAN мрежите и какви са посоките им на развитие. От поредицата сайтове с лицата и котетата има и такива за снимки на химически вещества… и за произведения на изкуството. Да, последните никак не приличат на това, което би трябвало да бъдат, освен ако не сведем изкуството до някои от най-най-абстрактните му и модернистични форми, по-популярни в северозападните части на България под термина „изгъзици“.

GAN мрежата в първоначалното си приложение успешно наподобява образи, които са сравнително стандартизирани. Истинското изкуство обаче се оказва голяма хапка за нея, дали защото няма милиарди гениални картини, от които да се учи, или по-скоро: понеже закономерностите там не могат да бъдат сведени до нещо толкова еднопластово.

След публикацията на Гудфелоу и колегите му GAN мрежите станаха популярно решение в света на машинното самообучение. Както често се случва в технологиите, трябваше да мине известно време, за да стане ясно кои са най-перспективните приложения.

GAN пейзажи

GAN мрежите успешно генерират и пейзажи.

 

Мрежи за невежи

Изображенията наистина са първото и очевидно приложение. И със сигурност голямата тръпка е в създаването на изкуство. Все пак, струва ми се, че сериозните пробиви в тази област все още не са налице. Правят се изложби с генерирано от GAN мрежи изкуство. Често се акцентира върху това, че на самата изложба се генерират автоматично изображения, които се показват само веднъж и после изчезват. И все пак, картините все още са далеч от убедителни, дали ще станат такива един ден, зависи от следващите стъпки на технологията.

Не по-малко интересни, а и доста по-успешни са други приложения, например в астрономията. Технологията се използва за обработката на космически изображения, например за симулиране на гравитационни влияния в изследването на тъмната материя. Помага и в други области на физиката, с помощта на GAN се симулират скъпи и сложни експерименти в света на елементарните частици.

В биологията пък вече повече от 5 години GAN помага за симулиране на клетъчните процеси и генерирането на лекарствени молекули, които могат да се използват в битката срещу рака.

 

GAN

GAN мрежите правят възможни всякакви преходи в изображенията. Например едно животно да се превърне в друго, или снимката да стане като пейзаж от Моне.

 

ПоGANци

Още през 2018-а беше предложена друга интересна идея: мрежите да се използват за това култовите компютърни игри с ниска резолюция от 90-те да се претворят в 4k зрелище с много повече реалистичност. Разбира се, това не е приложение, важно за човечеството, но пък доста полезно за многобройните фенове на жанра.

Отново в света на картинките, GAN мрежите правят възможно да се създават фотореалистични изображения, свързани с индустриалния дизайн, с обзавеждането, дори с модата. За да се създават много по-успешно реалистични прототипи, без да се губи време всеки от тях да бъде изработван.

Тези технологии се оказаха много подходящи и във фотографията. Фотошоп може и да промени завинаги отношението ни към обработката на снимките и това доколко те рисуват действителността. Но продължават да съществуват посоки, в които той е безсилен. И при това – не само що се отнася до увеличаването на малки по размер изображения, както това се случва с компютърните игри. Впечатляващи са прототипни проекти на GAN мрежи, които могат да възстановяват силно повредени кадри. Или пък да оцветяват свръхреалистично черно-бели кадри.

Също така – реалистично да превръщат снимките в картини в стила на определен художник и обратното: анимационни герои или картини да се превръщат в реалистични фотографии.

Любопитна идея: GAN моделът Speech2Face се опитва да пресъздаде лицето на даден човек, чувайки само неговия глас. Доста човешко, бих казал…

 

ПропаGANда

И ето че стигаме до тъмната страна от тази технология. За която, разбира се, вина няма нито самата тя, нито „добрият човек“, който ни я даде. Вече сме разказвали подробно за технологията дийп фейк, която днес може дори да възпламенява войни. Именно GAN мрежите се оказаха платформата, която осигури най-сериозен прогрес в тази посока. Тя обаче отвори много обществени, политически и психологически въпроси. Защото все по-съвършено можете да видите на видео как хора казват неща, които не биха и помислили. А какво остава за… реалистично порнографско съдържание, в което героите са съвършено заменени.

Сред другите потенциални проблеми е по-лесното създаване на фалшиви профили онлайн, благодарение на лицата на несъществуващи хора. На фона на другия риск обаче, този изглежда доста по-безобиден, най-малкото трудно може да се поддържа профил с повече от една снимка на съответния „човек“.

 

ВанGAN

Всеки, който има малко по-задълбочен интерес към програмирането и невронните мрежи, може да си „поиграе“ със собствен GAN. Тук например ще намерите моите експерименти за проста мрежа, чиято задача е да създава ръкописни цифри. Резултатът, като за скромните сили на компютъра ми, е всъщност доста приличен:

GAN за цифри

В света на задаващите се метавселени, много скоро всичко би трябвало да е по-виртуално и тук също се наместват GAN мрежите. Много от проектите залагат за създаването на среда от детайли, създадени от този тип технологии. Те са захранени с истински кадри, уловени с помощта на множество камери, подобно на Google StreetView. Същото важи и за все по-реалистичните аватари, с които всеки гостенин ще се олицетворява.

Какво ли следва нататък? Питайте някоя GAN мрежа, създадена, за да анализира прогнози за развития и събития на базата на историята. Какво, все още няма такъв проект? Може би просто никой не се е сетил… Както личи от проекта на Гудфелоу и колегите му, в света на изкуствения интелект далеч не всички добри идеи вече са измислени.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.

Най-нови публикации:

Впечатляващо признание за Дигитални истории от конкурса Web Report!

Впечатляващо признание за Дигитални истории от конкурса Web Report!

Впечатляващо признание за Дигитални истории дойде от 6-ото издание на журналистическия конкурс Web Report. През последните години надпреварата се утвърди като водещ и най-реномиран журналистически...

повече информация
„Не чуждиците подкопават устоите на езика“

„Не чуждиците подкопават устоите на езика“

„Как се пише?“ е сайт, който си извоюва огромно значение за живота онлайн. Създателката му Павлина Върбанова на доброволни начала дава практични съвети за правописа, граматиката и пунктуацията с...

повече информация

Още публикации по темата:

От рубриката:

На 10-ия ден Брандън създаде JavaScript…

На 10-ия ден Брандън създаде JavaScript…

Знаете, един митичен персонаж за седмица създаде света. Брандън Айк за малко повече време – 10 дни, създаде друг нов свят, в който всички живеем… JavaScript. Една технология, която промени ежедневието ни, след като позволи да се създават сложни приложения онлайн. Да отворим браузъра, да се насочим към любимата страница и тя да е способна на чудеса.
Ето поучителната приказка за това как човек, почти случайно попаднал в епицентъра на събитията, може да изгради нещо огромно. Как в технологично динамичните времена съдбата бързо променя избраниците си и с едно нейно мигване от герой можеш да се превърнеш в аутсайдер.
Кой ли е този Брандън Айк? Защо и той, подобно на други компютърни легенди, днес не се радва на особена слава? Как се ражда JavaScript и защо, уж толкова подобен на другите, именно този език успя да промени революционно начина, по който ползваме компютрите?
console.log(„Започваме!“);

повече информация
Универсален базов доход. Време ли е да ни дават пари, без да работим?

Универсален базов доход. Време ли е да ни дават пари, без да работим?

По всичко личи, технологиите ще ни освободят доста време, но как ще се промени обществото? Какво представлява прословутият универсален базов доход? Кои са големите аргументи за и против идеята всеки да получава гарантирани пари? Или пък решението на новите предизвикателства може да се окаже 4-дневната работна седмица?
Изкуственият интелект има силата да промени ежедневието на всички ни. Днес се разделяме в крайни мнения за това колко е напреднала технологията. И все пак, надали има спор, че тя вече има потенциала да обърне с главата надолу почти всички индустрии и поприща.
Дали ще вземе хляба на мнозина от нас? Сигурно е, че има силата да ни отмени в поредната порция задачи, вземайки на своя страна много нови дейности. Появяват се и нови роли, както е било винаги, но какво ще правим ако темпото, с което това се случва, изостане? Ще успеят ли и как обществата в развитите страни да реагират на новото предизвикателство?
Идва 1 май, празникът на труда. Трудът със сигурност е нещо, за което си струва да се замисляме по-често, особено по нашите ширини, където винаги сме имали малко по-философски поглед към темата. Дотолкова, че и труда празнуваме с ден почивка…

повече информация
Технологиите вече четат мисли. Идва ли краят на свободата?

Технологиите вече четат мисли. Идва ли краят на свободата?

Технологиите вече позволяват мозъчните сигнали да се „превеждат“ в четими данни, първите пробиви са налице. Улисани в напредъка на изкуствения интелект и прословутия GPT, може да пропуснем една огромна стъпка, що се отнася до естествения. На нея обръща внимание проф. Нита Фарахани, учен и юрист с огромен опит.
„Днес вече има компании, които са способни да декодират мозъчните вълни“, каза тя на световния форум в Давос в началото на годината.
Готови ли сме за момента, когато някой ще чете мислите ни? Ще доведе ли това до тотален контрол, или ще направи живота ни по-удобен и смислен?

повече информация

Най-новите:

„Май нихилизмът е заложен в генома ни?“

„Май нихилизмът е заложен в генома ни?“

Ивайло Кунев разказва вдъхновяващи истории от българското минало по магичен начин… Тогава как ли стигнахме до думите в заглавието?
Лидерите, хората, които умеят да променят света, да водят, да градят, да убеждават. Именно те са голямата тема на днешния ни гост, който повече от десетилетие разработва и води програми по лидерство.
Ивайло има впечатляващ мениджърски и предприемачески опит, минаващ през десетилетията. Като в същото време умее да разказва – историите му за силните личности привличат огромен брой почитатели. Автор е на книгата „Лидерите: забравените истории на България“.
Лидерството. Тази тема е толкова тежка по нашите ширини, а и като цяло във времената, в които живеем. Затова е време да потърсим трудните отговори.
Струва ли си да съберем историите на политиците, на предприемачите и на… хановете? Защо ни е трудно да формираме политически елит и да имаме автентични лидери като нация? Какво би написал Толкин, ако беше българин? Как българската история може да се превърне в лично приключение и да дава вдъхновяващи примери, които да ни помагат да сбъдваме мечтите си?

повече информация
Геният, който два пъти отрови света

Геният, който два пъти отрови света

Технологиите променят живота ни главоломно, а техните създатели – изобретателите, програмистите, са героите на днешния ден… Поне обикновено е така, докато не се окаже, че дадената иновация, която светът е посрещнал с невероятен ентусиазъм, е смъртоносно опасна.
И все пак, има един изобретател, който дълги години се носи на вълната на славата, тачен като гений, докато междувременно… създава не една, а две технологии, които впоследствие се оказва, че са стрували човешки животи. Щетите, които те са нанесли, засягат цялата планета и ще продължат да са тук дори за следващите поколения.
Историята на Томас Миджли-младши си струва да си припомняме всеки път, когато се зарадваме на поредния огромен пробив, свързан с изкуствения интелект или каквато и да било друга технология. Защото е показателна за това колко е важно да преценим рисковете, преди да полетим на крилете на ентусиазма. Колко е важно да мислим и обсъждаме големите въпроси, които ни поставят технологиите и за които все нямаме време…

повече информация
Впечатляващо признание за Дигитални истории от конкурса Web Report!

Впечатляващо признание за Дигитални истории от конкурса Web Report!

Впечатляващо признание за Дигитални истории дойде от 6-ото издание на журналистическия конкурс Web Report. През последните години надпреварата се утвърди като водещ и най-реномиран журналистически конкурс у нас.
Тази година Георги Караманев и Дигитални истории заслужиха наградата в категория „Изкуство и култура“ за  експеримента „Понякога ще идвам…“ Как ИИ нарисува 10 класически стиха?“. В 6-те категории на конкурса се включиха 185 журналисти. 
Наградата е особено признание и защото Дигитални истории е сред победителите за трета поредна година!

повече информация
Д-р Райчев, който даде Koprivshtitsa на Google

Д-р Райчев, който даде Koprivshtitsa на Google

„Хора като него трябва да са лицето на България. Точно хората, измислящи неща, които човек не може да си представи“ казва за днешния ни гост проф. Мартин Вечев.
Д-р Веселин Райчев е единственият българин, чиято докторска дисертация попада в световния топ 3 на годината за всички сфери на информатиката. При това с нея той създава цяло ново направление, което днес изживява бум – концепцията изкуственият интелект да пише компютърен код.
Той създава стартъпа DeepCode, използващ машинно самообучение, за да прави компютърните програми по-сигурни. Компанията е придобита от Snyk, а нашият гост остава начело на ИИ направлението в нея.
Кариерата му започва в Google, благодарение на него и днес Google Maps препоръчва пътя ни чрез алгоритми с български имена. През последните години е канен за професор в МИТ, Станфорд и други реномирани университети. Той обаче избира професионално да се свърже с българския проект ИНСАИТ, който има силата да промени цялата екосистема на нашата айти индустрия.
Какво ли мисли изследователят за последните големи новини от света на изкуствения интелект? Помага или пречи големият шум по темата и кои са важните решения, които е време да вземем? Защо дори отдалеч той не спира да се вълнува от случващото се у нас и какъв според него е пътят към по-доброто развитие на страната ни? Кое го кара да изостави впечатляващата кариера в Google, за да продължи в света на науката?

повече информация
Баща и син. Щафетата на живота

Баща и син. Щафетата на живота

Баща и порасналият му син, хванати за ръце. Зад тях е онова, което ги определя, а пред тях – обективът с безпощадната си прямота. Важните снимки нямат нужда от думи.
Тази Дигитална история е толкова голяма, колкото живота. Защото ни връща към най-естествения цикъл, дава ни проницателния си поглед към смисъла.
Фотографът Валерий Пощаров има двама синове – на 12 и 9 години. Една сутрин ги води към училище и се замисля как неусетно ще дойде моментът, когато те вече няма да искат да ги държи за ръка.
Така се ражда идеята да улавя в обектива си бащи и порасналите им синове, заобиколени от онази среда, която ги представя най-добре. Резултатът: снимки, които не просто разказват истории, а рисуват вселени…

повече информация
„Не чуждиците подкопават устоите на езика“

„Не чуждиците подкопават устоите на езика“

„Как се пише?“ е сайт, който си извоюва огромно значение за живота онлайн. Създателката му Павлина Върбанова на доброволни начала дава практични съвети за правописа, граматиката и пунктуацията с всичките им нюанси.
Разговорът с нея „Как се пише?“ „Незнам“ продължава да бъде най-четената дигитална история.
В навечерието на 24 май се срещаме, за да продължим. Ще поговорим за думите, които ни изграждат, и за отношението ни към тях.
За празника, за понякога фалшивата помпозност, която го съпровожда, и за честното ни отношение към езика. За това как думите са огледало на самите нас и на живота. За думите, които превръщаме в оръжия, и за технологиите, които им дават огромни сили да рушат.

повече информация
Share This