Тихо! Алгоритъмът сънува…

мар. 8, 2022 | Технологии

Тихо! Алгоритъмът сънува…

8 март 2022 | Технологии

Дълго ще се спори могат ли алгоритмите да създават изкуство. И докато спорим… ето го това изкуство.

Технологията Deep dreaming – „дълбокият сън“, ни издава какво виждат алгоритмите на изкуствения интелект, преди обективно „да си свършат работата“. И картината е магична, свръхреална, спокойно може да се припише на човешки артист. Защото надниква отвъд видимото, открива в снимките и картините свои шаблони, акценти и нюанси, образи, които вълнуват.

А нали тъкмо това е изкуството?

Пионерното технологично решение, което го наподобява… се ражда от кошмара на един програмист.

При това ни дава не просто изключително интересни изображения, но само ни помага да разберем по-добре една от най-нашумелите напоследък технологии. А дори… може за да окаже полезно средство, за да научим още и за самото човешко творчество, за начина на работа на мозъка ни, за отношението ни към Вселената.

 

 

Аз съм Сънчо

18 май 2015 г. Александър Мордвинцев не спи спокойно, върти се в леглото и изведнъж… усеща, че в дома му е влязъл неканен гост! Отскоро работи в „Гугъл“ и живее на квартира в Цюрих, там е с бременната си съпруга и 3-годишния им син. Александър се оттърсва от съня и…

Разбира, че усещането е било кошмар, за щастие няма крадци. Но вече се е разсънил, не иска да буди семейството си и сяда зад компютъра, за да поработи. Замисля се: а как ли сънуват невронните мрежи?

Мордвинцев пуска в ход идеята, която му се е присънила преди малко… и го среща първата впечатляваща картина. Променя малко параметрите и отново е изумен. Вижда как на алгоритъма също „му се присънват“ изключително интересни образи.

Картина, като от LSD „пътешествие“, само че произведена не от халюциногени. А от алгоритми.

 

Deep dreaming

 

Понякога ще идвам във съня ти

В 2,32 ч Мордвинцев пуска видяното във вътрешната мрежа на тогавашния „Гугъл плюс“ за служителите на компанията. „Не съм сигурен дали наистина беше добра идея да изпробвам дълбока невронна мрежа в 2 часа“, пише той. И добавя: „Как да спя оттук нататък?…“

Това изображение се оказва първото в цялото научно направление „дийп дрийминг“. То ни показва как сладкото котенце се превръща в зловещо същество, като че ли излязло от халюциногенен сън. Първият „дълбок сън“ остава в историята с тематичното име „звярът от кошмара“.

Слънцето никога не залязва над инженерните центрове на „Гугъл“, снимката бързо привлича погледите на впечатлени колеги от другия край на планетата. След секунда идва първият лайк, гарниран с коментара „Очите ми! Очите ми!“. За нула време получава повече от 100 коментара, казват му, че видяното напомня книгите на Лъвкрафт и Мордвинцев е отприщил тъмните сили.

Колелото се завърта и след броени дни, на 17 юни 2015 г. „дийп дрийминг“ стига до света.

 

Александър Мордвинцев

Така изглежда самият Мордвинцев по времето, когато създава алгоритъма.

 

Сън сънуваш, ой нерадост, опустяла младост

Това, което е хрумнало на Мордвинцев, е много малка, но гениална идея, която позволява да се родят изображенията, които виждате.

Дълбоките невронни мрежи са висшият пилотаж в областта на изкуствения интелект. Първоначално го свързвахме с машинното самообучение, а после се оказа, че то е само първата стъпка. Че алгоритмите му могат да бъдат „впрегнати“ в значително по-мощни структури, в които работят един до друг в слоеве, понякога „пържейки“ видеокарти, за да се допълват. Всичко това направи възможен напредъка, който днес виждаме в толкова много направления.

И ето, оказа се също, че тъкмо тези супермощни комбинации от алгоритми… могат да сънуват. Това ни показа несъстоялият се сън на Мордвинцев.

По това време е наскоро назначен служител на „Гугъл“. Въпреки че иска да се занимава с дълбоки невронни мрежи, работодателите му преценяват, че в екипите, които се занимават с това, има много хора, а той ще е по-полезен в проекта SafeSearch, чиято цел е да филтрира резултатите от търсенията за порнографско съдържание.

 

Александър Мордвинцев

Мордвинцев в едно от първите подобни изображения

 

Маншон, Полуобувка и Мъхеста брада

В „Гугъл“ обаче имат оригиналната практика да позволяват на служителите си един ден в седмицата да работят по друг проект на компанията и Мордвинцев, разбира се, се насочва към любимата си тема.

Именно тя е в главата му и в онази нощ на знаменитото откритие. Той обаче знае, че няма достатъчно опит, за да развие идеята, затова в работата се включват двама негови колеги от „Гугъл“, впечатлени от поста му. 22-годишният тогава Крис Ола е още стажант в компанията, дошъл като млад талант. Спечелил е стипендията „20 под 20“, която му дава средства, за да изостави университета и да се насочи към работата.

Тройката допълва Майк Тика от офиса на „Гугъл“ в Сиатъл. Той пък има дълги години като биохимик, преди да се насочи към компютърните науки. Занимава се с тези технологии на изкуственияа интелект, които ще помогнат в разработката на нови лекарства. Но освен това е човек на изкуството – има авторски изложби като скулптор, произведенията му са вдъхновени от биохимичната му работа.

Тримата не се срещат нито веднъж на живо, но само за месец успяват да подготвят знаменития блогпост, в който показват на света изкуството на алгоритъма. Първо се чудят дали да не го направят под формата на научна публикация, но решават, че по-важно е идеята да стигне бързо до повече хора.

 

Deep dreaming

Някои от образите, „измислени“ от алгоритъма в оригиналния блогпост.

 

Тройка на разсъмване

В снимките, обработени от тримата чрез дийп дрийминг, планините се превръщат в пагоди, листата стават птици. В чистите фонове се появяват изящни ангели и зловещи демони. Крис Ола вижда и нови животни, нарича ги прасеохлюв, камилориба, птицокуче.

Първоначално наричат направление „интерсепционизъм“ – игра на думи със заглавието на фирма „Генезис“ (Inception) и думата за прекъсване – “interception”. В „Гугъл“ обаче се оказва, че вече има проект с това име, така се стига до промяна в названието и идва „дълбокото сънуване“.

А това название може би звучи метафорично, но е доста близо до действителността. Дълбоките невронни мрежи по същество представляват поредица от слоеве алгоритми, които анализират подадената информация. Накрая, на базата на прецизен анализ, връщат отговори. Например, способни са да определят кой е човекът на снимката.

Неслучайно се наричат „невронни мрежи“ – начинът им на обработка прилича на това, което се случва в мозъка ни. Всеки слой получава информацията от предходния и я предава нататък, оценявайки различни нейни параметри. Накрая идва последният слой, който трябва просто да изведе оценката, да направи класификацията на базата на всичко дотук.

 

 

Сънят безкрай, когато се измъкнеш

В случая се използват конволюционните невронни мрежи, чиято задача е да обработват изображения. Картинките биват превърнати в компютърен код и „неврончетата“ започват да ги обработват, търсейки закономерности. Често задачата им е да направят класификация – например да могат да преценяват какво е изображението на снимката – дали е човек или хамстер.

За да се случи това, те трябва да бъдат тренирани с огромен обем данни, на базата на които да настроят фините си параметри. И след това са готови за работа – можете да им изпратите снимка и те с изумително голям процент точност да познаят какво има на нея.

Само че доскоро оставаше енигма точният им начин на работа, това, което се случва в самата комуникация между слоевете. Именно тук се включи концепцията за „дийп дрийминг“. Идеята на Мордвинцев е да се усилят онези параметри, които алгоритъмът е преценил като важни, и да се визуализират, преди да се осъществи самата класификация.

Невронните мрежи през последните години се доказват като изключително успешно решение, например в лицевото разпознаване или обработката на естествени езици, но истината е, че до момента не знаем точно какво се случва в тях. Целта на Мордвинцев е да „надникне в мозъка“, да види как работи мрежата. Именно това успява да постигне. Макар и да не предполага, че то ще се изразява в съновиденията – мечти и кошмари, които виждате.

 

От сън спомен не остава

Мордвинцев прекъсва работата на конволюционната невронна мрежа, преди да е дала резултата си и ни показва какво вижда тя в обработката си до момента. След това той подсилва някои от входните параметри, за да се откроят нещата, които са я впечатлили.

С други думи, Мордвинцев просто променя задачата на мрежата – от това да ни каже какво има на една снимка към това да генерира нещо, което може би не съществува на нея. Доста различна парадигма…

Ако това се случи в първите слоеве, се забелязват само някакви по-общи щрихи – форми, цветове. Колкото по-„навътре“ се отива, толкова по-сложни стават обектите. Виждаме как мрежата откроява очи, форми. Първите слоеве засичат текстури, после фигури и накрая обекти.

 

Deep dreaming

Понякога малки настройки на алгоритъма създават съвсем различно изображение.

 

Бродница сънна в бездънна гора

Именно малко преди края на работата ѝ се появяват и най-зрелищните изображения, тези, които напомнят халюциногенни картини.

Сходството с тях съвсем не е случайно. Карл Фринстън, професор по невронауки от Лондон казва, че тези изображения „много точно показват нещо, което си представяме като резултат на психеделици или по време на халюцинация и това е напълно осезаемо“.

Метафората със съня в названието на технологията е прецизно насочена. Красивите или страшни картини, които виждаме, докато сме в покой и мозъкът ни обработва случилото се през последния ден, очевидно дори и визуално напомнят това, което „минава“ през слоевете на невронната мрежа.

 

 

Lucy in the Sky With Diamonds

Доста добро обяснение дава колегата на Мордвинцев Крис Тика. „Има дълбока връзка между начина, по който работят визуалните невронни мрежи и мозъкът ни. Ето защо според мен не е учудващо, че се забелязват сходни резултати. Ако използвате например химически стимуланти, това обърква невроните и предаването на синаптичните сигнали, получавате странни свръхинтерпретации и изкривявания. Мисля, че тук имаме пълна аналогия. Смятам, че изследването на невронните мрежи може наистина да ни помогне да разбираме по-добре и биологичните“.

Нашите мозъци „приютяват“ около 100 милиарда неврони, свързани с все още недокрай изучените 100 трилиона връзки. И, видим ли нещо, работят на сходен принцип. Имаме първоначална обработка на информацията във визуалния кортекс, който идентифицира линиите и ъглите. После данните отиват в частите от мозъка, които изпълват смисъла с образи – лица, очи, ръце. Накрая имаме оценката, която минава и през спомените и езиковите ни знания, за да определим какво виждаме.

При невронните мрежи принципите са сходни. Да, като обеми на връзките те все още са далеч от нашите показателите, по-близки са до доста по-ранни еволюционно форми на живот. Но бързо крачат напред. И освен това, в някои области се оказва, че вече „работят“ по-добре от човешкия мозък.

 

 

Спи градът в безшумните тъми

В първите дни след появата си, темата се превръща в хит. Всеки може да си поиграе със свои изображения, да се позабавлява със зловещите очички, които се появяват на портрета на тъщата… после, както с всеки хит, интересът позалязва. Обективно обаче дийп дрийминг навлиза сериозно като направление в областта на невронните мрежи и в близките години със сигурност ни очакват още интересни резултати.

Все повече се налага и като решение тогава, когато трябва да се оцени дали една невронна мрежа работи добре, дали архитектурата ѝ е правилна.

В началото тримата от „Гугъл“ използват вече тренирана невронна мрежа с често използваната в тази сфера колекция от данни ImageNet. Тя включва 1,2 млн. изображения с 1000 класа, цели 118 от които са породи кучета. Разбира се, това си личи и в самите изображения. По-късно идеята е приложена върху най-различни колекции и невронни мрежи. Дори и при такива, работещи с текст.

А за учените в тази сфера е важно и как точно изглежда обработката, това им дава много информация как и защо „вижда“ алгоритъмът. По какво се отличава от начина на работа на мозъка ни и по какво си прилича.

Например: често на изображенията от дълбокото сънуване се показват гирички. Човек би предположил, че за „компютърния мозък“ това ще са предмети с метален вид, издължени, в средата по-тънки и с широки тежести в края. Оказва се обаче, че по-скоро се открояват метални предмети, които са свързани задължително с човешка ръка.

Дийп дрийминг започва да генерира впечатления и интересни изображения дори ако му се подаде едноцветен кадър, случаен шум или еднообразна текстура. А дали… това не е начинът, по който работи въображението и на хората? По който всички ние мечтаем?

 

 

Сън ли, C

Откритието отваря много технологични, но и философски врати. Може би генерирането на образи с невронни мрежи може да промени представите ни за човешкото възприятие и творчеството.

Днес и тримата герои продължават да работят в „Гугъл“. Малко след откритието си Мордвинцев е прехвърлен в мечтания екип, където се занимава с лицево разпознаване. После се специализира в търсенето на още и още алгоритми, които са свързани с генерирането на изкуство, някои от тях също са впечатляващи. През 2021-а – 6 години след „кошмарната нощ“, той се зае по своеобразен начин да пресъздаде отново алгоритъма.

Идеята му идва, след като искат от него изображение, което да бъде включено в колекцията K21, събираща „изкуството на следващите 100 години“. Мордвинцев иска да пусне първоначалния си код, тогава е написал едва 30-ина реда, които са свършили цялата работа. Те обаче „не палят“, тъй като използват много външни библиотеки, които междувременно са променени. Затова програмистът се заема да напише всичко отначало. Избира класическия език C. Новият базов алгоритъм е вече от 1000 реда код, и, както казва създателят му, не зависи от никакви външни фактори. Ще може да се подкара винаги, докато C върви поне на един компютър.

Тематично тази програма – наречена deepdream.c, е продадена под формата на незаменяеми токени – NFT.

 

 

Сладки сънища

И така, дали това е изкуство? Нещо, създадено от нищо? Нещо, видяно и разтълкувано?

Както казва колегата на Мордвинцев Майк Тика, „ако мислим за човешката креативност, един малък компонент от нея е умението да събираш впечатления и да ги рекомбинираш по интересни, неочаквани начини. Яко е да видиш компютрите да забелязват неочаквани неща, които на хората не биха им хрумнали“.

Даваме думата и на Мордвинцев. „Мисля, че Пикасо е казал: „Аз никога не съм правил изкуство, аз правя само проучвания“. Разбира се, това е прекалено опростено. Учените трябва да цитират източниците си и да обясняват как ги използват. Да отделят време, за да покажат това, което правят, в рамките на нещата, които някой е направил преди тях. В изкуството не е така. Освен това, за мен произведение на изкуството е и малкото парченце код, което качих някога в Github. Кодът винаги е бил моето изкуство. Кодът е моята четка за рисуване“.

 

Deep dreaming

Пчелата, кацнала на слънчоглед се превръща в тази картина

 

Над сънния Люлин, прибулен

Тук можете да видите GitHub хранилището, където и аз си „поиграх“ с дълбокото сънуване за някои от изображенията, които виждате. А ако се увличате от компютърния код, можете да използвате този, за да се позабавлявате и вие, не е нужен някакъв кой знае колко специфичен софтуер.

А дори изобщо да не се занимавате с програмиране, пак можете да поекспериментирате тук. Ще се радвам после да споделите резултата.

Изкуственият интелект ще продължава да е магия или просто мошеничество в ежедневието ни. В негово лице имаме все по-мощно оръжие, което тепърва се учим да използваме. Но, както си личи от дълбокото сънуване, понякога просто една добра идея може да покаже как ръка за ръка човекът и алгоритъмът са способни да създават изкуство. Да създават своеобразна красота… а, както помним от добрия стар сънародник на Мордвинцев, тъкмо тя и никой друг ще спаси света.

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

Дете или ИИ? Успяха ли 4000 души да различат автора?

Дете или ИИ? Успяха ли 4000 души да различат автора?

Детска рисунка или ИИ? Експериментът привлече огромен интерес. В теста дали ще различим 15 рисунки на деца под 11 г. от 15 изображения, създадени от изкуствения интелект, се включиха почти 4000...

повече информация
Грешки (не)човешки

Грешки (не)човешки

Статията се препубликува от Тоест. Тя е част от рубриката Порция език и е подготвена съвместно с Павлина Върбанова.   Има ли грешка, има и прощка. Ако сте открили нещо нередно тук, значи и вие...

повече информация
Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да...

повече информация

Още публикации по темата:

От рубриката:

Дете или ИИ? Успяха ли 4000 души да различат автора?

Дете или ИИ? Успяха ли 4000 души да различат автора?

Експериментът „Детска рисунка или ИИ?“ привлече огромен интерес! За месец и половина въпросникът, в който се опитваме да различим 15 истински рисунки на деца под 11 г. от изображения, създадени от изкуствения интелект, беше попълнен от почти 4000 души! Време е да обобщим резултатите. Успяхме ли да се справим с предизвикателството? Истинските или генерираните рисунки се оказаха по-лесни за разпознаване? Трудна ли се оказа задачата, или почти всеки успя да познае и 30-те възможности? Дали самите деца се оказаха по-точни в преценката си? Защо изводите са важни? Време е за прелюбопитните изводи.

повече информация
Грешки (не)човешки

Грешки (не)човешки

Във времената, когато все по-малко медии и дори издателства се доверяват на специалисти, които да следят за правописа, дали пък изкуственият интелект (ИИ) няма да се окаже полезен помощник? Време е за един показателен правописен експеримент с участието на някои от най-мощните съвременни модели.
Всички (надяваме се) вярваме, че по правописа, а не по дрехите днес посрещат онлайн. В технологичната епоха общуваме все по-често чрез писмени текстове и начинът, по който го правим, определено издава толкова много на събеседника. Може ли ИИ да ни помогне да пишем грамотно?

повече информация
Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

6 аудиозаписа, в които е произнeсена кратка фраза. Някои от тях са генерирани от ИИ, другите са истински човешки гласове. Ще ги различите ли?
Включете се до 1 август 2025 г. и при 6 правилни отговора участвате в жребия за скромен подарък.
Ще познаете ли кой глас е на човек и кой – на машина? Ръкавицата е хвърлена!

повече информация

Най-новите:

Дете или ИИ? Успяха ли 4000 души да различат автора?

Дете или ИИ? Успяха ли 4000 души да различат автора?

Експериментът „Детска рисунка или ИИ?“ привлече огромен интерес! За месец и половина въпросникът, в който се опитваме да различим 15 истински рисунки на деца под 11 г. от изображения, създадени от изкуствения интелект, беше попълнен от почти 4000 души! Време е да обобщим резултатите. Успяхме ли да се справим с предизвикателството? Истинските или генерираните рисунки се оказаха по-лесни за разпознаване? Трудна ли се оказа задачата, или почти всеки успя да познае и 30-те възможности? Дали самите деца се оказаха по-точни в преценката си? Защо изводите са важни? Време е за прелюбопитните изводи.

повече информация
Грешки (не)човешки

Грешки (не)човешки

Във времената, когато все по-малко медии и дори издателства се доверяват на специалисти, които да следят за правописа, дали пък изкуственият интелект (ИИ) няма да се окаже полезен помощник? Време е за един показателен правописен експеримент с участието на някои от най-мощните съвременни модели.
Всички (надяваме се) вярваме, че по правописа, а не по дрехите днес посрещат онлайн. В технологичната епоха общуваме все по-често чрез писмени текстове и начинът, по който го правим, определено издава толкова много на събеседника. Може ли ИИ да ни помогне да пишем грамотно?

повече информация
Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

6 аудиозаписа, в които е произнeсена кратка фраза. Някои от тях са генерирани от ИИ, другите са истински човешки гласове. Ще ги различите ли?
Включете се до 1 август 2025 г. и при 6 правилни отговора участвате в жребия за скромен подарък.
Ще познаете ли кой глас е на човек и кой – на машина? Ръкавицата е хвърлена!

повече информация
Кой говори – човек или алгоритъм?

Кой говори – човек или алгоритъм?

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!
Време е за една звучна Дигитална история. А какво предизвикателство ви очаква след това…

повече информация
Колко изкара ИИ на матура?

Колко изкара ИИ на матура?

Какво ще стане, ако изпитаме на матурата по български език и литература три от най-мощните модели изкуствен интелект? Усилията им ще оценят двама опитни проверители на истинските зрелостни изпити. За да е състезанието още по-оспорвано и показателно, включваме двама реални зрелостници и мен, автора на тези редове.
Ще изкарат ли пълни шестици ChatGPT, Claude и Gemini, или ще се провалят с гръм и трясък?
Ще разпознаят ли учителите коя от работите е на изкуствен интелект и коя – на човек?
Кой ще получи най-високата и кой – най-ниската оценка?
Какво ще ни кажат резултатите и за най-показателния изпит в българското образование, и за напредъка на алгоритмите, и за големите въпроси, с които идват новите технологии?

повече информация
„Хайде да спрем да се подценяваме!“

„Хайде да спрем да се подценяваме!“

Как да сме по-щастливи като общество? Как да изведем на следващо ниво ИТ сектора в България?
Седнали двама програмисти да си говорят за счупения обществен разговор, за разделението, за пътя на успеха. Звучи като начало на виц, а се получи сериозно и замислящо интервю в подкаста на DEV.BG. Думите, които разменихме, ми се сториха толкова важни, че ще ви ги представя и тук.
Веско Колев е начело на Icanpreneur – стартъп, който помага на повече ИТ компании да създадат работещ продукт. Има богат опит в софтуерния свят и особено интересни наблюдения, с които ще се срещнем днес.
Защо и как е време отново да започнем не само да се слушаме, но и да си говорим, дори когато ни разделя актуалният спор на деня? Защо е изграждащо и осмислящо честото „настъпване на мотиката“ и си струва да се радваме, когато детето ни получи слаба оценка? Какво ни е нужно като общество, за да вървим заедно напред, и то в епохата на напредналия изкуствен интелект?

повече информация
Share This