DALL·E, нарисувай ми овца!

май 27, 2022 | Технологии

DALL·E, нарисувай ми овца!

27 май 2022 | Технологии

„Бихте ли ми нарисували купа със супа, в която като че ли има чудовище от вълна?“

Хващам се на бас, че с такава странна заявка не могат да се справят повечето добри художници и фотографи. Като го чуя, и аз не мога да си представя нищо, което да прилича на нещо подобно. Далѝ обаче си представя много интересна картинка:

 

 

Този артист определено си заслужава уважението, затова нататък ще се погрижим да изписваме правилно името му. Защото DALL·E може да няма засукания мустак и ексцентричността на на адаша си Салвадор, но прави вълнуващи неща. Той е алгоритъм, който с помощта на изкуствения интелект превръща описанието в изображение. При това само колко точно!

„Нарисувай ми овца“, казва малко момче със златни коси на пилот, озовал се сред знойните хълмове на Сахара. Какво се случва нататък, знаем всичко, но отговорът на пилота е красиво детски.

Всичко друго освен детски са отговорите на DALL·E. Името му се изписва като на дете на Мъск, то идва от асоциацията с адаша му художник и анимационния герой – роботчето на „Пиксар“ WALL·E. От първите дни на май тази година алгоритъмът привлече вниманието на хората, които се интересуват от изкуствения интелект, със зашеметяващи примери.

 

Плюшени мечета работят по ново изследване на ИИ под вода с технологии от 90-те.

 

А дали е така кой ще ми каже?

DALL·E е доста активен онлайн. Даже редовно публикува новите си произведения в инстаграм.

След като миналата година първата версия на проекта загатна за впечатляващите му перспективи, вторият му версия дойде не само за да покаже, че алгоритмите са способни да творят. Но и много по-важни неща за възможностите им.

Проектът е дело на една от двете най-мащабни групи учени днес, които работят в областта на висшия пилотаж, свързан с разработката на изкуствен интелект. OpenAI е компанията, подкрепяна от Мъск срещу големия конкурент на Google, която създаде технологията GPT-3. Именно тази, най-впечатляваща до момента, предварително тренирана невронна мрежа се крие и зад проекта за електронния художник.

Нашият герой определено се смята за сериозен пробив в своята област. Както си струва отново да споменем, днес алгоритмите на изкуствения интелект са особено силни тогава, когато имат една от следните две задачи: на базата на обработката на огромен обем информация да предположат каква ще е следващата единица, която се зададе, или пък да успеят да я класифицират. Те се справят все по-впечатляващо в някои от посоките, в които очакваме чудеса, като например лицевото разпознаване, в други изостават, но като цяло продължават да се развиват в рамките на тези си основни роли.

 

Астронавт на кон във фотореалистичен стил.

 

Дали вали

Докато нашият нов приятел DALL·E променя парадигмата. Той анализира връзките между човешкия говор и изображенията. И в резултат създава неочаквани, понякога впечатляващи с майсторството си картини.

И пак стигаме до големия въпрос. Можем ли да ги наречем изкуство?

Наистина е изумително. Нека опитаме пак.

Някой: Уважаеми DALL·E, хайде да вземеш да ни нарисуваш плюшени мечета, които смесват бълбукащи химикали като луди учени от 90-тарско съботно анимационно шоу…

DALL·E:

 

Точно така, можем да му кажем не само какво искаме да видим, но и в каква стилистика. Имаме възможността да му описваме и обясняваме и той ще даде всичко от себе си, за да изпълни задачата. При това, давайки ни много възможни решения, от които да си изберем

Е, понякога резултатите може и да приличат, що се отнася до реалистичността, на тези от творчеството на адаша му. Не е случайно, че за момента алгоритъмът все още не е пуснат за свободна „проверка“. За да го изпиташ сам, се записваш в листа на чакащите (можете да сте сигурни, че съм там от първия момент, в който чух за него. Ако решите, опитайте и вие тук). Но това е стандартен подход в света на изкуствения интелект, където нещата са все още доста неясни и не винаги контролируеми. Понякога опитът да наподобим естествения интелект води дотам, че успяваме да извадим на преден план най-грозните му страни.

 

 

Куче влачи рейс, диря няма

Обещавам, именно това ще гласи първата задача, която мисля да му дам, стискайте палци да ми дойде редът, после ще споделя резултата!

Но междувременно, извън шегите, си струва да споменем още за достойнствата на DALL·E.

Както стана дума, новата версия на твореца използва алгоритъма GPT-3. Трениран е с помощта на 650 милиона изображения и текстовете към тях, търсейки закономерностите.

Именно в това е и нестандартният му успех. Той показва, че ИИ може да се окаже изненадващо силен, ако му покажем различни закономерности, а не просто го вкараме в руслото да класифицира или предсказва. А това е твърде вероятно да се окаже пътят по създаването на генералния изкуствен интелект. Следващото поколение алгоритъм, което пък ще може с помощта на една и съща програма да решава различни задачи.

А всичко това ни води все по-напред по пътя към машината, по-„умна“ от човека.

 

Страница на паспорт, пълна с печати от извънземни светове.

 

Бу-Дали

Дотам, разбира се, има много стъпки и никак не е сигурно, че криволичещата пътека няма да се изгуби. И все пак, успехът на DALL·E е впечатляващ.

Нека се разходим сред изложбата на електронния майстор. Той умее не само да генерира изцяло нова картина или фотография. Способен и на ретуширане. Казвате му да добави едно пате някъде насред хаоса и той му намира място.

 

 

После е способен да ви предлага различни варианти. Без да съм специалист в тази област, но… забелязвате ли как се справя алгоритъмът със светлосенките? Дори да отнесе известни критики от баш майсторите, със сигурност спестява доста работа на хората, които се занимават с ретуширане.

Поне му казваха „ретуширане“, преди годините на „Фотошоп“. После спряхме да бъдем толкова убедени във всичко, което виждаме на картинка… Уви, не спряхме, а трябваше. И днес често сме твърде лесно убеждавани, а фотоманипулацията наистина може да бъде съвършена, по пътя ѝ върви и видеото.

А какво ще стане, когато обаче алгоритъмът започне да се справя сам? И ако допълним това със задаващия се генерален ИИ, способен да изпълнява различни задачи…

DALL·E 2 много добре разбира какво ще рече „стил“. Ако му кажете какво да нарисува, ще прояви повече творчество, давайки ви доста разнообразни варианти, но ограничите ли го до епоха, направление или излъчване, ще се опита да ви помогне в зададените рамки.

 

Тигър, който с притеснение очаква часа си при зъболекаря, стил дигитално изкуство.

 

А дано, ама надали

Е, по модерна американска традиция, обвиняват го в това, че изпълнява задачите, като рисува основно лица на бели мъже. От гледната точка на бял мъж съм склонен да подкрепя атаките, също и от другата страна, срещу това, че рядко рисува голи тела.

Но всичко това се пристрастия, а в света на изкуствения интелект те, наричани по-често с англоезичния термин “bias”, са често смятани за най-сериозния проблем. Показателите, в които алгоритъмът може да се отклони от задачата си по някакви субективни причини.

DALL·E очевидно е склонен да го прави, заради което тестването му е ограничено, а и има безброй уговорки в тази посока. И в този смисъл той е доста симпатичен, покрива повече от критериите за твореца… който май по дефиниция е субективен. И си оправдава названието, което задължава към дадена самобитност.

Даже му подготвят и своеобразна цензура. Част от специалистите, работили по него, настояват да не му бъде дадена изобщо възможност да генерира лица (защото, когато му казват да нарисува затворник или ядосан човек, винаги връщал цветнокожи).

DALL·E обаче не е виновен, а е способен на впечатляващи резултати. И преди да го насочим към еротичния жанр (защо ли), бързам да ви кажа, че създателите му са цензурирали при обучението му всякакви по-пиперливи изображения. Така че ако му зададете горещ сюжет, може да ви покаже чук вместо действието, с което го свързваме вербално.

 

Ленивец в смокинг, който яде чийзбургер, докато кара колело с една гума във футуристичен град, дигитално изкуство.

 

Хляб и зрелища

Всяко от изображенията, които му се подават, минава през сериозен филтър, така че да няма и политически символи, и всички онези послания, които днес не се приемат за подходящи. Като знаем колко добре се справят с този филтър днес социалните мрежи, остава да допуснем колко подходяща идея е подобен подход да приложим и към следващите поколения алгоритми.

Той разчита на съвършените описания на кадрите, за да се опитва да намери взаимовръзките. За да си върши работата, алгоритъмът получава успоредно изображенията и текста, кодирани в знаци. Докато се тренира с помощта на огромния брой кадри, той открива закономерностите в описанията. И се опитва да ги претвори на практика след това, по зададените от потребителя рамки.

 

Хипопотам учен изследва проба под микроскоп.

 

Освен да помага на хората да се изразяват визуално, другата голяма цел на нашия приятел е да ни даде повече знание за това как ИИ възприема и обработва информацията. Както подробно стана дума в материала за
зрелищните сънища на алгоритмите, ние все още знаем прекалено малко за това, което се случва между подадената информация и крайния резултат.

Мнозина виждат още едно бъдещо приложение: DALL·E може да се окаже дългоочакваното средство, което да превърне в действителност прословутата значително по-съвършена и реалистична метавселена. Днешните решения според първите ѝ потребители са доста несъвършени, докато следващите версии на програмата – поръчков художник, могат да помогнат сериозно новият виртуален свят не само да е реалистичен, но и да се създава бързо и евтино.

 

Една и съща задача, изпълнена от DALL·E1 и DALL·E2.

 

Взели Дали

През февруари, преди пускането на алгоритъма, в екипа бяха привлечени 23-ма външни изследователи в т. нар. „червен екип“. Учени със сериозен опит в областта на машинното самообучение, които да проверяват за всякакви възможни пропуски и потенциални проблеми. Именно от тях е дошло предложението първоначално проектът да попадне само в ръцете на избрани люде. До момента този късмет са имали 400 души, основно служители на и OpenAI, подбрани творци и учени.

Според хора от „червения екип“ нашият приятел не е достатъчно способен да рисува реалистични лица. Е, и истинският Дали не е силен в лизата.

Още критики идват за това, че алгоритъмът просто прави това, на което е способен всеки средно добър майстор на „Фотошоп“ с повечко въображение.

Но пък е алгоритъм, нали? В която и да било област дефиницията „прави това, което всеки“… е знак, че тази професия си отива.

Освен това е зависим от това, което му се подаде. Колкото по-оригинална задача му поставите, толкова по-неочаквано изображение ще получите в замяна. Не е ли това дълго чаканата форма на симбиоза, що се отнася до креативността?

 

Купа със супа, която е портал към други измерения.

 

Imagine all the AI…

И ето че този журналистически материал едва беше подготвен за публикуване, когато се оказа, че нашият приятел вече… не е сам! Заформя се компания от ИИ художници, като нищо ще оформят и художническа школа, подобна на импресионистите.

По-скоро обаче се заформя конкуренция, защото Imagen е „отроче“ на другите най-големи днес в света на изкуствения интелект – Google. Този художник е способен на доста сходни задачи, но… определено има доста различен стил на изразяване.

Ето примери и от неговото творчество:

 

Двойка роботи на романтична вечеря пред Айфеловата кула.

 

Мраморна статуя на коала диджей.

 

Много ще е интересно ако един ден имаме възможност със свободен достъп да проверим как биха реагирали на едни и същи оригинални задачи двата алгоритъма. Дали ако разликата е сериозна, това няма да е още един аргумент да говорим за… творчество?!

 

Бори се, Дали!

Изображенията определено привлякоха вниманието и не е случайно, че напредъкът е постигнат едновременно от няколко проекта. Немалко мнения скептични, защото малко хора имат достъп до алгоритмите и могат да ги изпитат. Значи се подбират само най-добрите резултати, показват ни се само картините, които са се получили… А не правеха ли същото и хората художници?

„DALL·E е удобен помощник, който подсилва онова, което хората сами могат. Но е и силно зависим от въображението на хората, които го ползват. Творците, артистите, с негова помощ могат да създадат неочаквани резултати“, казва Адитя Рамеш, един от водещите инженери на проекта.

Последното сериозно умение на DALL·E наистина се оказват вариациите. Обратното на основната му задача, не да му поръчате рисунка и да я получите, а да му дадете картина, от която да се вдъхнови. И да създаде подобна по свое усмотрение

С това май вече не би могъл да се справи и адашът му.

А какво ще стане, когато пуснем и рекламистите, маркетолозите, инфлуенсърите? „DALL·E, знам, че си творец, ама направи ми реклама за…“? Всеки творец от модерното време знае колко ще му е неприятно на електронния колега.

И ето че след броени дни ще научим още по темата, като поговорим с един от доказаните български фотографи, който има шанса да изпробва (и покаже) невероятните възможности точно на тези алгоритми!

„DALL·E, нарисувай ми овца!“ Обещавам ви, ако имам шанса, ще го помоля и за това.

Скоро очаквайте и още една, само че не толкова дигитална история – на човека, написал оригинала на тази реплика – Антоан дьо Сент-Екзюпери. След това – текст и за генералния изкуствен интелект. Ех, няма ли да е хубав животът, да е доста по-шарено бъдещето на човечеството, ако успеем да ги срещнем…!

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
„Дигитални истории“ сборник

Най-нови публикации:

IT, любов и боровинки

IT, любов и боровинки

– Имам една мечта… – започва, леко неуверен Нено. Двамата с Криси са се качили на хълма с внушителната панорама към Долината на розите и бъдещата ферма. – Да гледам боровинки. Ще бъдеш ли до мен? –...

повече информация
„Хората си оставаме същества, за които е важно да притежават“

„Хората си оставаме същества, за които е важно да притежават“

Проф. дфн Стоян Ставру е способен да се вглъби в материя, която най-често смятаме за скучна, за да я изпълни със смисъл, да разкаже достъпно и атрактивно, да намери неочакван поглед към теми, важни...

повече информация
FM-2030. Той не умира

FM-2030. Той не умира

Наляво или надясно? Нагоре! Той вярваше, че когато дойде 2030 г., ще се пробуди от ледовете, за да отпразнува 100-годишния си юбилей. Беше убеден, че по това време ще сме стигнали небесата, ще сме...

повече информация

Още публикации по темата:

От рубриката:

Идва ли Фройд на дигиталната ера?

Идва ли Фройд на дигиталната ера?

Дори да си много жаден, няма как да пиеш от пожарникарския маркуч. Ако не вярвате, опитайте.
Същото е и с технологиите. Вкарваме ги безогледно във все повече области от ежедневието си, даваме им нови и нови роли, докато неочаквано се озоваваме приковани като Прометей за екраните.
Информационните технологии са огромна възможност. Дозата прави лекарството, но… каква е дозата? Отговора на този въпрос ще потърсим, заедно с още един – кога ще се появи и кой ще е Фройд на новото време? Човекът, който ще вникне в психологическите предизвикателства за хомо сапиенс в зенита на технологичната революция. Фройд, който ще премахне табутата и ще осмисли връзката между човека и информационните технологии.

повече информация
Блокчейн демокрация

Блокчейн демокрация

Напоследък говорим все за изкуствения интелект, а друго от големите технологични направления се развива в сянка… Блокчейн ли е следващата стъпка по пътя на общественото устройство? И как тази идея е свързана с древните оракули?
Технологиите променят огромна част от живота ни. Същевременно в някои области те остават встрани, така и не успяват да наваксат. Ясно е, че що се отнася до начина на управление и демокрацията проблеми има, а решенията, които познаваме, са остарели и неадекватни за днешния ден. Вероятно не след дълго и изкуственият интелект ще се включи в парадигмата, както вече е ставало дума. Но междувременно не е ли редно да опитаме да променим нещата като хора, с помощта на технологиите, които вече имаме?
Това направление може да направи напълно прозрачно толкова полемичното по нашите ширини електронно гласуване. А от друга страна: крие възможностите за много по-драстична промяна: блокчейн демокрация. Начин за вземане на решенията, които касаят обществото, по много неочакван, но пък логичен начин.

повече информация
Друга история

Друга история

„Който контролира миналото, контролира бъдещето“, пише в една книга, която се напреварваме да цитираме. Също и „който контролира настоящето, контролира миналото“.
Докато все повече делегираме паметта си на технологиите, животът ни ще става все по-лесен. Докато търсим времеубежището си в собствените си балони, това ще ни събира и дели.
Може ли обаче днешните технологии да променят историята? Да зачеркват и да преосмислят събития от миналото? Има ли как да впрегнем изкуствения интелект в помощ на по-обективния поглед към историята във всичките ѝ периоди? Защо именно миналото се оказва вечна тема за спорове онлайн?
Как технологиите от бъдещето променят миналото… и обратното?

повече информация

Най-новите:

Какъв е „Произходът на българите“?

Какъв е „Произходът на българите“?

Кои са прабългарите, откъде идват предците ни? Какво имат да ни кажат новите технологии в търсенето на отговора? Наследници на траките ли сме, дали идваме от далечните степи, или пък сме сармати? Как генетиката се оказа поредната голяма научна стъпка, която ни даде много отговори за миналото и на практика остави валидна само една теория?
Какъв е произходът на българите? Защо този въпрос толкова сериозно ни вълнува и вкарва в ожесточени спорове хилядолетие и половина по-късно?
Тази тема се превърна в най-четената дигитална история, по същото време излезе книгата на историка доц. д-р Тодор Чобанов – „Произходът на българите – дебатът през XXI век“. Изданието на „Българска история“ дава най-важното от съвременния поглед. Ето защо има още толкова съществени отговори, които си струва да бъдат добавени.

повече информация
IT, любов и боровинки

IT, любов и боровинки

И двамата работят в света на информационните технологии. Той е програмист, тя – проектов мениджър. Днес заедно са собственици на 4700 корена боровинки, които през лятото зарадваха с впечатляващия си вкус стотици купувачи. Гледат и 5 декара рози, редуват дейлитата с прекопаване, разговорите за data science с такива за агрономство.
Понякога животът е цветя и рози, нужна е само смелост, за да го оцениш и преосмислиш. Да повярваш в мечтите си. И да забравиш за стереотипите…
– Имам една мечта… – започва, леко неуверен Нено. Двамата с Криси са се качили на хълма с внушителната панорама към Долината на розите и бъдещата ферма. – Да гледам боровинки. Ще бъдеш ли до мен?
– Да, на 100%! – отвръща тя, без да се замисли. – Идея си нямах с какво се захващам… – допълва Криси днес.

повече информация
„Хората си оставаме същества, за които е важно да притежават“

„Хората си оставаме същества, за които е важно да притежават“

Кога и как ще си разделим собствеността върху звездите? Обречени ли сме като цивилизация да бъдем водени от непрестанното желание да притежаваме? Защо изкуственият интелект е мощен инструмент, но същевременно и фантазия, която е обречена да не се претвори в реалност? Време ли е да включим алгоритмите във вечната битка на човека за справедливост?
Проф. дфн Стоян Ставру е способен да се вглъби в материя, която най-често смятаме за скучна, за да я изпълни със смисъл, да разкаже достъпно и атрактивно, да намери неочакван поглед към теми, важни за всички ни.
„Предизвикай правото!“, призовава юристът в тематичния си сайт. Завършил право и психология, той има специално отношение към технологиите и много неочаквани амплоа. Дипломиран планински водач, учител по японските бойни изкуства джодо и айкидо, водещ на подкаста Vox Nihili, в който се чуват „шепоти от бъдещето“ и главен редактор на експертна правна система „Лексебра“.

повече информация
FM-2030. Той не умира

FM-2030. Той не умира

Наляво или надясно? Нагоре!
Той вярваше, че когато дойде 2030 г., ще се пробуди от ледовете, за да отпразнува 100-годишния си юбилей. Беше убеден, че по това време ще сме стигнали небесата, ще сме населили други планети. Ще сме загърбили злободневните си дърления и, окрилени от технологиите, ще вървим напред в човешката еволюция.
Дали е бил прав FM-2030? Дали с точната си ръка на баскетболист няма да ни изненада в прогнозите си със стрелба от тройката?
Ако се окаже така, само след 7 години ще можем да обсъдим детайлите със самия него. Ако наистина бъде съживен, забравеният създател на трансхуманизма, избрал име като на радио канал, със сигурност ще има какво да ни разкаже… В обратния случай ще се превърне в поредния мечтател, надценил човечеството и изпреварил своето време.

повече информация
Селфита, които ще спасяват животи

Селфита, които ще спасяват животи

Една дълго подценявана технология, узряла в днешния ден, може да спаси животите на много хора.
Понякога, в света на бурно развиващите се технологии, историите лъкатушат между голямата мечта и нереалното. Но много са аргументите, които показват, че тук се крие един огромен, неочакван пробив. Чрез малки промени в температурата на определени зони на тялото, уловени от термокамера и обработени с помощта на изкуствен интелект, могат да бъдат предсказани редица здравословни проблеми. Начинанието развива българският стартъп Kelvin Health.
Георги Къдрев е специалист по информационни технологии, отдавна се занимава и с предприемачество. Дълги години развива проекта Imagga, който неусетно се превръща в компания, технологичен лидер в разпознаването на изображения.
Пътят на Kelvin Health започва в първите дни на пандемията. Екипът е изправен пред предизвикателството да обработва изображения, показващи температурата на човешкото тяло в опит моментално да се разпознава ковид инфекция. Докато постепенно се оказва, че този метод, приеман едва ли не за алтернативен, може да се превърне в пробив за медицината. В технология, която да влезе във всеки дом и да спасява животи. Медицински директор на начинанието е известният сърдечносъдов специалист проф. Иво Петров.
Може ли термалната диагностика да се превърне в революция в медицината? Кои заболявания ще бъдат диагностицирани с новата технология? Може ли изкуственият интелект да удължи живота ни? Какво е за един стартъп да се превърне в еднорог, но не с пазарна оценка от милиард долара, а заради… милиард спасени човешки животи?

повече информация
Исус. Програмистът, дошъл от гетото

Исус. Програмистът, дошъл от гетото

„Най-трудно беше да взема есенцията от двата свята, в които живея, и да ги комбинирам в един. Изисква се доста емоционална енергия и висока емпатия. Бил съм отхвърлян от българи, защото съм циганин и от цигани, защото „се правя“ на българин. Бориш се да бъдеш уважаван на противоположни фронтове“.
Имам удоволствието да ви представя Исус Костов! За колегите си е просто „Джизъс“, а за мен – силен пример как човек може да победи средата, предубежденията, дори себе си, за да постигне онова, за което мечтае. Колкото и да изглежда далечно, дори невъзможно.
Пътят му тръгва от циганското гето, а днес е софтуерен инженер в реномирана компания. Учи сам онлайн, така и не се отказва, започвайки от училище, където често ходи гладен, с обувки без подметки. За да стигне до днес, натрупал сериозен опит в професията.
„Най-ценното, което програмирането ми даде безспорно е свободата“, казва Исус. „То ми донесе възможността да се измъкна от трудното положение, в което бях и да си изградя живот, в който съм независим и мога да помагам на семейството си“.
Следващата му цел е да вдъхнови повече хлапета да преследват мечтите си. Да не се отказват, потискани от средата и от обстоятелствата.
А какво ли ще стане, ако подобни истории променят отношението и на обществото ни, и на айти сектора към тези деца?

повече информация
Share This