„ИИ прави революция във фотографията“

май 31, 2022 | Срещи

„ИИ прави революция във фотографията“

31 май 2022 | Срещи

Предстои ви невероятна среща с двама забележителни фотографи. Единият се казва Ивайло Петров, а другият… е изкуствен интелект. Как ли могат да работят заедно?

Преди дни ви представих DALL·E – алгоритъма, който показва впечатляващи резултати в генерирането на изображения по кратко описание. Напредъкът в тази област през последните месеци е значителен и привлича погледите. Всички проекти по темата обаче за момента не дават свободен достъп да поекспериментираме, има дълги листи на чакащите. Това дава повод на скептиците да твърдят, че алгоритмите никак не са толкова впечатляващи, колкото изглежда, защото ни се показват само подбрани изображения.

Те обаче наистина вече са точно толкова изумително добри в задачата си, колкото изглежда.

 

снимка: Иванна Стефанова

Ивайло Петров е фотограф и дигитален артист с повече от 15 години опит. Има три самостоятелни изложби, списъкът с проектите му в портретната, рекламната фотография и 3-измерните визуализации е впечатляващ. Точно колкото впечатляващ е и задълбоченият му подход към работата, за който разказва в блога си.

„Искам да създавам светове, които не биха могли да съществуват, но въпреки това съществуват в мислите ми“, казва той.

И ето че имаме късмета от две седмици именно Ивайло да е сред първите хора, които имат възможността да тестват нашумелите алгоритми. Става дума за проекта Midjourney, решението на малка, независима група ИИ специалисти.

Как се справя алгоритъмът пред професионалния му и безпристрастен поглед? Готови ли сме за ИИ пробивите, които вече се случват? Бои ли се доказаният фотограф, че алгоритмите скоро могат да го заместят?


 

– Случайно попаднах на „снимките“, генерирани от изкуствения интелект по твоя идея във фейсбук. Как стигна до тази тема?

– Следя отдалеч какво се случва в тази сфера, но на практика не бях задълбавал. В моята глава винаги е било далеч времето, когато изкуственият интелект ще може да създава изображения.

В тази професия

работим с високо ниво на абстракция, на метафоричност, ако щеш, предаване на чувства, на емоции.

Затова не бих очаквал, че тук и сега, през 2022-а, може да съществува подобен софтуер. И се оказа, че много съм грешал.

Не следя особено фейсбук, но случайно видях, че един мой приятел е писал нещо по темата, стана ми любопитно и се зарових. Оказа се, че това е софтуер, който буквално преди месец е започнал да става много популярен. Все още е в затворена бета версия, но постепенно повече хора имат достъп до него. Имах късмет, че намерих покана.

 

„Комбинирай настроението на Bloodflowers от The Cure с емоцията от „Пиета“ на Микеланджело“, пише Ивайло на Midjourney и получава този резултат. Всички следващи изображения са генерирани по този начин.

 

– Кое те впечатлява най-силно?

– Моята гледна точка е на човек, който прави картинки, а не на някой, който разбира много от програмиране.

Чрез този изкуствен интелект можеш изключително бързо, само на базата на текстово описание и интерпретация, да визуализираш идеи и концепции. В работа като нашата това не е никак лесно. В крайна сметка

авторската фотография е точно това: в главата ми текат някакви мисли, които успявам да систематизирам чрез думи и след това да транслирам към изображения.

Днес самото снимане е малка част от създаването на изображенията, има много 3Д графика, постпродукция. Този ИИ успява да прави визуализациите по безпрецедентен начин, той елиминира слоя от технически познания, който се изисква.

В случая програмата е интерпретатор на текста, който ѝ се подава. Понякога, стъпвайки на твоята идея и твоето описание, тя тръгва в някаква посока, които не си очаквал и не би ти хрумнала. После можеш да задълбаеш в предложенията, да ги дообогатиш, да вкараш някой свой нюанс. Това е изцяло нова концепция, за съвсем различен творчески подход.

 

„Статуя на Мики Маус в постапокалиптичен свят“

 

– Тоест, по някакъв начин приемаш тази технология като следващата естествена стъпка в развитието на фотографията?

– Точно така. Тази технология все още е в ранен етап от развитието си. Но това, което ме шокира, е че тя ще премахне поредния праг от технически познания, които са били нужни, за да може всеки да създаде и предаде някаква идея като изображение.

Ако погледнеш назад в историята, винаги сме вървели към това – във фотографията тенденцията е към опростяване, а това важи и за много други сфери на живота. Какви са били ранните фотографи? Физици и химици, които са гледали на фотографията не като на артистична медия, а по-скоро като на технологична иновация. За да създадат изображения, е трябвало да се подготвят много сериозно.

Докато сега, с дигитализацията и всички останали процеси през последния век, фотографията е станала толкова либерална, че абсолютно всеки си хваща мобилното телефонче и на момента прави кадър, който „става“.

И това е следващата стъпка в тази посока. Дори не стъпка, а истинска революция!

 

 

– Според професионалния ти поглед, колко точно е добра в момента тази технология?

– Разбира се, тя не е готова за строго професионална употреба. Има технологични ограничения, които най-често са на базата на изчислителната мощ. Конкретно Midjourney има лимит от около 2 мегапиксела резолюция на изходния файл. Това, естествено, ще се промени много бързо и драстично, такъв е пътят, по който минава всяка технология.

Направих си експеримент с един приятел, който се занимава с „тежка“ музика и ме помоли да му предложа визия за обложката на негов проект. Реших да пробвам с помощта на изкуствения интелект. Той ми описа какво се търси: усещане за края на света; кораб, който е на края на живота си, изостанал назад; апокалиптично небе, мрак, депресия…И самотна фигура, която поема това настроение.

Предадох подробно описанието и ИИ абсолютно, на 100%, ми даде десетки вариации на подобна сцена, всяка от които беше достатъчно добра. Направих експеримент, пратих му 7-8 от изображенията и го попитах дали някое му харесва. Отговори ми: „Пииич, всичките ми вършат работа!“. И това го направих за 15 минути.

След това уголемихме изображението, приготвихме завършена визия, но тя вече не ставаше технологично. Корабът имаше доста проблеми в детайлите, които трябваше да се поправят в постпродукция.

 

 

– Защо повече от картините, генерирани от ИИ, които показваш, са толкова негативни?

– Истината е, че тук съм виновен аз, защото му подавам такива неща. Той наистина визуализира това, което му кажеш. Но мой приятел също направи тази съпоставка, че и по принцип изображенията, генерирани от ИИ, са такива. Най-вероятно причината е, че

въпросната невронна мрежа е тренирана със снимки, картини, постери от популярната естетика на Запада. А тя винаги е малко по-остра, мрачна, ангажираща.

Така ИИ е повлиян още в процеса на трениране. Но това не означава, че може да създава само такива неща. Ако искаш нещо различно, трябва изрично, много хубаво да му го кажеш, да си по-детайлен. Правих си и такива експерименти и наистина се получава.

 

„Ватикана по залез, обхванат от висша сила“.

 

– Кара ли те по някакъв начин това, което виждаш, да се боиш, че човекът може да стане излишен в целия този творчески процес?

– Тази технология определено е революционен етап. Но за момента според мен можем да я разглеждаме по-скоро като допълнителен инструмент, който да инкорпорираме в работата си и в творческия процес. Все още авторът не е изместен по никакъв начин и не мисля, че това ще се случи скоро.

В същото време наблюдавам нещо, което според мен е генерално в човешката природа, отвъд изкуствения интелект.

Ние имаме склонността силно да надценяваме краткосрочния ефект на промените в живота си и силно да подценяваме дългосрочния.

 

„Огромна статуя на машината Бог, извисена над София и Витоша, която ни кара да обмисляме собственото си съществуване.“

 

Публикувам в социалните мрежи моите експерименти с алгоритъма, без да ги редактирам по никакъв начин. И виждам, че хората понякога реагират с предубеждения. Те буквално се плашат от краткосрочните потенциални приложения на технологията. Аз не мисля, че те са особено страшни, за разлика от тези в дългосрочен план. Мисля, че сме все по-близо до т.нар. точка на сингулярност.

Всичко се променя толкова бързо, толкова интензивно, че в един момент просто не можем да предположим какво точно ще е следващото и до какво ще ни доведе.

Аз се чувствам по-скоро несигурен накъде отиваме и ако можем да приемем несигурността като вид страх, тогава наистина се боя.

 

„Кулата на Джото във Флоренция във Ван Гог стил под звездна нощ.“

 

– Така е. Сингулярността изглежда като някакво невероятно бъдеще, но човек бързо губи основата, след като вижда алгоритми като този, които си е представял, че ще дойдат след много години. И все пак, усещам у теб и ентусиазъм.

– Точно така. В живота винаги съм имал такъв подход – искам да научавам нещо ново, да го пробвам и по този начин да обогатя процеса, по който работя. Винаги това е било с идеалната цел да реализирам нещо, което преди това не съм можел, а ми е изглеждало важно да „кажа“. Затова реших да разуча какво точно умее алгоритъмът. Отдавна не ми се беше случвало да се докосна до нещо наистина ново. След като години наред създаваш картинки, в един момент научаваш процеса достатъчно добре. А това е изцяло друга логика.

Алгоритъмът стъпва на думи, на описания, на концепции, които ти му подаваш, и ги интерпретира. Малко или много, това е същото, което правя и аз.

Напоследък говоря с много хора по тази тема, някои от тях откровено се плашат, първосигналната реакция е „на мен това ми е твърде странно“. Разбирам ги прекрасно. Моят ентусиазъм идва от срещата с нещо ново. Усещането е много странно. Не мога да кажа, че имам твърде ясна дефиниция какво точно се случва, по-скоро се

опитвам да свикна с мисълта за него и да го поставя в някакъв контекст.

 

„Хълмът Палатин и християните, изгаряни на него“.

 

– Ще променят ли този тип алгоритми и отношението ни към реалността, както го промени веднъж фотошоп?

– Фотошоп е добър пример. Той навлезе масово във фотографската работа през 2003-2005 г., когато аз тъкмо прохождах в нея. По-старите фотографи имаха драстично негативно отношение към него, а с времето той се доказа като безценен инструмент, стига човек да може да го ползва компетентно. Днес е неотменна стъпка в създаването на изображенията, огромна, интегрална част от процеса. На практика всички фотографи го ползват, ако искат да имат допълнителна творческа свобода, след като са заснели кадъра.

Смятам, че ИИ по някакъв начин също ще революционализира процеса. Защото в момента, когато този софтуер напредне, според мен

ще започнем да мислим за изображенията, които виждаме, че по подразбиране са направени с негово участие.

Няма да звучи шокиращо, ако кажеш, че нещо е генерирано от ИИ, както е днес.

Смятам, че това ще промени работата на страшно много хора от най-различни индустрии, някои от които драстично. При това значително по-скоро, отколкото очаквах доскоро. Но това е естествената еволюция!

 

„Колизеумът, целият в цветя, близо до ретро футуристичен космически кораб.“

 

– Мислиш ли, че в тази конфигурация ще остане място и за истината?

– Истината винаги е била изключително субективна категория. Непрестанно се опитвам да я търся под една или друга форма и виждам, че днес е още по-трудно. Когато влезеш в една социална мрежа, страшно много зависи какво си харесал преди и какво знаят за теб по принцип, какво те е впечатлило в други сайтове, с кого си контактувал. За да може алгоритъмът да определи какво искаш да видиш.

Така ако човек остави съзнанието си да бъде курирано от тези алгоритми, истината за него става фундаментално различна в сравнение с тази за всеки друг.

Мисля, че наистина живеем в общество на постистината и

най-доброто, което индивидът може да направи, е да знае той самият кой е и къде се намира.

Да отстоява това и да взема решенията си на базата на него… поне доколкото му е възможно.

Защото, ако погледнеш какво се случва по света…

истината се превръща в толкова чупливо, дори абстрактно понятие, че точно това ме плаши. Дори повече от ИИ.

 

„Крилете на Бог“

 

Балонът на филтрите, начинът, по който данните формират истината за всеки от нас, са теми, за които често разказвам Дигитални истории. И в крайна сметка тези проблеми се случват именно заради развитието на изкуствения интелект и факта, че не оценяваме дългосрочните ефекти.

– Той е продукт на човешката мисъл. Точно днес един приятел ми написа, че дори не приема това като интелект, а той е програмист, занимава се с подобен софтуер, разбира техническите детайли, за разлика от мен.

Къде точно дефинираме границата на интелекта? Наистина не знам. Но за момента ИИ сам по себе си не може да направи нищо. Той стъпва на чисто човешки идеи, изображения и интерпретации, които е трениран да познава. И на базата на изчислителна мощ

може да генерира други идеи в други посоки, които обаче етимологично и по дефиниция следват от човешкото съзнание.

С нарастването на изчислителната ни мощ като цивилизация това сигурно ще се промени. И не знам накъде ще отиде.

 

„Езикът като фундаментален път към всичко.“

 

– Докато чакаме тази сингулярност, според теб на кое е най-важно да научим изкуствения интелект? На чувства, на емоции, на емпатия?

– Много ми е трудно да отговоря. Смятам, че ние, хората, имаме страшно много да учим по тези теми. Поне за себе си го твърдя непрекъснато. Би било цинично да ги коментирам за нещо, което е все още перспектива в бъдещето, при условие, че сам се уча на тях. Извинявай, че не ти отговорих на въпроса…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да...

повече информация

Още публикации по темата:

От рубриката:

„Хайде да спрем да се подценяваме!“

„Хайде да спрем да се подценяваме!“

Как да сме по-щастливи като общество? Как да изведем на следващо ниво ИТ сектора в България?
Седнали двама програмисти да си говорят за счупения обществен разговор, за разделението, за пътя на успеха. Звучи като начало на виц, а се получи сериозно и замислящо интервю в подкаста на DEV.BG. Думите, които разменихме, ми се сториха толкова важни, че ще ви ги представя и тук.
Веско Колев е начело на Icanpreneur – стартъп, който помага на повече ИТ компании да създадат работещ продукт. Има богат опит в софтуерния свят и особено интересни наблюдения, с които ще се срещнем днес.
Защо и как е време отново да започнем не само да се слушаме, но и да си говорим, дори когато ни разделя актуалният спор на деня? Защо е изграждащо и осмислящо честото „настъпване на мотиката“ и си струва да се радваме, когато детето ни получи слаба оценка? Какво ни е нужно като общество, за да вървим заедно напред, и то в епохата на напредналия изкуствен интелект?

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Защо е толкова важно да разберем умеем ли да различаваме детските рисунки от генерирани изображения? Как изглежда бъдещето на творчеството, на изкуството, на човека във времената, когато алгоритмите се оказват неразличими и дори по-добри автори от нас самите? На какво има смисъл да учим децата днес?
Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да проверят интуицията си! Резултатите от теста се очертават изключително интересни, ще поговорим за тях след края му – на 1 юли.
Експериментът е създаден заедно с днешната ни гостенка – Елица Станева-Бритън. Психолог, журналист, преподавател, в момента тя работи по докторската си дисертация в БАН, а темата е творчеството в ерата на изкуствения интелект. Дойде време да поговорим по всяка от тези теми.

повече информация
„Свободният човек не би смятал телефона си за нещо изключително“

„Свободният човек не би смятал телефона си за нещо изключително“

Днешният гост няма нужда от представяне, дори първото му име е достатъчно, за да привлече внимание.
Китодар Тодоров е популярен артист, телевизионен водещ. Но също и герой от мемове, опитен геймър, който кани гости, за да играят онлайн, докато си говорят за живота…
Дали ще се получи забавен разговор? Или по-скоро ще ни даде поводи да се замислим…? За днешното ни място в света на технологиите, за компютърните игри като начин на живот. За трудния баланс и големите въпроси.
А как ли се раждат мемовете с Китодар, които забавляват всички ни и стават толкова популярни онлайн?
„Цялата ни съвременна цивилизация е построена на някакви машинки, от които сме зависими, и това е много тъпо. Един истински свободен човек не би трябвало да смята телефона за нещо изключително важно, нито компютъра. Това го губим с времето, защото усещането е, че ни дават всичко. Че технологиите ни дават свобода, а не е така. Напротив, те ни създават повече зависимости.“
Очаква ни неочакван разговор!

повече информация

Най-новите:

Кой говори – човек или алгоритъм?

Кой говори – човек или алгоритъм?

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!
Време е за една звучна Дигитална история. А какво предизвикателство ви очаква след това…

повече информация
Колко изкара ИИ на матура?

Колко изкара ИИ на матура?

Какво ще стане, ако изпитаме на матурата по български език и литература три от най-мощните модели изкуствен интелект? Усилията им ще оценят двама опитни проверители на истинските зрелостни изпити. За да е състезанието още по-оспорвано и показателно, включваме двама реални зрелостници и мен, автора на тези редове.
Ще изкарат ли пълни шестици ChatGPT, Claude и Gemini, или ще се провалят с гръм и трясък?
Ще разпознаят ли учителите коя от работите е на изкуствен интелект и коя – на човек?
Кой ще получи най-високата и кой – най-ниската оценка?
Какво ще ни кажат резултатите и за най-показателния изпит в българското образование, и за напредъка на алгоритмите, и за големите въпроси, с които идват новите технологии?

повече информация
„Хайде да спрем да се подценяваме!“

„Хайде да спрем да се подценяваме!“

Как да сме по-щастливи като общество? Как да изведем на следващо ниво ИТ сектора в България?
Седнали двама програмисти да си говорят за счупения обществен разговор, за разделението, за пътя на успеха. Звучи като начало на виц, а се получи сериозно и замислящо интервю в подкаста на DEV.BG. Думите, които разменихме, ми се сториха толкова важни, че ще ви ги представя и тук.
Веско Колев е начело на Icanpreneur – стартъп, който помага на повече ИТ компании да създадат работещ продукт. Има богат опит в софтуерния свят и особено интересни наблюдения, с които ще се срещнем днес.
Защо и как е време отново да започнем не само да се слушаме, но и да си говорим, дори когато ни разделя актуалният спор на деня? Защо е изграждащо и осмислящо честото „настъпване на мотиката“ и си струва да се радваме, когато детето ни получи слаба оценка? Какво ни е нужно като общество, за да вървим заедно напред, и то в епохата на напредналия изкуствен интелект?

повече информация
Питър Тийл. Консервативният визионер

Питър Тийл. Консервативният визионер

Facebook, SpaceX, Airbnb, LinkedIn, PayPal, Ethereum. Революцията на OpenAI и ChatGPT, възходът на Доналд Тръмп и вездесъщия му (доскорошен) съюзник Илон Мъск.
Наистина ли има една личност, която събира всички тези явления? Нещо повече – не е преувеличено да се каже, че ако не беше днешният ни герой, надали някое от тях щеше да се претвори в реалност…
Питър Тийл си е спечелил името на пророк, на гуру. На големия визионер на технологичните времена. Докато в същото време има толкова противоречиви възгледи, които някак си остават встрани от големия медиен шум. Но това е типично за родения в Германия предприемач. Някои го приемат за сивия кардинал на Силициевата долина, други – за мъдрец, който може да покаже на всеки пътя към големия успех в технологичната епоха.
Мултимилиардер, той казва, че конкуренцията е измамно благо, а монополите са решението на бъдещето. Създава мащабна програма, за да помага на хора, избрали да изоставят образованието си, за да създадат собствен бизнес, което пък проправя пътя на следващото поколение технологични лидери.
Всичко това и още много е г-н Тийл. Време е да застане под светлината на прожекторите, защото със сигурност е един от хората, които вече са променили живота на всеки от нас. Нещо повече – от него се очаква да зависи все повече в турболентните технологични времена, в които живеем.

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Защо е толкова важно да разберем умеем ли да различаваме детските рисунки от генерирани изображения? Как изглежда бъдещето на творчеството, на изкуството, на човека във времената, когато алгоритмите се оказват неразличими и дори по-добри автори от нас самите? На какво има смисъл да учим децата днес?
Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да проверят интуицията си! Резултатите от теста се очертават изключително интересни, ще поговорим за тях след края му – на 1 юли.
Експериментът е създаден заедно с днешната ни гостенка – Елица Станева-Бритън. Психолог, журналист, преподавател, в момента тя работи по докторската си дисертация в БАН, а темата е творчеството в ерата на изкуствения интелект. Дойде време да поговорим по всяка от тези теми.

повече информация
Какъв ще станеш, когато пораснеш?

Какъв ще станеш, когато пораснеш?

Какви искат да бъдат, когато пораснат, днешните хлапета? Навръх техния празник, време е за резултатите от една любопитна анкета.
Поредицата на Дигитални истории за срещата на децата с технологиите събра важни гледни точки по много теми. От 350 души, включили се в анкетата на сайта, 289 избраха да отговорят:
Какви искат да станат децата, когато пораснат?
„Инфлуенсър“ или „лекар“ – кой според вас ще се окаже най-срещаният отговор?
Как се променят мечтите на хлапетата?
Какво говори това за нас, възрастните, за технологиите, за духа на времето?

повече информация
Share This