ИИ детектив. Технологията ли ще ни върне истината?

апр. 5, 2024 | Технологии

ИИ детектив. Технологията ли ще ни върне истината?

5 април 2024 | Технологии

След като експериментът на Дигитални истории, в който се включиха почти 2000 души, показа, че вече не сме способни да различаваме генерираните от изкуствения интелект изображения и текстове, е време за следващата стъпка.

Дали пък… самият изкуствен интелект няма да ни помогне в тази вече неравна битка в търсене на истината? След като алгоритмите станаха толкова добри в генерирането на разнообразни текстове, изображения, а вече и видео, дали пък няма те да се окажат спасението?

Не, няма да разсъждаваме, ще проверим на практика, очакват ни много полезни и замислящи изводи. Които идват, за да ни покажат, че битката за истината, поне засега, може да бъде спечелена. Особено ако имаме желанието и силите да я водим.

 

Внимавай в картинката!

Нека ви представя двамата главни герои – този път не са алгоритми, а повелители на алгоритмите. Радостин Чолаков от родопското село Барутин ни гостува с една от първите Дигитални истории. Тогава, само на 15, той разказа за работата си в света на невронните мрежи, много преди изкуственият интелект да се превърне в темата на деня. А до днес успехите му са още по-впечатляващи – макар тепърва да започва висшето си образование, той вече има научни публикации, впечатляващи разработки, бе избран в мрежата на Google за експерти по машинно самообучение.

През последните години пътят му често се преплита с този на друг талантлив младеж на същата възраст. Делян Бойчев също завършва средното си образование тази година, но вече има сериозни успехи, специалността му са методите с изкуствен интелект, свързани с изображения. Популярното направление, познато като „компютърното зрение“.

Ето че преди няколко месеца двамата приятели се заговарят по темата и решават да проверят: ясно е, че днес изкуственият интелект създава забележителни изображения, но дали пак той би могъл да разпознае истината и лъжата, да прецени коя картинка е създадена от човек и коя – от алгоритъм?

 

Радостин Чолаков и Делян Бойчев

Радостин в MIT, където прекарва 6 седмици през август 2023. Именно по време на престоя му се избистря идеята за метод за откриване на генерирани снимки.

 

Следите остават

„Аз съм те родил, аз ще те убия!“, според Гогол казва Тарас Булба на сина си Андрий. И не само го казва, само след няколко изречения претворява думите си в дела. Алгоритмите ни докараха дотам да не различаваме създадено от генерирано, дали именно те няма да ни поведат по обратния път?

Това решават да проверят Делян и Радостин. Делян познава добре обработката на изображения, Радостин пък навлиза все по-дълбоко в математическите основи на машинното самообучение и програмните им приложения.

Така двамата създават невронна мрежа, обучена за тази задача. Начинанието им още дори си няма име, но се оказа впечатляващо точно в постигането на целта си.

 

Кой ще ни пази от пазачите?

И така, експериментът на Дигитални истории включваше 30 текста и изображения. До неотдавна големите езикови модели не бяха достатъчно големи, съществуваха апликации, на които човек можеше да даде текста и с доста голяма степен на точност да се определи дали той е бил написан или генериран.

Уви, тази технологична битка вече е загубена, казва Радостин. „Текстовете в началото бяха много по-лесно различими от изображенията. До моделите с отворен код като GPT-2, беше лесно откриваемо. За всяка следваща дума невронната мрежа даваше степен на вероятност и ако тя е висока и съществува в текста, значи подобен тип модели биха я генерирали. Има думи, които са много непредсказуеми за езиков модел и такива, които пък са много предсказуеми“.

Разбира се, има някои условни идеи, които да ни подскажат, че текстът е генериран. Ако човек е подал твърде обща насока, често алгоритмите като ChatGPT създават и доста общо съдържание. Имат си и предпочитани думички, които иначе ние не бихме използвали чак толкова често. Не бива да пропускаме, разбира се, и халюцинациите.

„Скоро попаднах на анализ, според който в научните статии, публикувани в различни журнали, през последната година има много индикации, че авторите са използвали много повече ChatGPT. Определени думи като innovative, които той често използва, от миналата година имат огромен ръст. Това обаче са индиректни показатели, нищо не пречи и хората да са почнали да ползват по-често такива думи“.

 

Радостин Чолаков и Делян Бойчев

Делян представя проекта в БАН

 

Пенчо, не чети!

„Когато един тест стане тест, той вече не е хубав тест“, усмихва се Радостин. „Компаниите се научават да го минават, което не непременно значи, че моделът е станал кой знае колко по-добър“.

Основната причина днес алгоритмите да не могат да разпознаят генериран текст е чисто математическа. За големите езикови модели думите се разделят на „парченца“, наричани „токени“ (на български директният превод е „жетон“, но в този контекст така и не се наложи). „Всяка думичка или е там, или я няма. Докато в снимките един пиксел може да е малко по-тъмен или светъл и когато два съседни пиксела имат някакви конкретни стойности, може да намериш някакъв шаблон. В една макар и малка снимка има много повече данни, от които да направиш извод, отколкото от думите, които са просто точки в голям речник“.

Очевидно за това да различаваме генерирания текст ни остава само… здравият разум. Не така обаче се оказва със снимките!

Бързаме към резултата. Средната успеваемост на почти 2000 души в експеримента на Дигитални истории за изображенията беше малко над 8 от общо 16. Точно 8 от картинките позна и ChatGPT, помолен да направи експеримента. Докато алгоритъмът, създаден от днешните ни гости, се справи с… цели 14 от 16 изображения! По-добре от всеки един от почти 2000 души участници.

Сбърка само две изображения, но и за двете показа доста висок процент колебание. Нещо повече: това се оказаха две от най-погрешно отбелязваните и от участниците изображения. „Картината“ на Йеронимус Бош е генерирана от Midjourney. Но тя изключително много напомня по композиция, а и част от елементите съвсем реалната централната част от „Градината на земните удоволствия“, едно от най-известните произведения на художника. А илюстрацията, отново генерирана от Midjourney, подведе не само алгоритъма, но и 3/4 от хората.

Тоест, платформата на двамата младежи се оказа забележително добра в решаването на поставената задача!

 

Радостин Чолаков и Делян Бойчев

Тази снимка не е генерирана, убеден беше алгоритъмът и се оказа прав.

 

Дяволът в детайлите

Но как е възможно? И дали това може да се превърне в дългосрочно решение, което да ни помага да отличаваме генерираните изображения?

Идеята за конкретния алгоритъм е на Радостин, Делян пък се включва с опита си в обработката на картинки.

Използват контрастно обучение – начин една невронна мрежа да бъде тренирана така, че да измерва подобието на подадените данни. В случая моделът получава снимки и връща вектор – дълга поредица от числа, на базата на които изображенията се сравняват.

„Така, ако прекараш две снимки през модела, той връща два вектора. Можеш да му кажеш, ако и двата са на фалшива снимка, да ги приближи, а ако едната е истинска, да ги раздалечи. Така постепенно алгоритъмът се учи да търси онова, което ги отличава и започва да дава прогнози за следващите картинки, които му бъдат подадени“, обяснява Радостин.

 

Под микроскоп

Как се случва това, след като за човешкото око те са напълно неразличими? Разчита се на начина, по който работят самите алгоритми. Оказва се, че независимо дали става дума за DALL-E, Midjourney или Stable Diffusion, генерираните изображения имат забележим за алгоритъма “fingerprint”. „Пръстов отпечатък“, който не е забележим с просто око, но е достатъчно ясен за невронната мрежа, създадена от Радостин и Делян.

За да я обучат, те са събрали около 200 000 изображения, половината от които – генерирани. Идеята им е да има поравно както разнообразен тип фотографии, така и портрети, и илюстрации. Алгоритъмът да разпознава достатъчно добре генерираните картинки, независимо от конкретното им съдържание.

Да, човек, който дълго време използва някоя от трите платформи, след това може значително по-успешно да разпознава генерираните с нейна помощ изображения. Но… само до следващата версия на алгоритъма или до момента, когато ще попадне на някой от останалите.

 

Радостин Чолаков и Делян Бойчев

Тази снимка е генерирана, посочи алгоритъмът и отново беше прав.

 

Зърното от плявата

Един от най-забележимите „отпечатъци“ е в частите от изображението, които са сравнително едноцветни. „Много често данните ни водят към местата, където има бял или друг фон. Ако имаш нещо едноцветно в една истинска снимка, пикселите в тази област са с много близки стойности, докато не е така при генерираните.

„Някои от пикселите не са точно в същия цвят поради начина, по който работи моделът. И точно това се оказа отпечатъкът, по който пък нашият модел ги различава“, обяснява Радостин.

После двамата решават да затруднят модела – да го изпитват на изображения, които са компресирани или смалени. Той обаче с доста голяма точност продължава да различава генерираните.

 

Котка, мишка и клавиатура

Колко точно е добър алгоритъмът? Тествам го отново. Избирам 15 изображения (вижте ги тук), препитвам го, без създателите му да знаят правилния отговор…

И се справя със 100% точност! Познава дали картинките са генерирани, без да сбърка нито една!

Тогава значи… е лесно? Социалните мрежи или търсачките биха могли да използват подобни алгоритми, за да отбелязват генерираното съдържание?

Уви, не. Решението изглежда по-скоро моментно. Във вечната битка на стражари и апаши, продължила и онлайн, всяка следваща стъпка на едната страна дава сили и идеи на другата. Както вече стана дума, тест, който е обозначен като тест, сравнително лесно може да бъде решен от следващото поколение алгоритми, специално обучени да го правят. Още един допълнителен филтър на генерираните изображения лесно би могъл да заблуди алгоритъма.

И ето че идва време да отидем към следващата стъпка, която, неочаквано… носи доза оптимизъм.

 

Йеронимус Бош

Макар наистина да прилича неотличимо на стила на Йеронимус Бош, и тази картина е създадена от алгоритмите. Това обаче обърка цели 88,7% от включилите се в експеримента на Дигитални истории.

 

Не задълбавай

Радостин и Делян са тествали алгоритъма си на стопкадри от нашумелия модел Sora – платформата, която от OpenAI обещават, че ще генерира видео толкова успешно, колкото днес се справят трите споменати проекта със снимките. Тествали са го и с дийпфейк фалшифицирани видеа.

И тук моделът е безпогрешен. Според двамата ми гости определено има защо да вярваме, че алгоритмите ще са способни да оценяват достоверността на видеото още доста следващи стъпки. Ако битката за това начинание при текстовете е изгубена, а тази за изображенията все още е в сила, то генерираното видео поне в обозримото бъдеще ще бъде разпознаваемо. Защото там, освен че оставя „пръстите си“ в това как създава изображенията, алгоритъмът го прави и в последователността. Ако от времето на братя Люмиер, та до Sora видеото си остава поредица от картинки, и самите те биха могли да бъдат оценени, но и последователността им – това колко са плавни, колко са естествени преходите от кадър в кадър.

И така… до следваща стъпка в развитието на алгоритмите.

 

Стражарска марка, бум, печат

А нататък? Моделите, които могат да различават създадено от генерирано ще се развиват. После пък генераторите ще се развиват, за да ги изпреварят.

„Може би ще стигнем до момент, в който изображенията няма да бъдат различими“, казва Делян. „Самите модели могат просто да променят разпределението на стойностите. Но дали пък тогава няма да можем да ги различаваме по конкретния стил? Ето, изображенията, създадени със Stable Diffusion, имат при увеличение повтарящи се елементи, чисто визуално се намира решение“.

„Това, което в момента намираме, може след няколко итерации на тези модели да го няма“, смята и Радостин. „Комерсиалните модели вероятно скоро сами ще започнат да вкарват свой отпечатък“.

Ще оставят воден знак, по който да различаваме генерираното (нека пак го кажа, говорим за изображенията, за текста това е на практика невъзможно! И… какво от това? През последните години моделите с отворен код бързо настигат тези на компаниите. И дори OpenAI и Google да решат (или да бъдат задължени) да маркират генерираните изображения, какво ще спре всеки ентусиаст, който с минимални технически умения „подкара“ почти толкова успешен модел на собствения си компютър?

 

Радостин Чолаков и Делян Бойчев

Радостин и Делян в Perot Museum в Dallas, Texas, където двамата участват в най-голямото международно научно изложение и състезание за ученици през май 2023 г.

 

Пикселите се броят наесен

Радостин и Делян скоро ще са готови с научната си публикация, която ще разкаже за начинанието. А големият въпрос си остава… нужна ли ни е истината? Ето че напредват алгоритмите, които могат да генерират, да създават… покрай всичко това да позволяват да ни манипулират или лъжат. Напредват и тези от другата страна – които да разпознават, да различават, да гарантират.

Да, първите ще генерират повече печалби и търсене заради начина, по който вървят напред технологиите.

А за нас си остава отворен най-големият и важен въпрос.

Колко ни е важна истината?

Готови ли сме да се борим за нея?

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да...

повече информация
Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Да разкажеш цялата история на човечеството в няколкостотин страници… звучи като невъзможна задача. После да разкажеш бъдещето. И накрая – да успееш да привлечеш вниманието към големите въпроси на...

повече информация
„Свободният човек не би смятал телефона си за нещо изключително“

„Свободният човек не би смятал телефона си за нещо изключително“

Днешният гост няма нужда от представяне, дори първото му име е достатъчно, за да привлече внимание. Китодар Тодоров е популярен артист, телевизионен водещ. Но също и герой от мемове, опитен геймър,...

повече информация

Още публикации по темата:

От рубриката:

Останете любопитни!

Останете любопитни!

Кой е родният град на Яворов? Свищов.
Изхалюцинирал го е изкуственият интелект, доста некадърно, ще предположите. Само че не беше той, казах го аз, участвайки в телевизионно предаване в праймтайма на най-старата българска телевизия. Бих предположил, че е по-вероятно да не позная собственото си име, а не родното място на един от хората, чиято история ме вълнува цял живот. Обаче го сбърках и скоро няма да ходя в Чирпан.
Знанието не е даденост. Любопитството не идва само, а иска усилие.
Има ли обаче смисъл да помним къде е роден Яворов във времената, когато можем да го проверим за части от секундата?
Щеше ли да пише различни стихове, ако беше от Свищов?
Ще знаят ли следващите поколения къде е роден, как е писал? От какво се е вълнувал, къде и как е срещнал любовта?
Ако решите, питайте ChatGPT. Или Конституционния съд.
А моят личен отговор гласи: днес е по-важно отвсякога да останем любопитни!

повече информация
Васил Анастасов. VR среща взаимоучителната метода

Васил Анастасов. VR среща взаимоучителната метода

Той е на 21, а вече е помогнал на повече от 200 деца да направят първите си стъпки в професионално поприще, което може да се превърне в успешна кариера.
Днес Васил Анастасов се е заел с още една кауза. С помощта на модерните технологии да направи българските музеи по-атрактивни, привлекателни за младите. В началото сам извървява пътя към магията не миналото, за да разбере смисъла и важността на експонатите, които иначе се крият зад неразбираеми витрини с неатрактивни табели.
Хайде, нека потърсим заедно съкровище! Да опитаме да намерим важните пътеки сред обраслата поляна. За това как да превърнем музеите в магнетични места за младите. Къде се крият любопитството и желанието да споделяш знание, да помагаш. За историите на фона на най-модерните технологии в разработването на компютърни игри и системи с добавена и виртуална реалност. Запретвайте ръкави, чака ни приключение!

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация

Най-новите:

Питър Тийл. Консервативният визионер

Питър Тийл. Консервативният визионер

Facebook, SpaceX, Airbnb, LinkedIn, PayPal, Ethereum. Революцията на OpenAI и ChatGPT, възходът на Доналд Тръмп и вездесъщия му (доскорошен) съюзник Илон Мъск.
Наистина ли има една личност, която събира всички тези явления? Нещо повече – не е преувеличено да се каже, че ако не беше днешният ни герой, надали някое от тях щеше да се претвори в реалност…
Питър Тийл си е спечелил името на пророк, на гуру. На големия визионер на технологичните времена. Докато в същото време има толкова противоречиви възгледи, които някак си остават встрани от големия медиен шум. Но това е типично за родения в Германия предприемач. Някои го приемат за сивия кардинал на Силициевата долина, други – за мъдрец, който може да покаже на всеки пътя към големия успех в технологичната епоха.
Мултимилиардер, той казва, че конкуренцията е измамно благо, а монополите са решението на бъдещето. Създава мащабна програма, за да помага на хора, избрали да изоставят образованието си, за да създадат собствен бизнес, което пък проправя пътя на следващото поколение технологични лидери.
Всичко това и още много е г-н Тийл. Време е да застане под светлината на прожекторите, защото със сигурност е един от хората, които вече са променили живота на всеки от нас. Нещо повече – от него се очаква да зависи все повече в турболентните технологични времена, в които живеем.

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Защо е толкова важно да разберем умеем ли да различаваме детските рисунки от генерирани изображения? Как изглежда бъдещето на творчеството, на изкуството, на човека във времената, когато алгоритмите се оказват неразличими и дори по-добри автори от нас самите? На какво има смисъл да учим децата днес?
Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да проверят интуицията си! Резултатите от теста се очертават изключително интересни, ще поговорим за тях след края му – на 1 юли.
Експериментът е създаден заедно с днешната ни гостенка – Елица Станева-Бритън. Психолог, журналист, преподавател, в момента тя работи по докторската си дисертация в БАН, а темата е творчеството в ерата на изкуствения интелект. Дойде време да поговорим по всяка от тези теми.

повече информация
Какъв ще станеш, когато пораснеш?

Какъв ще станеш, когато пораснеш?

Какви искат да бъдат, когато пораснат, днешните хлапета? Навръх техния празник, време е за резултатите от една любопитна анкета.
Поредицата на Дигитални истории за срещата на децата с технологиите събра важни гледни точки по много теми. От 350 души, включили се в анкетата на сайта, 289 избраха да отговорят:
Какви искат да станат децата, когато пораснат?
„Инфлуенсър“ или „лекар“ – кой според вас ще се окаже най-срещаният отговор?
Как се променят мечтите на хлапетата?
Какво говори това за нас, възрастните, за технологиите, за духа на времето?

повече информация
Тест: Кой го нарисува – дете или ИИ?

Тест: Кой го нарисува – дете или ИИ?

Време е за неочакван, но важен тест. За експеримент, който поставя важни въпроси за бъдещето на творчеството, на човешкото, на образованието.
Предизвикайте себе си и своята интуиция! 15 картини, нарисувани от деца между 3 и 10 г., и 15 – генерирани от изкуствения интелект. Ако успеете да ги различите, очакват ви награди!
Отговорите се събират до 1 юли, анкетата не би ви отнела повече от 10 минути. За всяко от 30-те изображения е достатъчно да предположите дали е нарисувано от дете, или генерирано от ИИ, а също и да оцените техниката и въображението, вложени в първите 10. Можете да отговорите и само на част от въпросите. Анкетата е отворена и за деца!

повече информация
Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Ювал Ноа Харари. Често ще чуете името на историка и футуролог в разговорите за бъдещето. През последните години той се утвърди като световният мислител, който не само успява задълбочено и компетентно да разплита нишките, от които е съшита историята на човечеството, но и поставя големите въпроси на утрешния ден.
Но как един професор по история се превърна в любим автор на хора като Бил Гейтс и Барак Обама, Марк Зукърбърг и Бил Клинтън, докато в същото време е популярен, превеждан, четен и обсъждан? Как успява да стигне с дългите си тестове до съзнанието на хората във времената, когато концентрацията и задълбоченият поглед се превърнаха в екзотични умения?
Шарен образ, отвъд стереотипите. Любима мишена на всеки, който иска да блесне. Веган и защитник на животните, със съпруга му са начело на фондация, която цели да провокира обществения дебат по важни теми. Израелецът е едновременно широко признат учен и авторитет. Най-важното според мен – ценен и силен глас, който ни предупреждава за непосредствените опасности пред нас като вид. Ето какво си струва да знаем за него и впечатляващите му прозрения.

повече информация
„Свободният човек не би смятал телефона си за нещо изключително“

„Свободният човек не би смятал телефона си за нещо изключително“

Днешният гост няма нужда от представяне, дори първото му име е достатъчно, за да привлече внимание.
Китодар Тодоров е популярен артист, телевизионен водещ. Но също и герой от мемове, опитен геймър, който кани гости, за да играят онлайн, докато си говорят за живота…
Дали ще се получи забавен разговор? Или по-скоро ще ни даде поводи да се замислим…? За днешното ни място в света на технологиите, за компютърните игри като начин на живот. За трудния баланс и големите въпроси.
А как ли се раждат мемовете с Китодар, които забавляват всички ни и стават толкова популярни онлайн?
„Цялата ни съвременна цивилизация е построена на някакви машинки, от които сме зависими, и това е много тъпо. Един истински свободен човек не би трябвало да смята телефона за нещо изключително важно, нито компютъра. Това го губим с времето, защото усещането е, че ни дават всичко. Че технологиите ни дават свобода, а не е така. Напротив, те ни създават повече зависимости.“
Очаква ни неочакван разговор!

повече информация
Share This