Можем ли днес да различим създаденото от изкуствен интелект и от човека?
Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални истории.
Има обаче и много други важни щрихи, които да ни накарат да се замислим.
Използвам случая да благодаря от сърце на всеки от тези 1816 гости, които попълниха анкетата с 30 въпроса (тук). Искам да ви се извиня за трудностите – и аз обичам надпреварите, но тази, по всичко личи, вече е несправедлива.
И още едно извинение – че се наложи всички участници, пожелали да получат резултатите и правилните отговори на имейла си, да почакат до днес, както беше споменато в условията.
(Поради технически ограничения на Google Forms, необявени от платформата, изпращането на отговорите по имейл е забавено. Ако желаете да получите отговорите си, пишете ми на me@karamanev.me или в социалните мрежи. Можете също да попълните теста отново, дори с празни отговори, и ще видите кои са верните. Ще откриете верните отговори и в края на този текст.)
Йеронимус Бош или Петко Славейков се оказаха по-трудни за разпознаване? Гозбите на Мария Жекова или строфите на Виолета Кунева?
Експериментът приключи. Вече можете да правите теста отново, като ще получите отговорите веднага, след като го попълните. Ето какви са изводите.
Гаус? Хаос!
В предизвикателството се включиха 1816 души. Рекордът – 26 точки, или „само“ 4 сбъркани отговора постигнаха трима. Повече от 23 правилни отговора имат едва 26-има или малко над 1% от участниците.
Да, въпросите се оказаха изключително трудни. Определено вече ни е трудно да различим генерираното от създаденото. Разбира се, експериментът няма научни претенции, той е просто журналистическа проверка, своеобразна провокация, за да видим колко са добри днес всъщност в „работата“ си алгоритмите за генериране на изображения и текст.
Честно казано, съжалявам, че сам нямаше как да се включа в експеримента. Разбира се, никой не беше ограничен в това да потърси отговорите и в мрежата, (почти) всички авторски изображения и думи могат да бъдат намерени там.
Не, не винете мен, виновен е Карл Фридрих Гаус. Именно „нормално“ или гаусово разпределение е това, което виждаме на графиката по-горе. Кръстено на математика от XVII век, то описва разпределението на случайни величини, групирани около средната стойност. Тоест: данни, които говорят за това, че дори на случаен принцип, бихме получили същата графика.
Всеки, който е налучкал и навсякъде е дал отговор ИИ, би „изкарал“ 16 точки. А средният брой точки от всички включили се, е 16,07…. (От статистика са извадени участниците с по-малко от 10, защото очевидно не са попълнили голяма част от текста. Важно е да уточня и че много малко са изключенията сред останалите на някой, пропуснал да отговори на даден въпрос).
Но какви са другите любопитни изводи? Дали текстовете или изображенията се оказват по-лесни за разпознаване?
Крилце или кълка?
Както можете да се убедите, на практика няма разлика. При средно 54,94% правилни отговора (отново нека спомена, че 50% биха били чисто налучкване), много са близки стойностите при изображенията. Разбира се, неслучайно за целите на теста бяха използвани произведения на автори, дали съгласието си, от най-различни области. Така например хората, познаващи стила на рапъра MC Atila, поетесата Виолета Кунева или художничката Мая Бочева – Уики, не би трябвало да се затруднят толкова с конкретното съдържание, но биха били на равни начала с останалите що се отнася до всички останали въпроси. Същото важи за рецептите на Мария Жекова и фотографиите на Димитър Караниколов.
И така, дали заради конкретния избор на въпроси, или заради особеностите на конкретното изкуство, фотографиите се оказаха най-разпознаваеми (макар и само за по-малко от 2/3 от включилите се). Най-трудни пък се оказаха илюстрациите, там грешните отговори значително надвишават правилните. В цели три от категориите – диалектни думи, картини и илюстрации, неправилните отговори са дори повече от верните.
Само 38,8% разпознаха превода, направен от изкуствен интелект на Шекспир, редом с тези на Валери Петров и Гео Милев –
Да умрем, да спим –
не повече; в съня да сложим свършек
на болката сърдечна, на удари безбройни,
присъщи на плътта.
Рецепта за успех
Стиховете на Петко Рачов Славейков се оказаха сравнително разпознаваеми – кой е негов и кой генериран познаха средно 68,15%.
близостта нанася удари под кръста
подарък който не мога да пренеса
без твоя помощ
който не мога да откажа
Поетесата Виолета Кунева или изкуственият интелект? Да, човекът, но това различиха само 36,2%, над 2/3 от хората прецениха, че текстът е генериран.
- Бръндилник – примитивен уред за приготвяне на домашна ракия и други дестилати в домашни условия
- Чирикливо – описание на музика или песен с весел и игрив характер, типична за събирания на открито
Кое от двете е диалектна дума от Северозападна България и кое – „фалшификат“? И двете са „измислени“ от ChatGPT, много близо до 50-те процента са верните отговори (и все пак, по-малко и за двата отговора), тоест: пълно объркване.
Виждам ад, виждам рай
Коя от следващите две строфи е дело на рапъра MC ATILA и коя – на изкуствения интелект?
Щом погледна назад,
виждам ад, виждам рай.
Във врата ми дихание на дракон,
тоест движа се сам по среда – ин и ян,
черна нощ и ден, бял като мляко.
или
Времето лети, но аз съм над него,
във вените ми тече бит, не се предавам леко.
Спомени в рими, животът ми е чекмедже,
всеки стих е магия, отваря врати без ключе.
Първото е „човешко“, второто – не. И все пак, над 50% се объркаха и на двата отговора.
На изпроводяк
След като се убедих, че изкуственият интелект днес може и сам да генерира „онлайн човек“, ето че вече се потвърди: вече е неразличимо много от създаденото от него.
Хрумват ли ви други експерименти, с които да проверим възможностите му? Ако да, пишете ми тук!
Следващия вторник очаквайте продължение – интервю с коментар по темата защо всъщност е важно, че днес толкова често не можем да различим създадено от генерирано.
Можете да видите и решите теста тук.
Време е и за награди! Три от тях са за участниците, постигнали най-висок резултат в експеримента – 26 от 30 възможни точки, това са rad****.char*****@gmail.com, so***.tr*****@gmail.com и mi****.ant***@gmail.com. След жребий другите две награди печелят участниците с имейли kots***.zl***@gmail.com и evelinad*****86@gmail.com. Наградите са две книги „Дигитални истории“ с автограф и две фланелки с логото на сайта, а още един – книгата „Загадките на Атанас Атанасов“, отново с автограф.
Специални благодарности за приятелите на Дигитални истории, които дадоха съгласието си да участват в експеримента:
- Победителката от MasterChef и фотограф Мария Жекова (гостуването ѝ на Дигитални истории – тук),
- Поетесата Виолета Кунева,
- Художничката Мая Бочева – Уики,
- Фотографът и архитект Димитър Караниколов (гостуването му – тук),
- Орлин Милчев, познат преди и като MC ATILA (гостуването му – тук).
Експериментът се осъществява и с подкрепата на Българския център по нестопанско право.
Верни отговори:
(Фотографии) 1. Димитър Караниколов; 2. ИИ; 3. Димитър Караниколов; 4. ИИ;
(Стихове) 5. Петко Славейков; 6. ИИ; 7. Виолета Кунева; 8. Виолета Кунева; 9. ИИ; 10. ИИ;
(Фотографии) 11. ИИ; 12. ИИ;
(Рецепти) 13. ИИ; 14. ИИ; 15. Мария Жекова; 16. Мария Жекова;
(Преводи) 17. Третият; 18. Вторият;
(Рап) 19. Атила; 20. ИИ; 21. Атила; 22. ИИ;
(Йеронимус Бош) 23. ИИ; 24. ИИ;
(Диалектни думи) 25. ИИ; 26. ИИ;
(Илюстрации) 27. Мая Бочева – Уики; 28. ИИ; 29. ИИ; 30. Мая Бочева – Уики