Детска рисунка или ИИ? Експериментът привлече огромен интерес.
В теста дали ще различим 15 рисунки на деца под 11 г. от 15 изображения, създадени от изкуствения интелект, се включиха почти 4000 души! Време е да обобщим резултатите.
Успяхме ли да се справим с предизвикателството? Истинските или генерираните рисунки са по-лесни за разпознаване? Трудна ли се оказа задачата, или почти всеки успя да познае 30-те възможности? Дали самите деца се справиха по-точно в преценката си? Защо изводите са важни?
TL;DR
Статията е дълга и подробна. Ако ви интересуват само основните изводи, ще ги намерите
тук.
- Експериментът привлече огромен интерес, за месец и половина се включиха цели 3933-има души!
- Средната успеваемост на участниците е едва 52%. Точно 50% би била тя при абсолютно налучкване.
- Тоест, еднозначно може да кажем, че не сме способни да отличим детски рисунки от генерирани изображения.
- Макар и с малка разлика, участниците оцениха като по-креативни и с по-добра техника генерираните изображения.
- Минимални са разликите между точките на възрастните и децата, попълнили теста.
- За 6 от детските рисунки и за 9 от генерираните изображения повече хора са сбъркали автора, отколкото са го познали.
- Открояват се изображения, които са разпознати от по-малко от 1 от петима!
- Като цяло малко по-склонни сме да сметнем генерирано изображение за детска рисунка, отколкото обратното.
- Ако още не сте направили експеримента, той ви очаква тук.
Илюстрацията, с която обявих експеримента, се оказа и най-трудна за разпознаване. Само 16,5% от участниците познаха, че това е детска рисунка!
Внимавай в картинката
Цели 3933-има души се включиха в предизвикателството от средата на май до края на юни, когато приключи събирането на отговори в рамките на експеримента! Интересът не спира и след това, като попълнилите вече доближават 5000, макар вече постиженията им да не попадат в анализа на резултатите.
Ако и вие сте сред тях… надали ще ви изненада фактът, че резултатите са далеч от максималните. Нещо повече – те са близо до пълното налучкване. Изключваме от тях хората, попълнили по-малко от 2/3 от отговорите и пак… Почи половината участници имат повече на брой погрешни, отколкото верни отговори!
Средният резултат е 52%, той би бил 50% при чисто налучкване! Тоест, смело можем да кажем на базата на резултатите, че днес вече не сме способни да различим детски рисунки от такива, създадени от ИИ! (А това е важно, ето защо!)
И все пак… няма изображение, което да не успя да подведе поне 1 от 10 от участниците. Нито пък такова, която да заблуди повече от 90%.
Редно е да отбележа, че цели 12 души в рамките на периода са постигнали максималния резултат от 30 точки. Още по-редно е да отбележа, че въпреки старанието ми, имаше две възможности за нечестна игра – заради мое недоглеждане генерираните изображения бяха с абсолютно еднакви пропорции, а също – след попълване и при внимателен анализ на резултата, беше възможно да се види кои са верните отговори. И все пак, очевидно малцина от участниците са открили пропуска, ако изобщо има такива. А резултатите са толкова недвусмислени, че не оставят съмнение в най-важния извод. Оказахме се неспособни да различим двете групи.
Две хубави очи. Душата на дете
В рамките на експеримента имаше възможност да участват и деца до 14 г. Дали те се оказаха по-способни да различат произведенията на връстниците си? Не бих казал. Факт е, че попълнилите деца бяха едва 128, но средният им резултат далеч не се различава от този на възрастните.
И все пак, има някои картини, като например тази на снежния човек, при която младите участници се оказаха по-наблюдателни.
78% от хората отговориха, че картинката е генерирана от ИИ. А тя е нарисувана от дете.
Реална оценка
За първите 10 (общо 5 гененирани и 5 нарисувани) изображения участниците можеха да дадат и оценка – за техника и въображение. Истината е, е че и в двете посоки средните оценки бяха доста близки, малко над 3 от 5.
И все пак… генерираните изображения получиха малко по-високи средни оценки, почти без изключение! Участниците писаха малко по-силна бележка на ИИ в сравнение с тази на децата!
ИИ-генерираните рисунки получават малко по-високи средни оценки и за въображение (+0,15 т.) и за техника (+0,10 т.), като най-високо оценена от всички е рисунка 9 (ИИ).
Генерираната илюстрация, която заблуди най-много хора – цели 76,1%, че е детска рисунка, се оказа… и най-високо оценена като умения и въображение!
Ето някои от изображенията, които се откроиха и в двете посоки, успяха или не да заблудят участниците:
Почти 80% познаха, че това е детска рисунка. Явно недовършената част се оказа силен жокер.
Може би твърде съвършените линии на изображението подведоха цели 78%от включилите се, че изображението е генерирано.
2/3 от участниците сбъркаха, мислейки, че това е истинска детска рисунка.
Това се оказа най-разпознаваемата генерирана картинка. Успя да подведе едва един от петима.
Едва 1/3 от участвалите познаха, че тук авторът е ИИ.
Почти 9 от 10 участвали познаха, че това е истинска детска рисунка.
По картините изпращат
И така, ето изводите накратко:
- Експериментът привлече огромен интерес, за месец и половина се включиха цели 3933-има души!
- Средната успеваемост на участниците е едва 52%. Точно 50% би била тя при абсолютно налучкване.
- Тоест, еднозначно може да кажем, че не сме способни да отличим детски рисунки от генерирани изображения.
- Макар и с малка разлика, участниците оцениха като по-креативни и с по-добра техника генерираните изображения.
- Минимални са разликите между точките на възрастните и децата, попълнили теста.
- За 6 от детските рисунки и за 9 от генерираните изображения повече хора са сбъркали автора, отколкото са го познали.
- Открояват се изображения, които са разпознати от по-малко от 1 от петима!
- Като цяло малко по-склонни сме да сметнем генерирано изображение за детска рисунка, отколкото обратното.
- Ако още не сте направили експеримента, той ви очаква тук.
Време е и за обещаните награди! Четиримата участниците, които са постигнали максималните 30 точки и са оставили имейла си за разпределяне на наградите, са: p.vas***@ard**.bg, kalina***@abv.bg, lubo***@abv.bg и dimitrana****@yahoo.de . Те ще получат избрани книги и поздравления за впечатляващия резултат!
И отново, благодаря от сърце на всеки, който се включи, на всеки, който помогна прелюбопитният експеримент да стигне до толкова много хора!
А дали ще успеете да различите генериран от човешки глас? Опитайте тук!
Ако имате идеи за следващите експерименти на Дигитални истории, очаквам ви тук!
Ако темата ви е интересна, със сигурност си струва да прочетете интервюто с психоложката Елица Станева-Бритън, по чиято идея се случи експериментът. Ще го намерите тук.