Можете ли да различите човешки глас от такъв, генериран от изкуствен интелект?
2036 души се включиха в експеримента на Дигитални истории, търсещ отговора на този въпрос, а и още много важни нюанси. Резултатът според мен е недвусмислен…
TL;DR
Статията е дълга и подробна. Ако ви интересуват само основните изводи, ще ги намерите
тук.
- От над 2000 души, включили се в експеримента, средният резултат е 2,5 от 6 възможни верни отговора.
- Ако участниците просто бяха налучквали, щяха да имат по-висок резултат.
- Не просто се оказва невъзможно да разпознаем генерирания глас. По-вероятно е да се подведем по него, отколкото да отличим човешкия.
Човек или ИИ чувате в този запис? 82% от участвалите в експеримента сбъркаха. Това е изкуствен интелект, създаден от начинанието на доц. Мариана Тодорова и Иван Ванков – Gatakka.
Глас в пустиня
На този сайт може би сте виждали и други предизвикателства, които имат за цел не само да проверят уменията и интуицията ви, но и да покажат дали и колко вече е напреднал изкуственият интелект в различните му форми. Генерирани стихове стигнаха до топ 10 на два поредни реномирани поетични конкурса; изкуствено създаден инфлуенсър се появи във фийда на 85 000 души, без никой да отбележи, че нещо не е наред. Може би сте решавали тестовете за различаване на генерирани от създадени стихове, картини, детски рисунки, исторически факти…
И алгоритмите в много от тези експерименти се оказаха плашещо добри. Докато стигаме и до резултатите от този експеримент, когато за първи път грешните отговори са… драстично повече от верните.

Шест кратки аудиозаписа. В оранжево са оцветени верните отговори. Номер 2 и 3 са човешки гласове, останалите са генерирани. Разпознаха ги съответно 51% и 34%. Първият от генерираните гласове се оказа сравнително лесен за уцелване (макар повече от 1/4 от хората да са сгрешили, че е човек), а останалите… вижте и чуйте сами.
72% от включилите се в теста са преценили, че гласът е човешки. Не е.
Гласовете ви чувам
Очевидно е дошло време да признаем, че след текстовете и изображенията, и гласовете, генерирани от ИИ, могат да подведат всеки от нас в това, че насреща е човек. Колко много са важните изводи, които следват оттук? Ако следите сайта Дигитални истории, можете да се досетите за доооста потенциални проблеми. (И възможности!)
2/3 от участвалите смятат, че този глас е генериран, а той е човешки.
Дали има универсален мотив, който може да ни помогне да различим генерираното от човешкото? Дори да го намерим, твърде вероятно е това да е щрих, който на следващата стъпка ще ни подведе, след като дойде следващото поколение алгоритъм.
Хората, попълнили теста, са били малко по-склонни да смятат гласовете за човешки, докато 4 от 6 не са такива.
Ако човек разгледа коментарите към постовете в социалните мрежи, с които каня хората да се включат в експеримента, би се убедил – всеки може лесно да разпознае генерирания глас. Той прави грешки, допуска интонационни неточности, не звучи добре на български…
Да, може би по-дълъг текст би бил по-различно предизвикателство. Винаги могат да се намерят варианти, които да променят резултата. И все пак, в случая той е доста очевиден.

Глас народен
Преди да се разделим, си струва да се спрем на някои от отговорите на въпроса, в който участниците в експеримента бяха поканени да напишат впечатленията си от гласовете.
- Плаша се, че не различавам и малко наслуки отговарям.
- Според мен мъжките гласове са по-трудни за познаване в сравнение от женските и очаквам да имам несъответствие именно при тях.
- Много интересно!!! Благодаря!
- Оказва се трудна задача!
- Чудесен начин да се повиши нивото на информираност по темата. Особено с нарастващите телефонни измами.
- Всичко е изкуствен интелект
- Плашещо.
- Доста е задобрял ИИ.
- Много са близки, но все пак ИИ произнася малко отсечено.
- Много лесно се разпознават!
- Не мога да повярвам колко се е усъвършенствал ИИ. Най вероятно всичко е генерирано.
- Очаквах, че ще е по-лесно.
- Имах усещането, че човеците леко имитираха генерираните гласове
- 5 е човек.
Не, 5 не е човек, честна дума!
(Един от коментарите ясно показа, че тестът в случая не е попълнен от ИИ, а от естествен, който обаче не е в излишък: „КурЗаЛефски“)
Как ехото заглъхва
И така, ето отново изводите накратко:
- От над 2000 души, включили се в експеримента, средният резултат е 2,5 от 6 възможни верни отговора.
- Ако участниците просто бяха налучквали, щяха да имат по-висок резултат.
- Не просто се оказва невъзможно да разпознаем генерирания глас. По-вероятно е да се подведем по него, отколкото да разпознаем човешкия.
- Ако още не сте опитали да разпознаете гласовете, можете да се предизвикате тук.
Време е и за обещаните награди! Тримата участници, познали и 6-те верни отговора и избрани след жребий, са: ivana.****@ka***.bg, di***@gmail.com и pt***@gmail.com. Те ще получат избрани книги и поздравления за впечатляващия резултат!
Ако имате идеи за следващите журналистически експерименти на Дигитални истории, ще съм благодарен от сърце да ми ги споделите. Очаква ви и скромен подарък!














