Кой говори – човек или алгоритъм?

юли 4, 2025 | Технологии

Кой говори – човек или алгоритъм?

4 юли 2025 | Технологии

Можете ли да различите истински човешки глас от такъв, генериран изцяло от изкуствения интелект, при това на български? Сериозно предизвикателство ви очаква, при това с награди! Но преди да стигнем до експеримента, нека ви разкажа една гласовита дигитална история, която, вярвам, тепърва ще отеква със собствен тембър.

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!

А какво предизвикателство ви очаква във вторник…

 

 

Право на глас

Макар още да си няма търговско име (предполагам, създателите му биха се радвали на интересни предложения), става дума за едно начинание, което вече успешно се използва в практиката. Благодарение на героите на тази дигитална история от половин година слушателите на радио „Фокус“ в цялата страна слушат регионални новини, прочетени специално за тях от любимите им водещи.

Доц. Мариана Тодорова и Иван Ванков – Gatakka. Ако следите Дигитални истории, това са познати за вас имена. Доц. Тодорова проправя пътя на футурологията в съвременния ѝ вид у нас и всяка година ми гостува с важен разговор за това, което ни очаква, за големите въпроси, които трябва да си задаваме. Gatakka пък е технологичен специалист с огромен опит, който отдавна е натрупал популярност с умението да обяснява технологиите, а и да наднича в бъдещето им. Какво ли обединява тези двама безспорни авторитети? Именно проектът, чиито умения ще подложим на съмнение в края на тази среща.

 

Глас меден, загорски

В епохата, когато медиите все още са пред голямата задача да преоткриват себе си, по-важно от всякога се оказва персонализираното съдържание. Личното отношение, точният избор, но и гарниран с авторитета, който (би трябвало да) дават медиите. Разговор по тази тема отварят доц. Тодорова, която по това време гостува с рубрика в радио „Фокус“, и собственикът на медията Кирил Налджиев.

„Почти на шега той попита може ли някой да направи ИИ, който да клонира гласа на водещата“, разказва изследователката. „Предложих им Иван, на шега решихме да експериментираме. Клонирахме гласовете на двама водещи – Биляна Бозинарева и Живко Георгиев. Резултатите бяха изненадващо добри, особено като за български език!“.

Шегата бързо става работещо начинание. От септември 2024 г. клонираните гласове на двамата водещи всеки ден „четат“ по 8 емисии новини, различни за всеки от 11-те региона, където радиото има локален канал. Послушах новините… определено резултатът е впечатляващ.

 

Доц. Мариана Тодорова

Доц. Мариана Тодорова

 

Гласове

„Не че това не е невъзможно да се случва и с радиоводещи, четящи новините, но се изисква голям ресурс и радиото нямаше тази възможност“, казва доц. Тодорова. „Така с едно просто решение „Фокус“ стана най-голямата радиомедия с регионални новини. Това демократизира знанието, защото го прави по-достъпно – хора, които нямат време да четат, ще го чуят. Хора със зрителни проблеми, по-възрастните, също имат възможност да възприемат информацията.“

Аз лично нямам търпение да се добавят и регионалните особености! Ако чуя Живко Георгиев да чете новините за Северозапада, като че ли са написани от Торлака в стила на „Северозападен романь“, а и нататък по регионите…Животът ще стане по-интересен и пъстър.

„Но! вината“ – така се казваше първата от вече над 450 публикации в този сайт, в която преди 4 години си представих как технологиите ще изземат още повече от работата на журналистите. Не знам за вас, но аз избирам да се ентусиазирам, а не да се плаша от това, че всичко, описано по темата в този материал, се случва на практика. Нека имаме следващите впечатляващи технологии, пък как ще ги въвеждаме и къде да оставим човешката намеса в тях е по-добре да е отделен разговор. Толкова важен, че ме кара вече 4 години да пиша по 2 дигитални истории всяка седмица.

 

Без глас на буква

Проектът на доц. Тодорова и Gatakka (кажете, че не ви звучи като дуо супергерои?) се доказва в практиката и е време да се развива нататък. Да, клонирането става по-лесно, но… дали не е добра идея за следваща стъпка – да се създават гласове, да чуваме в познатата графа „текста четоха“ думите на хора, които не съществуват?

Именно това е днешното предизвикателство, пред което се изправят нашите супергерои, а доколко добре се справят, скоро ще имаме шанса да преценим с общи усилия.

Защо изобщо е нужно звукът, издаван от един човек, да бъде генериран? На първо място заради авторското право. Гласът си е наш, както са наши и отпечатъците ни, това винаги може да създаде подобен тип проблеми. Именно тогава намира решение следващата стъпка от начинанието. То е концентрирано върху българския с амбицията да продължи за други по-редки (на фона на световното многообразие) езици от околните ни страни.

 

Гласност и демокрация

Персонализирани новини. Говорител, който чете специално подбрани конкретно за нас текстове… мен продължава да ме плаши, колкото и да се насочвам към оптимизма. Докато в същото време ми е ясно колко полезно може да бъде нещо подобно, ако те са проверени, осмислени, представени в контекст и с достатъчна гаранция за достоверност и компетентност.

„В създаването на съдържанието все още няма как човекът да бъде заменен“, категорична е доц. Тодорова. „Няма кой да прави разследваща журналистика, да пише със специфичен хумор.“

Но пък генерираният глас има още толкова много приложения. Например съобщенията по летищата или гарите могат бързо и лесно да бъдат казани от него. Магазините, които продават огромен брой артикули, ще приготвят кратка информация за всеки продукт, която да стане достъпна за всеки клиент. Ами фармацевтичната индустрия? Всичко важно от брошурите за лекарствени препарати лесно може да се превърне в аудио, достъпно и за възрастните хора, дори персонализирано.

Много уроци и лекции биха могли да бъдат превърнати в аудио, което ще облекчи студенти и ученици. В туристическия бранш също е лесно да си представим следващата стъпка – на персонализирана информация, която е и четена на различни езици. Доц. Тодорова може дълго да говори за многобройните приложения, които вече изглеждат толкова близки…

 

Иван Ванков – Gatakka

Иван Ванков – Gatakka

 

Не пей ми се, не смей ми се

Технологията да се генерира глас, който не съществува, е прелюбопитна тема. Да, напоследък са много проектите, които залагат на клониране – ИИ се обучава на дълги записи и създава свое аудио на базата на любимия ви актьор или водещ. Но глас от нищото, който при това се справя на екзотичния за невронните мрежи български език… се оказва трудно начинание, изпълнено с много неочаквани предизвикателства.

„Да клонираме глас се оказва учудващо лесно“, разказва Gatakka. „Използваме свой модел, цялата архитектура е наша. Не няма нищо иновативно, минах през пейпърите, видях какво работи, взех най-доброто от 7 компонента и го стиковах. Обаче когато се роди идеята да генерираме абсолютно синтетични гласове, без да имаме референция, без да имаме данни… Пак се оказа, че може, но трябваше да добавя и важни неща от себе си. Изисква се нова архитектура, сериозни промени и някои идеи, които не бих искал да разкривам.“

Ще познаете ли кое се оказва най-трудно конкретно в българския? Аз не бих могъл – ударенията. „Правили сме магии, за да ги подадем по правилния начин и моделът да ги разбере“, усмихва се Gatakka. „В българския има думи, които в зависимост от ударението имат три различни смисъла! Ако добавиш контекста, стават още повече. 9000 думи в българския език променят значението си в зависимост от ударението, докато в английския са само 7 или 8!

Срещнахме се с езиковеди от БАН и ни обясниха, че няма правила, по които да се водим. Получаваш два зара, хвърляш ги и това е. „Той бе уверен, че тя ще дойде.“ Ако нямате изрично указано ударение, как да сте сигурни, че ще разберете смисъла на изречението? Увèрен или уверèн? Същото важи и за моделите, и те не успяват да ги различат“.

Една от следващите стъпки по този път е да се постигне емоционалност на гласа. Не просто да чете равно, в духа на „нивото на река Дунав в сантиметри“, но и без „соншонжмон“ – емоция, актьорска добавка, която може да направи аудиокнигата дори повече от просто книга. „Постижимо е, но е адски трудно“, казва Gatakka. „Технически няма проблем да се направи, просто вече не е работа за няколко човека, а за екип с много сериозен хардуер. При съответната инвестиция технически знам как може да бъде направено на всеки език, но е много, много, много работа“.

Време е за експеримент! Ще успеете ли да различите генерираните от истинските човешки гласове? Предизвикателството ви очаква във вторник!

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

Изкуственият интелект е неоправдан медиен шум или големият фактор, който ще промени бъдещето ни като вид? Ще отвори невероятни възможности пред хората, или ще превърне света в дигитален концлагер?...

повече информация
Петко Динев, който дава „очи“ на НАСА

Петко Динев, който дава „очи“ на НАСА

Българин и екипът му създават камери, с чиято помощ НАСА е насочила поглед към Луната, а после и към Марс. Неговите разработки се използват от всички най-големи авиационни компании, а освен че вече...

повече информация
„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е...

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така. Няма да се уморя да повтарям,...

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или...

повече информация

Още публикации по темата:

От рубриката:

Не изпускай автобуса! За ползата от отворените данни

Не изпускай автобуса! За ползата от отворените данни

Щом настане есен, София започва да се задъхва от трафика на стотиците хиляди коли, за които не е подготвена. А всички ние започваме да си задаваме почти риторичния въпрос дали няма как това да се промени? Повече хора да ползват градския транспорт, колелата си… Ползите от това ги знаем много добре.
Градският транспорт, уви, често е неудобен. Макар уж да е свързан с най-модерните онлайн платформи, това не ни помага достатъчно. Казвам го от първо лице, като човек, който се придвижва с колело, с автобус и едва когато е неизбежно се качва на автомобила.
Платформи като Google Maps са безценни за това да планираш маршрута си, но… почти винаги дават неточни данни кога ще дойде следващият автобус. Не ти казват дали ще е препълнен до шушка, дали няма да е мръсен и неподдържан, дали шофьорът му ще те изчака ведро, или ще се окаже киселяк, готов да хлопне вратата под носа ти.
Това обаче може да се промени и тук отново на помощ идват технологиите. Идеята за отворените данни може да се окаже безценна в това София (а и не само) да се „отпуши“ и да започне да диша. Как? Ще разберете от прелюбопитната история на колегите ми програмисти от фирма „Кодексио“.

повече информация
Apollo ex machina. Включете се в конкурса за поезия, генерирана с ИИ!

Apollo ex machina. Включете се в конкурса за поезия, генерирана с ИИ!

Включете се в Apollo ex machina – първия български конкурс за генерирана поезия, организиран от Дигитални истории и издателство Scribens!
Няма ограничения за тематиката и дължината. Единственото изискване е да участвате със стихове, които сте създали с помощта на ИИ. Можете да изпратите до 3 произведения, срокът е 1 декември 2025 г.
Победителят ще получи награда от 300 лв., избрани книги очакват заслужилите второ и трето място, а най-добрите стихове ще бъдат издадени в стихосбирка от Scribens!
Ще ги избере авторитетно жури: поетите Петър Чухов, Бойко Ламбовски и Виолета Кунева, управителят на Scribens Георги Гаврилов и създателят на Дигитални истории Георги Караманев.

повече информация
Що за „човек“ е ИИ? Психологически експеримент

Що за „човек“ е ИИ? Психологически експеримент

Каним четири най-популярни ИИ модела в кабинета на психолога, за да проверим какви „личности“ ще се окажат!
Властни или податливи на влияние, чувствителни или прагматични? Какви са по „характер“ GPT-5, Claude Opus 4.1, Gemini 2.5 Pro и o3?
Този експеримент може да ни каже много!

повече информация

Най-новите:

Виж ти! Когато гледането стане изкуство

Виж ти! Когато гледането стане изкуство

Да виждаш и да разпознаваш вече не е обективно умение и наука. Технологиите и хората вече не са способни да ни доказват кое произведение е човешко и кое – не, с достатъчна степен на убеденост, че да има смисъл. Тогава не е ли време да погледнем на гледането, на търсенето на истината, на проверката на факти… като на изкуство?
В една сумрачна зала неколцина млади лекари са се скупчили пред прожекционен екран. Но не, на него не се показват рентгенови снимки, нито лабораторни резултати, залата не е в болница или университет, а… в музей. Докторите разглеждат репродукции на картини от разни епохи – от Гоя, та до древноегипетски статуи.
Жената отпред им обяснява, че целта е да анализират какво виждат, сякаш е медицински случай. На екрана се появява хаотична мозайка от сиви, черни и бели „лепенки“. „Това е прочуто произведение на изкуството“, подсказва тя. Следва неловка тишина. „Испанско е, на един от най-известните художници на XX век…“ Накрая един от лекарите се престрашава: „Пикасо?“.
Оказва се прав – пред тях е „Герника“, емблематичната картина за ужасите на войната, която никой от присъстващите досега не е разпознал. Младите медици, потънали досега в учебници по биохимия и дежурства в болницата, изведнъж са изправени пред задача от съвсем различно естество – да търсят знаци, символи и истории, скрити в изкуството. Но защо им е нужно? Оказва се, че по неочакван начин това умение може да им помогне да откриват и анализират по-добре симптомите на своите пациенти.

повече информация
ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

Изкуственият интелект е неоправдан медиен шум или големият фактор, който ще промени бъдещето ни като вид? Ще отвори невероятни възможности пред хората или ще превърне света в дигитален концлагер? Вашето мнение е изключително важно и ще съм благодарен от сърце, ако го споделите в кратка анкета! Очакват ви и награди – избрани книги!
Отговорите се събират до 31 декември. Можете да изберете въпросите, на които да отговорите. Анкетата е анонимна.
Всяко попълване, всяко споделяне е безценна помощ за това да видим как се отнасяме днес към голямата технологична тема на нашето време!

повече информация
Петко Динев, който дава „очи“ на НАСА

Петко Динев, който дава „очи“ на НАСА

Българин и екипът му създават камери, с чиято помощ НАСА е насочила поглед към Луната, а после и към Марс. Неговите разработки се използват от всички най-големи авиационни компании, а освен че вече са „стъпвали“ на нашия спътник, летят и на хиляди спътници в орбита.
Петко Динев през 90-те заминава за Флорида, където започва работа в НАСА. После създава своя компания, която се откроява на световно ниво с опита си в създаването на промишлени камери.
Пътят му тръгва от Казанлък – той е първият български златен медалист по физика и ученик на знаменития Теодосий Теодосиев – Тео. Гостът ни е и сред главните герои в новия документален филм „Социално силните“, даващ думата на златните медалисти от школата на Тео.
Как човек случайно стига до НАСА? Как един учен създава компания, превърнала се в световен еталон в своята индустрия? Как можем да променим това, че днес половината ученици от гимназията, която е завършил, не успяват да изкарат и тройка на матурата по математика? Как да превърнем науката в мода и да дадем шанс на технологиите? Как да наваксаме изоставането си като хора от огромното им развитие? Огромни въпроси имаме да обсъждаме с този изключителен събеседник.
„Да, живеем в интересни времена. Даже може би твърде интересни. Аз не мисля, че сме стигнали предела на технологиите. Мисля, че сме още в увертюрата…“

повече информация
„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Има ли място за поезия в епохата на TikTok и изкуствения интелект? Как да върнем това изкуство на заслужения пиедестал? Могат ли и трябва ли да бъдат инфлуенсъри днешните поети? Плашещо или мечтано е времето, в което изкуственият интелект вече не може да бъде разделен от поезията?
Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е днешният ни гост. Освен член на журито на конкурса, той е и управител на издателство Scribens, което ще издаде в стихосбирка най-добрите стихове от него.
Георги Гаврилов е поет и… физик. Създава издателство Scribens, за да дава шанс на млади български автори да стигнат до читателите си.

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така.
Няма да се уморя да повтарям, че ти си това, което четеш. В навечерието на Деня на будителите изпратих на 30 забележителни за мен личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Получих цели 20 отговора, като днес имам удоволствието да ви представя втората половина от отговори (първата е тук)! Отново ще отбележа, че не са групирани по определена логика, защото се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или отвращение, с нетърпение за бъдещето или опит да останем в миналото.
Колко обаче са различни нещата и докъде ще стигнат?
Джемал Ахмедов ще ни покаже отговорите на 29 ноември в уъркшопа на conf.ai. Той ще впрегне ИИ агентите, които ще заработят като цял софтуерен екип.
Преди това обаче е време да поговорим. За хаотичното настояще и неясното бъдеще на софтуерния свят в годините на напредналия изкуствен интелект. „Винаги ще имаме човек в процеса по създаване на софтуер“, казва Джемал. Така ли е наистина?

повече информация
Share This