Кой говори – човек или алгоритъм?

юни 23, 2025 | Технологии

Кой говори – човек или алгоритъм?

23 юни 2025 | Технологии

Можете ли да различите истински човешки глас от такъв, генериран изцяло от изкуствения интелект, при това на български? Сериозно предизвикателство ви очаква, при това с награди! Но преди да стигнем до експеримента, нека ви разкажа една гласовита дигитална история, която, вярвам, тепърва ще отеква със собствен тембър.

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!

А какво предизвикателство ви очаква в петък…

 

 

Право на глас

Макар още да си няма търговско име (предполагам, създателите му биха се радвали на интересни предложения), става дума за едно начинание, което вече успешно се използва в практиката. Благодарение на героите на тази дигитална история от половин година слушателите на радио „Фокус“ в цялата страна слушат регионални новини, прочетени специално за тях от любимите им водещи.

Доц. Мариана Тодорова и Иван Ванков – Gatakka. Ако следите Дигитални истории, това са познати за вас имена. Доц. Тодорова проправя пътя на футурологията в съвременния ѝ вид у нас и всяка година ми гостува с важен разговор за това, което ни очаква, за големите въпроси, които трябва да си задаваме. Gatakka пък е технологичен специалист с огромен опит, който отдавна е натрупал популярност с умението да обяснява технологиите, а и да наднича в бъдещето им. Какво ли обединява тези двама безспорни авторитети? Именно проектът, чиито умения ще подложим на съмнение в края на тази среща.

 

Глас меден, загорски

В епохата, когато медиите все още са пред голямата задача да преоткриват себе си, по-важно от всякога се оказва персонализираното съдържание. Личното отношение, точният избор, но и гарниран с авторитета, който (би трябвало да) дават медиите. Разговор по тази тема отварят доц. Тодорова, която по това време гостува с рубрика в радио „Фокус“, и собственикът на медията Кирил Налджиев.

„Почти на шега той попита може ли някой да направи ИИ, който да клонира гласа на водещата“, разказва изследователката. „Предложих им Иван, на шега решихме да експериментираме. Клонирахме гласовете на двама водещи – Биляна Бозинарева и Живко Георгиев. Резултатите бяха изненадващо добри, особено като за български език!“.

Шегата бързо става работещо начинание. От септември 2024 г. клонираните гласове на двамата водещи всеки ден „четат“ по 8 емисии новини, различни за всеки от 11-те региона, където радиото има локален канал. Послушах новините… определено резултатът е впечатляващ.

 

Доц. Мариана Тодорова

Доц. Мариана Тодорова

 

Гласове

„Не че това не е невъзможно да се случва и с радиоводещи, четящи новините, но се изисква голям ресурс и радиото нямаше тази възможност“, казва доц. Тодорова. „Така с едно просто решение „Фокус“ стана най-голямата радиомедия с регионални новини. Това демократизира знанието, защото го прави по-достъпно – хора, които нямат време да четат, ще го чуят. Хора със зрителни проблеми, по-възрастните, също имат възможност да възприемат информацията.“

Аз лично нямам търпение да се добавят и регионалните особености! Ако чуя Живко Георгиев да чете новините за Северозапада, като че ли са написани от Торлака в стила на „Северозападен романь“, а и нататък по регионите…Животът ще стане по-интересен и пъстър.

„Но! вината“ – така се казваше първата от вече над 450 публикации в този сайт, в която преди 4 години си представих как технологиите ще изземат още повече от работата на журналистите. Не знам за вас, но аз избирам да се ентусиазирам, а не да се плаша от това, че всичко, описано по темата в този материал, се случва на практика. Нека имаме следващите впечатляващи технологии, пък как ще ги въвеждаме и къде да оставим човешката намеса в тях е по-добре да е отделен разговор. Толкова важен, че ме кара вече 4 години да пиша по 2 дигитални истории всяка седмица.

 

Безгласна буква

Проектът на доц. Тодорова и Gatakka (кажете, че не ви звучи като дуо супергерои?) се доказва в практиката и е време да се развива нататък. Да, клонирането става по-лесно, но… дали не е добра идея за следваща стъпка – да се създават гласове, да чуваме в познатата графа „текста четоха“ думите на хора, които не съществуват?

Именно това е днешното предизвикателство, пред което се изправят нашите супергерои, а доколко добре се справят, скоро ще имаме шанса да преценим с общи усилия.

Защо изобщо е нужно звукът, издаван от един човек, да бъде генериран? На първо място заради авторското право. Гласът си е наш, както са наши и отпечатъците ни, това винаги може да създаде подобен тип проблеми. Именно тогава намира решение следващата стъпка от начинанието. То е концентрирано върху българския с амбицията да продължи за други по-редки (на фона на световното многообразие) езици от околните ни страни.

 

Гласност и демокрация

Персонализирани новини. Говорител, който чете специално подбрани конкретно за нас текстове… мен продължава да ме плаши, колкото и да се насочвам към оптимизма. Докато в същото време ми е ясно колко полезно може да бъде нещо подобно, ако те са проверени, осмислени, представени в контекст и с достатъчна гаранция за достоверност и компетентност.

„В създаването на съдържанието все още няма как човекът да бъде заменен“, категорична е доц. Тодорова. „Няма кой да прави разследваща журналистика, да пише със специфичен хумор.“

Но пък генерираният глас има още толкова много приложения. Например съобщенията по летищата или гарите могат бързо и лесно да бъдат казани от него. Магазините, които продават огромен брой артикули, ще приготвят кратка информация за всеки продукт, която да стане достъпна за всеки клиент. Ами фармацевтичната индустрия? Всичко важно от брошурите за лекарствени препарати лесно може да се превърне в аудио, достъпно и за възрастните хора, дори персонализирано.

Много уроци и лекции биха могли да бъдат превърнати в аудио, което ще облекчи студенти и ученици. В туристическия бранш също е лесно да си представим следващата стъпка – на персонализирана информация, която е и четена на различни езици. Доц. Тодорова може дълго да говори за многобройните приложения, които вече изглеждат толкова близки…

 

Иван Ванков – Gatakka

Иван Ванков – Gatakka

 

Не пей ми се, не смей ми се

Технологията да се генерира глас, който не съществува, е прелюбопитна тема. Да, напоследък са много проектите, които залагат на клониране – ИИ се обучава на дълги записи и създава свое аудио на базата на любимия ви актьор или водещ. Но глас от нищото, който при това се справя на екзотичния за невронните мрежи български език… се оказва трудно начинание, изпълнено с много неочаквани предизвикателства.

„Да клонираме глас се оказва учудващо лесно“, разказва Gatakka. „Използваме свой модел, цялата архитектура е наша. Не няма нищо иновативно, минах през пейпърите, видях какво работи, взех най-доброто от 7 компонента и го стиковах. Обаче когато се роди идеята да генерираме абсолютно синтетични гласове, без да имаме референция, без да имаме данни… Пак се оказа, че може, но трябваше да добавя и важни неща от себе си. Изисква се нова архитектура, сериозни промени и някои идеи, които не бих искал да разкривам.“

Ще познаете ли кое се оказва най-трудно конкретно в българския? Аз не бих могъл – ударенията. „Правили сме магии, за да ги подадем по правилния начин и моделът да ги разбере“, усмихва се Gatakka. „В българския има думи, които в зависимост от ударението имат три различни смисъла! Ако добавиш контекста, стават още повече. 9000 думи в българския език променят значението си в зависимост от ударението, докато в английския са само 7 или 8!

Срещнахме се с езиковеди от БАН и ни обясниха, че няма правила, по които да се водим. Получаваш два зара, хвърляш ги и това е. „Той бе уверен, че тя ще дойде.“ Ако нямате изрично указано ударение, как да сте сигурни, че ще разберете смисъла на изречението? Увèрен или уверèн? Същото важи и за моделите, и те не успяват да ги различат“.

Една от следващите стъпки по този път е да се постигне емоционалност на гласа. Не просто да чете равно, в духа на „нивото на река Дунав в сантиметри“, но и без „соншонжмон“ – емоция, актьорска добавка, която може да направи аудиокнигата дори повече от просто книга. „Постижимо е, но е адски трудно“, казва Gatakka. „Технически няма проблем да се направи, просто вече не е работа за няколко човека, а за екип с много сериозен хардуер. При съответната инвестиция технически знам как може да бъде направено на всеки език, но е много, много, много работа“.

Време е за експеримент! Ще успеете ли да различите генерираните от истинските човешки гласове? Предизвикателството ви очаква в петък!

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да...

повече информация
Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Да разкажеш цялата история на човечеството в няколкостотин страници… звучи като невъзможна задача. После да разкажеш бъдещето. И накрая – да успееш да привлечеш вниманието към големите въпроси на...

повече информация

Още публикации по темата:

От рубриката:

Останете любопитни!

Останете любопитни!

Кой е родният град на Яворов? Свищов.
Изхалюцинирал го е изкуственият интелект, доста некадърно, ще предположите. Само че не беше той, казах го аз, участвайки в телевизионно предаване в праймтайма на най-старата българска телевизия. Бих предположил, че е по-вероятно да не позная собственото си име, а не родното място на един от хората, чиято история ме вълнува цял живот. Обаче го сбърках и скоро няма да ходя в Чирпан.
Знанието не е даденост. Любопитството не идва само, а иска усилие.
Има ли обаче смисъл да помним къде е роден Яворов във времената, когато можем да го проверим за части от секундата?
Щеше ли да пише различни стихове, ако беше от Свищов?
Ще знаят ли следващите поколения къде е роден, как е писал? От какво се е вълнувал, къде и как е срещнал любовта?
Ако решите, питайте ChatGPT. Или Конституционния съд.
А моят личен отговор гласи: днес е по-важно отвсякога да останем любопитни!

повече информация
Васил Анастасов. VR среща взаимоучителната метода

Васил Анастасов. VR среща взаимоучителната метода

Той е на 21, а вече е помогнал на повече от 200 деца да направят първите си стъпки в професионално поприще, което може да се превърне в успешна кариера.
Днес Васил Анастасов се е заел с още една кауза. С помощта на модерните технологии да направи българските музеи по-атрактивни, привлекателни за младите. В началото сам извървява пътя към магията не миналото, за да разбере смисъла и важността на експонатите, които иначе се крият зад неразбираеми витрини с неатрактивни табели.
Хайде, нека потърсим заедно съкровище! Да опитаме да намерим важните пътеки сред обраслата поляна. За това как да превърнем музеите в магнетични места за младите. Къде се крият любопитството и желанието да споделяш знание, да помагаш. За историите на фона на най-модерните технологии в разработването на компютърни игри и системи с добавена и виртуална реалност. Запретвайте ръкави, чака ни приключение!

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация

Най-новите:

„Хайде да спрем да се подценяваме!“

„Хайде да спрем да се подценяваме!“

Как да сме по-щастливи като общество? Как да изведем на следващо ниво ИТ сектора в България?
Седнали двама програмисти да си говорят за счупения обществен разговор, за разделението, за пътя на успеха. Звучи като начало на виц, а се получи сериозно и замислящо интервю в подкаста на DEV.BG. Думите, които разменихме, ми се сториха толкова важни, че ще ви ги представя и тук.
Веско Колев е начело на Icanpreneur – стартъп, който помага на повече ИТ компании да създадат работещ продукт. Има богат опит в софтуерния свят и особено интересни наблюдения, с които ще се срещнем днес.
Защо и как е време отново да започнем не само да се слушаме, но и да си говорим, дори когато ни разделя актуалният спор на деня? Защо е изграждащо и осмислящо честото „настъпване на мотиката“ и си струва да се радваме, когато детето ни получи слаба оценка? Какво ни е нужно като общество, за да вървим заедно напред, и то в епохата на напредналия изкуствен интелект?

повече информация
Питър Тийл. Консервативният визионер

Питър Тийл. Консервативният визионер

Facebook, SpaceX, Airbnb, LinkedIn, PayPal, Ethereum. Революцията на OpenAI и ChatGPT, възходът на Доналд Тръмп и вездесъщия му (доскорошен) съюзник Илон Мъск.
Наистина ли има една личност, която събира всички тези явления? Нещо повече – не е преувеличено да се каже, че ако не беше днешният ни герой, надали някое от тях щеше да се претвори в реалност…
Питър Тийл си е спечелил името на пророк, на гуру. На големия визионер на технологичните времена. Докато в същото време има толкова противоречиви възгледи, които някак си остават встрани от големия медиен шум. Но това е типично за родения в Германия предприемач. Някои го приемат за сивия кардинал на Силициевата долина, други – за мъдрец, който може да покаже на всеки пътя към големия успех в технологичната епоха.
Мултимилиардер, той казва, че конкуренцията е измамно благо, а монополите са решението на бъдещето. Създава мащабна програма, за да помага на хора, избрали да изоставят образованието си, за да създадат собствен бизнес, което пък проправя пътя на следващото поколение технологични лидери.
Всичко това и още много е г-н Тийл. Време е да застане под светлината на прожекторите, защото със сигурност е един от хората, които вече са променили живота на всеки от нас. Нещо повече – от него се очаква да зависи все повече в турболентните технологични времена, в които живеем.

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Защо е толкова важно да разберем умеем ли да различаваме детските рисунки от генерирани изображения? Как изглежда бъдещето на творчеството, на изкуството, на човека във времената, когато алгоритмите се оказват неразличими и дори по-добри автори от нас самите? На какво има смисъл да учим децата днес?
Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да проверят интуицията си! Резултатите от теста се очертават изключително интересни, ще поговорим за тях след края му – на 1 юли.
Експериментът е създаден заедно с днешната ни гостенка – Елица Станева-Бритън. Психолог, журналист, преподавател, в момента тя работи по докторската си дисертация в БАН, а темата е творчеството в ерата на изкуствения интелект. Дойде време да поговорим по всяка от тези теми.

повече информация
Какъв ще станеш, когато пораснеш?

Какъв ще станеш, когато пораснеш?

Какви искат да бъдат, когато пораснат, днешните хлапета? Навръх техния празник, време е за резултатите от една любопитна анкета.
Поредицата на Дигитални истории за срещата на децата с технологиите събра важни гледни точки по много теми. От 350 души, включили се в анкетата на сайта, 289 избраха да отговорят:
Какви искат да станат децата, когато пораснат?
„Инфлуенсър“ или „лекар“ – кой според вас ще се окаже най-срещаният отговор?
Как се променят мечтите на хлапетата?
Какво говори това за нас, възрастните, за технологиите, за духа на времето?

повече информация
Тест: Кой го нарисува – дете или ИИ?

Тест: Кой го нарисува – дете или ИИ?

Време е за неочакван, но важен тест. За експеримент, който поставя важни въпроси за бъдещето на творчеството, на човешкото, на образованието.
Предизвикайте себе си и своята интуиция! 15 картини, нарисувани от деца между 3 и 10 г., и 15 – генерирани от изкуствения интелект. Ако успеете да ги различите, очакват ви награди!
Отговорите се събират до 1 юли, анкетата не би ви отнела повече от 10 минути. За всяко от 30-те изображения е достатъчно да предположите дали е нарисувано от дете, или генерирано от ИИ, а също и да оцените техниката и въображението, вложени в първите 10. Можете да отговорите и само на част от въпросите. Анкетата е отворена и за деца!

повече информация
Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Ювал Ноа Харари. Често ще чуете името на историка и футуролог в разговорите за бъдещето. През последните години той се утвърди като световният мислител, който не само успява задълбочено и компетентно да разплита нишките, от които е съшита историята на човечеството, но и поставя големите въпроси на утрешния ден.
Но как един професор по история се превърна в любим автор на хора като Бил Гейтс и Барак Обама, Марк Зукърбърг и Бил Клинтън, докато в същото време е популярен, превеждан, четен и обсъждан? Как успява да стигне с дългите си тестове до съзнанието на хората във времената, когато концентрацията и задълбоченият поглед се превърнаха в екзотични умения?
Шарен образ, отвъд стереотипите. Любима мишена на всеки, който иска да блесне. Веган и защитник на животните, със съпруга му са начело на фондация, която цели да провокира обществения дебат по важни теми. Израелецът е едновременно широко признат учен и авторитет. Най-важното според мен – ценен и силен глас, който ни предупреждава за непосредствените опасности пред нас като вид. Ето какво си струва да знаем за него и впечатляващите му прозрения.

повече информация
Share This