Грешки (не)човешки

юли 11, 2025 | Технологии

Грешки (не)човешки

11 юли 2025 | Технологии

Статията се препубликува от Тоест. Тя е част от рубриката Порция език и е подготвена съвместно с Павлина Върбанова.


 

Има ли грешка, има и прощка. Ако сте открили нещо нередно тук, значи и вие имате погледа на коректор. Във времената, когато все по-малко медии и дори издателства се доверяват на специалисти, които да следят за правописа, дали пък изкуственият интелект (ИИ) няма да се окаже полезен помощник? Време е за един показателен правописен експеримент.

ИИ безспорно е голямата новина на днешния ден. И докато той е способен на все повече чудеса, ние продължаваме да търсим ежедневните приложения, в които технологията може да помогне, да облекчи… дори да ни замени.

Всички (надяваме се) вярваме, че по правописа, а не по дрехите днес посрещат онлайн. В технологичната епоха общуваме все по-често чрез писмени текстове и начинът, по който го правим, определено издава толкова много на събеседника. Може ли ИИ да ни помогне да пишем грамотно?

 

Човешко е да се греши…

Нали уж ИИ все повече заприличва на нас и нищо човешко не му е чуждо? Да видим как се справя в „стресова“ ситуация – с медиен текст, в който нарочно залагаме 30 грешки от всякакъв характер: правописни, граматични, пунктуационни, лексикални.

Министъра на околната среда и водите (МОСВ), Манол Генов, съобщи в интервю за Би Ти Ви, че инспекторите на ведомството проверяват 250 сигнали_ свързани с продуктовите такси за черна и бяла техника. Повод за разговора е нашумялата миналата седмица проверка на Комисията за защита на конкуренцията за картелно споразумение при вдигане на цените с 8001000 процента между фирмите, които събират такса, за да рециклират старите електроуреди и електроника.

 

Министър Генов заяви, че сигналите са от средата на миналата година, но регионалните инспекций разполагат с малко хора, затова проверката на „250 сигнали е изключително непосилен труд.“ Той настоя, обаче, че всички сигнали се проверяват.

 

Министърът каза, че някои фирми, например занимаващи се с интернет търговия_ не са обхванати с тези продуктови такси. „Много сме мислели какво можем да направим съвместно с Националната Агенция за Приходите. Имаме виждания, предстоят срещи с министерство на финансите по този въпрос, за да измислим подходящо законодателство,“ каза министъра на екологията.

 

Според Генов, продуктовите такси, които се събират в момента_ са символични. Като един от проблемите с еко таксите, той посочи остарялата наредба към закона за управление на отпадъците, определяща размера на продуктовите такси в България. Същевременно Генов е на мнение, че операторите са решили да вдигнат цените благодарение на повишаването на проверките през последните месеци от страна на еко министерството. Той посочи, че операторите на продуктовите такси са създадени, така че да не могат да формират печалба, а „всички пари да бъдат вложени в оползотворяването на тези отпадъци.“

 

После включваме най-модерните модели ИИ. Важен нюанс за технологичните любители: използваме моделите, които сме избрали, не през потребителски интерфейс и личен профил, а през програмен интерфейс, така че резултатите да не се влияят от предишните ни взаимодействия с моделите. За да е още по-пълноценен експериментът, на всеки модел подаваме по две задания (промптове). С първото (вижте го тук) просто молим текстът да бъде коригиран и да получим обяснение защо е направена дадена корекция. Второто задание е значително по-подробно и го създаваме след няколко „разговора“ с ИИ. Използваме техника, наречена meta-prompting – даваме съставени от нас указания на GPT-4o, който да ги развие и прецизира. В резултат се получава задание, което е по-дълго дори от самия текст. (Означаваме кратките задания с SP, а дългите – с LP.) В единия опит имаме просто „случаен изстрел“, в другия пробваме дали конкретни указания ще подобрят резултата. Дали наистина ще има разлика?

За участие в теста избираме два от моделите в платената версия на ChatGPT – GPT-4o и о3. Тук са Claude 4 Opus на Anthropic и флагманът на Google – Gemini 2.5 Pro. Всички те са платени, единствено последният има ограничен брой свободни заявки.

За пъстрота добавяме българския BgGPT и безплатната версия на ChatGPT. Важно е да отбележим, че използваме популярните големи езикови модели, никой от които не е обучен толкова добре на български език, нито пък е „специализиран“ в такава специфична роля като коректорската. Даваме на всички само по един шанс. Затова в таблицата с резултатите няма да видите GPT-4o (LP) – при тази заявка моделът просто върна малка част от текста.

 

Електронният коректор

Ето че пускаме заявките, след секунди получаваме отговорите, събираме резултатите… и се оказва, че трудностите тепърва започват. Как да преценим дали всички грешки са коригирани, ако например моделът е редактирал текста и е избегнал конкретната правописна неточност? Какво правим, ако добави, вместо да поправи грешки? Трябва ли да го стимулираме с допълнителни точки, ако е открил място в текста, което си струва да бъде „загладено“, дори да не става дума за явна грешка? Ще му прощаваме ли, ако просто промени вида на кавичките?

Опитваме се да бъдем максимално безпристрастни и така събираме резултатите в подробна таблица. Ето как се справиха моделите с конкретните задачи.

 

 

Грешки, които (почти) всички модели откриха

Едва ли ще бъде изненада, че формата инспекций не се изплъзна от ничий поглед – все пак очакваме ИИ да се справя минимум на ниво автоматична коригираща програма. И на двете места, където думата министър беше погрешно написана с кратък член, това беше поправено надлежно от всички, ако пренебрегнем, че Gemini (SP) реши изобщо да не членува думата в самото начало на текста: Министър на околната среда… Приятно сме впечатлени, че ИИ се ориентира в синтактичната служба на думите, когато това е от значение за правописа, но и грешките са тривиални, затова би било пресилено да заключим, че владее добре правилата за поставяне на пълен и кратък член.

Всички модели отчетоха липсата на главна буква в министерство на финансите и само с едно изключение (Claude SP) поправиха Националната Агенция за Приходите на Националната агенция за приходите, тоест приложиха правилото за правописа на съставните собствени имена.

В областта на пунктуацията ИИ забеляза липсващата запетая в началото на обособената част свързани с продуктовите такси за черна и бяла техника, която несъмнено много хора биха поставили дори и интуитивно, но далеч не толкова много биха се сетили за затварящата запетая в края на подчиненото изречение които се събират в момента.

 

Грешки, които никой модел не забеляза

Да, признаваме си, че бяхме взискателни и с някои грешки вдигнахме летвата високо. Но как иначе ще разберем колко може ИИ? Уви, той изобщо не отчете неуместното съкращение МОСВ, което се употребява за Министерството на околната среда и водите, но не и за министъра.

Нито един модел не премахна кавичките при Би Ти Ви. За да сме пунктуални, уточняваме: липсва изрично правило, че при собствени имена, които се състоят от названия на букви, не се поставят кавички. Засега кодификаторът ни е дал само примери във връзка с друго правило.

Думата еко министерство следва да се пише слято и това е отчетено от повечето модели, но никой от тях не се е сетил да замени малката буква с главна. Освен професионалните коректори вероятно малко хора биха го направили. А е редно, защото, когато дадено съставно собствено име се съкращава или се перифразира, главната буква се запазва, например Министерство на външните работи – Външно министерство.

При 800-1000 процента половината модели са заменили малкото тире с дълго, но нито един не е оставил интервали, както е редно според официалните правописни правила: 800 – 1000 процента.

 

Какво още мина под радара?

Двете излишни запетаи, ограждащи името Манол Генов в началото на текста, бяха премахнати единствено от Gemini (LP) и o3 (LP). Пунктуацията при цитиране също затруднява ИИ, макар че точно тук правилото е формално: щом цитатът е вмъкнат в авторово изречение, кавичките се затварят пред точката. Около половината от моделите не са поправили грешката и в трите случая.

Слятото, полуслятото и разделното писане в българския език са предизвикателство и за хората, и за ИИ. Само Gemini (LP и SP) са се справили със сливането на еко таксите в екотаксите и на еко министерството в екоминистерството. Непоследователно действат Claude (SP), GPT-4o (SP), o3 (SP), o3 free (LP и SP), които са коригирали едната грешка и са подминали другата, при положение че те са еднотипни. Осмеляваме се да мислим, че в сравнение с ИИ по-вероятно е човешкият интелект или да коригира двете грешки, или да не ги регистрира.

Освен правописни, пунктуационни и граматични грешки, заложихме и две лексикални – неточно употребени думи. Едната (благодарение на) беше уловена от половината модели и вместо ние да обясняваме, даваме думата на Gemini (LP): „Предлогът „благодарение на“ има положителна конотация и не е подходящ за описване на негативно събитие (вдигане на цени).“ Моделът дори ни предлага два варианта за заместване – и двата сполучливи: вследствие на и поради. Другите справили се със задачата заменят неподходящия предлог със заради и в резултат на.

Втората лексикална грешка е при употребата на повишаване в съчетание с проверки. Просто проверките не се повишават. Само два модела са забелязали това: o3 (LP) е заменил думата със засилването и това според нас е сполучливо, а BgGPT (SP) – с увеличаването, за което сме му присъдили половин, а не цяла точка.

 

Потвърдено: ИИ халюцинира

Понякога ИИ си въобразява, както знаем. Оказва се, че може да си измисля и грешки, след което, естествено, се чувства задължен да ги коригира. Няколко модела (Gemini (LP и SP) GPT -4o (SP), o3 (LP и SP), GPT free (SP) са добавили запетая след например, която е излишна – в случая с тази дума се въвежда обособената част например занимаващи се с интернет търговия. Дори и въпросната дума да беше употребена като вметната част, тя е от онези, които не се ограждат със запетаи.

Необяснимо защо някои модели са премахнали отварящите и затварящите кавички при първия цитат в текста, но при другите два цитата са ги оставили. Възможно е цифрите в началото на цитата (250) да са объркали ИИ. Явно първият цитат го смущава, защото там наблюдаваме и други решения, заради които сме го санкционирали с отнети точки: скъсяване на цитата чрез преместване на отварящите или затварящите кавички; промяна на съгласуването, което води до граматическа грешка: проверката на „250 сигнали са изключително непосилен труд.“

 

Обобщени впечатления

22,5 от максималните 30 точки получи победителят o3 (LP), а само на половин точка след него е Gemini (LP). Най-слабо представилите се модели като цяло са успели да покрият минимум 1/3 от грешките. Доста сериозна е разликата в представянето и заради различните задания – когато получат по-дълъг и прецизен промпт, моделите се представят значително по-успешно. С две изключения – GPT free и BgGPT – вероятно защото като по-малки модели по-трудно могат да навлизат в дълбок контекст.

 

ИИ като коректор

 

Сигурни сме, че всеки може да направи своите изводи, да прецени доколко добре се справя ИИ с българския правопис, граматика и пунктуация и дали си струва да му се довери в тази роля. Ако нещо е сигурно, то е, че моделите са далеч от това да изпълняват ролята на опитен и добър коректор, толкова дефицитна, важна и често липсваща, уви, в българските медийни среди.

Ето накратко личните впечатления на всеки от нас.

 

Правописно и лично

Павлина Върбанова: Признавам, че преди да направим експеримента, бях по-скептично настроена за коректорския капацитет на ИИ. Приятно съм изненадана, че поправи доста неформални грешки (например запетаята при така че), тоест в някаква степен той е започнал да „разбира“ текстовете. И това – при положение че не е специално обучаван да действа като коректор.

На сегашния етап ИИ може да се ползва като помощник за поправяне на грешки в сравнително кратки текстове, но без да му се възлагат отговорни задачи, а по-скоро за да посочи проблемни места, които са се изплъзнали от вниманието на пишещия. Възможно е ИИ да ви подведе и да предложи грешна корекция; също така при еднотипни или дори при еднакви грешки да поправи едната и да пропусне другата. Затова бъдете бдителни! В анализа наблегнахме на слабите места, за да заострим вниманието ви, а не за да ви откажем изцяло от коректорските услуги на ИИ.

Георги Караманев: Смятам, че моделите се представиха доста силно и откриха грешки, които лично аз бих пропуснал. Вижда се още нещо важно – как точното, прецизно задание сериозно подобрява резултатите. Според мен това е и ясен знак, че може да ги използваме в ежедневието. Разбира се, с едно наум. Те със сигурност могат да направят по-грамотни текстовете на огромна част от пишещите в мрежата и дори в общественото пространство.

В работата си и аз ги използвам в тази роля. Сайтът ми „Дигитални истории“ е изцяло некомерсиален, затова не мога да си позволя редактор или коректор (нещо, което искрено ми липсва от времената на традиционните печатни медии) и ИИ помага с идеи за корекции на всеки текст. Всяка от тях обаче преценявам аз, разбира се, и такъв би бил съветът ми към читателите. Така е и с почти всяко от безбройните приложения на технологията. Нещо повече – всеки нов идва с нови възможности, както личи от нашия анализ (а и от „представянето“ на ИИ на матурата по български език и литература).

Експериментирайте, опитвайте. Доверявайте, но… проверявайте. ИИ е тук, за да остане, и си струва да се възползваме от всяка следваща негова впечатляваща възможност.

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да...

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да...

повече информация

Още публикации по темата:

От рубриката:

Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

6 аудиозаписа, в които е произнeсена кратка фраза. Някои от тях са генерирани от ИИ, другите са истински човешки гласове. Ще ги различите ли?
Включете се до 1 август 2025 г. и при 6 правилни отговора участвате в жребия за скромен подарък.
Ще познаете ли кой глас е на човек и кой – на машина? Ръкавицата е хвърлена!

повече информация
Кой говори – човек или алгоритъм?

Кой говори – човек или алгоритъм?

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!
Време е за една звучна Дигитална история. А какво предизвикателство ви очаква след това…

повече информация
Колко изкара ИИ на матура?

Колко изкара ИИ на матура?

Какво ще стане, ако изпитаме на матурата по български език и литература три от най-мощните модели изкуствен интелект? Усилията им ще оценят двама опитни проверители на истинските зрелостни изпити. За да е състезанието още по-оспорвано и показателно, включваме двама реални зрелостници и мен, автора на тези редове.
Ще изкарат ли пълни шестици ChatGPT, Claude и Gemini, или ще се провалят с гръм и трясък?
Ще разпознаят ли учителите коя от работите е на изкуствен интелект и коя – на човек?
Кой ще получи най-високата и кой – най-ниската оценка?
Какво ще ни кажат резултатите и за най-показателния изпит в българското образование, и за напредъка на алгоритмите, и за големите въпроси, с които идват новите технологии?

повече информация

Най-новите:

Тест: Ще различите ли ИИ глас от човешки?

Тест: Ще различите ли ИИ глас от човешки?

6 аудиозаписа, в които е произнeсена кратка фраза. Някои от тях са генерирани от ИИ, другите са истински човешки гласове. Ще ги различите ли?
Включете се до 1 август 2025 г. и при 6 правилни отговора участвате в жребия за скромен подарък.
Ще познаете ли кой глас е на човек и кой – на машина? Ръкавицата е хвърлена!

повече информация
Кой говори – човек или алгоритъм?

Кой говори – човек или алгоритъм?

Не е новина, че ИИ генерира изображения и текстове, които (проверено!) не могат да бъдат различени от създадените от човека. Видеото като че ли все още изостава, но… Можете ли да си представите глас, неразличим от човешкия, който да чете новините? Или да ви се обади по телефона, без да има никакъв шанс да го различите? Не говорим за популярното решение гласът да бъде клониран, а за напълно изкуствено създаден, който обаче е толкова убедителен. При това на чист български, който е почти невъзможен за човек, чийто роден език не е!
Време е за една звучна Дигитална история. А какво предизвикателство ви очаква след това…

повече информация
Колко изкара ИИ на матура?

Колко изкара ИИ на матура?

Какво ще стане, ако изпитаме на матурата по български език и литература три от най-мощните модели изкуствен интелект? Усилията им ще оценят двама опитни проверители на истинските зрелостни изпити. За да е състезанието още по-оспорвано и показателно, включваме двама реални зрелостници и мен, автора на тези редове.
Ще изкарат ли пълни шестици ChatGPT, Claude и Gemini, или ще се провалят с гръм и трясък?
Ще разпознаят ли учителите коя от работите е на изкуствен интелект и коя – на човек?
Кой ще получи най-високата и кой – най-ниската оценка?
Какво ще ни кажат резултатите и за най-показателния изпит в българското образование, и за напредъка на алгоритмите, и за големите въпроси, с които идват новите технологии?

повече информация
„Хайде да спрем да се подценяваме!“

„Хайде да спрем да се подценяваме!“

Как да сме по-щастливи като общество? Как да изведем на следващо ниво ИТ сектора в България?
Седнали двама програмисти да си говорят за счупения обществен разговор, за разделението, за пътя на успеха. Звучи като начало на виц, а се получи сериозно и замислящо интервю в подкаста на DEV.BG. Думите, които разменихме, ми се сториха толкова важни, че ще ви ги представя и тук.
Веско Колев е начело на Icanpreneur – стартъп, който помага на повече ИТ компании да създадат работещ продукт. Има богат опит в софтуерния свят и особено интересни наблюдения, с които ще се срещнем днес.
Защо и как е време отново да започнем не само да се слушаме, но и да си говорим, дори когато ни разделя актуалният спор на деня? Защо е изграждащо и осмислящо честото „настъпване на мотиката“ и си струва да се радваме, когато детето ни получи слаба оценка? Какво ни е нужно като общество, за да вървим заедно напред, и то в епохата на напредналия изкуствен интелект?

повече информация
Питър Тийл. Консервативният визионер

Питър Тийл. Консервативният визионер

Facebook, SpaceX, Airbnb, LinkedIn, PayPal, Ethereum. Революцията на OpenAI и ChatGPT, възходът на Доналд Тръмп и вездесъщия му (доскорошен) съюзник Илон Мъск.
Наистина ли има една личност, която събира всички тези явления? Нещо повече – не е преувеличено да се каже, че ако не беше днешният ни герой, надали някое от тях щеше да се претвори в реалност…
Питър Тийл си е спечелил името на пророк, на гуру. На големия визионер на технологичните времена. Докато в същото време има толкова противоречиви възгледи, които някак си остават встрани от големия медиен шум. Но това е типично за родения в Германия предприемач. Някои го приемат за сивия кардинал на Силициевата долина, други – за мъдрец, който може да покаже на всеки пътя към големия успех в технологичната епоха.
Мултимилиардер, той казва, че конкуренцията е измамно благо, а монополите са решението на бъдещето. Създава мащабна програма, за да помага на хора, избрали да изоставят образованието си, за да създадат собствен бизнес, което пък проправя пътя на следващото поколение технологични лидери.
Всичко това и още много е г-н Тийл. Време е да застане под светлината на прожекторите, защото със сигурност е един от хората, които вече са променили живота на всеки от нас. Нещо повече – от него се очаква да зависи все повече в турболентните технологични времена, в които живеем.

повече информация
„Днес можем да сме всичко, а избираме да сме еднакви“

„Днес можем да сме всичко, а избираме да сме еднакви“

Защо е толкова важно да разберем умеем ли да различаваме детските рисунки от генерирани изображения? Как изглежда бъдещето на творчеството, на изкуството, на човека във времената, когато алгоритмите се оказват неразличими и дори по-добри автори от нас самите? На какво има смисъл да учим децата днес?
Можете ли да различите 15 детски рисунки от 15 изображения, генерирани от изкуствен интелект? Предизвикателството за деца и родители на Дигитални истории за броени дни провокира над 2500 души да проверят интуицията си! Резултатите от теста се очертават изключително интересни, ще поговорим за тях след края му – на 1 юли.
Експериментът е създаден заедно с днешната ни гостенка – Елица Станева-Бритън. Психолог, журналист, преподавател, в момента тя работи по докторската си дисертация в БАН, а темата е творчеството в ерата на изкуствения интелект. Дойде време да поговорим по всяка от тези теми.

повече информация
Share This