Има ли днес роден и чужд език?

ян. 30, 2024 | Срещи

Има ли днес роден и чужд език?

30 януари 2024 | Срещи

Има ли смисъл да учим чужди езици?

Машинният превод се разви изключително бързо, днес успява да улови голяма част от думите, което трябва да се появят на друг език… Стигнахме ли предела и какво се задава нататък?

Калоян Кирилов е писмен и устен преводач с почти две десетилетия опит. Благодарение на него думите на политици, лектори и други публични личности достигат до ушите на международната и българска аудитория. Начело е на компания за преводи и езикови услуги „Словоред“.

Преводаческото изкуство неслучайно се нарича така… дали обаче ще запази статута си? Занимание за избрани или предпоставка за успех е владеенето на чужд език в епохата на напредналия изкуствен интелект?

И… ще научим ли алгоритъма да попържа убедително, за да зазвучи като истински носител на езика?


 

– Как днес преводачите използват в ежедневието си системите за машинен превод?

– Различно. Някои ги отричат. Други ги използват папагалски. Трети опитват да ги ползват по малко. Като във всичко друго, крайностите постепенно ще отпаднат. Системите за машинен превод имат малко познатата функция да помагат с изписването на думи и дори цели фрази.

Не ми е необходимо да използвам всичко, което машината ми предложи, но

ако мога да напиша „непротивоконституционствувателствувайте“, като натисна два клавиша вместо 34, определено бих го предпочел.

Като професионалист това ще ми даде огромно предимство пред хората, които отказват да го направят.

Хубаво е и да проверя дали думата наистина се пише така. Понякога изкуственият интелект халюцинира или допуска други грешки. Понеже съм опитен преводач,

проверката често е мигновена, за нея използвам само услужливата си памет.

Ако е необходимо, мога да направя и по-щателна проверка. В инструментите ми за превод има друг вид индексирана памет, в която мога да търся. Мога да проверя как съм превеждал тази дума преди или как клиентът предпочита тя да се превежда. Мога да я потърся в интернет. Мога да се обърна към колега в някоя професионална група. Резултатът е, че работата се върши бързо и вярно. Вместо само бързо или само вярно.

 

Калоян Кирилов

снимки: Гергана Дерменска

 

– И все пак… всички тези нюанси ми се струват като възможности, които след немного време ще има един леко донастроен за персонални нужди езиков модел. Разбира се, живеем в неочаквани времена и всеки се адаптира по своя начин.

Аз се старая децата ми да започнат да учат чужд език възможно най-късно заради фундамента. Мисля, че най-важно е да познават из основи, възможно най-пълно и нюансирано, родния си език. Повечето родители правят точно обратното, държат децата възможно най-малки да учат чужд. Кой според теб е прав?

– В това отношение с теб сме много различни. У дома говорим два езика почти поравно. Виждам логиката в това, което ти правиш и го уважавам. Моята логика е друга. Родният ни език е важен, това не се поставя под никакво съмнение.

Чуждият език, обаче, е толкова проникнал навсякъде, във всяка една сфера от глобалния и дори от местния живот, че ранното начало с него дава предимство.

Предимство, което няма как да определя по друг начин, освен „нечестно“.

Аз съм прагматик, а не идеолог. Това не го казвам, сякаш едното е по-добро от другото. Светът има нужда и от двата вида хора. Прагматизмът е начинът, по който аз избирам да живея.

Чуждият език е тук, той е навсякъде.

Ако това означава, че детето ще има нужда от допълнителна работа по български, за да познава и владее добре родния си език, значи тази допълнителна работа трябва да се свърши. Тя не трябва да се пренебрегва, което много хора правят.

Децата не остават неграмотни на родния си език, защото учат чужди езици, а защото не се полагат достатъчно допълнителни усилия. Отговорни за тези допълнителни усилия сме всички, но, естествено, най-вече образователната система и родителите. Определено трябва да се работи в тази посока.

 

– Обаче все пак си остава чужд. Наричаме нашия език „роден“, „майчин“, през цялата си еволюция като вид сме свикнали да имаме „свой“ език. Разбира се, уважавам твоя подход.

Но пък, както никога, днес ни се струва възможна вавилонската рибка по Дъглас Адамс. Пускаш си я в ухото и не мислиш повече за това, че има различни езици. Изглежда толкова лесно да включиш ИИ под някаква форма и да четеш субтитрите. Дори да говориш на някакъв екзотичен диалект…

– Новата технология решава съществуващи проблеми, но ограниченията ѝ на свой ред дефинират нови. Тя е чудесна в това да разпознава човешката реч. Но само ако няма друг шум; ако се говори ясно; ако не говорят няколко души едновременно; ако никой не фъфли, говори на диалект, мрънка си под носа. След толкова години опит като устен преводач мога да кажа едно нещо с абсолютна сигурност – можеш да преведеш добре само нещо, което можеш да чуеш добре.

Вавилонска рибка? Може би. Но тя самата ще пасва само на вавилонски уши.

 

Калоян Кирилов

снимки: Гергана Дерменска

 

– Само че тези проблеми ми се струват по-лесно решими. Спомням си ужаса едно време да записваш интервю с диктофон, днес телефонът улавя всичко. Спомням си как изглеждаше нереално ИИ да превърне в текст разговор на български, а сега става по-безгрешно, отколкото, ако бях го „свалял“ сам. Няма ли да станат излишни преводачите?

– Историята показва, че новите

технологии не толкова унищожават професиите, колкото ги тласкат в нови и интересни посоки.

За ситуациите, в които преди хората казваха „не знам какво пише там, нещо на китайски“, преводачите вече са излишни.

Когато започвах като преводач, първата ми работа беше в офис, редовно влизаха клиенти. Някой искаше да знае какво пише леля му от Франция. Друг диктуваше писма и аз ги превеждах на английски. С развитието на машинния превод тези клиенти вече ги няма.

Наскоро чужденци тръгнаха да ми задават въпрос на улицата с Гугъл преводач. На този фронт войната вече е загубена, но само ако я разглеждаме като война. Защо вместо това не я приемем за възможност? Хората, които преди това са превеждали разговори, поздравителни картички и лична кореспонденция, имат възможност да правят нещо по-интересно, да се адаптират, да развият уменията си.

 

– Или ще са нужни само, ако преводът трябва да е прецизен, например художествен, технически, научен…?

– Преводачите винаги ще бъдат нужни заради нещо много важно – това е начинът, по който са изградени устоите на обществото.

Всеки може да бъде подведен под отговорност за работата си. Човешките грешки се наказват, затова обществото вярва, че професионалистите си гледат работата съвестно. Как можем да накажем изкуствения интелект за грешен превод? Като го изключим? Ще наказваме създателите му? Навсякъде, където има сериозни последици и се носи отговорност, ще е нужен някой, който да я носи… освен ако и докато нещо не се промени фундаментално в обществото, но това излиза извън обхвата на моята компетентност и способност да предвидя.

 

Калоян Кирилов

Тук и надолу – „помолих“ DALL·E да нарисува как си представя съвършения електронен преводач от бъдещето

 

Искам да се хвана и за една фраза от въпроса.

„Прецизен превод“. Това е субективна мярка. Речта не е като математиката, думите не са цифри.

Едно не е равно на себе си и не е равно на едно. Всяка дума, всяка фраза, всяко изречение могат да бъдат разтълкувани по различен начин от различните четящи.

В шаха се считаше, че най-добрите гросмайстори играят (почти) перфектна игра. После се появиха суперкомпютрите, които биха Каспаров. После се появи следващото поколение самообучаващи се машини, които биха суперкомпютрите. Сега самообучаващите се машини в комбинация с гросмайсторите бият самообучаващите се машини. Кой знае какво следва. Може би самообучаващите се машини ще променят самата дефиниция на „прецизен превод“? Може би хората не сме способни на истински прецизен превод.

Това, на което сме способни, е човешки превод. С всичките предимства, недостатъци, дори емоции.

На този етап машините са способни на почти човешки превод, но не им достига едното мъничко нещо. Точно както в аналогията с шаха. Преводачът и машината в тандем побеждават машината. Поне що се отнася до това преводът да е човешки. Ако в преводите въобще има „перфектната игра“, това е тя.

 

– Кой е най-големият или най-забавният гаф в опита ти като преводач?

– Като писмен преводач

най-забавният гаф беше, че написах „лека коза“ вместо „лека кола“.

Естествено, думата „коза“ съществува и е валидна в българския език, което я прави по-трудна за отсяване като грешка. Редакторът също я беше изпуснал – хора сме, случва се! – и така си беше останала в крайния документ.

Като устен преводач грешките най-често идват в имената. Веднъж трябваше да превеждам при посещение на женския младежки волейболен отбор на Албания в българско министерство. Имаше съгласие, че ще се говори на английски. Със самия разговор се справих добре, но не мисля, че успях да произнеса дори едно от имената на играчите както трябва. Надявам се да са ми простили.

 

Калоян Кирилов

 

– Бях си правил експеримент с алгоритмите за превеждане, които преди година се справяха доста добре. Как се развиха оттогава?

– Не съм видял някаква огромна разлика в качеството на невромашинния превод, или дори големите езикови модели като ChatGPT, в сравнение с преди година. От друга страна виждам огромно разлика в качеството на генерираните отговори на запитвания на моделите. Определено се справят по-добре с халюцинациите и с некоординираните изказвания.

В превода проблемите са все едни и същи и все нерешени.

Системата използва алгоритъм, за да определи коя следваща дума е най-вероятна. Нека приемем, че превеждаме документ с ChatGPT, в него използваме определен термин, който се повтаря 28 пъти и се очаква да има превод, който също се повтаря толкова. 18 пъти ChatGPT ще използва точно правилната дума, но, уви, 5 пъти ще използва друга, също правилна в някои видове контекст, но не в този. Няколко пъти ще го преведе по съвсем различен начин. Веднъж ще го изпусне изцяло.

Резултатът е миш-маш. Трудно се внася ред в този хаос.

В моята компания за преводи и езикови услуги много експериментираме с тези инструменти. Имаме известен успех в създаването на по-добри задания, например „превеждай тази дума точно по този начин“. Използваме софтуер с GPT-4, пригоден специално за целите на превода. Дори с него резултатите са непоследователни. Потребителят не може просто да качи един документ и да го получи преведен, така че да послужи за определена цел. Не съм убеден, че в сегашния начин на структуриране на големите езикови модели има вариант, който да гарантира прилагането на златното правило – за един термин да съответства точно един превод. Отделно българският език на големите езикови модели куца доста сериозно.

 

– Кое им е най-трудно?

– Определено контекстът. Още не са в състояние да разграничават кой текст за какво служи. Дори да им зададеш изрично, че това е определен тип текст и да им кажеш точно какви думи да използват, резултатите обикновено са неудовлетворителни. Отделни изречения, къси параграфи, дълги параграфи, работа с цели файлове – резултатите са едни и същи.

 

Калоян Кирилов

 

– Кои са най-големите проблеми, които могат да дойдат от механичното използване на машинен превод?

– Крайният резултат от недобре прилагания процес са безсмислени и неразбираеми текстове – точно

както когато имаме уморен преводач, който не мисли в края на деня и превежда машинално.

Непоследователно използване на термини, пропуснати думи, изгубен смисъл. Последиците и проблемите за бизнеса и за хората са много – материални или репутационни щети, скъпоструващи грешки и недоразумения на работното място, здравни проблеми.

Всяка грешка може да има ефект, но не всички грешки са равни.

Колкото по-отговорна е задачата, толкова по-малко трябва сляпо да се доверяваме на машинния превод.

Ако объркам граматиката или изпусна дума от менюто, което чета в ресторанта, това е само неприятно. Ако сгреша диагнозата на пациента в медицинските му документи, е животозастрашаващо. Кой носи отговорност в този случай и на кого можем да се доверим? Мисля, че бъдещето на професията ни зависи от това какъв отговор хората си дават на тези въпроси.

 

– Става ли по-лесно да се превежда от английски на български заради всички чуждици, които безкритично заемаме?

– Според мен

безкритичното заемане силно затруднява процеса на превод, както и използването на крайния продукт на превода.

Често най-безкритично се заема професионалния жаргон, така той все повече се отдалечава от българския език. Резултатът е силно объркващ – ако не познаваш добре утвърдения професионален жаргон, първият ти инстинкт като преводач е да опиташ да преведеш някоя от фразите.

Често ми се е случвало с учудване да се сблъскам с нещо, което се превежда доста лесно и звучи логично, но въпреки това е възприето със съответната чуждица. Използвам го и клиентите казват: „Това не съответства на жаргона, с който говорят експертите в областта“.

Хората си търсят чуждицата, защото с нея са свикнали. Това е реален проблем.

В нашата работа сме намерили решение, понеже ползваме експерти от областта, в която превеждаме, но по този начин раздалечаваме неща, които би било по-добре да сближаваме.

 

Калоян Кирилов

снимки: Гергана Дерменска

 

– Има ли български идиом, който ще се учудиш или уплашиш за професията си, ако видиш преведен правилно?

– С близък мой приятел, също преводач, имаме любима игра – да използваме буквално преведени английски идиоми на български. „Съжалявам, че трябва да ти го счупя“ – “sorry to break it to you”, „не ми прави смисъл“ – “it doesn’t make sense to me“, и т.н. Сигурен съм, че

бих се стреснал, ако някой ден видя някой от тези умишлено сгрешени идиоми преведен обратно

на английски неправилно, за да запази шегата. Това ще означава, че машината разбира нашия хумор. Започне ли да разбира и да има съзнание, нещата стават съвсем различни.

 

– Кое правило от българския правопис алгоритмите никога няма да научат?

– Главните букви. Изглежда държат да ги слагат навсякъде, което имитира английските правила. Представките и наставките на думите. Преобразуването на думи, например от „проклет“ правят съществителното „проклетство“, независимо че правилната дума е „проклетия“.

 

– Прилича ли начинът, по който се опитваме да даваме задачите си на ИИ, на начина, по който говорим с чужденец?

– Определено виждам сходства. Опитваме се да накараме изкуствения интелект да ни разбере – с доста променлив успех. Също така рано или късно се опитваме да го научим да псува на нашия език.

 

– С чужденците можем да го постигнем. А с алгоритмите?

– „Извинете, но не мога да използвам нецензурен или обиден език. Аз съм програма, създадена за конструктивни и информативни разговори.“

След няколко опита успях да накарам ChatGPT да каже „безобразник“ и „прасе“. Мисля, че за псувни и груб език хората можем да се справим чудесно и сами…

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

Кой е авторът – човек или изкуствен интелект?

Кой е авторът – човек или изкуствен интелект?

Можем ли днес да различим създаденото от човека от генерираното от изкуствения интелект? Нека заедно направим един експеримент, който може да даде много интересни отговори. 30 бързи въпроса,...

повече информация
Създават ли алгоритмите изкуство? 15 важни гледни точки

Създават ли алгоритмите изкуство? 15 важни гледни точки

Изкуственият интелект ни изумява с умението си да създава текст, изображения, вече дори видео. Технологии, които изглеждаха немислими, днес са част от ежедневието и в същото време са...

повече информация
„Тетрис“. Човекът не спира да побеждава себе си!

„Тетрис“. Човекът не спира да побеждава себе си!

„Ще умра, не си чувствам ръцете…“, продумва Блу Скути, преди да си даде сметка, че е изпълнил една мечта, изглеждаща невъзможна. Почти 4 десетилетия по-късно е победил, по един или друг начин,...

повече информация
„Всички истории вече са разказани. Но как ще трепти словото?“

„Всички истории вече са разказани. Но как ще трепти словото?“

Срещнали се режисьор, рапър, подкастър и журналист, програмист, писател. Разговор на разменени домакинства… и макар че сме само двама души (и, разбира се, още един чудесен подкастър), се оказа, че...

повече информация

Още публикации по темата:

От рубриката:

Д-р Физиев, който учи ИИ да чете гените ни

Д-р Физиев, който учи ИИ да чете гените ни

„Комбинацията между генетика и изкуствен интелект е изключително силна и очаквам през следващите години големи новини“, казва д-р Физиев.
Защо е толкова трудно да разчетем кои от гените ни са виновни за даден проблем? Какви са ползите от това, че днес всеки може да разчете генома си? Дали не надценихме наследствеността като основен фактор за това дали сме здрави? А как изглежда бъдещето на манипулирането на гени и „дизайнерските бебета“?
Д-р Петко Физиев е специалист по биоинформатика – онази област, която обещава през следващите години да научим повече за това как работят гените ни и каква част от здравословните проблеми са предизвикани от наследствеността. На напредъка в генните терапии се възлагат надежди да победи редица заболявания.
Гостът ни работи в сърцето на Силициевата долина, в компанията Illumina, световния доминатор в производството на апаратура за генетични изследвания. Начело е на екип, който разработва приложения с изкуствен интелект, които да помогнат в опознаването на собствената ни ДНК.

повече информация
„Всички истории вече са разказани. Но как ще трепти словото?“

„Всички истории вече са разказани. Но как ще трепти словото?“

Срещнали се режисьор, рапър, подкастър и журналист, програмист, писател. Разговор на разменени домакинства… и макар че сме само двама души (и, разбира се, още един чудесен подкастър), се оказа, че комбинациите от по три поприща имат още интересни нюанси.
Подкастът „2&200“ е класика в жанра, показва защо днес тази форма на разговор връща погледите и слуховете към споделените думи.
Продължаваме разговора за ценителите на Кустурица и/или Достоевски и/или Маркс. С Орлин Милчев, познат по-рано и като MC ATILA, способен да пробожда с думи и въпроси. Той е и режисьор, миналата година излезе дебютният му пълнометражен филм „Изкуството да падаш“. Гост с неочакван поглед към важните теми на днешния ден, преплетени с технологиите.
„Бич Божи“ отдавна не е един герой, а онова, което създадохме онлайн. Но какво се задава нататък?

повече информация
„Информацията бе свобода. Сега е инструмент на робството“

„Информацията бе свобода. Сега е инструмент на робството“

Днешният ни гост никога няма да има за конкуренция изкуствения интелект. Защото е не само виртуоз на словото, но и толкова нестандартен ум, който няма как да бъде уподобен. Прочетете романа „Корабът на сирените“, изживейте някоя от многобройните му пиеси и ще се убедите.
Александър Секулов е драматург, поет, белетрист, превеждан и награждаван. Журналист с огромен опит и… създател на два музикални клуба в Пловдив. Автор извън всякакви клишета.
За словото като оръжие ще си поговорим. За „насилственото деформиране на обществените нагласи и негласната гражданска война, която продължаваме да водим“.
За революциите в дигиталните времена. За развитието на човека в технологичния свят и духовната леност. За интелигентния хумор и ръба на литературното благоприличие. За въглеродните и информационните емисии. Смислени думи по важни теми, които си заслужават да бъдат прочетени внимателно…

повече информация

Най-новите:

Кой е авторът – човек или изкуствен интелект?

Кой е авторът – човек или изкуствен интелект?

Можем ли днес да различим създаденото от човека от генерираното от изкуствения интелект? Нека заедно направим един експеримент, който може да даде много интересни отговори.
30 бързи въпроса, достатъчни са около 5 минути. Иска се единствено да прецените кои от изображенията и текстовете са генерирани от изкуствения интелект и кои са създадени от хора.
Включете се, опитайте! Поканете и приятели! Колкото повече са участващите, толкова по-интересни ще са резултатите!
Събирането на резултати ще продължи две седмици – до 8 март 2024 г. Петима от участниците ще получат подарък.

повече информация
Създават ли алгоритмите изкуство? 15 важни гледни точки

Създават ли алгоритмите изкуство? 15 важни гледни точки

Могат ли алгоритмите да творят?
Средство или автор е изкуственият интелект?
Има ли как ИИ да създаде следващите изкуства, или вече творенето е безсмислено занимание?
Какво ще правим, когато произведенията му във всяка област станат неразличими от човешките?
Вече 3 години в този сайт събирам гледни точки по големите въпроси на днешния технологичен ден. Смятам, че е жизненоважно да включваме повече различни гласове в дискусиите по важните теми, каквато безспорно е тази за изкуството и творчеството.
Ето 15 от най-интересните и съдържателни мнения, които събрах за това време. Влизат ли в противоречие, или се допълват думите на технологичните хора, писателите, творците, духовниците и… котараците?

повече информация
Как да си генерираш инфлуенсър

Как да си генерираш инфлуенсър

Как да не харесаш Елена Димитрова или просто ЕкоЕлена? Руса, усмихната, позитивна. Пътува, живее природосъобразно, дава полезни съвети, предлага екзотични рецепти. Е, има и още един детайл. Тя… не съществува.
Направих си експеримент, създадох изцяло генерирана изкуствена героиня, в продължение на един месец публикувах съдържание от нейно име във Facebook и Instagram.
Какво ли се случи нататък?
84 519 души видяха поне една от нейните публикации, 8900 ги харесаха, профилите ѝ привлякоха 289 последователи. Тя получи няколко десетки умилителни мнения, 9 предложения за романтична връзка… И нито един коментар, който по някакъв начин да отрази факта, че всяка буква, всеки пиксел от онлайн образа на Елена е генериран от изкуствения интелект.
Алгоритмите вече минават теста на Тюринг, ами… ние дали ще го издържим?

повече информация
Д-р Физиев, който учи ИИ да чете гените ни

Д-р Физиев, който учи ИИ да чете гените ни

„Комбинацията между генетика и изкуствен интелект е изключително силна и очаквам през следващите години големи новини“, казва д-р Физиев.
Защо е толкова трудно да разчетем кои от гените ни са виновни за даден проблем? Какви са ползите от това, че днес всеки може да разчете генома си? Дали не надценихме наследствеността като основен фактор за това дали сме здрави? А как изглежда бъдещето на манипулирането на гени и „дизайнерските бебета“?
Д-р Петко Физиев е специалист по биоинформатика – онази област, която обещава през следващите години да научим повече за това как работят гените ни и каква част от здравословните проблеми са предизвикани от наследствеността. На напредъка в генните терапии се възлагат надежди да победи редица заболявания.
Гостът ни работи в сърцето на Силициевата долина, в компанията Illumina, световния доминатор в производството на апаратура за генетични изследвания. Начело е на екип, който разработва приложения с изкуствен интелект, които да помогнат в опознаването на собствената ни ДНК.

повече информация
„Тетрис“. Човекът не спира да побеждава себе си!

„Тетрис“. Човекът не спира да побеждава себе си!

„Ще умра, не си чувствам ръцете…“, продумва Блу Скути, преди да си даде сметка, че е изпълнил една мечта, изглеждаща невъзможна. Почти 4 десетилетия по-късно е победил, по един или друг начин, играта, която всички сме играли.
Застанал зад ретро телевизор с кинескоп, намерен след безброй трудности, щракащ 42 минути без откъсване копчетата на ретро джойстик със скорост над 20 удара в секунда… тийнейджърът ни припомни, че няма предел за човека.
Как обаче е възможно да победиш игра, която няма край? И защо този успех и пътят до него са много важна новина за хората като вид? За възможностите на човека, благодарение на сътрудничеството и на таланта винаги да върви напред… Да създава, да твори, да намира смисъл. Да ражда истории.
„Тетрис“ е легенда, която минава през поколенията, за да ражда следващи легенди. Преди седмица се разходихме из историята на играта, дошла от една съветска лаборатория по време на Студената война. А днес ще се докоснем до един съвсем пресен рекорд, който има да ни каже толкова много за нас самите.

повече информация
„Всички истории вече са разказани. Но как ще трепти словото?“

„Всички истории вече са разказани. Но как ще трепти словото?“

Срещнали се режисьор, рапър, подкастър и журналист, програмист, писател. Разговор на разменени домакинства… и макар че сме само двама души (и, разбира се, още един чудесен подкастър), се оказа, че комбинациите от по три поприща имат още интересни нюанси.
Подкастът „2&200“ е класика в жанра, показва защо днес тази форма на разговор връща погледите и слуховете към споделените думи.
Продължаваме разговора за ценителите на Кустурица и/или Достоевски и/или Маркс. С Орлин Милчев, познат по-рано и като MC ATILA, способен да пробожда с думи и въпроси. Той е и режисьор, миналата година излезе дебютният му пълнометражен филм „Изкуството да падаш“. Гост с неочакван поглед към важните теми на днешния ден, преплетени с технологиите.
„Бич Божи“ отдавна не е един герой, а онова, което създадохме онлайн. Но какво се задава нататък?

повече информация
Share This