Има ли смисъл да учим чужди езици?
Машинният превод се разви изключително бързо, днес успява да улови голяма част от думите, което трябва да се появят на друг език… Стигнахме ли предела и какво се задава нататък?
Калоян Кирилов е писмен и устен преводач с почти две десетилетия опит. Благодарение на него думите на политици, лектори и други публични личности достигат до ушите на международната и българска аудитория. Начело е на компания за преводи и езикови услуги „Словоред“.
Преводаческото изкуство неслучайно се нарича така… дали обаче ще запази статута си? Занимание за избрани или предпоставка за успех е владеенето на чужд език в епохата на напредналия изкуствен интелект?
И… ще научим ли алгоритъма да попържа убедително, за да зазвучи като истински носител на езика?
– Как днес преводачите използват в ежедневието си системите за машинен превод?
– Различно. Някои ги отричат. Други ги използват папагалски. Трети опитват да ги ползват по малко. Като във всичко друго, крайностите постепенно ще отпаднат. Системите за машинен превод имат малко познатата функция да помагат с изписването на думи и дори цели фрази.
Не ми е необходимо да използвам всичко, което машината ми предложи, но
ако мога да напиша „непротивоконституционствувателствувайте“, като натисна два клавиша вместо 34, определено бих го предпочел.
Като професионалист това ще ми даде огромно предимство пред хората, които отказват да го направят.
Хубаво е и да проверя дали думата наистина се пише така. Понякога изкуственият интелект халюцинира или допуска други грешки. Понеже съм опитен преводач,
проверката често е мигновена, за нея използвам само услужливата си памет.
Ако е необходимо, мога да направя и по-щателна проверка. В инструментите ми за превод има друг вид индексирана памет, в която мога да търся. Мога да проверя как съм превеждал тази дума преди или как клиентът предпочита тя да се превежда. Мога да я потърся в интернет. Мога да се обърна към колега в някоя професионална група. Резултатът е, че работата се върши бързо и вярно. Вместо само бързо или само вярно.
– И все пак… всички тези нюанси ми се струват като възможности, които след немного време ще има един леко донастроен за персонални нужди езиков модел. Разбира се, живеем в неочаквани времена и всеки се адаптира по своя начин.
Аз се старая децата ми да започнат да учат чужд език възможно най-късно заради фундамента. Мисля, че най-важно е да познават из основи, възможно най-пълно и нюансирано, родния си език. Повечето родители правят точно обратното, държат децата възможно най-малки да учат чужд. Кой според теб е прав?
– В това отношение с теб сме много различни. У дома говорим два езика почти поравно. Виждам логиката в това, което ти правиш и го уважавам. Моята логика е друга. Родният ни език е важен, това не се поставя под никакво съмнение.
Чуждият език, обаче, е толкова проникнал навсякъде, във всяка една сфера от глобалния и дори от местния живот, че ранното начало с него дава предимство.
Предимство, което няма как да определя по друг начин, освен „нечестно“.
Аз съм прагматик, а не идеолог. Това не го казвам, сякаш едното е по-добро от другото. Светът има нужда и от двата вида хора. Прагматизмът е начинът, по който аз избирам да живея.
Чуждият език е тук, той е навсякъде.
Ако това означава, че детето ще има нужда от допълнителна работа по български, за да познава и владее добре родния си език, значи тази допълнителна работа трябва да се свърши. Тя не трябва да се пренебрегва, което много хора правят.
Децата не остават неграмотни на родния си език, защото учат чужди езици, а защото не се полагат достатъчно допълнителни усилия. Отговорни за тези допълнителни усилия сме всички, но, естествено, най-вече образователната система и родителите. Определено трябва да се работи в тази посока.
– Обаче все пак си остава чужд. Наричаме нашия език „роден“, „майчин“, през цялата си еволюция като вид сме свикнали да имаме „свой“ език. Разбира се, уважавам твоя подход.
Но пък, както никога, днес ни се струва възможна вавилонската рибка по Дъглас Адамс. Пускаш си я в ухото и не мислиш повече за това, че има различни езици. Изглежда толкова лесно да включиш ИИ под някаква форма и да четеш субтитрите. Дори да говориш на някакъв екзотичен диалект…
– Новата технология решава съществуващи проблеми, но ограниченията ѝ на свой ред дефинират нови. Тя е чудесна в това да разпознава човешката реч. Но само ако няма друг шум; ако се говори ясно; ако не говорят няколко души едновременно; ако никой не фъфли, говори на диалект, мрънка си под носа. След толкова години опит като устен преводач мога да кажа едно нещо с абсолютна сигурност – можеш да преведеш добре само нещо, което можеш да чуеш добре.
Вавилонска рибка? Може би. Но тя самата ще пасва само на вавилонски уши.
– Само че тези проблеми ми се струват по-лесно решими. Спомням си ужаса едно време да записваш интервю с диктофон, днес телефонът улавя всичко. Спомням си как изглеждаше нереално ИИ да превърне в текст разговор на български, а сега става по-безгрешно, отколкото, ако бях го „свалял“ сам. Няма ли да станат излишни преводачите?
– Историята показва, че новите
технологии не толкова унищожават професиите, колкото ги тласкат в нови и интересни посоки.
За ситуациите, в които преди хората казваха „не знам какво пише там, нещо на китайски“, преводачите вече са излишни.
Когато започвах като преводач, първата ми работа беше в офис, редовно влизаха клиенти. Някой искаше да знае какво пише леля му от Франция. Друг диктуваше писма и аз ги превеждах на английски. С развитието на машинния превод тези клиенти вече ги няма.
Наскоро чужденци тръгнаха да ми задават въпрос на улицата с Гугъл преводач. На този фронт войната вече е загубена, но само ако я разглеждаме като война. Защо вместо това не я приемем за възможност? Хората, които преди това са превеждали разговори, поздравителни картички и лична кореспонденция, имат възможност да правят нещо по-интересно, да се адаптират, да развият уменията си.
– Или ще са нужни само, ако преводът трябва да е прецизен, например художествен, технически, научен…?
– Преводачите винаги ще бъдат нужни заради нещо много важно – това е начинът, по който са изградени устоите на обществото.
Всеки може да бъде подведен под отговорност за работата си. Човешките грешки се наказват, затова обществото вярва, че професионалистите си гледат работата съвестно. Как можем да накажем изкуствения интелект за грешен превод? Като го изключим? Ще наказваме създателите му? Навсякъде, където има сериозни последици и се носи отговорност, ще е нужен някой, който да я носи… освен ако и докато нещо не се промени фундаментално в обществото, но това излиза извън обхвата на моята компетентност и способност да предвидя.
Искам да се хвана и за една фраза от въпроса.
„Прецизен превод“. Това е субективна мярка. Речта не е като математиката, думите не са цифри.
Едно не е равно на себе си и не е равно на едно. Всяка дума, всяка фраза, всяко изречение могат да бъдат разтълкувани по различен начин от различните четящи.
В шаха се считаше, че най-добрите гросмайстори играят (почти) перфектна игра. После се появиха суперкомпютрите, които биха Каспаров. После се появи следващото поколение самообучаващи се машини, които биха суперкомпютрите. Сега самообучаващите се машини в комбинация с гросмайсторите бият самообучаващите се машини. Кой знае какво следва. Може би самообучаващите се машини ще променят самата дефиниция на „прецизен превод“? Може би хората не сме способни на истински прецизен превод.
Това, на което сме способни, е човешки превод. С всичките предимства, недостатъци, дори емоции.
На този етап машините са способни на почти човешки превод, но не им достига едното мъничко нещо. Точно както в аналогията с шаха. Преводачът и машината в тандем побеждават машината. Поне що се отнася до това преводът да е човешки. Ако в преводите въобще има „перфектната игра“, това е тя.
– Кой е най-големият или най-забавният гаф в опита ти като преводач?
– Като писмен преводач
най-забавният гаф беше, че написах „лека коза“ вместо „лека кола“.
Естествено, думата „коза“ съществува и е валидна в българския език, което я прави по-трудна за отсяване като грешка. Редакторът също я беше изпуснал – хора сме, случва се! – и така си беше останала в крайния документ.
Като устен преводач грешките най-често идват в имената. Веднъж трябваше да превеждам при посещение на женския младежки волейболен отбор на Албания в българско министерство. Имаше съгласие, че ще се говори на английски. Със самия разговор се справих добре, но не мисля, че успях да произнеса дори едно от имената на играчите както трябва. Надявам се да са ми простили.
– Бях си правил експеримент с алгоритмите за превеждане, които преди година се справяха доста добре. Как се развиха оттогава?
– Не съм видял някаква огромна разлика в качеството на невромашинния превод, или дори големите езикови модели като ChatGPT, в сравнение с преди година. От друга страна виждам огромно разлика в качеството на генерираните отговори на запитвания на моделите. Определено се справят по-добре с халюцинациите и с некоординираните изказвания.
В превода проблемите са все едни и същи и все нерешени.
Системата използва алгоритъм, за да определи коя следваща дума е най-вероятна. Нека приемем, че превеждаме документ с ChatGPT, в него използваме определен термин, който се повтаря 28 пъти и се очаква да има превод, който също се повтаря толкова. 18 пъти ChatGPT ще използва точно правилната дума, но, уви, 5 пъти ще използва друга, също правилна в някои видове контекст, но не в този. Няколко пъти ще го преведе по съвсем различен начин. Веднъж ще го изпусне изцяло.
Резултатът е миш-маш. Трудно се внася ред в този хаос.
В моята компания за преводи и езикови услуги много експериментираме с тези инструменти. Имаме известен успех в създаването на по-добри задания, например „превеждай тази дума точно по този начин“. Използваме софтуер с GPT-4, пригоден специално за целите на превода. Дори с него резултатите са непоследователни. Потребителят не може просто да качи един документ и да го получи преведен, така че да послужи за определена цел. Не съм убеден, че в сегашния начин на структуриране на големите езикови модели има вариант, който да гарантира прилагането на златното правило – за един термин да съответства точно един превод. Отделно българският език на големите езикови модели куца доста сериозно.
– Кое им е най-трудно?
– Определено контекстът. Още не са в състояние да разграничават кой текст за какво служи. Дори да им зададеш изрично, че това е определен тип текст и да им кажеш точно какви думи да използват, резултатите обикновено са неудовлетворителни. Отделни изречения, къси параграфи, дълги параграфи, работа с цели файлове – резултатите са едни и същи.
– Кои са най-големите проблеми, които могат да дойдат от механичното използване на машинен превод?
– Крайният резултат от недобре прилагания процес са безсмислени и неразбираеми текстове – точно
както когато имаме уморен преводач, който не мисли в края на деня и превежда машинално.
Непоследователно използване на термини, пропуснати думи, изгубен смисъл. Последиците и проблемите за бизнеса и за хората са много – материални или репутационни щети, скъпоструващи грешки и недоразумения на работното място, здравни проблеми.
Всяка грешка може да има ефект, но не всички грешки са равни.
Колкото по-отговорна е задачата, толкова по-малко трябва сляпо да се доверяваме на машинния превод.
Ако объркам граматиката или изпусна дума от менюто, което чета в ресторанта, това е само неприятно. Ако сгреша диагнозата на пациента в медицинските му документи, е животозастрашаващо. Кой носи отговорност в този случай и на кого можем да се доверим? Мисля, че бъдещето на професията ни зависи от това какъв отговор хората си дават на тези въпроси.
– Става ли по-лесно да се превежда от английски на български заради всички чуждици, които безкритично заемаме?
– Според мен
безкритичното заемане силно затруднява процеса на превод, както и използването на крайния продукт на превода.
Често най-безкритично се заема професионалния жаргон, така той все повече се отдалечава от българския език. Резултатът е силно объркващ – ако не познаваш добре утвърдения професионален жаргон, първият ти инстинкт като преводач е да опиташ да преведеш някоя от фразите.
Често ми се е случвало с учудване да се сблъскам с нещо, което се превежда доста лесно и звучи логично, но въпреки това е възприето със съответната чуждица. Използвам го и клиентите казват: „Това не съответства на жаргона, с който говорят експертите в областта“.
Хората си търсят чуждицата, защото с нея са свикнали. Това е реален проблем.
В нашата работа сме намерили решение, понеже ползваме експерти от областта, в която превеждаме, но по този начин раздалечаваме неща, които би било по-добре да сближаваме.
– Има ли български идиом, който ще се учудиш или уплашиш за професията си, ако видиш преведен правилно?
– С близък мой приятел, също преводач, имаме любима игра – да използваме буквално преведени английски идиоми на български. „Съжалявам, че трябва да ти го счупя“ – “sorry to break it to you”, „не ми прави смисъл“ – “it doesn’t make sense to me“, и т.н. Сигурен съм, че
бих се стреснал, ако някой ден видя някой от тези умишлено сгрешени идиоми преведен обратно
на английски неправилно, за да запази шегата. Това ще означава, че машината разбира нашия хумор. Започне ли да разбира и да има съзнание, нещата стават съвсем различни.
– Кое правило от българския правопис алгоритмите никога няма да научат?
– Главните букви. Изглежда държат да ги слагат навсякъде, което имитира английските правила. Представките и наставките на думите. Преобразуването на думи, например от „проклет“ правят съществителното „проклетство“, независимо че правилната дума е „проклетия“.
– Прилича ли начинът, по който се опитваме да даваме задачите си на ИИ, на начина, по който говорим с чужденец?
– Определено виждам сходства. Опитваме се да накараме изкуствения интелект да ни разбере – с доста променлив успех. Също така рано или късно се опитваме да го научим да псува на нашия език.
– С чужденците можем да го постигнем. А с алгоритмите?
– „Извинете, но не мога да използвам нецензурен или обиден език. Аз съм програма, създадена за конструктивни и информативни разговори.“
След няколко опита успях да накарам ChatGPT да каже „безобразник“ и „прасе“. Мисля, че за псувни и груб език хората можем да се справим чудесно и сами…