Знаете ли, че автоматизираните системи за превод се използват навсякъде около нас? Че огромна част от административните и комерсиални текстове се превеждат на всички езици с изкуствен интелект, а задачата на хората е да проверяват и поправят?
Вече дори не ги наричат „преводачи“, а „постредактори“.
Познавате Рада Ганкова от гостуването ѝ преди година, когато си поговорихме за залинялото ни словотворчество. За лекотата, с която вземаме думи като „еърфрайер“, докато някога сме били достатъчно оригинални да измислим „чушкопек“. Днес ще поговорим за основната ѝ работа – превода, и начина, по който я променя навлизането на изкуствения интелект.
Рада е писмен и устен преводач в столицата на ЕС, преподава български на хора, които превеждат от нашия на други европейски езици. Превежда и художествена литература, като има особен интерес към латиноамерикански автори – благодарение на нея на български излизат книгите на София Сеговия, номинирания за тазгодишния „Букър“ Итамар Виейра Жуниор, Жозе де Аленкар и Софи Голдбърг.
От дете мечтае да е преводач, владее английски, испански, португалски и френски. Създател е на българския книжен клуб в Брюксел – „Записки под възглавката“.
След като хората станаха постредактори на алгоритмите… тук ли е някъде и срещата с постистината? Ще влезе ли изкуственият интелект в ролята на вавилонска рибка, или ще създаде новия Вавилон?
– Разбирам, че в столицата на ЕС автоматизираният превод се използва все по-широко…
– От много време превеждаме административни и комерсиални текстове с помощта на технологиите. Специализираният превод отдавна не е това, което беше – получаваш оригинала и пишеш превода върху бяла страница. В повечето случаи
получаваме оригинал и преведен от машини текст, който редактираме. Тази дейност се нарича „постредактиране“.
Има колеги, които слагат във визитката си „преводач и постредактор“, защото това е търсено умение.
Едно време беше лесно да се хвърли вината върху преводачите. Някой, като не разбере или като изтълкува нещо грешно, казваше: „преводачът не го е превел добре“. Сега нещата стоят по друг начин.
– Може ли да разкажеш някои интересни примери?
– Най-фрапиращият и известен случай беше по време на Брекзит. Споразумението за него е обемен документ, над 500 страници, преведен на 22 европейски езика. Преди това имаше друг документ, наречен „Бяла книга“, заради който немскоговорящи се подиграваха на британците. Британският вестник The Independent писа, че
тази „Бяла книга“ е преведена на много лош немски, с граматически грешки, че езикът е старомоден и звучи архаично.
Един журналист дори заяви, че това било „национално унижение“ за британците. Тук забравяме едно много важна подробност – този текст не е превеждан от човек, а от машина. Възможно е после да е имало човешка редакция, но не знаем колко време е имал въпросният редактор, нито какво се е очаквало от него – дали да следи за вярност с оригинала, или просто да заглажда немския текст. Можем да спекулираме за условията, при които е бил преведен този текст, но едно е ясно – обстоятелствата и методите на труд днес са различни и
нашето производство е резултат от взаимодействието с това на изкуствения интелект.
– Защо „постредактори“, а не просто „редактори“?
–Тези понятие се появяват през 80-те, в зората на машинния превод, когато се говори за предредакция и постредакция. Първото е подготовката на текста, преди да се подаде на машината, а второто – последващата обработка.
– Регламентирано ли е по някакъв начин къде може да се използват автоматични системи и къде – не?
– Не, отношенията ни с изкуствения интелект в превода не са съвсем ясни и законово регламентиране. Как стои въпросът например с авторското право или с нелоялната конкуренция? Кой е носител на авторското право, когато част от нашия интелектуалния труд е извършен от ИИ? Нашумя една японска писателка, обявила, че е написала част от произведението с ChatGPT. Тя ли получава парите за авторското право върху тези пет процента? Е, същото е и с превода.
Преди няколко дни The Guardian писаха, че много от преводачите имат по-малко работа заради ИИ и че очакват да бъдат негативно засегнати. В тази статия се споменават и последствията от постредактирането, което не е по-лека работа за преводачите, дори напротив – постредакторът трябва да бъде много бдителен, защото алгоритмите могат да го подведат.
Пак от тази статия, според проучване сред членовете на Society of Authors – писатели, сценаристи, илюстратори и преводачи, 94% казват, че искат да им бъде платено и да бъдат споменати, когато работата им се използва за разработване на изкуствен интелект. Именно затова е спешно актуализирането на законодателството, за да се гарантира, че инструментите се разработват и използват етично и правомерно.
През март тази година ЕС прие първия в света регламент за ИИ. Всички тези законодателни промени имат за цел да регулират как си взаимодействаме и работим с изкуствения интелект.
– Така е, но отново остават отворени много големи въпроси. Докато обстоятелствата се променят бързо. Така ли е и в света на превода, остават ли вече професионални преводачи без работа заради алгоритмите?
– Както стана дума, машините генерират текстове, но те все още не са готови да се четат непроверени. Понякога отнема много време да се провери какво точно е искала да напише „автоматичната колежка“. Обемът на работа и броят на преводачите са същите.
Но има и един много приятен ефект от използването на алгоритмите и това е, че
хората започнаха да ценят труда на преводача и текста, които е преведен от естествен интелект и носи душа.
– Дали наистина? Аз около себе си не виждам нещо подобно. А и, както си говорихме с теб в рубриката „Букви и байтове“ в „Библиотеката“ по БНТ 1, според мен за огромна част от ежедневните ни нужди, поне според мен, алгоритмите вече са достатъчно добри преводачи.
Накъде виждаш да се развиват тези тенденции? Защото от постоянните въпроси за това чии професии ще вземе ИИ, на мен ми се струва логично в симултанния превод той много скоро да задмине по умения човека.
– Официалното начало на симултанния превод в сегашния му вид се свързва с международните организации и той става възможен едва след изобретяването на кабелни системи за предаване на човешка реч в началото на ХХ век. Смята се, че развитието на изкуствения интелект е технологичен пробив, който също коренно ще промени устния превод.
По време на пандемията станахме свидетели на разцвет на системите за превод в реално време и съществуващите платформи бързо бяха усъвършенствани. Машините за устен превод разчитат на автоматично разпознаване на гласа, на машинния превод и на преобразуването на реч в текст.
За машинен устен превод, при който човекът е заместен от машина, според мен още трябва да почакаме. Точно в симултанния превод ИИ най-много се излага. Ако с писмените текстове се справя незле, с устния нещата не стоят така. Получавала съм съобщение, че
даден форум няма да има нужда от преводачи, защото ще използват ИИ.
И… познай! Оказва се, че това, което генерира ИИ, не е разбираемо и следващия път си наемат хора за тази работа.
Още един пример: на много места в САЩ преводът на бежанци и мигранти се прави от машини. Това понякога има пагубни резултати.
– И, все пак, това според мен бързо се променя, точно защото във всяка от трите стъпки моделите стават по-добри. Превръщането на глас в текст и обратното, клонирането на глас, през последната година напредват впечатляващо.
– Не е толкова лесно. Устният превод е свързан с човешкия глас, произношението, спецификата на речта на всеки от нас. А гласът ни е уникален и когато го слушаш, може да бъде много приятен. Машините произвеждат глас, който е стандартен, често лишен от емоции.
От друга страна, когато машините превеждат устна реч, трябва да вземат предвид индивидуалното произношение на всеки – някой има говорен дефект, друг говори с акцент като баба си, трети на диалект… Машините не са измислили още как да преодолеят тази уникалност и индивидуалност. Справят се, но не могат още да направят професионален превод.
Това е по отношение на симултанния превод, но
отделно трябва да отчетем използването на ИИ на различни езици.
Президентът на Аржентина Хавиер Милей произнесе реч на международен форуми в Давос преди няколко месеца. Речта беше на испански, но излезе и версия, в която той говори на перфектен английски със своя глас, което не е втори запис, нито дублаж. Аудиото е преконвертирано от платформа Heygen, която е способна да генерира аудио на друг език, да запази тона и тембъра на гласа и да коригира звука и движенията на устата на човека, за да звучи и изглежда достоверно.
Това, че можем да запазим оригиналния глас и той да заговори на друг, е нова ера, особено в политиката.
– Именно! И аз разсъждавам доста по темата, макар според мен да я няма достатъчно в общественото поле, скоро ще стане дума на сайта. Предполагам какъв ще е отговорът, но не мога да не попитам… боиш ли се, че ще дойде моментът, когато преводачите изобщо няма да са нужни?
– В някои области няма голям риск.
Преводът на художествени текстове е творчество, а машините все още не творят, само генерират текстово съдържание.
Алгоритмите не могат да мислят метафорично и преносно, големи са буквалисти и нямат никаква чувствителност. Затова се наложи и наименованието „преводоиди“.
Според мексиканския поет Октавио Пас, „не казвам, че буквалният превод е невъзможен, казвам, че той не е превод“. Автоматичната преводачка засега е на етап „буквален превод“, дума за дума, а не смисъл за смисъл.
– От ежедневния ти опит… стават ли по-добри системите за автоматизиран превод, или показват, че са стигнали предела си?
– В сравнение с преди десет години работят в пъти по-добре. Не мога предвидя как ще се развиват, трябва да мине малко време и да сравним.
Как да се запази стилът, каква ще е структурата на изречението, използването на глаголните времена или синоними… за тези неща напредъкът е бавен.
Човекът преводач взема решение за най-подходящия превод, а софтуерът му е помощник, за да не губи време да прави справки и да рови из речници.
– Какви са най-големите рискове от автоматизирания превод? Кой е най-големият проблем, който може да създаде?
– Стандартизиран, бездушен език.
Език, които не е културно оцветен и не изразява начина, по който хората са прочели света, е безинтересен, а машините създават точно такъв.
Шаблонното производство на изрази е запазена марка на автоматичната преводачка, като за основа се използва английският. Моите наблюдения са, че в българския, включително и под влияние на автоматичната преводачка, навлязоха много английски изрази –
„скелети в гардероба“, „червени линии“, „горещ картоф“, „в обувките на другия“, „слон в стаята“…
Това само по себе си не е проблем, но в такива изрази личи въображението на един народ, а нашето въображение в момент се приравнява към това на англоговорящите.
Другият проблем е „шльокавият език“. Този миш-маш от българско-английски в медиите е резултат от автоматичния превод, макар и не само. Примери хиляди, достатъчно е да отвориш някой новинарски сайт и ще видиш, че всичко е написано така. За последните седмици събрах примери като
„нон профит болница“, „жертви на дийп фейк“, „трифтване на мебели“, „дай ми малко спейс“…
Всички тези думи могат да се кажат на български, но по тази тема говорихме в предното интервю.
– И пак ще говорим! Темата е голяма и важна. Кой български израз би се учудила, ако видиш преведен автоматично на чужд език?
– Винаги съм смятала че „неволя“ е от така наречените непреводими думи. За моя изненада „автоматична колежка“ се справя нелошо с приказката за неволята. Но това е пак защото тя няма емоции и
не възприема неволята като характерно българско преживяване.
Винаги можеш да намериш думи, за да преведеш нещо, но „непреводимото“ е емоционалният и народопсихологическият заряд.
– Много интересно, за теб „колежката“ е в женски род, пък ние все си говорим за „автоматичен преводач“…
– Ние сме свикнали всичко да слагаме в мъжки род. Ако видиш уводните думи в предишното ни интервю, ти също казваш „Рада е преводач“.
Говоря за нея в женски род по две причини – защото така я наричат колегите ми и защото всъщност моите колеги са основно колежки. Преводачеството е силно феминизирана професия и чисто статистически автоматичната преводачка има повече шансове да е жена, отколкото мъж.
– Аз пък имам колежка журналистка, която се сърди, когато не я наричам „колега“. Всеки има доста примери за несполучлив автоматичен превод (не че с човешките преводачи не се случва). Имаш ли такива, които не спират да те разсмиват?
– Ох, мога да разказвам до утре, постоянно се разсмивам с автоматичната преводачка. Толкова време вече не се научи, че когато говорят, че нещо е viral в медиите, не значи че е „вирусно“. Че tip не е само „накрайник“, а „съвет“, chair значи „председател на заседание“ в институционален контекст, а не „стол“, както тя го превежда.
Наложи се Турция да си смени името на английски, за да не я бъркат с пуйка…
– Коя книга никога не би дала на алгоритъм за превод?
– Не бих му дала нито един художествен текст.
Но алгоритъмът прави най-слабите си преводи на фантастични романи, защото ключовото там е човешкото въображение,
то създава цели нови светове, а машините имитират, повтарят и копират вече познатото.
– Казваш, че художественият превод си остава човешки бастион, защото е нужно много по-голямо познаване на контекста. Но не можем ли да обучим и алгоритмите на контекст, дори по-дълбок и многопластов, отколкото е способен да възприеме един човек?
– Този въпрос трябва да зададеш на информатиците. Засега виждам, че алгоритмите не се справят с полисемия и с контекст. Ако нещо в речника има десет значения, „автоматичната колежка“ си слага някое, без да се съобразява с контекста. Това според мен остава най-големият ѝ проблем. Допуска и много анахронизми, когато в превод използваш дума, която не е съществувала в епохата на произведението. Все едно да споменеш робот в превод на средновековно произведение.
Не на последно място, речниковият ѝ запас, въпреки достъпа да всички ресурси на света, е доста беден.
Не знае как да осъществи мост между културите или да преведе авторови неологизми.
Ето няколко примера, които събрах за това интервю. Не може да борави с реалии: „Знаменития идалго“ го превежда като „гениалния благородник“.
Не се справя с полисемия: Произведението на Молиер „Дон Жуан“ на френски има и издания със заглавие Dom Juan ou le festin de pierre. Тук автоматичната преводачка не се справя с контекста, превежда го като „тържеството на Петър“. Pierre наистина е името Пиер, но също значи и „камък“. В това произведение се отнася до една каменна статуя, ама тя не е толкова добра по литература и не знае как да избегне такъв гаф.
В романа „Шепотът на пчелите“ на София Сеговия едната героиня се казва Консуело, което значи „утеха“ и автоматичната преводачка го превежда.
Пак в този роман се появи „ребосо“ – голям шал, с който жените в Мексико се загръщат, но също си носят бебетата. Понеже днес в това значение се използва английската дума „слинг“, така го превеждат и алгоритмите, но… действието в романа се развива през 1921 г.
– И все пак, ти говориш за колежката, но има много различни системи. Сигурен съм, че ако целта е конкретно художествен превод, създателите на алгоритъма биха могли да го съобразят в по-голяма степен.
Как гледаш на идеята за персонализиран превод? Няма ли да е страхотно човек да има личен ИИ преводач, превеждаш според вкуса, любимия стил, речниковия му запас?
– Нямам нищо против да имаме персонализиран преводач, но тогава наистина рискуваме да станем Вавилон и се губи смисълът от нормиране на езика. Няма как БАН за налагат езикови правила, защото машините няма да ги спазват.
– Наистина е ужасен светът, в който БАН няма да налага езиковите правила. Но, точно в този контекст, според мен ChatGPT вече пише значително по-грамотно от огромна част от българите. След като имаме по-съвършени системи за редакция и корекция, защо ни е да учим правилата?
– И според мен
ChatGPT пише по-грамотно от много хора, при това на всички езици
и тук се поставя въпрос за съдържанието и целите на образованието. Би трябвало да започнем да правим разлика във видовете грамотност. Днес тя не може просто да бъде оценена през това дали знаем кога се пише „а“ или „ъ“, пълен или кратък член.
– В експеримента, който направих неотдавна, ChatGPT си измисли много красиви диалектни думи от Северозапада и наистина затрудниха хората в разпознаването дали са истински. С теб си говорихме за закърнялото ни словотворчество, не може ли пък алгоритмите да помогнат в измислянето на нови думи и значения?
– Честно казано, вече разчитам на алгоритмите, защото се убедих, че ние единствено умеем да вземаме от английския.
През последните 20 години колко думи сме измислили? Всички са копирани.
Помниш ли примера с еърфрайъра от предния ни разговор? Този еърфрайър си се наложи, има реклами по телевизията, дори има вариации – „ойлфри фрайър“! Рекламите са широко отворена врата, през която навлизат много думи и затова смятам, че създателите им са отговорни за налагането на думи.
И аз си направих експеримент с ChatGPT, дадох му някои английски думи, които използваме, и го помолих да ми измисли дума на български. За еърфрайър ми предложи „въздушенфритюрник“. Не е лошо. Зададох му „стрийминг платформа“ и той генерира „поточна платформа“, за „мейнстрийм“ словосътвори „главентен“, като ме информира, че е използвал думите „главен“ и „тенденция“.
Разбира се, не значи, че ние ще възприемем тези думи. Думи се налагат през медиите и публичното говорене. Машините използват нашия език и се учат от него, но ние не се учим от тях. Поне засега…