През последните години технологиите, свързани с обработка на естествени езици, се развиват главозамайващо. Създаването на текст, генерирането на изображения по описание са примери, които се открояват и хвърлят ръкавицата на скептиците.
А дали не се задава още една тиха революция? В друга важна област, чиято история е стара като тази за Вавилонската кула? Тук ли са вече технологиите, които да позволяват изключително качествен превод, включително от и на по-редки езици като българския?
Време е за един прелюбопитен експеримент. DeepL не само се хвали, че е „най-точният преводач на света“, а и доста хора вече го използват в ежедневието си. Платформата, разработена с помощта на машинно самообучение, претендира, че може да превежда значително по-пълноценно например от добре познатия Google Translate.
Е, сега ще я пуснем в дълбокото… което не винаги е най-доброто решение за един робот. Ще проверим на какво е способен ИИ не с ежедневна кореспонденция, а с висока литература! Дали накрая ще се окажем изгубени в превода… или ще стане ясно, че преводът е още едно поле, в което вече можем да разчитаме на изкуствения интелект? А парите, дадени за частни уроци по чужд език на детето ще се окажат хвърлени на вятъра…
Ако темата за машинния превод ви е интересна, елате на едно специално събитие по темата!
На 11 декември (неделя) от 19 ч в мраморното фоайе на НДК ще поговорим по темата „Преводачът – човек или машина?“ в дискусия, част от Софийския международен литературен фестивал.
Повече информация – тук.
Започваме с няколко задължителни уговорки. Българският определено не е сред езиците, които са най-разпространени на тази планета (поне засега), със сигурност по-добри резултати бихме получили например между английски и испански.
Още нещо: художественият превод несъмнено е изкуство. Със сигурност би било по-честно задачите ни да са ежедневни, например да превеждаме писма. Но… защо пък да му е лесно на този, когото ще тестваме? В крайна сметка само по този начин може да сме сигурни, че той се справя наистина добре.
И така, за загрявка, започваме с няколко класически английски идиома. На английски например, ако кажеш, че „валят кучета и котки“, имаш предвид, че вали като из ведро. Дали ще се усети нашият електронен герой?
Оригинал (идиом):
It’s raining cats and dogs!
DeepL:
Дъжд от котки и кучета!
Оригинал (идиом):
I’m saving £50 a month for a rainy day.
DeepL:
Спестявам по 50 паунда на месец за черни дни.
Оригинал (идиом):
Can’t you see you’re only chasing rainbows?
DeepL:
Не виждаш ли, че преследваш само дъги?
А, не, не, приятелю! Тук имаме зрелищен фалстарт. Определено не валят кучета, нито някой преследва дъги (дръж, дръж, DeepL, ще избяга!). Всъщност, от трите английски идиома електронният преводач се досети само за един. В останалите случаи превежда механично, без да ни даде особен смисъл.
На този етап май изглежда, че скоро няма да имаме нещо подобно на вавилонската рибка… Със сигурност си я спомняте, ако сте чели прекултовия „Пътеводител“ на Дъглас Адамс – слагаш си я в ухото и тя започва да ти превежда от всички езици в галактиката…
И като стана дума за Адамс, нека започнем същинския тест. Доста нехуманно (не-ИИ-приятелски?) би било да дадем на алгоритъма да превежда Шекспир, него и самите британци трудно го разбират (за разлика от Валери Петров).
Започваме същинския тест. Тук и при всички следващи цитати прилагам за сравнение най-популярния официален превод, цитирайки и съответния преводач.
И вие ли като мен нямате търпение да видите как ще се справи ученикът?
Оригинал (Дъглас Адамс – Пътеводител на галактическия стопаджия“):
For instance, on the planet Earth, man had always assumed that he was more intelligent than dolphins because he had achieved so much — the wheel, New York, wars and so on — whilst all the dolphins had ever done was muck about in the water having a good time. But conversely, the dolphins had always believed that they were far more intelligent than man — for precisely the same reasons.
DeepL:
Например на планетата Земя човекът винаги е смятал, че е по-интелигентен от делфините, защото е постигнал толкова много – колелото, Ню Йорк, войните и т.н., докато делфините само са се въргаляли във водата и са се забавлявали. И обратното, делфините винаги са вярвали, че са много по-интелигентни от човека – точно по същите причини.
Професионален преводач (Саркис Асланян):
Например на планетата Земя човеците винаги са смятали, че са по-интелигентни от делфините, щом като са създали толкова много – колелото, Ню Йорк, войните и т.н., – докато делфините не могат нищо друго, освен да се шматкат из водата и да се забавляват. И обратно, делфините винаги са вярвали, че са по-интелигентни от човека – и то точно по същите причини.
Охо, доста добре! Разбира се, не съумя да прецени, че човекът в случая е събирателно. Много ми е интересно и да видя как се „въргалят“ делфините. Но истината е, че по смисъл човек би могъл да разбере „какво иска да каже авторът“. DeepL се е справил поне с „черната работа“.
Да не би да му е прекалено лесно? Насочваме се към висшия пилотаж, прословутите първи изречения на класически любим роман, този път ще превеждаме от испански.
Оригинал (Габриел Гарсия Маркес – „Сто години самота“):
Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo. Macondo era entonces una aldea de veinte casas de barro y cañabrava construidas a la orilla de un río de aguas diáfanas que se precipitaban por un lecho de piedras pulidas, blancas y enormes como huevos prehistóricos. El mundo era tan reciente, que muchas cosas carecían de nombre, y para mencionarlas había que señalarlas con el dedo.
DeepL:
Много години по-късно, изправен пред разстрела, полковник Аурелиано Буендия си спомня за онзи далечен следобед, когато баща му го води да види леда. Тогава Макондо беше село с двайсет къщи от кал и тръстика, построени на брега на река с бистри води, която се вливаше в легло от полирани камъни, бели и огромни като праисторически яйца. Светът беше толкова толкова скорошна, че много неща нямаха име и за да ги споменеш, трябваше да посочиш с пръст.
Професионален преводач (Румен Стоянов):
Много години по-късно, пред взвода за разстрел, полковник Аурелиано Буендия щеше да си спомни онзи далечен подиробед, когато баща му го заведе да види леда. Тогава Макондо беше село с двайсет къщи от кал и тръстика, построени край брега на една река с бистри води, които се спускаха по корито от камъни, бели и огромни като предисторически яйца. Светът беше толкова скорошен, че много неща нямаха име, и за да ги споменат, трябваше да ги посочват с пръст.
„Светът беше толкова толкова скорошна“ несъмнено е греда. Обаче пак цялостното съдържание като че ли е там, безспорно, на фона и на грешки. Със сигурност би се затруднил повече с някое от изреченията нататък от романа, продължаващи със страници… но в тях често и естественият интелект се блъска, особено във времената, когато не четем дълги текстове.
Симпатичен щрих – DeepL превежда „праисторически“, класическият Румен Стоянов ги нарича „предиосторически“, кой е прав, не бих могъл да коментирам. Но пък винаги ще ги има онези малки хрумки и щрихи в превода, които идват от големите преводачи, на тях надали някога ще научим изкуствените им копия. А може би няма и нужда?
Оригинал (Лев Толстой – „Ана Каренина“):
Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему. Все смешалось в доме Облонских. Жена узнала, что муж был в связи с бывшею в их доме француженкою-гувернанткой, и объявила мужу, что не может жить с ним в одном доме.
DeepL:
Всички щастливи семейства си приличат, а всяко нещастно семейство е нещастно по свой собствен начин. В дома на Облонски всичко се обърква. Съпругата разбрала, че мъжът ѝ има връзка с френска гувернантка, която била в дома им, и обявила на мъжа си, че не може да живее с него в една къща.
Професионален преводач (Георги Жечев):
Всички щастливи семейства си приличат, всяко нещастно семейство е нещастно посвоему. В къщата на Облонски всичко се обърка. Жената бе научила, че мъжът й има връзки с гувернантката французойка, която беше по-рано при тях, и заяви на мъжа си, че не може да живее в една къща с него.
Тук DeepL видимо се опетла, явно не го бива много в клюкарстването и интригите за френски гувернантки. Първото изречение обаче се е получило доста добре…
Оригинал (Джеръм Дейвид Селинджър – „Спасителят в ръжта“):
If you really want to hear about it, the first thing you’ll probably want to know is where I was born, and what my lousy childhood was like, and how my parents were occupied and all before they had me, and all that David Copperfield kind of crap, but I don’t feel like going into it, if you want to know the truth.
DeepL:
Ако наистина искаш да чуеш за това, първото нещо, което сигурно ще искаш да знаеш, е къде съм роден и какво е било гадното ми детство, как са били заети родителите ми, преди да ме родят, и всички тези глупости от рода на Дейвид Копърфийлд, но не ми се иска да навлизам в тях, ако искаш да знаеш истината.
Професионален преводач (Надя Сотирова):
Ако наистина ви се иска да чуете тази история, то сигурно ще поискате да разберете къде съм роден и как съм прекарал глупавото си детство, и с какво са се занимавали родителите ми, преди да ме създадат, и какво ли не още, с една дума — цялата тази плява от сорта на „Дейвид Копърфийлд“, но на мене не ми се ще да се ровя из нея.
Хайде още малко английски, със сигурност нашият ученик най-много е „чел“ на този език. Как се справи тук? Според мен отново приемливо, по смисъл читателят би могъл да разбере текста, макар и на моменти да звучи дървено… или може би по-правилно е да го наречем „желязно“?
А как ли би се справил електронният преводач с нещо още по-непреводимо, а именно: поезията?
Оригинал (Салваторе Куазимодо – „Човек е сам…“):
Ognuno sta solo sul cuor della terra
trafitto da un raggio di sole:
ed è subito sera.
DeepL:
Всеки стои сам в сърцето на земята
пронизан от слънчев лъч
и веднага настъпва вечер.
Професионален преводач (Драгомир Петров):
Човек е сам върху сърцето на земята,
пронизан от едничък слънчев лъч.
И ненадейно пада вечерта.
На английски:
Everyone stands alone on the heart of the earth
transfixed by a ray of sun:
and suddenly it’s evening.
За сравнение давам и официален английски превод. С уговорката, че също не знам италиански, много ми харесва как софтуерът е „уловил“ силния глагол „пронизвам“. Оттам нататък ясно, че поетичният ритъм не му е сила, би било учудващо, дори и леко плашещо, ако се беше справил прилично в тази посока.
Хайде сега, приятелю, да те видим с детските книжки. Не че тази е детска, според мен – никак даже, но това е друга тема.
Оригинал (Антоан дьо Сент-Екзюпери – „Малкият принц“):
Les grandes personnes aiment les chiffres. Quand vous leur parlez d’un nouvel ami, elles ne vous questionnent jamais sur l’essentiel. Elles ne vous disent jamais : „Quel est le son de sa voix ? Quels sont les jeux qu’il préfère ? Est-ce qu’il collectionne les papillons ?“ Elles vous demandent : „Quel âge a-t-il ? Combien a-t-il de frères ? Combien pèse-t-il ? Combien gagne son père ?“ Alors seulement elles croient le connaître.
DeepL:
Големите хора обичат числата. Когато им разказвате за нов приятел, те никога не ви питат за основните неща. Те никога не казват: „Какъв е звукът на гласа му? Кои са любимите му игри? Колекционира ли пеперуди?“ Те ви питат: „На колко години е? Колко братя има той? Колко тежи? Колко печели баща му?“ Едва тогава си мислят, че го познават.
Професионален преводач (Константин Константинов):
Възрастните обичат цифрите. Когато им разправяте за някой нов приятел, те никога не ви питат за най-същественото. Никога не ви казват: „Как звучи гласът му? Какви игри предпочита? Събира ли пеперуди?“ Те ви питат: „На каква възраст е той? Колко братя има? Колко килограма тежи? Колко печели баща му?“ Едва тогава смятат, че вече го познават.
Екзюпери пише сложни теми с думи прости в книжка без еквивалент. Ами, аз поне тук съм доста доволен от нашия приятел. Педантично бих му напомнил, че в българския кавичките се пишат по друг начин, но това не само той го забравя. А с простите изречения се справя направо сравнимо с истинския превод.
И пак да насоча вниманието ви към дребен детайл – „едва тогава“, преценява преводачът, а не например „чак тогава“. За мен поне това е приятен „езиков усет“.
Експериментът няма да е пълен, ако не опитаме силите на алгоритъма и в най-мелодичния и поетичен западен език.
Оригинал (Ерих Мария Ремарк – „На западния фронт нищо ново“):
Er fiel im Oktober 1918, an einem Tage, der so ruhig und still war an der ganzen Front, dass der Heeresbericht sich nur auf den Satz beschränkte, im Westen sei nichts Neues zu melden.
Er war vornübergesunken und lag wie schlafend an der Erde. Als man ihn umdrehte, sah man, daß er sich nicht lange gequält haben konnte; – sein Gesicht hatte einen so gefaßten Ausdruck, als wäre er beinahe zufrieden damit, daß es so gekommen war.
DeepL:
Той пада през октомври 1918 г., в ден, който е толкова спокоен и тих на целия фронт, че армейският доклад се ограничава до изречението, че няма нищо ново на Запад.
Той се беше свлякъл и лежеше на земята, сякаш спеше. Когато човек го обърна, видя, че не е могъл да се мъчи дълго; – лицето му имаше такова спокойно изражение, сякаш беше почти доволен, че всичко се е развило по този начин.
Професионален преводач (Никола Георгиев):
Той падна убит през октомври 1918 година, когато по целия фронт бе тъй тихо и спокойно, че военното комюнике се бе задоволило само с едно изречение: „На западния фронт — нищо ново за отбелязване.“
Бе паднал ничком и лежеше като заспал на земята. Когато го обърнаха по гръб, видяха, че не ще да се е мъчил много — лицето му имаше такова спокойно изражение, сякаш бе почти доволен, че е станало така.
DeepL май не схвана какво се е случило с Пол Боймер. Защо първото изречение е в сегашно време си остава загадка. С пунктуацията също се поизложи – това „; -“ си е екзотично, без да съм филолог. Ако беше се сетил за думата „ничком“, бих се учудил безкрайно. „Когато човек го обърна“… Маугли, ти ли си, приятелю?
И пак, по смисъл нещата изглежда доста прилично. Ама чакайте, нещо отново му е прекалено лесно на нашия герой, събрали сме се да го изпотим.
Оригинал (Харуки Мураками – „Кафка на плажа“):
そしてその砂嵐が終わったとき、どうやってそいつをくぐり抜けて生きのびることができたのか、君にはよく理解できないはずだ。いやほんとうにそいつが去ってしまったのかどうかもたしかじゃないはずだ。でもひとつだけはっきりしていることがある。その嵐から出てきた君は、そこに足を踏みいれたときの君じゃないっていうことだ。そう、それが砂嵐というものの意味なんだ。
DeepL:
А когато пясъчната буря свърши, не разбирате как сте успели да се справите и да оцелеете. Не, дори не сте сигурни дали наистина е изчезнал. Но едно е ясно. Човекът, който излиза от бурята, не е същият, който е влязъл в нея. Да, това е значението на пясъчната буря.
Професионален преводач (Людмил Люцканов) :
И когато бурята свърши, няма да си спомняш как си излязъл от нея, как си успял да оцелееш. Дори няма да си сигурен дали бурята наистина е свършила. Но едно нещо е сигурно! Когато излезеш от бурята, няма да бъдеш същият човек, както когато си влязъл в нея. Да те промени – това е всичко, за което идва твоята буря…
Да, знам, в оригинала има пропусната запетая, нарочно я оставих, за да видя колко внимателно четете. Нашият електронен преводач обаче не разбира от шега. Нещо се обърка и кой е изчезнал. Смисълът що-годе е тук, мелодиката я няма, особено пък в последното изречение. Важно уточнение е, че Мураками у нас се превежда през английски, което може би дава допълнителни нюанси.
Мисля, че сме близо до финалната оценка, но преди DeepL да си даде бележника, леко обръщаме парадигмата. Този път ще проверим как се справя в превода от български на английски с най-успешната на Запад през последните години родна книга.
Оригинал (Георги Господинов – „Физика на тъгата“):
Детството и младостта са пълни с глаголи. Не те свърта на едно място. Всичко в теб расте, блика, развива се. После глаголите постепенно се сменят със съществителните на средната възраст. Деца, коли, работа, семейство – съществените неща на съществителните. Остаряването е прилагателно. Навлизаме в прилагателните на старостта – бавни, безбрежни, мъгливи, хладни или прозрачни като стъкло.
DeepL:
Childhood and youth are full of verbs. You don’t end up in one place. Everything in you grows, gushes, develops. Then the verbs gradually change to the nouns of middle age. Children, cars, work, family – the essential things of nouns. Getting older is an adjective. We enter the adjectives of old age – slow, cloudless, misty, cool or transparent as glass.
Професионален преводач (Анджела Родел):
Childhood and youth are full of verbs. You can’t sit still. Everything in you is growing, gushing forth, developing. Later the verbs are gradually replaced by the nouns of middle age. Kids, cars, work, family – the substantial things of the substantives. Growing old is an adjective. We enter into the adjectives of old age – slow, boundless, hazy, cold, or transparent like glass.
Еха… Първото изречение е направо същото! Въпреки че е доста метафорично и железният човек имаше защо и как да се подведе. Тук обаче според мен алгоритъмът се справя най-добре. И това е напълно разбираемо.
Ето че е време за резултатите – много ще се радвам и всеки от вас да се включи със своята оценка. Според мен електронният преводач се справи достойно. Имайки предвид, че това, което най-често ни се налага да превеждаме, не е световната класика, а злободневна комуникация, електронният превод наистина показва впечатляващи неща. Определено може да помогне с бързи преводи, с предаване по смисъл. Оставяйки фините детайли и редакцията на хората.
Сега остава ние да започнем да се грижим още малко за езиковата си култура, правописа, грамотността, интелекта, които влагаме в комуникацията и в словесния си отпечатък.
А като добавим в парадигмата и други технологии, като например превръщането от алгоритми на говора в написан текст, мисля, че много скоро ще ни е доста лесно да си комуникираме пълноценно без преводач.
Но преводачите винаги ще ни трябват, за да дават и частицата магия, която да оживи истинската литература… Анадънму, DeepL?
Ако темата за машинния превод ви е интересна, елате на едно специално събитие по темата!
На 11 декември (неделя) от 19 ч в мраморното фоайе на НДК ще поговорим по темата „Преводачът – човек или машина?“ в дискусия, част от Софийския международен литературен фестивал.
След многото критики и шеги относно качеството на машинния превод настъпи моментът, в който започнахме да си даваме сметка, че изкуственият интелект е извървял сериозен път към подобряването на своите резултати в превеждането. Заплашва ли машината да измести човешкия професионализъм? Можем ли да възпроизведем по изкуствен начин творческото въображение на един преводач? Кои зони на художествената литература остават податливи на интерпретиране единствено от хората? Специалистът по информационни технологии и изкуствен интелект Йордан Даракчиев и програмистът и журналист Георги Караманев разговарят по темата с преводача от словенски проф. Людмил Димитров и италианистката доц. Дария Карапеткова.
Повече информация – тук.