Той е способен да „надуши“ фалшивите новини по-добре от хрътка. Нещо повече, може да каже, че те ще се появят… дори преди да са написани. Какъв е този ловец телепат? Вероятно сте се досетили, той просто не е човек, а алгоритъм. Не е идея, а вече сериозно навлиза в практиката. И не просто заклеймява дезинформацията и цензурира, а помага на хората да я улавят сами.
В проекта участва Масачузетският технологичен институт, но той се води от Катарския институт за компютърни изследвания. Екипът разработчици е воден от българин.
Преслав Наков е начело на изследователите, той е създателят на проекта „Танбих“ (срещнете го тук), арабската дума, значеща „сигнал за тревога“. Специалността му е обработката на естествен език (Natural language processing или NLP), много класации го поставят сред топ учените в направлението в световен план. Благодарение на тази област, където изкуственият интелект среща лингвистиката, вече имаме сериозни технологични придобивки, като например развития машинен превод. Д-р Наков обаче е концентрирал изследванията си именно в използването на тази изключително перспективна технология в една битка, която иначе изглежда окончателно изгубена. Битката за истината.
И ловец съм, и рибар съм
Как да разберете, че сте неразбран гений? Гений сте и не ви разбират.
Какво е фалшивата новина? Новина, само че фалшива.
Не, не сме се събрали, за да създаваме мемове и шегички, а за да видим как се справя този ловец – алгоритъм. Какво прави, как работи.
Проблемът с фалшивите новини наистина започва от дефиницията. Дали ако журналистът сбърка дадено число в информацията си, това прави новината фалшива? Или пък трябва да има умисъл? Или има проблем, ако фактите се преплитат с интерпретациите?
Темата е стара, колкото е стара втората най-древна професия – журналистиката. И все пак, днес е по-важна от всякога, защото живеем в информационно общество. Заради балона на филтрите и факта, че сериозно се променя начинът, по който въприемаме информацията. Днес фалшивите новини са по-опасно оръжие, отколкото можем да си представим. Вече го няма авторитета на сериозните медии, всеки може да каже всичко и да стои на равна нога с безспорните авторитети по темата. Достатъчно е за пример да споменем информационното пространство, свързано с коронавируса.
Наслука
„Да, невярната информация в новините винаги е била наоколо, помислете за таблоидите“, казва Наков. „Но социалните мрежи промениха всичко. Те направиха възможно зловредните източници да микротаргетират целите си по демографски показатели. Да разпространяват информацията много по-бързо и в огромни обеми. Благодарение на социалните мрежи новините могат да се превърнат в оръжие с безпрецедентни мащаби“.
Фалшивите новини имаха сериозно значение в последните два избора за президент на САЩ, често с тяхна помощ се вземат сериозни политически решения.
Проблемът доби нови измерения, след като дойде коронавирусът. Световната здравна организация още през февруари постави на второ място сред най-важните стъпки, за да стигнем до края на пандемията, битката с „инфодемията“.
Факт е, че в тази посока сериозно значение имаше и не винаги достатъчно адекватната информационна политика на властите и на експертите. И все пак, надали дори от СЗО биха могли да си представят, че начинът, по който се отразява пандемията в мрежата, ще доведе дотам, че когато всеки може да има ваксина, над 70% от българите няма да счетат за нужно да си я поставят.
С пушка в ръка аз бродя през гората
Преди няколко години нашумяха услугите, които проверяваха достоверността на даден факт. И те са полезни. В крайна сметка, не е толкова трудно да се сравнят данните от достатъчно авторитетни източници с новината, че например някоя световна знаменитост се е разболяла от ишиас. Или че даден футболен отбор е победител друг.
Но това е елементарно. Да не говорим, че всеки от нас е редно да го прави. Да се замисли, преди да сподели заглавие, което му е прозвучало интригуващо, да отвори по-сериозен сайт, за да го провери, особено ако линкът е от очевидно съмнителен домейн.
Постепенно с това свикнахме. Разбира се, случва се всеки да се подведе, а много често в подобна ситуация изпадат по-възрастните хора, които все още имат друго отношение към информацията – щом е написано, значи е вярно. Сигурно знаете вица. „Колко да лети, дядо, най-много 2-3 метра…“
Ловна среща
И така, в основата на работата на нашия електронен ловец, арабският Шерлок Холмс, стоят дефинициите.
„Големият проблем не е, че фалшивите новини са неверни“, казва Преслав Наков. „А че те се превръщат в оръжие. А това е нещото, от което най-много се тревожи дори самият учен, направил възможен интернет – сър Тим Бърнърс-Лий“.
За много хора фалшивите новини са просто тези, които не им харесват, без въобще да ги интересува дали са верни, или не. Затова, според Преслав Наков по-подходящият термин в случая е „дезинформация“. „Тук вече дефиницията е доста проста, има само два компонента. Първият – че една информация не отговаря на истината и вторият: че има зловредна цел, предназначена е да навреди по някакъв начин. Повечето разработки по темата се концентрират само върху първата част от проблема. А по-важна е втората, именно нея има предвид Бърнърс-Лий, говорейки за превръщането на новините в оръжие. Основният проблем с фалшивите новини, както ще се съгласят и журналистите, не е, че те не съобщават вярна информация. Проблемът е, че те стават политическо оръжие“, допълва изследователят.
Пропа-гадна
Често наричаме явлението „пропаганда“, а според нашия събеседник това не е основателно. „Пропагандата се пресича с дезинформацията. Тя също има два компонента, първият е, че някой цели да ни убеди в нещо, а вторият: че има предварително дефинирана цел. И се пак, при нея няма истина или лъжа, няма добро или лошо. Пропаганда е и кампанията на правителството за ваксинации, и думите на Грета Тунберг, която се старае да ни плаши, че стотици биологични видове изчезват всеки ден. Това е една от техниките на пропагандата – целенасочено предизвикване на страх. Само че в случая не бихме сметнали, че е проблем. Пропагандата не е нещо добро или лошо, тя е просто сбор от техники, целящи да убеждават“, допълва Наков.
Именно тези техники се учи да разпознава алгоритъмът за машинно самообучение „Танбих“. Като ги наслагва с всичко останало. И в резултат не търси крайното бинарно решение „вярно/невярно“, а просто информира потребителя за рисковете и нюансите, оставяйки му решението сам да прецени как да се възползва от информацията.
„Танбих“ анализира езика. Проверява как източникът на информацията се съотнася към новините, които публикува: съдържа ли доказано достоверни и доказано фалшиви. Ако често се цитират неверни твърдения, това е доста ясен знак, че и бъдещите публикации на тази медия отиват в същата посока.
Съществуват повече от 60 пропагандни техники, а „Танбих“ се концентрира върху 18 от тях, които са най-разпространени и най-ефективни днес.
Ловец храбрец
Битката с фалшивите новини е неравна, защото, както показва проучване на MIT, те се разпространяват 6 пъти по-бързо от истинските. Те са по-атрактивни, подготвени са така, че да бъдат харесвани. Освен това онлайн нещата се случват светкавично: 50% от разпространението им е през първите 10 минути! Как е възможно за това време да се направи проверка дали новината е вярна?
Това могат да го правят само потребителите. Които, в случая, да бъдат подпомогнати от възможностите на изкуствения интелект.
Лесно е да се провери дали е вярно едно изречение. Дори да бъде аналитично, това също може лесно да се отрази. Но, както казва нашият събеседник, в президентския дебат в САЩ например, се казват около 1000 изречения. Също и в една по-дълга и аналитична статия. Как може да се провери всяко съждение? Единственият шанс е с помощта на изкуствения интелект. Алгоритмите, особено в областта на езиковия анализ (и, за съжаление, най-вече на разпространените езици) имат невероятни умения, показателен е примерът с GPT-3. „Танбих“ взема най-доброто от тази област, за да анализира за читателя дългите текстове и да даде своята независима оценка. Какво ще прави с нея въпросният читател, е негова работа. Но така и би трябвало да бъде, доста различно например от света на „Фейсбук“.
На пусия
Дяволът е в детайлите. Във внушенията. И най-вече в случаите, когато лъжата е целенасочена, масирана, има конкретна пропагандна цел и носи определени ползи на източника.
Както казва д-р Наков, многото проекти за проверка на факти – ръчни или автоматизирани, не могат да решат проблема, защото в момента, в който можем да докажем, че една новина е невярна, тя вече ще е достигнала до милиони хора и няма как да бъде спряна. Именно затова ученият насочва усилията си към технологията, която може да предсказва фалшивата новина.
Всички знаем, че дори „Фейсбук“, въпреки дългогодишните си усилия, така и не успява да намери достатъчно работещо решение в тази посока. Огромният обем информация в социалната мрежа няма как да бъде следен автоматично, а заради системата на докладване на публикациите често жертва на цензурата падат текстове, с които просто някой не е съгласен. Но това не ги прави фалшиви, особено в среда, в която уж се търсят мнения и гледни точки, а не новинарско съдържание (като преплитането между двете е в основата на най-големите проблеми в тази област).
Ако е доказано, че даден сайт, профил или какъвто и да било източник вече е създал фалшива новина, със сигурност е редно да сме по-мнителни. Именно в тази посока помага алгоритъмът на „Танбих“. Идеята е да предсказва. Като не цензурира, а просто помага на потребителите. Дава им основни показатели за това колко е достоверен източникът, оцветен ли е емоционално по темата, за която пише. Например политически.
Фалшива новина по ловджийски
Единственият шанс да изградим по-добра интернет среда, е като спираме пропагандата и фалшивите новини, преди да са се разпространили, убеден е проф. Наков. И първата стъпка е верифицирането и отделянето на достоверните източници на информация.
„Няма как да провериш всяко отделно твърдение на света. И все пак, по този начин можеш да провериш една новина, преди дори да е написана“.
Реалният проблем е, че когато се появят натрупвания, внушения, когато не само лъжата има значение, а и си личи кой има полза от нея. Точно това цели да улавя алгоритъмът „Танбих“.
За момента той работи на арабски и английски, покрива публикации, свързани с политика, бизнес, спорт, наука, технологии… и конкретно ковид.
Ловци на градус
„Танбих“ умее да оценява общата достоверност на фактите в текста, градуса на пропагандното съдържание, наличието на крайни политически оттенъци, идеологии. Оценява новината в общата рамка на останалите. Анализира отделните информационни единици, но още по-добре анализира източниците на информация.
Историята на този изкуствен интелект започва като обикновена система за персонализирано филтриране на новините, подобна на „Гугъл Нюз“. После създателите му решават да го разширят с основната идея – не просто да събира новини, а и да ги обогатяват с информация за съдържанието на текста, за основните характеристики на автора и медията, от които идва. Полезно е да знаеш дали източникът има ясно изразена политическа връзка, ако е виден анти- или проваксър. И най-вече: винаги, когато е екстремно предубеден към дадена тема.
100 шарана… и една червена херинга
А както стана дума, специалитетът му е да разпознава техниките на пропагандата. Предизвикването на страх е само една от тях. Като цяло, се делят на две групи, а първата разчита на емоциите. Може да става дума за страх, за патриотични чувства, за съчувствие. Втората част са по-скоро логически парадигми. Например „или си с нас, или си срещу нас“. Класическа техника е „Ефектът на бандата“, когато ни убеждават, че някой ще победи на изборите с огромен процент и ние трябва да се почувстваме от правилната страна на историята, като се присъединим.
„Червената херинга“ е още една техника за пропаганда, дължи красноватото си име на Уилям Корбет, който го популяризира през 1807 г. На български я наричаме с доста по-скучното название „отвличане на вниманието“. А чуем ли „червена херинга“, някак си се замисляме, ама има ли я наистина тази риба? Извън шарения термин, този пропаганден подход го знаем от българските медии и политици до болка добре.
На мушката
„Умишлено замъгляване“ е друг подход на пропагандата. При него комуникацията нарочно е замъглена, говори се на целенасочено усложнен език, с морфични резонанси, както бихме казали у нас.
„Танбих“ е научен да разпознава всички тези и останалите класически техники, като успоредно с това анализира и оценъчната страна на текста.
Ех, ако всички бяхме малко повече като „Танбих“.
Скоро, надяваме се, ще го имаме и на български. Поне за да ни светва лампичката. А дали не е доста късно за лампички и има ли кой да ги гледа в тотално мрачна медийна среда като българската… кой знае, ще видим.
Има защо да сме отчаяни от естествения интелект, особено що се отнася до политиката и медиите по нашите ширини, нека дадем шанс на изкуствения.
Ловецът на хвърчила
„Аз продължавам да смятам, че медийната грамотност е най-доброто дългосрочно решение за това как се информираме“, казва изследователят. „Затова и съм горд с инструмента, който създадохме. Той успява да улови фините техники на пропагандата и да информира читателите, че са манипулирани. Така те знаят как да подходят към тези източници на информация, а и какво да избягват занапред. В един момент даже няма да им трябва платформата, ще разпознават техниките сами. Същото се случи и с мен, а и с други учени, работещи по проекта“, допълва Преслав Наков.
„Вече не мога да чета спокойно новините. Всеки път, когато ги отворя, започвам да разпознавам една по една техниките на пропагандата. Вярвам, че ще е много добре, ако повече хора стигнат до този етап.“
А ние се разделяме с новия ИИ и със създателя му, но с уговорката, че скоро ще се срещнем отново, за да направим интервю. Да поговорим и за други теми, свързани с най-важните и бързо напредващи посоки, в които алгоритмите се очаква да променят света ни. За прословутия изкуствен интелект, когото сме натоварили с толкова много (често пресилени) очаквания да промени живота ни в толкова много посоки.
А вие: какво бихте го попитали?