Ловецът на фалшиви новини

ное. 16, 2021 | Истории

Ловецът на фалшиви новини

16 ноември 2021 | Истории

Той е способен да „надуши“ фалшивите новини по-добре от хрътка. Нещо повече, може да каже, че те ще се появят… дори преди да са написани. Какъв е този ловец телепат? Вероятно сте се досетили, той просто не е човек, а алгоритъм. Не е идея, а вече сериозно навлиза в практиката. И не просто заклеймява дезинформацията и цензурира, а помага на хората да я улавят сами.

В проекта участва Масачузетският технологичен институт, но той се води от Катарския институт за компютърни изследвания. Екипът разработчици е воден от българин.

Преслав Наков е начело на изследователите, той е създателят на проекта „Танбих“ (срещнете го тук), арабската дума, значеща „сигнал за тревога“. Специалността му е обработката на естествен език (Natural language processing или NLP), много класации го поставят сред топ учените в направлението в световен план. Благодарение на тази област, където изкуственият интелект среща лингвистиката, вече имаме сериозни технологични придобивки, като например развития машинен превод. Д-р Наков обаче е концентрирал изследванията си именно в използването на тази изключително перспективна технология в една битка, която иначе изглежда окончателно изгубена. Битката за истината.

 

„Танбих“

 

И ловец съм, и рибар съм

Как да разберете, че сте неразбран гений? Гений сте и не ви разбират.

Какво е фалшивата новина? Новина, само че фалшива.

Не, не сме се събрали, за да създаваме мемове и шегички, а за да видим как се справя този ловец – алгоритъм. Какво прави, как работи.

Проблемът с фалшивите новини наистина започва от дефиницията. Дали ако журналистът сбърка дадено число в информацията си, това прави новината фалшива? Или пък трябва да има умисъл? Или има проблем, ако фактите се преплитат с интерпретациите?

Темата е стара, колкото е стара втората най-древна професия – журналистиката. И все пак, днес е по-важна от всякога, защото живеем в информационно общество. Заради балона на филтрите и факта, че сериозно се променя начинът, по който въприемаме информацията. Днес фалшивите новини са по-опасно оръжие, отколкото можем да си представим. Вече го няма авторитета на сериозните медии, всеки може да каже всичко и да стои на равна нога с безспорните авторитети по темата. Достатъчно е за пример да споменем информационното пространство, свързано с коронавируса.

 

Горящ вестник

Снимка: Pezibear от Pixabay

 

Наслука

„Да, невярната информация в новините винаги е била наоколо, помислете за таблоидите“, казва Наков. „Но социалните мрежи промениха всичко. Те направиха възможно зловредните източници да микротаргетират целите си по демографски показатели. Да разпространяват информацията много по-бързо и в огромни обеми. Благодарение на социалните мрежи новините могат да се превърнат в оръжие с безпрецедентни мащаби“.

Фалшивите новини имаха сериозно значение в последните два избора за президент на САЩ, често с тяхна помощ се вземат сериозни политически решения.

Проблемът доби нови измерения, след като дойде коронавирусът. Световната здравна организация още през февруари постави на второ място сред най-важните стъпки, за да стигнем до края на пандемията, битката с „инфодемията“.

Факт е, че в тази посока сериозно значение имаше и не винаги достатъчно адекватната информационна политика на властите и на експертите. И все пак, надали дори от СЗО биха могли да си представят, че начинът, по който се отразява пандемията в мрежата, ще доведе дотам, че когато всеки може да има ваксина, над 70% от българите няма да счетат за нужно да си я поставят.

 

Преслав Наков, „Танбих“

Снимка: Gerd Altmann, Pixabay

 

С пушка в ръка аз бродя през гората

Преди няколко години нашумяха услугите, които проверяваха достоверността на даден факт. И те са полезни. В крайна сметка, не е толкова трудно да се сравнят данните от достатъчно авторитетни източници с новината, че например някоя световна знаменитост се е разболяла от ишиас. Или че даден футболен отбор е победител друг.

Но това е елементарно. Да не говорим, че всеки от нас е редно да го прави. Да се замисли, преди да сподели заглавие, което му е прозвучало интригуващо, да отвори по-сериозен сайт, за да го провери, особено ако линкът е от очевидно съмнителен домейн.

Постепенно с това свикнахме. Разбира се, случва се всеки да се подведе, а много често в подобна ситуация изпадат по-възрастните хора, които все още имат друго отношение към информацията – щом е написано, значи е вярно. Сигурно знаете вица. „Колко да лети, дядо, най-много 2-3 метра…“

 

Ловна среща

И така, в основата на работата на нашия електронен ловец, арабският Шерлок Холмс, стоят дефинициите.

„Големият проблем не е, че фалшивите новини са неверни“, казва Преслав Наков. „А че те се превръщат в оръжие. А това е нещото, от което най-много се тревожи дори самият учен, направил възможен интернет – сър Тим Бърнърс-Лий“.

За много хора фалшивите новини са просто тези, които не им харесват, без въобще да ги интересува дали са верни, или не. Затова, според Преслав Наков по-подходящият термин в случая е „дезинформация“. „Тук вече дефиницията е доста проста, има само два компонента. Първият – че една информация не отговаря на истината и вторият: че има зловредна цел, предназначена е да навреди по някакъв начин. Повечето разработки по темата се концентрират само върху първата част от проблема. А по-важна е втората, именно нея има предвид Бърнърс-Лий, говорейки за превръщането на новините в оръжие. Основният проблем с фалшивите новини, както ще се съгласят и журналистите, не е, че те не съобщават вярна информация. Проблемът е, че те стават политическо оръжие“, допълва изследователят.

 

Преслав Наков, „Танбих“

Снимка: Jacek Dylag, Unsplash

 

Пропа-гадна

Често наричаме явлението „пропаганда“, а според нашия събеседник това не е основателно. „Пропагандата се пресича с дезинформацията. Тя също има два компонента, първият е, че някой цели да ни убеди в нещо, а вторият: че има предварително дефинирана цел. И се пак, при нея няма истина или лъжа, няма добро или лошо. Пропаганда е и кампанията на правителството за ваксинации, и думите на Грета Тунберг, която се старае да ни плаши, че стотици биологични видове изчезват всеки ден. Това е една от техниките на пропагандата – целенасочено предизвикване на страх. Само че в случая не бихме сметнали, че е проблем. Пропагандата не е нещо добро или лошо, тя е просто сбор от техники, целящи да убеждават“, допълва Наков.

Именно тези техники се учи да разпознава алгоритъмът за машинно самообучение „Танбих“. Като ги наслагва с всичко останало. И в резултат не търси крайното бинарно решение „вярно/невярно“, а просто информира потребителя за рисковете и нюансите, оставяйки му решението сам да прецени как да се възползва от информацията.

„Танбих“ анализира езика. Проверява как източникът на информацията се съотнася към новините, които публикува: съдържа ли доказано достоверни и доказано фалшиви. Ако често се цитират неверни твърдения, това е доста ясен знак, че и бъдещите публикации на тази медия отиват в същата посока.

Съществуват повече от 60 пропагандни техники, а „Танбих“ се концентрира върху 18 от тях, които са най-разпространени и най-ефективни днес.

 

Ловец храбрец

Битката с фалшивите новини е неравна, защото, както показва проучване на MIT, те се разпространяват 6 пъти по-бързо от истинските. Те са по-атрактивни, подготвени са така, че да бъдат харесвани. Освен това онлайн нещата се случват светкавично: 50% от разпространението им е през първите 10 минути! Как е възможно за това време да се направи проверка дали новината е вярна?

Това могат да го правят само потребителите. Които, в случая, да бъдат подпомогнати от възможностите на изкуствения интелект.

Лесно е да се провери дали е вярно едно изречение. Дори да бъде аналитично, това също може лесно да се отрази. Но, както казва нашият събеседник, в президентския дебат в САЩ например, се казват около 1000 изречения. Също и в една по-дълга и аналитична статия. Как може да се провери всяко съждение? Единственият шанс е с помощта на изкуствения интелект. Алгоритмите, особено в областта на езиковия анализ (и, за съжаление, най-вече на разпространените езици) имат невероятни умения, показателен е примерът с GPT-3. „Танбих“ взема най-доброто от тази област, за да анализира за читателя дългите текстове и да даде своята независима оценка. Какво ще прави с нея въпросният читател, е негова работа. Но така и би трябвало да бъде, доста различно например от света на „Фейсбук“.

 

Преслав Наков, „Танбих“

Снимка: Here and now, Pixabay

 

На пусия

Дяволът е в детайлите. Във внушенията. И най-вече в случаите, когато лъжата е целенасочена, масирана, има конкретна пропагандна цел и носи определени ползи на източника.

Както казва д-р Наков, многото проекти за проверка на факти – ръчни или автоматизирани, не могат да решат проблема, защото в момента, в който можем да докажем, че една новина е невярна, тя вече ще е достигнала до милиони хора и няма как да бъде спряна. Именно затова ученият насочва усилията си към технологията, която може да предсказва фалшивата новина.

Всички знаем, че дори „Фейсбук“, въпреки дългогодишните си усилия, така и не успява да намери достатъчно работещо решение в тази посока. Огромният обем информация в социалната мрежа няма как да бъде следен автоматично, а заради системата на докладване на публикациите често жертва на цензурата падат текстове, с които просто някой не е съгласен. Но това не ги прави фалшиви, особено в среда, в която уж се търсят мнения и гледни точки, а не новинарско съдържание (като преплитането между двете е в основата на най-големите проблеми в тази област).

Ако е доказано, че даден сайт, профил или какъвто и да било източник вече е създал фалшива новина, със сигурност е редно да сме по-мнителни. Именно в тази посока помага алгоритъмът на „Танбих“. Идеята е да предсказва. Като не цензурира, а просто помага на потребителите. Дава им основни показатели за това колко е достоверен източникът, оцветен ли е емоционално по темата, за която пише. Например политически.

 

Фалшива новина по ловджийски

Единственият шанс да изградим по-добра интернет среда, е като спираме пропагандата и фалшивите новини, преди да са се разпространили, убеден е проф. Наков. И първата стъпка е верифицирането и отделянето на достоверните източници на информация.

Няма как да провериш всяко отделно твърдение на света. И все пак, по този начин можеш да провериш една новина, преди дори да е написана“.

Реалният проблем е, че когато се появят натрупвания, внушения, когато не само лъжата има значение, а и си личи кой има полза от нея. Точно това цели да улавя алгоритъмът „Танбих“.

За момента той работи на арабски и английски, покрива публикации, свързани с политика, бизнес, спорт, наука, технологии… и конкретно ковид.

 

Преслав Наков, „Танбих“

Снимка: Ed Rojas, Unsplash

 

Ловци на градус

„Танбих“ умее да оценява общата достоверност на фактите в текста, градуса на пропагандното съдържание, наличието на крайни политически оттенъци, идеологии. Оценява новината в общата рамка на останалите. Анализира отделните информационни единици, но още по-добре анализира източниците на информация.

Историята на този изкуствен интелект започва като обикновена система за персонализирано филтриране на новините, подобна на „Гугъл Нюз“. После създателите му решават да го разширят с основната идея – не просто да събира новини, а и да ги обогатяват с информация за съдържанието на текста, за основните характеристики на автора и медията, от които идва. Полезно е да знаеш дали източникът има ясно изразена политическа връзка, ако е виден анти- или проваксър. И най-вече: винаги, когато е екстремно предубеден към дадена тема.

 

100 шарана… и една червена херинга

А както стана дума, специалитетът му е да разпознава техниките на пропагандата. Предизвикването на страх е само една от тях. Като цяло, се делят на две групи, а първата разчита на емоциите. Може да става дума за страх, за патриотични чувства, за съчувствие. Втората част са по-скоро логически парадигми. Например „или си с нас, или си срещу нас“. Класическа техника е „Ефектът на бандата“, когато ни убеждават, че някой ще победи на изборите с огромен процент и ние трябва да се почувстваме от правилната страна на историята, като се присъединим.

„Червената херинга“ е още една техника за пропаганда, дължи красноватото си име на Уилям Корбет, който го популяризира през 1807 г. На български я наричаме с доста по-скучното название „отвличане на вниманието“. А чуем ли „червена херинга“, някак си се замисляме, ама има ли я наистина тази риба? Извън шарения термин, този пропаганден подход го знаем от българските медии и политици до болка добре.

 

Преслав Наков, „Танбих“

Снимка: Ron Porter, Pixabay

 

На мушката

„Умишлено замъгляване“ е друг подход на пропагандата. При него комуникацията нарочно е замъглена, говори се на целенасочено усложнен език, с морфични резонанси, както бихме казали у нас.

„Танбих“ е научен да разпознава всички тези и останалите класически техники, като успоредно с това анализира и оценъчната страна на текста.

Ех, ако всички бяхме малко повече като „Танбих“.

Скоро, надяваме се, ще го имаме и на български. Поне за да ни светва лампичката. А дали не е доста късно за лампички и има ли кой да ги гледа в тотално мрачна медийна среда като българската… кой знае, ще видим.

Има защо да сме отчаяни от естествения интелект, особено що се отнася до политиката и медиите по нашите ширини, нека дадем шанс на изкуствения.

 

Ловецът на хвърчила

„Аз продължавам да смятам, че медийната грамотност е най-доброто дългосрочно решение за това как се информираме“, казва изследователят. „Затова и съм горд с инструмента, който създадохме. Той успява да улови фините техники на пропагандата и да информира читателите, че са манипулирани. Така те знаят как да подходят към тези източници на информация, а и какво да избягват занапред. В един момент даже няма да им трябва платформата, ще разпознават техниките сами. Същото се случи и с мен, а и с други учени, работещи по проекта“, допълва Преслав Наков.

„Вече не мога да чета спокойно новините. Всеки път, когато ги отворя, започвам да разпознавам една по една техниките на пропагандата. Вярвам, че ще е много добре, ако повече хора стигнат до този етап.“

А ние се разделяме с новия ИИ и със създателя му, но с уговорката, че скоро ще се срещнем отново, за да направим интервю. Да поговорим и за други теми, свързани с най-важните и бързо напредващи посоки, в които алгоритмите се очаква да променят света ни. За прословутия изкуствен интелект, когото сме натоварили с толкова много (често пресилени) очаквания да промени живота ни в толкова много посоки.

А вие: какво бихте го попитали?

 

Преслав Наков

Снимка: Владимир Мачоков

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

„Светът е вмирисан на кич. Затова върви към катастрофа“

„Светът е вмирисан на кич. Затова върви към катастрофа“

Текла Алексиева се превръща в легендарен илюстратор, след като създава 120 корици за книгите от поредицата „Библиотека Галактика“. Поколения читатели свързват най-големите фантастични романи с...

повече информация
Програмистът, който избра да е детегледач

Програмистът, който избра да е детегледач

Продължава да е повече от примамливо да се насочиш към програмирането, да потърсиш бъдещето си в прословутия IT сектор… Днешният ни гост е програмист с 20-годишен стаж! Насочва се към това поприще,...

повече информация
Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Можем ли днес да различим създаденото от изкуствен интелект и от човека? Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални...

повече информация
„Живеем във време на пълна трансформация“

„Живеем във време на пълна трансформация“

„Заобиколени сме от огромно количество софтуерни системи, ползваме ги в ежедневието си, а те са написани от посредствени програмисти. Счупен е начинът, по който създаваме софтуер!“ „Ценността на...

повече информация
Каква да бъде следващата Дигитална история?

Каква да бъде следващата Дигитална история?

Сещате ли се за история, която заслужава да бъде разказана? Отговорете ми и ако идеята ви се претвори в публикация тук, ще получите личен подарък – книгата „Дигитални истории“ с автограф или...

повече информация

От рубриката:

Програмистът, който избра да е детегледач

Програмистът, който избра да е детегледач

Продължава да е повече от примамливо да се насочиш към програмирането, да потърсиш бъдещето си в прословутия IT сектор…
Днешният ни гост е програмист с 20-годишен стаж! Насочва се към това поприще, много преди то да се превърне в мода и да стане толкова изкусително. Докато не усеща, че му е омръзнало да прекарва времето си пред компютрите, а най-приятно му е да е сред децата.
Така, напук на всички стереотипи, Богдан решава да си изкарва хляба, като гледа хлапета. Това го прави щастлив, осмисля ежедневието му. Дори не му минават идеи да се връща към компютрите, за него няма нищо по-смислено от времето, прекарано с децата…
Не е ли време да преосмислим някои клишета?

повече информация
Каква да бъде следващата Дигитална история?

Каква да бъде следващата Дигитална история?

Сещате ли се за история, която заслужава да бъде разказана? Отговорете ми и ако идеята ви се претвори в публикация тук, ще получите личен подарък.
3 години навършва днес начинанието Дигитални истории!
Време е за обобщение на постгнато дотук. Време е и да дадете мнението си. А накрая е време… за една неочаквана новина.

повече информация
„Тетрис“. Играта от СССР, която 40 г. ражда легенди

„Тетрис“. Играта от СССР, която 40 г. ражда легенди

Почти 40 години по-късно най-накрая оригиналният „Тетрис“ беше победен!
Триумфът на едно симпатично 13-годишно хлапе привлече погледите към добрата стара класическа надпревара във времената, когато компютърните игри са съвършена наслада за сетивата.
Какво има да ни каже това на фона на изкуствения интелект? Защо изведнъж в много интелектуални игри човекът се оказа способен на неочаквани умения? Как се роди играта, която всеки познава и как се превърна в легенда? Кои са интересните страни и мрачните ѝ тайни?
Това е дълга и поучителна дигитална история, която минава през забележителни личности, през триумфове и трагедии, през култури и обрати…

повече информация

Най-новите:

„Светът е вмирисан на кич. Затова върви към катастрофа“

„Светът е вмирисан на кич. Затова върви към катастрофа“

„За човека продължава да има 10 000 начина да мисли и да гледа света. А какво прави той, по дяволите? Зяпа си телефона. Децата, които растат сега, не са виждали какво има наоколо. Те са обект на фантастиката, живеят в паралелен свят. Те не знаят как изглеждат улиците, как изглеждат хората. Това ме кара да мисля, че няма оправия. Кой ще ги вкара в този свят? Ако стане случайно, те ще бъдат разбити.“
Текла Алексиева се превръща в легендарен илюстратор, след като създава 120 корици за книгите от поредицата „Библиотека Галактика“. Поколения читатели свързват най-големите фантастични романи с образите, нарисувани от нея. Освен художник със самобитен поглед и безброй признания, е и автор на стихосбирка.
Какво ли мисли тя за изображенията, генерирани от изкуствен интелект?
Защо според нея днес сме заобиколени отвсякъде от кич – в литературата, в изкуството, в живота?
Можем ли и как да си върнем добрия вкус?
Защо в никакъв случай не бива да напускаме Земята?
Как така… Текла Алексиева не е успяла да дочете книгата с една от най-известните ѝ корици?

повече информация
Програмистът, който избра да е детегледач

Програмистът, който избра да е детегледач

Продължава да е повече от примамливо да се насочиш към програмирането, да потърсиш бъдещето си в прословутия IT сектор…
Днешният ни гост е програмист с 20-годишен стаж! Насочва се към това поприще, много преди то да се превърне в мода и да стане толкова изкусително. Докато не усеща, че му е омръзнало да прекарва времето си пред компютрите, а най-приятно му е да е сред децата.
Така, напук на всички стереотипи, Богдан решава да си изкарва хляба, като гледа хлапета. Това го прави щастлив, осмисля ежедневието му. Дори не му минават идеи да се връща към компютрите, за него няма нищо по-смислено от времето, прекарано с децата…
Не е ли време да преосмислим някои клишета?

повече информация
„Колко ни е важна днес истината?“

„Колко ни е важна днес истината?“

„Как изпуснахме обществения договор? Ей така, тихичко…“
Вече не сме способни да различаваме текстовете и изображенията, генерирани от изкуствен интелект от тези, създадени от човека. Това е големият извод от експеримента на Дигитални истории, в който се включиха близо 2000 души.
Срещаме се с Надя Шабани, правозащитен адвокат и директор на БЦНП, и с Радина Банова-Стоева, правозащитен адвокат и правен консултант към центъра.
Какъв ще е начинът, по който оттук нататък ще можем да различаваме истината?
Защо е важно да си говорим за човешките права в контекста на големите въпроси, пред които днес ни изправят технологиите? Обречени ли са опитите за регулация на изкуствения интелект? Как да решим големия въпрос с етиката в тази област?
Защо решенията, които вземаме днес по въпросите на изкуствения интелект, имат толкова голямо значение за бъдещето на цивилизацията ни?

повече информация
Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Способни ли сме да различим създаденото от изкуствен интелект и от човека?
Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални истории.
Има обаче и толкова много други любопитни щрихи, които да ни накарат да се замислим…
Йеронимус Бош или Петко Славейков се оказаха по-трудни за разпознаване? Гозбите на Мария Жекова или строфите на Виолета Кунева?

повече информация
„Живеем във време на пълна трансформация“

„Живеем във време на пълна трансформация“

„Заобиколени сме от огромно количество софтуерни системи, ползваме ги в ежедневието си, а те са написани от посредствени програмисти. Счупен е начинът, по който създаваме софтуер!“
„Ценността на смисленото съдържание ще се вдига, защото има прекалено много боклук, прекалено много шум. Единственият начин да се съхраним като хора е, да слагаме прегради. Да пресяваме какво влиза в нашата глава.“
Борис Симандов има огромен технологичен опит. Близо 10 години е на директорска позиция в Chaos Group, една от най-успешните български IT компании. Днес помага в развитието на следващото поколение стартъпи.
Заедно с Росен Генчев са създатели на фейсбук групата DevBG, най-оживеното (и често доста странно) онлайн пространство, където се срещат хората от технологичния свят.
Ще поговорим:
– за това можем ли да се чувстваме спокойни в днешните турбулентни времена
– за революцията на изкуствения интелект, в която живеем и за скептиците
– за поредната важна стъпка – Sora и генерирането на видео
– за големите предизвикателства и професиите, обречени да изчезнат
– за връщането на истината като ценност и медиите на бъдещето
– за групата DevBG като най-добрия пример защо и как не работи демокрацията днес.

повече информация
Каква да бъде следващата Дигитална история?

Каква да бъде следващата Дигитална история?

Сещате ли се за история, която заслужава да бъде разказана? Отговорете ми и ако идеята ви се претвори в публикация тук, ще получите личен подарък.
3 години навършва днес начинанието Дигитални истории!
Време е за обобщение на постгнато дотук. Време е и да дадете мнението си. А накрая е време… за една неочаквана новина.

повече информация
Share This