Алгоритмите, които ни вкараха в „балона“

дек. 10, 2021 | Технологии

Алгоритмите, които ни вкараха в „балона“

10 декември 2021 | Технологии

Искам вечерта да гледам филм, обаче да не е тъп като последния. Търся препоръки. Някога щях да се ровя и ровя из интернет, сега няма нужда, изкуственият интелект се грижи за мен.

Алгоритмите за препоръчване на съдържание са сред по-старите и най-успешните представители на машинното самообучение. Днес да се говори за тях не е чак толкова на мода поради две основни причини. Вече могат да работят много добре и второ – никак не са удобна тема за тези, които ги използват най-активно.

Защо ли? Точно те са в основата на един от големите проблеми на днешното време: балона на филтрите. Бързаме, имаме време да четем само препоръчана информация, заобикаляме се с удобни гледни точни, нямаме сили за нюансите, така скоро се разделяме на ваксъри и антиваксъри…

…ама нали в началото ставаше дума за филми, това не е ли нещо безобидно? Точно така. Алгоритмите не са виновни за това как ние ги използваме. А историята на тези, които търсят как да предложат най-доброто съдържание, е интересна за всеки, който се интересува от технологиите и бъдещето, което те ни подготвят.

 

Нетфликс

 

ИИ, препоръчай ми филм!

Преди десетилетие особено нашумяла беше наградата на „Нетфликс“. Гигантът беше обещал милион долара на учените, които предлагат най-доброто решение в областта на алгоритмите за препоръчване на съдържание.

Последното връчване на приза през 2010-а беше отменено, от „Нетфликс“ се отказаха да организират повече надпреварата. Защото явно вече бяха станали достатъчно добри в това направление…

Дали системите за препоръчване са нещо добро или лошо, никак не е правилният въпрос. Винаги сме търсили препоръки от приятелите си за следващите книги, филми, плочи, на които да се насладим. Със сигурност е доста добър подход да се посъветваме с хора, които имат сходен вкус с нашия. Очевидно това например, че е един филм е станал много популярен, не е достатъчна гаранция, че ще ни хареса. Много по-добра идея е да сравним вкусовете си с наши приятели, които вече са го гледали.

Днес обаче нямаме време и за това. А и защо трябва да се случва по този начин, след като имаме на своя страна усъвършенстваните алгоритми за машинно самообучение? Те много добре умеят да съпоставят данните и да намират шаблоните, сходствата. В огромната база данни да открият хората със сходни с нашите вкусове, да систематизират информацията и на базата на това да ни дадат конкретна препоръка, която има много сериозен шанс да се окаже успешна.

И така, как работят системите за препоръчване, които днес са се доказали като най-добри?

 

Разделяй и уцелвай

Какво е машинното самообучение? Начин да създаваме „изкуствен интелект“, който помага в безброй много области (и може би един ден дори ще ни управлява). Както всички останали научни дисциплини, ако подходим без предубеждения, може да си го представим и като нещо по-просто. Компютърът получава огромна база от информация. После специалистите по машинно самообучение имат грижата да му предложат най-точните алгоритми, за да се опита да намери закономерностите в нея. Безброй са различните решения, някои са по-прости и могат да бъдат обяснени в няколко реда, други са почти невъзможни за популярно представяне.

Инженерите разделят данните, които подават, на такива за същинското обучение и за тестване на успеваемостта. После оставят програмата сама да опитва да налучква променливите параметри за съответния алгоритъм с основните данни и ги съпоставят с тестовите данни, отделени за тази цел.

В този момент прилагат различни нови методи, които да покажат колко добре се е справил със задачата си основният. Ако оценката му е достатъчно висока, са сигурни, че са си свършили работата. И могат да го пуснат на свобода…

 

Препоръчващи алгоритми

Снимка: mohamed Hassan, Pixabay

 

Четящи мозъци

Както стана дума, алгоритмите за препоръчване са едни от най-старите първопроходци в машинното самообучение, днес ги познаваме доста добре.

Основните подходи в това направление са два, наричат се „колаборативно филтриране“ и „филтриране, базирано на съдържанието“. В по-модерните решения се прилагат различни комбинации от тях така, че да се използват силните страни на двата подхода.

Колаборация, или сътрудничество, ще рече, че хората работят заедно, за да постигнат даден резултат. Това стои в основата и на колаборативното филтриране. Същият принцип, който споменахме и продължаваме да използваме и днес. А на езика на продажбите: „Хората, които купиха…, купиха и…“. Целта на алгоритъма в този случай е да обработи данните така, че максимално да потърси общите черти в избора на различните потребители, така че да изведе тенденциите.

Е, едно време всички харесваха „Титаник“, как тогава да се справим в океана от решения?

 

Колаборативно филтриране

Схема на колаборативно филтриране, направена от Google Developers

 

БезприСтрасти

Като цяло подходът е следният. Алгоритъмът за колаборативно филтриране групира хората, които са давали максимално близки рейтинги, както потребителя, на когото ще препоръчваме. После данните се използват, за да се изчисли колко е вероятно хората със сходен вкус да харесат и друг продукт от същата група. Измежду потребителите, харесали любимите ви филми, да намерим средните показатели за филмите и да видим за кои от тях са най-високи. Именно тях ще препоръчаме. Като, разбира се, опитаме да игнорираме например филмите, които имат твърде малко оценки, потребителите, които дават твърде разнопосочни числа. Или, т.нар. „пристрастие“, което в света на технологиите наричат с английския термин “bias”.

От другата страна идва филтрирането, базирано на съдържание. Идеята не е много различна, просто перспективата се обръща наобратно. Алгоритмите се базират на другите единици, които в случая са филмите, а не зрителите им. Сравняват се оценките на потребителите за всяка двойка филми и на базата на това се извежда предположение какъв би бил рейтингът на този потребител, който още не е гледал втория филм.

Както стана дума, „Нетфликс“ определено е пионер и доказан фактор в тази област, ето защо ще разгледаме по-подробно техния подход. Както твърдят от компанията, 80% от гледанията на техни филми са в резултат на персонализираните предложения. Представете си само! Едва 1 от 5 от филма е гледан, защото посетителят го е отворил сам, всички останали са били предложени като следващи най-добри решения.

 

Филтриране, базирано на съдържание

Схема на филтриране, базирано на съдържание, направена от Google Developers

 

Колаборационисти

„Нетфликс“ базират системата си повече върху подхода с колаборативното филтриране. Очевидно това се оказа печелившото решение след състезанието, за което ви споменах. А историята на наградата е повече от интересна. Малцина знаят, но „Нетфликс“ стартират бизнеса си в края на 90-те, разпространявайки филми на базата на абонамент, като доставят избраните заглавия на дивидита в домовете на зрителите.

През 2000 г. те представят за първи път напредничавата си система за препоръчване, а 6 години по-късно създават наградата, за която стана дума. Обещават да дадат 1 милион долара на всеки, който успее да създаде система с по-добри показатели. Има, разбира се и конкретна оценка, 1 милион не се дават току-тъй. Избран е един от най-често използваните критерии – този за оценка на средната квадратична грешка (RMSE). Алгоритъмът на „Нетфликс“ постига изключително високата стойност от 0,9525, а призът е обещан на всеки, който я надмине с поне 10%.

За щастие, наградата не си остава за тези, които са я обявили („за щастие“, защото те и без това си имат доста пари). През 2007 г. тя е спечелена с кандидатура, която ползва комбинация от два по-сложни алгоритми – матрична факторизация (SVD) и ограничени машини на Боцман (RBM). Успехът в този случай е вече 0,88, което изпълнява изискванията!

 

По първа програма

През 2009 г. наградата отново е спечелена, с нова комбинация от алгоритми. „Нетфликс“ чинно си изплащат отново обещаната сума, но този път решават да не използват предложените решения в своята практика. Преценяват, че за много малко по-добри резултати трябва да отделят прекалено сериозни разходи. Системата им и без това е доказано, че работи изключително добре, стигайки до споменатите 80% на препоръчаното съдържание.

Една от причините наградите след това да отпаднат е, че идва ерата на „стриймването“. Компанията спира да продава просто филми, а се превръща в абонаментна платформа, стигайки през 2021-а до над 190 милиона абонати!

Просто в този момент вече не им е чак такъв приоритет да препоръчват добре, защото следващата им продажба не е на нов филм, а на абонамент.

 

Препоръчващи алгоритми

Снимка: Gerd Altmann, Pixabay

 

Става за четене

Така системите за препоръчване продължават нататък, за да стигнем днес до времената на прословутия балон на филтрите. Със сигурност и днес именно споменатите алгоритми са в основата на персонализираното съдържание и препоръките, които получаваме от социалните мрежи и търсачките. Просто вече не се говори чак толкова за тези решения, защото те не са само повод за гордост.

Разбира се, всичко изброено дотук, са само основите идеи. Алгоритмите за препоръчване, с които работят „Фейсбук“ и „Гугъл“, са изключително комплексни и многопластови и, разбира се, за тях се знае малко. Освен това, последните разкрития, направени от бивш високопоставен служител на първата социална мрежа, ясно показват защо за компанията никак не е изгодно да показва системите си.

Що се отнася до „Гугъл“ и рекламите, които ви показва, има една малка подробност. На базата на ежедневните ви интеракции в мрежата, търсачката определя основни показатели за вас. Ще се учудите (или пък не) колко са точни те, ако надникнете тук. Даже можете да ги ограничите, поне така твърдят.

Така или иначе, в по-сложните задачи, като например лицевото разпознаване, машинния превод, автономните автомобили, днес се прилагат следващото поколение технологии. Те са висшият пилотаж в тази област и универсалното решение, на което се крепят най-големите очаквания за технологичното бъдеще – невронните мрежи.

Именно дълбоките невронни мрежи днес стоят в основата на препоръчващите системи на големите състезатели. При тях не се използват просто един или два конкретни алгоритъма, които обработват данните, а многобройни нива, способни да търсят още и още фини тенденции в данните. Благодарение на невронните мрежи компютрите дори могат да… сънуват! Но това е дълга и интересна тема, която скоро ще обсъдим по-подробно.

 

Препоръчващи алгоритми

Снимка: Gerd Altmann, Pixabay

 

Алгоритми на крак

Тук ще намерите файлово хранилище (малко странно, така е на български „репозитори“) с елементарен модел за създаването на алгоритъм за препоръчване на базата на официалната база данни, използвана за наградите на „Нетфликс“. Приложени са принципите на колаборативното филтриране.

И така, вече знаем малко повече за интелигентните системи, които ни подбират предпочитания – за новини, филми или книги. А това да знаем как работят, със сигурност е полезно и за да имаме предвид и негативните страни от тях. Алгоритмите не са добри или лоши. От нас зависи до каква степен ще им позволим с помощта на препоръчването да ни изпратят в „балона“. Те вече ни познават доста добре. Затова е добре и ние да ги опознаем…

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

„Изкуственият интелект навлиза мащабно, бурно и малко хаотично“

„Изкуственият интелект навлиза мащабно, бурно и малко хаотично“

Скоро България ще посрещне първата международна олимпиада по изкуствен интелект! Как така страната ни се оказва пионер в толкова важно начинание и какви възможности ни дава то? „Олимпиадата е нашият...

повече информация
Чергар, който свали правителството (без да иска)

Чергар, който свали правителството (без да иска)

Можем ли да променяме средата? Страната си, света…ако просто напишем онлайн това, което ни вълнува? Можем. Ето го най-силното доказателство, което съм срещал. „Все едно си говориш с призрак“, описва...

повече информация
„Разумен ИИ? Само ако направим следващата голяма стъпка“

„Разумен ИИ? Само ако направим следващата голяма стъпка“

Виктор Ботев и екипът му разработват успешен продукт в едно от най-високотехнологичните направления на изкуствения интелект. Но защо ли ентусиазмът му за близкото бъдеще, в което ИИ ще промени...

повече информация
Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме...

повече информация
„ИИ вече промени работата на преводачите“

„ИИ вече промени работата на преводачите“

Знаете ли, че автоматизираните системи за превод се използват навсякъде около нас? Че огромна част от административните и комерсиални текстове се превеждат на всички езици с изкуствен интелект, а...

повече информация

Още публикации по темата:

От рубриката:

Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме едновременно представителите си в националния ни и в Европейския парламент. Ключови избори има в 8 от 10-те най-големи държави на планетата, поне 2 милиарда души се очаква да се озоват пред урните (ако не отидат за гъби).
И ако за нас през последните години това се превърна в повтарящо се често, не особено атрактивно и мотивиращо задължение, то ето че за първи път демократичните процедури от подобен мащаб се случват в епохата след ChatGPT. Във времето, когато изкуственият интелект се превърна в голямата възможност и предизвикателство. И всичко това – на фона на цялостния упадък на интереса към демократичните процеси. В зората на зараждащите се обществени сътресения, които, няма как, са свързани изключително пряко с технологичната революция, в която живеем.
Може ли изкуственият интелект да се превърне в ключов фактор, който ще решава задаващите се избори? Има ли как да намалим риска да бъдем манипулирани в избора си, на фона на и без това манипулативните форми на комуникация онлайн? Как ще изглежда и колко е далеч моментът, когато технологиите ще ни позволят да направим следващите стъпки от развитието ни като вид, от начина, по който е организирано и управлявано обществото ни? Ето осем повода за замисляне.

повече информация
Stack Overflow. Спасителят на програмистите си отива

Stack Overflow. Спасителят на програмистите си отива

Много е лесно да различиш човек, който някога е програмирал от останалите – „докосвал“ ли си код, просто няма как да не си виждал Stack Overflow. Само за 15 години сайтът с въпроси и отговори промени из основи начина, по който работят програмистите. Превърна се в Мека за софтуерните инженери, в спасителен пристан за почти всеки ежедневен техен проблем.
Днес обаче легендата върви към своя залез. При това, по ирония на съдбата, заради напредъка в технологиите, който сама направи възможен…
Нещо повече – заради упадъка на проекта мнозина вещаят сериозни проблеми, с които ще се сблъскват следващите програмисти.
Историята на Stack Overflow е показателна за това къде сме днес в света на технологиите. За стремителната скорост, с която се променяме. За семенцата, за добрите идеи, които могат да покълнат само ако попаднат в подходящата среда и в точния момент. И за бързината, с която до вчера непоклатимият гигант се превръща в сянка на себе си.

повече информация
Как DALL·E „прочете“ любими български книги?

Как DALL·E „прочете“ любими български книги?

Чукчата не е читател, а писател, знаете сигурно, ами… ChatGPT? Време е за поредния прелюбопитен експеримент, който да ни покаже на какво са способни днес алгоритмите в областта както на създаването на изображения, така и на разбирането на контекст.
Ще призова алгоритъма DALL·E 3, който е част от платената версия на ChatGPT, да ми илюстрира класически български литературни произведения от различни периоди.
Защо това е интересно? От една страна, ще ни покаже колко добре работи големият езиков модел на български. Ще стане ясно доколко разпознава някои от безспорните наши класически произведения.
Не на последно място просто защото… е интересно дали пък няма да ни покаже някакви по-неочаквани, различни, атрактивни гледни точки? Дали не можем да говорим за някаква форма на колективно неосъзнато? Дали картините ще се припокрият поне донякъде с образите, които всеки от нас има за тези книги в главата си?

повече информация

Най-новите:

Как се „счупи“ разговорът онлайн?

Как се „счупи“ разговорът онлайн?

Днес в мрежата можем да си говорим както никога за важните неща, да чуем мнението на най-интелигентните хора, да обсъдим, а… се чудим за какво да се изпокараме.
За и против правителството, Тръмп, скандалната участничка в „Ергенът“ (защото се очаква да избират само нескандални). Машинното гласуване, ваксините, съдебната реформа. Новия чалга хит, поредната недомислена законова промяна и какво ли още не.
Знаем, че живеем в социалните балони, че платформите за съдържание отдавна не са място за среща с приятели, а големи телевизори, които правят всичко, за да погълнат вниманието ни, но… какво от това?
Можем ли да променим нещо? Струва ли си? Ето един малък експеримент, гарниран с 8 повода за замисляне.
Ще се върнем към темата за ковид и начина, по който я осмислихме. Ще тръгнем по пътя на една журналистическа публикация, за да поразмишляваме заедно. За мястото, докъдето сме стигнали.

повече информация
„Изкуственият интелект навлиза мащабно, бурно и малко хаотично“

„Изкуственият интелект навлиза мащабно, бурно и малко хаотично“

Скоро България ще посрещне първата международна олимпиада по изкуствен интелект! Как така страната ни се оказва пионер в толкова важно начинание и какви възможности ни дава то?
„Олимпиадата е нашият принос едновременно за изграждането на елитна човешка експертиза за съвместно бъдеще с изкуствения интелект и за широк обществен диалог за възможностите, ограниченията и етичните въпроси, свързани с ИИ“, казва днешният ни гост.
Елена Маринова е съосновател и дългогодишен президент на „Мусала Софт“, днес е член на консултативния съвет на ИТ компанията на 6-милиардната група KKCG. Лидер с огромен опит в бизнеса, тя е начело и на редица инициативи, свързани с въвеждането на иновации и образованието.
Елена е съосновател на първата международна олимпиада по изкуствен интелект, която от 9 до 15 август ще събере в Бургас талантливи младежи от поне 30 държави. (Още за IOAI – тук.) Включват се учени от водещи университети, които вече подготвят състезанията, а и ще представят своите най-нови разработки.
Как така именно в България се роди идеята за подобно състезание? Какви са възгледите на един дългогодишен лидер в IT сферата за бъдещето ѝ? Какви са най-големите промени, които според госта ни обещава развитието на изкуствения интелект и защо е толкова важен диалогът по тези теми?

повече информация
Чергар, който свали правителството (без да иска)

Чергар, който свали правителството (без да иска)

Можем ли да променяме средата? Страната си, света…ако просто напишем онлайн това, което ни вълнува?
Можем. Ето го най-силното доказателство, което съм срещал.
„Все едно си говориш с призрак“, описва срещата ни събеседникът. А не ми прилича на призрак, същински Шерлок, върлинест, с шахматно карирани каскет и сако. После, в разговора, повече ми заприличва на друг знаменит литературен герой, един идалго.
Срещу мен е легендарният блогър Чергар, създал незабравими текстове и мистификации, които и до днес стоят на почетно място в дигиталния фолклор и колективната памет. Авторът на сайта neverojatno, от определен момент познат и като „Бъзикилийкс“. За „Истината такава, каквато можеше да бъде!?“
Но как един анонимен блогър се превърна в честа тема за разговор между политици и медии? И как негов текст доведе до… оставката на българското правителство, при това… без той да го иска или очаква?
„Ако младите имат желание, имат идея, имат нещо, в което вярват и искат да постигнат, винаги трябва да положат усилия…“

повече информация
„Разумен ИИ? Само ако направим следващата голяма стъпка“

„Разумен ИИ? Само ако направим следващата голяма стъпка“

Виктор Ботев и екипът му разработват успешен продукт в едно от най-високотехнологичните направления на изкуствения интелект. Но защо ли ентусиазмът му за близкото бъдеще, в което ИИ ще промени всички ни…, е далеч от ширещите се огромни очаквания? Предстои ни да срещнем една неочаквана, задълбочена гледна точка към голямата тема на нашето време.
Вече 8 години гостът ни е главен технологичен директор на Iris.ai. Норвежко-българският стартъп разработва системи за прилагането на изкуствен интелект в обработката на масиви с научни данни.
Защо не изглежда да сме чак толкова близо до генералния изкуствения интелект? Обречени ли сме да се съобразяваме с пристрастията и халюцинациите на моделите, преди да измислим следващата голяма стъпка?
Надценихме ли ефекта от появата на ChatGPT и това кои области могат да бъдат променени из основи от големите езикови модели? Защо според госта ни сме близо до предела на възможностите им и е време за следващата голяма стъпка?
Защо според него ерата на сървиз компаниите у нас приключи безвъзвратно? Изпуснахме ли ключовия момент да изведем IT индустрията си на следващото ниво и има ли шанс да наваксаме?
Очаква ни един дълъг технологичен разговор по човешки за ценители…

повече информация
Избори + изкуствен интелект. Перфектната буря

Избори + изкуствен интелект. Перфектната буря

Тази година почти 2/3 от хората на земното кълбо ще избират, по един или друг начин, онези, които да ги управляват. Открояват се изборите за президент на САЩ на 5 ноември, у нас на 9 юни ще избираме едновременно представителите си в националния ни и в Европейския парламент. Ключови избори има в 8 от 10-те най-големи държави на планетата, поне 2 милиарда души се очаква да се озоват пред урните (ако не отидат за гъби).
И ако за нас през последните години това се превърна в повтарящо се често, не особено атрактивно и мотивиращо задължение, то ето че за първи път демократичните процедури от подобен мащаб се случват в епохата след ChatGPT. Във времето, когато изкуственият интелект се превърна в голямата възможност и предизвикателство. И всичко това – на фона на цялостния упадък на интереса към демократичните процеси. В зората на зараждащите се обществени сътресения, които, няма как, са свързани изключително пряко с технологичната революция, в която живеем.
Може ли изкуственият интелект да се превърне в ключов фактор, който ще решава задаващите се избори? Има ли как да намалим риска да бъдем манипулирани в избора си, на фона на и без това манипулативните форми на комуникация онлайн? Как ще изглежда и колко е далеч моментът, когато технологиите ще ни позволят да направим следващите стъпки от развитието ни като вид, от начина, по който е организирано и управлявано обществото ни? Ето осем повода за замисляне.

повече информация
„ИИ вече промени работата на преводачите“

„ИИ вече промени работата на преводачите“

Знаете ли, че автоматизираните системи за превод се използват навсякъде около нас? Че огромна част от административните и комерсиални текстове се превеждат на всички езици с изкуствен интелект, а задачата на хората е да проверяват и поправят?
Вече дори не ги наричат „преводачи“, а „постредактори“.
След като хората станаха постредактори на алгоритмите… тук ли е някъде и срещата с постистината? Ще влезе ли изкуственият интелект в ролята на вавилонска рибка, или ще създаде новия Вавилон?
Познавате Рада Ганкова от гостуването ѝ преди година, когато си поговорихме за залинялото ни словотворчество. За лекотата, с която вземаме думи като „еърфрайер“, докато някога сме били достатъчно оригинални да измислим „чушкопек“. Днес ще поговорим за основната ѝ работа – превода, и начина, по който я променя навлизането на изкуствения интелект.

повече информация
Share This