Как алгоритъмът се научи да познава лицата ни

мар. 29, 2022 | Технологии

Как алгоритъмът се научи да познава лицата ни

29 март 2022 | Технологии

Лицевото разпознаване се оказа изключително успешно приложение на изкуствения интелект. Едно от малкото му направления, които на практика достигнаха до съвършенство. Преди няколко години фейсбук стана плашещо добър в това да разбира кой е на дадена снимка, после… официално и тихомълком се отказа от тази услуга.

Днес можем да минем паспортен контрол на летището, след като камерата „се убеди“, че именно нашето лице е на паспорта. В Москва например не е нужно да имаш билет, за да влезеш в метрото, системата веднага разбира кой е насреща.

 

По лицата ще ни познаете

Толкова сме разглезени от удобствата на технологиите, че този огромен пробив изобщо не ни направи впечатление.

Темата обаче е много голяма. Първо, защото е повече от интересно да разберем как работят алгоритмите, които позволиха на практика безгрешно една достатъчно качествена снимка да „каже“ веднага кой от хората в базата данни е на нея.

А на следващо място – за да обсъдим кога това може да се превърне в проблем.

 

 

Лице в лице

Всички направления, от които очакваме революция в света на изкуствения интелект, могат да бъдат обобщени по следния начин. Имаме достатъчно огромна база данни, с помощта на която специалистите в тази област прилагат усъвършенстваните си алгоритми, за да намерят закономерностите. Целите им могат да бъдат какви ли не, но в крайна сметка се свеждат до само две. Или да предположат какво ще следва в дадена поредица на базата на тази закономерност. Или да класифицират следващата единица информация. В нашия случай именно това е целта: да определят кое е това лице.

Алгоритмите в тази посока са немалко. Някои минават през обичайното машинно самообучение, но истинският пробив дойде с включването в състезанието на дълбоките невронни мрежи.

 

По лице

Ето как работят алгоритмите, независимо в кое от двете им поколения.

Със сигурност първата им задача е да „намерят“ къде точно минават очертанията на лицето в рамките на изображението, което са получили.

Нататък… може би си мислите, че програмата ще потърси, както едно време в детективските сериали, фотопортрета? Максимално близките по форма и размери уши, очи, вежди, нос, скули…

Нищо подобно. Именно в това е силата на модерните технологии и конкретно на дълбоките невронни мрежи. Те до голяма степен се абстрахират от детайлите. Тяхната основна нужда е да разполагат с достатъчно големи данни (и именно те са златото на нашето време). После постепенно да анализират стъпка по стъпка, слоеве от алгоритми да търсят закономерностите и да ги предават на следващите.

 

Лицево разпознаване

Снимка: Andrea Piacquadio, Pexels

 

Странни птици

По пътя към това се получават някои меко казано странни изображения. Типичен пример са психеделичните картини, получени чрез алгоритмите на „дълбокото сънуване“ или deep dreaming (тук).

Не по-малко интересни са резултатите от междинните слоеве в работата на системите за лицево разпознаване. Както можете да видите, става дума за доста размазани образи, отново по някакъв начин като че ли извадени от дълбините на човешкото неосъзнавано. Никак не е случайно, че работата не невронните мрежи се асоциира все повече с начина, по който работи и мозъкът ни.

Аналогията е още по-точна, стане ли дума за лицевото разпознаване. Защото всъщност и нашият мозък не „помни“ лицата като поредица от отделни елементи, а по-скоро като закономерности, които се наслагват на подсъзнателно ниво. И ние, и алгоритъмът не се замисляме дали пред нас е човекът със сини очи, бакенбарди и… какво ли още не, а веднага казваме, че това е той заради комбинацията от пропорции, които представлява лицето. Дистанцията между очите, формата на челюстта, разстоянието между носа и устата… Така класификацията става завършена.

 

Лицево разпознаване

Снимка: cottonbro, Pexels

 

Face to face

Разбира се, за да се случи всичко това, в случая с невронните мрежи, е нужно снимките да се превърнат в числа, само с тях работят този тип системи. За това отдавна има достатъчно стандартизирани подходи, които работят безотказно.

След като минат през многото етапи на анализ, алгоритмите стигат до крайния си резултат. Тогава могат да ни кажат кой е на снимката с невероятна точност, която днес доближава 100-те процента, ако снимката е ясна, с достатъчно добра резолюция и се вижда достатъчна част от лицето.

Също както и ако ние видим някой познат. С разликата, че в нашата „база данни“ влизат стотици или хиляди души, а в тази на „колегата“ алгоритъм, понякога милиарди, както беше в примера с лицевото разпознаване, предлагано от фейсбук.

После дойде ред и на много по-трудни задачи. Да се симулират и „създават“ лица например. Тук можете да видите колко плашещо добри са вече и в тази област алгоритмите.

Докато междувременно лицевото разпознаване от страхотен лукс, помагащ да подредим снимките в албумите с всичко заснето с телефона ни… се превърна явно в неудобна тема.

 

Снимка: Shubham Dhage, Unsplash

 

Face бук

Показателен е примерът с това как тихомълком отпадна услугата в най-голямата социална мрежа. Та собственото ѝ име идва от „лице“ и „книга“. Как станаха неудобни лицата? Каква ли е причината? Системата за разпознаване работеше на практика безгрешно..

И тя продължава да работи, просто не и за потребителите. Факт е, че днес не е особено трудно с помощта на достатъчно голяма база от снимки да се създаде съвършено решение за разпознаване. Само че, явно се оказа неудобно начинание, отварящо много въпроси.

Сред официално обявените причини бяха грижата за личните данни (ха-ха). Фактът, че цветнокожите и азиатците биват обърквани от алгоритъма над 100 пъти по-често, а също: че системите идентифицират хората с баналното разделение на половете между мъже и жени и няма как да определят някой, който се вписва в нюансите.

Американското законодателство позволява и прилага алгоритмите за лицево разпознаване от 2001 г. с тогавашното издание на „Супербоул“. Именно тази година се смята за официалния прощъпулник на този тип технологии. И все пак, предстои да измине десетилетие, преди системите да заработят достатъчно прецизно.

Ако насред тълпата, например на футболен мач, може да се разпознае човек, който извършва престъпление, това е добре, нали? Само че по същия път минава и опасността от тотален контрол.

 

Лицево разпознаване

Снимка: Click on , Pixabay

 

Лице и опако

Да, заговорим ли за тази тема, първото, за което сигурно ще се досетите, е китайската система за социален рейтинг и фактът, че в тази страна огромният брой на камерите, който днес се оценява на 500 милиона, е важно звено от веригата. Може би, но дали само там стои този проблем?

Лицевото разпознаване дълго време беше мечта, а днес е неудобна истина. Първите проекти в САЩ по темата датират от 60-те. Само че тогава усилията стигат дотам учените да търсят закономерности в лицата, да мерят с линийка и да анализират… без особен шанс за успех.

Докато през второто десетилетие на 21-и век алгоритмите се оказаха достатъчно добри, за да се справят. През 2011-а системите помогнаха, за да бъде идентифициран и убит Осама бин Ладен. През 2014-а се появи услугата на фейсбук с тогава доста симпатично звучащото название DeepFace. През същата година лицевото разпознаване официално беше използвано за зрелищното разкриване на няколко престъпления в САЩ.

Също през 2014-а Едуард Сноудън публикува документи, с които разкри, че американското правителство събира огромни обеми от изображения, включително и от нерегламентирани източници, за да изгради съвършена система за лицево разпознаване.

После темата поизчезна от общественото пространство.

 

Снимка: Pexels, Pixabay

 

Личице

Днес почти всеки нов телефон може да се отключи, виждайки лицето на собственика си. Тук даже няма намеса на невронните мрежи, става дума за доста по-простите алгоритми на машинното самообучение, които не са с такава висока прецизност, не им ѝ трябва.

Смята се, че пазарът на софтуер, свързан с лицево разпознаване, днес е за около 7,7 милиарда долара срещу 4 милиарда преди 5 години. Тази необходимост има все повече приложения, а, както стана ясно, добрата работа на тези системи отдавна не е в ръцете толкова на самите алгоритми, колкото на обема данни, с които разполагат.

Как точно се докопват данните… е интересният въпрос. Трябват ви лица и имена, а вече доста социални мрежи дават възможност да ги получите. И точно това е проблемът: че днес, благодарение на социалните мрежи, нашите снимки вече са навсякъде. Това улеснява алгоритмите и дава козовете в ръцете на същите социални мрежи, които пък имат достъп до повече фотографии.

Забавен пример в тази посока е историята на милиардера Джон Кациматидис, който в една октомврийска вечер през 2018-а е поканен в суперлуксозен италиански ресторант в Манхатън, за да се запознае с гаджето на дъщеря си. Той моли сервитьора да им щракне снимка за спомен и тихичко отива настрани, за да потърси кой е този младеж. Ползва на телефона си приложението за лицево разпознаване Clearview AI, вижда, че кандидат зетят е създател на съмнителна компания в Сан Франциско, преценява, че е шарлатанин и казва на дъщеря си. И… се оказва прав.

Но дали наистина това е бъдещото на човешките отношения? Или сме вече в света на добрите стари антиутопии?

 

 

Налице

В Китай има и други приложения. В края на 2018-а в град Цзинан бяха представени системи, с чиято помощ се пести тоалетна хартия. Благодарение на лицевото разпознаване всеки посетител на обществените тоалетни може да получи още 70 сантиметра тоалетна хартия едва 9 минути, след като е минал веднъж. Така се пестели доста метри от луксозната стока.

Няма да асоциираме със софийските мобилни тоалетни, където 70 см хартия биха били неземна радост.

Класическото лицево разпознаване е достигнало съвършенство и дълбае в детайлите. Например, все по-съвършени са решенията, които разпознават човека по част от снимката, нещо доста полезно в годините, когато маските станаха задължителен моден аксесоар.

Или пък, що се отнася до разпознаването на лица, което е успешно дори при сериозни възрастови разлики. Алгоритъмът да може да ви познае и на детските снимки, макар че вече сте в зряла възраст.

Оказва се, че технологиите в тази посока се справят учудващо добре с помощта на известни допълнителни разработки. Явно основните характеристики, които побират нашето излъчване, си остават същите, веднъж щом излезем от бебешката възраст. В това има логика, защото, както стана дума, алгоритмите търсят закономерностите и пропорциите, точно както го прави и мозъкът ни.

 

Не лице приятно

При създаването на DeepFace през 2014-а програмата на „Фейсбук“ познава един и същи човек на снимката с точност 97.25%, а в състезанието все още водят хората, макар и минимално с 97,53%.

През юни 2015-а „Гугъл“ повежда в надпреварата чрез системата си FaceNet, която постига точност от 99,63%.

С риск да е прекалено опростено… може би има логика точно тези две споменати компании да направят сериозните стъпки, защото имат достъп до по-големи бази от кадри?

Да, онлайн съществуват огромни обеми от свободнодостъпни масиви данни, които могат да се използват за обучение на невронни мрежи, но когато дойде време за същинската класификация… е логично да водят тези, които имат повече снимки като потенциален резултат.

 

Снимка: 0fjd125gk87, Pixabay

 

Face the face

Изследване на Американския институт за стандарти и технологии показва, че през 2014-а грешката на подобни алгоритми е 4,1%. Докато през април 2020-а тя е вече само… 0,08%. Разбира се, с важното уточнение, че става дума за качествени снимки. Ако те са ясни и чисти фронтални снимки, като тези за паспорт, грешката пада до 0,03%. Е, това обяснява защо вече е доста по-прецизно компютърът да ни „снима“ и прецени дали сме ние, а не митническият служител на летището.

И все пак… не всичко е толкова лесно. През 2018-а „Нюзуик“ прави любопитен експеримент, при който системата на „Амазон“ за разпознаване на лица… погрешно идентифицира 28 сенатори като хора, арестувани за криминални престъпления.

Успоредно с усъвършенстването на алгоритмите, започнаха да се появяват и решения, които да ги затрудняват. Руският изобретател Григорий Бакунов например предлага специален грим, който прави хората неразпознаваеми за софтуера. Германският му колега Адам Харви пък продава специални модни аксесоари.

Друга стратегия казва, че са достатъчни маска и слънчеви очила… за чувал на главата така и не съм чел, може би си струва да се патентова.

 

Маски долу

Опити има и „от другата страна“. Fawkes се казва софтуерът, който променя невидимо малки пиксели от изображенията, които качвате в социалните си мрежи, така че да не бъдете разпознаваеми след това от алгоритмите. Тъй като изображенията се превръщат в числа, малкото отклонение на правилното място, може би наистина би ви направило незабележимо.

Но дали наистина е така… една невронна мрежа знае.

В САЩ дебатът за използването на лицевото разпознаване от правителството минава през обичайния и все по-задълбочен през последните години разлом. Докато беше президент, Доналд Тръмп регламентира използването на технологията от граничните служби, междувременно градове с традиционен уклон към демократите, като Сан Франциско, Бъркли и Бостън, изцяло забраниха използването на технологията.

Засега у нас такива проблеми нямаме, кметовете на Каспичан и Опака мълчат.

Макар че въпросът отпраща към вечни теми, свързани със социалните науки и етиката, по-важни днес, според мен, са аспектите ѝ, свързани с приложенията от страна на големите компании. А този дебат все изглежда страничен на други, доста по-маловажни. Като например прословутия спор дали данните на европейските потребители могат да се съхраняват от фейсбук отвъд океана.

Докато по-важният въпрос е как се използват тези данни. И кога се обръщат срещу нас, за да ни контролират и манипулират по един или друг начин. Дано стигнем и до този разговор…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук. .
Дигитални истории

Най-нови публикации:

„Забравихме, че бебето знае как да се роди“

„Забравихме, че бебето знае как да се роди“

Как технологиите промениха бременността и раждането? С какво облекчиха и как – парадоксално, в други посоки създадоха проблеми за начина, по който идваме на бял свят? Жени Маркова се свърза с мен...

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното...

повече информация
„Страх от технологии = изоставане на нацията“

„Страх от технологии = изоставане на нацията“

Толкова е пъстър пътят на днешната ни гостенка! 11 години се занимава с журналистика. После се насочва към туризма, за да стане… управител на хотел на Марианските острови в Тихия океан. Докато...

повече информация
Колко е IQ-то на ChatGPT?

Колко е IQ-то на ChatGPT?

Какви ли не хобита имат хората – някои колекционират марки, други – евро, трети дори имат търпението да гледат български футбол. Е, аз освен че имам навика да проверявам нищожните си познания в...

повече информация
„Пожертвахме две поколения, защото не знаехме как работят технологиите“

„Пожертвахме две поколения, защото не знаехме как работят технологиите“

„Ние, възрастните, пожертвахме две поколения, защото създадохме нещо, което не знаехме какво е и как работи. Тези деца са жертва на нашата некомпетентност. Вече никой не може да каже, че не знаем до...

повече информация

Още публикации по темата:

От рубриката:

Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация
Таралежите се раждат без ИИ

Таралежите се раждат без ИИ

В какъв свят ще живеят днешните деца?
Какво има смисъл да учат днес и кое би било загуба на време, усилия и пари?
Кога и как да ги срещнем с технологиите така, че да им помогнем да се опознаят, без някой да пострада?
А кога да ги „запознаем“ с изкуствения интелект?
Ще потърся отговорите на тези и други важни въпроси, свързани с децата и технологиите. Започва дълга поредица от детски Дигитални истории.
Ето защо според мен е жизненоважно да навлезем по-дълбоко в тези огромни теми:

повече информация
Как срещаме децата с технологиите? (Анкета)

Как срещаме децата с технологиите? (Анкета)

В какъв свят ще живеят децата ни? А как да ги срещнем с технологиите по най-добрия начин?
Имам две хлапета и този сайт го има, защото тези въпроси не ми дават мира. Докато има още толкова важни въпроси, на които е време да намерим отговор.
Нека ги обсъдим, а после да потърсим отговорите. Нека заедно нарисуваме картината на днешното дигитално родителство и погледа му към бъдещето.
Анкетата е насочена към родителите на деца от 0 до 11 години (а и към баби, дядовци, хора, които имат отношение към децата). Темите на тийнейжърите също са изключително важни, и за тях ще дойде моментът.
Анкетата е анонимна, можете да отговорите на въпросите, които си изберете. Можете да се включите и в жребий за награди – подбрани книги и фланелки с логото на Дигитални истории. Отговорите се събират до 28 февруари, а в началото на март очаквайте резултатите.
С тази анкета започва поредицата от важни Дигитални истории за децата и технологиите. Ще поговорим за майчинството и бащинството днес, за промените в образованието, за професиите на бъдещето. Поканил съм забележителни гости, от които всеки родител (включително и аз) има много какво да научи.
Благодаря от сърце за всяко попълване, за всяко споделяне!

повече информация

Най-новите:

„Забравихме, че бебето знае как да се роди“

„Забравихме, че бебето знае как да се роди“

Как технологиите промениха бременността и раждането? С какво облекчиха и как – парадоксално, в други посоки създадоха проблеми за начина, по който идваме на бял свят?
Евгения Маркова се свърза с мен заради поредицата „Дигитални деца“ с предложението да поговорим за този аспект от връзката на технологиите с родителството. Тя живее в Германия и макар че дълги години е работила в сферата на маркетинга и разработката на софтуер, днес основното ѝ занимание е на дула. Особено популярно на запад, това е попрището на жени, които не са медицински специалисти, но помагат с информация, съвети, практическа и емоционална подкрепа на бъдещите майки.
Кога предоверяването на технологиите може да се превърне в проблем при бременността и раждането? Защо си струва в някои посоки да се върнем към традициите и повече да слушаме тялото си, а не само медицинските показатели или чужди съвети? Време е за един важен разговор, който според мен би могъл да даде много полезни идеи за хората, които тепърва се готвят да станат родители.

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация
„Страх от технологии = изоставане на нацията“

„Страх от технологии = изоставане на нацията“

Елица Стоилова казва, че дигиталната грамотност би трябвало да се превърне в национална цел, ако искаме да вървим напред. „Липсата ѝ води до страх от технологиите = консерватизъм в тяхното въвеждане и използване = изоставане на нацията ни в множество посоки. Какво е бъдещето на неграмотните народи?“, написа ми тя.
Толкова е пъстър пътят на днешната ни гостенка! 11 години се занимава с журналистика. После се насочва към туризма, за да стане… управител на хотел на Марианските острови в Тихия океан. Докато накрая акостира в ИТ света. Разбира, че голяма част от задачите в туризма успешно могат да се изпълняват от алгоритми, тъй като са повторяеми. Така създава чатбот платформата UMNI, много преди друг един чатбот да привлече погледите на света към това колко е напреднал изкуственият интелект.
Но как така… тя е толкова оптимистично настроена за пътя напред? Гостенката ни смята, че ако правилно изиграем картите си, ИИ ни води към едно прекрасно бъдеще. От какво зависи дали ще изиграем картите си както трябва? И защо понякога си струва дори да изоставиш едно от най-райските кътчета на планетата, преследвайки мечтите? Търсим важни и неочаквани отговори в следващите редове.

повече информация
Колко е IQ-то на ChatGPT?

Колко е IQ-то на ChatGPT?

Какъв е коефициентът на интелигентност на напредналия изкуствения интелект?
Достига ли, надминава ли средните 100 точки на днешното човечество? И защо това е важно?
Хайде да научим заедно!

повече информация
„Последният печели“. ChatGPT отвръща на удара!

„Последният печели“. ChatGPT отвръща на удара!

Из въздуха витае интелигентност, в залата са малко над 100 души, повечето от тях са сред най-интелигентните в нашата страна. Не е предположение, мога да го докажа. Те са сред победителите в „Последният печели“ – телевизионното състезание, което през последните години припомня защо знанието е важно за всички ни, дори като вид, във времената на напредналия изкуствен интелект.
С моите съмишленици в залата имаме важна задача. Да се изправим заедно срещу ИИ в едно състезание, което може да ни каже и покаже много.
Ще победи ли с днешните си невероятни умения изкуственият интелект едни от най-знаещите представители на естествения? Време е да проверим. И да научим нещо ново…
ChatGPT срещу някои от най-интелигентните българи в състезание по познание. Кой ще победи? Изгубихме ли окончателно и тази битка срещу машините? Ръкавицата е хвърлена!

повече информация
„Пожертвахме две поколения, защото не знаехме как работят технологиите“

„Пожертвахме две поколения, защото не знаехме как работят технологиите“

„Ние, възрастните, пожертвахме две поколения, защото създадохме нещо, което не знаехме какво е и как работи. Тези деца са жертва на нашата некомпетентност. Вече никой не може да каже, че не знаем до какво води прекомерната употреба на дигитални устройства за развитието на емоционално-интелектуалния апарат на децата.“
Но какви точно са тези щети и защо са толкова важни? Как прекомерното излагане на технологии променя необратимо децата? И какво да правим, след като го знаем?
Слави Стоев е психолог, води обучения за лидерство и мениджърски умения, водещ е на подкаста „Естествен ѝнтелект“. В същото време е и баща, и автор на детски книжки, посветени на ранното развитие и емоционалната интелигентност.
Точният гост, с когото да потърсим има ли среден път в отношението на родителите към технологиите и как можем да го намерим. Ще поговорим за базовите умения, които днес не успяваме да развием, и упадъка, към който се е насочила цивилизацията ни. Ако бързо не вземем целенасочени мерки, свързани именно с пресечната точка между технологиите и децата.

повече информация
Share This