Йордан Даракчиев води единствения у нас модул, в който само за година човек може да получи достатъчно знания, за да започне работа в областта на изкуствения интелект. Машинното самообучение е гореща тема, специалистите се търсят като топъл хляб, а въпреки това поредицата от курсове остава единствена по рода си.
Като човек, завършил модула, се убедих, че в него не само разбираш основите на това перспективно направление, но и преодоляваш себе си. За да се убедиш, че математиката може да бъде интересна. Че машинното самообучение и изкуственият интелект не са магически заклинания, а важни термини, които трябва да се обсъждат, като се използват отговорно и с познание.
Как така Йордан, астрофизик по професия, създава това начинание, което вече за 5-и път дава основните познания на толкова хора? Как завършилите модула продължават в научни институти, във фирми като „Тесла“ и „Мета“, в обещаващи стартъпи, дори създават и свои начинания? Какво се изисква, за да успееш в света на машинното самообучение? С какво този тип технологии помагат да опознаем света, в който живеем?
Кои са най-вълнуващите посоки, в които да очакваме новини, свързани с изкуствения интелект?
– Как обясняваш на баба си с какво е машинното самообучение?
– Питам я… може ли да поговорим някой друг път за това? Ще ми направиш ли чай? Но, извън шегата, тази дефиниция много зависи от аудиторията.
Машинното самообучение е начин да накараш компютъра да прави нещо с примери, подобно на начина, по който хората учат. Това е най-често дефиницията, която давам, но повечето хора, които срещаш на улицата, надали биха се интересували от машинно самообучение.
– Но биха питали за изкуствения интелект, днес използваме това словосъчетание всеки ден.
– ИИ е малко по-различна фраза, която е натоварена с много проблеми, в това число и маркетингови. Фундаменталните въпроси са най-трудни за отговаряне, защото са абстрактни.
ИИ е имитация на човешки мозък върху чип.
По какъв начин ще бъде направена, зависи от много неща, най-вече от капацитета на създателя ѝ. ИИ имаш, когато играеш шах срещу компютъра си, но и когато Spotify ти препоръчва песен.
– И в крайна сметка ИИ днес се препокрива с машинно самообучение, като най-популярна негова посока на развитие.
– Всеки вид ИИ прави нещо подобно. Машинното самообучение някак си е най-секси понятието, но това не означава, че другите идеи не работят. За да направиш успешен продукт, трябва да си наясно какви възможности имаш. А тук технологиите работят, понякога даже нереално успешно. Появиха се научни статии със заглавия като „Непонятната ефективност на машинното самообучение в…“.
Машинното самообучение има доста насоки и постига сериозни успехи. Все пак, трябва да знаем, че
човешкият фактор е най-съществен.
Той е също така най-проблемен и поставя най-много въпроси. Взаимодействието на човека с това, което е създал, и с това, което използва. Именно той отличава най-много машинното самообучение от другите части на ИИ. Иначе той е просто интересна думичка, която някои хора използват, за да правят повече пари.
– Кои са посоките, които са те изненадали с някакъв огромен пробив? За мен напоследък това определено е генерирането на изображения, то е цяла парадигма по отношение на начина, по който творим…
– За мен лично винаги най-вълнуващо е било разпознаването на изображения, компютърното зрение. Затова в момента, когато се оказа, че напредъкът в изчислителната мощ може да му помогне да съществува, около 2014-а, то много се разви, дотогава беше на практика немислимо.
Това за мен беше най-големият прогрес – може ли да разбереш дали на тази картинка има терорист, или не; има ли котка, задачата е една и съща. Изведнъж получихме експлозия от алгоритми само за месеци. Да, ограничения винаги има, но те изведнъж се вдигат експоненциално нагоре и ти имаш експоненциално повече свобода.
Има много области, в които неща, които са били немислими, вече са възможни. Такова в астрономията например е предсказването на траекторията на астероиди. През последните месеци добър пример наистина са генераторите на изображения. Има много неща, които да ни впечатлят в последните тенденции в ИИ. За мен лично един от най-интересните алгоритми напоследък беше за решаване на триизмерни пъзели.
Според мен, ако повече хора се интересуват от ИИ, всеки ще намери нещо за себе си, което му е интересно и го впечатлява.
– Стига да се научим да говорим интелигентно по темата и да надникнем под повърхността. Да се опитаме да разбираме какво дават този тип технологии, а не да спрем до фейсбушкото „Терминаторът идва!“.
– Тези коментари не са безоснователни, има научни изследвания, които се занимават с тази част. И това е важно, защото
не е хубаво да е черна кутия нещо, от което зависи животът ти.
От друга страна… наистина, хайде да не направим Терминатор, без да искаме, а?
Но да, много теми биха били полезни, ако в тях се вкарваше малко повече интелект. Малко повече мисъл и по-малко мнение.
– За мен най-опасната част все още е информацията, затварянето в балоните. Това, че направихме алгоритмите за препоръчване прекалено добри. Те изкривяват драматично начина, по който се сдобиваме с информация за света и по който комуникираме. Има ли някакви приложения на алгоритмите, които могат да поправят това?
– Алгоритмите ли създават този балон? Ами, преди тях са били вестниците. Мозъкът ни е така устроен, че избира много на брой преки пътища. И това му е необходимо като орган, който работи изключително натоварено. Основната му работа е да не работи, да пести възможно най-много от това, което трябва да прави.
Балоните се създават от чиста необходимост.
Дали можем да ги елиминираме? Едва ли. Дали можем да предоставим повече информация? Има я вече. Дали можем да накараме хората, в това число самите себе си, да търсим повече информация и да сме критични? Да.
Дали имаме възможност да го направим за всички? В никакъв случай.
Дали е възможно да направим алгоритъм, който се справя с тези проблеми? Да, разбира се.
Още от старите основи на програмирането, една програма прави това, което ѝ кажеш. Продължава да бъде така в машинното самообучение и тук идва тънкият момент какво ще кажеш на алгоритъма.
Дали няма да попаднеш в ситуацията да съжаляваш за това, което си си пожелал.
– Поредицата от курсове, които водиш, вече 5 години си остава единствената в България, при която завършваш готов за работа в областта на изкуствения интелект. Как се случи това?
– Има доста курсове, но те са кратки, от по месец-два и покриват само част от темите. Наистина, до момента няма друга цялостна поредица, която продължава година.
Как започнах? Един ден разказах на моя пряк началник в „СофтУни“ Ангел Георгиев, че вече 3 години професионално работя с данни. „Искаш ли да пробваме такова обучение?“ Неговата реакция беше мигновена: „Не знам какъв интерес ще има. Хайде да направим семинар и да видим“. Дойдоха повече от 250 души при капацитет на залата от 200. В рамките на месец-два успяхме да организираме курс, беше в края на 2017 г.
Не само имаше интерес, а беше и много наложително – все повече хора започваха да говорят за данни. Стараем се да не изоставаме от тенденциите, а
аз самият исках да водя нещо, което ми е интересно и много вдъхновяващо отвътре.
Тогава ме радваше, че сме единствени, сега, когато чуя, че още е така, малко се притеснявам. Донякъде заради отговорността, която пада върху мен, донякъде заради учудването – защо още няма други? Иска ми се да има конкуренция, все повече хора да се интересуват.
Малката подробност е, че материята е сложна и не е за всеки.
– Така е, лично мога да потвърдя. Но пък ти имаш безспорния талант да представяш атрактивно и достъпно. Може би просто в тази сфера у нас все още търсенето не е достатъчно голямо? А същевременно се изисква повече учене, отколкото например за да станеш програмист.
– За да станеш програмист също се иска много учене. И човек трябва да се развива всеки ден, иначе изостава някъде в миналото.
Програмирането не е по-лесно и не иска по-малко учене. Но началното ниво, което е необходимо за работа с данни, е по-високо. По-трудно се пробива, но това се изплаща – където има голям риск, има и голяма награда.
Работата е там, че програмирането днес е малко компютърни науки и много повече блъскане по клавиатурата и решаване на конкретни инженерни задачи. А те са горе-долу фиксирани, за тях имаме процеси, на които, общо взето, знаем отговора. В машинното самообучение също имаме процеси, но и научни въпроси, чиито отговорите са неизвестни. Неща, които не е ясно колко време ще отнемат. Колко данни ти трябват, за да направиш самоуправляваща се кола? Колко от от тях са нужни, за да я накараш да не блъсне някого на пътя? Оказва се, че все са недостатъчни, винаги ще намери начин да катастрофира.
Това е по-сложното – самата есенция често е по-абстрактна, по-теоретична. Не казвам, че е по-трудно от традиционното програмиране, хубаво е повече хора да се пробват, защото е интересно. И защото си заслужава!
– Какви хора са те изненадвали като част от курса?
– Такива като теб! Но имам подробна статистика, особено за тези, които са се явявали на изпити. Две са основните групи и те са горе-долу равни – хора, които нямат никакво понятие от математика и са сравнително добри програмисти и обратното – с познания по математика, статистици с 5-10-15 години опит, докосващи за първи път програмиране.
Разбира се, голяма част са съвсем начинаещи и към тях основно е насочен моят модул. Но се оказа, че всеки може да вземе по нещо. Огромна част от хората по някакъв начин се интересуват от това какво може да прави машинното самообучение. Чували са за него, знаят
колко е прекрасна идеята да обучиш една програма, без да ѝ казваш какво точно да прави.
Искат да пробват. И не заради парите, знам колко е опасно да тръгнеш по пътя им. Основният фактор, който води хората, е интересът към това какво представлява машинното самообучение.
– Имаш ли впечатляващи примери на хора, които са стигнали далеч, тръгвайки от курса?
– Зависи от какво се впечатляваш. Някои вече работят в „Тесла“, в „Мета“, в „Майкрософт Рисърч“. Голяма или малка компания, няма значение, дали ще започнеш в „Майкрософт“, или в стартъп, е по-скоро въпрос на желание, не толкова на възможности. Но ми е интересно, че доста хора започнаха магистърски, докторантски програми, занимават повече с научни изследвания, при това в топ университети.
Много приятно е да видя, че хората, които записват модула, имат всякакви интереси и аз някак мога да помогна на повечето от тях да преминат през свое собствено приключение, да направят това, което после ще им е интересно. Радва ме, че успявам не да ги вкарам в един коловоз, което често се случва в курсове за начинаещи. Казват ти: „Това е начинът“ и го копираш цял живот. Ами ако лекторът е сбъркал?
Две са основните цели на курсовете ми. Първо, да накарам хората да мислят критично и да се съмняват в много неща, най-вече в себе си, колкото и деструктивно да е това понякога. И второ:
да отприщят креативността в себе си.
Да не се страхуват да вземат от курса това, което на тях им харесва, което е тяхното приключение. Знам, че звучи много странно, философски, абстрактно, но за мен това има много голяма конкретика – мислене и креативност.
– Ти как се насочи към тази област? Интересът към нея от астрономията ли дойде?
– Като малък прекарвах много време в Общинската библиотека в Котел, обичах да чета каквото ми падне. Интересувах се от компютри, бях почитател на игрите още от 4-5-годишен. Попадна ми книга за програмиране, тогава още не знаех какво означава това, обаче видях основите на BASIC. В друга книга прочетох, че
едно от най-интересните неща са невронните мрежи и изкуственият интелект някога ще завладее света.
Буквално го пишеше в книжката! Стана ми много интересно, беше много вдъхновяващо. Още не знаех за „Матрицата“ и фантастите, които се занимаваха по някакъв начин с изкуствения интелект и разказваха какво би могло да стане, добрите и лошите страни.
Много години по-късно, вече съм в края на първи курс в университета, уча физика и един приятел ме пита мога ли да му обясня нещо по математика. Поглеждам, виждам някакъв слайд от презентация и отговарям: „Това е съвсем просто, учил съм го в 9-и клас, ще ти го обясня“.
20 минути по-късно той знаеше какво е линейна регресия, а на мен ми стана интересно откъде е този слайд. След малко ми изпрати презентацията, оказа се от курса на Андрю Енг по машинно самообучение. Изкарах курса, стана ми много интересно и така започнаха нещата, почти по случайност. След това видях, че познанията ми за работа с научни данни, за научния метод, са много ценни, че мога да комбинирам двете си страсти – програмирането и астрономията.
Кое дойде първо? Не знам, някак си двете са били с мен цял живот. Не помня и кога съм се запалил по астрономията, знам, че на 3-4 г. вече се интересувах от небето, а в трети клас вече поправях учителката си в часовете по природознание.
– Кои са най-вълнуващите посоки, в които машинното самообучение може да помага на астрономията?
– Много са, като започнем с най-стандартното приложение – да автоматизираме задачи, които са много трудни и бавни за хората.
Едната насока е да търсим нови обекти, които до момента не са били открити. Знанието за всяко нещо на небето ни носи някакъв вид конкретна полза. Едни обекти ни помагат да определим разстояние, някои звезди ни дават да разберем дали биха били обитаеми планетите около тях, мъглявините разказват каква е била историята на звездата преди тях.
Правим снимки. Както в „От местопрестъплението“, търсим как да ги направим по-качествени, да виждаме по-добре. Там също има софтуер и изкуствен интелект, който може страшно много да ни помогне.
Така например виждаме снимки на черна дупка, нещо, което е почти невъзможно да се получи директно, а вече се случва с магията на обработката на данни и машинното самообучение.
Има много ползи – от предсказване на слънчева активност до всякакъв тип предпазване на Земята, например от астероиди. Приложенията са толкова много, че ми е трудно да ги изброя.
– Сега си докторант по астрономия, в каква посока са твоите изследвания?
– Става дума за машинно самообучение в астрономията. Работя по търсенето на неоткрити до момента обекти – най-вече периодично променливи звезди. Основният тип, с които аз се занимавам – цефеидите, са много добри мерки за разстояние. На базата на тях можем да сметнем доста точно колко далеч са различни галактики. Основната цел на докторантурата ми е да разберем къде и как са разположени звездите спрямо космическия прах, който поглъща светлината.
Новото откритие води до много ползи и идеята е това да стане автоматизирано, доколкото е възможно. На астронома би отнело много време, това е сложна и специфична работа, която се влияе и от познанията му.
– Кои са най-вълнуващите новини, които очакваш да бъдат постигнати в астрономията и астрофизиката с помощта на машинното самообучение?
– Най-много бих се развълнувал някой ден,
ако видя заглавие, че са открили извънземен живот.
И съм абсолютно сигурен, че то ще изглежда много сухо и скучно. Научната статия за това няма да бъде „Открихме живот на планетата Х“ с много удивителни накрая, а нещо от сорта на „Има индикации на наличие на биологично синтезирана ДНК на планетата Х при доверителен интервал Y“. Но да, да открием следи от съществуваща извънземна цивилизация би било апотеоза на много, много изследвания.