„Хора като него трябва да са лицето на България. Точно хората, измислящи неща, които човек не може да си представи“ казва за днешния ни гост проф. Мартин Вечев.
Д-р Веселин Райчев е единственият българин, чиято докторска дисертация попада в световния топ 3 на годината за всички сфери на информатиката. При това с нея той създава цяло ново направление, което днес изживява бум – концепцията изкуственият интелект да пише компютърен код.
Той създава стартъпа DeepCode, използващ машинно самообучение, за да прави компютърните програми по-сигурни. Компанията е придобита от Snyk, а нашият гост остава начело на ИИ направлението в нея.
Кариерата му започва в Google, благодарение на него и днес Google Maps препоръчва пътя ни чрез алгоритми с български имена. През последните години е канен за професор в МИТ, Станфорд и други реномирани университети. Той обаче избира професионално да се свърже с българския проект ИНСАИТ, който има силата да промени цялата екосистема на нашата айти индустрия.
„Веско не само е талант, той се изгради като такъв, което е много стойностно“, казва за него проф. Вечев. „С много желание, труд, удоволствие, удовлетворение постигна всичко и си остана с присъщата си скромност. Както казах на изпълнителния директор на Snyk, когато купуваха DeepCode: „Ако имаш Веско, няма за какво да се притесняваш. Такива като него са единици в света“. След време той ми каза: „Май беше прав!“.“
Какво ли мисли изследователят за последните големи новини от света на изкуствения интелект? Помага или пречи големият шум по темата и кои са важните решения, които е време да вземем? Защо дори отдалеч той не спира да се вълнува от случващото се у нас и какъв според него е пътят към по-доброто развитие на страната ни? Кое го кара да изостави впечатляващата кариера в Google, за да продължи в света на науката?
– Нека започнем отдалеч: как се озова в Google?
– По доста интересен начин. Бях в бакалавърската степен в Софийския университет, а Google тогава бяха прохождаща фирма, която търсеше млади таланти. Повечето други големи компании в САЩ по това време наемаха хора само от техния пазар, но Google имаше нужда да расте по-бързо и отвори вратите си.
Ходех на състезания по информатика и с нашия ръководител проф. Красимир Манев се беше свързал един румънец, също олимпиец, за да препоръча хора, така той изпрати мен и още един студент. Интервюираха ни и започнахме стаж, бяхме едни от първите стажанти от България в Силиконовата долина.
По онова време повечето ми колеги от университета ходеха на лятна бригада в Щатите. Една трета от всички студенти отиваха, за да изкарат няколко хиляди долара, които тогава бяха страшно много пари. А ние отидохме на стаж, за да ни прикоткат да останем да работим там. Вместо да работим по 15 часа на ден и да спим в супертесни общежития, ни даваха безумни пари за тогавашното време. И в същото време само ни показваха колко е хубаво.
Според мен заради това, че по онова време успяха да наемат много хора от целия свят, се разраснаха толкова бързо. А постепенно започнаха да идват все повече българи.
– Най-дълго си работил в екипа на Google Maps, издигнал си се до шеф екип. Четох, че и днес платформата използва алгоритъм на име Koprivshtitsa, създаден от теб. Така ли е наистина? Какво представлява?
– Така е. Едно от основните неща е предварително да се изчислят много маршрути за това как да бъде използван градският и междуградският транспорт, да се изчисли къде са най-добрите възможни точки на прекачване. След което тези прекачвания се запомнят, така че когато дойде потребителят, алгоритъмът значително по-бързо намира отговор.
По онова време имаше много сайтове, които се опитваха да търсят път с транспорт, но бяха доста бавни и неприятни за работа, дори в сравнително малък град. В същото време
с нашите алгоритми Google отговаря мигновено, човек може лесно и удобно да размества крайната или началната точка, да променя заявката.
Дори в момента е трудно за някой, който не е Google, да прави толкова ефективно намиране на маршрут. Изисква се много сериозна инвестиция, за да се създадат алгоритми, които да се използват ефективно.
– Кое от работата в Google човек не би могъл да предположи отстрани?
– Не бих казал, че има някаква безумна разлика. Разбира се, има безкрайно лоши фирми, но ако говорим за компания, която разработва нещо смислено, в крайна сметка се прави по почти сходен начин. Огромните конгломерати от Силиконовата долина, като Oracle, Intel, Apple или Google, работят с много на брой малки екипи. И всеки малък екип до голяма степен решава сам как би искал да се менажира. Така Google може да е ужасно място за работа в някои екипи и много добро в други.
Не мисля, че има някакво голямо чудо. Но влияе много това, че лидерите в компанията, поне преди десетина години, когато работех там, много искаха да я направят силно управлявана от инженери с реални данни, а не просто от маркетинг или един СЕО.
Там има много успешни екипи, например този, който създава Tensorflow, в същото време има екипи, които правят абсолютни глупости. Около 150 000 души работят в Google, нормално е да се очаква, че поне няколко хиляди от тях са изключително неефективни.
– Какво те накара да поемеш към академичната дейност? Повечето хора, които започват кариера, продължават по нея, рядко се връщат към науката…
– Най-голямата разлика е, че Google плаща много добре и човек трябва да свикне, да си каже: „Ще се откажа от 3/4 от дохода си“. Но в онзи момент нямах жена, деца, хиляди неща на изплащане и не беше толкова страшно. Когато човек направи един път този преход, като се откаже от малките луксове, в един момент установява, че нещата не са толкова зле.
Освен това си мислех: окей, Google се смяташе за най-добрия работодател тогава, и сега със сигурност е много нагоре в класацията. Ако някой ден си погледна биографията и там пише „5 години работил в Google“ или „10 години“, каква е разликата? Никаква. В момента много хора вече имат 15 години там, но според мен
това не е в техен плюс – значи, че са правили едно и също нещо през половината си кариера.
– Но все пак избираш да се насочиш към науката, а не към друга фирма например. При това да смениш посоката, като избираш машинното самообучение и прословутия днес изкуствен интелект.
– Да, имах една негласна идея, че генерираме огромни количества компютърен код и бихме могли да ги използваме за машинно самообучение. Интересно е, че днес всички проекти, като например
ChatGPT, са толкова добри, защото са се учили върху огромно количество компютърен код
и след това са дотренирани с въпроси. Една невронна мрежа се обучава върху код, след което започват да ѝ задават логически задачи, които отдалеч изглежда, че нямат нищо общо с кода, а тя се оказва много добра. Логическите разсъждения идват до голяма степен от кода, това е много интересен резултат.
– Проф. Вечев пише, че всъщност ти си първият изследовател, който се насочва в посоката за генерирането на код чрез невронните мрежи. Сега това е голяма мода…
– Ранните изследвания бяха в тази посока. Мисля, че все още се занимаваме с много интересни неща, свързани с кода. Един от интересните въпроси: сега всички продукти интегрират изкуствен интелект. Вече може, като си отворя програмата за писане, алгоритъмът да ми описва какво се случва в кода, да генерира човешко описание на базата на това, което вижда.
Но какъв е проблемът? Мисля, че ще го видим през следващите няколко месеца.
Това всъщност създава повече работа за хората, вместо да ги облекчава.
Колко ще съм доволен, че изкуственият интелект ми описва кода, ако това значи, че ще чета повече, отколкото преди? Ако досега съм чел кода, за да разбера какво се случва, сега чета описания и после пак ще си кажа: „Я да погледна кода, тук не е съвсем ясно“.
Има много шум по темата, но най-важното за един изследовател е да бъде постоянен. Има определени неща, които искаме да постигнем, работим върху тях и, доколкото можем, игнорираме маркетинга.
Нека вземем за пример стилизирането на една страница. CSS е направо гениален език – мога да опиша по какъв начин да изглежда един уебсайт декларативно. Проблемът е, че ако бутонът не е точно където искам, започва едно натаманяване и търсене на различни решения. Може ли изкуственият интелект да реши такива проблеми? Това би било интересно. А именно такива въпроси отнемат най-много време. Иначе, ако го накарам на празна страница да ми напише базов CSS, ще се справи гениално.
Има още много работа, за да може изкуственият интелект да върши повече неща. Иначе несъмнено има огромен напредък.
– Но немалко фирми вече имат идеята, че голяма част от хората ще станат излишни. Дори гигантите признават, че ще автоматизират голяма част от процесите. Конкретно в софтуерния свят мисля, че вече е възможно да по-малко хора да могат да са по-ефективни чрез такъв тип технологии.
– Според мен това е по-скоро пазарна реакция. Една от причините повечето фирми да съкращават хора е, че
продуктивността падна драстично, след като всички започнаха да работят от вкъщи.
И трябва по някакъв начин да се върне балансът. Не мисля, че изкуственият интелект ще доведе до по-малко инженерни позиции, да кажем в рамките на година.
– Според теб хубаво ли е, че покрай ChatGPT повече хора научиха за тези технологии – докъде са стигнали, колко са напреднали? Много повече се говори по тези теми, но най-често в крайности…
– Хубаво е, че се говори. Но, наистина, когато се отива в някоя от крайностите като предсказания, резултатът няма как да бъде верен. Винаги са се появявали решения, които са подобрявали ефективността на инженерите, въобще на хората. Едната крайност гласи: всичко става толкова ефективно, защо нашите деца изобщо да са умни, не може ли да си живеят живота? ИИ ще ги замени… Мисля, че няма да стане по този начин. Другата крайност: абсолютно нищо не се променя заради изкуствения интелект.
Преди 5 години имаше много предсказания, че професията на тираджията е обречена, те ще са първите, които автоматизацията ще замени. Има много предимства не човек да кара камиона – може да пътува 24 часа, няма толкова голяма каросерия. Но ето че нещата стават по-бавно, отколкото хората си представят. И сега този нов изкуствен интелект, който идва от естествения език,
по никакъв начин не променя задънената улица, в която са самоуправляващите се автомобили.
Поне за няколко години. Тя не е безкрайно задънена, те ще излязат от нея, но е нужно време. Ако трябва да съветвам моите деца дали да стават тираджии, надали ще го направя. Но някой, който в момента е такъв, най-вероятно ще се пенсионира без проблеми.
– Големият ми син е на 5 и иска да става дърводелец. На мен ми се струва добра идея, все по-трудно е човек да намери майстори, за разлика от фронтенд програмисти.
Проектът, по който работиш през последните години, е свързан със сигурността и това е важна тема, много специалисти очакват напредъкът на ИИ да доведе до сериозни проблеми, да направи пробивите много по-лесни. Как твоето начинание решава проблемите?
– Проектът, по който работя, намира дупки в сигурността. Ето че всички започват да използват автоматично писане на код, благодарение на различни плъгини за генерирането му. Но този код невинаги е сигурен. Затова още в самата програма се инсталира нашето решение, което веднага, още в момента на генериране, открива дали има проблем. След което дава предложение как той може да бъде решен.
– Какъв тип проблеми открива?
– Всички най-чести заплахи, например SQL injection – когато някой, използвайки уебсайт, иска да манипулира заявките към базата данни, която да бъде променена по неприятен начин. Има начини човек да се предпази, като не позволява данни от потребителя да влизат в заявката директно. Друг пример е т. нар. XSS – cross-site scripting, чрез зловреден код атакуващият може да направи каквото си поиска – да открадне акаунта на потребителя, да получи пълен контрол. Отново има начини да се предотврати. Има и много други видове атаки, например отказ от услуга – DoS. Когато даден уебсайт е атакуван с голям брой заявки, на които не може да отговори.
– И в момента повечето проекти минават през инструменти за статичен анализ на кода. С какво са по-добри тези, които разработваш с помощта на невронни мрежи?
– Едно от подобренията е, че резултатите се виждат директно, в момента на писане на кода, повечето проекти за статичен анализ изискват поне компилация. Другата разлика е, че
обикновено намираме много повече бъгове от другите проекти и имаме по-малко грешни оценки.
– Силно ангажиран си и с темата за института ИНСАИТ, вълнуваш се и от българска политика. Защо ти е интересно какво се случва у нас, при положение, че отдавна не живееш тук?
– Имам много роднини в България. Не сме спрели да сме български граждани, по никакъв начин. Летим често до София, има толкова неща, които ни задържат там. Освен това вярвам, че има потенциал да се случват много позитивни неща.
– Какво ги спира най-често? Всички се ядосваме на политиката, до нея ли опира всичко?
– Не, не мисля така. Много съм мислил какъв е реалният проблем на България. Виждаме как политиката води до отрицателен подбор – в нея отиват именно хората, които са най-некадърните. Една от причините е естествена – ако някой няма други умения, той ще се бори със зъби и нокти, за да остане в нея.
Докато аз как ще се боря в политически смисъл? Ще псувам във фейсбук.
Най-големият проблем според мен е прекалено голямото количество на фалшификати, на ментета. Като се почне от политиката и се стигне до всичко.
ИНСАИТ най-много дразни с това, че не е нещо, което изчезва за 6 месеца – направихме 2 конференции, извикахме медиите и приключи. Напротив, идват изключително хора, за да строят. Как така изведнъж нещо, което всички очакват, че ще е измишльотина, се оказва реално, огромна възможност?
– И аз още не мога да повярвам, че е реално да се съберат по такъв начин държава, университети, бизнесът да го оцени. Просто е голямо изключение…
– Не очаквам държавата да помогне, достатъчно е да е на ниво, на което да не пречи. Това нещо ще е успешно, ако бизнесът се интересува от него. Но, като виждаме в момента кои хора си дават парите, изкарани от реален бизнес за ИНСАИТ, става ясно, че
това начинание може да вдигне много високо бизнес летвата в България. Ще създаде много добавена стойност.
В момента пазарът дори в айти областта е много тежък, защото няма достатъчно стартъпи с добавена стойност. Не може София, милион и половина град, да има 10, които да се развиват добре. Би трябвало да са 500.
– Още повече, че имаме потенциал от гледна точка например на кадри. Но почти всички работим в сървиз компании, тоест добавената стойност отива за някого навън.
– За да се промени тази концепция, че бизнесът в България трябва да бъде с висока добавена стойност, трябва да има нещо като ИНСАИТ. Трябва да има силни образователни звена на всички нива. На ниво гимназии вече имаме немалко добри – частни и държавни. След това, като се стигне до университета, да кажем, че Софийският университет поддържа добро ниво на информатиката.
После изведнъж всичко изчезва. Когато по средата на бакалавъра всички отиват да работят в сървиз компании и никой не продължава да се развива, целият пазар се превръща в това. Това е добре за някого, който се занимава с нещо съвсем друго, може за една година да отиде в някоя от академиите и да започне работа.
Но тези компании зависят от неща навън. Те могат да решат, че ще съкратят разходите и, разбира се, външните фирми са първи кандидат.
Начинът да имаме работещ бизнес в България, е да се появят повече стартъпи, които да се развиват.
В такава позиция сме, че нещо трябва да се направи в тази посока и това е ИНСАИТ. То не започва огромно, с трима човека тук, двама човека там, но има потенциал. Има някакъв начален капитал и много хора, които искат да успее. Предстои да видим докъде ще стигне…
– Дано се получи наистина! Ако се върнем към изкуствен интелект, кои са следващите големи новини, които очакваш?
– През следващата година очаквам той да стане много по-достъпен инструмент за всички. Това, което в момента наблюдаваме, са един-двама играчи, които владеят всичко, OpenAI са на върха. В рамките на година всеки с малко по-мощна видеокарта ще може да си пуска такива системи на компютъра.
– И тепърва ще разбираме какво те могат да правят…
– Най-интересната част не е да получиш отговор на един въпрос. Това нещо ще остане, със сигурност, както досега всички използваха Google, ще има нови решения. Но според мен по-важната тенденция може да се види в генерирането на изображения. Първо се появи DALL·E – въвеждам текст и получавам много интересна картинка. Но много скоро последва един модел с отворен код, наречен Stable Diffusion, който промени изцяло света. Човек може да си свали един вариант, да си го донастрои, после да му каже не просто „направи ми снимка на куче, което скача и хваща фризби“, а това да е точно неговото куче.
Винаги ще има неща, които не са възможни с даден модел и такива въпроси стават все по-интересни. Изкуственият интелект като нещо глобално не е толкова интересен, колкото да имаш някакъв вариант до теб, с който може да общуваш.
– Много хора казват, че вече няма смисъл да учиш програмиране, но като че ли точно сега има смисъл да се учат основите, за да може човек да се възползва от тези възможности.
– Да, в момента не е лошо човек да може да го прави. Доста е лесно, има ниска финансова бариера. Ако човек има възможност да програмира, трябва да може да пише на Python, да чете 100-ина реда код и да знае линейна алгебра и диференциални уравнения.
– Така се задават интересни стартъпи. От хората, които ще се досетят за по-нестандартните приложения… Много ти благодаря за разговора!