Apply AI or Diе? Или ще въвеждаме изкуствения интелект във все повече области, или сме обречени – това е според днешния ни гост големият въпрос на нашето време.
Д-р Артур Кордон е от Варна, вече 32 години работи в САЩ. В слънчева Флорида през последните десетилетия се занимава с внедряването на изкуствения интелект в индустрията. 18 години е научен лидер в най-голямата химическа компания в САЩ – „Дау кемикълс“, където реализира 80 проекта с икономически ефект от близо половин милиард долара. Автор на книги, издавани от „Шпрингер“, последната от тях е на български по толкова актуалната тема – „Перспективата изкуствен интелект“.
Защо според специалиста ChatGPT, който „чат-пат“ познава, е само една стъпка в революцията на изкуствения интелект, която до няколко години „ще помете всичко“? Как от шума и клишетата да стигнем до масовото внедряване? Защо според него днешните системи са не черна кутия, а черна дупка, която може да унищожи всички ни, ако поемем по пътя, начертан от Сам Алтман и OpenAI…
Важните отговори на днешния и утрешния ден от един специалист, който през дългия си опит е видял толкова много от развитието на изкуствения интелект.
– Често гостувате с лекции и представяния за приложния изкуствен интелект. Какви са впечатленията Ви, навлизат ли тези технологии в българския бизнес?
– Определено не. Уви, няма много специалисти с дълбоки познания в тази технология, аз съм безкрайно разочарован, защото не виждам дори дискусия, тя изцяло се хлъзга в плоскостта на големите езикови модели, които не изискват фундаментални знания по ИИ и са с ограничени възможности за генериране на добавена стойност.
Считам, че изкуственият интелект в бизнеса в България не е модерна тема, а точно тук трябва да акцентираме.
Очаквам много повече да се говори за практическите приложения. Смятам, че е важно да се насочи вниманието, фирми, които са започнали този процес, да говорят за своя опит. Да се започне с визията на хората, които вземат важните решения в една компания. Ако те не разберат значението на изкуствен интелект, че това е огромна перспектива, че оттук нататък не могат да използват старата тактика – „да се снишим, ще ни отмине бурята“, ако гледат на изкуствения интелект като на някакво временно явление…
Не, бурята няма да отмине, напротив, ще бушува с все по-голяма сила. И ако не вземем мерки веднага, до 5 години може и да ни издуха.
За да се върви напред, трябва да има убеждение в хората, които вземат решения. Да са наясно, че трябва да се инвестира сериозно в изкуствения интелект.
Имаме златна възможност! Хубаво е, че говорим за стартъпи, но при тях имаш семена – хвърляш и чакаш да поникнат. Само че трябва благодатна почва, някаква готовност от българския бизнес. Това ще е по-дълга битка, която водя от дълги години.
Считам, че Вашата платформа е начин да се стигне до бизнеса, да се популяризира и повече млади хора да се насочат по този път…
– Опитвам се и аз да търся такива примери, често ми гостуват хора от бизнеса и също не виждам нещата да се случват толкова бързо и мащабно, колкото се очакваше. Докато от година и половина светът не спира да говори за изкуствен интелект и ChatGPT. Прочетох обаче, че говорите за героя на деня като за „чат-пат изкуствен интелект“. Какво имате предвид?
– Голямата заблуда на последните две години е, че ChatGPT е синоним на изкуствен интелект, а той е само една от възможните форми. Една от причините това, особено в България да бъде комуникирано толкова агресивно, е, че почти няма хора, които да са наясно с темата за истинския, основен изкуствен интелект. У нас са не повече от стотици хората, които са запознати в дълбочина. И така, появи се ChatGPT на 30 ноември 2022 г., още през декември доста хора, особено в IT сектора, виждат за какво става въпрос, че тази технология може да бъде много бърза, да генерира код. Тук изскочи посланието, което смрази кръвта на доста хора – значи ще ни изяде хляба. Много скоро стана ясно, че това е само първа стъпка в дългия процес да се направи цялостно генериран IT проект.
ChatGPT е една възможна форма, много популярна, която доближи изкуствения интелект до масите и затова стана толкова популярен.
– Но по някакъв начин и навреди на темата, доколкото хората наистина започнаха да асоциират термина само с него и всичките му несъвършенства.
– Големият въпрос е с бизнеса, моят опит е в приложния изкуствен интелект, как се използват възможностите му в бизнеса и то в „тежката артилерия“ – индустрията. Започнах като постдокторант в Университета в Делауеър, където имах проекти с химическия гигант „Дюпон“. След като взех зелена карта, ми предложиха работа в техния основен конкурент – „Дау Кемикълс“. Сега консултирам най-голямата компания за производство на хартия в САЩ – „Джорджия Пасифик“.
Тоест, познавам индустрията. През декември 2022 г. тя беше изключително объркана от светкавичния интерес към ChatGPT. В първите дни вицепрезидентът по иновациите на компанията, която консултирам, искаше да му отговоря светкавично, точно и ясно на въпроса трябва ли да използваме ChatGPT. Изследвах колкото може по-подробно неговите възможности, докато един отговор наклони везните към категорично „не“. На въпроса ми „има ли шопи в България“, той отговори: „Да, има шопинг, супермаркети“.
Е, как да кажа „да“ при такъв отговор? Именно тогава ми дойде тази игра на думи с богатството на българския език, че това е „чат-пат изкуствен интелект“. Има области, в които е много успешен, много подходящ. Но за бизнеса това рядко е така, просто защото не различава лъжата от истината. Неслучайно „халюцинация“ беше дума номер едно в английския език за 2023 г. Слава Богу,
разработчиците на големи езикови модели разбраха, че без да се реши проблемът с халюцинациите, бъдещето няма да е много светло.
Вече има хиляди програмни средства, с които това се случва, стъпка по стъпка. И все пак този проблем фундаментално е нерешим заради самата архитектура на големия езиков модел.
– Защо е така?
– Стигаме до голямото „идеологическо разделение“, по което не знам защо в България се пази пълно мълчание.
Това е посланието, което настоявам студентите ми да разберат добре. В момента имаме две идеологии за бъдещето на изкуствения интелект. Едната, която е доминираща, е, че можем да разработим изкуствен интелект, който не е структуриран. Тя се базира на закона на мащабиране на големите езикови модели – колкото повече параметри имаме, толкова по-точни отговори дават те. Ако, да кажем, един модел нарасне от 7 до 65 милиарда параметра, той започва да работи значително по-добре. Така обаче не можем да разберем защо моделът е предсказал следващата дума така, а не иначе. Това е единственото, което един генеративен езиков модел прави – предсказва следващата дума по тези милиарди параметри.
Големият проблем е, че не знаем какво става вътре в този свръхсложен модел. За невронните мрежи употребяваме аналогията с черна кутия, но тук е много по-страшно, имаме черна дупка. А добре знаем от астрономията, че черните дупки гълтат материя.
Но това е евтиният и бърз начин да вървим напред. Да използваме този закон – ето, сега се мисли за десетки, стотици трилиони параметри и GPT следващ номер ще предсказва по-добре на база на това, което може да стане след година или след 6 месеца. Зад този подход стои един гениален стартъп мениджър, какъвто е шефът на OpenAI Сам Алтман.
Той не идва от науката. За него е важно да започне бизнес с малки инвестиции, да го раздуе и това го направи блестящо.
Обаче тук има някои дребни нещица, които започват да смущават, научният екип го напусна. Най-основния му учен Иля Суцкевер, един от създателите на дълбоките невронни мрежи, организира преврата, не успя и се оттегли.
– Определено не се говори достатъчно по тези теми, заради които го има и този сайт. Неотдавна с друг мой гост – Виктор Ботев, поговорихме доста задълбочено за сблъсъка на тези две течения. В които от другата страна е технологичният лидер на „Мета“ и също един от „бащите“ на ИИ Ян Лекун.
– И слава Богу, защото не само, че той е голям учен, но зад него стои и технологичен гигант – „Фейсбук“. Аз също твърдо стоя зад неговата философия, именно защото съм учен. Независимо, че идвам от индустрията, много добре мога да различа кога нещо е солидно и кога просто се тупаме в гърдите, че ще правим генерален ИИ.
Хора, за да го направим, трябват толкова много технически решения! Пътят очевидно минава през структурния подход и визията как да се стигне до него. Ян Лекун задава посоката: дайте да започнем от биологическия интелект, от човешкия. Мозъкът е структуриран, нашите знания не са само базирани на текст, голяма част се базират на визуален източник. Затова той бавно и методично работи в тази насока. Има алтернативен модел, по който се работи вече 5 години и пътят няма да е кратък, няма да е догодина. Може би ще е след 20 години, но това е пътят.
Другият, неструктурираният път на Алтман е опасен!
Ако бяхме тръгнали във физиката по лесния път, без да имаме теория на атома, без да имаме разбиране на физическите сили, които стоят зад това, да започнем да правим бомби, не знам как щяхме да продължим… Именно по този път ни предлагат да вървим с неструктурирания подход. Като учен, като човек, който е в тази област от над трийсет години, аз виждам тази опасност и не съм сам. Почти всички големи в областта на основния ИИ се отдръпнаха от неструктурирания подход, пръв беше Джефри Хинтън.
Това според мен е фундаменталният въпрос, който стои пред развитието на изкуствения интелект. Естествено, зад неструктурирания подход стои големият бизнес, инвестира десетки милиарди, вече се намесва и излишъкът от финанси на арабските страни. Все пак, надявам се да не се стигне до негативните последствия от неразбирането на черната дупка…
– Какви могат да бъдат те? От една страна може би сме близо до предела на големите езикови модели, нямаме повече данни, с които да го учим. Но пък, ако се получи, какви са опасностите от тази черна дупка?
– Според мен няма как по този начин да стигнем до наистина генерален изкуствен интелект. Не можем да получим задълбочено познание и мислене, защото не знаем механизмите за интелект, за интелектуална дейност. Какво правим сега? Компенсираме това родилно петно на големите езикови модели чрез инжектиране на нашето познание, чрез техники за промпт.
Това, което Сам Алтман споделя все по-често в интервюта, е, че генералният ИИ ще дойде, „когато ние решим“. Защото това зависи от дефинирането на понятието „интелигентност“ и тук се появяват големите разногласия, има един дълъг списък какво трябва да има всяка такава система.
Основното е самосъзнание, но също има огромен разнобой какво разбираме под това? Може да затънем в куп дискусии по основните понятия, докато хора практици като Сам Алтман и Сатя Надела в един момент ще тропнат на масата и ще кажат: „Ето, това е генерален изкуствен интелект“.
В един момент ще сложим флага и ще кажем, че сме кацнали на Луната… без да я имаме ракетата „Сатурн-5“. И само ще си мислим, че сме кацнали.
– Обаче всички бързаме доста… Защо структурираният подход би отнел толкова много време?
– Защото е фундаментален. Тук в голяма степен центърът на тежестта се прехвърля от езикови в динамични, визуални модели, а разработването им е в порядъци по-трудно и по-скъпо.
Второ – вече имаме много изследвания за началните етапи на интелигентност. Канеман, Нобелов лауреат по поведенческа икономика, дефинира системата за „генетичен интелект“ – нещо, което имаме в мозъка си и вероятно ни е генетично заложено. Всички получаваме една начална интелигентност, каквато ChatGPT няма, въпреки че съдържа компресирана цялата налична информация в текстова форма. Но как да се разбере къде е разликата?
Тоест, първо в структурирания подход имаме една последователност от научни изследвания, преди да се стигне до резултат, по-добър от това, което имаме. Но то удовлетворява, да кажем, 50% от ползвателите на изкуствения интелект. Учениците и студентите подскачат от радост, преподавателите донякъде също, хората в маркетинга. Дори се учудвам на търпението на ръководството на „Фейсбук“, което всеки момент може да каже: „Чакайте сега, конкурентите печелят десетки милиарди долари, а ние тук се занимаваме с по-добри концепции, които може евентуално след 10 години да ни изкарат напред“.
Има проблем, но те стоят зад Лекун, защото е безспорен авторитет. Макар да не е политически коректен, направо разстрелва големите езикови модели. Аз също не съм съгласен с изявления от рода, че след 2 години никой няма да ги ползва, че са неработещи. Не е вярно – фактът, че се използват от поне 300 милиона души, значи, че има нещо в тях.
– Ето, мога да кажа непосредствено,че безспорно помагат и със сигурност ускоряват създаването на компютърен код… В кои области имат място?
– На този етап там, където са достигнали нужното ниво на зрялост. Ще използвам мисъл на един професор от „Уортън“ – бизнес университета с най-голям авторитет в Съединените щати. Той издаде книгата „Коинтелигентност“ – „съвместен интелект“, с
основна мисъл, че в края на краищата ние няма да имаме чиста форма на изкуствен интелект, а съвместно действие на изкуствения и естествения.
Това е реалността и трябва да Ви кажа, че от бизнес гледна точка нещата са такива от години.
Плюсът на генеративния изкуствен интелект е, че моделът, който ползвате в момента, е най-лошият възможен, само след три месеца ще има по-добър. Че прогресът, който стои зад него именно поради закона на мащабирането, ще помогне да се разработват по-големи и по-сложни модели.
Но големият минус е, че той никога няма да може да разсъждава дълбоко, да различи истината от лъжата.
Тези неща ще бъдат преграда пред едно автоматично, безпроблемно внедряване на генеративните модели, особено в бизнеса. Вие казвате, че ползвате възможностите и с всяка версия те ще стават все по-мощни, но при всички положения едва ли му вярвате на 100%. Винаги има една итерация на проверка на верността на генерираните решения.
– Разбира се. Но и така има икономически смисъл, защото ме прави много по-бърз и ефективен в работата ми.
– Естествено. Но трябва да се има предвид и друго – времето, което губите за проверка. И доста хора забравят този дребен ефект. Аз ще ви кажа от личен опит – от четири години променихме стратегията за прилагане на ИИ в компанията, която консултирам. Преди беше, както аз я наричам „на дървосекачите“ – имаме проблем, например спират машините за производство на хартия. Насочим се да решим проблема, после следващия. Но разбрахме, че така ефекта не е голям докато не решим проблема за гората. Да изработим една обща стратегия къде изкуствен интелект цялостно ще подпомогне компанията. Да се направи нещо като цифров мозък.
Натам ни насочи и пандемията – в началото тази компания беше поставена пред огромно предизвикателство. За няколко седмици търсенето на тоалетна хартия нарасна със 73%, навсякъде беше така. В този труден период компанията се нуждаеше от бързи и ефективни решения. Преди това, когато работим с изкуствен интелект, „идеологически“ непрекъснато ни насочваха към данни, данни, данни. За съжаление, в конкретния случай нямахме данни, последната такава ситуация е била преди 100 години с испанския грип.
Единственото, което ни спаси, беше знанието. Тогава според мен и в цялата област на приложния изкуствен интелект се пренасочихме от параноята по данните към знанието. Да, всичко опира до баланс, но тогава се замислихме за втората част.
Започнахме с единствения тогавашен голям езиков модел – BERT. Действахме безумно бързо, което на практика ни показа, че именно кристализирането на специализираното познание е важно.
Големият езиков модел не му трябва на бизнеса, никой не достига конкурентно предимство с пенкилерно познание. Има смисъл, когато се добавят други модели със специализирано знание, само с онтологии, само с технологиите на езика не става! Трябва и друга методика, с графи на знанието, която да структурира данните в постоянен вид, а не флуидно. Попитайте един голям езиков модел нещо 5 пъти и всеки път ще даде различни отговори. Ами, така не се прави бизнес.
Третият фактор е, че когато вземаме решения, те трябва да се базират на причинно-следствени връзки. На тези три компонента – специализирано познание, структурирано с графи на знанието и причинно-следствени връзки, се основава съвременния дълбок изкуствен интелект, на тях вярва бизнесът…