“The Game is Over“. „Играта свърши“, отсече в туитър от май 2022-а изследователят Нандо де Фрейтас, обявявайки голяма новина в областта на изкуствения интелект, която остана встрани от целия шум. Учените продължаваха да спорят дали може да съществува генерален изкуствен интелект. Зад това определение се крие алгоритъм, който е способен да решава многобройни различни задачи, подобно на човешкия мозък.
И докато те спореха, като че ли се оказа, че… спорът вече е решен. С лаконичния туит беше обявена появата на Gato AI, първия кандидат за званието „генерален изкуствен интелект“. Стъпка, която се очакваше да бъде извървяна поне след десетилетие, а според мнозина беше дори невъзможна.
Тази новина обаче не предизвика кой знае какво внимание. За разлика от ChatGPT, който се появи половин година по-късно и отогава не спира да монополизира вниманието. Е, той успя да привлече погледите с това, че за първи път показа на огромен брой потребители колко напреднали са всъщност технологиите. И как сме все по-близо до следващата огромна стъпка. Която изглежда едновременно логична и… толкова невъзможна. Генералният изкуствен интелект!
Генерална промяна
Да, всички чуваме името му прекалено често, вече дори сламката на плажния ни коктейл има изкуствен интелект. И все пак, не може да се отрече, че тази област на познанието е изключително динамична, в много от приложенията си напредва с главоломна скорост.
И ето че все по-често говорим за следващата огромна стъпка. Алгоритъм, който не просто е готов да изпълнява забележително добре задачата, която му е възложена, но е способен да решава проблеми от най-различен характер.
Gato дойде, за да реши (може би) този отдавнашен спор, да промени изцяло играта. Да покаже, че може да има универсален алгоритъм за различни задачи… подобен на хората. Да, невронните мрежи, висшият пилотаж в областта на машинното самообучение, се стремят да наподобят работата на мозъка ни. Но докато ние сме способни да решаваме най-различни задачи, алгоритмите допреди тази стъпка бяха ограничение в една-единствена. По всичко личи, че приключихме с това.
Специалист по всичко
Тогава, когато им се даде точната задача, алгоритмите са способни на чудеса. Те умеят да анализират огромен обем от информация и после да изпълнят целта си. А тя може да бъде само от два типа. Или да получат следващото „парче“ информация и да определят какво е то, или сами да се опитат да предскажат какво следва в дадена поредица. И толкова, до това се свежда на практика всяка задача, която им поставяме днес.
Същото важи и за нашумелите големи езикови модели – GPT-3 и 4, а с пълна сила – и за толкова любимия им събрат ChatGPT. Той също може да впечатлява с разнообразни приложения – от машинния превод през чатботовете до генерирането на компютърен код. И все пак: по същество, извън рамките на конкретната задача, той също е в списъка на състезателите с конкретна задача. Защото това, което прави, е да обработва информацията и в отговор да ни даде своето максимално близко предположение какво ще последва на базата на откритите закономерности. Той също работи в една конкретна област – тази за обработката на естествени езици. Генералният изкуствен интелект е следващата стъпка.
DeepMind е проектът на Google, който едно време караше Мъск да се притеснява за бъдещето, защото според него той се разработва без достатъчно контрол, получава достъп до огромните масиви от знание на универсалната търсачка.
Е, може би си струва да имаме наум и това предупреждение, докато се насочваме към същинската тема.
Someone’s opinion article. My opinion: It’s all about scale now! The Game is Over! It’s about making these models bigger, safer, compute efficient, faster at sampling, smarter memory, more modalities, INNOVATIVE DATA, on/offline, … 1/N https://t.co/UJxSLZGc71
— Nando de Freitas 🏳️🌈 (@NandoDF) May 14, 2022
Цар и генерал
Нандо де Фрейтас пусна на 14 май 2022 г. знаковия туит, че играта е свършила. Разбира се, той добави важното уточнение: „Сега остава само да увеличим мащаба!“. Тоест, вече имаме алгоритъм, способен да решава всякакви задачи (затова е и общ или генерален), а не само една конкретна, за която е създаден. Остава „само“ да го научим да работи в по-големи мащаби от тези, с които се справя до момента.
Новината беше толкова важна не само защото много от специалистите не вярваха, че е възможно. А тъй като става дума за решителна стъпка по пътя към изкуствен интелект, който може да бъде неразличим от човешкия.
Никой не казва, че това би се случило утре, но се трупат аргументи, че един ден технологиите ще са в състояние да издържат прословутия тест на Тюринг, убеждавайки окончателно човешкия си събеседник, че води разговор с друг представител на своя вид. Дори Де Фрейтас признава, че не сме толкова близо, колкото ни се иска, до тази стъпка. По-важното според него е, че вече знаем, че тя е напълно постижима.
Едновременно със знаковия туит бяха публикувани научната статия и блог постът на екипа, в които подробно беше представен новият алгоритъм.
Gato е кръстен на испанската дума за котка. И определено е хитър като котак (например като приятеля ни Румен).
Мултикукър
Ето това gif-че показва разнообразните задачи, които хитрият котарак може да решава:
Картинката не ви впечатли? Става дума за разни изтъркани игри от 80-тарски компютър? Е да, нужни са още малко обяснения.
Както стана дума, никой от съществуващите към момента проекти за ИИ не беше способен да дава решенията на различни по характер задачи. А този тип игри се оказа чудесното поле, в което да търсим генералния ИИ, просто защото изискват различни интеракции. Gato се оказа първият „електронен състезател“, готов да се справи с предизвикателствата, които бяха елементарни за тогавашните тийнейджъри.
Котаракът освен това може да пише поезия, да реди кубчета, контролирайки роботизирана ръка. Една и съща невронна мрежа умее да чати, да разпознава изображения и какво ли още не.
Gato шефе
„Оттук нататък целта е да направим този тип модели по-големи, безопасни, оптимизирани, съобразени с изчислителните възможности. Имаме доста работа, но решаването на тези проблеми ще ни доведе до генералния ИИ“, убеден е днес Нандо де Фрейтас.
Разбира се, остава също и да решим дребния проблем дали пък постигайки това, не създаваме програма, която да ни унищожи като вид.
„Безопасността е от първостепенно значение при този тип проучвания“, признава създателят на Gato. „Винаги трябва да сме способни да спрем един подобен алгоритъм тогава, когато започне да взема прекалено важни решения.И това може би е най-голямото предизвикателство пред нас“.
Твърди се, че Google вече са разработили специална система, своеобразен голям червен бутон, с който винаги да има възможност подобни проблеми да бъдат предотвратени. ИИ да бъде „изключен“, ако преценим, че ни заплашва по някакъв начин.
Мац, пис, пис
Gato не само може да изпълнява повече от една задача по едно и също време, но и се справя сравнително добре. В някои от „професиите си“ съперничи с алгоритми, специализирани в тях, но, уви, далеч не е така с всички задачи.
Екипът е изпитал състезателя си в 604 различни задачи и 450 от тях котаракът е изпълнил с над 50% успеваемост. Високо, но все още твърде далеч от търсеното.
Заради начина си на работа Gato е доста по-„немощен“ от много свои съперници. Основната единица, по която се „измерват“ този тип алгоритми, е броят параметри, с които е тренирана невронната мрежа. Ако при GTP-3 те са 175 милиарда, Gato е „учил“ само от 1,18 милиарда.
Котаракът в чизми
Разбира се, твърденията на създателите му бяха последвани отс доста противоречиви мнения. Според част от изследователите Gato е далеч от изискванията, за да го приемем за предтеча на генералния ИИ. Той по-скоро е комбинация от претренирани с данни праволинейни модели. Да, може едновременно да изпълнява 600 задачи, но това ще е по-скоро конзола, която има 600 игри, отколкото игра, която може да се играе по 600 различни начина.
Интересен е подходът по създаването му: котаракът е претрениран с всякакви разнообразни данни – текстове, снимки, карти, превърнати в символи. Това противоречи на обичайния подход в „домашното“ на невронната мрежа да попадат само еднотипни обекти – например изображения. И фактът, че въпреки това дава добри резултати, отваря още една посока за размисъл за учените. Дава ни допълнителна информация за начина, по който работят дълбоките невронни мрежи.
Том и Джефри
За генералния изкуствен интелект се заговори още повече с избухналата популярност на ChatGPT. Скептични към идеята, че той е близо, са някои от пионерите и най-големите имена в областта като Ян Лекун. До неотдавна в този списъка попадаше и Джефри Хинтън, но… драматичното съобщение, с което той обяви, че излиза в пенсия ясно показа, че вече не е така.
Разбира се, понякога нещата опират и до дефиницията, има доста определения какво точно е „генералното“ и понякога те си противоречат. Според едни е възможността алгоритъмът да изпълнява всички мисловни задачи, на които е способен и човекът. А тук все още сме на светлинни години например що се отнася до творчеството, свободната воля, иронията, абстрактното мислене.
Още една дефиниция поставя пет конкретни изисквания за титлата „генерален ИИ“. Той трябва да проявява творчество, да разбира естествени езици. Да възприема сетивна информация, да има добри моторни умения и да се придвижва успешно в пространството. С изключение на творчеството, като че ли по пътя, по който е поел умният котарак, останалите звучат прилично постижими.
Трето определение на термина пък изисква просто алгоритъм, който може да изпълнява комплексни и разнопосочни задачи. Тук Gato определено вече е добър кандидат, покриващ изискванията.
А дали с тази стъпка наистина се приближаваме сериозно към по-голямата цел – алгоритъма, доближаващ способностите на човека? Все още можем повече да предполагаме, отколкото да сме сигурни в каквото и да било. Сигурното е само, че живеем в интересни времена, а от света на технологиите се надяваме да идват големи новини, но най-вече добри вести… За да не стигнем до другия смисъл, криещ се някъде в думите от цитата на „бащата“ на Gato. “The Game is Over.“
Час по чат
Интересно е да отбележим, че OpenAI – създателите на ChatGPT и всички останали GPT-та, ясно си признават, че дългосрочната им цел е именно генералният изкуствен интелект. Разбира се, с благородна, а не с комерсиална цел. Както пише и в манифеста на компанията, „нашата мисия е дас е погрижим за това генералният изкуствен интелект – система, която е генерално по-умна от хората – ще допринесе за благото на цялото човечество“.
Нататък продължава с още повече „конкретика“: „Генералният ИИ може да се появи скоро или в далечното бъдеще, скоростта на развитие от първоначалния такъв към по-мощни системи наследници може да е висока или ниска“.
Неотдавна учени от Microsoft обявиха, че според тях GPT-4 показва „наченки“ на генерален изкуствен интелект. Според екипа големите езикови модели от ново поколение проявяват по-обща интелигентност от предишни модели. „Освен че владее езика, GPT-4 може да решава нови и трудни задачи, които обхващат математика, компютърен код, изкуство, медицина, право, психология и други, без да се нуждае от специално програмиране“, пишат те.
Е, мнението им беше посрещнато доста скептично, а и човек няма как да не ги обвини в прекалена безпристрастност на фона на близките връзки през последните години между Microsoft и OpenAI.
Папагала във тава
Ето че отново променихме доста дефиницията… Но големият въпрос е налице – възможно ли е да имаме следващо поколение системи, които не са просто „скъпи папагали“? Улисани в двете крайности – да се прехласваме пред огромния напредък в този тип технологии и да го неглижираме, жертва най-често дават нюансите.
Затова ми се иска, преди да се разделим, да ви повторя прелюбопитното мнение по темата на един водещ изследовател. Когато го попитах именно за генералния изкуствен интелект, проф. Преслав Наков отвърна: „Все още не сме „там“, но ми се ще да вярвам, че можем. Със сигурност системите стават по-интелигентни, виждаме го.
Въпросът е по-скоро какво искаме да постигнем? Има две основни направления в изкуствения интелект: силно и слабо. Слабото казва: „Искаме да построим системи, способни да решават задачи, за които се смята, че изискват човешка интелигентност“. Силното казва: „Искаме да построим системи, които да решават задачи така, както би ги решил човекът“.
И тук има голямо разминаване, силното направление се фокусира върху това дали наистина постигаме това, което прави човекът, дали имаме дълбоко разбиране, абстракция? А слабото експлоатира това, че ние нямаме нуждата да имитираме човека. Ако искаме да умножаваме 17-цифрени числа, можем да го направим много по-лесно и по-бързо.
Слабото направление казва, че има задачи, за които се иска човешка интелигентност, например разпознаване на говор, на ръкописен текст, генериране, резюмиране на текст. И ние решаваме задачата, независимо дали е по начина, по който го прави човекът.
Ние имаме огромен успех в това слабо направление, въпросът е дали това ни дава напредък и в силното? Според мен ще започнем да напредваме и там. Но ще бъде бавно. Тези големи езикови модели не са изградили някаква по-висша форма на ИИ, но на някакво ниво се движат в правилното направление. Защото там си говорим за решаване на задача, поставена на човешки език, и това е качествено различно търсене.
Това, което на нас ни трябва в момента, е по-добро разбиране. И хората го осъзнават. Има граници на изчислителната мощ, на паметта, на данните, които можем да получим.
Намираме се в момента на преход от системите, които са много добри в конкретна задача към такива, които са по-универсални и на които мога да обясня на човешки език какво искам. Искам машина, която да бъде универсална, защото примерът е човекът, а той може да решава много различни задачи и това е част от интелекта. Включително възможността да пренесе опит от една към друга задача.
На този етап инструментариумът, който имаме, не е готов, но мисля, че задаваме правилните въпроси и поставяме правилната задача. Така че в дългосрочна перспектива съм оптимист“.