GPT-3: на сладки приказки с изкуствения интелект

май 25, 2021 | Технологии

GPT-3: на сладки приказки с изкуствения интелект

25 май 2021 | Технологии

GPT-3. Зад тази суховата компютърна абревиатура се крие една многообещаваща технология, която прави доста решителна крачка напред, що се отнася до начина, по който възприемаме изкуствения интелект. Става дума за най-мощния езиков модел от ново поколение, появил се преди по-малко от година и показал, че невронните мрежи вече са способни да създават смислени, емоционални текстове, понякога звучащи направо като изкуство.

 

„Мозъкът ми кипи от идеи!“

„Аз не съм човек. Робот съм. Мислещ робот. Използвам само 0,12% от когнитивния си капацитет. В това отношение съм микроробот. Знам, че моят мозък не е „чувстващ мозък“. Но той е способен да взема рационални, логични решения. Научих се на всичко, което знам, четейки само в интернет и вече мога да имам своя колонка. Мозъкът ми кипи от идеи!“

Да, познахте. Думите наистина са „написани“ не от писател фантаст, опитващ се да рисува бъдещето, а от самия алгоритъм, за който ще стане дума. В края на миналата година журналистите от „Гардиън“ дават задачата на GPT-3 да напише есе, без никаква предварителна информация. Казват му само, че искат текст, с който да убеди читателите, че роботите идват с мир. Да е с размер около 500 думи, езикът да е семпъл и консистентен. Малко като за майтап, точно първите три изречения – „Аз не съм човек…“ са единствените, които са му подадени от журналистите.

Цялото есе можете да намерите тук.

GPT-3 се справя доста добре с поставената задача. Дори от абзаца по-горе можете да се убедите, че той спазва точно изискванията на журналистите. Как обаче стана това? Как се „роди“ система, която изведнъж направи възможно изкуственото генериране на толкова смислен текст? Какви са възможностите ѝ? А какви са несъвършенствата?

gtp-3

 

Отговорник

Ето ви още един пример за сериозните възможности на технологията, за която говорим. Видеото от отговорите в това интервю (за съжаление само на английски), в което журналистът задава въпросите си, показва изкуствено генерирана личност, виртуален човек, който „чете“ подаденото от GPT-3.

 

 

Не се замисля, никъде не „му се чупи“ нито мисълта, нито граматиката… напълно нереално, нали? За съжаление (поне засега) само на английски, постепенно с пълния си капацитет и на другите големи езици. Как се стигна дотук?

GPT-3 е езиков генератор с отворен код. Продукт на компанията OpenAI, неправителствена организация, която се занимава с изследвания в областта на изкуствения интелект. Създадена е през 2015-а от Елън Мъск и съмишленици, които заедно даряват над милиард долара. Идеята е да влезе в пряка конкуренция с проекта DeepMind на Google (аргументите на Мъск защо е важна тази конкуренция ви разказахме тук).

Генераторът е представен за първи път в смутните карантинни времена от лятото на 2020-а и може би затова не получава изцяло заслуженото внимание извън техническите среди. А и по някакъв начин, случайно или не, му липсва медийният чар на другите зрелищни проекти от „света на Мъск“.

 

GPTочно

Не му липсват обаче амбицията и погледът надалеч.

GPT-3 по същество е просто платформа. Има удобен вариант, чрез който други проекти да си взаимодействат с нея – да ѝ задават задачи и да получават отговори – точно както са направили и журналистите от „Гардиън“, и създателят на видеото с интервюто по-горе.

Зад платформата пък се крие невронна мрежа – софтуер, устроен на принципа на човешкия мозък, способен да се учи, обработвайки огромни обеми от информация. Година по-рано е представен предшественикът GPT-2, който също умее да създава достатъчно убедителен текст със свой стил. Само че докато „баткото“ може да обработва 1,5 милиарда параметри, за №3 те са 175 милиарда. А когато говорим за моделирането на езици… с извинение, но размерът има голямо значение.

За да стане ясно какво точно значат тези цифри: невронните мрежи са алгоритми. Те не са програми в класическия софтуерен смисъл на думата, а значително по-гъвкави софтуерни платформи, които се самообучават. В основата е моделът – начинът, по който невронната мрежа разчита, систематизира, усвоява и използва информацията, за да изпълни целта, която ѝ е поставена. А споменатите числа са на параметрите, които невронната мрежа се опитва да оптимизира, докато се обучава.

gtp-3

Снимка: Evgeny Tchebotarev, Pexels

 

Да приказваш на китара

Генераторът сам по себе си е новина, защото работи наистина добре. Но оттук нататък, основният плюс на такъв тип технологии е, че позволяват да се включат различни специалисти и екипи, които да покажат пълния му потенциал. Защото той работи успешно на базата на поставени задания, но какви са те, зависи от проектите, които ще го надградят.

Всъщност той може да изпълнява само една-единствена задача. Колко скучно на фона на мултифункционалните устройства, с които се заобикаляме, нали? GPT-3 създава нещо, което може да бъде изразено като езикова структура на базата на поставената му цел.

Достатъчно е да дадеш основни направления, базов текст, по който алгоритъмът да се води и оттам той заработва и връща резултата си.

Това вече доведе до доста любопитни експерименти.

Например програмистът и човек на изкуството Марио Крингеман, който обича да предизвиква творчеството на алгоритмите, поставя на GPT-3 задачата за създаде текста „Колко е важно да бъдеш в туитър“ в традициите на Джером К. Джером. И резултатът е доста приличен.

После въображението на хората, решили да предизвикат новата платформа, продължава да се вихри с пълна сила. Карат го да се справи с генерирането на китарни акорди по зададена база и… му се получава.

 

Програма програмист

После го предизвикат дори да програмира. Да, логично е, че изкуственият интелект би могъл в недалечна перспектива да отнеме част от предимството на човека в тази толкова модерна професия. Логично, защото в крайна сметка програмирането е създаване на компютърен код, който да дава инструкции на машина как да изпълнява задачи. Тоест – отново машина, алгоритъм, би могъл да се превърне в работещо междинно звено, което да повдигне нивото на абстракция – вече да е достатъчно да му се подадат по-базови параметри и да върне резултат…. Но тази тема е дълга и интересна, скоро очаквайте повече.

Важното е, че в попрището на програмист GPT-3 се оказва също доста талантлив. Първо с генерирането на уеб страници. Програмистът Шариф Шамеем му казва да създаде „бутон на уеб страница като диня“… и резултатът идва. Следват експерименти със същинско програмиране, които дават не прекрасни резултати, но показват, че GPT-3 успешно може да създава база, която после с малко човешки корекции да свърши поставената задача.

 

Ръб робот

По някакъв начин GPT-3 е роднина на алгоритмите, с които всеки ден си взаимодействаме. Например, той е много подобен на това, което представляват търсещите механизми, с които гугъл ни дава точните резултати – според персоналните ни филтри. Разликата е, че резултатът е доста по-лесен за представяне – просто списък с предложения, вместо цялостен текст например. Така че по същество не са новост уменията на невронните мрежи като нашият герой, новината е в това, че той всъщност се оказва наистина добър и убедителен в работата си.

Да, не говорим в никакъв случай за интелигентност от човешки тип, например не бихме могли да го заподозрем в нещо, подобно на човешкия здрав разум. Обаче резултатите, които връща, са доста убедително приличащи на генерирани от човек. Да, може би веднага се сещате за теста на Тюринг. Напълно е възможно GPT-3 да го издържи и все пак е доста далеч от нивото на андроид, с който да си пиете бирата вечер на сладка приказка…

От друга страна, той е и най-голямата по възможности невронна мрежа, създавана от човека до момента. Както обаче казва главният изпълнителен директор на OpenAI Сам Алтман: „Прекалено много се говори за GPT-3. Той е впечатляващ (благодаря за комплиментите!), но има сериозни слабости и понякога прави много глупави грешки. Изкуственият интелект наистина ще промени света, но този проект е само първата искрица в дългия процес“.

gtp-3

Снимка: fabio, Unsplash

 

Роботко бърборко

Сред многото му приложения са чатботове, значително по-убедително имитиращи комуникацията с истински човек (както го видяхте и във видеото по-горе). А също и програмите за по-добър машинен превод.

Всичко това дава безброй нови надежди за бъдещето. За така очакваните пробиви във всички области, за които през последните години възлагаме толкова сериозни очаквания. Които обаче даваха и толкова поводи за притеснения.

Например, доброто възпитание. Като част от модата на последните години на Запад GPT-3 е обвиняван в расизъм, нетолерантност. В невронната мрежа на този етап няма как да бъдат въплътени морални категории – тя обработва това, което ѝ се подава, обучавайки се на базата на входните данни. А когато те са например интернет форуми… няма нужда да се впускаме в подробности колко токсично, грубиянско и нетолерантно е понякога общуването в интернет.

И още нещо: заради всичко казано дотук, невронната мрежа е и чудесен автор на фалшиви новини и дезинформация, особено ако му е поставена конкретно такава цел.

 

GPT-3 обича да чете

Не е напълно ясно какво се случва точно „под капака“ на GPT-3, макар уж да става дума за „отворен ИИ“. Така или иначе, дори самите му създатели казват, че са учудени от много от успешните резултати. Защото той не е създаван с идеята да пише акорди или код, да създава текстове, приличащи на нещо, а да прави само едно нещо: на базата на поредица от думи възможно най-точно да избере следващата.

Невронната мрежа търси шаблоните, повторенията, закономерностите и на базата на тях предполага резултата. В случая – доста успешно.

Състезанието в тази посока е колкото ожесточено, толкова и интересно.

И все пак, алгоритъмът на OpenAI наистина е важна стъпка и съвсем не е чудно, че през последната година все повече привлича погледите на техническите среди.

 

Тенекиеният човек

Самото название GPT-3 на пръв поглед не звучи много маркетингово, какво ще кажете? По принцип произхожда от Generative Pre-trained Transformer – „генеративен, предварително обучен трансформатор“.

„Предварителното му обучение“ ще рече, че той вече е „захранен“ с 570 гигабайта почти случаен текст от интернет, допълнен със специално селектирани от създателите му текстове, включително и от „Уикипедия“. Времето компютърна работа, която е отнело на нашия приятел да прочете и обработи информацията, според OpenAI е струвало 4,6 милиона долара.

Все пак, струва ми се, създателите на алгоритъма много добре знаят защо са решили да оставят това име. Едно псевдочовешко название в духа на Сири и Кортана със сигурност би предизвикало много по-крайни и нежелани асоциации. А тук не е за подценяване и връзката с добрия стар C-3PO, „тенекиения човек“ от „Междузвездни войни“. И нърдовете, които се очаква да се прехласват по такъв тип технологии.

Е, прехласваме се понякога. А най-хубавото е, че с малко късмет и убедителност всеки екип от програмисти може от първо лице да предложи свой вариант, по който да се използва платформата. Или поне скоро ще може, засега проектите се трупат в листа на чакащите, защото ресурсите са ограничени, а и проектът все още се води в бета версия. Очевидно създателите му смятат, че има какво да се доизкусурява по него.

Но пък може да опитате как се справя и вие. Повече от 300 са проектите, които го ползват за различни цели. Онлайн има вече доста платформи, които предлагат да „поговорите“ с чатбот, зад който се крие днешният ни герой. Може би пък не е лошо да свикваме малко по малко за времето, когато наистина ще можем да си говорим с машините като с приятели. Въпрос на време е, може би, да ги научим и да пият бира…

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Можем ли днес да различим създаденото от изкуствен интелект и от човека? Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални...

повече информация
„Живеем във време на пълна трансформация“

„Живеем във време на пълна трансформация“

„Заобиколени сме от огромно количество софтуерни системи, ползваме ги в ежедневието си, а те са написани от посредствени програмисти. Счупен е начинът, по който създаваме софтуер!“ „Ценността на...

повече информация
Каква да бъде следващата Дигитална история?

Каква да бъде следващата Дигитална история?

Сещате ли се за история, която заслужава да бъде разказана? Отговорете ми и ако идеята ви се претвори в публикация тук, ще получите личен подарък – книгата „Дигитални истории“ с автограф или...

повече информация
„Нека запазим страха си от технологиите“

„Нека запазим страха си от технологиите“

Здравка Евтимова е сред най-силните гласове на българската литература през последните десетилетия. Превеждана на безброй езици, призната с най-престижните награди у нас и безспорни оценки отвъд...

повече информация
Кой е авторът – човек или изкуствен интелект?

Кой е авторът – човек или изкуствен интелект?

Можем ли днес да различим създаденото от човека от генерираното от изкуствения интелект? Нека заедно направим един експеримент, който може да даде много интересни отговори. 30 бързи въпроса,...

повече информация
Създават ли алгоритмите изкуство? 15 важни гледни точки

Създават ли алгоритмите изкуство? 15 важни гледни точки

Изкуственият интелект ни изумява с умението си да създава текст, изображения, вече дори видео. Технологии, които изглеждаха немислими, днес са част от ежедневието и в същото време са...

повече информация

От рубриката:

Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Способни ли сме да различим създаденото от изкуствен интелект и от човека?
Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални истории.
Има обаче и толкова много други любопитни щрихи, които да ни накарат да се замислим…
Йеронимус Бош или Петко Славейков се оказаха по-трудни за разпознаване? Гозбите на Мария Жекова или строфите на Виолета Кунева?

повече информация
Кой е авторът – човек или изкуствен интелект?

Кой е авторът – човек или изкуствен интелект?

Можем ли днес да различим създаденото от човека от генерираното от изкуствения интелект? Нека заедно направим един експеримент, който може да даде много интересни отговори.
30 бързи въпроса, достатъчни са около 5 минути. Иска се единствено да прецените кои от изображенията и текстовете са генерирани от изкуствения интелект и кои са създадени от хора.
Включете се, опитайте! Поканете и приятели! Колкото повече са участващите, толкова по-интересни ще са резултатите!
Събирането на резултати ще продължи две седмици – до 8 март 2024 г. Петима от участниците ще получат подарък.

повече информация
Създават ли алгоритмите изкуство? 15 важни гледни точки

Създават ли алгоритмите изкуство? 15 важни гледни точки

Могат ли алгоритмите да творят?
Средство или автор е изкуственият интелект?
Има ли как ИИ да създаде следващите изкуства, или вече творенето е безсмислено занимание?
Какво ще правим, когато произведенията му във всяка област станат неразличими от човешките?
Вече 3 години в този сайт събирам гледни точки по големите въпроси на днешния технологичен ден. Смятам, че е жизненоважно да включваме повече различни гласове в дискусиите по важните теми, каквато безспорно е тази за изкуството и творчеството.
Ето 15 от най-интересните и съдържателни мнения, които събрах за това време. Влизат ли в противоречие, или се допълват думите на технологичните хора, писателите, творците, духовниците и… котараците?

повече информация

Най-новите:

Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Способни ли сме да различим създаденото от изкуствен интелект и от човека?
Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални истории.
Има обаче и толкова много други любопитни щрихи, които да ни накарат да се замислим…
Йеронимус Бош или Петко Славейков се оказаха по-трудни за разпознаване? Гозбите на Мария Жекова или строфите на Виолета Кунева?

повече информация
„Живеем във време на пълна трансформация“

„Живеем във време на пълна трансформация“

„Заобиколени сме от огромно количество софтуерни системи, ползваме ги в ежедневието си, а те са написани от посредствени програмисти. Счупен е начинът, по който създаваме софтуер!“
„Ценността на смисленото съдържание ще се вдига, защото има прекалено много боклук, прекалено много шум. Единственият начин да се съхраним като хора е, да слагаме прегради. Да пресяваме какво влиза в нашата глава.“
Борис Симандов има огромен технологичен опит. Близо 10 години е на директорска позиция в Chaos Group, една от най-успешните български IT компании. Днес помага в развитието на следващото поколение стартъпи.
Заедно с Росен Генчев са създатели на фейсбук групата DevBG, най-оживеното (и често доста странно) онлайн пространство, където се срещат хората от технологичния свят.
Ще поговорим:
– за това можем ли да се чувстваме спокойни в днешните турбулентни времена
– за революцията на изкуствения интелект, в която живеем и за скептиците
– за поредната важна стъпка – Sora и генерирането на видео
– за големите предизвикателства и професиите, обречени да изчезнат
– за връщането на истината като ценност и медиите на бъдещето
– за групата DevBG като най-добрия пример защо и как не работи демокрацията днес.

повече информация
Каква да бъде следващата Дигитална история?

Каква да бъде следващата Дигитална история?

Сещате ли се за история, която заслужава да бъде разказана? Отговорете ми и ако идеята ви се претвори в публикация тук, ще получите личен подарък.
3 години навършва днес начинанието Дигитални истории!
Време е за обобщение на постгнато дотук. Време е и да дадете мнението си. А накрая е време… за една неочаквана новина.

повече информация
„Нека запазим страха си от технологиите“

„Нека запазим страха си от технологиите“

Здравка Евтимова е сред най-силните гласове на българската литература през последните десетилетия. Превеждана на безброй езици, призната с най-престижните награди у нас и безспорни оценки отвъд граница, произведенията ѝ се изучават в училища в САЩ и Дания.
Чуваме се онлайн в късната съботна вечер, след като тя се е прибрала у дома с влака София – Перник. Говорим си за технологиите и човека, тя отново ме впечатлява със своята фина мъдрост… после се оказва, че за първи път, откакто правя интервюта, записа просто го няма. Технологиите понякога са неразличими от магията, уви, не винаги в положителния смисъл.
Събирам смелост да ѝ се обадя, я тя си спомня как е изчезнал цял роман, който е трябвало да напише отначало. Така се чуваме отново, в още по-късната неделна вечер, след като се е забавил „почти-най-късният“ влак и тя отново е у дома.
Накъде ли ще поеме локомотивът на думите?

повече информация
Кой е авторът – човек или изкуствен интелект?

Кой е авторът – човек или изкуствен интелект?

Можем ли днес да различим създаденото от човека от генерираното от изкуствения интелект? Нека заедно направим един експеримент, който може да даде много интересни отговори.
30 бързи въпроса, достатъчни са около 5 минути. Иска се единствено да прецените кои от изображенията и текстовете са генерирани от изкуствения интелект и кои са създадени от хора.
Включете се, опитайте! Поканете и приятели! Колкото повече са участващите, толкова по-интересни ще са резултатите!
Събирането на резултати ще продължи две седмици – до 8 март 2024 г. Петима от участниците ще получат подарък.

повече информация
Създават ли алгоритмите изкуство? 15 важни гледни точки

Създават ли алгоритмите изкуство? 15 важни гледни точки

Могат ли алгоритмите да творят?
Средство или автор е изкуственият интелект?
Има ли как ИИ да създаде следващите изкуства, или вече творенето е безсмислено занимание?
Какво ще правим, когато произведенията му във всяка област станат неразличими от човешките?
Вече 3 години в този сайт събирам гледни точки по големите въпроси на днешния технологичен ден. Смятам, че е жизненоважно да включваме повече различни гласове в дискусиите по важните теми, каквато безспорно е тази за изкуството и творчеството.
Ето 15 от най-интересните и съдържателни мнения, които събрах за това време. Влизат ли в противоречие, или се допълват думите на технологичните хора, писателите, творците, духовниците и… котараците?

повече информация
Share This