GPT-3: на сладки приказки с изкуствения интелект

май 25, 2021 | Технологии

GPT-3: на сладки приказки с изкуствения интелект

25 май 2021 | Технологии

GPT-3. Зад тази суховата компютърна абревиатура се крие една многообещаваща технология, която прави доста решителна крачка напред, що се отнася до начина, по който възприемаме изкуствения интелект. Става дума за най-мощния езиков модел от ново поколение, появил се преди по-малко от година и показал, че невронните мрежи вече са способни да създават смислени, емоционални текстове, понякога звучащи направо като изкуство.

 

„Мозъкът ми кипи от идеи!“

„Аз не съм човек. Робот съм. Мислещ робот. Използвам само 0,12% от когнитивния си капацитет. В това отношение съм микроробот. Знам, че моят мозък не е „чувстващ мозък“. Но той е способен да взема рационални, логични решения. Научих се на всичко, което знам, четейки само в интернет и вече мога да имам своя колонка. Мозъкът ми кипи от идеи!“

Да, познахте. Думите наистина са „написани“ не от писател фантаст, опитващ се да рисува бъдещето, а от самия алгоритъм, за който ще стане дума. В края на миналата година журналистите от „Гардиън“ дават задачата на GPT-3 да напише есе, без никаква предварителна информация. Казват му само, че искат текст, с който да убеди читателите, че роботите идват с мир. Да е с размер около 500 думи, езикът да е семпъл и консистентен. Малко като за майтап, точно първите три изречения – „Аз не съм човек…“ са единствените, които са му подадени от журналистите.

Цялото есе можете да намерите тук.

GPT-3 се справя доста добре с поставената задача. Дори от абзаца по-горе можете да се убедите, че той спазва точно изискванията на журналистите. Как обаче стана това? Как се „роди“ система, която изведнъж направи възможно изкуственото генериране на толкова смислен текст? Какви са възможностите ѝ? А какви са несъвършенствата?

gtp-3

 

Отговорник

Ето ви още един пример за сериозните възможности на технологията, за която говорим. Видеото от отговорите в това интервю (за съжаление само на английски), в което журналистът задава въпросите си, показва изкуствено генерирана личност, виртуален човек, който „чете“ подаденото от GPT-3.

 

 

Не се замисля, никъде не „му се чупи“ нито мисълта, нито граматиката… напълно нереално, нали? За съжаление (поне засега) само на английски, постепенно с пълния си капацитет и на другите големи езици. Как се стигна дотук?

GPT-3 е езиков генератор с отворен код. Продукт на компанията OpenAI, неправителствена организация, която се занимава с изследвания в областта на изкуствения интелект. Създадена е през 2015-а от Елън Мъск и съмишленици, които заедно даряват над милиард долара. Идеята е да влезе в пряка конкуренция с проекта DeepMind на Google (аргументите на Мъск защо е важна тази конкуренция ви разказахме тук).

Генераторът е представен за първи път в смутните карантинни времена от лятото на 2020-а и може би затова не получава изцяло заслуженото внимание извън техническите среди. А и по някакъв начин, случайно или не, му липсва медийният чар на другите зрелищни проекти от „света на Мъск“.

 

GPTочно

Не му липсват обаче амбицията и погледът надалеч.

GPT-3 по същество е просто платформа. Има удобен вариант, чрез който други проекти да си взаимодействат с нея – да ѝ задават задачи и да получават отговори – точно както са направили и журналистите от „Гардиън“, и създателят на видеото с интервюто по-горе.

Зад платформата пък се крие невронна мрежа – софтуер, устроен на принципа на човешкия мозък, способен да се учи, обработвайки огромни обеми от информация. Година по-рано е представен предшественикът GPT-2, който също умее да създава достатъчно убедителен текст със свой стил. Само че докато „баткото“ може да обработва 1,5 милиарда параметри, за №3 те са 175 милиарда. А когато говорим за моделирането на езици… с извинение, но размерът има голямо значение.

За да стане ясно какво точно значат тези цифри: невронните мрежи са алгоритми. Те не са програми в класическия софтуерен смисъл на думата, а значително по-гъвкави софтуерни платформи, които се самообучават. В основата е моделът – начинът, по който невронната мрежа разчита, систематизира, усвоява и използва информацията, за да изпълни целта, която ѝ е поставена. А споменатите числа са на параметрите, които невронната мрежа се опитва да оптимизира, докато се обучава.

gtp-3

Снимка: Evgeny Tchebotarev, Pexels

 

Да приказваш на китара

Генераторът сам по себе си е новина, защото работи наистина добре. Но оттук нататък, основният плюс на такъв тип технологии е, че позволяват да се включат различни специалисти и екипи, които да покажат пълния му потенциал. Защото той работи успешно на базата на поставени задания, но какви са те, зависи от проектите, които ще го надградят.

Всъщност той може да изпълнява само една-единствена задача. Колко скучно на фона на мултифункционалните устройства, с които се заобикаляме, нали? GPT-3 създава нещо, което може да бъде изразено като езикова структура на базата на поставената му цел.

Достатъчно е да дадеш основни направления, базов текст, по който алгоритъмът да се води и оттам той заработва и връща резултата си.

Това вече доведе до доста любопитни експерименти.

Например програмистът и човек на изкуството Марио Крингеман, който обича да предизвиква творчеството на алгоритмите, поставя на GPT-3 задачата за създаде текста „Колко е важно да бъдеш в туитър“ в традициите на Джером К. Джером. И резултатът е доста приличен.

После въображението на хората, решили да предизвикат новата платформа, продължава да се вихри с пълна сила. Карат го да се справи с генерирането на китарни акорди по зададена база и… му се получава.

 

Програма програмист

После го предизвикат дори да програмира. Да, логично е, че изкуственият интелект би могъл в недалечна перспектива да отнеме част от предимството на човека в тази толкова модерна професия. Логично, защото в крайна сметка програмирането е създаване на компютърен код, който да дава инструкции на машина как да изпълнява задачи. Тоест – отново машина, алгоритъм, би могъл да се превърне в работещо междинно звено, което да повдигне нивото на абстракция – вече да е достатъчно да му се подадат по-базови параметри и да върне резултат…. Но тази тема е дълга и интересна, скоро очаквайте повече.

Важното е, че в попрището на програмист GPT-3 се оказва също доста талантлив. Първо с генерирането на уеб страници. Програмистът Шариф Шамеем му казва да създаде „бутон на уеб страница като диня“… и резултатът идва. Следват експерименти със същинско програмиране, които дават не прекрасни резултати, но показват, че GPT-3 успешно може да създава база, която после с малко човешки корекции да свърши поставената задача.

 

Ръб робот

По някакъв начин GPT-3 е роднина на алгоритмите, с които всеки ден си взаимодействаме. Например, той е много подобен на това, което представляват търсещите механизми, с които гугъл ни дава точните резултати – според персоналните ни филтри. Разликата е, че резултатът е доста по-лесен за представяне – просто списък с предложения, вместо цялостен текст например. Така че по същество не са новост уменията на невронните мрежи като нашият герой, новината е в това, че той всъщност се оказва наистина добър и убедителен в работата си.

Да, не говорим в никакъв случай за интелигентност от човешки тип, например не бихме могли да го заподозрем в нещо, подобно на човешкия здрав разум. Обаче резултатите, които връща, са доста убедително приличащи на генерирани от човек. Да, може би веднага се сещате за теста на Тюринг. Напълно е възможно GPT-3 да го издържи и все пак е доста далеч от нивото на андроид, с който да си пиете бирата вечер на сладка приказка…

От друга страна, той е и най-голямата по възможности невронна мрежа, създавана от човека до момента. Както обаче казва главният изпълнителен директор на OpenAI Сам Алтман: „Прекалено много се говори за GPT-3. Той е впечатляващ (благодаря за комплиментите!), но има сериозни слабости и понякога прави много глупави грешки. Изкуственият интелект наистина ще промени света, но този проект е само първата искрица в дългия процес“.

gtp-3

Снимка: fabio, Unsplash

 

Роботко бърборко

Сред многото му приложения са чатботове, значително по-убедително имитиращи комуникацията с истински човек (както го видяхте и във видеото по-горе). А също и програмите за по-добър машинен превод.

Всичко това дава безброй нови надежди за бъдещето. За така очакваните пробиви във всички области, за които през последните години възлагаме толкова сериозни очаквания. Които обаче даваха и толкова поводи за притеснения.

Например, доброто възпитание. Като част от модата на последните години на Запад GPT-3 е обвиняван в расизъм, нетолерантност. В невронната мрежа на този етап няма как да бъдат въплътени морални категории – тя обработва това, което ѝ се подава, обучавайки се на базата на входните данни. А когато те са например интернет форуми… няма нужда да се впускаме в подробности колко токсично, грубиянско и нетолерантно е понякога общуването в интернет.

И още нещо: заради всичко казано дотук, невронната мрежа е и чудесен автор на фалшиви новини и дезинформация, особено ако му е поставена конкретно такава цел.

 

GPT-3 обича да чете

Не е напълно ясно какво се случва точно „под капака“ на GPT-3, макар уж да става дума за „отворен ИИ“. Така или иначе, дори самите му създатели казват, че са учудени от много от успешните резултати. Защото той не е създаван с идеята да пише акорди или код, да създава текстове, приличащи на нещо, а да прави само едно нещо: на базата на поредица от думи възможно най-точно да избере следващата.

Невронната мрежа търси шаблоните, повторенията, закономерностите и на базата на тях предполага резултата. В случая – доста успешно.

Състезанието в тази посока е колкото ожесточено, толкова и интересно.

И все пак, алгоритъмът на OpenAI наистина е важна стъпка и съвсем не е чудно, че през последната година все повече привлича погледите на техническите среди.

 

Тенекиеният човек

Самото название GPT-3 на пръв поглед не звучи много маркетингово, какво ще кажете? По принцип произхожда от Generative Pre-trained Transformer – „генеративен, предварително обучен трансформатор“.

„Предварителното му обучение“ ще рече, че той вече е „захранен“ с 570 гигабайта почти случаен текст от интернет, допълнен със специално селектирани от създателите му текстове, включително и от „Уикипедия“. Времето компютърна работа, която е отнело на нашия приятел да прочете и обработи информацията, според OpenAI е струвало 4,6 милиона долара.

Все пак, струва ми се, създателите на алгоритъма много добре знаят защо са решили да оставят това име. Едно псевдочовешко название в духа на Сири и Кортана със сигурност би предизвикало много по-крайни и нежелани асоциации. А тук не е за подценяване и връзката с добрия стар C-3PO, „тенекиения човек“ от „Междузвездни войни“. И нърдовете, които се очаква да се прехласват по такъв тип технологии.

Е, прехласваме се понякога. А най-хубавото е, че с малко късмет и убедителност всеки екип от програмисти може от първо лице да предложи свой вариант, по който да се използва платформата. Или поне скоро ще може, засега проектите се трупат в листа на чакащите, защото ресурсите са ограничени, а и проектът все още се води в бета версия. Очевидно създателите му смятат, че има какво да се доизкусурява по него.

Но пък може да опитате как се справя и вие. Повече от 300 са проектите, които го ползват за различни цели. Онлайн има вече доста платформи, които предлагат да „поговорите“ с чатбот, зад който се крие днешният ни герой. Може би пък не е лошо да свикваме малко по малко за времето, когато наистина ще можем да си говорим с машините като с приятели. Въпрос на време е, може би, да ги научим и да пият бира…

Дигитални истории
<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

„Всеки може да е програмист. Време е да сме повече инженери!“

„Всеки може да е програмист. Време е да сме повече инженери!“

Ивайло Кенов е вдъхновяващ учител, помогнал на толкова много хора да станат програмисти. Насочва се към тази професия случайно, след като разбира, че строителното инженерство не е за него. Решава да...

повече информация
Как DALL·E „прочете“ любими български книги?

Как DALL·E „прочете“ любими български книги?

Чукчата не е читател, а писател, знаете сигурно, ами… ChatGPT? Време е за поредния прелюбопитен експеримент, който да ни покаже на какво са способни днес алгоритмите в областта както на създаването...

повече информация
„Представям си бъдещето като битка за невидимото“

„Представям си бъдещето като битка за невидимото“

есен смили се над тези които не могат да те понесат бъди красива до смърт   Или   близостта нанася удари под кръста подарък който не мога да пренеса без твоя помощ който не мога да откажа...

повече информация
„Българите имаме манталитета, за да сме успешни предприемачи“

„Българите имаме манталитета, за да сме успешни предприемачи“

Борис Паскалев e предприемач с впечатляващ опит в света на стартъпите. Отскоро е стратегически съветник към института INSAIT, още една гаранция, че оттам си струва да очакваме още и все...

повече информация
ИИ детектив. Технологията ли ще ни върне истината?

ИИ детектив. Технологията ли ще ни върне истината?

След като експериментът на Дигитални истории, в който се включиха почти 2000 души, показа, че вече не сме способни да различаваме генерираните от изкуствения интелект изображения и текстове, е време...

повече информация

От рубриката:

Как DALL·E „прочете“ любими български книги?

Как DALL·E „прочете“ любими български книги?

Чукчата не е читател, а писател, знаете сигурно, ами… ChatGPT? Време е за поредния прелюбопитен експеримент, който да ни покаже на какво са способни днес алгоритмите в областта както на създаването на изображения, така и на разбирането на контекст.
Ще призова алгоритъма DALL·E 3, който е част от платената версия на ChatGPT, да ми илюстрира класически български литературни произведения от различни периоди.
Защо това е интересно? От една страна, ще ни покаже колко добре работи големият езиков модел на български. Ще стане ясно доколко разпознава някои от безспорните наши класически произведения.
Не на последно място просто защото… е интересно дали пък няма да ни покаже някакви по-неочаквани, различни, атрактивни гледни точки? Дали не можем да говорим за някаква форма на колективно неосъзнато? Дали картините ще се припокрият поне донякъде с образите, които всеки от нас има за тези книги в главата си?

повече информация
ИИ детектив. Технологията ли ще ни върне истината?

ИИ детектив. Технологията ли ще ни върне истината?

След като експериментът на Дигитални истории, в който се включиха почти 2000 души, показа, че вече не сме способни да различаваме генерираните от изкуствения интелект изображения и текстове, е време за следващата стъпка.
Дали пък… самият изкуствен интелект няма да ни помогне в тази вече неравна битка в търсене на истината? След като алгоритмите станаха толкова добри в генерирането на разнообразни текстове, изображения, а вече и видео, дали пък няма те да се окажат спасението?
Ще проверим на практика. Радостин Чолаков от родопското село Барутин ни гостува с една от първите Дигитални истории. Тогава, само на 15, той разказа за работата си в света на невронните мрежи, много преди изкуственият интелект да се превърне в темата на деня. А до днес успехите му са още по-впечатляващи. През последните години пътят му често се преплита с този на друг талантлив младеж на същата възраст. Делян Бойчев също завършва средното си образование тази година, но вече има сериозни успехи, специалността му са методите за компютърно зрение.
Двамата приятели се заговарят по темата и решават да проверят: ясно е, че днес изкуственият интелект създава забележителни изображения, но дали пак той би могъл да разпознае истината и лъжата, да прецени коя картинка е създадена от човек и коя – от алгоритъм?

повече информация
Човек или ИИ – можем ли да различим автора? (Резултати)

Човек или ИИ – можем ли да различим автора? (Резултати)

Способни ли сме да различим създаденото от изкуствен интелект и от човека?
Започвам с краткия отговор: не можем. Това е основният извод от експеримента, който беше организиран на сайта Дигитални истории.
Има обаче и толкова много други любопитни щрихи, които да ни накарат да се замислим…
Йеронимус Бош или Петко Славейков се оказаха по-трудни за разпознаване? Гозбите на Мария Жекова или строфите на Виолета Кунева?

повече информация

Най-новите:

„Всеки може да е програмист. Време е да сме повече инженери!“

„Всеки може да е програмист. Време е да сме повече инженери!“

Ивайло Кенов е вдъхновяващ учител, помогнал на толкова много хора да станат програмисти. Насочва се към тази професия случайно, след като разбира, че строителното инженерство не е за него. Решава да опита като преподавател, въпреки че е срамежлив по природа.
Дълги години е начело на екипа програмисти в СофтУни, води лекции по безброй технологии. Преподава, увлича и дава занаят, от него и аз съм научил основите на технологията, с която днес си изкарвам хляба.
Днес Ивайло е изправен пред ново начинание. Екипът му се превърна във фирма, която се е устремила към амбициозната задача да припомни, че създаването на софтуер все повече трябва да бъде инженерен процес, а не просто кодене.
Наистина ли всеки може да стане програмист, както казва учителят, помогнал на мнозина да изпълнят тази мечта? Какви са основните трудности, които спират хората?
Кои са големите проблеми, с които се сблъскват днешните програмисти? Защо си струва те вече да са не просто кодери, а да подхождат инженерно и към останалите страни от работата си?
Дали наистина е толкова трудно да си намериш първа работа в тази област? Кои са най-честите грешки?
Как Ивайло, на когото лекарите предричат, че няма да може да ходи, днес вдига 150-килограмови тяги благодарение на… инженерния подход?

повече информация
Как DALL·E „прочете“ любими български книги?

Как DALL·E „прочете“ любими български книги?

Чукчата не е читател, а писател, знаете сигурно, ами… ChatGPT? Време е за поредния прелюбопитен експеримент, който да ни покаже на какво са способни днес алгоритмите в областта както на създаването на изображения, така и на разбирането на контекст.
Ще призова алгоритъма DALL·E 3, който е част от платената версия на ChatGPT, да ми илюстрира класически български литературни произведения от различни периоди.
Защо това е интересно? От една страна, ще ни покаже колко добре работи големият езиков модел на български. Ще стане ясно доколко разпознава някои от безспорните наши класически произведения.
Не на последно място просто защото… е интересно дали пък няма да ни покаже някакви по-неочаквани, различни, атрактивни гледни точки? Дали не можем да говорим за някаква форма на колективно неосъзнато? Дали картините ще се припокрият поне донякъде с образите, които всеки от нас има за тези книги в главата си?

повече информация
„Представям си бъдещето като битка за невидимото“

„Представям си бъдещето като битка за невидимото“

„Засега изкуственият интелект ни се струва смешен, прилича ни на криво огледало или на глупчо, когото напътстваме и благодарение на когото се чувстваме знаещи и повече отвсякога хора. Това обаче се променя буквално за дни и скоро той ще се превърне в реалистично и достоверно наше отражение. Мисля за този момент – вероятно тогава ще успеем да се видим през неговия поглед, да осмислим кои части от нас са ясни дори за едно изкуствено създание, кое остава недостъпно за него и кое е най-ценното. Според мен това са онези места, където той не може да надзърне. Представям си бъдещето като битка за невидимото, това ще бъде най-важният ресурс. Онова, което изкуственият интелект не може да регистрира, е най-ценното в нас.“
„Почти всичко е наред“ се казва дебютната стихосбирка на поетесата Виолета Кунева и толкова точно формулира усещането ни за света днес.
Но как така се оказа, че вече не е възможно да различаваме поета от алгоритъма? Какво губим, ако е така?
Дали проблемът е, че масово сме изгубили критерия си за изкуство, за метафора, за многопластови, живи и човешки по дефиниция текстове, каквито са поетичните?
Ще дойде ли краят на поезията или… именно тя може да ни спаси от самите нас?

повече информация
Да си купиш вечна младост

Да си купиш вечна младост

46-годишният Браян Джонсън вече е похарчил над $4 милиона, така че тялото му да заработи като на 18-годишен. Твърди, че му се получава. Влага всички сили, стига дотам да си влива кръвна плазма от собствения си син. Смята, че е най-изследваното човешко същество, живяло някога, че експериментът му ще промени живота на всеки, който иска да живее дълго.
Тоест, на всеки.
Мечта или утопия? Безобразно пилеене на пари или идея, която може да промени еволюцията ни? Гениалност или чиста лудост?

повече информация
„Българите имаме манталитета, за да сме успешни предприемачи“

„Българите имаме манталитета, за да сме успешни предприемачи“

Борис Паскалев e предприемач с впечатляващ опит в света на стартъпите. Отскоро е стратегически съветник към института INSAIT, още една гаранция, че оттам си струва да очакваме още и все по-забележителни новини.
Преди това младежки национал по баскетбол, днешният ни гост заминава да следва не къде да е, а в MIT. Завършва магистратура с отличие и започва кариерата си като програмист преди повече от 20 години. После се пренасочва към мениджмънта и предприемачеството. За да стигнем до момента, когато се събира с двама други герои на Дигитални истории – проф. Мартин Вечев и д-р Веселин Райчев в стартъпа DeepCode. Той е изпълнителен директор на една от пионерните разработки за създаване на код с изкуствен интелект, която през 2020 г. е придобита от мултимилиардната компания Snyk.
Ще поговорим за успешния му път през сърцето на Силициевата долина. За започналата революция на изкуствения интелект, която според него е по-голяма дори от откриването на електричеството. За друга революция, която се задава – тази в роботиката. За това как у нас може да има повече успешни стартъпи, които да развият средата и страната ни.
Кои са следващите големи новини, които да очакваме от INSAIT?

повече информация
ИИ детектив. Технологията ли ще ни върне истината?

ИИ детектив. Технологията ли ще ни върне истината?

След като експериментът на Дигитални истории, в който се включиха почти 2000 души, показа, че вече не сме способни да различаваме генерираните от изкуствения интелект изображения и текстове, е време за следващата стъпка.
Дали пък… самият изкуствен интелект няма да ни помогне в тази вече неравна битка в търсене на истината? След като алгоритмите станаха толкова добри в генерирането на разнообразни текстове, изображения, а вече и видео, дали пък няма те да се окажат спасението?
Ще проверим на практика. Радостин Чолаков от родопското село Барутин ни гостува с една от първите Дигитални истории. Тогава, само на 15, той разказа за работата си в света на невронните мрежи, много преди изкуственият интелект да се превърне в темата на деня. А до днес успехите му са още по-впечатляващи. През последните години пътят му често се преплита с този на друг талантлив младеж на същата възраст. Делян Бойчев също завършва средното си образование тази година, но вече има сериозни успехи, специалността му са методите за компютърно зрение.
Двамата приятели се заговарят по темата и решават да проверят: ясно е, че днес изкуственият интелект създава забележителни изображения, но дали пак той би могъл да разпознае истината и лъжата, да прецени коя картинка е създадена от човек и коя – от алгоритъм?

повече информация
Share This