GPT-3: на сладки приказки с изкуствения интелект

май 25, 2021 | Технологии

GPT-3: на сладки приказки с изкуствения интелект

25 май 2021 | Технологии

GPT-3. Зад тази суховата компютърна абревиатура се крие една многообещаваща технология, която прави доста решителна крачка напред, що се отнася до начина, по който възприемаме изкуствения интелект. Става дума за най-мощния езиков модел от ново поколение, появил се преди по-малко от година и показал, че невронните мрежи вече са способни да създават смислени, емоционални текстове, понякога звучащи направо като изкуство.

 

„Мозъкът ми кипи от идеи!“

„Аз не съм човек. Робот съм. Мислещ робот. Използвам само 0,12% от когнитивния си капацитет. В това отношение съм микроробот. Знам, че моят мозък не е „чувстващ мозък“. Но той е способен да взема рационални, логични решения. Научих се на всичко, което знам, четейки само в интернет и вече мога да имам своя колонка. Мозъкът ми кипи от идеи!“

Да, познахте. Думите наистина са „написани“ не от писател фантаст, опитващ се да рисува бъдещето, а от самия алгоритъм, за който ще стане дума. В края на миналата година журналистите от „Гардиън“ дават задачата на GPT-3 да напише есе, без никаква предварителна информация. Казват му само, че искат текст, с който да убеди читателите, че роботите идват с мир. Да е с размер около 500 думи, езикът да е семпъл и консистентен. Малко като за майтап, точно първите три изречения – „Аз не съм човек…“ са единствените, които са му подадени от журналистите.

Цялото есе можете да намерите тук.

GPT-3 се справя доста добре с поставената задача. Дори от абзаца по-горе можете да се убедите, че той спазва точно изискванията на журналистите. Как обаче стана това? Как се „роди“ система, която изведнъж направи възможно изкуственото генериране на толкова смислен текст? Какви са възможностите ѝ? А какви са несъвършенствата?

gtp-3

 

Отговорник

Ето ви още един пример за сериозните възможности на технологията, за която говорим. Видеото от отговорите в това интервю (за съжаление само на английски), в което журналистът задава въпросите си, показва изкуствено генерирана личност, виртуален човек, който „чете“ подаденото от GPT-3.

 

 

Не се замисля, никъде не „му се чупи“ нито мисълта, нито граматиката… напълно нереално, нали? За съжаление (поне засега) само на английски, постепенно с пълния си капацитет и на другите големи езици. Как се стигна дотук?

GPT-3 е езиков генератор с отворен код. Продукт на компанията OpenAI, неправителствена организация, която се занимава с изследвания в областта на изкуствения интелект. Създадена е през 2015-а от Елън Мъск и съмишленици, които заедно даряват над милиард долара. Идеята е да влезе в пряка конкуренция с проекта DeepMind на Google (аргументите на Мъск защо е важна тази конкуренция ви разказахме тук).

Генераторът е представен за първи път в смутните карантинни времена от лятото на 2020-а и може би затова не получава изцяло заслуженото внимание извън техническите среди. А и по някакъв начин, случайно или не, му липсва медийният чар на другите зрелищни проекти от „света на Мъск“.

 

GPTочно

Не му липсват обаче амбицията и погледът надалеч.

GPT-3 по същество е просто платформа. Има удобен вариант, чрез който други проекти да си взаимодействат с нея – да ѝ задават задачи и да получават отговори – точно както са направили и журналистите от „Гардиън“, и създателят на видеото с интервюто по-горе.

Зад платформата пък се крие невронна мрежа – софтуер, устроен на принципа на човешкия мозък, способен да се учи, обработвайки огромни обеми от информация. Година по-рано е представен предшественикът GPT-2, който също умее да създава достатъчно убедителен текст със свой стил. Само че докато „баткото“ може да обработва 1,5 милиарда параметри, за №3 те са 175 милиарда. А когато говорим за моделирането на езици… с извинение, но размерът има голямо значение.

За да стане ясно какво точно значат тези цифри: невронните мрежи са алгоритми. Те не са програми в класическия софтуерен смисъл на думата, а значително по-гъвкави софтуерни платформи, които се самообучават. В основата е моделът – начинът, по който невронната мрежа разчита, систематизира, усвоява и използва информацията, за да изпълни целта, която ѝ е поставена. А споменатите числа са на параметрите, които невронната мрежа се опитва да оптимизира, докато се обучава.

gtp-3

Снимка: Evgeny Tchebotarev, Pexels

 

Да приказваш на китара

Генераторът сам по себе си е новина, защото работи наистина добре. Но оттук нататък, основният плюс на такъв тип технологии е, че позволяват да се включат различни специалисти и екипи, които да покажат пълния му потенциал. Защото той работи успешно на базата на поставени задания, но какви са те, зависи от проектите, които ще го надградят.

Всъщност той може да изпълнява само една-единствена задача. Колко скучно на фона на мултифункционалните устройства, с които се заобикаляме, нали? GPT-3 създава нещо, което може да бъде изразено като езикова структура на базата на поставената му цел.

Достатъчно е да дадеш основни направления, базов текст, по който алгоритъмът да се води и оттам той заработва и връща резултата си.

Това вече доведе до доста любопитни експерименти.

Например програмистът и човек на изкуството Марио Крингеман, който обича да предизвиква творчеството на алгоритмите, поставя на GPT-3 задачата за създаде текста „Колко е важно да бъдеш в туитър“ в традициите на Джером К. Джером. И резултатът е доста приличен.

После въображението на хората, решили да предизвикат новата платформа, продължава да се вихри с пълна сила. Карат го да се справи с генерирането на китарни акорди по зададена база и… му се получава.

 

Програма програмист

После го предизвикат дори да програмира. Да, логично е, че изкуственият интелект би могъл в недалечна перспектива да отнеме част от предимството на човека в тази толкова модерна професия. Логично, защото в крайна сметка програмирането е създаване на компютърен код, който да дава инструкции на машина как да изпълнява задачи. Тоест – отново машина, алгоритъм, би могъл да се превърне в работещо междинно звено, което да повдигне нивото на абстракция – вече да е достатъчно да му се подадат по-базови параметри и да върне резултат…. Но тази тема е дълга и интересна, скоро очаквайте повече.

Важното е, че в попрището на програмист GPT-3 се оказва също доста талантлив. Първо с генерирането на уеб страници. Програмистът Шариф Шамеем му казва да създаде „бутон на уеб страница като диня“… и резултатът идва. Следват експерименти със същинско програмиране, които дават не прекрасни резултати, но показват, че GPT-3 успешно може да създава база, която после с малко човешки корекции да свърши поставената задача.

 

Ръб робот

По някакъв начин GPT-3 е роднина на алгоритмите, с които всеки ден си взаимодействаме. Например, той е много подобен на това, което представляват търсещите механизми, с които гугъл ни дава точните резултати – според персоналните ни филтри. Разликата е, че резултатът е доста по-лесен за представяне – просто списък с предложения, вместо цялостен текст например. Така че по същество не са новост уменията на невронните мрежи като нашият герой, новината е в това, че той всъщност се оказва наистина добър и убедителен в работата си.

Да, не говорим в никакъв случай за интелигентност от човешки тип, например не бихме могли да го заподозрем в нещо, подобно на човешкия здрав разум. Обаче резултатите, които връща, са доста убедително приличащи на генерирани от човек. Да, може би веднага се сещате за теста на Тюринг. Напълно е възможно GPT-3 да го издържи и все пак е доста далеч от нивото на андроид, с който да си пиете бирата вечер на сладка приказка…

От друга страна, той е и най-голямата по възможности невронна мрежа, създавана от човека до момента. Както обаче казва главният изпълнителен директор на OpenAI Сам Алтман: „Прекалено много се говори за GPT-3. Той е впечатляващ (благодаря за комплиментите!), но има сериозни слабости и понякога прави много глупави грешки. Изкуственият интелект наистина ще промени света, но този проект е само първата искрица в дългия процес“.

gtp-3

Снимка: fabio, Unsplash

 

Роботко бърборко

Сред многото му приложения са чатботове, значително по-убедително имитиращи комуникацията с истински човек (както го видяхте и във видеото по-горе). А също и програмите за по-добър машинен превод.

Всичко това дава безброй нови надежди за бъдещето. За така очакваните пробиви във всички области, за които през последните години възлагаме толкова сериозни очаквания. Които обаче даваха и толкова поводи за притеснения.

Например, доброто възпитание. Като част от модата на последните години на Запад GPT-3 е обвиняван в расизъм, нетолерантност. В невронната мрежа на този етап няма как да бъдат въплътени морални категории – тя обработва това, което ѝ се подава, обучавайки се на базата на входните данни. А когато те са например интернет форуми… няма нужда да се впускаме в подробности колко токсично, грубиянско и нетолерантно е понякога общуването в интернет.

И още нещо: заради всичко казано дотук, невронната мрежа е и чудесен автор на фалшиви новини и дезинформация, особено ако му е поставена конкретно такава цел.

 

GPT-3 обича да чете

Не е напълно ясно какво се случва точно „под капака“ на GPT-3, макар уж да става дума за „отворен ИИ“. Така или иначе, дори самите му създатели казват, че са учудени от много от успешните резултати. Защото той не е създаван с идеята да пише акорди или код, да създава текстове, приличащи на нещо, а да прави само едно нещо: на базата на поредица от думи възможно най-точно да избере следващата.

Невронната мрежа търси шаблоните, повторенията, закономерностите и на базата на тях предполага резултата. В случая – доста успешно.

Състезанието в тази посока е колкото ожесточено, толкова и интересно.

И все пак, алгоритъмът на OpenAI наистина е важна стъпка и съвсем не е чудно, че през последната година все повече привлича погледите на техническите среди.

 

Тенекиеният човек

Самото название GPT-3 на пръв поглед не звучи много маркетингово, какво ще кажете? По принцип произхожда от Generative Pre-trained Transformer – „генеративен, предварително обучен трансформатор“.

„Предварителното му обучение“ ще рече, че той вече е „захранен“ с 570 гигабайта почти случаен текст от интернет, допълнен със специално селектирани от създателите му текстове, включително и от „Уикипедия“. Времето компютърна работа, която е отнело на нашия приятел да прочете и обработи информацията, според OpenAI е струвало 4,6 милиона долара.

Все пак, струва ми се, създателите на алгоритъма много добре знаят защо са решили да оставят това име. Едно псевдочовешко название в духа на Сири и Кортана със сигурност би предизвикало много по-крайни и нежелани асоциации. А тук не е за подценяване и връзката с добрия стар C-3PO, „тенекиения човек“ от „Междузвездни войни“. И нърдовете, които се очаква да се прехласват по такъв тип технологии.

Е, прехласваме се понякога. А най-хубавото е, че с малко късмет и убедителност всеки екип от програмисти може от първо лице да предложи свой вариант, по който да се използва платформата. Или поне скоро ще може, засега проектите се трупат в листа на чакащите, защото ресурсите са ограничени, а и проектът все още се води в бета версия. Очевидно създателите му смятат, че има какво да се доизкусурява по него.

Но пък може да опитате как се справя и вие. Повече от 300 са проектите, които го ползват за различни цели. Онлайн има вече доста платформи, които предлагат да „поговорите“ с чатбот, зад който се крие днешният ни герой. Може би пък не е лошо да свикваме малко по малко за времето, когато наистина ще можем да си говорим с машините като с приятели. Въпрос на време е, може би, да ги научим и да пият бира…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист на свободна практика и писател. Още за мен – четете тук.
Дигитални истории

Най-нови публикации:

Кой изобрети тостера? Няма такава история!

Кой изобрети тостера? Няма такава история!

Сигурно сте чували за Алън Макмастърс, прословутия изобретател на тостера? Опитвайки се да намери идеалната сплав за електрически крушки, той неволно получил вещество, което карало хляба да кафенее...

повече информация
Рори и рецептите на Баба

Рори и рецептите на Баба

Какво ли прави един татуиран американец на борда на 40-годишна лада, устремен към поредното българско село? А какво ли съдържа коктейлът „Компютър“? Защо гражданинът на щата Вашингтон избира да...

повече информация
Айнщайн се прекланя пред Дънов? 12 клишета от българската история

Айнщайн се прекланя пред Дънов? 12 клишета от българската история

Първият християнски манастир е у нас. Пловдив е най-старият град на Земята. Айнщайн се прекланя пред Петър Дънов, а Хан Тервел е спасителят на Европа. Нещо повече, никога не сме губили военен флаг....

повече информация
ИИ влезе сред най-добрите на втори поетичен конкурс (експеримент)

ИИ влезе сред най-добрите на втори поетичен конкурс (експеримент)

Сред модерните новини на деня – изборите, Big Brother и внезапното нахлуване на есента, някак си в обществения дневен ред се вмъкна вестта, че в престижния конкурс за младежка поезия „Веселин...

повече информация

От рубриката:

Тест: Колко добре познавате българската история? Ще ви подхлъзне ли ChatGPT?

Тест: Колко добре познавате българската история? Ще ви подхлъзне ли ChatGPT?

15 общоприети твърдения за българската история и 15, измислени от изкуствения интелект. Ще успеете ли да ги различите? Кое е исторически факт и кое – безсмислица?
Днес, както никога, спорим за миналото си. Намираме силните исторически моменти, които ни карат да се гордеем, но лесно залитаме и по измислената история.
Можем ли да различим историческите факти от измислиците? Хайде да проверим заедно. 15 твърдения, генерирани от ChatGPT за българската история (и проверени от историк) и 15, които алгоритъмът измисли, помолен да пофантазира. 15 от твърденията са верни, 15 – изцяло измислени от изкуствения интелект.
С този тест започва историческата поредица от Дигитални истории. Ще поговорим с историка Александър Мошев за големите клишета онлайн, ще съберем поуките от някои любопитни фалшификации в мрежата. Ще дадем думата на писателите Виктория Бешлийска и Захари Карабашлиев, на учителя по история и куиз рекордьор Борис Русев. А междувременно сте вие – ще успеете ли да различите фактите от измислиците?
Колко добре познаваме историята си? Нека проверим заедно, а накрая ще обобщим резултатите.

Можете да се включите и в жребий за награди – подбрани книги и фланелки с логото на Дигитални истории. Отговорите се събират до символичния 10 ноември, а на 15-и очаквайте резултатите.
Благодаря от сърце за всяко попълване, за всяко споделяне!

повече информация
Какво мислят българите за изкуствения интелект? (Резултати)

Какво мислят българите за изкуствения интелект? (Резултати)

След дълго събиране на отговори в мащабната анкета на Дигитални истории дойде време да обобщим резултатите! Какво мислят българите за изкуствения интелект? Впечатлява ли ги напредъкът му и използват ли го ежедневно? Със страх или с ентусиазъм посрещат следващите големи стъпки в тази посока? Вярват ли, че е възможен генерален изкуствен интелект? Смятат ли, че през следващите години ни очакват мащабни промени? Дойде време да разберем на базата на безпристрастния поглед на данните!

повече информация
Бай Ганьо срещу ChatGPT. Ще гласувате ли?

Бай Ганьо срещу ChatGPT. Ще гласувате ли?

След броени дни се задават 7-ите поредни избори за Народно събрание само в рамките на 3 години. Вероятно е активността да е още по-ниска от рекордите, които не спираме да подобряваме, по всичко изглежда, че в Парламента ще влязат още повече партии.
Как да излезем от омагьосания кръг? Защо политиката у нас се превърна в толкова неблагодарно и непрестижно занимание? Къде са лидерите, които да ни вдъхновяват и за които да гласуваме с гордост, а не като за най-малкото зло? Къде са програмите, идеите, визионерството? Ясните политически позиции, принципите… Толкова ли е трудно в крайна сметка?
Разбира се, отговорите е редно да дават специалистите – политолози, социолози, общовойскови коментатори с важни гледни точки. И те ги дават всяка сутрин по телевизиите и целодневно онлайн, но всичко резултира в чесане на езици и допълнително разделяне, подпомогнато от технологиите.
Така че избирам да дам думата на два безспорни авторитета – Бай Ганьо, който така и не иска да си отиде – ще се убедите по цитатите, с които Алеко ни разказва толкова много за политиката по нашите ширини и отношението към нея. И, разбира се, на ChatGPT, чиято най-нова версия обещава да е още по-добра и близка до човешките отговори.

повече информация

Най-новите:

Българският литературен Банкси

Българският литературен Банкси

„Най-опасният литературен терорист у нас“. Не, тези думи за днешния ни гост не са мои, а на специалист, който следи и познава отблизо случващото се в българската литература.
Ето че след 153 интервюта, публикувани на този сайт, дойде времето за… първия анонимен гост! Няма да ви издам дори дали е мъж, или жена, важни тук са историята и гледната му точка.
Преди броени дни в два поетични конкурса генерирани от ИИ стихове попаднаха сред най-добрите, във втория случай ставаше дума за експеримент на Дигитални истории. Според мен е жизненоважно да започнем дискусията за бъдещите ни взаимоотношения с технологиите, при това с участието на колкото може повече важни гледни точки. Очаквайте следващите забележителни гости (и експерименти) по темата.
Днес обаче се връщаме още преди модата на ИИ генерирането. За да разкажем историята на един човек, който дълго време експериментира с това да изпраща компилирани или просто абсурдни стихове под различни имена. Дълго време преди това той е участвал и печелил конкурси с истинското си име, докато… не се убеждава, че нещо в системата не е наред. Че критериите не са това, което би трябвало да бъдат. Идеята му се променя с годините, особено след като успява да постигне серия от убедителни резултати и безброй публикации в много от смятаните за водещи поетични издания у нас.
Каква ли е целта му? Как изглежда според него бъдещето на поезията? Как алгоритмите променят отношението ни към писаното слово и към творчеството? Очаква ни забележителна среща с първия анонимен гост на Дигитални истории, българския литературен Банкси.

повече информация
Кой изобрети тостера? Няма такава история!

Кой изобрети тостера? Няма такава история!

Сигурно сте чували за Алън Макмастърс, прословутия изобретател на тостера? Опитвайки се да намери идеалната сплав за електрически крушки, той неволно получил вещество, което карало хляба да кафенее до съвършен загар. Уви, след тежка вечер в компанията на половин шише уиски, неговият конкурент Стивън Кромптън откраднал начинанието му и го представил за свое. После обрал цялата слава. И покрай това доста пари…
Дълъг репортаж за него показаха по BBC, „Уошингтън таймс“ описа невероятната му история, „Дейли Мирър“ включи името му сред „50-те най-велики британски изобретатели“. Често го споменават и до днес на Световния ден на тостера – 27 февруари. Статии, сборници, енциклопедии разказват историята му. Дори в популярен британски готварски формат му посвещават състезание, участниците трябва да измислят забележително блюдо в чест на изобретателя на тостера.
Малката подробност е, че… няма такъв човек. Изобретателят Макмастърс е „изобретен“ от двама студенти, решили да покажат колко е важно днес да проверяваме информацията, особено тази, свързана с миналото. Колко лесно даваме доверие онлайн и колко по-критични би трябвало да бъдем. Измислената страница в Wikipedia просъществува почти десетилетие, преди истината да излезе наяве.
Колко лесно е днес да се създаде фалшива история? Отговора дава специалният списък, в който самата англоезична Уикипедия разказва за най-дълго просъществувалите фалшиви публикации.
За мащабни мистификации и дребни, неочаквано случили се шеги. Които идват да ни припомнят колко лесно може да бъдем подведени онлайн.

повече информация
Рори и рецептите на Баба

Рори и рецептите на Баба

Какво ли прави един татуиран американец на борда на 40-годишна лада, устремен към поредното българско село? А какво ли съдържа коктейлът „Компютър“? Защо гражданинът на щата Вашингтон избира да търси старите български рецепти из затънтените села, там, където е „Баба“, събирателното, вечното на един безкраен, универсален образ, който докосва всички ни?
Рори Милър с днешна дата преоткрива магията на българското село. Онова, което изоставяме, а пази толкова от смисъла.
Строителен работник, берач на маслини и учител по английски, преди около 15 години Рори спира в България, за да се родят тук двете му деца. Привлича погледите с участието си в “Masterchef”, после продължава пътя си из затънтените български села. Така се ражда забележителната книга „На око“, сюрреалистичен пътепис, където точни рецепти няма да намерите – и за гозби, и за бъдещето, всичко е „на око“ като мерна единица и начин на живот. Но ще намерите и самото село, и гозбите му, и бабите, и духа, и добре премерените подправки.
Следващата стъпка на американеца е книгата да се появи на английски с кампания в платформа за споделено финансиране. Аз лично ще го подкрепя, защото мисля, че е уловил безценния дух на българското село днес. Което е различно от онова на Елин Пелин и Иван Вазов. Което, вярвам, ще обърне сбъркана мода, че животът е в големия град. Светът на технологиите ни позволява както никога да разбиваме стереотипите. Припомня ни го и книгата на колоритния Рори, който има какво да ни каже и в следващите редове.

повече информация
Айнщайн се прекланя пред Дънов? 12 клишета от българската история

Айнщайн се прекланя пред Дънов? 12 клишета от българската история

Първият християнски манастир е у нас. Пловдив е най-старият град на Земята. Айнщайн се прекланя пред Петър Дънов, а Хан Тервел е спасителят на Европа. Нещо повече, никога не сме губили военен флаг.
Кое от твърденията, които можете да намерите всеки ден онлайн, има историческа обосновка? Къде можем да говорим за различни тълкувания, къде поводът за гордост има пълно основание и къде става дума за откровена измислица?
Историята е толкова важна област, която ни събира и дели. Щедро поле за гордост и за манипулации.
Вие можете ли да различите някои общоприети твърдения, свързани с българската история, от такива, измислени от изкуствения интелект? Опитайте тук, този експеримент ще даде интересни резултати!
А ние ще проверим някои от най-популярните твърдения, поводи за гордост онлайн, които можете да видите навсякъде. Не, няма да фактчектваме, според мен тази идея е обречена, защото и историята, както журналистиката, не може да бъде точна наука.
Срещаме се с историка Александър Мошев, за да поговорим на базата на изворите и на логиката, да се опитаме да потърсим рационалния поглед. Аз му подавам без предварителни условия 12 избрани клишета, а той ще разкаже повече за тях и за това доколко съвпадат с мнението на днешната историография.

повече информация
Кое лекува историческите рани?

Кое лекува историческите рани?

Историята днес ни свързва и дели, разпалва и вълнува, както никога преди. Разбира се, и защото, „който контролира миналото, контролира бъдещето“.
Захари Карабашлиев с най-новия си роман – „Рана“ се обърна именно към българската история, към едни от най-драматичните ѝ и важни моменти. Към раните, които ни нанася миналото, към предците, чийто път продължаваме. Романът наднича в няколко от големите теми на последните 150 години по вълнуващ и автентичен начин. Писателят вече ми е гостувал, срещаме се отново, за да поговорим за миналото. За силните му истории и вълнението. За поуките и отговорите. За това, което ни събира и което ни дели.

повече информация
ИИ влезе сред най-добрите на втори поетичен конкурс (експеримент)

ИИ влезе сред най-добрите на втори поетичен конкурс (експеримент)

В литературните среди отекна новината, че в престижния конкурс за младежка поезия „Веселин Ханчев“ сред избраните от журито финалисти е попаднал неочакван състезател – 21-годишният Христиан Папазов от силистренското село Ножарево е изпратил стихове, генерирани от изкуствен интелект. Христиан (или който и да стои зад това име) се отказа от участието си, пишейки, че единствената му цел е била да привлече вниманието към темата.
Не знам дали вярвате в съвпадения, аз – не. На 25 октомври, ден преди новината да излезе, бяха обявени 10-те избраници на журито в друг популярен поетичен конкурс. И ето че отново в селекцията попаднаха… генерирани стихове. Този път като част от експеримент на Дигитални истории.
Но как така само за два дни двама „автори“ със стихове, написани от ИИ, се озоваха сред най-добрите, тези, измежду които ще бъдат избрани победителите? И, по-важното: кои са големите въпроси и изводи от това? Вярваме или не в съвпадения, явно е, че е дошло време да поговорим по-адекватно и задълбочено за големите въпроси на днешния ден.
Денят на будителите според мен е точният, за да се събудим…

повече информация
Share This