Идва GPT-4, който обещава да промени всичко

сеп. 16, 2022 | Технологии

Идва GPT-4, който обещава да промени всичко

16 септември 2022 | Технологии

Надали има в света на прословутия изкуствен интелект алгоритъм, по-прочут от GPT-3. Тук можете да прочетете подробно как и защо решението на OpenAI се оказа сериозен пробив в редица области. Той се появи в края на 2020-а и малко по малко даде шанс да изследователи от различни посоки да използват възможностите му, за да покажат невиждани до момента пробиви. В създаването и редактирането на текстове, в превода, в генерирането на компютърен код, за свръхнапреднали чатботове и какво ли още не.

И ето че идва следващият състезател. Макар и забавил се спрямо първоначалните очаквания, GPT-4 се очаква да бъде представен съвсем скоро. Дали от него можем да получим дори много повече? С какво се различава от предшественика си? Кои са областите, в които очакваме да донесе нещо наистина различно?

 

GPT-4

Изображенията, които виждате, са създадени от „детето“ на GPT-3 – DALL·E. Под всяка от тях ще намерите описанието, зададено на алгоритъма. Тук имаме „маслено платно на Анри Матис на робот хуманоид, който играе шах“

 

G пи три

И така, става дума за модел от висшия пилотаж на изкуствения интелект – дълбоките невронни мрежи. Този тип алгоритми стават изключително добри тогава, когато имат достъп до масивни обеми от информация, на базата на които се учат да търсят и намират закономерностите. После изпълняват поставената задача – например да генерират свой текст по зададени параметри.

Съкращението идва от „генеративен предварително обучен трансформатор“, Generative Pretrained Transformer. Всяка от версиите всъщност не е един модел, а група от такива, които имат различно предназначение.

Когато става дума за някои от големите компании, те разчитат на свои алгоритми в това начинание. Големият плюс на OpenAI, както си личи и от името на начинанието, стартирано от Илон Мъск и съмишленици, е, че дава достъп на разнообразни проекти до претренирания модел, който се справя добре с широк кръг задачи. Оттук нататък е работа на отделните екипи да формулират заданието си и да го подготвят така, че да се възползват от уменията на алгоритъма.

Най-впечатляващи бяха успехите във всички области, свързани с текста. GPT-3 беше безспорен пробив, що се отнася до каквито и да било манипулации, свързани с думи. Разбира се, тези възможности бяха преди всичко свързани с английския език. Появиха се приложения, с които невероятно успешно се обработва текст – той бива редактиран, пренаписван в различни стилове и какво ли още не. Оказа се, че платформата работи невероятно добре и в други посоки – например генерирането на компютърен код или ноти. Всичко, което по някакъв начин може да бъде сведено до писмени знаци.

 

GPT-4

„Добър, приятелски настроен робот от Ренесанса“

 

G(PT)enius

А също и в наподобяването – например в провеждането на разговор.

Дали и следващият член на GPT семейството ще донесе подобен пробив, но в следващите области? Това е един от въпросите, които си задават специалистите в областта на изкуствения интелект. Както неотдавна каза футуроложката доц. Мариана Тодорова, от GPT-4 се очакват големи неща. Всички в тази област са наострили уши, докато, за съжаление, конкретните новини за уменията на бъдещия алгоритъм все още остават неясни.

Например, що се отнася до броя на параметрите, с които ще бъде обучен. Данните са ужасно противоречиви. В началото се говореше, че ще са десетки трилиони, после трилион… докато накрая се оказва, че е по-вероятно да става дума за дори по-малко входни данни, отколкото тези, с които беше обучен предшественикът му.

GPT-1 дойде през 2018-а, година по-късно пристигна и наследникът му, който беше обучен на 1,5 милиарда параметъра. Прословутият вариант 3 беше представен през 2020-а със своите 175 милиарда единици информация. Така четвъртата версия се бави от ритъма на пускане на останалите, а ето че учудва и по другия водещ показател…

 

GPT-4

„Два робота обсъждат бъдещето, реалистично изображение“

 

G си ти

В началото, покрай еуфорията, дошла с налагането на третата версия, се говореше, че последващата я ще бъде обучена със 100 трилиона параметъра и с това за първи път ще бъде достигнат броят на синапсите – връзките между невроните, които всеки от нас приютява в мозъка си. А ето, че крачката ще бъде по-скоро назад – към дори по-малко от 175-те милиарда.

По-скоро ще се разчита на по-развити алгоритми. И на по-внимателен подбор на това какво точно ще съдържат данните за самообучение.

Факт е, че закономерностите в тази посока до момента изглеждаха незаобиколими. Дълго време развитието на невронните мрежи се забавяше от невъзможността на компютрите да обработват данните в обемите, които са им нужни. После, някак естествено, хардуерът напредна и стана ред на софтуера да го настигне. Защото се оказа, че обемът има значение за това да подобрява резултатите само тогава, когато е смислено подаден. Когато невронните мрежи се учат не на базата на телефонния указател, а на повече и повече текстове, които обаче са смислено структурирани.

Новината, че GPT-3 ще бъде обучен на по-малко параметри дойде от думите на изпълнителния директор на OpenAI Сам Алтман, който, за съжаление, рядко дава интервюта по темата. Той каза още, че макар базата, с която бъдещият алгоритъм ще бъде „захранен“, да е по-скромна, той ще е значително по-сложен от своя предшественик. Обучението му ще изисква значително по-голяма изчислителна мощ, но той ще се справя с много повече поставени задачи.

 

GPT-4

„Много интелигентен и симпатичен андроид, който има чувства“

 

Размерът…

Така или иначе, GPT-3 и до момента, макар безспорно да е най-известният, далеч не е изкуственият интелект, който държи първенството по брой параметри, на които е обучен. Gopher например е „прочел“ 280, PaLM – 540 млрд.

Обучението е най-ключовата част от работата на дълбоките невронни мрежи. В началото те са просто поредици от алгоритми, които не са способни да решават задачи. Трябва да бъдат „захранени“ с максимално голям обем информация, на базата на който да свикнат да намират закономерностите, да търсят важните фактори, да дават повече тежест на тези части от мрежата, които се оказват по-показателни.

Дълго време изглеждаше, че взаимовръзката е пряка – колкото повече са данните, толкова по-прецизни са резултатите. Според много от учените обаче вече сме постигнали предела от това данните да има смисъл да растат като обем, докато е много по-важно как точно работят алгоритмите, каква е архитектурата на невронната мрежа.

 

GPT-4

„Маслена картина на Ван Гог на робот хуманоид, който пие бира“

 

G(PT) точка

Важно уточнение, което трябва да направим, е, че що се отнася до дълбоките невронни мрежи, уви, ние знаем твърде малко за конкретния начин, по който функционират. Те са затворена, черна кутия, поредица от слоеве алгоритми, за които знаем само входните и изходните данни. Можем да им влияем с различни допълнителни параметри, но като цяло как точно са били обучени от приемането на данните си остава енигма. Какво се случва „вътре“, кои параметри ги „вълнуват“, все още са важни и недостатъчно отговорени въпроси, за които се търсят нестандартни решения (като например „дълбокия сън“).

Някъде тук идва следващият голям въпрос: ако GPT-4 в крайна започне да дава точен отговор във все повече области, дали той няма да е и поредната стъпка към евентуалния бъдещ генерален изкуствен интелект? Или поне ще е нещото, което все повече го наподобява.

Още нещо любопитно, което вече се знае за GPT-4, е, че той отново ще бъде обучаван само с текст. През последните години станаха популярни начинанията, при които се търси мултимодалност – данните, които се подават, са не само текст, но и изображения, звуци, видео. Популярен и впечатляващ пример в тази посока е DALL·E – алгоритъмът, който създава изумителни изображения на базата на описание.

И въпреки това… DALL·E също се крепи на плещите на GPT-3, това е алгоритъмът, „изрисувал“ картините, които виждате. Защото се оказва, че невронната мрежа е способна на чудеса и когато е обучена допълнително. Да, ИИ художникът е обучен на базата на връзка между текст и изображение, но само като форма на надграждане над чисто текстовия алгоритъм. Той е своеобразен специфичен вариант на GPT-3, каквато е и платформата за генериране на компютърен код Codex.

Много специалисти очакваха, че и GPT екипът ще се насочи в тази посока. И все пак, за момента се оказва, че е по-ефективно да се получават успешни решения на широк кръг проблеми, като за основа се използва единствено текст. Което е странно, доколкото невронните мрежи би трябвало да наподобяват мозъците ни, които, разбира се, са „захранвани“ с много по-разнообразна информация. Очевидно идеята на OpenAI е да развият докрай възможностите на текстовите модели, преди да се пренасочат към още по-сложното мултимодално бъдеще.

 

GPT-4

„Умен и чувствителен робот андроид, създаден по време на Ренесанса“

 

В началото беше текстът

В тази посока е любопитно мнението на Иля Суцкевър, изследователят начело на учените в OpenAI. Още през 2020-а той прогнозира, че „до края на 2021-а езиковите модели ще започнат да разбират и визуалния свят. Сам по себе си текстът може да изразява огромен обем информация за заобикалящия ни свят, но не е завършен, защото също така ние живеем и във визуален свят“.

И след като няколко пъти става дума колко е важна точната информация, любопитно е да погледнем каква всъщност е тя. За GPT-4 все още можем само да предполагаме, но това е известно за неговия известен предшественик.

Над 90% от данните, с които той е захранен, са от англоезични източници, което обяснява и защо алгоритъмът е толкова добър конкретно на „родния“ си език. Целият обем данни е с размер 45 терабайта, можете да си представите колко много текст може да се побере вътре. Най-голяма част от тях – 410 милиарда единици са от колекцията Common Crawl, свободно достъпна база данни, която сканира и запазва информацията от целия интернет. Тоест, именно там попадат и най-разнообразните текстове. На тази база се падат и цели 60% от тежестта – това какво значение им отдава алгоритъмът. 22% идват от база, където се събират публикации в Reddit, събрали поне 3 положителни гласа.

GPT-3 е „чел“ от две бази данни общо 67 милиарда думи, събрани в различни книги, с общо „тегло“ 16%. Най-малко – 3 милиарда, са единиците, които са въведени от англоезичната Wikipedia, те все пак имат значително по-високо за пропорцията тегло от 3%.

Интересен повод да се замислим… ами ако създателите му бяха дали да „чете“ повече книги и по-малко случайни текстове?

 

GPT-4

„Много разумен и готин андроид, който се държи като човек“

 

Ти си GPT

Всичко това дава и още поводи за замисляне какво ни очаква с идването на 4-ата версия. Ако 4-ия GPT наистина е значително по-съвършен алгоритъм, той например би могъл да е способен изключително бързо да генерира неразличими от истината фалшиви видеа, по-известни като дийп фейк. Или пък текстове, масиви от информация, които няма да могат да бъдат различени от създадените от човека. Ако чатботовете все още могат лесно да бъдат хванати „в крачка“, дали сега няма да станат още по-убедителни?

Така идват и следващите важни въпроси, които постоянно гостуват на „Дигитални истории“. За бъдещето ни като хора, за технологиите, които могат и променят всичко, колкото и да сме скептични понякога. Интересното бъдеще отдавна е тук и става все по-интересно. А несъмнено част от голямата картина съвсем скоро ще бъде и GPT-4 – натоварен с огромни очаквания и надежди… и, разбира се, задължителната в тази тема щипка притеснение.

А кое трябва да бъде повече? Очаквайте следващата Дигитална история! С проф. Преслав Наков, един от световните специалисти в областта на ИИ и обработката на естествени езици, заедно ще вперим поглед в бъдещето!

 

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

Изкуственият интелект е неоправдан медиен шум или големият фактор, който ще промени бъдещето ни като вид? Ще отвори невероятни възможности пред хората, или ще превърне света в дигитален концлагер?...

повече информация
Петко Динев, който дава „очи“ на НАСА

Петко Динев, който дава „очи“ на НАСА

Българин и екипът му създават камери, с чиято помощ НАСА е насочила поглед към Луната, а после и към Марс. Неговите разработки се използват от всички най-големи авиационни компании, а освен че вече...

повече информация
„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е...

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така. Няма да се уморя да повтарям,...

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или...

повече информация

Още публикации по темата:

От рубриката:

Не изпускай автобуса! За ползата от отворените данни

Не изпускай автобуса! За ползата от отворените данни

Щом настане есен, София започва да се задъхва от трафика на стотиците хиляди коли, за които не е подготвена. А всички ние започваме да си задаваме почти риторичния въпрос дали няма как това да се промени? Повече хора да ползват градския транспорт, колелата си… Ползите от това ги знаем много добре.
Градският транспорт, уви, често е неудобен. Макар уж да е свързан с най-модерните онлайн платформи, това не ни помага достатъчно. Казвам го от първо лице, като човек, който се придвижва с колело, с автобус и едва когато е неизбежно се качва на автомобила.
Платформи като Google Maps са безценни за това да планираш маршрута си, но… почти винаги дават неточни данни кога ще дойде следващият автобус. Не ти казват дали ще е препълнен до шушка, дали няма да е мръсен и неподдържан, дали шофьорът му ще те изчака ведро, или ще се окаже киселяк, готов да хлопне вратата под носа ти.
Това обаче може да се промени и тук отново на помощ идват технологиите. Идеята за отворените данни може да се окаже безценна в това София (а и не само) да се „отпуши“ и да започне да диша. Как? Ще разберете от прелюбопитната история на колегите ми програмисти от фирма „Кодексио“.

повече информация
Apollo ex machina. Включете се в конкурса за поезия, генерирана с ИИ!

Apollo ex machina. Включете се в конкурса за поезия, генерирана с ИИ!

Включете се в Apollo ex machina – първия български конкурс за генерирана поезия, организиран от Дигитални истории и издателство Scribens!
Няма ограничения за тематиката и дължината. Единственото изискване е да участвате със стихове, които сте създали с помощта на ИИ. Можете да изпратите до 3 произведения, срокът е 1 декември 2025 г.
Победителят ще получи награда от 300 лв., избрани книги очакват заслужилите второ и трето място, а най-добрите стихове ще бъдат издадени в стихосбирка от Scribens!
Ще ги избере авторитетно жури: поетите Петър Чухов, Бойко Ламбовски и Виолета Кунева, управителят на Scribens Георги Гаврилов и създателят на Дигитални истории Георги Караманев.

повече информация
Що за „човек“ е ИИ? Психологически експеримент

Що за „човек“ е ИИ? Психологически експеримент

Каним четири най-популярни ИИ модела в кабинета на психолога, за да проверим какви „личности“ ще се окажат!
Властни или податливи на влияние, чувствителни или прагматични? Какви са по „характер“ GPT-5, Claude Opus 4.1, Gemini 2.5 Pro и o3?
Този експеримент може да ни каже много!

повече информация

Най-новите:

Виж ти! Когато гледането стане изкуство

Виж ти! Когато гледането стане изкуство

Да виждаш и да разпознаваш вече не е обективно умение и наука. Технологиите и хората вече не са способни да ни доказват кое произведение е човешко и кое – не, с достатъчна степен на убеденост, че да има смисъл. Тогава не е ли време да погледнем на гледането, на търсенето на истината, на проверката на факти… като на изкуство?
В една сумрачна зала неколцина млади лекари са се скупчили пред прожекционен екран. Но не, на него не се показват рентгенови снимки, нито лабораторни резултати, залата не е в болница или университет, а… в музей. Докторите разглеждат репродукции на картини от разни епохи – от Гоя, та до древноегипетски статуи.
Жената отпред им обяснява, че целта е да анализират какво виждат, сякаш е медицински случай. На екрана се появява хаотична мозайка от сиви, черни и бели „лепенки“. „Това е прочуто произведение на изкуството“, подсказва тя. Следва неловка тишина. „Испанско е, на един от най-известните художници на XX век…“ Накрая един от лекарите се престрашава: „Пикасо?“.
Оказва се прав – пред тях е „Герника“, емблематичната картина за ужасите на войната, която никой от присъстващите досега не е разпознал. Младите медици, потънали досега в учебници по биохимия и дежурства в болницата, изведнъж са изправени пред задача от съвсем различно естество – да търсят знаци, символи и истории, скрити в изкуството. Но защо им е нужно? Оказва се, че по неочакван начин това умение може да им помогне да откриват и анализират по-добре симптомите на своите пациенти.

повече информация
ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

ИИ – революция или маркетингов шум? Мнението ви е важно! (анкета)

Изкуственият интелект е неоправдан медиен шум или големият фактор, който ще промени бъдещето ни като вид? Ще отвори невероятни възможности пред хората или ще превърне света в дигитален концлагер? Вашето мнение е изключително важно и ще съм благодарен от сърце, ако го споделите в кратка анкета! Очакват ви и награди – избрани книги!
Отговорите се събират до 31 декември. Можете да изберете въпросите, на които да отговорите. Анкетата е анонимна.
Всяко попълване, всяко споделяне е безценна помощ за това да видим как се отнасяме днес към голямата технологична тема на нашето време!

повече информация
Петко Динев, който дава „очи“ на НАСА

Петко Динев, който дава „очи“ на НАСА

Българин и екипът му създават камери, с чиято помощ НАСА е насочила поглед към Луната, а после и към Марс. Неговите разработки се използват от всички най-големи авиационни компании, а освен че вече са „стъпвали“ на нашия спътник, летят и на хиляди спътници в орбита.
Петко Динев през 90-те заминава за Флорида, където започва работа в НАСА. После създава своя компания, която се откроява на световно ниво с опита си в създаването на промишлени камери.
Пътят му тръгва от Казанлък – той е първият български златен медалист по физика и ученик на знаменития Теодосий Теодосиев – Тео. Гостът ни е и сред главните герои в новия документален филм „Социално силните“, даващ думата на златните медалисти от школата на Тео.
Как човек случайно стига до НАСА? Как един учен създава компания, превърнала се в световен еталон в своята индустрия? Как можем да променим това, че днес половината ученици от гимназията, която е завършил, не успяват да изкарат и тройка на матурата по математика? Как да превърнем науката в мода и да дадем шанс на технологиите? Как да наваксаме изоставането си като хора от огромното им развитие? Огромни въпроси имаме да обсъждаме с този изключителен събеседник.
„Да, живеем в интересни времена. Даже може би твърде интересни. Аз не мисля, че сме стигнали предела на технологиите. Мисля, че сме още в увертюрата…“

повече информация
„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Има ли място за поезия в епохата на TikTok и изкуствения интелект? Как да върнем това изкуство на заслужения пиедестал? Могат ли и трябва ли да бъдат инфлуенсъри днешните поети? Плашещо или мечтано е времето, в което изкуственият интелект вече не може да бъде разделен от поезията?
Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е днешният ни гост. Освен член на журито на конкурса, той е и управител на издателство Scribens, което ще издаде в стихосбирка най-добрите стихове от него.
Георги Гаврилов е поет и… физик. Създава издателство Scribens, за да дава шанс на млади български автори да стигнат до читателите си.

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така.
Няма да се уморя да повтарям, че ти си това, което четеш. В навечерието на Деня на будителите изпратих на 30 забележителни за мен личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Получих цели 20 отговора, като днес имам удоволствието да ви представя втората половина от отговори (първата е тук)! Отново ще отбележа, че не са групирани по определена логика, защото се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или отвращение, с нетърпение за бъдещето или опит да останем в миналото.
Колко обаче са различни нещата и докъде ще стигнат?
Джемал Ахмедов ще ни покаже отговорите на 29 ноември в уъркшопа на conf.ai. Той ще впрегне ИИ агентите, които ще заработят като цял софтуерен екип.
Преди това обаче е време да поговорим. За хаотичното настояще и неясното бъдеще на софтуерния свят в годините на напредналия изкуствен интелект. „Винаги ще имаме човек в процеса по създаване на софтуер“, казва Джемал. Така ли е наистина?

повече информация
Share This