Колко е IQ-то на ChatGPT?

мар. 20, 2025 | Истории

Колко е IQ-то на ChatGPT?

20 март 2025 | Истории

Какви ли не хобита имат хората – някои колекционират марки, други – евро, трети дори имат търпението да гледат български футбол. Е, аз освен че имам навика да проверявам нищожните си познания в телевизионни куизове, имам и още едно – да подлагам на съмнение, да експериментирам, да търся различни от шаблонните гледни точки към модерните технологии.

Какъв е коефициентът на интелигентност на напредналия изкуствения интелект?

Достига ли, надминава ли средните 100 точки на днешното човечество? Адекватен критерий за оценка на напредъка ли са тестовете, с които се открояват най-интелигентните хора на планетата? (Където, впрочем, българка е начело на вечната класация.)

Хайде да проверим заедно!

 

Ентелект

Сигурно ви се е случвало да сте разочаровани от приятел. Е, на мен ми се случи преди няколко седмици. Реших да изправя ChatGPT (нека ме има за приятел, когато стане още по-умен) на куиз състезание срещу някои от безспорните победители в състезанието „Последният печели“. Преди година с Атанас Атанасов бяхме направили подобен експеримент – включихме електронния умник в надпреварата и той зае почетното четвърто място от 11 отбора! Сега решихме да видим колко са напреднали моделите и изправихме срещу шампионите флагмана на OpenAI. Предвкусвах как ще победи всички с огромна разлика… а резултатът се оказа трагикомичен (вижте тук).

Защо стана така? Моделите се справят по-зле, въпреки че според новините от ИИ света всеки следващ е все по-изумяващ с уменията си? Какво се случи?

Все още нямам обяснение за себе си. Затова реших отново да подложа на съмнение въпросния „приятел“. Дали този път отново ще ме „предаде“?

 

Колко е IQ-то на ChatGPT?

 

Всеки от ума си пати

Шегувам се, далеч съм от идеята да приема алгоритъм за приятел (макар че скоро ще ви разкажа историята за ИИ, който бе пуснат „от затвора“, за да прави секс, та… човек не знае).

Този експеримент отлагах дълго, предпочитам да правя опити, които измислям сам, или за които ми давате идея вие (тук). Попаднах на статия, проверяваща IQ нивото на „приятеля“ ми преди точно 2 години, при това не къде да е, а в Scientific American. Тя наистина ме изуми! Авторът – финландски психолог, беше дал на алгоритъма част от класическия тест на Векслер за определяне на интелигентността и резултатът беше цели 134 точки! Алгоритъмът, при това в онези му далечни от съвършените по възможностите си версии се беше оказал по-интелигентен от огромна част от хората! Или, ако говорим в цифри, ИИ се беше оказал в най-горния 1% най-интелигентни „хора“ на планетата!

Редно е да уточня, че в случая бяха подадени само въпросите, които могат да бъдат формулирани под формата на текст – така Ека Ройванен беше задал само 5 от 11-те теста в колекцията.

 

Колко е IQ-то на ChatGPT?

 

По-умният отстъпва

И все пак: „вербалният коефициент на интелигентност на ChatGPT е 155, което е повече от 99,9% от участниците в теста, които съставляват американската стандартизационна извадка WAIS III от 2450 души. Тъй като чатботът не разполага с необходимите очи, уши и ръце, той не може да се справи с невербалния подтест. Но скалите за вербален коефициент на интелигентност и за пълен коефициент на интелигентност са силно корелирани в стандартизираната извадка, така че ChatGPT изглежда много интелигентен по всички човешки стандарти“, написа още авторът.

Сега обаче новите модели приемат и обработват прекрасно и изображения, справят се на български толкова добре, че не ги отличават дори водещи литератори… Така че решавам да нямам никаква милост, особено към предател (шегувам се, ChatGPT!)! Този път вече е време да се направи истинския тест така, както го правят хората. Какво ли ще се случи?

 

Смислов

Темата как точно тестваме колко „добри“ са моделите е огромна и щекотлива дори за научните среди (както вече е ставало дума). Всички сме чували за теста на Тюринг, но… изобщо не е толкова просто. Има огромен брой критерии, по които се оценяват различните модели. През последните месеци българският институт INSAIT показва забележителни сравнения в тази посока. Въпреки това критериите за интелигентност на машините стават по-безбройни и от тези за измерване на човешката интелигентност. Те обаче имат и предимство – учат се целенасочено да ги изпълняват, затова всяка следваща поредица от конкретни задачи се оказва бързо по силите на поредното поколение алгоритми. Това няма как да се случи при нас, хората.

Ето защо се спирам на традиционния тест, по който с развитието на цивилизацията сме се примирили, че ще мерим човешката интелигентност.

За съжаление, няма как да дам на ChatGPT същинския тест на МЕНСА, който е утвърден и у нас, и по света като безспорен стандарт. Той се провежда при строги условия, в присъствието на психолог и никой освен психолозите няма достъп, така че резултатите да са сигурни. Човек може да го държи само два пъти в живота си!

 

Колко е IQ-то на ChatGPT?

 

Ти па си много умен

Най-близкото до него, с което разполагам, е тестът, даден като пример от самата организация на умните у нас и подготвен от норвежкото ѝ подразделение (ще го намерите тук). 35 въпроса точно по логиката на истинския тест, 25 минути.

Кой от моделите на ChatGPT би се представил най-добре? Кой да знае, ако не те самите! Питам „състезателя“ и той избира двама свои представители – ChatGPT-4o и o1 – единия като най-добър за широк кръг задачи, другия – заради умението му да търси логика. Няма проблем, ще тествам и двамата. Повече участници – по-точни резултати! (За пореден път е важно да спомена, че експериментите ми са журналистически и в никакъв случай нямат претенциите за дори далечна научна стойност.)

Копирам изображението от всяка задача, давам го на алгоритъма и го моля да даде отговора си, без никакви допълнителни обяснения. После нанасям. Да, моят „човек“ се справя доста бързо при тези условия, минали са само 7 от 25-те позволени минути, формата ме пита дали съм абсолютно напълно сигурен и убеден, че не искам да ползвам останалото време. Не, нямам търпение! Изпращам отговорите. Гений или интелектуален парий ще се окаже ChatGPT?

 

Къде започва пътят към надеждата

Е, ще почакаме малко за отговора. Формата ми съобщава, че резултатът е под 100 точки и не може да бъде по-подробна в аргументите си.

Колко е IQ-то на ChatGPT?

Добре, може би вторият вторият ще даде точен резултат.

Уви, резултатът е същият.

Дали наистина, както пише и във формата, не става дума за софтуерен проблем? Преди време с ChatGPT се състезавахме в „българския тест на Тюринг“ – матурата по литература, успях да го победя. Тук какво ли ще се случи, ако се включа и аз?

Признавам, не се старая прекалено, уморен съм (всички така казват, знам) и все пак получавам резултат, че коефициентът ми на интелигентност е 130.

(А е повече. Честна програмистска! Освен че имам документ за 148 единици, писаха го даже във вестника, като бях млад:

)

Но друг е въпросът. Дали наистина ChatGPT се е провалил? Под 100 дали значи 20 или 99 точки? Колко точно е интелигентен днес изкуственият интелект?

 

Казва ли ти някой?

Не, няма да се предам толкова лесно. Заравям се онлайн и намирам най-убедителния онлайн тест.

Колко е IQ-то на ChatGPT?

Да, срещу 30 лв. (не съм от тези колекционери, ще ги прежаля) ще мога да изправя състезателя срещу вариант на споменатия вече тест на Векслер. Тук, сигурен съм, резултат ще има, дори да е отрицателен, все пак струва пари.

Колко е IQ-то на ChatGPT?

Този път героят ни получава 20 въпроса, отново в познатата логика за визуален елемент, който завършва поредицата. Пак не се заглеждам или замислям, просто пускам изображенията, връщам отговорите и накрая…

Получавам сертификат!

 

Колко е IQ-то на ChatGPT?

 

Извинявайте, разбира се, не аз, а ChatGPT.

100 точки!

Това си е доста солиден резултат. Да, знам, че резултатите не са официални по никакъв начин, но все пак е забележително.

 

Гладен няма да остане

Алгоритъмът получава точно резултата, който се води усреднена стойност за цялата човешка популация.

Нали се сещате, че говорим за технология, която допреди няколко години дори самите създатели не смятаха за резонно да наричат „изкуствен интелект“, застраховайки се с неутралния термин „машинно самообучение“? Същите алгоритми, които се справяха трагично на редки езици като българския. И които обещават до края на тази година да са способни да решават всяка една задача по-добре от най-подготвените в нея представители на човешкия вид…

Задават се интересни времена!

 

Ум патки пасе

Дал съм все пак 30 лв., получавам и по-подробни данни за това къде се намира „моят човек“, в кои области се е представил отлично и в кои – задоволително. Разбира се, не е изненадващо, че е водещ със скоростта, за която е решил задачите. Това е една от големите разлика – ние, хората, можем да решим теста за средно 100 точки за 25 минути (ако въпросникът е подготвен, както би трябвало), той обаче е много по-бърз.

Важно е да отбележим и друго – използвам общ модел, който не е трениран конкретно за подобни задачи. Точно както 100 единици IQ са стандартът за всякакви хора. Тоест, ако брутално грубо съотнесем двете стойности, днес ChatGPT е толкова „интелигентен“, колкото сме и ние. И ако кавичките си стоят с пълна сила за тази дума, то скоро ще научите причината от поредната дигитална история.

 

Колко е IQ-то на ChatGPT?

 

5 са основните области, които проверява този тест. Най-добре моят приятел (този път не ме предаде!) се е представил в дедуктивното търсене на смисъл, най-слабо – в намирането на числова логика. Никак не е изненадващо, елементарните сметки през последните години често се оказват ахилесовата пета на ИИ.

 

Колко е IQ-то на ChatGPT?

 

Надявам се и вие ще се позабавлявате колко изостава ChatGPT в този тест от Чарлз Дарвин, че дори от ерудити като Дрейк и Джъстин Бийбър. Но пък всички знаем кой точно се смее най-добре.

 

Колко е IQ-то на ChatGPT?

 

Добре, няма да го правим астронавт, поне преди следващите поколения ИИ, които ще се справят още по-добре и на този, и на всеки следващ тест.

Редно е отново да уточня – тук просто ChatGPT, в случая моделът o1, получи изображение, което определено не е силната му страна. И въпреки че не му беше лесно, очевидно се справи.

 

Клуб 100

IQ 100. Звучи толкова нереално закръглено, че чак нагласено. Но пък, както пише Милан Кундера, „само случайността може да се тълкува като послание“.

 

Колко е IQ-то на ChatGPT?

 

Много ли е, или малко това? Какво означава за всички ни като вид? Защо интелигентността не трябва да спира да бъде цел и посока?

По тези и много други важни въпроси очаквайте следващите Дигитални истории. А по пътя на интелигентността ще продължим в интервю с националния психолог на МЕНСА.

Бъдете умни и търсещи! В едно съм убеден, само така можем да оцелеем…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е...

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така. Няма да се уморя да повтарям,...

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или...

повече информация
От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

Ти си това, което четеш – вярвам аз. Също така вярвам, че празници като Деня на будителите са повод да се замислим. И за себе си, и за книгите, и за пробуждането, от което се нуждаем във връзката си...

повече информация
Не изпускай автобуса! За ползата от отворените данни

Не изпускай автобуса! За ползата от отворените данни

Щом настане есен, София започва да се задъхва от трафика на стотиците хиляди коли, за които не е подготвена. А всички ние започваме да си задаваме почти риторичния въпрос дали няма как това да се...

повече информация
„Не, сега не е за поезия“!

„Не, сега не е за поезия“!

„Поезия, написана с помощта на изкуствен интелект“. Що е то? ИИ ли я пише сам? Дали зависи от заданието на човека? Или пък двамата намират начин да продължат заедно, така че да създадат нещо...

повече информация

Още публикации по темата:

От рубриката:

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така.
Няма да се уморя да повтарям, че ти си това, което четеш. В навечерието на Деня на будителите изпратих на 30 забележителни за мен личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Получих цели 20 отговора, като днес имам удоволствието да ви представя втората половина от отговори (първата е тук)! Отново ще отбележа, че не са групирани по определена логика, защото се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

Изпратих на 30 забележителни за мен ИТ личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Гответе се за взривяване на стереотипи!
Получих цели 20 отговора, които имам удоволствието да ви представя! Те отново ме изумиха с пъстротата, с разнообразието и дълбочината си. С това, че ми дадоха доста идеи за следващи четива, които да добавя в списъка си в Goodreads. Днес ви представям препоръките на първите десетима гости, след седмица ще дойде време и за останалите. Не са групирани по определена логика, просто се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
„Не, сега не е за поезия“!

„Не, сега не е за поезия“!

„Поезия, написана с помощта на изкуствен интелект“. Що е то? ИИ ли я пише сам? Дали зависи от заданието на човека? Или пък двамата намират начин да продължат заедно, така че да създадат нещо следващо, нещо различно? Така, както е било винаги до момента…
Вярвам, че си струва тeзи въпроси да си задават колкото може повече хора. И да потърсят своите отговори. Защото по-добрата версия на бъдещето минава само и единствено през този разговор.
Apollo ex Machina се казва конкурсът за поезия, генерирана с помощта на ИИ, организиран от Дигитални истории и издателство Scribens. Можете да се включите в него тук до 1 декември, правилата са максимално опростени.
Може ли така да се родят нови, различни, неочаквани, красиви стихове? От човека ли зависи, или от алгоритъма?

повече информация

Най-новите:

„Ако е красиво, има ли значение, че е написано от ИИ?“

„Ако е красиво, има ли значение, че е написано от ИИ?“

Има ли място за поезия в епохата на TikTok и изкуствения интелект? Как да върнем това изкуство на заслужения пиедестал? Могат ли и трябва ли да бъдат инфлуенсъри днешните поети? Плашещо или мечтано е времето, в което изкуственият интелект вече не може да бъде разделен от поезията?
Apollo ex machina – така се казва първият у нас конкурс за поезия, създадена с помощта на изкуствен интелект. Сега е моментът да се включите! Заглавието на начинанието е специално, а негов автор е днешният ни гост. Освен член на журито на конкурса, той е и управител на издателство Scribens, което ще издаде в стихосбирка най-добрите стихове от него.
Георги Гаврилов е поет и… физик. Създава издателство Scribens, за да дава шанс на млади български автори да стигнат до читателите си.

повече информация
Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Ще има ли български автор? Книжните препоръки на ИТ лидерите III

Бихте ли предположили, че българските ИТ лидери четат „Хари Потър“ или пък Достоевски? Аз не бих, поне допреди седмица, когато ги попитах и се оказа, че е точно така.
Няма да се уморя да повтарям, че ти си това, което четеш. В навечерието на Деня на будителите изпратих на 30 забележителни за мен личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Получих цели 20 отговора, като днес имам удоволствието да ви представя втората половина от отговори (първата е тук)! Отново ще отбележа, че не са групирани по определена логика, защото се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

„Инженери ще се търсят винаги. Но уменията ни трябва да се променят“

Работата в софтуерния свят вече се промени из основи с идването на изкуствения интелект. Не вярвам, че някой би го оспорил, независимо дали в положителен или отрицателен аспект, с ентусиазъм или отвращение, с нетърпение за бъдещето или опит да останем в миналото.
Колко обаче са различни нещата и докъде ще стигнат?
Джемал Ахмедов ще ни покаже отговорите на 29 ноември в уъркшопа на conf.ai. Той ще впрегне ИИ агентите, които ще заработят като цял софтуерен екип.
Преди това обаче е време да поговорим. За хаотичното настояще и неясното бъдеще на софтуерния свят в годините на напредналия изкуствен интелект. „Винаги ще имаме човек в процеса по създаване на софтуер“, казва Джемал. Така ли е наистина?

повече информация
От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

От Достоевски до Хари Потър. Какво четат българските ИТ лидери?

Изпратих на 30 забележителни за мен ИТ личности кратка покана – да препоръчат 3 свои любими книги на читателите на Дигитални истории. Постарах се палитрата от гости да е възможно най-пъстра – от хора на лидерски позиции до такива, познати като лектори; от работещи отвъд океана до чужденци, които секторът е довел в България; представители на най-пъстри технологии и на различни поколения.
Гответе се за взривяване на стереотипи!
Получих цели 20 отговора, които имам удоволствието да ви представя! Те отново ме изумиха с пъстротата, с разнообразието и дълбочината си. С това, че ми дадоха доста идеи за следващи четива, които да добавя в списъка си в Goodreads. Днес ви представям препоръките на първите десетима гости, след седмица ще дойде време и за останалите. Не са групирани по определена логика, просто се оказаха прекалено пъстри и неочаквани, за да е възможно, предлагам ви ги в поредността, в която ги получих.
Приятно четене!

повече информация
Не изпускай автобуса! За ползата от отворените данни

Не изпускай автобуса! За ползата от отворените данни

Щом настане есен, София започва да се задъхва от трафика на стотиците хиляди коли, за които не е подготвена. А всички ние започваме да си задаваме почти риторичния въпрос дали няма как това да се промени? Повече хора да ползват градския транспорт, колелата си… Ползите от това ги знаем много добре.
Градският транспорт, уви, често е неудобен. Макар уж да е свързан с най-модерните онлайн платформи, това не ни помага достатъчно. Казвам го от първо лице, като човек, който се придвижва с колело, с автобус и едва когато е неизбежно се качва на автомобила.
Платформи като Google Maps са безценни за това да планираш маршрута си, но… почти винаги дават неточни данни кога ще дойде следващият автобус. Не ти казват дали ще е препълнен до шушка, дали няма да е мръсен и неподдържан, дали шофьорът му ще те изчака ведро, или ще се окаже киселяк, готов да хлопне вратата под носа ти.
Това обаче може да се промени и тук отново на помощ идват технологиите. Идеята за отворените данни може да се окаже безценна в това София (а и не само) да се „отпуши“ и да започне да диша. Как? Ще разберете от прелюбопитната история на колегите ми програмисти от фирма „Кодексио“.

повече информация
„Не, сега не е за поезия“!

„Не, сега не е за поезия“!

„Поезия, написана с помощта на изкуствен интелект“. Що е то? ИИ ли я пише сам? Дали зависи от заданието на човека? Или пък двамата намират начин да продължат заедно, така че да създадат нещо следващо, нещо различно? Така, както е било винаги до момента…
Вярвам, че си струва тeзи въпроси да си задават колкото може повече хора. И да потърсят своите отговори. Защото по-добрата версия на бъдещето минава само и единствено през този разговор.
Apollo ex Machina се казва конкурсът за поезия, генерирана с помощта на ИИ, организиран от Дигитални истории и издателство Scribens. Можете да се включите в него тук до 1 декември, правилата са максимално опростени.
Може ли така да се родят нови, различни, неочаквани, красиви стихове? От човека ли зависи, или от алгоритъма?

повече информация
Share This