Колко е IQ-то на ChatGPT?

мар. 20, 2025 | Истории

Колко е IQ-то на ChatGPT?

20 март 2025 | Истории

Какви ли не хобита имат хората – някои колекционират марки, други – евро, трети дори имат търпението да гледат български футбол. Е, аз освен че имам навика да проверявам нищожните си познания в телевизионни куизове, имам и още едно – да подлагам на съмнение, да експериментирам, да търся различни от шаблонните гледни точки към модерните технологии.

Какъв е коефициентът на интелигентност на напредналия изкуствения интелект?

Достига ли, надминава ли средните 100 точки на днешното човечество? Адекватен критерий за оценка на напредъка ли са тестовете, с които се открояват най-интелигентните хора на планетата? (Където, впрочем, българка е начело на вечната класация.)

Хайде да проверим заедно!

 

Ентелект

Сигурно ви се е случвало да сте разочаровани от приятел. Е, на мен ми се случи преди няколко седмици. Реших да изправя ChatGPT (нека ме има за приятел, когато стане още по-умен) на куиз състезание срещу някои от безспорните победители в състезанието „Последният печели“. Преди година с Атанас Атанасов бяхме направили подобен експеримент – включихме електронния умник в надпреварата и той зае почетното четвърто място от 11 отбора! Сега решихме да видим колко са напреднали моделите и изправихме срещу шампионите флагмана на OpenAI. Предвкусвах как ще победи всички с огромна разлика… а резултатът се оказа трагикомичен (вижте тук).

Защо стана така? Моделите се справят по-зле, въпреки че според новините от ИИ света всеки следващ е все по-изумяващ с уменията си? Какво се случи?

Все още нямам обяснение за себе си. Затова реших отново да подложа на съмнение въпросния „приятел“. Дали този път отново ще ме „предаде“?

 

Колко е IQ-то на ChatGPT?

 

Всеки от ума си пати

Шегувам се, далеч съм от идеята да приема алгоритъм за приятел (макар че скоро ще ви разкажа историята за ИИ, който бе пуснат „от затвора“, за да прави секс, та… човек не знае).

Този експеримент отлагах дълго, предпочитам да правя опити, които измислям сам, или за които ми давате идея вие (тук). Попаднах на статия, проверяваща IQ нивото на „приятеля“ ми преди точно 2 години, при това не къде да е, а в Scientific American. Тя наистина ме изуми! Авторът – финландски психолог, беше дал на алгоритъма част от класическия тест на Векслер за определяне на интелигентността и резултатът беше цели 134 точки! Алгоритъмът, при това в онези му далечни от съвършените по възможностите си версии се беше оказал по-интелигентен от огромна част от хората! Или, ако говорим в цифри, ИИ се беше оказал в най-горния 1% най-интелигентни „хора“ на планетата!

Редно е да уточня, че в случая бяха подадени само въпросите, които могат да бъдат формулирани под формата на текст – така Ека Ройванен беше задал само 5 от 11-те теста в колекцията.

 

Колко е IQ-то на ChatGPT?

 

По-умният отстъпва

И все пак: „вербалният коефициент на интелигентност на ChatGPT е 155, което е повече от 99,9% от участниците в теста, които съставляват американската стандартизационна извадка WAIS III от 2450 души. Тъй като чатботът не разполага с необходимите очи, уши и ръце, той не може да се справи с невербалния подтест. Но скалите за вербален коефициент на интелигентност и за пълен коефициент на интелигентност са силно корелирани в стандартизираната извадка, така че ChatGPT изглежда много интелигентен по всички човешки стандарти“, написа още авторът.

Сега обаче новите модели приемат и обработват прекрасно и изображения, справят се на български толкова добре, че не ги отличават дори водещи литератори… Така че решавам да нямам никаква милост, особено към предател (шегувам се, ChatGPT!)! Този път вече е време да се направи истинския тест така, както го правят хората. Какво ли ще се случи?

 

Смислов

Темата как точно тестваме колко „добри“ са моделите е огромна и щекотлива дори за научните среди (както вече е ставало дума). Всички сме чували за теста на Тюринг, но… изобщо не е толкова просто. Има огромен брой критерии, по които се оценяват различните модели. През последните месеци българският институт INSAIT показва забележителни сравнения в тази посока. Въпреки това критериите за интелигентност на машините стават по-безбройни и от тези за измерване на човешката интелигентност. Те обаче имат и предимство – учат се целенасочено да ги изпълняват, затова всяка следваща поредица от конкретни задачи се оказва бързо по силите на поредното поколение алгоритми. Това няма как да се случи при нас, хората.

Ето защо се спирам на традиционния тест, по който с развитието на цивилизацията сме се примирили, че ще мерим човешката интелигентност.

За съжаление, няма как да дам на ChatGPT същинския тест на МЕНСА, който е утвърден и у нас, и по света като безспорен стандарт. Той се провежда при строги условия, в присъствието на психолог и никой освен психолозите няма достъп, така че резултатите да са сигурни. Човек може да го държи само два пъти в живота си!

 

Колко е IQ-то на ChatGPT?

 

Ти па си много умен

Най-близкото до него, с което разполагам, е тестът, даден като пример от самата организация на умните у нас и подготвен от норвежкото ѝ подразделение (ще го намерите тук). 35 въпроса точно по логиката на истинския тест, 25 минути.

Кой от моделите на ChatGPT би се представил най-добре? Кой да знае, ако не те самите! Питам „състезателя“ и той избира двама свои представители – ChatGPT-4o и o1 – единия като най-добър за широк кръг задачи, другия – заради умението му да търси логика. Няма проблем, ще тествам и двамата. Повече участници – по-точни резултати! (За пореден път е важно да спомена, че експериментите ми са журналистически и в никакъв случай нямат претенциите за дори далечна научна стойност.)

Копирам изображението от всяка задача, давам го на алгоритъма и го моля да даде отговора си, без никакви допълнителни обяснения. После нанасям. Да, моят „човек“ се справя доста бързо при тези условия, минали са само 7 от 25-те позволени минути, формата ме пита дали съм абсолютно напълно сигурен и убеден, че не искам да ползвам останалото време. Не, нямам търпение! Изпращам отговорите. Гений или интелектуален парий ще се окаже ChatGPT?

 

Къде започва пътят към надеждата

Е, ще почакаме малко за отговора. Формата ми съобщава, че резултатът е под 100 точки и не може да бъде по-подробна в аргументите си.

Колко е IQ-то на ChatGPT?

Добре, може би вторият вторият ще даде точен резултат.

Уви, резултатът е същият.

Дали наистина, както пише и във формата, не става дума за софтуерен проблем? Преди време с ChatGPT се състезавахме в „българския тест на Тюринг“ – матурата по литература, успях да го победя. Тук какво ли ще се случи, ако се включа и аз?

Признавам, не се старая прекалено, уморен съм (всички така казват, знам) и все пак получавам резултат, че коефициентът ми на интелигентност е 130.

(А е повече. Честна програмистска! Освен че имам документ за 148 единици, писаха го даже във вестника, като бях млад:

)

Но друг е въпросът. Дали наистина ChatGPT се е провалил? Под 100 дали значи 20 или 99 точки? Колко точно е интелигентен днес изкуственият интелект?

 

Казва ли ти някой?

Не, няма да се предам толкова лесно. Заравям се онлайн и намирам най-убедителния онлайн тест.

Колко е IQ-то на ChatGPT?

Да, срещу 30 лв. (не съм от тези колекционери, ще ги прежаля) ще мога да изправя състезателя срещу вариант на споменатия вече тест на Векслер. Тук, сигурен съм, резултат ще има, дори да е отрицателен, все пак струва пари.

Колко е IQ-то на ChatGPT?

Този път героят ни получава 20 въпроса, отново в познатата логика за визуален елемент, който завършва поредицата. Пак не се заглеждам или замислям, просто пускам изображенията, връщам отговорите и накрая…

Получавам сертификат!

 

Колко е IQ-то на ChatGPT?

 

Извинявайте, разбира се, не аз, а ChatGPT.

100 точки!

Това си е доста солиден резултат. Да, знам, че резултатите не са официални по никакъв начин, но все пак е забележително.

 

Гладен няма да остане

Алгоритъмът получава точно резултата, който се води усреднена стойност за цялата човешка популация.

Нали се сещате, че говорим за технология, която допреди няколко години дори самите създатели не смятаха за резонно да наричат „изкуствен интелект“, застраховайки се с неутралния термин „машинно самообучение“? Същите алгоритми, които се справяха трагично на редки езици като българския. И които обещават до края на тази година да са способни да решават всяка една задача по-добре от най-подготвените в нея представители на човешкия вид…

Задават се интересни времена!

 

Ум патки пасе

Дал съм все пак 30 лв., получавам и по-подробни данни за това къде се намира „моят човек“, в кои области се е представил отлично и в кои – задоволително. Разбира се, не е изненадващо, че е водещ със скоростта, за която е решил задачите. Това е една от големите разлика – ние, хората, можем да решим теста за средно 100 точки за 25 минути (ако въпросникът е подготвен, както би трябвало), той обаче е много по-бърз.

Важно е да отбележим и друго – използвам общ модел, който не е трениран конкретно за подобни задачи. Точно както 100 единици IQ са стандартът за всякакви хора. Тоест, ако брутално грубо съотнесем двете стойности, днес ChatGPT е толкова „интелигентен“, колкото сме и ние. И ако кавичките си стоят с пълна сила за тази дума, то скоро ще научите причината от поредната дигитална история.

 

Колко е IQ-то на ChatGPT?

 

5 са основните области, които проверява този тест. Най-добре моят приятел (този път не ме предаде!) се е представил в дедуктивното търсене на смисъл, най-слабо – в намирането на числова логика. Никак не е изненадващо, елементарните сметки през последните години често се оказват ахилесовата пета на ИИ.

 

Колко е IQ-то на ChatGPT?

 

Надявам се и вие ще се позабавлявате колко изостава ChatGPT в този тест от Чарлз Дарвин, че дори от ерудити като Дрейк и Джъстин Бийбър. Но пък всички знаем кой точно се смее най-добре.

 

Колко е IQ-то на ChatGPT?

 

Добре, няма да го правим астронавт, поне преди следващите поколения ИИ, които ще се справят още по-добре и на този, и на всеки следващ тест.

Редно е отново да уточня – тук просто ChatGPT, в случая моделът o1, получи изображение, което определено не е силната му страна. И въпреки че не му беше лесно, очевидно се справи.

 

Клуб 100

IQ 100. Звучи толкова нереално закръглено, че чак нагласено. Но пък, както пише Милан Кундера, „само случайността може да се тълкува като послание“.

 

Колко е IQ-то на ChatGPT?

 

Много ли е, или малко това? Какво означава за всички ни като вид? Защо интелигентността не трябва да спира да бъде цел и посока?

По тези и много други важни въпроси очаквайте следващите Дигитални истории. А по пътя на интелигентността ще продължим в интервю с националния психолог на МЕНСА.

Бъдете умни и търсещи! В едно съм убеден, само така можем да оцелеем…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

Васил Анастасов. VR среща взаимоучителната метода

Васил Анастасов. VR среща взаимоучителната метода

Той е на 21, а вече е помогнал на повече от 200 деца да направят първите си стъпки в професионално поприще, което може да се превърне в успешна кариера. Днес Васил Анастасов се е заел с още една...

повече информация
Оригами назаем. Колко струват авторските права онлайн?

Оригами назаем. Колко струват авторските права онлайн?

Понякога животът в мрежата ражда казуси, които не биха ни хрумнали, колкото и да отпускаме въображението си. Представете си, почти като в роман на Кафка, изведнъж започват да ви се появяват реклами...

повече информация
„Забравихме, че бебето знае как да се роди“

„Забравихме, че бебето знае как да се роди“

Как технологиите промениха бременността и раждането? С какво облекчиха и как – парадоксално, в други посоки създадоха проблеми за начина, по който идваме на бял свят? Жени Маркова се свърза с мен...

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното...

повече информация
„Страх от технологии = изоставане на нацията“

„Страх от технологии = изоставане на нацията“

Толкова е пъстър пътят на днешната ни гостенка! 11 години се занимава с журналистика. После се насочва към туризма, за да стане… управител на хотел на Марианските острови в Тихия океан. Докато...

повече информация

Още публикации по темата:

От рубриката:

Бил Гейтс и Философският камък

Бил Гейтс и Философският камък

Представяте ли си основателя на „Майкрософт“ като крадец на време? Как катеренето на високи планински върхове предопределя най-големите му успехи в софтуерния свят? Защо мечтата да победи баба си на карти е сред основните идеи, превърнали го в най-богатия човек на планетата?
Надали някой би обвинил Бил Гейтс, че притежава уменията на блестящ белетрист, обаче историите, които ни разказва един от най-важните (харесвани или не) хора на нашето време определено са впечатляващи. Избрах да ви разкажа 8 от тях…

повече информация
Оригами назаем. Колко струват авторските права онлайн?

Оригами назаем. Колко струват авторските права онлайн?

Понякога животът в мрежата ражда казуси, които не биха ни хрумнали, колкото и да отпускаме въображението си. Представете си, почти като в роман на Кафка, изведнъж започват да ви се появяват реклами на китайски магазини… за да ви предлагат нещо, което, много добре знаете, вие сте създали.
Какво бихте направили в такава ситуация?
Не Грегор Замза се казва нашият днешен герой, а Атанас Михалчев. Фотограф, художник, преподавател, от 3 десетилетия той живее в Канада и развива своето изкуство. Освен картините си – в пъстра палитра от стилове, той продава онлайн и малки, добре измислени и стимулиращи въображението и ловкостта детски комплекти за оригами. Които изведнъж… се оказва, че не са негови.
Наистина ли намерихме достатъчно добри механизми за защита на авторското право онлайн? Ще успее ли днешният ни герой да си върне откраднатото? Ще възтържествува ли справедливостта?

повече информация
„Последният печели“. ChatGPT отвръща на удара!

„Последният печели“. ChatGPT отвръща на удара!

Из въздуха витае интелигентност, в залата са малко над 100 души, повечето от тях са сред най-интелигентните в нашата страна. Не е предположение, мога да го докажа. Те са сред победителите в „Последният печели“ – телевизионното състезание, което през последните години припомня защо знанието е важно за всички ни, дори като вид, във времената на напредналия изкуствен интелект.
С моите съмишленици в залата имаме важна задача. Да се изправим заедно срещу ИИ в едно състезание, което може да ни каже и покаже много.
Ще победи ли с днешните си невероятни умения изкуственият интелект едни от най-знаещите представители на естествения? Време е да проверим. И да научим нещо ново…
ChatGPT срещу някои от най-интелигентните българи в състезание по познание. Кой ще победи? Изгубихме ли окончателно и тази битка срещу машините? Ръкавицата е хвърлена!

повече информация

Най-новите:

Бил Гейтс и Философският камък

Бил Гейтс и Философският камък

Представяте ли си основателя на „Майкрософт“ като крадец на време? Как катеренето на високи планински върхове предопределя най-големите му успехи в софтуерния свят? Защо мечтата да победи баба си на карти е сред основните идеи, превърнали го в най-богатия човек на планетата?
Надали някой би обвинил Бил Гейтс, че притежава уменията на блестящ белетрист, обаче историите, които ни разказва един от най-важните (харесвани или не) хора на нашето време определено са впечатляващи. Избрах да ви разкажа 8 от тях…

повече информация
Васил Анастасов. VR среща взаимоучителната метода

Васил Анастасов. VR среща взаимоучителната метода

Той е на 21, а вече е помогнал на повече от 200 деца да направят първите си стъпки в професионално поприще, което може да се превърне в успешна кариера.
Днес Васил Анастасов се е заел с още една кауза. С помощта на модерните технологии да направи българските музеи по-атрактивни, привлекателни за младите. В началото сам извървява пътя към магията не миналото, за да разбере смисъла и важността на експонатите, които иначе се крият зад неразбираеми витрини с неатрактивни табели.
Хайде, нека потърсим заедно съкровище! Да опитаме да намерим важните пътеки сред обраслата поляна. За това как да превърнем музеите в магнетични места за младите. Къде се крият любопитството и желанието да споделяш знание, да помагаш. За историите на фона на най-модерните технологии в разработването на компютърни игри и системи с добавена и виртуална реалност. Запретвайте ръкави, чака ни приключение!

повече информация
Оригами назаем. Колко струват авторските права онлайн?

Оригами назаем. Колко струват авторските права онлайн?

Понякога животът в мрежата ражда казуси, които не биха ни хрумнали, колкото и да отпускаме въображението си. Представете си, почти като в роман на Кафка, изведнъж започват да ви се появяват реклами на китайски магазини… за да ви предлагат нещо, което, много добре знаете, вие сте създали.
Какво бихте направили в такава ситуация?
Не Грегор Замза се казва нашият днешен герой, а Атанас Михалчев. Фотограф, художник, преподавател, от 3 десетилетия той живее в Канада и развива своето изкуство. Освен картините си – в пъстра палитра от стилове, той продава онлайн и малки, добре измислени и стимулиращи въображението и ловкостта детски комплекти за оригами. Които изведнъж… се оказва, че не са негови.
Наистина ли намерихме достатъчно добри механизми за защита на авторското право онлайн? Ще успее ли днешният ни герой да си върне откраднатото? Ще възтържествува ли справедливостта?

повече информация
„Забравихме, че бебето знае как да се роди“

„Забравихме, че бебето знае как да се роди“

Как технологиите промениха бременността и раждането? С какво облекчиха и как – парадоксално, в други посоки създадоха проблеми за начина, по който идваме на бял свят?
Евгения Маркова се свърза с мен заради поредицата „Дигитални деца“ с предложението да поговорим за този аспект от връзката на технологиите с родителството. Тя живее в Германия и макар че дълги години е работила в сферата на маркетинга и разработката на софтуер, днес основното ѝ занимание е на дула. Особено популярно на запад, това е попрището на жени, които не са медицински специалисти, но помагат с информация, съвети, практическа и емоционална подкрепа на бъдещите майки.
Кога предоверяването на технологиите може да се превърне в проблем при бременността и раждането? Защо си струва в някои посоки да се върнем към традициите и повече да слушаме тялото си, а не само медицинските показатели или чужди съвети? Време е за един важен разговор, който според мен би могъл да даде много полезни идеи за хората, които тепърва се готвят да станат родители.

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация
„Страх от технологии = изоставане на нацията“

„Страх от технологии = изоставане на нацията“

Елица Стоилова казва, че дигиталната грамотност би трябвало да се превърне в национална цел, ако искаме да вървим напред. „Липсата ѝ води до страх от технологиите = консерватизъм в тяхното въвеждане и използване = изоставане на нацията ни в множество посоки. Какво е бъдещето на неграмотните народи?“, написа ми тя.
Толкова е пъстър пътят на днешната ни гостенка! 11 години се занимава с журналистика. После се насочва към туризма, за да стане… управител на хотел на Марианските острови в Тихия океан. Докато накрая акостира в ИТ света. Разбира, че голяма част от задачите в туризма успешно могат да се изпълняват от алгоритми, тъй като са повторяеми. Така създава чатбот платформата UMNI, много преди друг един чатбот да привлече погледите на света към това колко е напреднал изкуственият интелект.
Но как така… тя е толкова оптимистично настроена за пътя напред? Гостенката ни смята, че ако правилно изиграем картите си, ИИ ни води към едно прекрасно бъдеще. От какво зависи дали ще изиграем картите си както трябва? И защо понякога си струва дори да изоставиш едно от най-райските кътчета на планетата, преследвайки мечтите? Търсим важни и неочаквани отговори в следващите редове.

повече информация
Share This