OpenAI представи нов инструмент за оценка на способностите на своите модели ChatGPT, наречен GDPval, който измерва колко добре ИИ се справя с „икономически ценни задачи от реалния свят“ в полето на 44 професии.
Целта е да се оцени потенциалът на моделите на базата на реални резултати, а не на догадки.
Според OpenAI „най-добрите съвременни модели вече се доближават до качеството на работа, извършвана от експерти в индустрията“.
Очертават се 44 професии, в които ИИ може да окаже най-голямо влияние върху продуктивността. Сред тях са тези на адвокати, фармацевти, частни детективи и служители в сферата на обслужването на клиенти. В изследването се дават конкретни примери за това как ИИ може да е полезен: финансовите анализатори могат да разчитат на него за анализ на конкурентната среда, медицинските сестри – за оценка на кожни лезии, а агентите по недвижими имоти – за създаване на маркетингови брошури.
В тестовете моделът Claude Opus 4.1 на Anthropic се представя най-добре, следван от GPT-5, който се отличава с точността си. По-мощната версия GPT-5-high достига резултати равни или по-добри от експертите в над 40% от задачите, докато GPT-4o - едва 13,7%.
OpenAI подчертава, че ИИ няма да замести изцяло човешкия труд, а ще подпомага хората в ежедневната им работа. Въпреки това, индустрията отдавна се стреми към автоматизация и намаляване на разходите, което поражда скептицизъм относно истинските цели на компаниите.
Въпреки впечатляващите резултати, ИИ инструментите все още имат проблеми – особено с халюцинациите и непредсказуемостта при по-дълги или комплексни задачи.
OpenAI признава, че „повечето работни места са нещо повече от сбор от добре дефинирани задачи“ и че ИИ засега е най-ефективен при повтарящи се и ясно специфицирани дейности, отбелязва Futurism.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
Великобритания забрани политическите дарения в криптовалута
Henkel придобива бранда за коса Olaplex в сделка за 1,4 млрд. долара
Зукърбърг, Елисън и Хуанг влизат в новия технологичен съвет на Тръмп
Samsung Galaxy S26 Ultra – премиум смартфон, носещ повече сигурност и AI възможности
BASF открива завод в Китай за 11,6 млрд. долара на фона на пазарната нестабилност
М. Маринов: Активно участие в динамичен подфонд гарантира по-висока втора пенсия
Йотова: Прошката е единственият път към траен мир и по-добро бъдеще
20 евро помощ за горивата: Как се кандидатства и кой може да я получи
Fibank подкрепя кампанията "Сканирай лапата" в защита на животните
Камерите за средна скорост превъзпитаха шофьорите: Идва ли краят на джигитите на пътя?
ПСС: Турист почина в района на хижа "Грънчар"
По-скъп Великден: Агнетата ни намаляват, внасяме от Гърция и Румъния
България се вълнува от мача със Соломоновите острови
Намалиха влиянието на батерията за квалификацията в Япония
0 евро за ЦСКА: Европейски шампион прилапва Ето'о
Бостън удари шампионите и спря победната им серия
Хари Магуайър удари рамо на уволнения Рубен Аморим
Бонус в битката за титлата! Голяма радост в Левски
Нумерологична прогноза за април 2026
10 тайни за стила, които модните експерти крият
Ледени билкови кубчета – при торбички под очите и за сияйна кожа
8 храни и напитки с диуретичен ефект
Нумерологична прогноза за 26 март
Дневен хороскоп за 26 март, четвъртък
68 пожара са потушили огнеборците за денонощие в страната
Община Варна не може да намери здравен медиатор
От утре: Варна е младежка фолклорна столица на България
Акциите срещу купения вот в страната продължават
Спартак II (Варна) приема Доростол Силистра
Без паника! Изтребители летят тренировъчно в североизточната част на страната
Междузвездният обект 3I/ATLAS може да съдържа остатъци от извънземно гориво
„Джеймс Уеб“ и „Хъбъл“ заснеха смяната на сезоните на Сатурн
В окото на бурята: Учен разказва какво е да попаднеш в торнадо
Китай изпробва гъвкав робот за зареждане на сателити в орбита (видео)
Откриха мистериозни пирамиди в Антарктида: Чии следи са скрити под снега и леда
Плюшена играчка, пусната от стратосферата, постави нов световен рекорд (видео)