OpenAI представи нов инструмент за оценка на способностите на своите модели ChatGPT, наречен GDPval, който измерва колко добре ИИ се справя с „икономически ценни задачи от реалния свят“ в полето на 44 професии.
Целта е да се оцени потенциалът на моделите на базата на реални резултати, а не на догадки.
Според OpenAI „най-добрите съвременни модели вече се доближават до качеството на работа, извършвана от експерти в индустрията“.
Очертават се 44 професии, в които ИИ може да окаже най-голямо влияние върху продуктивността. Сред тях са тези на адвокати, фармацевти, частни детективи и служители в сферата на обслужването на клиенти. В изследването се дават конкретни примери за това как ИИ може да е полезен: финансовите анализатори могат да разчитат на него за анализ на конкурентната среда, медицинските сестри – за оценка на кожни лезии, а агентите по недвижими имоти – за създаване на маркетингови брошури.
В тестовете моделът Claude Opus 4.1 на Anthropic се представя най-добре, следван от GPT-5, който се отличава с точността си. По-мощната версия GPT-5-high достига резултати равни или по-добри от експертите в над 40% от задачите, докато GPT-4o - едва 13,7%.
OpenAI подчертава, че ИИ няма да замести изцяло човешкия труд, а ще подпомага хората в ежедневната им работа. Въпреки това, индустрията отдавна се стреми към автоматизация и намаляване на разходите, което поражда скептицизъм относно истинските цели на компаниите.
Въпреки впечатляващите резултати, ИИ инструментите все още имат проблеми – особено с халюцинациите и непредсказуемостта при по-дълги или комплексни задачи.
OpenAI признава, че „повечето работни места са нещо повече от сбор от добре дефинирани задачи“ и че ИИ засега е най-ефективен при повтарящи се и ясно специфицирани дейности, отбелязва Futurism.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
Лихвите по потребителски и жилищни заеми намаляха на годишна база през май
Акционерите на „Булметал“ са гласували 0,06 евро брутен дивидент на акция
Вучич обръща нова политическа глава с оттеглянето си от президентския пост
Станислав Опаранов: Риск за бизнеса е използването на Shadow AI
България е сред страните в ЕС с най-малка данъчна тежест при заплатите
ЕС и Китай определиха краен срок през октомври за изглаждане на търговските спорове
Жертвите по пътищата: След всяка трагедия обещания, след това - още загинали
Българин преби приятелката си във Виена и заплаши да я убие
Емануил Йорданов за скандала "Баба Алино", екстрадицията на Мавродиев и Невзоров
Хаджигенов за смяната на ВСС: ГЕРБ на квадрат, само че със зелени чорапи
Сабаленка и Андреева започнаха успешно похода си на „Уимбълдън“
Бразилия възкръсна от ада! "Селесао" пречупи Япония след инфарктна драма
ПО МИНУТИ: Бразилия – Япония 2:1
Дешан отсече: Имаме самочувствие, но не прекалено
ФИФА с ключово решение за дузпите на Мондиал 2026
Посрещнаха Кличко с аплодисменти и много детски смях на „Герена“
Орлин Павлов се завърща към клубното звучене с новия си сингъл "САМ"
Дневен хороскоп за 30 юни, вторник
10 гръцки рецепти, от които ще си оближете пръстите
Пълнолуние в Козирог на 30 юни: Какво да очаква всяка зодия
20 закона на Мърфи за живота
Гръцка салата с паста – рецепта
Коя е най-голямата грешка на шофьорите в трафика?
Първо заседание на Съвета за реформи в туризма ще се проведе в Министерския съвет
Добра реколта на ечемик и пшеница в Добружда
Черно море започна седмицата с двуразови тренировки
12-годишна спаси майка си след инсулт зад волана на АМ „Струма“
Варна бе домакин на Държавното първенство по стрелба с лък за незрящи
Откриха генетична мутация, която може да удължи живота
Калисто: Луната, която може да се превърне в бъдеща база на НАСА
„Изгубеният град“: Може ли подводна планина да разкрие тайната за произхода на живота?
Учени предлагат: Гигантски огнени торнада да почистват нефтени разливи в океана
НАСА разработва технология за презареждане в орбита за мисии в далечния космос
Китайската космическа станция прелетя над Луната: Илюзия или реалност? (снимки)