OpenAI представи нов инструмент за оценка на способностите на своите модели ChatGPT, наречен GDPval, който измерва колко добре ИИ се справя с „икономически ценни задачи от реалния свят“ в полето на 44 професии.
Целта е да се оцени потенциалът на моделите на базата на реални резултати, а не на догадки.
Според OpenAI „най-добрите съвременни модели вече се доближават до качеството на работа, извършвана от експерти в индустрията“.
Очертават се 44 професии, в които ИИ може да окаже най-голямо влияние върху продуктивността. Сред тях са тези на адвокати, фармацевти, частни детективи и служители в сферата на обслужването на клиенти. В изследването се дават конкретни примери за това как ИИ може да е полезен: финансовите анализатори могат да разчитат на него за анализ на конкурентната среда, медицинските сестри – за оценка на кожни лезии, а агентите по недвижими имоти – за създаване на маркетингови брошури.
В тестовете моделът Claude Opus 4.1 на Anthropic се представя най-добре, следван от GPT-5, който се отличава с точността си. По-мощната версия GPT-5-high достига резултати равни или по-добри от експертите в над 40% от задачите, докато GPT-4o - едва 13,7%.
OpenAI подчертава, че ИИ няма да замести изцяло човешкия труд, а ще подпомага хората в ежедневната им работа. Въпреки това, индустрията отдавна се стреми към автоматизация и намаляване на разходите, което поражда скептицизъм относно истинските цели на компаниите.
Въпреки впечатляващите резултати, ИИ инструментите все още имат проблеми – особено с халюцинациите и непредсказуемостта при по-дълги или комплексни задачи.
OpenAI признава, че „повечето работни места са нещо повече от сбор от добре дефинирани задачи“ и че ИИ засега е най-ефективен при повтарящи се и ясно специфицирани дейности, отбелязва Futurism.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
С ескалацията на конфликта страни от Персийския залив спешно търсят българска спецпродукция
Цените на торовете създават риск за реколтата
Украйна даде данни за повредата на "Дружба" на европейски представители
Happy стана генерален спонсор на спектакъла „Кораб в сърцето“
ЕЦБ очаквано не промени лихвите, но влоши прогнозите си за инфлацията заради нарастващата несигурност
"Дронамикс" планира първите си търговски полети тази година по маршрут София-Русе
Спипаха над 30 пияни и 6-ма дрогирани шофьори за ден
Съдът отхвърли искането за експертиза на запис с Кьовеши пред ЕП по делото срещу Петков
Циклонът "Нарел" приближава Австралия с ветрове до 260 км/ч
Столичната община започна мащабно почистване на фасади и площади
Историческо! Клубовете от Висшата лига с единодушно решение!
Левски получи двоен стимул в битката с Лудогорец за титлата
Мъри дава живец на Гьоз-Гьоз в базата
Голяма новина за ЦСКА и Лудогорец, Левски също е замесен
Бити от Сенегал на финала: "Служебните" от Мароко празнуват "титлата"
Локо Пловдив се похвали с историческо събитие + СНИМКИ
Дневен хороскоп за 20 март, петък
Катерина Иванова: Основният симптом при жените с ендометриоза, е изключително болезнена менструация
Вкусна рецепта с риба за Благовещение
Тест с карти: Какво ще се промени в живота ви до една година?
Време е за приказки!
7 храни с повече протеин от яйцата
Депутатите приеха единния електронен билет за различни видове транспорт
Над 4700 са кандидатите за власт на вота за 19 април
Над 35 000 заявления за гласуване в чужбина са подадени до момента
"Проклятието" на еврото застигна и риболовния билет
Данъчните ще ни следят с изкуствен интелект
Евакуираха цял блок в Добрич заради пожар
Мистериозна огнена сфера в небето над САЩ предизвика паника
Откриха нови луни около Сатурн и Юпитер
Защо НАСА отложи извеждането на ракетата за мисията „Артемис II“
Агонията на кометата C/2025 K1 ATLAS се превърна в неочакван подарък за науката
Астронавтът от Starliner Бъч Уилмор разказа за преживения ужас в орбита
Рядко явление в Атлантическия океан: Морски гиганти са забелязани на неочаквано място