OpenAI представи нов инструмент за оценка на способностите на своите модели ChatGPT, наречен GDPval, който измерва колко добре ИИ се справя с „икономически ценни задачи от реалния свят“ в полето на 44 професии.
Целта е да се оцени потенциалът на моделите на базата на реални резултати, а не на догадки.
Според OpenAI „най-добрите съвременни модели вече се доближават до качеството на работа, извършвана от експерти в индустрията“.
Очертават се 44 професии, в които ИИ може да окаже най-голямо влияние върху продуктивността. Сред тях са тези на адвокати, фармацевти, частни детективи и служители в сферата на обслужването на клиенти. В изследването се дават конкретни примери за това как ИИ може да е полезен: финансовите анализатори могат да разчитат на него за анализ на конкурентната среда, медицинските сестри – за оценка на кожни лезии, а агентите по недвижими имоти – за създаване на маркетингови брошури.
В тестовете моделът Claude Opus 4.1 на Anthropic се представя най-добре, следван от GPT-5, който се отличава с точността си. По-мощната версия GPT-5-high достига резултати равни или по-добри от експертите в над 40% от задачите, докато GPT-4o - едва 13,7%.
OpenAI подчертава, че ИИ няма да замести изцяло човешкия труд, а ще подпомага хората в ежедневната им работа. Въпреки това, индустрията отдавна се стреми към автоматизация и намаляване на разходите, което поражда скептицизъм относно истинските цели на компаниите.
Въпреки впечатляващите резултати, ИИ инструментите все още имат проблеми – особено с халюцинациите и непредсказуемостта при по-дълги или комплексни задачи.
OpenAI признава, че „повечето работни места са нещо повече от сбор от добре дефинирани задачи“ и че ИИ засега е най-ефективен при повтарящи се и ясно специфицирани дейности, отбелязва Futurism.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
Г-20 прие декларация въпреки бойкота на САЩ
Потребителите вече не избират между магазини и онлайн търговия, а искат комбинация от двете
Климатичната среща COP30 завърши със сделка, от която много страни са недоволни
Представители на САЩ, Украйна и ЕС преговарят в Женева по мирния план на Тръмп
Защо Америка печели надпреварата при улавянето на въглерод?
След като обяви, че НАТО е в „мозъчна смърт“, Макрон предвижда и края на Г-20
"Чу Брица": Групата, която превръща фолклора в нещо взривяващо модерно (ВИДЕО)
"Добруджа" измъкна точка от "Локомотив" (Пд) вкъщи
Обедна прогноза
"Провираме се като глисти": Протест пред общината в София заради зоните за паркиране
Ключова седмица за Бюджет 2026: Опозицията готви блокада на входовете на парламента
Бурята "Фина" връхлетя Австралия с 205 км/ч, хидяли домакинства са без ток
Ковач се сопна: "Не ни отписвайте!“
Макларън няма да обжалва наказанието
Добруджа и Локо (Пловдив) поделиха точките
Посрещаме Белгия за Купа "Дейвис"
Първите 10 коли във Вегас са били проверени
Александър Димитров: Победата над Грузия тушира напрежението
Поверия за 24 ноември – Света Екатерина
Какви промени ви носи новата 2026 според датата на раждане
Седмична таро прогноза за 24 – 30 ноември
20 знака, че някой не обича да помага
Дневен хороскоп за 23 ноември, неделя
Таро карта за 23 ноември, неделя
Протести обхващат страната през следващата седмица
Няма пряка връзка между цената на пшеницата и тази на хляба
Мъж загина блъснат от Влак край Мездра
Владислав Горанов: ОИК-Варна взе разумно решение за Коцев
Тръмп е с 1,1 млрд. долара по-беден
ИПИ: Варна е пример как образованието дава стимул за развитие
Изключителни темпове и мащаби на загуба на лед при ледника Хектория
От НАСА предупреждават: Големите американски градове потъват
Пилот на United Airlines: Самолетът бе ударен от космически отпадъци
Съществуването на НЛО „вече не е под въпрос“, твърди американски режисьор
Спорите на мъха оцеляват 9 месеца в космически вакуум
Морските костенурки притежават мистериозна суперсила