OpenAI представи нов инструмент за оценка на способностите на своите модели ChatGPT, наречен GDPval, който измерва колко добре ИИ се справя с „икономически ценни задачи от реалния свят“ в полето на 44 професии.
Целта е да се оцени потенциалът на моделите на базата на реални резултати, а не на догадки.
Според OpenAI „най-добрите съвременни модели вече се доближават до качеството на работа, извършвана от експерти в индустрията“.
Очертават се 44 професии, в които ИИ може да окаже най-голямо влияние върху продуктивността. Сред тях са тези на адвокати, фармацевти, частни детективи и служители в сферата на обслужването на клиенти. В изследването се дават конкретни примери за това как ИИ може да е полезен: финансовите анализатори могат да разчитат на него за анализ на конкурентната среда, медицинските сестри – за оценка на кожни лезии, а агентите по недвижими имоти – за създаване на маркетингови брошури.
В тестовете моделът Claude Opus 4.1 на Anthropic се представя най-добре, следван от GPT-5, който се отличава с точността си. По-мощната версия GPT-5-high достига резултати равни или по-добри от експертите в над 40% от задачите, докато GPT-4o - едва 13,7%.
OpenAI подчертава, че ИИ няма да замести изцяло човешкия труд, а ще подпомага хората в ежедневната им работа. Въпреки това, индустрията отдавна се стреми към автоматизация и намаляване на разходите, което поражда скептицизъм относно истинските цели на компаниите.
Въпреки впечатляващите резултати, ИИ инструментите все още имат проблеми – особено с халюцинациите и непредсказуемостта при по-дълги или комплексни задачи.
OpenAI признава, че „повечето работни места са нещо повече от сбор от добре дефинирани задачи“ и че ИИ засега е най-ефективен при повтарящи се и ясно специфицирани дейности, отбелязва Futurism.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
Украйна търси с какво да замени Patriot заради постоянния дефицит на ракети
Кризата в Иран може да нанесе най-тежкия удар на страните от Персийския залив от 90-те
Д. Тодоров: Инфлацията може да се вдигне между 0,5% и 1% при цена на петрола над 100 долара
Dow Jones се понижи с над 750 пункта в новия си най-лош ден за 2026 г.
BMW се стреми към възстановяване в Китай чрез своята серия Neue Klasse
Тръмп замрази 106-годишен закон в САЩ, за да намали цените на бензина
Калин Стоянов сезира прокуратурата за натиск и злоупотреба от Иван Демерджиев
Иран екзекутира трима души, задържани за протестите срещу режима
Сериозни проблеми мъчат Лудогорец
Добра и лоша новина за Левски
Левски получи двоен стимул в битката с Лудогорец за титлата
Голям проблем за Италия в битката за класиране на Мондиал 2026
Спартак Варна – Лудогорец
Рома – Болоня
Време е за приказки!
Нумерологична прогноза за 19 март
Дневен хороскоп за 19 март, четвъртък
Новолуние в Риби на 19 март – мечтаем смело, но не бързаме
Таро карти за април за всяка зодия
Ново начало за 3 зодии на 20 март – пролетното равноденствие
Времето във Варна на 19 март 2026
Честваме паметта на светите мъченици Хрисант и Дария
Литературно събитие събира над 30 артиста в близо 50 срещи във Варна и страната
Деца се запознаха с интересни легенди от Североизтока
Над 1100 учители се обучиха да използват изкуствен интелект в учебния процес
Пета гимназия е №1 по мини футбол за VIII-X клас в „Ученическа купа Варна 2026“
Рядко явление в Атлантическия океан: Морски гиганти са забелязани на неочаквано място
НАСА с необичаен призив: Снимайте градушките!
Ще се превръщат ли роботите-фермери в тор след края на експлоатацията си?
Мощна магнитна буря ще удари Земята между 19 и 22 март
НАСА планира ежемесечни кацания на Луната през 2027 г.
Възможен ли е извънземен живот на луни, реещи се в мрака на Космоса?