Анализ на Epoch AI, неправителствен изследователски институт в сферата на изкуствения интелект, сочи, че индустрията може скоро да не успява да извлича значителни подобрения в производителността от т.нар. разсъждаващи AI модели. Според доклада, напредъкът при тези модели може да се забави още в рамките на следващата година.
Разсъждаващи модели като o3 на OpenAI доведоха до значителни подобрения в различни AI тестове през последните месеци, особено при задачи, свързани с математика и програмиране. Тези модели могат да прилагат повече изчислителна мощ към даден проблем, което подобрява представянето им, но за сметка на по-дълго време за изпълнение спрямо стандартните модели.
Разсъждаващите модели се разработват чрез първоначално обучение на конвенционален модел върху огромно количество данни, след което се прилага техника, наречена обучение чрез подсилване (reinforcement learning), която на практика дава "обратна връзка" на модела относно решенията му при трудни задачи. До момента водещите AI лаборатории, като OpenAI, не са прилагали огромна изчислителна мощ именно на етапа на обучение чрез подсилване, според Epoch.
Това, обаче, се променя. OpenAI заяви, че е използвала около 10 пъти повече изчислителна мощ за обучението на модела o3, отколкото за неговия предшественик o1, и от Epoch предполагат, че по-голямата част от тази мощ е отишла именно за reinforcement learning. Изследователят от OpenAI Дан Робъртс наскоро разкри, че бъдещите планове на компанията предвиждат използване на още повече изчислителни ресурси за обучение чрез подсилване - дори повече, отколкото за първоначалното обучение на модела.
Но според Epoch има горна граница на това колко изчислителна мощ може да се приложи към този етап на обучение. Анализаторът Джош Ю от Epoch - автор на изследването - обяснява, че подобренията в производителността при стандартното AI обучение в момента се увеличават 4 пъти годишно, докато при обучение чрез подсилване растежът е 10-кратен на всеки 3 до 5 месеца. По думите му, напредъкът в обучението на разсъждаващи модели вероятно ще се изравни с общото развитие на водещите модели до 2026 г.
Анализът на Epoch прави няколко допускания и се базира отчасти на публични изявления на ръководители от AI индустрията. В същото време се подчертава, че мащабирането на разсъждаващи модели може да се окаже предизвикателство не само заради изчислителната мощ, но и поради високите постоянни разходи за изследвания, пише dir.bg.
"Ако има постоянни разходи за изследователска дейност, разсъждаващите модели може да не се развият толкова, колкото очакваме", пише Ю. "Бързото мащабиране на изчисленията може да е критично важно за напредъка при тези модели, така че това трябва да се следи внимателно".
Всеки знак, че напредъкът на разсъждаващите AI модели скоро може да достигне граница, вероятно ще предизвика тревога в индустрията, която вече е вложила огромни ресурси в разработването им. Освен това, вече има изследвания, които показват, че тези модели - макар и скъпи за използване - имат сериозни недостатъци, включително склонност да "халюцинират" повече от някои традиционни модели.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.
Meta продължава да бави пускането на новия си AI модел за разработчици
Петролът поевтинява, след като Израел и Ливан се споразумяха за примирие под условие*
Българите инвестират все по-активно, диверсификацията остава ключова
Шефът на TSMC залага силно на AI растежа и сигнализира интерес към повишаване на цените
Украйна показа управляем тестови полет на своя противобалистична ракета
ЕЦБ рискува да повтори стара грешка с повишаването на лихвите
Гръмотевични бури и градушки удрят България: Петър Янков съобщи кога идва лятото
В Мексико регистрираха първи случай на месояден червей от 60 години
Вигенин предлага преразглеждане на правилата за прикрепените капачки
Грешка ли е да зареждаме гориво от по-евтини бензиностанции?
Край на сагата! Вписаха Весела Лечева като председател на БОК
Скреч карти, футбол и награди: efbet Пункт с нова кампания за Мондиала
Босът на ЦСКА 1948: Ще отпаднем безславно на старта в Европа!
Ще играе ли на световното? Де ла Фуенте каза истината за Ямал
Кокала: Левски се нуждае от подсилване отзад и отпред!
Ираола подписва днес договора си на "Анфийлд"
Защо се опитваме да се харесаме на хора, които не харесват нас?
Поверия за ангелската дата 6/6
Орехов щрудел по австрийска рецепта
Нумерологична прогноза за 4 юни
„Хиляда жерава. Впечатления от едно пътуване из Япония с влака „Шинкансен“ от Атанас Владиков
Таро карта за 4 юни, четвъртък
Ограничиха правомощията на Тръмп във войната в Иран
"Възраждане" призоваха в НС Благомир Коцев да подаде оставка като кмет на Варна
490 плувци от 22 клуба атакуват медали в Black Sea Cup
Спират движението по Дунав мост при Русе
Държавата съучаства във вдигането на цените
Филип Киркоров: Дано Евровизия се проведе в родната ми Варна
НАСА прекрати мисията на марсианския си сателит MAVEN след месеци мълчание
НАСА потвърди: Огнена топка от метеор е преминала над Нова Англия
Използват „Боинг 737“ за симулация на лунна гравитация
Живи организми са открити в 5300-годишната мумия на Йоци
Muon Space представи сателитна платформа от клас Starship за орбитални центрове за данни
НАСА търси обяснение на мистериозен сигнал от Слънцето, продължил 19 дни