Университетът в Осака е разработил невронна мрежа, способна да реконструира образа, който човек вижда в момента. Анализирайки данни от функционален ядрено-магнитен резонанс, системата прецизно възпроизвежда не само формата, но и цветовете на обектите. Учените говорят за първата в света машина за четене на мисли, съобщава БГНЕС.
Обхватът на приложенията на обещаващата технология на компютърното зрение е много широк: от общуване с парализирани хора до записване на сънища и изучаване на начина, по който различните животни възприемат света около себе си.
Японски изследователи са се възползвали от предимствата на Stable Diffusion - популярна програма за преобразуване на текст в реч. Тази невронна мрежа с отворен код е подобна по структура на други генеративни LLM (Large language models), като DALL-E2 на OpenAI (създател на ChatGPT) или Midjourney.
Тя се основава на дифузия - метод за машинно обучение, при който визуалният образ се генерира чрез последователни приближения. Всяка нова итерация се базира на друга текстова реплика.
Японците са добавили допълнителна стъпка на обучение към стандартната схема за Stable Diffusion. Така невронната мрежа сравнява данните за мозъчната активност на четирима участници в експеримента, на които са показани различни снимки с текстови описания на изображенията.
Във фазата на машинното обучение на участниците бяха показани десет хиляди изображения и системата събра генерираните в процеса на изследване модели на fMRI, които след това бяха декодирани от изкуствен интелект.
Анализирайки пиковете, регистрирани чрез fMRI в различни области на мозъка, учените откриват, че темпоралните лобове са отговорни за съдържанието на образите. Това е така наречената семантична зона. А тилната, където се намира зрителната кора, пресъздава размера и общото разположение на обектите.
Резултатите до голяма степен съответстват на хипотезата за два потока визуална информация, формулирана през 1983 г. от американския невропсихолог Мортимър Мишкин. Той предложи, че в мозъчната кора да има два анатомично и функционално различни канала за обработка на пространствена и предметна информация: "Къде?" и "Какво?".
Японците са комбинирали визуална и семантична информация. Дифузионният алгоритъм е сравнявал наблюдаваните модели на невронна активност, формирани при разглеждане на снимки, с моделите в набора от данни за обучение. Сигналите от "визуалната" кортикална област са били използвани за изграждане на общ обем и перспектива. След това били свързани сигналите от семантичния декодер на сигнали и първичната картина, приличаща повече на смущение на телевизионния екран, постепенно придобила очертанията на разпознаваеми обекти.
Учените получиха около хиляда изображения, които съвпаднаха със смисъла и съдържанието на оригинала с точност до 80%. В повечето случаи изкуственият интелект дори пресъздава цветовата схема на оригиналното изображение.
Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase.

S&P 500 и Nasdaq с нови рекорди благодарение на надеждите за мир в Близкия изток
Инвеститорите предупреждават Mercedes за риск в плана за възстановяване в Китай
Ръководството на "Елхим Искра" е приело план за преструктуриране на дейността
Балин Балинов: Трябва да се промени моделът за енергийна общност у нас
Ярдени: Инвеститорите гледат отвъд войната и се фокусират върху фундаменталните фактори
МВФ сви прогнозите за растеж на петролните страни от Персийския залив
Здравословен шоколадов пудинг с чиа и бадемово мляко
Защо пожълтяват листата на мушкатото и как да го спасим?
Магнитна буря връхлита Земята на 18 април
Храната, която лекарите препоръчват при високо кръвно
Разкриха адреса на къщата на Шекспир в Лондон
Легендата Овечкин не смята да спира с хокея
Олимпиакос ще разваля проклятие, Везенков изпревари легенда
Синди Алварес Гарсия
"Орела" вярва, че ще спаси Монтана от изпадане
Фрайбург е първият полуфиналист в Лига Европа
Бомба от "Армията": Стоичков води нов шеф в ЦСКА
Таро карта за 17 април, петък
Дневен хороскоп за 17 април, петък
Задължителни ястия за Томина неделя на 19 април
5 тренда от 90-те, които са хит тази пролет
Технополис стартира „Пролетен супер уикенд“ с до - 40% на топ оферти
Защо листата на мушкатото пожълтяват?
Неочакваната варненска следа в историята на "Титаник"
"Мяра": Общественото напрежение в българското общество остава високо
Нападат автомобили на улица във Варна
Принудителните разселвания ще нараснат с 4,2 милиона до 2027 г.
Ренета Инджова: Нашите избори са като игра на сляпа баба!
Отношението на поколението Z към AI тревожи технологичната индустрия
НАСА и Voyager Technologies сключиха договор за нова частна мисия до МКС
Китай стартира масово производство на летящи автомобили (видео)
Астероид с размерите на три футболни игрища ще прелети край Земята през 2029 г.
След 400 години: Откриха точния адрес на изгубения лондонски дом на Шекспир
Трогателно писмо на 10-годишно момиче до НАСА развълнува света: Отнася се до Плутон
Астронавт от „Артемида 2“ наруши протокола на НАСА, за да спаси талисмана на мисията