Вашите данни от Facebook ще станат тайното оръжие на Зукърбърг за AI

Планината от данни на Meta е огромна и може да създаде "по-интелигентен" ИИ
9 фев 2024 19:32, Анисия Иванова
57
Вашите данни от Facebook ще станат тайното оръжие на Зукърбърг за AI
Снимка: БГНЕС

Според последните финансови резултати на Meta Platforms Inc. за много хора Facebook е интернет, а броят на потребителите му продължава да расте. Но Марк Зукърбърг не само празнува този непрекъснат растеж. Той иска да се възползва от него, като използва данните от Facebook и Instagram за създаване на мощен изкуствен интелект с общо предназначение. Звучи чудесно и Meta е добре позиционирана да го направи, но милиардите му потребители в крайна сметка може да платят цената с личните си данни и не само.

Ето как Зукърбърг подсказа следващия си ход в областта на изкуствения интелект в четвъртък:

"Във Facebook и Instagram има стотици милиарди публично споделени изображения и десетки милиарди публични видеоклипове, които според нашите оценки са повече от масива от данни на Common Crawl, а хората споделят и голям брой публични текстови публикации в коментари в нашите услуги."

Въпросът, който Зукърбърг прави тук за "Common Crawl", изненадва наблюдателите в технологичната преса, защото този архив вече е огромен: 250 милиарда уеб страници за период от 17 години. Това е едно от най-големите и популярни хранилища на публичния интернет, което днес се използва за обучение на системи за изкуствен интелект. Когато OpenAI стартира своя езиков модел GPT-3 през 2020 г., близо 60% от текста, използван за обучение на системата, идваше от Common Crawl.

Но планината от данни на Meta е още по-голяма, което означава, че теоретично тя може да създаде "по-интелигентен" ИИ. Това е така, защото изследванията показват, че обучението на моделите на ИИ върху повече данни ги прави по-способни и точни. Тази формула е свършила чудеса за OpenAI, която през годините е увеличила количеството данни, използвани за създаване на модели като ChatGPT.

Ако Зукърбърг иска да създаде по-мощен чатбот, купчината данни, върху които седи, е особено ценна, защото голяма част от тях идват от теми за коментари. Всеки текст, който представлява човешки диалог, е от решаващо значение за обучението на т.нар. разговорни агенти, поради което OpenAI усилено експлоатира интернет форума Reddit Inc. за създаването на свой собствен популярен чатбот.

Лесно е да се подиграваме, когато Зукърбърг говори за нова амбиция - независимо дали става дума за ботове, крипто или метавселена. Най-новата му амбициозна визия е особено голяма: да създаде "общ интелект" или софтуерни системи, които да достигнат или надминат човешкия интелект. Но с всички тези данни стремежът на Зукърбърг изглежда осъществим. Проблемът е какви ще са последиците за останалите.

Странно е, че в същото съобщение, в което Зукърбърг казва, че екипът му за изкуствен интелект работи по изграждането на общ интелект "повече от десетилетие", той казва също, че Facebook едва сега ще се обърне към данните на своите потребители, за да изгради модели като "следващата ключова част от нашия наръчник". Защо Мета вече не го е направила? Може би защото използването на всички тези данни не е толкова просто. От една страна, това би представлявало още едно нарушение на неприкосновеността на личния живот на 3 млрд. потребители на Facebook и 1,5 млрд. потребители на Instagram. По същия начин, по който OpenAI беше подложена на критики за това, че е използвала защитените с авторски права данни на художници и писатели, за да обучава своите модели, Facebook може да се сблъска с негативни последици за репутацията си, ако отново използва данните на хората. Това не само повдига сложни етични въпроси, но и може да изисква строги практики за обработка на данни и спазване на глобалните закони за защита на данните, което може да предизвика недоволството на европейските регулатори.

Другият проблем е свързан с предубедеността и токсичността на данните. Според проучване на Университета в Монреал от 2021 г. OpenAI трябваше да се справи с този проблем при Common Crawl, чийто огромен масив включваше уебстраници за възрастни. В същото проучване се казва, че между 4 и 6% от всички уебсайтове в Common Crawl са включвали расови обиди, реч на омразата или конспиративни теории на расова основа.

Макар че софтуерът за модериране на съдържанието на Facebook е станал по-добър в блокирането на речта на омразата и конспиративните теории, той не е съвършен и има тенденция да се влошава в страни извън САЩ. Част от съдържанието във Facebook, което се маркира като токсично, вече не се преглежда от човек и остава на сайта. Още по-лошо: Когато Зукърбърг каза, че данните на Meta са по-големи от тези на Common Crawl, той вероятно е включил историческия архив на компанията, който ще включва цялото хиперболично политическо съдържание и фалшиви новини, които са били на сайта, преди Зукърбърг да се погрижи да ги изчисти.

Цялата работа, която трябва да се извърши при внимателното обработване и проверка на данните, може да обясни защо Зукърбърг едва сега заговори за капитализиране на планината от данни, върху която се намира. Ако не го направи както трябва, той рискува да преживее кошмара на публичните критики за това как Facebook се справя с фалшивите новини и вредното съдържание.

Все пак, ако има нещо, което знаем за Зукърбърг, то е, че той има мания за победа и доминация, подобна на тази на Цезар. Миналата седмица, около 24 часа след като се изправи пред тълпа от родители във Вашингтон, които го обвиниха, че води децата им към самонараняване или дори самоубийство, той обяви едно от най-успешните финансови тримесечия на Meta и се закани как ще използва данните на хората, за да създаде мощен изкуствен интелект.

Близостта на тези събития трябва да напомня: Пътят на Facebook към богатството е наранил мнозина. Това може да се случи и по пътя му към създаването на мощен изкуствен интелект.

Анализът на Парми Олсън е публикуван на сайта на Bloomberg TV Bulgaria. Тя е колумнист на Bloomberg, който пише за технологиите. Бивш репортер на Wall Street Journal и Forbes, тя е автор на книгата "Ние сме анонимни".

Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase


57
Още от
Спонсорирано съдържание
Напиши коментар Коментари
27
0
 
1
 
! Отговори
Анонимен преди 3 месеца
Няма такова нещо, не случайно микромеките постоянно ви събираха данните, не че Гугъл не го прави също :)))
26
0
 
1
 
! Отговори
Анонимен преди 3 месеца
До Анонимен 19 - Няма значение, как му викат ... Пролемът е, че има много опасни злоупотреби ...
25
1
 
1
 
! Отговори
Анонимен преди 3 месеца
Събират ви данните и ето ви изкуствения интелект, смешна работа :))) Още с ракети се изтрелват в Космоса, ама от гледане на филми човек става ид иот :)))
24
0
 
1
 
! Отговори
Анонимен преди 3 месеца
Аз ползвам само Телеграм.
23
0
 
2
 
! Отговори
Анонимен преди 3 месеца
Когато го говрих това 2014-а ... "Оо ти си луууд, какви са тези глупсотии" - ХАК ДА ВИИЙЙЙЙЙ
22
1
 
8
 
! Отговори
Анонимен преди 3 месеца
Никога не съм имал акаунт в клюкарника Фейсбук. Не разбирам защо изобщо си губите времето с този сайт.
21
2
 
0
 
! Отговори
Анонимен преди 3 месеца
Че то руските *** са най-активни там. Те да му мислят.
20
2
 
5
 
! Отговори
Анонимен преди 3 месеца
Ще ми има оная работа Зукърбърг. Аз нямам акаунт в клюкарската му социална мрежа.
19
1
 
3
 
! Отговори
Анонимен преди 3 месеца
На това ако викат изкуствен интелект, значи филма Идиокрация се е сбъднал предварително :)))
18
2
 
7
 
! Отговори
Анонимен преди 3 месеца
Не ползвам фейсбук нито инстаграм, нито туитър, камо ли пък тик ток или снап чат
17
1
 
3
 
! Отговори
Анонимен преди 3 месеца
Те отдавна са станали. Малко хора знаят че компанията която съхранява данните я е основал друг евреин учил в подразделение на Мосад, който беше на борда на самолет който се блъсна в кулите на 9/11. Името му е Daniel Lewin. Компанията е Akamai. Естествено никой не информира българите за това.
16
3
 
0
 
! Отговори
Анонимен преди 3 месеца
Горките параноици!
15
2
 
3
 
! Отговори
Анонимен преди 3 месеца
Ами желая му успех с начинанието. Аз няма нито Фейсбук, нито Инстаграм. И никога не съм имал.
14
0
 
2
 
! Отговори
Анонимен преди 3 месеца
До Ех, как. Той ИИ няма да спре да се развива ако Цукърмукър са гътне
13
0
 
0
 
! Отговори
Ех, как преди 3 месеца
Ще се радва светът на некролога му!
12
0
 
1
 
! Отговори
Анонимен преди 3 месеца
До Анонимен 7. Накъде напред ?
11
4
 
1
 
! Отговори
Анонимен преди 3 месеца
До Анонимен 8. Да не си вършил нещо лошо, че се притесняваш ?
10
0
 
9
 
! Отговори
Анонимен преди 3 месеца
Е моите данни, няма да са там , животът е прекрасен и без Фейсбук , инстаграм и другите такива
9
0
 
2
 
! Отговори
Анонимен преди 3 месеца
До Анонимен 5. Ако обучават ИИ през фацето накрая няма да е на себе си.
8
0
 
2
 
! Отговори
Анонимен преди 3 месеца
И един ден всичко кето сме го вършили в социалните медии ще бъде публично достояние.