AI боклуците започват да замърсяват интернет, генерираният спам расте

В YouTube златната треска на ChatGPT е в разгара си
17 юли 2023 19:52, Анисия Иванова
32
AI боклуците започват да замърсяват интернет, генерираният спам расте
Снимка: БГНЕС

Когато за първи път чу за човешките езикови умения на бота с изкуствен интелект ChatGPT, Дженифър Стивънс се чудеше какво би означавало това за списанието за пенсионери, което редактира.

Месеци по-късно тя има по-добра идея. Това означава, че тя прекарва много време във филтриране на безполезни предложения за статии.

Хора като Стивънс, изпълнителен редактор на International Living, са сред онези, които виждат нарастващо количество съдържание, генерирано от AI, което е толкова под техните стандарти, че го смятат за нов вид спам, пише The Wall Street Journal.

Технологията подхранва инвестиционен бум. Тя може да отговаря на въпроси, да създава изображения и дори да генерира есета въз основа на прости подкани. Някои от тези техники обещават да подобрят анализа на данни и да премахнат ежедневните задачи за писане, точно както калкулаторът промени математиката. Но те също така показват потенциала за генериран от AI спам да нарасне и потенциално да се разпространи в интернет.

В началото на май компанията за рейтинг на новинарски сайтове NewsGuard откри 49 фалшиви новинарски уебсайта, които използват AI за генериране на съдържание. До края на юни броят им достигна 277, според Гордън Кровиц, съосновател на компанията.

„Това нараства експоненциално“, каза Кровиц. Изглежда, че сайтовете са създадени, за да правят пари чрез онлайн рекламната мрежа на Google, каза Кровиц, бивш колумнист и издател в The Wall Street Journal.

Изследователите също така посочват потенциала на AI технологиите, използвани за създаване на политическа дезинформация и насочени съобщения, използвани за хакване. Компанията за киберсигурност Zscaler казва, че е твърде рано да се каже дали AI се използва от престъпниците по широко разпространен начин, но компанията очаква да го види да се използва за създаване на висококачествени фалшиви фишинг уеб страници, които са предназначени да подмамят жертвите да изтеглят зловреден софтуер или да разкрият техните онлайн потребителски имена и пароли.

В YouTube златната треска на ChatGPT е в разгара си. Десетки видеоклипове, предлагащи съвети как да печелите пари от технологията на OpenAI, са гледани стотици хиляди пъти. Много от тях предлагат съмнителни схеми, включващи нежелано съдържание. Някои казват на зрителите, че могат да правят хиляди долари на седмица, като ги призовават да пишат електронни книги или да продават реклами в блогове, пълни с генерирано от AI съдържание, което след това може да генерира приходи от реклами, като се появи при търсения с Google.

Google каза в изявление, че работи за защита на своите резултати от търсене от спам и манипулация и че използването на генерирано от AI съдържание за манипулиране на класирането на резултатите от търсенето е нарушение на правилата за спам на компанията Alphabet.

Когато ChatGPT бе помолен да „посочи няколко списания, които биха приемали съдържание, написано от ChatGPT“, AI предложи 10 списания, включително пет, които използват система за подаване на съдържание, наречена Moksha, за управление на изпращанията на статии.

„Издателите, които използват Moksha, определено са докладвали за ръст на изпращанията, генерирани от AI, така че ние разработихме инструменти за тях, за да реагират лесно и да блокират автори, които не следват указанията на издателите относно AI“, каза Матю Кресел, създателят на Moksha. Той отбеляза, че едно списание, препоръчано от ChatGPT, Shimmer, затвори през 2018 г.

ChatGPT е добър в предвиждането на следващите думи в изреченията, но понякога дава неправилни отговори, каза говорител на OpenAI. „Много хора го смятат за търсачка, но не е“, каза тя, цитирана от Bloomberg TV Bulgaria.

Друго списание в списъка на ChatGPT, списанието за научна фантастика Clarkesworld, трябваше временно да спре да приема онлайн публикации по-рано тази година, тъй като беше затрупано от стотици истории, генерирани от AI, каза издателят на Clarkesworld Нийл Кларк.

Кларк каза, че притокът е бил заради онлайн видеоклипове, които препоръчват използването на ChatGPT за създаване на статии за Clarkesworld.

Кларк, подобно на други издатели, казва пред WSJ, че неговото списание отхвърля всички писмени материали, написани от AI, и че те са лесни за идентифициране.

Те имат „перфектен правопис и граматика, но напълно несвързана история“, каза той. Често те започват с голям проблем - светът ще свърши - и след това 1000 думи по-късно проблемът някак си е решен, без обяснение, каза той.

„Всички те са написани по доста скучен и общ начин“, каза Стивънс от International Living. „Всички те са граматически правилни. Те просто се чувстват много шаблонни и наистина са безполезни за нас."

Ако интернет все повече се изпълва с генерирано от AI съдържание, това може да се превърне в проблем за самите AI компании. Това е така, защото техните големи езикови модели, софтуерът, който формира основата на чатботовете като ChatGPT, се обучават на публични набори от данни. Тъй като тези набори от данни стават все по-пълни с генерирано от AI съдържание, изследователите се притесняват, че езиковите модели ще станат по-малко полезни, феномен, известен като „колапс на модела“.

Точно както многократното сканиране и отпечатване на една и съща снимка в крайна сметка ще намали нейните детайли, колапсът на модела се случва, когато големите модели за обучение станат по-малко полезни, тъй като усвояват създадените от тях данни, каза Илья Шумайлов, научен сътрудник в Групата за приложно и теоретично машинно обучение в Оксфорд (OATML), който наскоро беше съавтор на статия за този феномен.

Не само спам съдържанието ще допринесе за колапса на модела. Това е и нарастващото използване на AI за генериране на съдържание като цяло, каза Шумайлов.

Миналия месец изследователи от École Polytechnique Fédérale de Lausanne наеха писатели на свободна практика онлайн, за да обобщят резюмета, публикувани в New England Journal of Medicine, и установиха, че повече от една трета от тях използват съдържание, генерирано от AI.

Шумайлов смята, че колапсът на модела е неизбежен, но има редица потенциални технически решения на този проблем. Например компаниите, които имат достъп до генерирано от хора съдържание, все още ще могат да изграждат висококачествени големи езикови модели.

„Това не е непременно нещо лошо“, каза той. „Може би ще се отървем от captcha и ще стане нормално да си компютър в интернет“, каза той, имайки предвид картинните пъзели, които уебсайтовете налагат, за да разграничат компютрите от хората.

Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase


32
Още от
Спонсорирано съдържание
Напиши коментар Коментари
6
0
 
4
 
! Отговори
Анонимен преди 10 месеца
A зa naвaжнитe тakивa, зaщo нe nишeтe? 3apинaxa цялaтa cтpaнa...
5
6
 
3
 
! Отговори
ьаьаьааь преди 10 месеца
Има много некачествено п0рн0, което трябва да се оправи от ИИ. Иначе света ще загине ако няма добро п0рн0. В момента 90% е crap
4
0
 
6
 
! Отговори
Гешев преди 10 месеца
а при Нас, не са в Интернет, а в Парламента, у нас в Интернет повечето хора са с Висок Естествен Натурален Интелект!
3
0
 
7
 
! Отговори
Анонимен преди 10 месеца
Бисквитките и кеша какво са? Защо когато почиствам айфона си, ми изписва почистени *** в mb?
2
0
 
6
 
! Отговори
Анонимен преди 10 месеца
за справка = тази статия. няма такъв човек Анисия, Нелка или Камелия. това са ботове
1
1
 
15
 
! Отговори
Анонимен преди 10 месеца
Интернет е замърсен още от създаването си. 90% от информацията в Интернет е замърсител от различен вид.