Българският език заплашен от дигитална смърт

Пропастта между т. нар. "големи" и "малки" езици продължава, показва проучване
Обновена: 25 сеп 2012 14:52 | 25 сеп 2012 13:10,
96
Българският език заплашен от дигитална смърт
Езиковите технологии за 21 от 30-те изследвани езика са недоразвити. Снимка: архив, Reuters

Българският е един от езиците, които са заплашени от дигитална смърт. Това показва ново изследване на водещи европейски експерти в сферата на езиковите технологии.

Проучването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни. Сред тях е и Институтът за български език „Проф. Любомир Андрейчин”.

Експертите са направили оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа.

Те са достигнали до извода, че езиковите технологии за 21 от 30-те изследвани езика или „са недоразвити", или са „слабо развити".

Проучването е проведено от над 200 експерти и включва оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика (т. е. 70%) получават най-ниската оценка (т. е. за тях липсват езикови технологии или съществуващите технологии са недоразвити), като за български категорията със слаба оценка е автоматичният превод.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити”.

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити”, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.

Тоест, за момента българският език (получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси) не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, съобщават от БАН.

„Наблюдаваме драстично разминаване в равнището на състоянието и достъпа до езиковите технологии за различните европейски езици и за различните технологични области. Пропастта между т. нар. „големи” и „малки” езици продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт“, коментира Георг Рем, един от редакторите на проекта.

Под езикови технологии най-общо се разбира софтуер, който може да обработва говорима и писмена човешка реч, уточняват от БАН.

Добре познати приложения на такъв софтуер са програмите за правописна и граматична корекция и за синтез на реч (като SpeechLab 2.0 за български), интерактивните лични асистенти на смартфоните (например Siri за iPhone), диалоговите системи за обработка на въпроси по телефона, системите за автоматичен превод (като WebTrance на SkyCode), уеб търсачките, както и синтезаторите на реч в навигационните системи за автомобили.

 

Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase


96
Още от
Спонсорирано съдържание
Напиши коментар Коментари
28
1
 
3
 
! Отговори
да бе! преди 11 години
След като няма какво да ядеш ,и си ----заминаваш ,на кой ли му пука за това?
27
5
 
4
 
! Отговори
:) преди 11 години
Е мноо ясно - тва е пазар. Колко хора на световният пазар говорят български и латвийски и колко говорят английски и испански....*** новината, *** драмата
26
3
 
13
 
! Отговори
Анонимен преди 11 години
27 - тиймбилдинг да не е на български ленински съботник?:)))
25
5
 
0
 
! Отговори
Анонимен преди 11 години
27 , кои са тия думи на български?
24
5
 
39
 
! Отговори
Анонимен преди 11 години
Българският език е прекрасен език, но много хора не го знаят. Боравят с много малко думи, а той е много богат. Вкарват чуждици защото глупаците не разбирали когато е казано на български и вече става смешно. Примерно референция, тимбилдинг и куп простотии за които си има български думи, но не звучи познато на чичо Джон. Учители и журналисти са хората които трябва да поддържат езика, а не да се европейчат и да стават жалки.
23
4
 
6
 
! Отговори
Анонимен преди 11 години
до 25 - Ти за ирония чувал ли си, или още де си добутал до 8-ми клас?
22
22
 
2
 
! Отговори
Ацета преди 11 години
Шо ми се тревожете бе ***? Научете македонски за цел свет да ве разуме мама му...
21
11
 
4
 
! Отговори
тинейджър преди 11 години
4e kakwo mu e na bulgarkiq ezik? 6e se promeni spored horata, koito go polzwat, a te stawat wse po-prosti i negramotni. Vijte me men. Are 4ao
20
26
 
8
 
! Отговори
Анонимен преди 11 години
Аз нямам нищо против английският. Хубав език е.Доста по-красив от българският.Например думата *** off е доста по миролюбива и негрозна от балканското "Ходи се ***" или нещо подобно. Освен това уважителната думичка "вие" все още *** по софията и други села и паланки в цяла България когато им говориш с "Вие" почват да отговарят в множествено число... Мъка ,мъка...или пък си мислят,че ги виждаш двойно.Мъка и скръб.На английски е просто ""you" ако искаш го разбирай на ти или вие.И още и още..
19
5
 
11
 
! Отговори
Mr. Jack преди 11 години
Как ми се доспа.Искам да легна гол до някоя мацка, да я хвана за гардата и да я прегърна. Бих поспал доста време така :)
18
13
 
7
 
! Отговори
Анонимен преди 11 години
Може да ви си види нереално,но гръцкия език е един от най-богатите езици на света.Просто казано, с малко думи можеш да обрисуваш цялостна цветна картина.Относно тоновете и ударенията ,несравнимо богат е този език .
17
6
 
4
 
! Отговори
.. преди 11 години
До Анонимен To и латинския е в основата на латиницата ама не пречи да е умрял език...
16
2
 
23
 
! Отговори
-- преди 11 години
Поредната статия с куп глупости, извадени от контекста...Само преди 10 години едни немски учени обясняваха как кирилицата била неудобна и трябвало да преминем на латиница, за да не изпуснем влака за високите технологии.Бумът на тази идеология дойде къмто 25 години след като кирилицата и българския отдавна бяха факт в компютрите :)))
15
2
 
4
 
! Отговори
Анонимен преди 11 години
Бъдете спокойни за нашия едиз докато го има между 66 езика на преводачката Гъгълка.
14
2
 
21
 
! Отговори
до 3 преди 11 години
Какво общо имат пък политиците с това, че примерно ти си неграмотен ? Неграмотен е човек, който не е залягал навремето над книгите, това става или по собствено желание или ако родителите му не са го били достатъчно, за да учи. Политиците нямат абсолютно нищо общо с неграмотността, ама нали на българина все някои друг трябва да му е виновен...
13
1
 
36
 
! Отговори
трий модераторе преди 11 години
Може ли да разкарате всевъзможните подскачащи и изкачащи реклами и банери, страшно дразнещо е.Няма да фалирате, то бива печалбарство ама чак пък толкова...
12
6
 
12
 
! Отговори
gostenkata s kosata преди 11 години
До Турчин с фесКаква турция бе резан *** такъв.....останали сте само безродна и безформена маса от анадолска ***...не виждаш ли че сами се избивате:)))
11
7
 
10
 
! Отговори
Анонимен преди 11 години
До 1000rrЗащото дори в природата унифицирането води до регрес. В човешката история също, доказателство за това е комунизмът.
10
3
 
28
 
! Отговори
Анонимен преди 11 години
По глупава статия не можахте ли да преведете?
9
5
 
7
 
! Отговори
Анонимен преди 11 години
na toia sviat malkite dyrjavi i esika im rano ili kysno 6te is4esnat niama kakvo da se peniavime.