Българският език заплашен от дигитална смърт

Пропастта между т. нар. "големи" и "малки" езици продължава, показва проучване
Обновена: 25 сеп 2012 14:52 | 25 сеп 2012 13:10,
96
Българският език заплашен от дигитална смърт
Езиковите технологии за 21 от 30-те изследвани езика са недоразвити. Снимка: архив, Reuters

Българският е един от езиците, които са заплашени от дигитална смърт. Това показва ново изследване на водещи европейски експерти в сферата на езиковите технологии.

Проучването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни. Сред тях е и Институтът за български език „Проф. Любомир Андрейчин”.

Експертите са направили оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа.

Те са достигнали до извода, че езиковите технологии за 21 от 30-те изследвани езика или „са недоразвити", или са „слабо развити".

Проучването е проведено от над 200 експерти и включва оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика (т. е. 70%) получават най-ниската оценка (т. е. за тях липсват езикови технологии или съществуващите технологии са недоразвити), като за български категорията със слаба оценка е автоматичният превод.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити”.

Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити”, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.

Тоест, за момента българският език (получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси) не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, съобщават от БАН.

„Наблюдаваме драстично разминаване в равнището на състоянието и достъпа до езиковите технологии за различните европейски езици и за различните технологични области. Пропастта между т. нар. „големи” и „малки” езици продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт“, коментира Георг Рем, един от редакторите на проекта.

Под езикови технологии най-общо се разбира софтуер, който може да обработва говорима и писмена човешка реч, уточняват от БАН.

Добре познати приложения на такъв софтуер са програмите за правописна и граматична корекция и за синтез на реч (като SpeechLab 2.0 за български), интерактивните лични асистенти на смартфоните (например Siri за iPhone), диалоговите системи за обработка на въпроси по телефона, системите за автоматичен превод (като WebTrance на SkyCode), уеб търсачките, както и синтезаторите на реч в навигационните системи за автомобили.

 

Това се случи Dnes, за важното през деня ни последвайте и в Google News Showcase


96
Още от
Спонсорирано съдържание
Напиши коментар Коментари
8
3
 
25
 
! Отговори
Анонимен преди 11 години
До Турчин с фесСлед 200 години няма и турци да има. То и сега няма.
7
21
 
7
 
! Отговори
1000rr преди 11 години
Не мога да разберем защо са ни различни езици на нас хората,не може ли да си говориме всички на английски или немски(ако не бяха спрели Хитлер)......а да,и да имаме една религия и да сме без граници...
6
26
 
12
 
! Отговори
Турчин с фес преди 11 години
Голяма работа, и без това след 200 години няма да има живи българи че да го ползватезика.
5
5
 
30
 
! Отговори
Иван преди 11 години
"Дигитална" е много българска дума. За числата да не би да ползвате "дигити", а не "цифри"?
4
7
 
32
 
! Отговори
Анонимен преди 11 години
КАТО НАУЧИМ КИТАЙЦИТЕ НА КИРИЛИЦА ЩЕ ВИДИМ КОЙ Е НА ИЗМИРАНЕ. СМЕШНИЦИ.
3
7
 
31
 
! Отговори
АЗЕ преди 11 години
Да БЛАГОДАРИМ на политиците и Оправниците ни в Бг ,.........-от 1989г .----до днесКА!Всеки 3-ти българин /без ***/,...е НЕГРАМОТЕН !
2
4
 
41
 
! Отговори
Анонимен преди 11 години
Българския е в основата на кирилицата така че изобщо не ме интересува какво казват другите
1
29
 
12
 
! Отговори
време е! преди 11 години
Време е да се учи ---*** и турски ---,..Бг нция е на ---изчезване ---ФАКТ!