martes, 19 de abril de 2011

Usan Twitter para rastrear lenguajes nativos

Kevin Scannell es profesor de Matemáticas y Computación en la Universidad de San Luis (EEUU). Da clases de álgebra, pero luego emplea los algoritmos para buscar lenguas en internet. Su pasión son las minoritarias, algunas en peligro de extinción. Sabe de qué habla. Es y practica el irlandés. Nació en Cheathrú Rua.

Hace un mes, Scannell creó Indigenous Tweets, un lugar que rastrea los mensajes escritos en lenguas minoritarias y que, además, al identificar a sus autores, pone en contacto a los escritores en esas lenguas, del euskera al asturiano, del lombardo al pulaar.

“Twitter proporciona a los programadores una aplicación para acceder a las bases de datos de los tuits y permite agruparlos. Después, con métodos estadísticos mi buscador determina el lenguaje de esos tuits”, explica Scannell.

Así ha registrado los 378.000 tuits en euskera de 3.788 personas; y que los asturianos que escriben en bable son 626, que hay 13 maorís y 82 occitanos tuiteando en su idioma nativo.

Así hasta el rastreo de 76 lenguas, algunas tan minoritarias como el ugandés, con un practicante en Twitter, aunque tan prolífico que ha enviado un millar de mensajes. En esos casos, casi siempre es un medio informativo. Es lo que ocurre con los mensajes en euskera

No hay comentarios:

Publicar un comentario