Atajar fenómenos como el ciberacoso o analizar la propagación de rumores en Internet son los objetivos de Ciberguardian, una aplicación capaz de conectarse a una red social y extraer automáticamente información de las páginas web. "Esta herramienta es capaz de comportarse como una persona que navega por Internet y que cuando encuentra información interesante la almacena en una base de datos y la hace disponible para un análisis posterior", explica Luis López Fernández, profesor de Ingeniería Telemática en la Universidad Rey Juan Carlos (URJC) y responsable del proyecto.
Gracias a este análisis se pueden realizar tareas tales como chequear de manera periódica qué nuevos amigos tiene una persona, qué mensajes han ido apareciendo en su cuenta, a qué nuevos eventos ha sido convocada... Pero con un límite: la información que cada usuario hace públicamente disponible de sí mismo. "Se respeta en todo momento la legalidad y los límites de la intimidad que las personas desean imponer sobre su propia información", asegura el investigador.
La tecnología de Ciberguardian se basa en dos componentes modulares. En primer lugar un robot de extracción (o 'crawler') capaz de conectarse a un servidor web, descargar documentos del mismo y construir una representación computerizada de la información que aparece en las páginas HTML que ven los usuarios. Gracias a esta representación, el robot puede recuperar y almacenar textos, imágenes, vídeos o cualquier otro elemento que pueda aparecer en la pantalla de un navegador. El segundo de los componentes es un módulo inteligente que analiza los textos que el robot ha recuperado para determinar, a partir de las palabras que lo forman, si el mensaje asociado contiene información relevante para los objetivos del programa.
De esta forma, si se quiere, por ejemplo, detectar mensajes de acoso o de amenaza, basta con incorporar al sistema un diccionario de palabras que aparezcan con frecuencia en este tipo de mensajes. Además, debido al carácter modular de la aplicación es sencillo integrar librerías de análisis computerizado de lenguaje natural que podrían utilizarse para clasificar los mensajes extraídos o para extraer entidades, opiniones o relaciones entre los mismos.
Además, CiberGuardian puede ser de gran utilidad para ámbitos como la sociología o el marketing. Y es que esta aplicación es capaz de analizar aspectos como quién conoce a quién dentro de una red social de Internet. Es decir, se puede reconstruir la estructura de dicha red y visualizarla mediante un grafo, en el que los nodos son las personas que forman parte de la red y las aristas representan las relaciones entre las mismas (de amistad, de intercambio de mensajes, etc). Cuando este grafo se representa en una estructura de datos, es sencillo analizar aspectos tales como qué roles aparecen en la red, quiénes son los líderes, cómo se propagan la información y los rumores, qué comunidades de interés hay, o de qué maneras evoluciona la estructura de la red ante eventos externos
Suscribirse a:
Enviar comentarios (Atom)
0 comentarios:
Publicar un comentario