Buscador :
Volver al Menú
| : /
Vote:
Resultados:
0 Votos
ENERO-DICIEMBRE 2016 - Volumen: 3 - Páginas: [12 p.]
Descargar pdf
RESUMEN: Este artículo presenta una Arquitectura de Software inspirada en métodos de Big Data Analytics y Web Semántica con el objetivo de analizar grandes cantidades de información en la Web y obtener conocimiento que apoye en la toma de decisiones a organizaciones, empresas y sociedad en general.A efectos de probar la arquitectura y sus métodos, como caso de estudio se analizaron páginas Web sobre el Ciberbullying. Fenómeno de acoso escolar que sufren los niños y adolescentes haciendo uso de Tecnologías de la Información para acosar, hostigar e intimidar a un individuo a través de ataques personales, divulgación de información confidencial o falsa.El proceso utiliza un Crawler para localizar y descargar la información en la Web. En la recuperación del vocabulario se implementó una estrategia genética en paralelo que integra técnicas de Web Semántica (ontologías) y Procesamiento de Lenguaje Natural (PLN) (Tokenización, Stop Word, Frecuencia de Término (TF) y Frecuencia de Término con Frecuencia Inversa del Documento (TF-IDF)), métodos de lematización y sinónimos, con el propósito de recuperar más información. Para obtener conocimiento se utilizaron los algoritmos de Aprendizaje Supervisado Arboles, Máquinas de Soporte Vectorial (MSV) y Bosques Aleatorios. Mediante el método propuesto fue posible integrar un proceso completo que inicia obteniendo datos en la Web y termina con la detección de vocabulario (conocimiento), uniendo distintas técnicas de manera natural. Los resultados muestran que los porcentajes en la detección del vocabulario de Ciberbullying son elevados logrando un 95% de precisión. Además con la estrategia genética se logra optimizar el tiempo de procesamiento en la recuperación del vocabulario con un ahorro del 302% comparado con el proceso secuencial y se obtuvo un conjunto de datos robusto para las pruebas. Por otro lado el uso de ontologías semánticas facilitó el análisis de la información generando (n) conjuntos de datos con distintas vistas.Palabras clave: Ciberbullying, Big Data, PLN, Web Semántica, Aprendizaje Supervisado, Algoritmos Genéticos.
Compártenos:
© Revista de Ingeniería Dyna NewTechnologies
EDITORIAL: Publicaciones DYNA SL
Dirección: Alameda Mazarredo 69 - 2º, 48009-Bilbao SPAIN
Email: info@dyna-newtech.com - Web: http://www.dyna-newtech.com
Regístrese en un paso con su email y podrá personalizar sus preferencias mediante su perfil
Nombre: *
Apellido 1: *
Apellido 2:
Email: *