Minería y visualización de texto
description
Transcript of Minería y visualización de texto
![Page 1: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/1.jpg)
MINERÍA Y VISUALIZACIÓN DE TEXTO
Edwin Fabián Maza S.Estudiante de la UTPL
ISUMMIT 2010
![Page 2: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/2.jpg)
INTRODUCCIÓN
En la actualidad se busca analizar el texto existente en todo su ámbito y para ello se requiere de procedimientos automáticos para: extraer los temas, determinar en el texto la localización de las rupturas, visualizar la proximidad entre documentos y/o entre términos, indexar los documentos, construir bases de documentos para una interrogación automática a lo posterior.
![Page 3: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/3.jpg)
Búsqueda de información VS Extracción de información
Búsqueda de información: Es un tratamiento global de un gran nuero de documentos, búsqueda de temas, construcción de una tipología de los documentos.
Extracción de información: consiste en la búsqueda de información “ciblada”, para alimentar una base de datos estructurada (relleno automático de los campos de la base).
![Page 4: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/4.jpg)
Tipos de textos analizados Los tipos de textos analizados se
pueden realizar entre: Encuestas de opinión Encuestas de satisfacción de clientela Entrevistas semi-abiertas en estudios de
clientela Revistas de prensa Vigilia tecnológica: resúmenes de
artículos contenidos en las bases científicas, patentes, entre otras.
![Page 5: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/5.jpg)
Métodos de análisis
Para ello se pueden identificar dos puntos importantes como son: La codificación: se debe conocer como
se codifica el corpus, esta transforma el corpus en una tabla que se puede analizar mediante métodos estadísticos
La distancia: el papel fundamental de la distancia escogida en el análisis estadístico de textos. Distancia entre elementos (entrevistados, categorías de entrevistados, palabras, entre otros.)
![Page 6: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/6.jpg)
¿Por qué es dificil?
La minería de textos se ve compleja o difícil para su análisis debido a la conformación de: Títulos Imágenes Tablas Graficas Texto seguro
Es difícil la visualización del texto como por ejemplo: la presencia de un objeto extraño se puede interpretar de varias formas como: alucinación, nave extraterrestre, platillo volador, OVNI
![Page 7: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/7.jpg)
Lingüística computacional y procesamiento de textos
Esta ciencia ha ayudado para tratar de aplicar métodos computacionales en el estudio del lenguaje natural. Por lo que es ha combinado dos importantes ciencias, la lingüística que el estudio de leyes del lenguaje humano, y la inteligencia artificial que investiga métodos computacionales para el manejo de sistemas complejos.
![Page 8: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/8.jpg)
La solución tradicional de este problema consiste en construir un procesador lingüístico construido por diferentes módulos independientes.
![Page 9: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/9.jpg)
Tipos de minería de textos Web (Web Mining)
La Web Mining nos ayuda a descubrir información, encontrar documentados relacionados, mostrar temáticas, averiguar el grado de satisfacción de recursos web, etc. Según el fin deseado, la actividad de excavar en la web se desglosa en tres dominios de extracción de conocimiento de acuerdo con la naturaleza de los datos.
![Page 10: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/10.jpg)
Tipos de minería de textos Web (Web Mining)
Web content mining (minería de contenido web)
Web structure mining (minería de estructura web)
Web usage mining (minería de uso web)
![Page 11: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/11.jpg)
HERRAMIENTAS DE MINERÍA DE TEXTO
Weka RapidMiner Lenguaje R Pentaho GATE
Bases de datos de artículos técnicos. biotech medline chemical abstract registry
![Page 12: Minería y visualización de texto](https://reader036.fdocuments.ec/reader036/viewer/2022082420/557e9af5d8b42a1d048b4f12/html5/thumbnails/12.jpg)
REFERENCIAS
[1] Minería de Textos Web Recuperación y organización de la información Disponible en http://mineria-textos-web.awardspace.com/
[2] Explotación minera del texto Disponible en http://enciclopediaespana.com/Explotación_minera_del_texto.html
[3] Explotación minera del texto http://www.worldlingo.com/ma/enwiki/es/Text_mining
[4] Minería de textos y datos para-textuales Universitat Autónoma de Barcelona SEA 2 de febrero 2007 Mónica Bécue Bertaut
[5] Minería de texto: Un nuevo reto computacional Manuel Montes-y-Gómez Centro de Investigación en Computación, Instituto Politécnico Nacional.