t Are a Elizabeth

18
4. Adquisición del conocimiento. Ingenieria del conocimiento

description

ingenieria del conocimiento

Transcript of t Are a Elizabeth

4. Adquisicin del conocimiento.

INDICE4.1 INTRODUCCION A LA MINERIA DE DATOS.24.2 TCNICAS PARA EL PRE-PROCESAMINETO DE DATOS.3COMPONENTES DEL PRE-PROCEAMIENTO DE DATOS.34.3 TCNICAS PARA IDENTIFICACIN DE CONCEPTOS, REGLAS Y RELACIONES44.4 HERRAMIENTA PARA ANLISIS DEL CONOCIMIENTO, SELECCIN DE DATOS, EXTRACCIN DE REGLAS.7Portales Corporativos8Herramientas de Simulacin8Herramientas de Trabajo en Grupo9Ejemplos de algunos buscadores de informacin:9CONCLUSION11REFERENCIAS11

4.1 INTRODUCCION A LA MINERIA DE DATOS.La minera de datos es el proceso que tiene como propsito descubrir y almacenar la informacin relevante de amplias bases de datos, a travs de programas de bsqueda e identificacin de patrones y relaciones globales, tendencias, desviaciones y otros indicadores aparentemente caticos que tienen una explicacin que puede descubrirse mediante diversas tcnicas de esta herramienta. El objetivo fundamental es aprovechar el valor de la informacin localizada y usar los patrones preestablecidos para tener un mejor conocimiento de lo que se trabaja y poder tomar decisiones ms confiables. Se considera al Descubrimiento de Conocimiento en Bases de Datos (KDD) como el proceso, lo ms automatizado posible, que va de los datos elementales disponibles en un repositorio de datos a la decisin.El objetivo principal del Descubrimiento de Conocimiento en Bases de Datos (KDD) es crear un proceso automatizado que tome como punto de partida los datos y cuya meta es la ayuda a la toma de decisiones. Minera de DatosLa diferencia entre minera de datos y KDD es que la minera de datos usa algoritmos para extraer informacin y/o patrones derivados dentro del proceso KDD.

4.2 TCNICAS PARA EL PRE-PROCESAMINETO DE DATOS.Engloba a todas aquellas tcnicas de anlisis de datos que permite mejorar la calidad de un conjunto de datos de modo que las tcnicas de extraccin de conocimiento/minera de datos puedan obtener mayor y mejor informacin (mejor porcentaje de clasificacin, reglas con ms completitud, etc.)

COMPONENTES DEL PRE-PROCEAMIENTO DE DATOS. LIMPIEZA DE DATOS (DATA CLEANING): Este proceso consiste en la eliminacin de datos errneos o inconsistentes en trminos generales: Resuelve redundancias. Chequea y resuelve problemas de ruido, datos errneos, valores perdidos. Resuelve inconsistencias/conflictos entre datos REDUCCIN DE DATOS: Consiste en decidir qu datos deben ser utilizados para el anlisis se subdivide en el rango de atributos continuos en intervalos, almacena solo las etiquetas de los intervalos. INTEGRACIN DE DATOS: Obtiene los datos de diferentes fuentes de informacin, resuelve problemas de representacin y codificacin, adems integra los datos desde diferentes tablas para crear informacin homognea. Se basa en combinar mltiples tablas o registros para crear nuevo registros o valores. TRANSFORMACIN DE DATOS (NORMALIZACIN). Las transformaciones consisten principalmente en modificaciones sintcticas llevadas a cabo sobre los datos.

4.3 TCNICAS PARA IDENTIFICACIN DE CONCEPTOS, REGLAS Y RELACIONESPuede decirse que no existen tcnicas o herramientas ampliamente aceptadas para llevar a cabo, de modo automtico, el anlisis de la documentacin que necesita el IC.Sin embargo, las escasas tcnicas existentes poseen una filosofa comn: buscar, a travs de la documentacin, determinados trminos.Tcnicas en las cuales los trminos son determinados por el IC en tiempo de ejecucin.Ante el anlisis de un determinado texto, que constituye parte de la documentacin proporcionada para desarrollar el sistema, establece una serie de trminos que deben ser buscados, automticamente o no, en el texto.Tcnicas en las que los trminos a buscar estn preestablecidos por la tcnica y son dependientes del dominio. Las tcnicas pertenecientes a la tercera familia (trminos preestablecidos independientes del dominio) realizan extraccin tanto de conceptos como de relaciones entre los mismos.Estas tcnicas suelen denominarse de anlisis estructural de textos, dado que extraen conceptos fundamentales del dominio buscando estructuras preestablecidas. La tcnica sabe que los conceptos vienen introducidos en estructuras de tipo definicin, o que las relaciones entre conceptos vienen establecidas en estructuras de tipo afirmacin relacionalPara poder funcionar el anlisis estructural de textos necesita:Tener descritas las estructuras textuales interesantes (definicin, afirmacin,...) y el tipo de conocimientos que aportan (concepto, relacin, caracterstica, valor,...)Tener descrito el modo de detectar las estructuras en el texto.

TCNICAS DE IDENTIFICACIN EntrevistasConsiste en una interaccin sistemtica de un IC con un experto para extraer los conocimientos de experiencia de ste. AbiertasEs una entrevista no estructurada, o abierta, el IC plantea, ms o menos espontneamente, preguntas al experto. EstructuradasEl IC, una vez marcado el tema y la profundidad con que se desea tratarlo, planifica todas las preguntas que debe plantear al experto durante la sesin. CuestionariosEn esta tcnica el IC piensa en un concepto/escenario, que el experto debe averiguar.El experto hace preguntas de tipo SI/NO al IC para descubrir el escenario/concepto. Observacin de tareas habitualesCon frecuencia, la mejor forma de descubrir cmo hace un juicio un experto, efecta un diagnstico, o disea una solucin, es observar a un experto trabajar en un problema real habitual. Anlisis de protocolosAnlisis de un protocolo o caso concreto de forma global.Tres profundidades: Anlisis del Asunto o Materia (dependencias entre conceptos interrelacionados que se infieren en secuencia). Anlisis de Tareas (pasos del procedimiento).

Distinguir el caso dentro de la materia y la tarea asociada.

EmparrilladoSesin de valoracin y recuerdo. Permite establecer prioridades entre caractersticas diferenciadoras de elementos. Incidentes crticosUna variante es plantear al experto casos crticos imaginarios. Se le pide al experto que considere un caso cualquiera y se le convierte en un incidente crtico mediante el planteamiento de situaciones alternativas de la forma: qu pasara si?.Es muy til para determinar lo inslito.

Clasificacin de conceptosEsta tcnica es especialmente aconsejable cuando hay un gran nmero de conceptos en un dominio, de modo que requieren una estructuracin para que sean manejables.

4.4 HERRAMIENTA PARA ANLISIS DEL CONOCIMIENTO, SELECCIN DE DATOS, EXTRACCIN DE REGLAS.Una forma comn del almacenamiento del conocimiento de una organizacin son los documentos. Para poder reutilizar el conocimiento guardado en los documentos es necesario disponer de herramientas de clasificacin, bsqueda, almacenamiento y extraccin.

La bsqueda de texto completo es probablemente el mtodo ms conocido y usado al realizar una bsqueda. La idea detrs de este mtodo es la bsqueda a travs de documentos de palabras clave. Los motores de bsqueda ms conocidos por el pblico general son los que se pueden encontrar en Internet, como Google, Yahoo, Altavista, Lycos, etc. Pero existe una gran variedad de motores de bsqueda, algunos de los cuales examinaremos con un poco ms de detalle en la seccin Error! No se encuentra el origen de la referencia., pgina Error! Marcador no definido.. El modo de operar de estos motores de bsqueda consiste en la construccin de un ndice de palabras claves que se encuentran en los documentos. Estos ndices creados se hacen corresponder cuando se realizan bsquedas. Como resultado de la bsqueda se muestran las pginas que tienen aquellos ndices.

El trabajo en un entorno dinmico exige la obtencin de informacin sobre temas relacionados en distintos momentos del tiempo. Este es uno de los objetivos de las herramientas que permiten la distribucin de informacin personalizada (vase seccin Error! No se encuentra el origen de la referencia., pgina Error! Marcador no definido.). De forma automtica, el usuario tiene acceso a informacin que ha sido seleccionada anteriormente, sin necesidad de realizar el mismo tipo de bsqueda ms de una vez.

Portales Corporativos

La creacin de portales, y en concreto de portales del conocimiento, permite aprovechar la utilizacin de los estndares de Internet e integrar las distintas herramientas de gestin de datos e informacin. Mediante los portales, los individuos tienen acceso a contenido personalizado y, adems, son una herramienta que ayuda a crear ambientes colaborativos. Cada vez adquiere ms importancia el disponer de un portal corporativo porque facilita el acceso a una gran cantidad de informacin sin que el usuario tenga que cambiar de aplicacin para realizar distintas tareas relacionadas con el conocimiento. Otra particularidad de las herramientas de creacin de portales de conocimiento es que, indirectamente, se permite el acceso a una cantidad inmensa de informacin que no necesariamente est depositada en los repositorios de la organizacin, sino que proviene de fuentes externas. Adems, mediante el acceso personalizado e integrado se permite que aumente la eficacia en la bsqueda de informacin.

Herramientas de Simulacin En la mayora de los casos se trata de herramientas que simulan el esquema de coordinacin de una tarea de trabajo, con lo que se pueden corregir errores sin necesidad que se hayan producido. Estn basadas en los procesos de pensamiento humano con la finalidad de poder reproducir sus esquemas principales y corregir los errores que puedan producirse al planificar una tarea compleja dentro de una organizacin. Son de gran utilidad para organizaciones que desarrollan complejos proyectos con una gran cantidad de agentes y dirigidas por directores de proyecto, estos ltimos siendo uno de los principales usuarios de estas herramientas.

Herramientas de Trabajo en Grupo Para hacer efectiva una GC dentro de las complejas organizaciones de hoy en da es necesario disponer de herramientas que permitan generar procesos colaborativos, distribuir y sincronizar tareas en la organizacin, de forma que se pueda reducir el tiempo y aumentar la eficacia. Estas herramientas engloban procesos que podran incluirse dentro de funcionalidades de bsqueda o de distribucin personalizada de informacin, pero van mucho ms all de estos para convertirse en paquetes altamente integrados capaces de realizar una gestin casi integral del conocimiento de la organizacin. Tenemos que mencionar que para que estas herramientas tan complejas puedan servir a la organizacin en su totalidad en muchos casos tienen que realizarse cambios no solo organizativos, sino incluso culturales en la empresa/organizacin en la que se implanten. Las herramientas analizadas incluyen tantas funciones de relacin sncrona, es decir, que se llevan a cabo en el mismo instante de tiempo, como funciones de relacin asncrona, sin que sea necesario que las distintas partes que comparten conocimiento se comuniquen en el mismo instante.

Ejemplos de algunos buscadores de informacin:Oracle Database Server http://www.oracle.com/database/index.html La base de datos de Oracle es una de las herramientas ms potentes del mercado. Es un repositorio en el cual se integran mltiples aplicaciones capaces de personalizar las necesidades de cliente. Internet Platform, Oracle 8i y Oracle DataWarehouse son las principales bases de datos que incluye Database Server.

Lycos Site Spider http://www.lycos.com/software/software-intranet.html Permite buscar un determinado contenido en un sitio web. Puede recoger e indexar informacin automticamente utilizando la base de datos de texto de Inmagic. Adems, es capaz de actualizar la base de datos a medida que el contenido de un sitio web cambia. Meridio http://www.teamware.com/teamware/Products/meridio/meridio.htm

Sistema de gestin de documentos a nivel empresarial. Asegura que la informacin est protegida de accesos no autorizados y facilita, al mismo tiempo, que los individuos que la necesiten puedan compartirla. Interlan Systems http://www.inter-lan.com/

Sistema de Gestin de la Informacin y del Conocimiento abierto, flexible y adaptable a la mayora de los estndares informticos actuales, que permite ofrecer servicio y optimizar la gestin empresarial de medianas y grandes empresas que necesiten clasificar, archivar, publicar, traducir y buscar la informacin de una manera personalizada, rpida y sencilla en distintos idiomas. Inter-Search es un mdulo que permite buscar la informacin dentro de la Intranet y obtener los resultados de la bsqueda de forma estructurada.

CONCLUSIONEn trminos generales la minera de datos engloba a todas aquellas tcnicas de anlisis de datos que permite mejorar la calidad de un conjunto de datos de modo que las tcnicas de extraccin de conocimiento/minera de datos puedan obtener mayor y mejor informacin (mejor porcentaje de clasificacin, reglas con ms completitud, etc.)

REFERENCIAS

Herramientas de gestin del conocimientohttp://www.tdx.cat/bitstream/handle/10803/127223/Tdlf1de1.pdf?sequence=2Introduccin a la minera de datoshttp://www.redalyc.org/pdf/944/94402303.pdf