Clasificación y Agrupamiento

15
Clasificación y Agrupamiento

Transcript of Clasificación y Agrupamiento

Page 1: Clasificación y Agrupamiento

Clasificación y Agrupamiento

Page 2: Clasificación y Agrupamiento

Características para la extracción de datos

• Siempre que se haga una clasificación se deben tener bien definido las variables de interés.

• Existen dos tipos de características principales en las ciencias biomédicas.– Características biomédicas y biológicas.– Características de señales biomedicas y

procesamiento de imagen.

Page 3: Clasificación y Agrupamiento

Características biomédicas y biológicas.

• Son definidas por el conocimiento biológico y medico disponible de los sistemas biológicos que se estudian.

• Y son propuestos por los especialistas en estas ramas

Page 4: Clasificación y Agrupamiento

Características de señal y procesamiento de imagen.

• Este tipo de características son las que un especialista medico o biólogo, no tiene el conocimiento para identificarlas y que describen al sistema biológico.

– Energía de la señal en banda de frecuencias – Medidas de las onduletas– Medidas complejas– Medidas geométricas– Descriptores de fourier

Page 5: Clasificación y Agrupamiento

Energía de la señal en banda de frecuencias

• El contenido de una señal en diferentes bandas de frecuencias cuantitativamente expresa las características que son vitales en el diagnostico de señales biomédicas. – En el EEG´s se tienen diferentes ondas• Ondas ß: frecuencias entre 14 y 30 Hz• Ondas : Frecuencias entre 8 y 13 Hz• Ondas : entre 4 y 7 Hz• Ondas : Frecuencias inferiores a 3.5 Hz

Page 6: Clasificación y Agrupamiento
Page 7: Clasificación y Agrupamiento

Medidas de las onduletas (wavelet)

• Estas proporcionan un numero de coeficientes que descompone una señal a diferentes escalas.

• Son normalmente usados para clasificación y agrupamiento de señales biológicas e imágenes.

Page 8: Clasificación y Agrupamiento

Medidas complejas

• Cuantitativamente describe la sofisticada estructura de los sistemas biológicos– Fractal dimensional expresa la complejidad de una

señal y tiene gran importancia en técnicas de procesamiento de señales biológicas.

– Movilidad– Complejidad– Entropía

Page 9: Clasificación y Agrupamiento

Medidas geométricas

• Son importantes en le clasificación de una imagen, y algunas son:

• Área. Que nos proporciona el tamaño del objeto de una imagen. Mostrándonos el numero de píxeles que conforman el objeto

• Perímetro. Es el numero de píxeles que forman el contorno que distingue al objeto con el fondo de la imagen.

Page 10: Clasificación y Agrupamiento

Compacticidad

• Es una característica que nos indica que tanta área esta inmersa en un perímetro, es decir que tan compacto es el objeto

Area

PerimetrodadCampactici

2

Page 11: Clasificación y Agrupamiento

Eje mayor y Eje menor

• El eje mayor es la mayor distancia que existe entre un par de píxeles que componen al objeto.

• Un eje perpendicular al eje mayor es llamado eje menor

• Estas medidas son importantes para la clasificación de células

Page 12: Clasificación y Agrupamiento

Excentricidad

• Esta definido al evaluar la desviación de la forma del objeto y la similitud que tiene con una forma circular.

• Y esta definido por la siguiente formulamenorejedelLonjitud

mayorejedelLonjituddadExcentrici

Page 13: Clasificación y Agrupamiento

Descriptores de fourier (DF’s)

• Esencialmente son transformadas discretas de fourier que representan el contorno, a través de series de fourier

• Invariantes en trasformaciones geométrica y tolerantes al ruido

Page 14: Clasificación y Agrupamiento

El algoritmo de k-medias.

• Uno de las técnicas mas populares usadas en el análisis de imágenes y en señales biomédicas

• Esta basado en k particiones.

Page 15: Clasificación y Agrupamiento

Clasificador bayesiano

• Un clasificador Bayesiano es una clasificador probabilístico que se basa en aplicar el Teorema de Bayes.

• Se tienen N elementos que pueden provenir de dos o más poblaciones distintas de un universo particionado en K clases. Cada elemento x puede considerarse como una variable aleatoria de dimensión n, en donde n es el número de características retenidas para representar al patrón. El problema consiste en clasificar x en una y sólo una de las poblaciones o clases.