Master thesis presentation

105
Aproximaciones a S 3 VM multiclase aster en tecnolog´ ıas del lenguaje en la web Arkaitz Zubiaga Mendialdua UNED 29 de septiembre de 2008 Director: V´ ıctor Fresno Fern´ andez

description

My master thesis presentation on 2008-09-29

Transcript of Master thesis presentation

Page 1: Master thesis presentation

Aproximaciones a S3VM multiclaseMaster en tecnologıas del lenguaje en la web

Arkaitz Zubiaga Mendialdua

UNED

29 de septiembre de 2008

Director: Vıctor Fresno Fernandez

Page 2: Master thesis presentation

Clasificacion automatica de textos

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 2 / 43

Page 3: Master thesis presentation

Clasificacion automatica de textos

¿Que es?

Se dispone de una coleccion de documentos:

D = {d1, ..., d|D|}

Y una serie de categorıas predefinidas:

C = {c1, ..., c|C |}

La clasificacion se define como:

〈dj , ci 〉 ∈ D × C

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 3 / 43

Page 4: Master thesis presentation

Clasificacion automatica de textos

¿Que es?

Se dispone de una coleccion de documentos:

D = {d1, ..., d|D|}

Y una serie de categorıas predefinidas:

C = {c1, ..., c|C |}

La clasificacion se define como:

〈dj , ci 〉 ∈ D × C

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 3 / 43

Page 5: Master thesis presentation

Clasificacion automatica de textos

¿Que es?

Se dispone de una coleccion de documentos:

D = {d1, ..., d|D|}

Y una serie de categorıas predefinidas:

C = {c1, ..., c|C |}

La clasificacion se define como:

〈dj , ci 〉 ∈ D × C

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 3 / 43

Page 6: Master thesis presentation

Clasificacion automatica de textos

Caracterısticas

Aprendizaje automatico

Aprendizaje supervisadoAprendizaje semisupervisado

Taxonomıa

BinariaMulticlase

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 4 / 43

Page 7: Master thesis presentation

Clasificacion automatica de textos

Caracterısticas

Aprendizaje automatico

Aprendizaje supervisadoAprendizaje semisupervisado

Taxonomıa

BinariaMulticlase

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 4 / 43

Page 8: Master thesis presentation

Motivacion

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 5 / 43

Page 9: Master thesis presentation

Motivacion

Motivacion

Muchos estudios para clasificacion de texto plano (noticias), peromenos sobre paginas web.

Problema tıpico de clasificacion de paginas web

Semisupervisado: pocos documentos etiquetados respecto a lacoleccion a clasificar.Multiclase: taxonomıa mayor que 2.

Tecnica de clasificacion escogida: SVM.

Problema: Poco trabajo para SVM semisupervisado multiclaseNecesidad de nuevas propuestas para resolver el problema planteado

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 6 / 43

Page 10: Master thesis presentation

Motivacion

Motivacion

Muchos estudios para clasificacion de texto plano (noticias), peromenos sobre paginas web.

Problema tıpico de clasificacion de paginas web

Semisupervisado: pocos documentos etiquetados respecto a lacoleccion a clasificar.Multiclase: taxonomıa mayor que 2.

Tecnica de clasificacion escogida: SVM.

Problema: Poco trabajo para SVM semisupervisado multiclaseNecesidad de nuevas propuestas para resolver el problema planteado

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 6 / 43

Page 11: Master thesis presentation

Motivacion

Motivacion

Muchos estudios para clasificacion de texto plano (noticias), peromenos sobre paginas web.

Problema tıpico de clasificacion de paginas web

Semisupervisado: pocos documentos etiquetados respecto a lacoleccion a clasificar.Multiclase: taxonomıa mayor que 2.

Tecnica de clasificacion escogida: SVM.

Problema: Poco trabajo para SVM semisupervisado multiclaseNecesidad de nuevas propuestas para resolver el problema planteado

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 6 / 43

Page 12: Master thesis presentation

Motivacion

Motivacion

Muchos estudios para clasificacion de texto plano (noticias), peromenos sobre paginas web.

Problema tıpico de clasificacion de paginas web

Semisupervisado: pocos documentos etiquetados respecto a lacoleccion a clasificar.Multiclase: taxonomıa mayor que 2.

Tecnica de clasificacion escogida: SVM.

Problema: Poco trabajo para SVM semisupervisado multiclase

Necesidad de nuevas propuestas para resolver el problema planteado

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 6 / 43

Page 13: Master thesis presentation

Motivacion

Motivacion

Muchos estudios para clasificacion de texto plano (noticias), peromenos sobre paginas web.

Problema tıpico de clasificacion de paginas web

Semisupervisado: pocos documentos etiquetados respecto a lacoleccion a clasificar.Multiclase: taxonomıa mayor que 2.

Tecnica de clasificacion escogida: SVM.

Problema: Poco trabajo para SVM semisupervisado multiclaseNecesidad de nuevas propuestas para resolver el problema planteado

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 6 / 43

Page 14: Master thesis presentation

¿Por que SVM?

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 7 / 43

Page 15: Master thesis presentation

¿Por que SVM?

¿Por que SVM?

Muchos estudios recientes: Bolelli et al. (2007); Bordes et al. (2007);Sun et al. (2007); Wang et al. (2007a,b); Zien et al. (2007);Heymann et al. (2008)).

Mejores resultados que otras tecnicas para clasificacion de textos.

La utilizacion de un kernel facilita la tarea de clasificacion para zonasdisjuntas.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 8 / 43

Page 16: Master thesis presentation

¿Por que SVM?

Comparativa con otras tecnicas

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 9 / 43

Page 17: Master thesis presentation

¿Por que SVM?

Comparativa con otras tecnicas

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 10 / 43

Page 18: Master thesis presentation

¿Por que SVM?

Comparativa con otras tecnicas

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 11 / 43

Page 19: Master thesis presentation

SVM

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 12 / 43

Page 20: Master thesis presentation

SVM

SVM

Modelo espacio vectorial

Busqueda de hiperplano de separacion

Maximizacion de margen

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 13 / 43

Page 21: Master thesis presentation

SVM

SVM

Modelo espacio vectorial

Busqueda de hiperplano de separacion

Maximizacion de margen

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 13 / 43

Page 22: Master thesis presentation

SVM

SVM

Modelo espacio vectorial

Busqueda de hiperplano de separacion

Maximizacion de margen

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 13 / 43

Page 23: Master thesis presentation

SVM

SVM

Modelo espacio vectorial

Busqueda de hiperplano de separacion

Maximizacion de margen

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 13 / 43

Page 24: Master thesis presentation

SVM

SVM

Funcion de optimizacion: f (x) = ω · x + b

Problema: Dificil de computar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 14 / 43

Page 25: Master thesis presentation

SVM

SVM

Funcion de optimizacion: f (x) = ω · x + b

Problema: Dificil de computar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 14 / 43

Page 26: Master thesis presentation

SVM

SVM

Funcion de optimizacion: f (x) = ω · x + b

Problema: Dificil de computar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 14 / 43

Page 27: Master thesis presentation

SVM

SVM

Se utiliza funcion equivalente:

min1

2||ω||2 + C ·

n∑i=1

ξdi

Sujeto a: yi (ω · xi + b) ≥ 1− ξi , ξi ≥ 0

Utilizacion de funcion de kernel para casos no lineales.

Unicamente resuelve problemas binarios y supervisados.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 15 / 43

Page 28: Master thesis presentation

SVM

SVM

Se utiliza funcion equivalente:

min1

2||ω||2 + C ·

n∑i=1

ξdi

Sujeto a: yi (ω · xi + b) ≥ 1− ξi , ξi ≥ 0

Utilizacion de funcion de kernel para casos no lineales.

Unicamente resuelve problemas binarios y supervisados.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 15 / 43

Page 29: Master thesis presentation

SVM

SVM

Se utiliza funcion equivalente:

min1

2||ω||2 + C ·

n∑i=1

ξdi

Sujeto a: yi (ω · xi + b) ≥ 1− ξi , ξi ≥ 0

Utilizacion de funcion de kernel para casos no lineales.

Unicamente resuelve problemas binarios y supervisados.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 15 / 43

Page 30: Master thesis presentation

SVM multiclase

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 16 / 43

Page 31: Master thesis presentation

SVM multiclase

SVM multiclase

Aproximaciones a SVM multiclase:

Directa.

Combinacion de binarios.

One-against-one.One-against-all.

Se ha trabajado con colecciones supervisadas, pero apenas consemisupervisadas.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 17 / 43

Page 32: Master thesis presentation

SVM multiclase

SVM multiclase

Aproximaciones a SVM multiclase:

Directa.Combinacion de binarios.

One-against-one.One-against-all.

Se ha trabajado con colecciones supervisadas, pero apenas consemisupervisadas.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 17 / 43

Page 33: Master thesis presentation

SVM multiclase

SVM multiclase

Aproximaciones a SVM multiclase:

Directa.Combinacion de binarios.

One-against-one.One-against-all.

Se ha trabajado con colecciones supervisadas, pero apenas consemisupervisadas.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 17 / 43

Page 34: Master thesis presentation

SVM multiclase

SVM multiclase: Aproximacion directa

La funcion de optimizacion tiene en cuenta todos los hiperplanos.

mın1

2

n∑m=1

||wm||2 + Cl∑

i=1

∑m 6=yi

ξmi

Sujeto a:wyi · xi + byi ≥ wm · xi + bm + 2− ξmi , ξmi ≥ 0

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 18 / 43

Page 35: Master thesis presentation

SVM multiclase

SVM multiclase: Aproximacion directa

La funcion de optimizacion tiene en cuenta todos los hiperplanos.

mın1

2

n∑m=1

||wm||2 + Cl∑

i=1

∑m 6=yi

ξmi

Sujeto a:wyi · xi + byi ≥ wm · xi + bm + 2− ξmi , ξmi ≥ 0

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 18 / 43

Page 36: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 37: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 38: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 39: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 40: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 41: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 42: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 43: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 44: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 45: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-one

Construye k·(k−1)2 clasificadores binarios

sign(ωTij · x + bij) −→ Sumar un voto a clase positiva entre i y j

La clase con mas votos es la que el sistema predice.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 19 / 43

Page 46: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 47: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 48: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 49: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 50: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 51: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 52: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 53: Master thesis presentation

SVM multiclase

SVM multiclase: One-against-all

Construye k clasificadores binarios

Ci = arg maxi=1,...,k

(ωi · x + bi )

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 20 / 43

Page 54: Master thesis presentation

S3VM

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 21 / 43

Page 55: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 56: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 57: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi

+ C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 58: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 59: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 60: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 61: Master thesis presentation

S3VM

SVM semisupervisado (S3VM)

Utilizacion de documentos no etiquetados en fase de aprendizaje.

Se anade un termino adicional a la funcion de optimizacion:

mın1

2· ||ω||2 + C ·

l∑i=1

ξdi + C ∗ ·u∑

j=1

ξ∗d

j

Problema: se representa mediante una funcion no convexa.

Soluciones de optimizacion convexa.

Utilizado sobre taxonomıas binarias, pero apenas en entornosmulticlase.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 22 / 43

Page 62: Master thesis presentation

S3VM

SVM vs S3VM

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 23 / 43

Page 63: Master thesis presentation

S3VM

SVM vs S3VM

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 23 / 43

Page 64: Master thesis presentation

S3VM

SVM vs S3VM

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 23 / 43

Page 65: Master thesis presentation

S3VM

SVM vs S3VM

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 23 / 43

Page 66: Master thesis presentation

S3VM

SVM vs S3VM

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 23 / 43

Page 67: Master thesis presentation

S3VM multiclase

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 24 / 43

Page 68: Master thesis presentation

S3VM multiclase

S3VM multiclase

Unica referencia hasta el momento (Yajima y Kuo, 2006):

mın(1

2

h∑i=1

βiT K−1βi + Cl∑

j=1

∑i 6=yj

max(0, 1− (βyj

j − βij ))2)

donde β representa el producto entre un vector de variables y una matrizde kernel definidas por el autor.

Su optimizacion puede resultar costosa, por lo que conviene estudiarnuevas aproximaciones.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 25 / 43

Page 69: Master thesis presentation

S3VM multiclase

S3VM multiclase

Unica referencia hasta el momento (Yajima y Kuo, 2006):

mın(1

2

h∑i=1

βiT K−1βi + Cl∑

j=1

∑i 6=yj

max(0, 1− (βyj

j − βij ))2)

donde β representa el producto entre un vector de variables y una matrizde kernel definidas por el autor.

Su optimizacion puede resultar costosa, por lo que conviene estudiarnuevas aproximaciones.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 25 / 43

Page 70: Master thesis presentation

S3VM multiclase

S3VM multiclase

Unica referencia hasta el momento (Yajima y Kuo, 2006):

mın(1

2

h∑i=1

βiT K−1βi + Cl∑

j=1

∑i 6=yj

max(0, 1− (βyj

j − βij ))2)

donde β representa el producto entre un vector de variables y una matrizde kernel definidas por el autor.

Su optimizacion puede resultar costosa, por lo que conviene estudiarnuevas aproximaciones.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 25 / 43

Page 71: Master thesis presentation

Alternativas para S3VM multiclase

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 26 / 43

Page 72: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase

One-against-all-S3VM: No aplicado sobre semisupervisado.

One-against-one-S3VM: No aplicado sobre semisupervisado.

¿Posible existencia de ruido al no poder seleccionar los debidosdocumentos no etiquetados?

Nuevas propuestas:

All-against-all-S3VM.2-steps-SVM.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 27 / 43

Page 73: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase: all-against-all-S3VM

Construye 2k−1 − 1 clasificadores binarios.

Para un ejemplo con 4 clases:

1 vs 2-3-41-2 vs 3-41-3 vs 2-41-4 vs 2-31-2-3 vs 41-2-4 vs 31-3-4 vs 2

sign(ωTij · x + bij) −→ Sumar margen resultante a clases del lado

positivo.

El sistema presenta como prediccion aquella clase con mayorpuntuacion.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 28 / 43

Page 74: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase: 2-steps-SVM

Se aplican 2 pasos de aprendizaje supervisado multiclase:

1 Aprendizaje sobre coleccion de entrenamiento: se aprende con losdocumentos etiquetados, prediciendo los no etiquetados.

121...300...0

2 Clasificacion de la coleccion de test: con la coleccion de entrenamientoetiquetada, se basa el aprendizaje en ella, clasificando la coleccion detest.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 29 / 43

Page 75: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase: 2-steps-SVM

Se aplican 2 pasos de aprendizaje supervisado multiclase:1 Aprendizaje sobre coleccion de entrenamiento: se aprende con los

documentos etiquetados, prediciendo los no etiquetados.

121...300...0

2 Clasificacion de la coleccion de test: con la coleccion de entrenamientoetiquetada, se basa el aprendizaje en ella, clasificando la coleccion detest.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 29 / 43

Page 76: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase: 2-steps-SVM

Se aplican 2 pasos de aprendizaje supervisado multiclase:1 Aprendizaje sobre coleccion de entrenamiento: se aprende con los

documentos etiquetados, prediciendo los no etiquetados.

1 −→ 12 −→ 21 −→ 1...3 −→ 30 −→ 30 −→ 2...0 −→ 1

2 Clasificacion de la coleccion de test: con la coleccion de entrenamientoetiquetada, se basa el aprendizaje en ella, clasificando la coleccion detest.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 29 / 43

Page 77: Master thesis presentation

Alternativas para S3VM multiclase

Alternativas para S3VM multiclase: 2-steps-SVM

Se aplican 2 pasos de aprendizaje supervisado multiclase:1 Aprendizaje sobre coleccion de entrenamiento: se aprende con los

documentos etiquetados, prediciendo los no etiquetados.

1 −→ 12 −→ 21 −→ 1...3 −→ 30 −→ 30 −→ 2...0 −→ 1

2 Clasificacion de la coleccion de test: con la coleccion de entrenamientoetiquetada, se basa el aprendizaje en ella, clasificando la coleccion detest.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 29 / 43

Page 78: Master thesis presentation

Experimentacion

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 30 / 43

Page 79: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).

WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 80: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).

Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 81: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 82: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 83: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 84: Master thesis presentation

Experimentacion

Experimentacion: colecciones

Colecciones utilizadas:

BankSearch: 10.000 documentos web / 10 categorıas (4.000entrenamiento).WebKB: 4.518 documentos web / 6 categorıas (2.000 entrenamiento).Yahoo! Science: 788 documentos web / 6 categorıas (200entrenamiento).

Versiones con diferentes fracciones etiquetadas / no etiquetadas.

9 ejecuciones para cada una de las versiones.

Representacion: tf-idf.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 31 / 43

Page 85: Master thesis presentation

Experimentacion

Experimentacion: implementacion

Software utilizado:

SVM-light (http://svmlight.joachims.org)SVM-multiclass

2-steps-SVM =⇒ 1 step-SVM

Ignorar documentos no etiquetados, ¿empeora los resultados?

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 32 / 43

Page 86: Master thesis presentation

Experimentacion

Experimentacion: implementacion

Software utilizado:

SVM-light (http://svmlight.joachims.org)SVM-multiclass

2-steps-SVM =⇒ 1 step-SVM

Ignorar documentos no etiquetados, ¿empeora los resultados?

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 32 / 43

Page 87: Master thesis presentation

Experimentacion

Experimentacion: evaluacion

Acierto (accuracy): % del numero de predicciones correctas sobre eltotal de documentos testeados.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 33 / 43

Page 88: Master thesis presentation

Resultados

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 34 / 43

Page 89: Master thesis presentation

Resultados

Resultados: BankSearch

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 35 / 43

Page 90: Master thesis presentation

Resultados

Resultados: WebKB

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 36 / 43

Page 91: Master thesis presentation

Resultados

Resultados: Yahoo! Science

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 37 / 43

Page 92: Master thesis presentation

Resultados

Resultados

Mejores resultados para combinacion de supervisados multiclase:2-steps-SVM y 1-step-SVM.

De las combinaciones binarias, destaca all-against-all-S3VM, mientrasque one-against-one-S3VM demuestra que el ruido previsto existe.

1-step-SVM muestra resultados similares que 2-steps-SVM, exceptoen WebKB, que gana; esa coleccion es mas homogenea.

Se mantiene el ranking de los algoritmos.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 38 / 43

Page 93: Master thesis presentation

Resultados

Resultados

Mejores resultados para combinacion de supervisados multiclase:2-steps-SVM y 1-step-SVM.

De las combinaciones binarias, destaca all-against-all-S3VM, mientrasque one-against-one-S3VM demuestra que el ruido previsto existe.

1-step-SVM muestra resultados similares que 2-steps-SVM, exceptoen WebKB, que gana; esa coleccion es mas homogenea.

Se mantiene el ranking de los algoritmos.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 38 / 43

Page 94: Master thesis presentation

Resultados

Resultados

Mejores resultados para combinacion de supervisados multiclase:2-steps-SVM y 1-step-SVM.

De las combinaciones binarias, destaca all-against-all-S3VM, mientrasque one-against-one-S3VM demuestra que el ruido previsto existe.

1-step-SVM muestra resultados similares que 2-steps-SVM, exceptoen WebKB, que gana; esa coleccion es mas homogenea.

Se mantiene el ranking de los algoritmos.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 38 / 43

Page 95: Master thesis presentation

Resultados

Resultados

Mejores resultados para combinacion de supervisados multiclase:2-steps-SVM y 1-step-SVM.

De las combinaciones binarias, destaca all-against-all-S3VM, mientrasque one-against-one-S3VM demuestra que el ruido previsto existe.

1-step-SVM muestra resultados similares que 2-steps-SVM, exceptoen WebKB, que gana; esa coleccion es mas homogenea.

Se mantiene el ranking de los algoritmos.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 38 / 43

Page 96: Master thesis presentation

Conclusiones y trabajo futuro

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 39 / 43

Page 97: Master thesis presentation

Conclusiones y trabajo futuro

Conclusiones

Se han comparado aproximaciones a S3VM multiclase paraclasificacion de paginas web:

Trasladando one-against-one y one-against-all al entornosemisupervisado.Presentando los metodos 2-steps-SVM y all-against-all-S3VM.

Se ha evaluado la aportacion de los documentos no etiquetados en elaprendizaje.

Los mejores resultados han sido para las combinaciones declasificadores supervisados multiclase.

La utilizacion de documentos no etiquetados no ha aportado mucho.

Esta aportacion ha sido algo mayor para colecciones homogeneas.

Entre las combinaciones de semisupervisados binarios,all-against-all-S3VM ha mostrado una gran efectividad, aunque sueficiencia debe mejorar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 40 / 43

Page 98: Master thesis presentation

Conclusiones y trabajo futuro

Conclusiones

Se han comparado aproximaciones a S3VM multiclase paraclasificacion de paginas web:

Trasladando one-against-one y one-against-all al entornosemisupervisado.Presentando los metodos 2-steps-SVM y all-against-all-S3VM.

Se ha evaluado la aportacion de los documentos no etiquetados en elaprendizaje.

Los mejores resultados han sido para las combinaciones declasificadores supervisados multiclase.

La utilizacion de documentos no etiquetados no ha aportado mucho.

Esta aportacion ha sido algo mayor para colecciones homogeneas.

Entre las combinaciones de semisupervisados binarios,all-against-all-S3VM ha mostrado una gran efectividad, aunque sueficiencia debe mejorar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 40 / 43

Page 99: Master thesis presentation

Conclusiones y trabajo futuro

Conclusiones

Se han comparado aproximaciones a S3VM multiclase paraclasificacion de paginas web:

Trasladando one-against-one y one-against-all al entornosemisupervisado.Presentando los metodos 2-steps-SVM y all-against-all-S3VM.

Se ha evaluado la aportacion de los documentos no etiquetados en elaprendizaje.

Los mejores resultados han sido para las combinaciones declasificadores supervisados multiclase.

La utilizacion de documentos no etiquetados no ha aportado mucho.

Esta aportacion ha sido algo mayor para colecciones homogeneas.

Entre las combinaciones de semisupervisados binarios,all-against-all-S3VM ha mostrado una gran efectividad, aunque sueficiencia debe mejorar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 40 / 43

Page 100: Master thesis presentation

Conclusiones y trabajo futuro

Conclusiones

Se han comparado aproximaciones a S3VM multiclase paraclasificacion de paginas web:

Trasladando one-against-one y one-against-all al entornosemisupervisado.Presentando los metodos 2-steps-SVM y all-against-all-S3VM.

Se ha evaluado la aportacion de los documentos no etiquetados en elaprendizaje.

Los mejores resultados han sido para las combinaciones declasificadores supervisados multiclase.

La utilizacion de documentos no etiquetados no ha aportado mucho.

Esta aportacion ha sido algo mayor para colecciones homogeneas.

Entre las combinaciones de semisupervisados binarios,all-against-all-S3VM ha mostrado una gran efectividad, aunque sueficiencia debe mejorar.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 40 / 43

Page 101: Master thesis presentation

Conclusiones y trabajo futuro

Trabajo futuro

Anadir el metodo S3VM multiclase directo al estudio.

Aplicacion de diferentes metodos de representacion, aprovechando lascaracterısticas propias de las paginas web (etiquetado HTML, etc.).

Optimizar el rendimiento de la tecnica all-against-all-S3VM.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 41 / 43

Page 102: Master thesis presentation

Conclusiones y trabajo futuro

Trabajo futuro

Anadir el metodo S3VM multiclase directo al estudio.

Aplicacion de diferentes metodos de representacion, aprovechando lascaracterısticas propias de las paginas web (etiquetado HTML, etc.).

Optimizar el rendimiento de la tecnica all-against-all-S3VM.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 41 / 43

Page 103: Master thesis presentation

Conclusiones y trabajo futuro

Trabajo futuro

Anadir el metodo S3VM multiclase directo al estudio.

Aplicacion de diferentes metodos de representacion, aprovechando lascaracterısticas propias de las paginas web (etiquetado HTML, etc.).

Optimizar el rendimiento de la tecnica all-against-all-S3VM.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 41 / 43

Page 104: Master thesis presentation

Referencias

Indice

1 Clasificacion automatica de textos

2 Motivacion

3 ¿Por que SVM?

4 SVM

5 SVM multiclase

6 S3VM

7 S3VM multiclase

8 Alternativas para S3VM multiclase

9 Experimentacion

10 Resultados

11 Conclusiones y trabajo futuro

12 Referencias y trabajo futuro

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 42 / 43

Page 105: Master thesis presentation

Referencias

Referencias

T. Joachims. 2002. Learning to Classify Text using Support VectorMachines. Kluwer/Springer.

X. Qi y B.D. Davison. 2007. Web Page Classification: Features andAlgorithms. Informe Tecnico LU-CSE-07-010.

F. Sebastiani. 2002. Machine Learning in Automated TextCategorization. ACM Computing Surveys, pp. 1-47.

J. Weston y C. Watkins. 1999. Multi-class Support Vector Machines.Proceedings of ESAAN, the European Symposium on Artificial NeuralNetworks.

Y. Yajima y T.-F. Kuo. 2006. Optimization Approaches forSemi-Supervised Multiclass Classification. Proceedings of ICDMW’06,the 6th International Conference on Data Mining.

Arkaitz Zubiaga Mendialdua (UNED) Aproximaciones a S3VM multiclase 29 de septiembre de 2008 43 / 43