Interpretación semántica

44
N interpretación semántica 1 Interpretación semántica Interpretación semántica Semántica léxica Desambiguación de sentidos Word Sense Disambiguation (WSD)

description

Interpretación semántica. Interpretación semántica Semántica léxica Desambiguación de sentidos Word Sense Disambiguation (WSD). La Interpretación Semántica. semántica léxica "Pedro"  pedro. "rie"  (lambda(x), reir(x))) composición (lambda(x), reir(x)) pedro  reir(pedro). - PowerPoint PPT Presentation

Transcript of Interpretación semántica

Page 1: Interpretación semántica

PLN interpretación semántica 1

Interpretación semántica

• Interpretación semántica• Semántica léxica• Desambiguación de sentidos

• Word Sense Disambiguation (WSD)

Page 2: Interpretación semántica

PLN interpretación semántica 2

La Interpretación Semántica

• semántica léxica• "Pedro" pedro.

• "rie" (lambda(x), reir(x)))

• composición• (lambda(x), reir(x)) pedro reir(pedro).

• ¿Cómo llevar a cabo la IS? • función (o funciones) de composición

• momento de llevar a cabo la interpretación

Page 3: Interpretación semántica

PLN interpretación semántica 3

función de composición = lambda evaluación.

ORACION GN FV, (2 1)

GN np, (1)

FV vi, (1)

FV vt GN (1 2)

Pedro np, pedro

María np, maria

ríe vi, (lambda (x), reir(x))

ama a vt, ((lambda (x), (lambda (y), ama(y,x))))

Page 4: Interpretación semántica

PLN interpretación semántica 4

"Pedro rie"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) reir(x)) pedro) = reir(pedro) | |_______GN | | SEM = (1) = (np:SEM) = pedro | | | |_______np | | SEM = pedro | | | Pedro |_______FV

| SEM = (1) = (vi:SEM) = (lambda(x) reir(x)) |_______vi

| SEM = (lambda(x) reir(x)) | ríe

ejemplo 1

Page 5: Interpretación semántica

PLN interpretación semántica 5

"Pedro ama a María"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) amar(x,maria)) pedro) = amar(pedro,maria) |_______GN | | SEM = (1) = (np:SEM) = pedro | |________np | | SEM = pedro | Pedro |_______FV SEM=(1 2) = (vt:SEM GN:SEM) = (((lambda(y)

| (lambda(x) amar(x,y))) maria)=((lambda(x)amar(x,maria)) |_______vt | | SEM = ((lambda(y) (lambda(x) amar(x,y))) | ama a | |_______GN

| SEM = (1) = (np:SEM) = maria |_______np

| SEM = maria María

ejemplo 2

Page 6: Interpretación semántica

PLN interpretación semántica 6

Estrategias de la interpretacion semántica

• proceso posterior al análisis sintáctico• se parte del arbol de análisis

• unificacion del proceso sintáctico y semántico• existe un solo proceso de análisis.

• las categorias gramaticales se unifican: gramáticas semánticas

• proceso en paralelo sintaxis/semántica.• la semántica sirve para validar hipotesis de análisis sintáctico

• las interpretaciones (parciales) semánticas se construyen a medida que se construye el arbol de análisis.

• analizadores guiados por la semántica. • el papel de la sintaxis se reduce (si es que existe análisis sintáctico) a validar

determinadas hipotesis semánticas (ej. patrones de subcategorización o restricciones de selección) o a categorizar partes del texto.

Page 7: Interpretación semántica

PLN interpretación semántica 7

Análisis semántico independiente y posterior al sintáctico (Allen)

• aplicación de reglas de interpretación.

• <esquema> <descripcion parcial de la f.l.>

• el esquema consiste en un conjunto de restricciones selectivas, producto del análisis sintáctico.

• la representación semántica será una forma lógica. Las componentes de una construcción sintáctica darán lugar a formas lógicas parciales (con alguno de sus elementos aun no determinado).

• notacion:• * objeto (identificación única) descrito por la forma lógica

• t (<descritor>) tipo del constituyente

• v (<descritor>) interpretación semántica del constituyente

• ? elemento aún no determinado.

Page 8: Interpretación semántica

PLN interpretación semántica 8

Sintaxis de la forma lógica

• (<OPERADOR> <NOMBRE> <TIPO> <MODIFICADORES>)• Los operadores dependen del tipo de estructura a representar:

• Sintagmas nominales no cuantificados:• DEF/SING, DEF/PL, INDEF/SING, INDEF/PL

• Sintagmas nominales cuantificados• EACH, SOME

• Pronombres interrogativos• WH, WH/PL, WH/SING

• Pronombres personales• PRO

• Nombres propios• NAME

• Oraciones• ASSERT, Y/N_QUERY, WH_QUERY, COMMAND

• Sintagmas verbales• PAST, PRES, FUT, INF

• Relaciones• OR, AND, BUT

Page 9: Interpretación semántica

PLN interpretación semántica 9

Ejemplos de reglas de interpretacion 1

a green apple(NP DET a

ADJ (green)HEAD apple)

{(? A1 APPLE (COLOR C1 GR137)), (? A1 APPLE (UNRIPE C1))}

Page 10: Interpretación semántica

PLN interpretación semántica 10

Ejemplos de reglas de interpretacion 2

The man laughed(S SUBJ (NP DET the

HEAD manNUM {3s}SEM (DEF/SING M1 MAN))

MAIN-V laughTENSE past)

(? L1 LAUGH

[AGENT (DEF/SING M1 MAN)])

Page 11: Interpretación semántica

PLN interpretación semántica 11

Algoritmo de interpretacion semántica 1

• Se asume que cada subconstituyente se interpreta automáticamente cuando se efectúa la primera verificación semántica sobre él

• Se crea un nombre (reemplazando *)• Análisis del núcleo

• aplicar todas las reglas de interpretación indexadas por el núcleo

• mezclar las FLs parciales

• Para cada interpretación del núcleo aplicar lo siguiente hasta que todos los modificadores hayan actuado• seleccionar un modificador (componente sintáctico aún no interpretado)

• aplicar todas las reglas de interpretación indexadas por el head del modificador

• mezclar las FLs

• Producir las FLs mediante unificación

Page 12: Interpretación semántica

PLN interpretación semántica 12

Interpretacion de los constituyentes simples

• en general, la interpretacion de un constituyente comienza interpretando el nucleo de dicho constituyente (lo cual da lugar a llamadas recursivas al mecanismo de interpretacion).

• la interpretacion del nucleo suele obligar a la interpretacion de alguno de los modificadores. el resultado de esta fase (head analysis) es un conjunto de descripciones parciales correspondientes a la interpretacion del nucleo y una lista de modificadores ya utilizados).

• la siguiente fase (modifiers analysis) consiste en la interpretacion de los modificadores aun no interpretados y la incorporacion del resultado a la forma logica (parcial) que interpreta al componente.

Page 13: Interpretación semántica

PLN interpretación semántica 13

Algoritmo de unificación 1

• Unificador• ? unifica con cualquier cosa. • dos objetos identicos unifican• dos objetos con modificadores unifican si son

consistentes los modificadores correspondientes a los casos más internos.

• la unificación con valores ambiguos se realiza mediante la intersección de los valores de cada una de las interpretaciones parciales.

Page 14: Interpretación semántica

PLN interpretación semántica 14

Algoritmo de unificación 2

• ejemplos• (? R1 RUN [THEME (NAME J1 PERSON "John"]))

• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])

• no son unificables• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))

• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])

• si lo son, dando lugar a:• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))

[THEME (DEF/SING P1 PRINT-PRESS)])

Page 15: Interpretación semántica

PLN interpretación semántica 15

Algoritmo de interpretacion semántica 2

The dishwasher laughed(S SUBJ (NP DET the

NUM {3s}HEAD diswasher)

MAIN-V laugh TENSE past)

(the.1) (NP DET the NUM {3s}) (DEF/SING * ? ?)

(dishwasher.1) (NP HEAD dishwasher) (? * {PERSON_TYPE_43, APPLIANCE_TYPE_3} ?)

(laugh.1) (S SUBJ +animate MAIN_V laugh) (? * LAUGH [AGENT V(SUBJ)])

(past.1) (S TENSE PAST) (PAST ? ? ?)

Page 16: Interpretación semántica

PLN interpretación semántica 16

aplicacion de la regla laugh.1 ==> subj ha de tener la caracteristica +animate==> hay que analizar subj ==> hay que analizar np ==> aplicacion de the.1 y diswasher.1

(DEF/SING D1 ? ?)(? D1 {PERSON-TYPE-3,

APPLIANCE-TYPE-43} ?)

Algoritmo de interpretacion semántica 3

Page 17: Interpretación semántica

PLN interpretación semántica 17

se unifican las descripciones parcialesel resultado rellena el descriptor sem del np y del subj.

(S SUBJ (NP DET theNUM {3s}HEAD diswasherSEM (DEF/SING D1

{PERSON-TYPE-3, APPLIANCE-TYPE-43})

MAIN-V laughTENSE past)

Algoritmo de interpretacion semántica 4

Page 18: Interpretación semántica

PLN interpretación semántica 18

ahora ya es posible la aplicacion de la regla laugh.1, dando lugar a

(? L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])

la interpretacion de TENSE, mediante la aplicacion de la regla past.1 da lugar a

(PAST ? ? ?)

y la posterior unificacion a

(PAST L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])

Algoritmo de interpretacion semántica 5

Page 19: Interpretación semántica

PLN interpretación semántica 19

Jerarquía de reglas

(give.1) (S SUBJ +animate MAIN_V give) (? * GIVE1 [AGENT V(SUBJ)])(give.2) (S OBJ +physobj MAIN_V give) (? * GIVE1 [THEME V(OBJ)])(give.3) (S IOBJ +org MAIN_V give) (? * GIVE1 [TO_POSS V(IOBJ)])(give.4) (S MAIN_V give MODS (PP PREP to POBJ +org)) (? * TO_POSS [AGENT V(POBJ)])

action

obj/action

to/action inst/action

laugh

give break

Page 20: Interpretación semántica

PLN interpretación semántica 20

Interpretacion de los componentes complejos 1

The man gave the company a car at the fairgrounds

(S SUBJ (NP "the man")MAIN-V giveTENSE pastOBJ (NP "a car")IOBJ (NP "the company")MODS ([PP PREP at

POBJ (NP "the fairgrounds")]))

(? G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)])

la aplicación del algoritmo sobre el núcleo da lugar a:

de forma que sólo TENSE y MODS quedan sin interpretar

Page 21: Interpretación semántica

PLN interpretación semántica 21

la interpretacion de tense, mediante la aplicacion de la regla past.1 da lugar a

(PAST ? ? ?)

la interpretacion de mods se realiza mediante la regla at.1. dando lugar a:

(? G1 ? (AT-LOC G1 (DEF/SING F1 FAIRGROUND)))

Interpretacion de los componentes complejos 2

Page 22: Interpretación semántica

PLN interpretación semántica 22

La posterior unificacion de estas dos formas con la resultante del nucleo produce:

(PAST G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)](AT-LOC G1 (DEF/SING F1 FAIRGROUND)))

Interpretacion de los componentes complejos 3

Page 23: Interpretación semántica

PLN interpretación semántica 23

Gramáticas semánticas 1

• combinación de sintaxis y semántica en un único formalismo (normalmente gramáticas incontextuales)

• en las gramáticas semánticas los símbolos terminales son categorías semánticas.• tamaño mayor (número de reglas).

• número de palabras por categoría mucho menor.

• mayor ambigüedad.

• problema: generalidad

• aplicación: sistemas robustos y eficientes en dominios restringidos.• la construcción de la forma lógica a partir de la gramática se hace

directamente mediante simples extensiones.

Page 24: Interpretación semántica

PLN interpretación semántica 24

Gramáticas semánticas 2

RES_VP RESERVING, RES_MODSDEP_VP DEPARTING, DEP_MODS

RESERVING RESERVE_VERB, FLIGHTRES_MODS for, PERSONRES_MODS []

DEPARTING DEPART_VERBDEPARTING DEPART_VERB, SOURCE_LOCDEP_MODS DEP_MOD, DEP_MODSDEP_MODS []DEP_MOD to, DEST_LOCDEP_MOD from, SOURCE_LOC

Page 25: Interpretación semántica

PLN interpretación semántica 25

Semántica léxica

• Diccionarios semánticos• Ontologías

• Tipología

• Granularidad

• Ámbito

• Generalidad

• Ejemplos• UMLS

• WordNet

• EuroWordnet

• Otros recursos

Page 26: Interpretación semántica

PLN interpretación semántica 26

Ejemplo: UMLS

• UMLS (Unified Medical Language System) • National Library of Medecine, USA Department of Health and Human

Services

• Conjunto de recursos

• Metatesauro

• 330.000 conceptos, 735.000 términos

• Red Semántica

• Conjunto de categorías semánticas básicas (135 tipos semánticos, 51 relaciones)

• Enlaces con los Vocabularios fuente

• 30 fuentes (multilingües)

• Lexicón especializado

• con información morfo-sintáctica

Page 27: Interpretación semántica

PLN interpretación semántica 27

Ejemplo: WordNet

• WordNet • Universidad de Princeton (Fellbaum,1998)

• Conceptos lexicalizados (palabras, lexías)• synsets: conjunto de sinónimos (sinonimia en contexto)

• Cobertura en nombres, verbos, adjetivos y adverbios

• Relacionados entre sí por relaciones semánticas• sinonimia

• antonimia

• hiperonimia-hiponimia

• meronimia

• implicación

• causa

• ...

• Wn1.5, Wn1.6,Wn 1.7: 120.000 palabras, 100.000 synsets

• Wn2.0, Extended WordNet

http://www.cogsci.princeton.edu/~wn/

Page 28: Interpretación semántica

PLN interpretación semántica 28

{vehicle}

{conveyance; transport}

{car; auto; automobile; machine; motorcar}

{cruiser; squad car; patrol car; police car; prowl car} {cab; taxi; hack; taxicab; }

{motor vehicle; automotive vehicle}

{bumper}

{car door}

{car window}

{car mirror}

{hinge; flexible joint}

{doorlock}

{armrest}

hyperonym

hyperonym

hyperonym

hyperonymhyperonym

meronym

meronym

meronym

meronym

Fragmento de WN1.5

Page 29: Interpretación semántica

PLN interpretación semántica 29

EuroWordNet

• Proyecto LE-2 4003 Telematics Application Programme de la Unión Europea• Redes semánticas de diversas lenguas, integradas e interconectadas

• Inglés Universidad de Sheffield

• Holandés Univ. de Amsterdam

• Italiano I.L.C. de Pisa

• Español UB, UPC, U.N.E.D

• Cobertura básicamente nominal y verbal (50.000 acepciones por lengua)• Gran riqueza en las relaciones semánticas

• inter/intra linguales, inter/intra categoriales

• EWN2• Alemán, Checo, Estonio, Francés

• Extensiones al catalán, gallego y vasco• Extensiones y mejoras

http://www.hum.uva.nl/~ewn/http://www.lsi.upc.es/~nlp/

Page 30: Interpretación semántica

PLN interpretación semántica 30

Page 31: Interpretación semántica

PLN interpretación semántica 31

Levin classes (3100 verbs)

• 47 top level classes, 193 second and third level

• Basadas en pares de plantillas sintácticas.John broke the jar. / Jars break easily. / The jar broke.

John cut the bread. / Bread cuts easily. / *The bread cut. John hit the wall. / *Walls hit easily. / *The wall hit.

• Reflejan implícitamente los componentes semánticoscontact, directed motion, exertion of force, change of state

• Sinonimia, plantillas sintácticas (patrones de subcategorización)

Page 32: Interpretación semántica

PLN interpretación semántica 32

Intersective Levin classes

Page 33: Interpretación semántica

PLN interpretación semántica 33

Regular Sense Extensions

John pushed the chair. +force, +contact

John pushed the chairs apart. +ch-state

John pushed the chairs across the room. +ch-loc

John pushed at the chair. -ch-loc

The train whistled into the station. +ch-loc

The truck roared past the weigh station. +ch-loc

Page 34: Interpretación semántica

PLN interpretación semántica 34

VerbNet 1

• Lexicón verbal computacional• Asociaciones entre sintaxis y semántica

• Syntactic frames (patrones de subcategorización) y restricciones de selección.

• Información semántica léxica – estructura predicado/argumentos

• Componentes semánticos representados como predicados• Links a synsets de WordNet

• Entradas basadas en refinamiento de las clases de Levin

• Propiedades temporales inherentes representadas explícitamente• during(E), end(E), result(E)

Page 35: Interpretación semántica

PLN interpretación semántica 35

Hit Class

Basic Transitive A V P Manner (during(E), directedmotion,A)^

Manner (end(E), forceful,A)^

Contact(end(E),A,P)

Transitive with

Instrument

AVP with I Manner (during (E)directedmotion,I)^

Manner (end (E),forceful,I)^

Contact (end(E),I,P)

Conative AV at P Manner (during (E), directedmotion, A)

With/against alternation A V I against/on P

Manner(during (E), directedmotion, I)^

Manner(end(E), forceful, I)^

Contact (end(E), I, P)

<<MEMBERS>> [<hit1>, <kick1>,<slap1>…]<<THEMATIC ROLES>> Agent(A), Patient(P), Instrument(I)<<SELECT RESTRICTIONS>> Agent [+animate],

Patient [+concrete],Instrument [+concrete,-animate]

<<FRAMES and PREDICATES>>

VerbNet 2

Page 36: Interpretación semántica

PLN interpretación semántica 36

Penn Treebank

• 1,3 millones de palabras, 40.000 oraciones• Wall Street Journal y otras fuentes• POS tagged• Syntactically Parsed

Page 37: Interpretación semántica

PLN interpretación semántica 37

A TreeBanked Sentence

Analysts

S

NP-SBJ

VP

have VP

been VP

expecting NP

a GM-Jaguar pact

NP

that

SBAR

WHNP-1

*T*-1

S

NP-SBJVP

wouldVP

give

the US car maker

NP

NP

an eventual 30% stake

NP

the British company

NP

PP-LOC

in

(S (NP-SBJ Analysts) (VP have (VP been (VP expecting

(NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)

(S (NP-SBJ *T*-1) (VP would

(VP give (NP the U.S. car maker)

(NP (NP an eventual (ADJP 30 %) stake) (PP-LOC in (NP the British

company))))))))))))

Analysts have been expecting a GM-Jaguar pact that would give the U.S. car maker an eventual 30% stake in the British company.

Page 38: Interpretación semántica

PLN interpretación semántica 38

Proposition Bank (Propbank)

Powell met Zhu Rongji

Proposition: meet(Powell, Zhu Rongji)Powell met with Zhu Rongji

Powell and Zhu Rongji met

Powell and Zhu Rongji had a meeting

. . .

When Powell met Zhu Rongji on Thursday they discussed the return of the spy plane.

meet(Powell, Zhu) discuss([Powell, Zhu], return(X, plane))

debate

consult

joinwrestle

battle

meet(Somebody1, Somebody2)

Generalización de oraciones a proposiciones

Page 39: Interpretación semántica

PLN interpretación semántica 39

The same sentence, PropBanked

Analysts

have been expecting

a GM-Jaguar pact

Arg0 Arg1

(S Arg0 (NP-SBJ Analysts) (VP have (VP been (VP expecting

Arg1 (NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)

(S Arg0 (NP-SBJ *T*-1) (VP would

(VP give Arg2 (NP the U.S. car maker)

Arg1 (NP (NP an eventual (ADJP 30 %) stake)

(PP-LOC in (NP the British company))))))))))))that would give

*T*-1

the US car maker

an eventual 30% stake in the British company

Arg0

Arg2

Arg1

expect(Analysts, GM-J pact)give(GM-J pact, US car maker, 30% stake)

Page 40: Interpretación semántica

PLN interpretación semántica 40

Desambiguación de sentidos 1

• Sense (sentido, acepción)• distinción del significado de una palabra (word type)

observable en diferentes usos (word tokens)

• Word Sense Disambiguation (WSD)• dada una palabra (word token) en un contexto determinar cuál

es su sentido correcto

Page 41: Interpretación semántica

PLN interpretación semántica 41

Desambiguación de sentidos 2

• Problemas• Homonimia: significados no relacionados

• banco financiero, banco de pesca

• Polisemia: significados relacionados

• Polisemia regular (sistemática)• entré en (el edificio de) la universidad

• Metáfora• Me bebí un vaso de vino

• ¿Cuántos sentidos? ¿Cuáles?

• ¿Realmente es posible?

Page 42: Interpretación semántica

PLN interpretación semántica 42

Desambiguación de sentidos 3

• Problema similar al POS tagging• Se pueden intentar aproximaciones similares

• Pero es mucho más difícil

• Restricciones habituales• Yarowsky (1995)

• One sense per discourse

• One sense per collocation

Page 43: Interpretación semántica

PLN interpretación semántica 43

Desambiguación de sentidos 4

• Una posible solución (Naive Bayes)• Sea w la palabra a desambiguar

• Sean ck los posibles sentidos

• Sea el vector de contexto (p.ej. ventana fija de 100 palabras).

• Aplicando Bayes tenemos:

x

)|(maxarg' xcPc kck

Page 44: Interpretación semántica

PLN interpretación semántica 44

Desambiguación de sentidos 5

xinv

kkjc

kkc

kkc

kk

c

kc

jk

k

k

k

k

cPcvP

cPcxP

cPcxP

cPxP

cxP

xcPc

)(log)|(logmaxarg

)(log)|(logmaxarg

)()|(maxarg

)()(

)|(maxarg

)|(maxarg'