Sie sind auf Seite 1von 37

Introducción al Procesamiento de

Lenguaje Natural
Grupo de PLN - InCo
2010

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Funciones sintácticas
Los sintagmas son los constituyentes de la oración y cumplen diversas
funciones sintácticas:

• sujeto
• objeto directo
• objeto indirecto
• complemento de régimen
• complemento circunstancial

[La maestra] entregó [un regalo] [a quienes se portaron bien] [ayer] [en la escuela].

Juan viajó [a Paris] antes de vivir [en Londres].

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Estructura argumental
verbo argumentos (complementos) (son subcategorizados)
adjuntos

adjuntos - complementos circunstanciales

argumentos - sujeto
- objeto directo
- objeto indirecto
- complementos de régimen (preposicionales)

(Introducción a la gramática del español)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Estructura argumental
Podemos definir varias entradas diferentes para cantar:
cantar1: [sujeto, objeto directo, objeto indirecto]
cantar2: [sujeto, objeto directo]
cantar3: [sujeto]

o definir argumentos opcionales:


cantar: [sujeto, (objeto directo), (objeto indirecto)]

(Introducción a la gramática del español)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Establecen una relación entre sintaxis y semántica

El niño come la manzana.


sujeto <-> agente
objeto directo <-> tema (paciente)

La manzana es comida por el niño.


sujeto <-> tema (paciente)
complemento agente <-> agente

(Introducción a la gramática del español)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos

El ruido desagrada al maestro.


sujeto <-> tema
objeto directo <-> experimentante

El maestro detesta el ruido.


sujeto <-> experimentante
objeto directo <-> tema

(Introducción a la gramática del español)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Juan corta el pan con el cuchillo.

sujeto <-> agente


objeto directo <-> tema
complemento preposicional <-> instrumento

(Introducción a la gramática del español)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
• Existe una diferencia entre la función
gramatical y el rol semántico del
constituyente.
• El análisis sintáctico nos da:
– los constituyentes,
– a veces también la función gramatical,
– pero no el rol semántico

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Mínimamente desearíamos:
• Equivalencia de:
• Los obreros construyeron la casa
• La casa fue construida por los obreros

• Implicación de 1 a 2 en:
• 1. La oferta de una fórmula de pago de la deuda por
Argentina está siendo considerada por los acreedores.
• 2. Argentina ofreció una fórmula de pago de la deuda.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Mínimamente desearíamos:

• Y más aún, implicación de 1 a 2 y 3


• 1. Juan le vendió la casa a Pedro en $ 100.
• 2. Pedro pagó $ 100 por la casa.
• 3. Pedro le compró la casa a Juan.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Hemos visto relaciones semánticas :
– Sinónimos
– Antónimos
– Hipónimos
– …

dentro del repertorio de la lengua


Veremos relaciones semánticas dentro de la oración o cláusula.
Los roles semánticos son estas relaciones.
Implican un elemento distinguido, el predicado, que estructura la grilla
semántica.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Etiquetado de roles semánticos
(ERS, SRL en inglés)
• Tarea en PLN que consiste en asignar
roles semánticos a constituyentes.

[Juan]AGENTE abrió [la puerta]TEMA [con la llave]INSTRUMENTO.

• Requiere:
• Haber identificado los constituyentes
• Haber identificado los predicados (en general, los
verbos)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
Respuestas a preguntas:
P: Cuándo fue derrotado Napoleon?
Buscar: [PACIENTE Napoleon] [PRED
derrotar-synset] [ARGM-TMP *RESP*]
P: Quién derrotó a Napoleón?
Buscar: [PACIENTE Napoleon] [PRED
derrotar-synset] [AGENTE *RESP*]

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
Respuestas a preguntas:
Juan golpeó a Pedro con un palo ayer en la
calle.
Quién?
A quién?
Cuándo ?
Dónde?

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
• Resumen automático
– Los predicados y los núcleos de los roles
argumentales resumen el contenido.
• Extracción de información
– Si se reconocen los roles estamos más cerca
de los atributos de una BD

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Problemas con los roles
semánticos
• Se propuso una cantidad grande de roles
semánticos, pero las propiedades no son siempre
homogéneas.

1. Juan abre esa puerta con la llave roja.


2. La llave roja abre esa puerta.
3. Juan come la pasta con el tenedor.
4. *El tenedor come la pasta.

Distintos tipos de instrumentos.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Recursos léxicos para
ERS
Para el inglés (parcialmente para otras
lenguas) se desarrollaron 2 recursos:
• PropBank
• FrameNet

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
PropBank
http://verbs.colorado.edu/~mpalmer/projects/ace.html
Un corpus de oraciones etiquetadas (Penn Treebank WSJ)
Los argumentos se anotan con números: arg0, arg1, arg2,

argo – proto-agente
arg1 – proto-paciente

De hecho, los roles son específicos para cada predicado.


Más de 100.000 proposiciones (cláusulas) anotadas

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Jurafsky & Martin

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
[El precio de la carne]ARG1 aumentó [un 5%]ARG2.

[El precio de la carne]ARG1 subió [5%]ARG2.

Hubo un aumento [de 5%]ARG2 en [el precio de la


carne]ARG1.

Se usan distintos verbos o incluso un nombre pero hay equivalencia.


FrameNet da respuesta a esto, mientras que PropBank no lo considera.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet,
http://framenet.icsi.berkeley.edu

• FrameNet es un proyecto de anotación


manual de roles semánticos orientado a
problemas del tipo anterior.

• … the FrameNet lexical database, currently contains more than


11,600 lexical units (defined below), more than 6,800 of which are
fully annotated, in more than 960 semantic frames, exemplified in
more than 150,000 annotated sentences.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Spanish FrameNet First
Release!
We are excited to announce the SFN First Release!
Spanish FrameNet is now open and available to the
public, with 305 frames and 575 fully annotated LUs
adding up to over 10,000 annotated sentences.

You may see the data by visiting


http://gemini.uab.es/SFN.
Fecha : junio 2008

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
• Un frame describe una situación.
• Se instancian los participantes (elementos
del frame)en roles semánticos, de modo
particular para cada frame.
• Se codifican también relaciones entre
frames (herencia, causación) y con
elementos de frames.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Definition:
• An Ingestor consumes food or drink (Ingestibles), which
entails putting the Ingestibles in the mouth for delivery to
the digestive system. This may include the use of an
Instrument. Sentences that describe the provision of food
to others are NOT included in this frame.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
FEs:
Core:
Ingestibles [Ingible]
The Ingestibles are the entities that are being
consumed by the Ingestor.
Ingestor [Ing]
The Ingestor is the person eating or drinking.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
FEs:
Non-Core:
Degree [Degr]
Semantic Type Degree
The extent to which the Ingestibles are consumed by the
Ingestor.
The wolves DEVOURED the carcass completely

Duration [Dur]
The length of time spent on the ingestion activity.
They 've been EATING for hours !
….

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Inherits From: Ingest_substance, Manipulation
Is Inherited By:
Subframe of:
Has Subframes:
Precedes:
Is Preceded by:
Uses: Cause_motion
Is Used By: Food, Tasting

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Lexical Units
breakfast.v, consume.v, devour.v, dine.v, down.v, drink.v, eat.v,
feast.v, feed.v, gobble.v, gulp.n, gulp.v, guzzle.v, have.v, imbibe.v,
ingest.v, lap.v, lunch.v, munch.v, nibble.v, nosh.v, nurse.v, put
away.v, put back.v, quaff.v, sip.n, sip.v, slurp.n, slurp.v, snack.v,
sup.v, swig.n, swig.v, swill.v, tuck.v

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce_scenario

Commerce is a situation in which a Buyer and a Seller have agreed upon an


exchange of Money and Goods (possibly after a negotiation), and then perform
the exchange, optionally carrying it out with various kinds of direct payment or
financing or the giving of change.

The Seller indicates their willingness to give the Goods in their possession to a
Buyer who would give them some amount of Money. The Seller may have already
decided on the amount of money that they would require, in which case it is called
the Asking price.

The Buyer also indicates their willingness to give an amount of money called an
Offer to a Seller who would give them the Goods.

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce-scenario
FrameNet
CORE

Buyer [Byr]
The Buyer has the Money and wants the Goods.
She was considered a PURCHASER of the finest things

Goods [Gds]
Goods is anything including labor or time, for example, which is exchanged for Money in a
transaction.
She was considered a purchaser OF THE FINEST THINGS

Money [Mny]
Money is given in exchange for Goods in a transaction.
The PRICE of the sweater was $50.

Seller [Slr]
The Seller has the Goods and wants the Money.
MY LOCAL GROCERY STORE raised PRICES on meat

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce-scenario
FrameNet
Has Subframes: Commercial_transaction,
Having_commercial_agreement

Is Used By: Businesses,


Exchange_currency, Expensiveness

Lexical Units
buyer.n, commerce.n, goods.n, price.n, purchaser.n, retailer.n,
seller.n, supply side.n, trafficker.n, vendor.n

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet - Relaciones entre frames

Commiting-crime
Inherits From: Misdeed
Is Inherited By: Abusing, Kidnapping, Piracy, Rape, Robbery,
Smuggling, Theft
Subframe of: Crime_scenario
Has Subframes:
Precedes: Criminal_investigation
Is Preceded by:
Uses: Compliance, Legality
Is Used By: Offenses

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS (Etiquetado Roles
Semánticos)
• Aprendizaje supervisado
• Necesidad de corpus para entrenamiento y
testeo (Se han usado FrameNet y
PropBank)
• Además:
– Qué es un predicado
– Cuáles son los roles

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS

• Metodología comunmente utilizada:


• Parsing previo (Collins, Charniak)
• Extracción de los predicados del árbol de parsing
• Para cada predicado se examina el árbol para ver el
rol de cada constituyente respecto al predicado.
• Esto se hace por aprendizaje, armando un conjunto
de features por cada par (predicado, constituyente)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS
• Atributos para el aprendizaje (Gildea, Jurafsky, 2000,
2002)
• Predicado (la palabra)
• Tipo de constituyente (gn, gp, etc.)
• Palabra núcleo del constituyente
• Cateoría gramatical del núcleo
• Camino en el árbol de parse del constituyente al predicado
• Voz de la cláusula (activa o pasiva)
• Posición lineal (antes o después del predicado)
• Subcategorización del predicado
• Otros atributos usados:
• Entidades con nombre clasificadas
• Palabras a la izq. O der. del constituyente
• …

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS
• En vez de generar un solo clasificador es posible
proceder por etapas:
– Eliminación como candidatos de algunos constituyentes
– Clasificación binaria de un nodo como constituyente o no.
– Clasificación en n-clases según el esquema de roles semánticos
que se utilice.
• Evaluación
– Precision, recall, medida F
– Baseline: sistema simple basado en reglas (p.ej., 1er gn antes del
predicado ARG0, gn siguiente ARG1, etc.)

Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010

Das könnte Ihnen auch gefallen