Beruflich Dokumente
Kultur Dokumente
Lenguaje Natural
Grupo de PLN - InCo
2010
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Funciones sintácticas
Los sintagmas son los constituyentes de la oración y cumplen diversas
funciones sintácticas:
• sujeto
• objeto directo
• objeto indirecto
• complemento de régimen
• complemento circunstancial
[La maestra] entregó [un regalo] [a quienes se portaron bien] [ayer] [en la escuela].
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Estructura argumental
verbo argumentos (complementos) (son subcategorizados)
adjuntos
argumentos - sujeto
- objeto directo
- objeto indirecto
- complementos de régimen (preposicionales)
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Estructura argumental
Podemos definir varias entradas diferentes para cantar:
cantar1: [sujeto, objeto directo, objeto indirecto]
cantar2: [sujeto, objeto directo]
cantar3: [sujeto]
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Establecen una relación entre sintaxis y semántica
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Juan corta el pan con el cuchillo.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
• Existe una diferencia entre la función
gramatical y el rol semántico del
constituyente.
• El análisis sintáctico nos da:
– los constituyentes,
– a veces también la función gramatical,
– pero no el rol semántico
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Mínimamente desearíamos:
• Equivalencia de:
• Los obreros construyeron la casa
• La casa fue construida por los obreros
• Implicación de 1 a 2 en:
• 1. La oferta de una fórmula de pago de la deuda por
Argentina está siendo considerada por los acreedores.
• 2. Argentina ofreció una fórmula de pago de la deuda.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Mínimamente desearíamos:
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Roles semánticos
Hemos visto relaciones semánticas :
– Sinónimos
– Antónimos
– Hipónimos
– …
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Etiquetado de roles semánticos
(ERS, SRL en inglés)
• Tarea en PLN que consiste en asignar
roles semánticos a constituyentes.
• Requiere:
• Haber identificado los constituyentes
• Haber identificado los predicados (en general, los
verbos)
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
Respuestas a preguntas:
P: Cuándo fue derrotado Napoleon?
Buscar: [PACIENTE Napoleon] [PRED
derrotar-synset] [ARGM-TMP *RESP*]
P: Quién derrotó a Napoleón?
Buscar: [PACIENTE Napoleon] [PRED
derrotar-synset] [AGENTE *RESP*]
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
Respuestas a preguntas:
Juan golpeó a Pedro con un palo ayer en la
calle.
Quién?
A quién?
Cuándo ?
Dónde?
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Aplicaciones de ERS
• Resumen automático
– Los predicados y los núcleos de los roles
argumentales resumen el contenido.
• Extracción de información
– Si se reconocen los roles estamos más cerca
de los atributos de una BD
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Problemas con los roles
semánticos
• Se propuso una cantidad grande de roles
semánticos, pero las propiedades no son siempre
homogéneas.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Recursos léxicos para
ERS
Para el inglés (parcialmente para otras
lenguas) se desarrollaron 2 recursos:
• PropBank
• FrameNet
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
PropBank
http://verbs.colorado.edu/~mpalmer/projects/ace.html
Un corpus de oraciones etiquetadas (Penn Treebank WSJ)
Los argumentos se anotan con números: arg0, arg1, arg2,
…
argo – proto-agente
arg1 – proto-paciente
…
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Jurafsky & Martin
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
[El precio de la carne]ARG1 aumentó [un 5%]ARG2.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet,
http://framenet.icsi.berkeley.edu
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Spanish FrameNet First
Release!
We are excited to announce the SFN First Release!
Spanish FrameNet is now open and available to the
public, with 305 frames and 575 fully annotated LUs
adding up to over 10,000 annotated sentences.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
• Un frame describe una situación.
• Se instancian los participantes (elementos
del frame)en roles semánticos, de modo
particular para cada frame.
• Se codifican también relaciones entre
frames (herencia, causación) y con
elementos de frames.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Definition:
• An Ingestor consumes food or drink (Ingestibles), which
entails putting the Ingestibles in the mouth for delivery to
the digestive system. This may include the use of an
Instrument. Sentences that describe the provision of food
to others are NOT included in this frame.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
FEs:
Core:
Ingestibles [Ingible]
The Ingestibles are the entities that are being
consumed by the Ingestor.
Ingestor [Ing]
The Ingestor is the person eating or drinking.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
FEs:
Non-Core:
Degree [Degr]
Semantic Type Degree
The extent to which the Ingestibles are consumed by the
Ingestor.
The wolves DEVOURED the carcass completely
Duration [Dur]
The length of time spent on the ingestion activity.
They 've been EATING for hours !
….
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Inherits From: Ingest_substance, Manipulation
Is Inherited By:
Subframe of:
Has Subframes:
Precedes:
Is Preceded by:
Uses: Cause_motion
Is Used By: Food, Tasting
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet
Ingestion
Lexical Units
breakfast.v, consume.v, devour.v, dine.v, down.v, drink.v, eat.v,
feast.v, feed.v, gobble.v, gulp.n, gulp.v, guzzle.v, have.v, imbibe.v,
ingest.v, lap.v, lunch.v, munch.v, nibble.v, nosh.v, nurse.v, put
away.v, put back.v, quaff.v, sip.n, sip.v, slurp.n, slurp.v, snack.v,
sup.v, swig.n, swig.v, swill.v, tuck.v
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce_scenario
The Seller indicates their willingness to give the Goods in their possession to a
Buyer who would give them some amount of Money. The Seller may have already
decided on the amount of money that they would require, in which case it is called
the Asking price.
The Buyer also indicates their willingness to give an amount of money called an
Offer to a Seller who would give them the Goods.
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce-scenario
FrameNet
CORE
Buyer [Byr]
The Buyer has the Money and wants the Goods.
She was considered a PURCHASER of the finest things
Goods [Gds]
Goods is anything including labor or time, for example, which is exchanged for Money in a
transaction.
She was considered a purchaser OF THE FINEST THINGS
Money [Mny]
Money is given in exchange for Goods in a transaction.
The PRICE of the sweater was $50.
Seller [Slr]
The Seller has the Goods and wants the Money.
MY LOCAL GROCERY STORE raised PRICES on meat
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
Commerce-scenario
FrameNet
Has Subframes: Commercial_transaction,
Having_commercial_agreement
Lexical Units
buyer.n, commerce.n, goods.n, price.n, purchaser.n, retailer.n,
seller.n, supply side.n, trafficker.n, vendor.n
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
FrameNet - Relaciones entre frames
Commiting-crime
Inherits From: Misdeed
Is Inherited By: Abusing, Kidnapping, Piracy, Rape, Robbery,
Smuggling, Theft
Subframe of: Crime_scenario
Has Subframes:
Precedes: Criminal_investigation
Is Preceded by:
Uses: Compliance, Legality
Is Used By: Offenses
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS (Etiquetado Roles
Semánticos)
• Aprendizaje supervisado
• Necesidad de corpus para entrenamiento y
testeo (Se han usado FrameNet y
PropBank)
• Además:
– Qué es un predicado
– Cuáles son los roles
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS
• Atributos para el aprendizaje (Gildea, Jurafsky, 2000,
2002)
• Predicado (la palabra)
• Tipo de constituyente (gn, gp, etc.)
• Palabra núcleo del constituyente
• Cateoría gramatical del núcleo
• Camino en el árbol de parse del constituyente al predicado
• Voz de la cláusula (activa o pasiva)
• Posición lineal (antes o después del predicado)
• Subcategorización del predicado
• Otros atributos usados:
• Entidades con nombre clasificadas
• Palabras a la izq. O der. del constituyente
• …
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010
ERS
• En vez de generar un solo clasificador es posible
proceder por etapas:
– Eliminación como candidatos de algunos constituyentes
– Clasificación binaria de un nodo como constituyente o no.
– Clasificación en n-clases según el esquema de roles semánticos
que se utilice.
• Evaluación
– Precision, recall, medida F
– Baseline: sistema simple basado en reglas (p.ej., 1er gn antes del
predicado ARG0, gn siguiente ARG1, etc.)
Introducción al Procesamiento de Lenguaje Natural - InCo - Facultad de Ingeniería - Universidad de la República - 2010