NTLK

Hochgeladen von

Kevin Alonso Milkyway

0% fanden dieses Dokument nützlich (0 Abstimmungen)

27 Ansichten9 Seiten

netwoek lengish

Copyright

Verfügbare Formate

PPTX, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

netwoek lengish

Copyright:

Verfügbare Formate

Als PPTX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

27 Ansichten9 Seiten

NTLK

Hochgeladen von

Kevin Alonso Milkyway

netwoek lengish

Copyright:

Verfügbare Formate

Als PPTX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 9

Im Dokument suchen

NLTK

(Natural Language Toolkit)

( Kit de Herramientas de Lenguaje Natural)
DE QUE SE TRATA
El kit de herramientas de lenguaje natural, o más comúnmente NLTK, es un conjunto de bibliotecas y programas para el procesamiento del lenguaje
natural (PLN) simbólico y estadísticos para el lenguaje de programación Python. NLTK incluye demostraciones gráficas y datos de muestra. Se
acompaña de un libro que explica los conceptos subyacentes a las tareas de procesamiento del lenguaje compatibles el toolkit,2 además de programas
de ejemplo.3 NLTK está destinado a apoyar la investigación y la enseñanza en PLN o áreas muy relacionadas, que incluyen la lingüística empírica, las
ciencias cognitivas, la inteligencia artificial, la recuperación de información, y el aprendizaje de la máquina.4 NLTK se ha utilizado con éxito como
herramienta de enseñanza, como una herramienta de estudio individual, y como plataforma para los sistemas de investigación de prototipos y
construcción.

2
RELEVANCIA
El NLTK es importante por razones científicas, económicas, sociales y
culturales. La PNL está experimentando un rápido crecimiento a medida que
sus teorías y métodos se implementan en una variedad de nuevas
tecnologías lingüísticas. Por esta razón, es importante que una amplia gama
de personas tengan un conocimiento práctico de la NLTK. Dentro de la
industria, esto incluye personas en la interacción persona-computadora,
análisis de información empresarial y desarrollo de software web. Dentro de la
academia, incluye personas en áreas de informática de humanidades y
lingüística de corpus a través de la informática y la inteligencia artificial. (Para
muchas personas en el mundo académico, la NLTK se conoce con el
nombre de "Lingüística computacional").
Este libro está dirigido a una amplia gama de personas que desean aprender
cómo escribir programas que analicen el lenguaje escrito,
independientemente de la experiencia previa en programación:

3
THIS IS A SLIDE TITLE
◈ Here you have a list of items
◈ And some text
◈ But remember not to overload your slides
with content
Your audience will listen to you or read the
content, but won’t do both.
4
EJEMPLO
5
Lo primero es importar los textos, esto creara unas variables text<n>, cada una contiene el contenido completo del libro

Hay que seleccionar el “corpus” Book, tengan en cuenta que si todo está correctamente instalado, debiera
abrirse un ventana gráfica (Si se cuenta con TKinter/Tcl) o bien la selección se haría en modo texto.

Lo primero es importar los textos, esto creara unas variables text<n>, cada una contiene el contenido
completo del libro .
Conceptualmente, un objeto nltk.text no es más que una lista ordenada de tokens, siendo esto la unidad
mínima de un texto, simplemente palabras o signos de puntuación. Esto podemos verlo fácilmente de la
siguiente manera

Un token o también llamado componente léxico es una cadena de caracteres que tiene un significado
coherente en cierto lenguaje de programación.

6
Conceptualmente, un objeto nltk.text no es más que una lista ordenada de tokens,
siendo esto la unidad mínima de un texto, simplemente palabras o signos de
puntuación. Esto podemos verlo fácilmente de la siguiente manera

Si revisáramos el texto en la carpeta nltk_data/corpora/gutemberg, veríamos en el caso

del archivo de “Moby Dick” que justamente comienza de la siguiente forma:

Vemos entonces que “tokenización” que se hizo hace algunas cosas

interesantes y para nada triviales:
Separa convenientemente signos de puntuación y palabras
Elimina caracteres en blanco y saltos de línea
EJEMPLO
8
GRACIAS!

Das könnte Ihnen auch gefallen

Lógica de programación: Solucionario en pseudocódigo – Ejercicios resueltos
Von Everand
Lógica de programación: Solucionario en pseudocódigo – Ejercicios resueltos
Omar Ivan Trejos Buriticá
Bewertung: 3.5 von 5 Sternen
3.5/5 (7)
Controles PLC con Texto Estructurado (ST): IEC 61131-3 y la mejor práctica de programación ST
Von Everand
Controles PLC con Texto Estructurado (ST): IEC 61131-3 y la mejor práctica de programación ST
Tom Mejer Antonsen
Bewertung: 3 von 5 Sternen
3/5 (7)
El gran libro de Python
Von Everand
El gran libro de Python
Marco Buttu
Bewertung: 5 von 5 Sternen
5/5 (4)
Los Amores Imparables PDF
Dokument2 Seiten
Los Amores Imparables PDF
Esperanza Perez
0% (2)
Curso Python: Manejo de datos, clases, interfaces, bases de datos y documentación
Dokument2 Seiten
Curso Python: Manejo de datos, clases, interfaces, bases de datos y documentación
cleisito espinoza real g4
33% (3)
Aprende a Programar en Python
Von Everand
Aprende a Programar en Python
Ángel Arias
Bewertung: 5 von 5 Sternen
5/5 (2)
Procesamiento Del Lenguaje Natural
Dokument11 Seiten
Procesamiento Del Lenguaje Natural
api-394504195
Noch keine Bewertungen
Aprendephpconejercicios PDF
Dokument128 Seiten
Aprendephpconejercicios PDF
Mauricio Contreras
Noch keine Bewertungen
Informe NLP
Dokument13 Seiten
Informe NLP
DavidSC
Noch keine Bewertungen
Lab05 INF513
Dokument22 Seiten
Lab05 INF513
Eric Patterson
Noch keine Bewertungen
Procesamiento Del Lenguaje Natural Con Python
Dokument18 Seiten
Procesamiento Del Lenguaje Natural Con Python
Lorenzo Lopez Cerros
Noch keine Bewertungen
TEXTMINING
Dokument17 Seiten
TEXTMINING
RAQUEL GONZALEZ RODRIGUEZ
Noch keine Bewertungen
Tarea Paquetes
Dokument2 Seiten
Tarea Paquetes
Alejandro Alejandro
Noch keine Bewertungen
El Procesamiento de Lenguaje Natural o PLN Es Un Campo Dentro de La Informática
Dokument2 Seiten
El Procesamiento de Lenguaje Natural o PLN Es Un Campo Dentro de La Informática
Sofia quispe arela
Noch keine Bewertungen
Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Von Everand
Procesamient o de Lenguaje Natural con Python: COMPUTADORAS
Ajit Singh
Noch keine Bewertungen
Iabdm1modelosdeinteligenciaartificial E78d5894 b5c8 3a73 2a65 93f72f1c21b1
Dokument18 Seiten
Iabdm1modelosdeinteligenciaartificial E78d5894 b5c8 3a73 2a65 93f72f1c21b1
Rafi- Escribano
Noch keine Bewertungen
Programa Dr. José Federico MEDRANO 2024
Dokument3 Seiten
Programa Dr. José Federico MEDRANO 2024
pablomamani.mani
Noch keine Bewertungen
PLN Clase04
Dokument47 Seiten
PLN Clase04
Enrique Escalante
Noch keine Bewertungen
Taller Sobre Conocimiento Inherente en Los Modelos de Lenguaje
Dokument9 Seiten
Taller Sobre Conocimiento Inherente en Los Modelos de Lenguaje
Julian Diaz
Noch keine Bewertungen
Procesamiento Del Lenguaje Natural en Python
Dokument19 Seiten
Procesamiento Del Lenguaje Natural en Python
GeanMarcoPrada
Noch keine Bewertungen
Manejo de Archivos en Python
Dokument6 Seiten
Manejo de Archivos en Python
Daniel Mtz H
Noch keine Bewertungen
Act 1 Segundo Parcial
Dokument6 Seiten
Act 1 Segundo Parcial
Fernando Rojas Martinez
Noch keine Bewertungen
Inglés 1 Cuadernillo Completo (2022)
Dokument126 Seiten
Inglés 1 Cuadernillo Completo (2022)
Antonella veron palmero
Noch keine Bewertungen
Text Mining
Dokument7 Seiten
Text Mining
Estefani
Noch keine Bewertungen
Picd-209 Formatoalumnotrabajofinal2
Dokument8 Seiten
Picd-209 Formatoalumnotrabajofinal2
imgm1504
Noch keine Bewertungen
3 Analisis de Textos y Contenidos Semanticos
Dokument5 Seiten
3 Analisis de Textos y Contenidos Semanticos
Nelson Lop
Noch keine Bewertungen
02 Introduccion Historica YTecnologica
Dokument42 Seiten
02 Introduccion Historica YTecnologica
hmjero2
Noch keine Bewertungen
Tema_1 latex
Dokument5 Seiten
Tema_1 latex
Carmen Gallego
Noch keine Bewertungen
Procesamiento Del Lenguaje Natural - PLN
Dokument5 Seiten
Procesamiento Del Lenguaje Natural - PLN
Manuel Brambila Pelayo
Noch keine Bewertungen
PLN Clase05
Dokument52 Seiten
PLN Clase05
Enrique Escalante
Noch keine Bewertungen
Clase 19 - Manejo de Archivos
Dokument46 Seiten
Clase 19 - Manejo de Archivos
Miguel La Rocca
Noch keine Bewertungen
PLN II
Dokument20 Seiten
PLN II
Sara Durango
Noch keine Bewertungen
Clase 28 - Introducción Al Procesamiento de Lenguaje Natural II + Datathon
Dokument102 Seiten
Clase 28 - Introducción Al Procesamiento de Lenguaje Natural II + Datathon
Paul Vásquez
Noch keine Bewertungen
U1T2 - Erick Alberto - Velasco Perez
Dokument14 Seiten
U1T2 - Erick Alberto - Velasco Perez
termye41
Noch keine Bewertungen
Lenguaje de Programacion Smalltalk
Dokument5 Seiten
Lenguaje de Programacion Smalltalk
juan
Noch keine Bewertungen
Curso no convencional de LaTeX para principiantes
Dokument128 Seiten
Curso no convencional de LaTeX para principiantes
yoto83
Noch keine Bewertungen
Informe Compiladores - PLN 17-04
Dokument15 Seiten
Informe Compiladores - PLN 17-04
Kevin Garcia F
Noch keine Bewertungen
Eva
Dokument13 Seiten
Eva
Miguel Durango
Noch keine Bewertungen
GUIA 6° PERIODO 1 NIVELACIÓN
Dokument11 Seiten
GUIA 6° PERIODO 1 NIVELACIÓN
Vanessa Muentes
Noch keine Bewertungen
Small Talk
Dokument3 Seiten
Small Talk
chelito
Noch keine Bewertungen
Digital e Industria I Reconocimiento Del Lenguaje Natural
Dokument8 Seiten
Digital e Industria I Reconocimiento Del Lenguaje Natural
Omar Fernández
Noch keine Bewertungen
Archivos de Texto y Punteros en Java
Dokument33 Seiten
Archivos de Texto y Punteros en Java
Husky-Wolf
100% (2)
Actividades de Aprendizaje - Automatas
Dokument21 Seiten
Actividades de Aprendizaje - Automatas
André Jr Sandoval
Noch keine Bewertungen
Reducir El Número de Palabras de Un Texto - Lematización y Radicalización (Stemming) Con Python
Dokument7 Seiten
Reducir El Número de Palabras de Un Texto - Lematización y Radicalización (Stemming) Con Python
Luciano
Noch keine Bewertungen
Progrmacion Logica y Sistemas Expertos
Dokument157 Seiten
Progrmacion Logica y Sistemas Expertos
Jesús Moreno Plasencia
Noch keine Bewertungen
MONOGRAFÍA DE DANIELA MEJORADO
Dokument6 Seiten
MONOGRAFÍA DE DANIELA MEJORADO
Daniela García Lima
Noch keine Bewertungen
Manual El Lenguaje de Programacion PROLOG PDF
Dokument157 Seiten
Manual El Lenguaje de Programacion PROLOG PDF
Alejandro Hernandez Valle
0% (1)
Texto Expositivo Divulgativo Actividad
Dokument3 Seiten
Texto Expositivo Divulgativo Actividad
DENNIS VALENCIA GÓMEZ
Noch keine Bewertungen
Informe Lenguaje Sesgado Spacy
Dokument9 Seiten
Informe Lenguaje Sesgado Spacy
william david calsin borda
Noch keine Bewertungen
Programacion
Dokument15 Seiten
Programacion
Kalin Ayasta
Noch keine Bewertungen
Compiler (ANTLR)
Dokument13 Seiten
Compiler (ANTLR)
Sheila
Noch keine Bewertungen
The Last Dance
Dokument6 Seiten
The Last Dance
BrunoFerres
Noch keine Bewertungen
Ventajas XML Ciencias Información
Dokument36 Seiten
Ventajas XML Ciencias Información
Daniel Rodriguez
0% (1)
El Subrayado - Tema I
Dokument8 Seiten
El Subrayado - Tema I
Alex Herrera Coronel
Noch keine Bewertungen
Planeacion Español Reforzamiento Profr. Esther
Dokument14 Seiten
Planeacion Español Reforzamiento Profr. Esther
QUETZAL JORGE PALACIO RAMIREZ
Noch keine Bewertungen
Trabajo Final - Respuestas
Dokument7 Seiten
Trabajo Final - Respuestas
Denis Vera
Noch keine Bewertungen
Cuaderno de comentario de texto. Lengua y literatura 2º bachillerato
Von Everand
Cuaderno de comentario de texto. Lengua y literatura 2º bachillerato
Raquel Sánchez Lara
Bewertung: 4 von 5 Sternen
4/5 (7)
El camino a las redes neuronales artificiales
Von Everand
El camino a las redes neuronales artificiales
Diego Andrés Restrepo Leal
Noch keine Bewertungen
Matemáticas discretas: un eslabón tecnológico
Von Everand
Matemáticas discretas: un eslabón tecnológico
Juan Manuel Campos Sandoval
Noch keine Bewertungen
Curso básico de Python: La guía para principiantes para una introducción en la programación con Python
Von Everand
Curso básico de Python: La guía para principiantes para una introducción en la programación con Python
M.Eng. Johannes Wild
Noch keine Bewertungen
Colecciones de datos y algoritmos en Python: de cero al infinito
Von Everand
Colecciones de datos y algoritmos en Python: de cero al infinito
Silvia Guardati Buemo
Noch keine Bewertungen
Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial
Von Everand
Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial
Carlos Pineda
Noch keine Bewertungen
Termodinamica Cuzcano PDF
Dokument29 Seiten
Termodinamica Cuzcano PDF
Donplo
67% (3)
VENTANAS
Dokument3 Seiten
VENTANAS
Kevin Alonso Milkyway
Noch keine Bewertungen
Ventanas de madera presupuesto
Dokument4 Seiten
Ventanas de madera presupuesto
Kevin Alonso Milkyway
Noch keine Bewertungen
Preguntas y Problemas de Fisica - L Tarasov y A Tarasova PDF
Dokument295 Seiten
Preguntas y Problemas de Fisica - L Tarasov y A Tarasova PDF
Juan Carlos Carrillo
50% (2)
ELIA HL - Iluminación LED
Dokument2 Seiten
ELIA HL - Iluminación LED
Kevin Alonso Milkyway
Noch keine Bewertungen
Catálogo Lighting
Dokument174 Seiten
Catálogo Lighting
Kevin Alonso Milkyway
Noch keine Bewertungen
PDF Codigos Pokemon Blanco 2 DD
Dokument20 Seiten
PDF Codigos Pokemon Blanco 2 DD
Kevin Alonso Milkyway
Noch keine Bewertungen
InventarConPython 3a Es
Dokument380 Seiten
InventarConPython 3a Es
sergio_741
Noch keine Bewertungen
ELIA HL - Iluminación LED
Dokument2 Seiten
ELIA HL - Iluminación LED
Kevin Alonso Milkyway
Noch keine Bewertungen
Gewiss Catálogo Soluciones para Edificios
Dokument32 Seiten
Gewiss Catálogo Soluciones para Edificios
VEMATEL
Noch keine Bewertungen
Manual FX 7400GII
Dokument411 Seiten
Manual FX 7400GII
Troy Bolton
100% (5)
Elia DL - Downlight Led
Dokument2 Seiten
Elia DL - Downlight Led
Kevin Alonso Milkyway
Noch keine Bewertungen
Gama CHORUS Antibacteriana
Dokument7 Seiten
Gama CHORUS Antibacteriana
Kevin Alonso Milkyway
Noch keine Bewertungen
Smart (PRO)
Dokument2 Seiten
Smart (PRO)
Kevin Alonso Milkyway
Noch keine Bewertungen
ELIA CL - Ceiling LED Plafón de Pared - Techo
Dokument2 Seiten
ELIA CL - Ceiling LED Plafón de Pared - Techo
Kevin Alonso Milkyway
Noch keine Bewertungen
Planificacion Alg Lineal PDF
Dokument2 Seiten
Planificacion Alg Lineal PDF
Kevin Alonso Milkyway
Noch keine Bewertungen
Casio CFX 9950 GB Plus
Dokument20 Seiten
Casio CFX 9950 GB Plus
vpizarro_23
Noch keine Bewertungen
Historias Urbanas
Dokument8 Seiten
Historias Urbanas
Patricia Alejandra Valdès
Noch keine Bewertungen
Planificacion Alg Lineal PDF
Dokument2 Seiten
Planificacion Alg Lineal PDF
Kevin Alonso Milkyway
Noch keine Bewertungen
Capitulo II Relatividad Especial
Dokument80 Seiten
Capitulo II Relatividad Especial
John Z Es
Noch keine Bewertungen
Alfabeto Griego PDF
Dokument1 Seite
Alfabeto Griego PDF
rodjajato
Noch keine Bewertungen
3 Unidad Material de Estudio
Dokument64 Seiten
3 Unidad Material de Estudio
Kevin Alonso Milkyway
Noch keine Bewertungen
En Sentido Forma e Instrumental
Dokument3 Seiten
En Sentido Forma e Instrumental
Kevin Alonso Milkyway
Noch keine Bewertungen
En Sentido Forma e Instrumental
Dokument3 Seiten
En Sentido Forma e Instrumental
Kevin Alonso Milkyway
Noch keine Bewertungen
Tabla1 Eq - Prefijos
Dokument1 Seite
Tabla1 Eq - Prefijos
Kevin Alonso Milkyway
Noch keine Bewertungen
Adrianarroyocalle Pasos para Aumentar Tu Influencia Sobre Los Demas
Dokument1 Seite
Adrianarroyocalle Pasos para Aumentar Tu Influencia Sobre Los Demas
Kevin Alonso Milkyway
Noch keine Bewertungen
Habilidades Del Instructor
Dokument3 Seiten
Habilidades Del Instructor
frederyps
Noch keine Bewertungen
Victorjfg Acceso A Bases de Datos Relacionales en Java
Dokument5 Seiten
Victorjfg Acceso A Bases de Datos Relacionales en Java
Kevin Alonso Milkyway
Noch keine Bewertungen
Pic 18f4550
Dokument11 Seiten
Pic 18f4550
GaTo Lokko
Noch keine Bewertungen
Camila
Dokument6 Seiten
Camila
Camila Parra Ariza
Noch keine Bewertungen
Opera y Teattro Musical Xiomy Pinto
Dokument2 Seiten
Opera y Teattro Musical Xiomy Pinto
Romina Casella
Noch keine Bewertungen
Manual HP 50g
Dokument23 Seiten
Manual HP 50g
Paolo Cardenas Gonsalez
100% (1)
Progr. Paleografía y Diplomática 2020 (Modalidad Virtual)
Dokument8 Seiten
Progr. Paleografía y Diplomática 2020 (Modalidad Virtual)
Nahuel Ferreyra
Noch keine Bewertungen
America Central Insular para Segundo Grado de Secundaria
Dokument5 Seiten
America Central Insular para Segundo Grado de Secundaria
Alejandra Fernandez
Noch keine Bewertungen
Infografías y comprensión lectora
Dokument29 Seiten
Infografías y comprensión lectora
José Castañeda Apablaza
Noch keine Bewertungen
Revista Gnostica Primera Edicion
Dokument22 Seiten
Revista Gnostica Primera Edicion
Rene
Noch keine Bewertungen
Clase01BI 01
Dokument86 Seiten
Clase01BI 01
Oblas
Noch keine Bewertungen
Actividad Herbolaria
Dokument2 Seiten
Actividad Herbolaria
julian_burroughs
Noch keine Bewertungen
3 Ejemplo Planificación y Textualización 1
Dokument15 Seiten
3 Ejemplo Planificación y Textualización 1
MMartinezIsmael
100% (1)
Folleto LITERATURA JAPONESA
Dokument2 Seiten
Folleto LITERATURA JAPONESA
danie96l
Noch keine Bewertungen
Lenguajes, Algoritmos y Estructuras
Dokument13 Seiten
Lenguajes, Algoritmos y Estructuras
Milagros
Noch keine Bewertungen
La Indefectibilidad de La Iglesia - Pedro Rodriguez PDF
Dokument33 Seiten
La Indefectibilidad de La Iglesia - Pedro Rodriguez PDF
Nancy
100% (1)
Nudler Oscar Y Klimovsky Gregorio - La Racionalidad en Debate I
Dokument202 Seiten
Nudler Oscar Y Klimovsky Gregorio - La Racionalidad en Debate I
Lisandro Fabrizio Diaz
100% (1)
Citas para Operativo de Documentos de Beca Pilares 2023
Dokument164 Seiten
Citas para Operativo de Documentos de Beca Pilares 2023
ANAHI LISSETE SALVADOR DELGADO
Noch keine Bewertungen
Tema 1 La Comunicación y La Lengua
Dokument42 Seiten
Tema 1 La Comunicación y La Lengua
Ra
Noch keine Bewertungen
Encuentro Filipense
Dokument4 Seiten
Encuentro Filipense
BARRAZA AREVALO SANDRA
Noch keine Bewertungen
La Voz de La Torah Parashat Vaera
Dokument44 Seiten
La Voz de La Torah Parashat Vaera
Geovanny Franco
Noch keine Bewertungen
Pensamiento Critico Resumen
Dokument34 Seiten
Pensamiento Critico Resumen
Boris Nazario Merino
Noch keine Bewertungen
Álgebra de Boole
Dokument4 Seiten
Álgebra de Boole
Hatapro Abaran Said
Noch keine Bewertungen
Bosquejo Jeremias
Dokument3 Seiten
Bosquejo Jeremias
Klever Cuzco
Noch keine Bewertungen
Actividades de Historia Paginas 20 - 22
Dokument3 Seiten
Actividades de Historia Paginas 20 - 22
Emiler Caleb Hernández
Noch keine Bewertungen
Luz para alumbrar a las naciones
Dokument3 Seiten
Luz para alumbrar a las naciones
Enrique Carpintero
Noch keine Bewertungen
LOS CANTOS DEL SIERVO SUFRIENTE
Dokument2 Seiten
LOS CANTOS DEL SIERVO SUFRIENTE
Peces Ypeces
Noch keine Bewertungen
Abuso de Poder, Abuso de Lenguaje
Dokument12 Seiten
Abuso de Poder, Abuso de Lenguaje
federicokramer
100% (1)
Romance Texto Expositivo
Dokument1 Seite
Romance Texto Expositivo
luis
Noch keine Bewertungen
Introducción a los géneros musicales
Dokument3 Seiten
Introducción a los géneros musicales
Rudy Baten
Noch keine Bewertungen
1.1. Las Distintas Concepciones de La Filosofia
Dokument8 Seiten
1.1. Las Distintas Concepciones de La Filosofia
Gamalzagoth Grivald
Noch keine Bewertungen