Beruflich Dokumente
Kultur Dokumente
Octubre 2009
http://www.bib.uc3m.es/~mendez/SW-ARGENTINA
Presentaciones Recursos Programa Bibliografa
Eva Mndez
PRESENTACIONES
Sobre mi
Octubre 2009
Dra. en Documentacin. Profesora de la Universidad Carlos III de Madrid (desde 1997) Miembro del Comit Asesor de la DCMI y co-chair de la DC Social Tagging Community European Research Scholar en el Centro de Investigacin de Metadatos. UNC (Chapel Hill, USA 2005-06) Experto independiente para la CE en los programas eContentPlus, CIP-PSP y del ICT-Digital Libraries (7FP) Directora del Mster Oficial en Bibliotecas y Servicios de informacin digital (semipresencial 2009-2010): http://www.uc3m.es/bibliotecasdigitales
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares
Eva Mndez
Sobre vosotros Cuntos de vosotros sois bibliotecarios? archiveros?documentalistas? desarrolladores? Qu sabis de la Web Semntica?Qu sabis de la Web? Cuntos estis involucrados en alguna iniciativa de biblioteca o xxxx digital? Si es asEn cul? Qu esperis aprender aqu?
Octubre 2009
Eva Mndez
De qu vamos a hablar
Octubre 2009
El problema de la representacin y recuperacin de informacin en la WWW La representacin y recuperacin del conocimiento: del data mining a las ontologas Concepto y caractersticas de la Web Semntica Estndares y lenguajes de representacin del contenido: Vocabularios de base lxica: WordNet, SKOS Vocabularios de base lgica: Ontologas y Topic Maps Tipificacin de NKOS (Network Knowledge Organization Systems/Services) para la Web Semntica y sus estndares Proyectos y reas de aplicacin de las tecnologas de la Web Semntica Web 2.0 y la Web Semntica: Web 3.0 Web Social Semntica (Social Semantic Web) Linked data, Open data y de la nube. Bibliotecas digitales semnticas
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Contenidos / Programa
La evolucin de la Web: diferenciacin entre Web 2.0, Web Semntica (SW),etc. Web Semntica, Servicios Web y la Recuperacin de informacin en la WWW. Estndares para la Web y estndares para la Web Semntica: RDF/XML Conceptos clave en la SW: metadatos, ontologas, agentes, etc.
Octubre 2009
Discusin sobre el futuro de la Web Semntica, Web 3.0, interoperabilidad y Bibliotecas Digitales Semnticas.
Eva Mndez
Mi posicin en el tema
Octubre 2009
Greenberg & Mendez (2007): Knitting the Semantic Web = Tejiendo la Web Semntica
Eva Mndez
La Web necesita bibliotecari@s, la SW + The Internet is the Worlds largest library. It is just that the books are on the floor
Octubre 2009
Eva Mndez
Octubre 2009
Encontrar lo que queremos en la Web debera de ser igual de fcil que encontrar un libro en una biblioteca.
As ser, si Eugenia [pongan aqu su nombre] consigue lo que quiere. Est trabajando para crear un estndar para etiquetar y catalogar informacin online que incluye todos los 2.7 billones de pginas web algo as como un sistema de informacin Decimal Dewey virtual, si lo prefers. As, podrs gastar menos tiempo en buscar, y ms tiempo en utilizar la informacin que necesitas.
Shhhhh Ests en Internet.
Eva Mndez
Todo evoluciona
Octubre 2009
incluso en 4 meses por supuesto: la Web y por supuesto: la Web Semntica Infodemiologa: Google Flu Trends (leer artculo en Nature): http://www.google.org/flutrends
Eva Mndez
La Web evoluciona
Octubre 2009
incluso en 4 meses
Nuevo Website para NeOn Toolkit (7 Agosto 2009): http://neon-toolkit.org/wiki/New_Website SKOS Reference: Recomendacin del W3C el 18 Agosto 2009 Las bibliotecas buscan gente interesada en la Web semntica. Oferta de trabajo Europeana (Oct2009) Nueva Biblioteca Digital Semntica (Oct2009): http://bami.cilea.it/ International Semantic Web Conference (ISWC 2009): Washington DC 25-29 Oct 2009 Nuevo libro sobre SW
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
La Web evoluciona
Octubre 2009
http://www.w3.org
Eva Mndez
Introduccin y contexto
WEB: Gran cantidad de informacin (de alta calidad e informacin cientfica y/o profesional + informacin informal, sitios personales, Weblogs, Wikis, etc.) Cmo dotar a esa informacin de fiabilidad y consistencia en la recuperacin? Adems de la informacin nacida en la Web (born digital) tendencia al acceso, disponibilidad en lnea del patrimonio cultural / cientfico (EU, Espaa, WDL, etc.) Lo que no est en la Web no existe Lo que no se encuentra, integra no vale
Octubre 2009
Ver video
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Octubre 2009
WWW
Esttica
URI, HTML, HTTP
Eva Mndez
Octubre 2009
Pginas Web
Comercio
Biblioteca
Empresa
Internet
Datos cientficos
eGobierno
Cualquiera...
Eva Mndez
Octubre 2009
Web de documentos
Web de datos
Eva Mndez
Octubre 2009
Octubre 2009
Solucin tradicional (Google, etc.): aunque han mejorado mucho no suficientes para recuperar conocimiento
Eva Mndez
Octubre 2009
Ambigedad en el significado de las cadenas de bsqueda Multitud de resultados sin orden lgico (Google) Imposible trasladar la relevancia subjetiva del usuario (incapacidad de entender el significado que el usuario tiene en mente) No garanta de fiabilidad Falta ayuda para la formulacin de las bsquedas
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Octubre 2009
Recuperar conocimiento no es lo mismo que recuperar informacin Recuperar conocimiento implica tradicionalmente el procesamiento semntico de grandes cantidades de datos: Data mining El data mining (minera de datos, explotacin de datos, KDD) es un tema complejo (informtica + tcnicas computacionales estadsticas, IR + ML+l reconocimiento de patrones (Fayyard, etc.).
Eva Mndez
Octubre 2009
Data mining extraccin de conocimiento de grandes cantidades de informacin estructurada Text mining extraccin de informacin de calidad a partir de textos o informacin no estructurada.
Eva Mndez
Octubre 2009
Bsqueda (objetivo) Datos Estructurados Datos sin Estructurar (texto) Data Retrieval Information Retrieval
Eva Mndez
Octubre 2009
Unidad mnima
Ejemplo de necesidad de informacin
Registro de datos
Buscar un restaurante japons en Valencia que tengan comida vegetariana
SELECT * FROM restaurants WHERE city = Valencia AND type = japanese AND has_veg = true
Eva Mndez
Recuperacin de informacin Encontrar informacin relevante en fuentes de informacin sin estructurar (normalmente texto)
Tipo de base de datos Modo de bsqueda Unidad mnima Ejemplo de necesidad de informacin Ejemplos de sentencia de bsquda Sin estructurar Dirigido a un objetivo / oportunista (serendipity) Documento Buscar un restaurante japons en Valencia que tengan comida vegetariana
-
Octubre 2009
Eva Mndez
Recuperar conocimiento (text mining) Descubrir nuevo *conocimiento* a partir de textos e informacin sin estructurar
Octubre 2009
Tipo de base de datos Modo de bsqueda Unidad mnima Ejemplo de necesidad de informacin Ejemplo de sentencia de bsqueda
Sin estructurar Oportunista Caractersticas del lenguaje o conceptos Encuentra tipos de comida envenenada, normalmente asociada a restaurantes japoneses Clasifica enfermedades asociadas con restaurantes japoneses
Eva Mndez
Recuperar conocimiento (data mining) Descubrir nuevo *conocimiento* a travs del anlisis de datos
Tipo de base de datos
Modo de bsqueda Unidad mnima
Octubre 2009
Estructurada / semiestructurada
Oportunista Nmeros y dimensiones
Eva Mndez
Octubre 2009
Anlisis de contenido de la Web (indizacin y resumen: tagging) Minera de contenido Web implica:
Clasificacin Web (categoras predefinidas donde se clasifican las pginas Web: inicios de Yahoo) Clustering Web (agrupacin de pginas web basadas en sus similaridades) Extraccin Web (implica la extraccin de elementos HTML, frases o tuplas de las pginas web que representan instancias de los conceptos buscados).
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Octubre 2009
Aplicar tcnicas de data mining para extraer conocimiento de la informacin Web resulta muy difcil ya que la informacin est desestructurada Algunas tcnicas del Web mining (text mining de la Web) ayudan a extraer informacin de calidad de la Web (clustering que realiza CiteSeer) Semantic Web mining= Data mining + Semantic Web
Los resultados de la minera de la Web se mejorarn a travs de una Web ms estructurada basada en estructuras semnticas que permitan extraer/inferir conocimiento (Web semntica) Las tcnicas de minera web pueden ayudar a la construccin de la Web Semntica.
Eva Mndez
La evolucin de la Web. Diferenciacin entre Web 2.0, Web Semntica (SW): Web 3.0 y linked data
Octubre 2009
Los ordenadores utilizarn informacin estructurada de forma mucho ms eficaz. Se necesita la integracin de datos para permitir el procesamiento automtico SW (Web Semntica)...
...is an extension of the current Web in which information is given well-defined meaning, better enabling computers and people to work in cooperation
Tim Berners-Lee, James Hendler, Ora Lassila. The Semantic Web. Scientific American (Mayo 2001)
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Octubre 2009
Eva Mndez
Octubre 2009
Octubre 2009
No es tan fcil!!
Eva Mndez
Octubre 2009
Eva Mndez
Octubre 2009
Google AdSense Flickr, Corbis BitTorrent (cooperative distribution) Napster, eMule, etc. Wikipedia Blogging Eventful and EVDB Search engine optimization Cost per click Web services Participation Wikis Tagging ("folksonomy") Syndication
Web 2.0
Eva Mndez
Web 1.0
La Web como un portal de informacin Exclusividad de la informacin Seccionar la WWW en directorios tiles Cada uno tena su pequeo rincn en el ciberspacio Carece de:
Contexto Interaccin Escalabilidad
Web 1.0
Octubre 2009
Eva Mndez
Web 2.0
La Web como plataforma Centrada en el poder de compartir (crear y validar) El poder de un sistema de organizacin ms libre (tagging) Estableciendo conexiones para la integracin futura (RSS) Carece de:
Personalizacin Portabilidad verdadera Interoperabilidad
Octubre 2009
Web 2.0
Eva Mndez
Web 3.0?
Octubre 2009
Octubre 2009
http://upload.wikimedia.org/wikipedia/commons/1/16/Web20mindmapLARG.jpg
Eva Mndez
Octubre 2009
La Web 2.0 necesita motores de bsqueda ms especficos para encontrar: amigos, un buen lugar de vacaciones o fotos de otra gente en tu bar favorito etc.
Technorati, el ms famoso buscador de weblogs: http://technorati.com/ Vdeos y podcast http://podzinger.com/ Noticias sindicadas: http://agregax.es/ Especializados ($): Viajes: http://www.trabber.com/es/ Compras: http://es.shoomo.com/ Compras (libros /Amazon): http://pricenoia.com/
Eva Mndez
Octubre 2009
Eva Mndez
Octubre 2009
Metadatos descriptivos (RDF vinculado link rel) Metadatos para la sindicacin de noticias (RSS)
Eva Mndez
Octubre 2009
http://dublincore.org/news.rss
Eva Mndez
Octubre 2009
La Web Semntica (SW) no es una Web separada sino una extensin de la actual, en la cual la informacin se da con un significado bien definido, permitiendo que los ordenadores y las personas puedan trabajar juntos, en cooperacin.
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares
Eva Mndez
Octubre 2009
El principio central que subyace a los gigantes nacidos en la Era de la Web 1.0, que han sobrevivido en la Era Web 2.0, parecen haber adoptado el poder de la Web para que han adopdato el poder de la web para explotar la inteligencia colectiva"
Traduccin al espaol del artculo de OReilly: Qu es la Web 2.0:
http://sociedaddelainformacion.telefonica.es/jsp/articulos/detalle.jsp?elem=2146
Eva Mndez
Web 2.0 es La Web Social (Hinchcliffe) La Web 2.0 tiene mucho ms que ver con el cambio que se produce en las personas y en la sociedad que con la tecnologa
Algunos datos: Ms de un billn de personas conectadas a Internet 100 millones de sitios Web Alrededor de 1/3 de adultos en USA han contribuido al contenido pblico de Internet (18% mayores de 65)
Octubre 2009
Eva Mndez
Octubre 2009
La Web no va de lo que podemos hacer con los ordenadores. Son personas, y s, vale, estn conectadas por computadores Pero la informtica, entendida como el estudio de lo que pasa en un ordenador, no te dice qu pasa en la Web.
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares
Eva Mndez
Octubre 2009
Eva Mndez
Tim Berners-Lee: Febrero 2009 On the next Web (TED): Datos enlazados
Octubre 2009
http://www.w3.org/DesignIssues/LinkedData.html
Eva Mndez
Octubre 2009
Octubre 2009
Octubre 2009
Linked Data (datos enlazados) implica utilizar la Web para conectar datos relacionados que no han sido previamente enlazados o bien, utilizar la Web para disminuir las barreras entre los datos que ya estn enlazados utilizando otros mtodos. Trmino utilizado para describir las prcticas recomendadas para exponer, compartir y conectar piezas de datos, informacin y conocimiento en la Web Semntica, utilizando URIs y RDF (Wikipedia) Conectar datos distribuidos en la Web
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares
Eva Mndez
Octubre 2009
Utilizar URIs para identificar los recursos publicados en la Web Aprovechar el HTTP de la URI para que la gente pueda localizar y consultar (es decir, desreferenciar) estos recursos. Proporcionar informacin til acerca del recurso cuando la URI haya sido desreferenciada. Incluir enlaces a otras URIs relacionadas con los datos contenidos en el recurso, de forma que se potencie la RI en la Web.
Eva Mndez
Octubre 2009
Fuente: Social Semantic Web Syposium (Marzo 2009) Introduccin a la Web Semntica: vocabularios, tecnologas y estndares Eva Mndez
Orgenes de la Web Semntica Idea original de la Web (Tim B. Lee, 1989). Berners-Lee: Metadata Architecture (1997); Semantic Web Roadmap (1998): Weaving the Web (1999). Definicin formal (2001):
Octubre 2009
La Web Semntica es una extensin de la Web actual en la que la informacin se presenta con un significado bien definido, permitiendo a los ordenadores y a las personas trabajar conjuntamente.
Introduccin a la Web Semntica: vocabularios, tecnologas y estndares
Eva Mndez
Octubre 2009
Web semntica = Web + Semntica? Biblioteca digital= Biblioteca + Digital? Sociedad de la Informacin= Sociedad + Informacin?
Eva Mndez
Web + Semntica?
Octubre 2009
Semntica implica significado concreto, o unidades que pueden componerse para generar un significado ms especfico para un discurso ms amplio. Web medio universal para los datos, que puede albergar contenido que puede expresarse en un formato ledo y utilizado por agentes de software (mquinas) para buscar, compartir y integrar informacin de forma ms fcil. Web Semntica
Visin de esa integracin de la informacin. La habilidad de las mquinas de registrar cmo los datos se relacionan con el mundo real, y un cambio de la necesidad de acceder a una serie de bases de datos a travs de una serie de bsquedas, a la traduccin del contenido a informacin legible por mquina, a la que pueda accederse a travs de una base de datos interminable
Eva Mndez
Octubre 2009
Intangibilidad del concepto (Cognitivismo, Inteligencia Artificial, Documentacin). El entusiasmo y la proyeccin de sus principales instigadores (Tim Berners-Lee y James Hendler) Un conjunto interminable de siglas, acrnimos y conceptos:
RDF, XML, DCMI, SVG, DALM, OIL, OWL, SOAP, WSDL, SKOS, etc. Metadatos, ontologas, lgica, inferencia, etc.
Qu es la Web Semntica?
Octubre 2009
Eva Mndez
Qu es la Web Semntica?
Octubre 2009
La SW es muchas cosas para mucha gente Conjunto de tecnologas para la organizacin, representacin y recuperacin del conocimiento digital que aaden semntica interpretable por las mquinas Objetivos: Proporcionar un acceso inteligente a la informacin heterognea y distribuida en la WWW, posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los recursos de informacin disponibles Creacin de una Web de datos con significado (informacin + conocimiento), de tal forma que un programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como acerca de la informacin necesaria para procesarlos Procesamiento global e interoperable de la informacin Web (marcado semntico XML + estructuras de metadatos)
Eva Mndez
Qu es la Web Semntica?
Octubre 2009
Explicacin gradual:
La Web es un conjunto de recursos y enlaces
Eva Mndez