Beruflich Dokumente
Kultur Dokumente
Quin soy?
Juan Elosua Tom (Twitter: @jjelosua) Ingeniero de Telecomunicaciones que trabaja como
desarrollador freelance con experiencia en anlisis y visualizaciones de datos. Algunos proyectos en los que he colaborado: El indultmetro Espaa en Llamas Donde van mis impuestos - Parte autonmica Infoamazona: Ganado vs. Deforestacin
Contenido
Introduccin Web scraping Demo dapper ScraperWiki Conclusiones
Introduccin
Definicin Scraping: Conjunto de tcnicas necesarias para extraer informacin de uno o varios lugares (web, pdf, ...) hacia un formato ms adecuado para su procesamiento. Si tratamos con datos complejos, lamentablemente en la actualidad se requiere tener conocimientos de programacin, ya que no hay herramientas suficientemente maduras y "usables"
Desde la compra de Needlebase por parte de Google las alternativas sin conocimientos de programacin son limitadas.
ScraperWiki est al menos barajando la posibilidad de incluir la integracin de selenium con scraperWiki Al menos Francis Irving CEO de ScraperWiki ha hecho alguna prueba de ello
2. Introducimos URL
2. Clasificamos el Dapp (privado o de prueba) 1. Nombre del Dapp, descripcin y etiquetas (opcional) 3. Guardamos
Vamos all!!
Gracias!!
Dudas o preguntas? Juan Elosua Tom Twitter: @jjelosua