Beruflich Dokumente
Kultur Dokumente
topolgico de datos
en R. (phom)
Grupo de Inters Local de Madrid 26 de Noviembre.
Alfonso de Ua del Bro.
ndice de materias.
Introduccin
..
Anlisis topolgico de datos
Objetivo:
Aplicar la topologa algebraica para obtener tcnicas y herramientas que nos permitan
estudiar las propiedades topolgicas y geomtricas de un conjunto de datos.
Paradigma anlisis topolgico de los datos
DATOS
DATOS Se les asocia Estructura
Estructura topolgica
topolgica
Se
Retornamos a estudian
los datos Propiedades
Propiedades topolgicas
topolgicas
ATD como herramienta
A partir de un conjunto de datos queremos obtener informacin sobre que estructura forma en el
espacio.
Est basado en como nuestro cerebro infiere la informacin del mundo que nos
rodea.
Ejemplo: el ojo como aparato ptico es bastante malo es gracias a nuestro cerebro
que a partir de las formas vagas que nos llegan infiere el mundo tal y como lo
entendemos (visualizacin en 3d).
Concepto Matemtico: Homologa persistente
Homologa
Homologa persistente:
Estructura topolgica: Complejos simpliciales
Propiedades topolgicas: Grupos de homologa, nmeros de Betti.
Complejos simpliciales
Propiedades topolgicas
Descripcin matemtica:
La teora de la homologa persistente crea la homologa simplicial desde el algebra
topolgica, donde la homologa simplicial define un conjunto de invariantes
topolgicos de complejos simpliciales con los que se puede describir las
caractersticas topolgicas de las formas
Gunnar Carlsson, Topology and data, Bulletin of the American Mathematical Society 46 (2009), no2, 255308.
Homologa de persistencia
Version: 1.0.3
Depends: Rcpp ( 0.9.7)
LinkingTo: Rcpp
Published: 2014-02-09
Author: Andrew Tausz
Maintainer: Andrew Tausz <atausz at stanford.edu>
License: BSD_3_clause + file LICENSE
Paquete pHom
Nos devuelve una matriz con tres columnas con dimensin inicio y fin
Ejemplo
library(phom)
x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
#diagrama de persistencia
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")
Ejemplo: Diagrama de persistencia
library(phom)
N <- 50
x1 <- rnorm(N) * 0.1
y1 <- rnorm(N) * 0.1
X1 <- t(as.matrix(rbind(x1, y1)))
x2 <- rnorm(N) * 0.1 + 0.5
y2 <- rnorm(N) * 0.1 + 0.5
X2 <- t(as.matrix(rbind(x2, y2)))
x <- cbind(x1, x2)
y <- cbind(y1, y2)
X <- as.matrix(rbind(X1, X2))
max_dim <- 0
max_f <- 0.8
intervals <- pHom(X, max_dim, max_f, metric =
"manhattan")
Ejemplo de Cdigo de barras
https://dreamtolearn.com/ryan/data_analytics_viz/50
Interpretacin del cdigo de barras
Una vez obtenido un cdigo de barras
Y ahora qu?
Tenemos que interpretar el cdigo de barras en nuestro estudio.
Qu significa tener agujeros de dimensin dos en nuestros datos?
Interpretar las diferencias topolgicas de diferentes espacios.
Interpretar las modificaciones de las propiedades en el tiempo con nuestro conjunto de datos.
http://cran.r-project.org/web/packages/phom/vignettes/phom.pdf
Barcodes: The persistent topology of data
http://www.math.upenn.edu/~ghrist/preprints/barcodes.pdf
Bibliografa