Beruflich Dokumente
Kultur Dokumente
Big Data
Analytics(Aprendizaje
No-Supervisado)
Unidad 2. Big Data Analytics(Aprendizaje No-Supervisado)
Extraer (Extract)
Transformar (Transform)
Cargar (Load)
Procesamiento en paralelo(Parallel procesing )
Problemas para comprender el
análisis de datos
Explorando la categorización de
páginas web.
Calcular la frecuencia de los cambios
en el mercado de valores.
Predecir el precio de venta de un libro
azul para bulldozers (estudio de caso).
Exploring web pages categorization
CSV file.
Machine Learning
Introduction to machine learning
Definition
Tom M. Mitchell
Introduction to machine learning
Unsupervised machine-learning
algorithms(descriptive models).
Supervised machine-learning
algorithms(predictive models).
Recommender systems.
NOTE: If you load a dataset that won't be able to fit into your machine memories
and you try to run it, the predictive analysis will throw an error related to machine
memory, such as Error: cannot allocate vector of size 990.1 MB. The solution
is to increase the machine configuration or parallelize with commodity hardware.
Aprendizaje de máquinas
No-Supervisado
Unsupervised machine-learning algorithms.
Aprendizaje no supervisado
En machine learning(aprendizaje de
máquinas), el aprendizaje no supervisado se
usa para encontrar estructuras ocultas dentro
de los datasets.
Se distingue del Aprendizaje supervisado por
el hecho de que no hay un conocimiento a
priori.
No Supervisado vs. Supervisado
● Aprendizaje No Supervisado
– Clustering: particionar los datos en grupos
cuando no hay categorías/clases disponibles.
– Solo requiere instancias, pero no etiquetas.
– Sirve para entender y resumir los datos.
● Aprendizaje Supervisado
– Clasificación y regresión.
– Requiere instancias etiquetadas para
entrenamiento.
Aprendizaje no supervisado
https://www.kaggle.com/c/titanic
http://github.com
https://github.com/gephi/gephi/wiki/
Datasets
https://data.worldbank.org/topic/cli
mate-change?end=2014&start=1960