Beruflich Dokumente
Kultur Dokumente
Machine Learning
Aula 1
• Pedro Teixeira
• Professor e Monitor
Roteiro da • Motivação
https://terracoeconomico-com-
br.cdn.ampproject.org/c/s/terracoeconomico.com.br/po
r-que-os-economistas-estao-invadindo-as-empresas-de-
tecnologia/amp/
Pilares da
Transformação
• Dados
• Tecnologia
E quão
Big são os
Dados?
Em 2010, imagine hoje!
Recursos para
o trabalho em
analytics é
imenso!
Hadoop
Cloud
Computing
Linguagens de
Programação
• Matlab
• SAS
• Stata
• E-views
Linguagens de
Programação Gratuitas
• Julia
• Gauss
• Octave
• R
• Python
Quais as razões para
Python ser tão popular ?
Roteiro do 5
6
15 / 05
16 / 05
Treinando Modelos
Curso 7
8
22 / 05
23 / 05
Support Vector Machine
9 29 / 05 Árvore de Decisão
10 30 / 05 Ensemble Learning e Random Florest
11 05 / 06
Redução de Dimensionalidade
12 06 / 06
13 19 /06
Apresentação Trabalho
14 20 /06
Além das técnica queremos
entender a forma de pensar
dos profissionais de ML
• Praticar Python
• Apresentar a programação
das técnicas apresentadas
em cada capítulo do livro.
Avaliação
The Machine
Learning
Landscape
[Machine Learning is the] field
of study that gives computers
the ability to learn without
being explicitly programmed.
• A experiência é a base de
treino
• A medida de performance
poderia ser por exemplo o
percentual de falso positivos
Abordagem Tradicional
Vejam a similaridade com o PDCA (plan, do , check , act)
Aumentando a
complexidade,
regras
jugamentais
não serão mais
suficientes…
Ou ambientes que Exemplos:
mudam - Detecção de fraudes
= Rótulo
Aprendizado Supervisionados / Não Supervisionados
Principais algoritmos Supervisionados
• k-Nearest Neighbors
• Linear Regression
• Logistic Regression
• Neural networks
Aprendizado Supervisionados / Não Supervisionados
Não Supervisionados – Sem necessidade de rótulos
Aprendizado Supervisionados / Não Supervisionados
Não Supervisionados – Sem necessidade de rótulos
• Clustering
o k-Means
o Clustering hierárquico Analysis (HCA)
o Maximização da Expectativa
• Visualização e redução de dimensionalidade
o Component Analysis (PCA)
o Kernel PCA
o Locally-Linear Embedding (LLE)
o t-distributed Stochastic Neighbor Embedding (t-SNE)
• Aprendizado da regra da associação
o Apriori
o Eclat
Aprendizado Supervisionados / Não Supervisionados
Não Supervisionados – Sem necessidade de rótulos
Aprendizado Supervisionados / Não Supervisionados
Não Supervisionados – Sem necessidade de rótulos
Ou no processo de detecção de
anomalias.
Semi Supervisionados
Exemplo de uso
Semi Supervisionados
Aprendizado Online & em Lote
• Em Instância
• O sistema aprende os exemplos por meio da
Aprendisado memorização e, em seguida, generaliza para
baseado em casos novos utilizando uma medida de
similaridade.
Instância vs • Em Modelo
• Constroe-se um modelo com os exemplo e
Modelo utiliza-se estes para generalizar
Em instância
90 dias de atraso
informação de significativa deterioração
na capacidade de pagamento.
Y X1 X2 X3 ⋯ x100
1
0 • Variáveis Explicativas 𝑿 = 𝒙𝟏 , ⋯ , 𝒙𝒏