Willkommen bei Scribd!

Karussell überspringen

3 Recitation StochasticGradientDescent

Hochgeladen von

M Rameez Ur Rehman

0% fanden dieses Dokument nützlich (0 Abstimmungen)

21 Ansichten10 Seiten

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

21 Ansichten10 Seiten

3 Recitation StochasticGradientDescent

Hochgeladen von

M Rameez Ur Rehman

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 10

Im Dokument suchen

Stochastic Gradient Descent

10701 Recitations 3

Mu Li

Computer Science Department

Cargenie Mellon University

February 5, 2013
The problem

I A typical machine learning problem has a penalty/regularizer

+ loss form
n
1X
min F (w ) = g (w ) + f (w ; yi , xi ),
w n
i=1

xi , w Rp , yi R, both g and f are convex

I Today we only consider differentiable f , and let g = 0 for
simplicity
I For example, let f (w ; yi , xi ) = log p(yi |xi , w ), we are trying
to maximize the log likelihood, which is
n
1X
max log p(yi |xi , w )
w n
i=1
Gradient Descent

I choose initial w (0) , repeat Two dimensional

example:
w (t+1) = w (t) t F (w (t) )

until stop
I t is the learning rate, and
1X
F (w (t) ) = w f (w (t) ; yi , xi )
n
i

I How to stop? kw (t+1) w (t) k or

kF (w (t) )k
Learning rate matters

too small t , after 100

t = t, it is too big
iterations
Backtracking line search

Adaptively choose the learning rate

I choose a parameter 0 < < 1
I start with = 1, repeat t = 0, 1, . . .
I while

L(w (t) L(w (t) )) > L(w (t) ) kL(w (t) )k2
2
update =
I w (t+1) = w (t) L(w (t) )
Backtracking line search

A typical choice = 0.8, converged after 13 iterations:

Stochastic Gradient Descent

We name n1 i f (w ; yi , xi ) the empirical loss, the thing we

P
I
hope to minimize is the expected loss

f (w ) = Eyi ,xi f (w ; yi , xi )

I Suppose we receive an infinite stream of samples (yt , xt ) from

the distribution, one way to optimize the objective is

w (t+1) = w (t) t w f (w (t) ; yt , xt )

I On practice, we simulate the stream by randomly pick up

(yt , xt ) from the samples we have
Comparing the average gradient of GD n1 i w f (w (t) ; yi , xi )
P
I
More about SGD

I the objective does not always decrease for each step

I comparing to GD, SGD needs more steps, but each step is
cheaper
I mini-batch, say pick up 100 samples and do average, may
accelerate the convergence
Relation to Perceptron

I Recall Perceptron: initialize w , repeat

(
yi xi if yi hw , xi i < 0
w =w+
0 otherwise

I Fix learning rate = 1, let f (w ; y , x) = max(0, yi hw , xi i),

then (
yi xi if yi hw , xi i < 0
w f (w ; y , x) =
0 otherwise
we derive Perceptron from SGD
Question?

Das könnte Ihnen auch gefallen

Lec 02 Computation Graphs
Dokument64 Seiten
Lec 02 Computation Graphs
Mr. Coffee
Noch keine Bewertungen
Linear Regression and Classification: Lectures 3-4
Dokument41 Seiten
Linear Regression and Classification: Lectures 3-4
Val
Noch keine Bewertungen
Support Vector Machines (SVM) : Y.H. Hu
Dokument25 Seiten
Support Vector Machines (SVM) : Y.H. Hu
Shopno Chura
Noch keine Bewertungen
One Layer Neural-Nets (Perceptrons) : The Delta Rule For A Linear Unit
Dokument2 Seiten
One Layer Neural-Nets (Perceptrons) : The Delta Rule For A Linear Unit
Raghunath Siripudi
Noch keine Bewertungen
Linear Regression: Volker Tresp 2017
Dokument25 Seiten
Linear Regression: Volker Tresp 2017
Sophie Strobl
Noch keine Bewertungen
Lecture 3
Dokument7 Seiten
Lecture 3
She
Noch keine Bewertungen
Today: - Calculus
Dokument61 Seiten
Today: - Calculus
Jose Ramon Villatuya
Noch keine Bewertungen
Bagging and Boosting: 9.520 Class 10, 13 March 2006 Sasha Rakhlin
Dokument19 Seiten
Bagging and Boosting: 9.520 Class 10, 13 March 2006 Sasha Rakhlin
Akhi Danu
Noch keine Bewertungen
Lecture 2
Dokument57 Seiten
Lecture 2
happy_user
Noch keine Bewertungen
Unconstrained Optimization III: Topics We'll Cover
Dokument3 Seiten
Unconstrained Optimization III: Topics We'll Cover
MohammadAli
Noch keine Bewertungen
Percept Ron
Dokument2 Seiten
Percept Ron
Vishesh
Noch keine Bewertungen
Vademecum PROB ML
Dokument14 Seiten
Vademecum PROB ML
anon_57840914
Noch keine Bewertungen
Pegasos
Dokument4 Seiten
Pegasos
Melanie2023
Noch keine Bewertungen
Neural Networks: (Many Slides From Greg Durrett and Philipp Koehn)
Dokument65 Seiten
Neural Networks: (Many Slides From Greg Durrett and Philipp Koehn)
Ethan Roland
Noch keine Bewertungen
ECS171: Machine Learning: Lecture 4: Optimization (LFD 3.3, SGD)
Dokument45 Seiten
ECS171: Machine Learning: Lecture 4: Optimization (LFD 3.3, SGD)
svwnerlgwr
Noch keine Bewertungen
Lec 16
Dokument15 Seiten
Lec 16
Thiago Salles
Noch keine Bewertungen
ECS171: Machine Learning: Cho-Jui Hsieh UC Davis
Dokument50 Seiten
ECS171: Machine Learning: Cho-Jui Hsieh UC Davis
Sam Dillinger
Noch keine Bewertungen
Tutorial 8 Questions
Dokument3 Seiten
Tutorial 8 Questions
Evan Duh
Noch keine Bewertungen
coursSVM Versionlongue 20
Dokument70 Seiten
coursSVM Versionlongue 20
dorian
Noch keine Bewertungen
Foundations of Deep Learning
Dokument30 Seiten
Foundations of Deep Learning
Nelson Ubaldo Quispe M
Noch keine Bewertungen
Dual Coordinate Descent Methods For Logistic Regression
Dokument35 Seiten
Dual Coordinate Descent Methods For Logistic Regression
Alvin
Noch keine Bewertungen
ANN Backpropagation: Weight Updates For Hidden Nodes: Step 1: Update The Weights V
Dokument3 Seiten
ANN Backpropagation: Weight Updates For Hidden Nodes: Step 1: Update The Weights V
roro132
Noch keine Bewertungen
Gradient Descent Based Learners
Dokument11 Seiten
Gradient Descent Based Learners
sandt
Noch keine Bewertungen
Lec. 03 - An Introduction To Support Vector Machines - Giorgio Valentini U. Milano
Dokument42 Seiten
Lec. 03 - An Introduction To Support Vector Machines - Giorgio Valentini U. Milano
Alejandro Vasquez
Noch keine Bewertungen
Support Vector Machines PDF
Dokument5 Seiten
Support Vector Machines PDF
Nageswararao Eluri
Noch keine Bewertungen
R300 Solution Guide 2018M
Dokument8 Seiten
R300 Solution Guide 2018M
Marco Brolli
Noch keine Bewertungen
Homework 4: Kernel Methods: Minted Listings
Dokument14 Seiten
Homework 4: Kernel Methods: Minted Listings
Mayur Agrawal
Noch keine Bewertungen
3 DeltaRule PDF
Dokument10 Seiten
3 DeltaRule PDF
Es E
Noch keine Bewertungen
SD-M1 TSI Chapitre 4
Dokument42 Seiten
SD-M1 TSI Chapitre 4
Felix Chokwe Danra Taissala
Noch keine Bewertungen
MAST20005 Statistics Assignment 3
Dokument8 Seiten
MAST20005 Statistics Assignment 3
Anonymous na314kKjOA
Noch keine Bewertungen
EE Exercise Solutions 2022
Dokument21 Seiten
EE Exercise Solutions 2022
ValentinaArmoniaFarinelli
Noch keine Bewertungen
Online Learning: 9.520 Class 12, 20 March 2006 Andrea Caponnetto, Sanmay Das
Dokument33 Seiten
Online Learning: 9.520 Class 12, 20 March 2006 Andrea Caponnetto, Sanmay Das
Habib Mrad
Noch keine Bewertungen
Assignment 1: CMSC 498L Released: Feb-14. Due Feb-21
Dokument2 Seiten
Assignment 1: CMSC 498L Released: Feb-14. Due Feb-21
Zu Ki
Noch keine Bewertungen
Sol 1
Dokument4 Seiten
Sol 1
anıl
Noch keine Bewertungen
Machine Learning 10-701 Final Exam May 5, 2015: Obvious Exceptions For Pacemakers and Hearing Aids
Dokument17 Seiten
Machine Learning 10-701 Final Exam May 5, 2015: Obvious Exceptions For Pacemakers and Hearing Aids
Nithin
Noch keine Bewertungen
Imaging Summary
Dokument39 Seiten
Imaging Summary
lepenguin
Noch keine Bewertungen
MAFE208IU-L11 ODEs Part1
Dokument25 Seiten
MAFE208IU-L11 ODEs Part1
Thy Vũ
Noch keine Bewertungen
NNLS1 2019 HW4 Solutions
Dokument11 Seiten
NNLS1 2019 HW4 Solutions
ADSTE ETW
Noch keine Bewertungen
1 D'alembert's Solution: Weston Barger July 12, 2016
Dokument11 Seiten
1 D'alembert's Solution: Weston Barger July 12, 2016
ranv
Noch keine Bewertungen
CS 229, Public Course Problem Set #1 Solutions: Supervised Learning
Dokument10 Seiten
CS 229, Public Course Problem Set #1 Solutions: Supervised Learning
suhar adi
Noch keine Bewertungen
Study Micro
Dokument43 Seiten
Study Micro
Rija Ali
Noch keine Bewertungen
Prob 02
Dokument18 Seiten
Prob 02
Tuhin
Noch keine Bewertungen
6.7. Ordinary Differential Equation (Ode) and PDE
Dokument37 Seiten
6.7. Ordinary Differential Equation (Ode) and PDE
Eyu Kaleb
Noch keine Bewertungen
Machine Learning Exponential Family: Dmitrij Schlesinger
Dokument11 Seiten
Machine Learning Exponential Family: Dmitrij Schlesinger
Sakshi Badoni
Noch keine Bewertungen
University
Dokument3 Seiten
University
Sudo27
Noch keine Bewertungen
Transformations of Two Random Variables
Dokument9 Seiten
Transformations of Two Random Variables
asarisetya
Noch keine Bewertungen
HW6 Solutions
Dokument4 Seiten
HW6 Solutions
Juan Carños Anaya Bohorquez
Noch keine Bewertungen
Problem Set 8
Dokument5 Seiten
Problem Set 8
clouds lau
Noch keine Bewertungen
Objectives of Chapter 5:, X, and
Dokument6 Seiten
Objectives of Chapter 5:, X, and
Mayank Soni
Noch keine Bewertungen
UW MATH STAT395 Functions Random Variables
Dokument6 Seiten
UW MATH STAT395 Functions Random Variables
Kassawmar Ayalew
Noch keine Bewertungen
Lecture3 Logistic Regression Regularization
Dokument39 Seiten
Lecture3 Logistic Regression Regularization
jiayuan0113
Noch keine Bewertungen
cs229.... Machine Language. Andrew NG
Dokument17 Seiten
cs229.... Machine Language. Andrew NG
krishna
Noch keine Bewertungen
Методичка Stat. Inference
Dokument45 Seiten
Методичка Stat. Inference
Yehor
Noch keine Bewertungen
Support Vector Machines
Dokument5 Seiten
Support Vector Machines
S
Noch keine Bewertungen
COGS 118 Homework 3 Supervised Machine Learning Algorithms
Dokument7 Seiten
COGS 118 Homework 3 Supervised Machine Learning Algorithms
Veronica Lin
Noch keine Bewertungen
Adam: Adaptive Moment Estimation: The Error To Be Minimized
Dokument4 Seiten
Adam: Adaptive Moment Estimation: The Error To Be Minimized
Raghunath Siripudi
Noch keine Bewertungen
A Substitute of Harmonic Majorization: - U (X, T) - P G (X)
Dokument10 Seiten
A Substitute of Harmonic Majorization: - U (X, T) - P G (X)
Alvaro Corvalan
Noch keine Bewertungen
Evans PDE Solution Chapter 5 Sobolev
Dokument8 Seiten
Evans PDE Solution Chapter 5 Sobolev
Hazard
100% (1)
SVM Incremental Learning, Adaptation and Optimization - IJCNN 2003 Presentation
Dokument11 Seiten
SVM Incremental Learning, Adaptation and Optimization - IJCNN 2003 Presentation
Chris Diehl
Noch keine Bewertungen
Green's Function Estimates for Lattice Schrödinger Operators and Applications. (AM-158)
Von Everand
Green's Function Estimates for Lattice Schrödinger Operators and Applications. (AM-158)
Jean Bourgain
Noch keine Bewertungen
Instructions Residencepermitapplication Study PHD - EnG 14-6-18
Dokument5 Seiten
Instructions Residencepermitapplication Study PHD - EnG 14-6-18
M Rameez Ur Rehman
Noch keine Bewertungen
Tensor Voting: Theory and Applications: Gérard Medioni Chi-Keung Tang Mi-Suen Lee
Dokument10 Seiten
Tensor Voting: Theory and Applications: Gérard Medioni Chi-Keung Tang Mi-Suen Lee
M Rameez Ur Rehman
Noch keine Bewertungen
20 Multiscale Vessel Enhancement
Dokument13 Seiten
20 Multiscale Vessel Enhancement
M Rameez Ur Rehman
Noch keine Bewertungen
Modeling and Simulation of A Moving Robot Arm Mounted On Wheelchair
Dokument5 Seiten
Modeling and Simulation of A Moving Robot Arm Mounted On Wheelchair
M Rameez Ur Rehman
Noch keine Bewertungen
19 Detection of Electrophysiology Cathers
Dokument8 Seiten
19 Detection of Electrophysiology Cathers
M Rameez Ur Rehman
Noch keine Bewertungen
xx08 SIreview PDF
Dokument22 Seiten
xx08 SIreview PDF
M Rameez Ur Rehman
Noch keine Bewertungen
Bayes Optimization For Machine Learning
Dokument29 Seiten
Bayes Optimization For Machine Learning
M Rameez Ur Rehman
Noch keine Bewertungen
Convex Optimization in Image Processing: Ernie Esser
Dokument9 Seiten
Convex Optimization in Image Processing: Ernie Esser
M Rameez Ur Rehman
Noch keine Bewertungen
Robot Trajectory Optimization Using Approximate Inference
Dokument8 Seiten
Robot Trajectory Optimization Using Approximate Inference
M Rameez Ur Rehman
Noch keine Bewertungen
2Pqlgluhfwlrqdo9Lvlrqedvhg3Rvh&Rqwuroehwzhhq7Zr5Rerwv:, 1 - LD DQJ/L &+ (1+DL/RQJ
Dokument6 Seiten
2Pqlgluhfwlrqdo9Lvlrqedvhg3Rvh&Rqwuroehwzhhq7Zr5Rerwv:, 1 - LD DQJ/L &+ (1+DL/RQJ
M Rameez Ur Rehman
Noch keine Bewertungen
WWW Electronicslovers Com 2015 09 Arduino Based MPPT Solar C
Dokument35 Seiten
WWW Electronicslovers Com 2015 09 Arduino Based MPPT Solar C
M Rameez Ur Rehman
Noch keine Bewertungen
WWW Hackingdream Net 2015 05 Hack Wifi Wpa Wpa2 Wps in Windo
Dokument71 Seiten
WWW Hackingdream Net 2015 05 Hack Wifi Wpa Wpa2 Wps in Windo
M Rameez Ur Rehman
0% (1)
Phy Sops
Dokument171 Seiten
Phy Sops
M Rameez Ur Rehman
Noch keine Bewertungen
RaufAliev CV Full
Dokument3 Seiten
RaufAliev CV Full
Rauf Aliev
100% (1)
fINAL REPORT - ONLINE PROJECT
Dokument64 Seiten
fINAL REPORT - ONLINE PROJECT
Nitika Kapil Kathuria
100% (4)
DirectoryIsra University Hyderabad
Dokument3 Seiten
DirectoryIsra University Hyderabad
mansaf
Noch keine Bewertungen
Vasudevan 2019
Dokument2 Seiten
Vasudevan 2019
Vassu Devan
Noch keine Bewertungen
How To Automate ImageJ Analysis With Macros and Batch Processing
Dokument4 Seiten
How To Automate ImageJ Analysis With Macros and Batch Processing
Arjun Mehta
100% (5)
Development of A Scilab/Matlab Toolbox Dedicated To LTI/LPV Descriptor Systems For Fault Diagnosis ?
Dokument7 Seiten
Development of A Scilab/Matlab Toolbox Dedicated To LTI/LPV Descriptor Systems For Fault Diagnosis ?
Lamine Algeria
Noch keine Bewertungen
Computing Fundamentals Assignment
Dokument11 Seiten
Computing Fundamentals Assignment
Mary Jane Evardone Espino
Noch keine Bewertungen
CentrixMDS Product Overview
Dokument7 Seiten
CentrixMDS Product Overview
rsgarcia
Noch keine Bewertungen
IT Welcome Kit 1.0 PDF
Dokument9 Seiten
IT Welcome Kit 1.0 PDF
Uu
Noch keine Bewertungen
Objectives:: Regional Training On Pmis Basic Inputs and System Enhancement Cum Monitoring of System Installation To Ros
Dokument3 Seiten
Objectives:: Regional Training On Pmis Basic Inputs and System Enhancement Cum Monitoring of System Installation To Ros
MARLON CUSTODIO
Noch keine Bewertungen
Information Security
Dokument2 Seiten
Information Security
Raghunath Parulekar
Noch keine Bewertungen
Parallel Architecture Classification
Dokument41 Seiten
Parallel Architecture Classification
Abhishek singh
0% (1)
CAD Viewers
Dokument24 Seiten
CAD Viewers
johnaustin1
Noch keine Bewertungen
Manual GST-M200
Dokument2 Seiten
Manual GST-M200
Mauricio Fuentes Abarzua
100% (1)
E-Recruitment: Avinash S. Kapse, Vishal S. Patil, Nikhil V. Patil
Dokument5 Seiten
E-Recruitment: Avinash S. Kapse, Vishal S. Patil, Nikhil V. Patil
Ridish Kumar
Noch keine Bewertungen
Top 50 SAP FICO Interview Questions and Answers 1673535378
Dokument14 Seiten
Top 50 SAP FICO Interview Questions and Answers 1673535378
sudershan9
Noch keine Bewertungen
AFP Resource Manager Manual en
Dokument34 Seiten
AFP Resource Manager Manual en
Roberta Casola
Noch keine Bewertungen
CMOS Circuit Layout
Dokument4 Seiten
CMOS Circuit Layout
Abhijeet Kumar
Noch keine Bewertungen
Pega CLSA Office Hour Note 1651953783
Dokument21 Seiten
Pega CLSA Office Hour Note 1651953783
Chinmayee Parija
Noch keine Bewertungen
The Demi Virgin
Dokument4 Seiten
The Demi Virgin
Robert Bonisolo
Noch keine Bewertungen
Datasheet CH3MNAS English
Dokument3 Seiten
Datasheet CH3MNAS English
txomon
Noch keine Bewertungen
Business To Manufacturing Markup Language Batch Information Version 6.0 - March 2013 Batchml - Batch Information
Dokument52 Seiten
Business To Manufacturing Markup Language Batch Information Version 6.0 - March 2013 Batchml - Batch Information
Wass Gharbi
Noch keine Bewertungen
Amdahl's Law in The Multicore Era
Dokument6 Seiten
Amdahl's Law in The Multicore Era
Dmytro Shteflyuk
100% (1)
SAP.C ABAPD 2309.v2024-02-12.q35
Dokument34 Seiten
SAP.C ABAPD 2309.v2024-02-12.q35
Mallar Saha
Noch keine Bewertungen
Inventory Management in SAP BW - 4HANA
Dokument7 Seiten
Inventory Management in SAP BW - 4HANA
dibyajotibiswal
Noch keine Bewertungen
English Grade 6 Flipbook
Dokument139 Seiten
English Grade 6 Flipbook
DroidAbramTelan
100% (1)
LCHS General Brochure Preview
Dokument8 Seiten
LCHS General Brochure Preview
Rizalito Lloven Briones
Noch keine Bewertungen
IEEE Conf 2018 TrackNet - A - Deep - Learning - Based - Fault - Detection - For - Railway - Track - Inspection
Dokument5 Seiten
IEEE Conf 2018 TrackNet - A - Deep - Learning - Based - Fault - Detection - For - Railway - Track - Inspection
karuldeepa
Noch keine Bewertungen
E01.1 - XenApp and XenDesktop 7.6
Dokument2.969 Seiten
E01.1 - XenApp and XenDesktop 7.6
falberto08
Noch keine Bewertungen
Enroll. No. - : Marwadi University
Dokument4 Seiten
Enroll. No. - : Marwadi University
Rudrik Bhatt
Noch keine Bewertungen