Willkommen bei Scribd!

Karussell überspringen

Regularization

Hochgeladen von

Sai Sumanth P

0% fanden dieses Dokument nützlich (0 Abstimmungen)

49 Ansichten14 Seiten

Regularization

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Regularization

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

49 Ansichten14 Seiten

Regularization

Hochgeladen von

Sai Sumanth P

Regularization

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 14

Im Dokument suchen

Chapter 7:

Regularization for
Deep Learning

Deep Learning Textbook Study Group, SF

Safak Ozkan
April 15, 2017

1 Safak Ozkan
Chapter 7: Regularization for Deep Learning

L2 Parameter Regularization
L1 Parameter Regularization
Norm Penalties and Constrained Optimization
Regularization and Under-Constrained Problems
Dataset Augmentation
Noise Robustness
Injecting Noise at Output Targets
Early Stopping
Semi Supervised Learning
Multi-Task Learning
Parameter Tying and Parameter Sharing
Bagging and Other Ensemble Methods
Dropout
Adversarial Training
Tangent Distance, Manifold Tangent Classifier
2 of 13 Safak Ozkan
Definition

Regularization is any modification we make to a

learning algorithm that is intended to reduce its
test error but NOT its training error.

Etrain : Training Error Etest : Test Error

(or Generalization Error)

3 of 13 Safak Ozkan
L2 Regularization
(a.k.a. Weight decay, Tikhonov regularization, Ridge regression)

Regularization increases bias and reduces variance.

Regularization
parameter

Regularized Regularization term

cost function Unregularized
Cost function

Gradient Descent update rule:

Additional term

4 of 13 Safak Ozkan
L2 Regularization

Lagrangian Constrained Optimization

Lagrangian
multiplier

is equivalent to optimizing
such that .

5 of 13 Safak Ozkan
L2 Regularization

Lagrangian Constrained Optimization

We typically dont set explicitly,
We set .

Unregularized
solution

Regularized Large small

solution constraint region

Large

6 of 13 Safak Ozkan
L2 Regularization

2nd degree Taylor Approximation of around :

unregularized
problem

At ,

Analysis through e-vector decomposition

Stretching in i th small eigen-directions will be affected

eigen direction: more than larger eigen-directions.

7 of 13 Safak Ozkan
L2 Regularization
Normal Equations for Linear Regression

Assume:

Then, would shrink

more than components.

covariance of input features

covariance of
with the target values.
input features

regularization causes the learning algorithm to

perceive the input with increased variance.

8 of 13 Safak Ozkan
L1 Regularization
(a.k.a. LASSO)

Regularization
Term

2nd degree Taylor Approximation

of around :

(Induces
Sparsity)

9 of 13 Safak Ozkan
Under-Constrained Problems
E.g. Logistic Regression

Linearly non seperable Linearly separable

Well behaved problem. Under-determined problem.

( will continue to increase
in a GD Algorithm)

10 of 13 Safak Ozkan
Data Augmentation
Best way to improve generalization of a model is
to train it on more data.
Data Augmentation works particularly well for
Object Recognition tasks.
Injecting noise to input works well for
Speech Recognition.
Affine Elastic
Distortion Noise Deformation
Original
Input Image

Horizontal Random Hue

Flip Translation Shift

11 of 13 Safak Ozkan
Noise Robustness
Addition of noise with a small variance is
equivalent to imposing norm penalty on weights.
Noise on weights: A stochastic implementation of
Bayesian Inference (uncertainty on weights are
represented by a probability distribution)

For each input data,

apply noise on weights

modified cost
function

regularization term

12 of 13 Safak Ozkan
Early Stopping

regularization
number of parameter
learning rate
steps
13 of 13 Safak Ozkan
Early Stopping
HAPTER 7. REGULARIZATION FOR DEEP LEARNING
Early stopping: Terminate while validation set
performance is better

0.20
Loss (negative log-likelihood)

Training set loss

0.15 Validation set loss

0.10

0.05

0.00
0 50 100 150 200 250
Time (epochs)

gure 7.3: Learning curves showing how the negative log-likelihood loss changes o
14 of 13 Safak Ozkan

Das könnte Ihnen auch gefallen

Partial Differential Equations of Applied Mathematics
Von Everand
Partial Differential Equations of Applied Mathematics
Erich Zauderer
Bewertung: 3.5 von 5 Sternen
3.5/5 (1)
Greedy Technique
Dokument37 Seiten
Greedy Technique
gorakhnnath
Noch keine Bewertungen
Stephen Klosterman - Data Science Projects With Python - A Case Study Approach To Successful Data Science Projects Using Python, Pandas, and Scikit-Learn (2019)
Dokument374 Seiten
Stephen Klosterman - Data Science Projects With Python - A Case Study Approach To Successful Data Science Projects Using Python, Pandas, and Scikit-Learn (2019)
NIKHIL WAKODE
100% (1)
Deep Learning Tutorial Release 0.1
Dokument173 Seiten
Deep Learning Tutorial Release 0.1
lerhlerh
Noch keine Bewertungen
Math Lesson Plan 1
Dokument6 Seiten
Math Lesson Plan 1
api-300499643
Noch keine Bewertungen
Linear - Regression & Evaluation Metrics
Dokument31 Seiten
Linear - Regression & Evaluation Metrics
reshma acharya
Noch keine Bewertungen
Neural Networks Desing - Martin T. Hagan - 2nd Edition
Dokument1.013 Seiten
Neural Networks Desing - Martin T. Hagan - 2nd Edition
Yeisson Muñoz
100% (1)
Statistical Machine Learning
Dokument12 Seiten
Statistical Machine Learning
Deva Hema
100% (1)
Basic Data Science Interview Questions Explained
Dokument38 Seiten
Basic Data Science Interview Questions Explained
sahil kumar
Noch keine Bewertungen
BEHAVIORISM - Villaran, John Lawrence H.
Dokument9 Seiten
BEHAVIORISM - Villaran, John Lawrence H.
John Lawrence Villaran
100% (1)
Data Science Interview Questions
Dokument300 Seiten
Data Science Interview Questions
MaheshBirajdar
100% (1)
Letter To God Q:Ans PDF
Dokument6 Seiten
Letter To God Q:Ans PDF
Arnav Singhal
Noch keine Bewertungen
Happy Valentine Day SMS 2017 - Short SMS For BF and GF
Dokument5 Seiten
Happy Valentine Day SMS 2017 - Short SMS For BF and GF
Abid Tanveer
Noch keine Bewertungen
1.1 A Letter To God-Cw-Material For Reference
Dokument26 Seiten
1.1 A Letter To God-Cw-Material For Reference
Chilukuri Teja
Noch keine Bewertungen
Bilingual Education Timeline
Dokument2 Seiten
Bilingual Education Timeline
api-293758675
0% (1)
Child Directed Speech 2015
Dokument10 Seiten
Child Directed Speech 2015
api-315440977
Noch keine Bewertungen
Deep Learning: Huawei AI Academy Training Materials
Dokument47 Seiten
Deep Learning: Huawei AI Academy Training Materials
Mohammad Waleed
Noch keine Bewertungen
Iterative Algorithms I PDF
Dokument445 Seiten
Iterative Algorithms I PDF
Betulix
Noch keine Bewertungen
Maximum Likelihood
Dokument16 Seiten
Maximum Likelihood
sup2624rak
Noch keine Bewertungen
1.2 Master Deep Learning Computer Vision Slides PDF
Dokument666 Seiten
1.2 Master Deep Learning Computer Vision Slides PDF
DM Timane
67% (3)
Weekly Home Learning Plan For Online Distance Learning-Q 3 Week 1
Dokument8 Seiten
Weekly Home Learning Plan For Online Distance Learning-Q 3 Week 1
ROVELYNE DE LUNA
Noch keine Bewertungen
Fundamentals of business Analytics - Case Study 1: Contact vs Glasses by Age Group
Dokument5 Seiten
Fundamentals of business Analytics - Case Study 1: Contact vs Glasses by Age Group
Christine Joyce Magote
Noch keine Bewertungen
6 Week Study Plan New Convert
Dokument6 Seiten
6 Week Study Plan New Convert
ayat tubji
100% (1)
LEARNING DECLARATIVE AND PROCEDURAL KNOWLEDGE VIA VIDEO LECTURES: Cognitive Load and Learning Effectiveness
Dokument17 Seiten
LEARNING DECLARATIVE AND PROCEDURAL KNOWLEDGE VIA VIDEO LECTURES: Cognitive Load and Learning Effectiveness
Jade Michelle Conciso Pabalinas
Noch keine Bewertungen
Indian Literature
Dokument12 Seiten
Indian Literature
Juan Lorenzo Edullantes Bernido
Noch keine Bewertungen
Machine Learning Andrew NG Week 6 Quiz 1
Dokument8 Seiten
Machine Learning Andrew NG Week 6 Quiz 1
Hương Đặng
Noch keine Bewertungen
Interaction
Dokument4 Seiten
Interaction
joshua patilan
Noch keine Bewertungen
13100043HBET1303Doing Students Justice How L1 Acquisition Influences L2 PDF
Dokument6 Seiten
13100043HBET1303Doing Students Justice How L1 Acquisition Influences L2 PDF
blue_shylin
50% (2)
Game Lesson Plan
Dokument3 Seiten
Game Lesson Plan
api-300676725
100% (1)
Extrapolation Methods for Extending Known Data Points
Dokument3 Seiten
Extrapolation Methods for Extending Known Data Points
makarandwath
Noch keine Bewertungen
Exploratory Data Analysis - Komorowski PDF
Dokument20 Seiten
Exploratory Data Analysis - Komorowski PDF
EdinssonRamos
Noch keine Bewertungen
Curvefitting Manual PDF
Dokument54 Seiten
Curvefitting Manual PDF
Arup Kunti
Noch keine Bewertungen
Multiple Linear Regression Using Python Machine Learning: Kaleab Woldemariam, June 2017
Dokument8 Seiten
Multiple Linear Regression Using Python Machine Learning: Kaleab Woldemariam, June 2017
apurv shukla
Noch keine Bewertungen
02 Machine Learning Overview
Dokument103 Seiten
02 Machine Learning Overview
Dhouha Benzina
Noch keine Bewertungen
K-Means Clustering for Data Segmentation
Dokument57 Seiten
K-Means Clustering for Data Segmentation
Albin Mathew
0% (1)
05-TrainingNN PDF
Dokument81 Seiten
05-TrainingNN PDF
Muhammad Rizwan Khalid
Noch keine Bewertungen
Curve Fitting
Dokument4 Seiten
Curve Fitting
kh5892
Noch keine Bewertungen
Hypothesis Testing
Dokument5 Seiten
Hypothesis Testing
Rikki Mera
Noch keine Bewertungen
Digital Game-Based Learning Introduction and Literature Review
Dokument9 Seiten
Digital Game-Based Learning Introduction and Literature Review
BAEDAEBOK
Noch keine Bewertungen
Marketing Management U 1
Dokument27 Seiten
Marketing Management U 1
Sana Khursheed
Noch keine Bewertungen
NGS Data Preprocessing
Dokument20 Seiten
NGS Data Preprocessing
Fadhili
Noch keine Bewertungen
GSAS Parameters & Controls What To Refine When? (Refinement Recipes)
Dokument14 Seiten
GSAS Parameters & Controls What To Refine When? (Refinement Recipes)
Alf Simpatico
Noch keine Bewertungen
CS 4650/7650: Natural Language Processing: Neural Text Classification
Dokument85 Seiten
CS 4650/7650: Natural Language Processing: Neural Text Classification
Rahul Gautam
Noch keine Bewertungen
Dlincv 161110052148 PDF
Dokument271 Seiten
Dlincv 161110052148 PDF
Raj Verma
Noch keine Bewertungen
Python GTU Study Material Presentations Unit-5 20112020032922AM
Dokument24 Seiten
Python GTU Study Material Presentations Unit-5 20112020032922AM
Kushal Parmar
Noch keine Bewertungen
Chapter 13 Nonlinear Simulations 1
Dokument21 Seiten
Chapter 13 Nonlinear Simulations 1
Sony Jsd
Noch keine Bewertungen
ME L20 RootLocusLead
Dokument6 Seiten
ME L20 RootLocusLead
Rezkoda
Noch keine Bewertungen
3 Regularizations
Dokument24 Seiten
3 Regularizations
MInh Thanh
Noch keine Bewertungen
Multilayer Perceptron Optimization
Dokument19 Seiten
Multilayer Perceptron Optimization
Ram Bhagat Soni
Noch keine Bewertungen
Chapter 3: Multiple Linear Regression (Estimation)
Dokument23 Seiten
Chapter 3: Multiple Linear Regression (Estimation)
Yissek Batalla
Noch keine Bewertungen
ME451: Control Systems Course Roadmap
Dokument6 Seiten
ME451: Control Systems Course Roadmap
Vu Nghia
Noch keine Bewertungen
Optimization For ML (2) : CS771: Introduction To Machine Learning Piyush Rai
Dokument14 Seiten
Optimization For ML (2) : CS771: Introduction To Machine Learning Piyush Rai
Raja
Noch keine Bewertungen
Lec - 15-16 Denoising, Shrinkage and Other Transforms v4.0
Dokument4 Seiten
Lec - 15-16 Denoising, Shrinkage and Other Transforms v4.0
Nikesh Bajaj
Noch keine Bewertungen
3 Regression Diagnostics
Dokument53 Seiten
3 Regression Diagnostics
Arda Hüseyinoğlu
100% (1)
DL6 - Convnets 4
Dokument57 Seiten
DL6 - Convnets 4
razifa0
Noch keine Bewertungen
Tutorials On Design Expert
Dokument4 Seiten
Tutorials On Design Expert
Lea Grace Villazor Guilot
Noch keine Bewertungen
Lecture 5
Dokument31 Seiten
Lecture 5
Reema Amgad
Noch keine Bewertungen
3 - DeepLearning - and - CNN v3
Dokument50 Seiten
3 - DeepLearning - and - CNN v3
Dumidu Ghanasekara
Noch keine Bewertungen
Unit 3 - Diving - Deep - Learning
Dokument108 Seiten
Unit 3 - Diving - Deep - Learning
Alekhya Roy
Noch keine Bewertungen
1sensitivity Lecture Slides
Dokument59 Seiten
1sensitivity Lecture Slides
Khaled Hamdaoui
Noch keine Bewertungen
Twentyone 20466 PDF
Dokument15 Seiten
Twentyone 20466 PDF
Ram Bhagat Soni
Noch keine Bewertungen
Laplace Transformation - Part 1
Dokument25 Seiten
Laplace Transformation - Part 1
Jamiza shenning
Noch keine Bewertungen
Operant Conditioning: Learning Based on Consequences
Dokument3 Seiten
Operant Conditioning: Learning Based on Consequences
Rohan Godiyal
Noch keine Bewertungen
Final Evaluation Review
Dokument1 Seite
Final Evaluation Review
Parth Pandey
Noch keine Bewertungen
Backprop and Optimizers
Dokument62 Seiten
Backprop and Optimizers
Abdul hadi
Noch keine Bewertungen
JavaScript Developer Roadmap - Step by Step Guide To Learn JavaScript
Dokument1 Seite
JavaScript Developer Roadmap - Step by Step Guide To Learn JavaScript
goxed
Noch keine Bewertungen
Adaptive Tests of Significance Using Permutations of Residuals with R and SAS
Von Everand
Adaptive Tests of Significance Using Permutations of Residuals with R and SAS
Thomas W. O'Gorman
Noch keine Bewertungen
Computing for Calculus
Von Everand
Computing for Calculus
Mark J. Christensen
Noch keine Bewertungen
Multivariate LSTM-FCNs for Time Series Classification
Dokument9 Seiten
Multivariate LSTM-FCNs for Time Series Classification
Sai Sumanth P
Noch keine Bewertungen
Delving Deep Into Rectifiers: Surpassing Human-Level Performance On Imagenet Classification
Dokument11 Seiten
Delving Deep Into Rectifiers: Surpassing Human-Level Performance On Imagenet Classification
smisat
Noch keine Bewertungen
Cloud Based Big Data Analytics Framework For Face Recognition in Social Networks Using Machine Learning 2015 Procedia Computer Science
Dokument8 Seiten
Cloud Based Big Data Analytics Framework For Face Recognition in Social Networks Using Machine Learning 2015 Procedia Computer Science
Govind Upadhyay
Noch keine Bewertungen
Basic SQL
Dokument1 Seite
Basic SQL
Sai Sumanth P
Noch keine Bewertungen
Neural Network Based Energy Efficient Clustering and Routing in Wireless Sensor Networks
Dokument6 Seiten
Neural Network Based Energy Efficient Clustering and Routing in Wireless Sensor Networks
Sai Sumanth P
Noch keine Bewertungen
10 SLS I Key
Dokument1 Seite
10 SLS I Key
Sai Sumanth P
Noch keine Bewertungen
Polya
Dokument32 Seiten
Polya
Sai Sumanth P
Noch keine Bewertungen
C Programs
Dokument21 Seiten
C Programs
Sai Sumanth P
Noch keine Bewertungen
Sat 2004 Maths Questions
Dokument3 Seiten
Sat 2004 Maths Questions
Sai Sumanth P
Noch keine Bewertungen
Autoencoders - Buffalo University
Dokument36 Seiten
Autoencoders - Buffalo University
nitin
Noch keine Bewertungen
Collaborative Filtering - Dotx
Dokument36 Seiten
Collaborative Filtering - Dotx
Đřë Ťįmmý Ťūřněŗ
Noch keine Bewertungen
Personalize Movie Recommendation System CS 229 Project Final Writeup
Dokument6 Seiten
Personalize Movie Recommendation System CS 229 Project Final Writeup
abhay
0% (1)
Ridge and Lasso Regression for California Housing Data
Dokument18 Seiten
Ridge and Lasso Regression for California Housing Data
arso arsovski
Noch keine Bewertungen
We Are Intechopen, The World'S Leading Publisher of Open Access Books Built by Scientists, For Scientists
Dokument21 Seiten
We Are Intechopen, The World'S Leading Publisher of Open Access Books Built by Scientists, For Scientists
Gustavo Calizaya
Noch keine Bewertungen
Hardware Implementation of Electrical Resistance Tomography For Damage Detection of Carbon Fibre-Reinforced Polymer Composites
Dokument13 Seiten
Hardware Implementation of Electrical Resistance Tomography For Damage Detection of Carbon Fibre-Reinforced Polymer Composites
CESAR
Noch keine Bewertungen
Machine Learning: April 2022
Dokument32 Seiten
Machine Learning: April 2022
Rajachandra Voodiga
Noch keine Bewertungen
Preliminary OWR 2018 11
Dokument29 Seiten
Preliminary OWR 2018 11
Jaweria Amjad
Noch keine Bewertungen
DCinv V6 Rev2 Clean
Dokument38 Seiten
DCinv V6 Rev2 Clean
yasirarafat91
Noch keine Bewertungen
Regularization: The Problem of Overfitting
Dokument23 Seiten
Regularization: The Problem of Overfitting
PravinkumarGhodake
Noch keine Bewertungen
2d Overfitting 18may
Dokument19 Seiten
2d Overfitting 18may
Vageesha Shantha Veerabhadra Swamy
Noch keine Bewertungen
Aluminium Space Frame Model
Dokument22 Seiten
Aluminium Space Frame Model
articledownload2
Noch keine Bewertungen
Ordinal Feature Selection For Iris and Palmprint Recognition
Dokument38 Seiten
Ordinal Feature Selection For Iris and Palmprint Recognition
Bhuwon Arjun
Noch keine Bewertungen
Report Practical Pattern Recognition MNIST Dataset Analysis
Dokument13 Seiten
Report Practical Pattern Recognition MNIST Dataset Analysis
paul sakelaridis
Noch keine Bewertungen
Machine Learning Guidelines and Practical List - Tutorialsduniya
Dokument2 Seiten
Machine Learning Guidelines and Practical List - Tutorialsduniya
preethinanjundan
Noch keine Bewertungen
ISSE: An Interactive Source Separation Editor
Dokument10 Seiten
ISSE: An Interactive Source Separation Editor
Alex Arm
Noch keine Bewertungen
MNE Manual 2.7
Dokument356 Seiten
MNE Manual 2.7
Javi Cruz
Noch keine Bewertungen
Linear Regression Model Fundamentals
Dokument20 Seiten
Linear Regression Model Fundamentals
Omkar Todkar
100% (1)
Beginners Tutorial On XGBoost and Parameter Tuning in R Tutorials & Notes - Machine Learning - HackerEarth PDF
Dokument9 Seiten
Beginners Tutorial On XGBoost and Parameter Tuning in R Tutorials & Notes - Machine Learning - HackerEarth PDF
Zeeshan
Noch keine Bewertungen
Linear Factor Models and Auto-Encoders
Dokument28 Seiten
Linear Factor Models and Auto-Encoders
Muhammad Rizwan
Noch keine Bewertungen
Regularization
Dokument38 Seiten
Regularization
K.P.Revathi Asst prof - IT Dept
Noch keine Bewertungen
Large Margin Deep Networks For Classification
Dokument16 Seiten
Large Margin Deep Networks For Classification
Shah Nawaz Khan
Noch keine Bewertungen