Willkommen bei Scribd!

Karussell überspringen

S7 extraFeatureSelection

Hochgeladen von

sargentshriver

0% fanden dieses Dokument nützlich (0 Abstimmungen)

266 Ansichten7 Seiten

S7.2 slides

Originaltitel

S7_extraFeatureSelection

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

S7.2 slides

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

266 Ansichten7 Seiten

S7 extraFeatureSelection

Hochgeladen von

sargentshriver

S7.2 slides

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 7

Im Dokument suchen

S7

Extra: Feature Selec/on

Shawndra Hill Spring 2013 TR 1:30-3pm and 3-4:30

Feature Selec/on
Step 1: Use Domain knowledge to guide you whenever possible Step 2: Visualize aKributes Remove aKributes with no values, too many missing values Check for obvious outliers and remove them Step 3: Construct new aKributes (if it makes sense) Combine aKributes Normalize numeric aKributes (for regression, Nave Bayes, NN hKp://www.tuVs.edu/ ~gdallal/regtrans.htm) Create binary aKributes from nominal aKributes Step 4: Select the best subset of aKributes for the problem IF IN DOUBT CHOOSE A METHOD THAT DOES THE FEATURE SELECTION FOR YOU (for example, decision trees)

The Basics
Basic Ideas
Usually faced with problem of selec/ng subset of possible predictors Have to balance conic/ng objec/ves
Want to include all variables that have legi/mate predic/ve skill Want to exclude all extraneous variables that t only sample- specic noise
Reduce predic/ve skill Increase standard errors of regression coecients , classica/on, etc.

Ideally would be able to determine single best subset of predictors to include

But no single deni/on of best Dierent algorithms will produce dierent "best" subsets Problems magnied by correla/on among predictors

Feature Selec/on
Ranking
By some objec/ve (for example, informa/on gain)

Subset
Algorithms (see next slide) Wrapper (try subset within the context of the algorithm you know you are going to use)

Feature Selec/on Algorithms

All possible subsets
Only feasible with small number of poten/al predictors (maybe 10 or less) Then can use one or more of possible numerical criteria to nd overall best Start with no predictors

Forward stepwise regression

First include predictor with highest correla/on with response In subsequent steps add predictors with highest par/al correla/on with response controlling for variables already in equa/ons Stop when numerical criterion signals maximum (minimum) Some/mes eliminate variables when t value gets too small

Backward elimina/on

Only possible method for very large predictor pools Local op/miza/on at each step, no guarantee of nding overall op/mum Start with all predictors in equa/on

OVen produces dierent nal model than forward stepwise method

Remove predictor with smallest t value Con/nue un/l numerical criterion signals maximum (minimum)

Mul/colinearity (regression)
The degree of correlation between Xs. A high degree of multicolinearity produces unacceptable uncertainty (large variance) in regression coefficient estimates (i.e., large sampling variation) Imprecise estimates of slopes and even the signs of the coefficients may be misleading. t-tests which fail to reveal significant factors. The analysis of variance for the overall model may show a highly signicantly good t, when paradoxically; the tests for individual predictors are non-signicant.

S7 Extra: Feature Selec/on

Shawndra Hill Spring 2013 TR 1:30-3pm and 3-4:30

Das könnte Ihnen auch gefallen

Advanced Statistics Manual PDF
Dokument258 Seiten
Advanced Statistics Manual PDF
hamartinez
100% (3)
Feature Selection Can Improve Accuracy and Model Interpretability
Dokument25 Seiten
Feature Selection Can Improve Accuracy and Model Interpretability
marcsader
Noch keine Bewertungen
Fiches Machine Learning
Dokument21 Seiten
Fiches Machine Learning
Rhysand Re
Noch keine Bewertungen
Data Analysis (27 Questions) : 1. (Given A Dataset) Analyze This Dataset and Tell Me What You Can Learn From It
Dokument28 Seiten
Data Analysis (27 Questions) : 1. (Given A Dataset) Analyze This Dataset and Tell Me What You Can Learn From It
kumar kumar
Noch keine Bewertungen
Machine Learning Interview Questions.
Dokument43 Seiten
Machine Learning Interview Questions.
hari krishna reddy
100% (1)
C4.5 and CHAID Algorithm: Pavan J Joshi 2010MCS2095 Special Topics in Database Systems
Dokument30 Seiten
C4.5 and CHAID Algorithm: Pavan J Joshi 2010MCS2095 Special Topics in Database Systems
Fidia Dta
Noch keine Bewertungen
Multivariate Statistical Methods with R
Dokument11 Seiten
Multivariate Statistical Methods with R
qwety300
Noch keine Bewertungen
Probability Models in Marketing
Dokument66 Seiten
Probability Models in Marketing
dualballers
Noch keine Bewertungen
Null - 2023-08-29T105405.196
Dokument4 Seiten
Null - 2023-08-29T105405.196
Gourav verma
Noch keine Bewertungen
8ad59658 1701235711480
Dokument36 Seiten
8ad59658 1701235711480
kashyaputtam7
Noch keine Bewertungen
Control Charts For Variable Data: STAT8010 Applied Statistical Techniques
Dokument22 Seiten
Control Charts For Variable Data: STAT8010 Applied Statistical Techniques
Isha B
Noch keine Bewertungen
5224 Measure Phase 2
Dokument41 Seiten
5224 Measure Phase 2
Gark Lop
Noch keine Bewertungen
Measurement and Control of Experimental Error: Bull's Eye Represents The True Value of The Parameter You Wish To Estimate
Dokument17 Seiten
Measurement and Control of Experimental Error: Bull's Eye Represents The True Value of The Parameter You Wish To Estimate
-
Noch keine Bewertungen
Lesson 5 Model Selection
Dokument41 Seiten
Lesson 5 Model Selection
maartenwilders
Noch keine Bewertungen
SPC Basics: Presented By: Tariq Khurshid
Dokument50 Seiten
SPC Basics: Presented By: Tariq Khurshid
tkhurshid3997
Noch keine Bewertungen
Multivariate Analysis Techniques for Market Segmentation
Dokument57 Seiten
Multivariate Analysis Techniques for Market Segmentation
suduku007
100% (1)
ML3 - Evaluation
Dokument65 Seiten
ML3 - Evaluation
param_email
100% (1)
Quick Answers: To Your Initial Review Concerns
Dokument11 Seiten
Quick Answers: To Your Initial Review Concerns
Apoorva
Noch keine Bewertungen
Add Two Numbers Software Testing Using Equivalence Classes and Boundary Values
Dokument60 Seiten
Add Two Numbers Software Testing Using Equivalence Classes and Boundary Values
Abhinav Daksha
Noch keine Bewertungen
RSM Part1 Intro
Dokument61 Seiten
RSM Part1 Intro
ksheikh777
Noch keine Bewertungen
L25 Recap of Data Analysis PDF
Dokument3 Seiten
L25 Recap of Data Analysis PDF
Ananya Agarwal
Noch keine Bewertungen
Dsur I Chapter 18 Categorical Data
Dokument47 Seiten
Dsur I Chapter 18 Categorical Data
Danny
Noch keine Bewertungen
Decision Trees
Dokument16 Seiten
Decision Trees
AsemSaleh
100% (2)
02-MLR For Prediction
Dokument24 Seiten
02-MLR For Prediction
prashant
Noch keine Bewertungen
Cluster Analysis: Abu Bashar
Dokument18 Seiten
Cluster Analysis: Abu Bashar
Abu Bashar
Noch keine Bewertungen
Unit6 Part3 General Procedure
Dokument19 Seiten
Unit6 Part3 General Procedure
tamanna sharma
Noch keine Bewertungen
Fractional Factorial Designs Experiments
Dokument23 Seiten
Fractional Factorial Designs Experiments
roger_roland_1
Noch keine Bewertungen
SPC Presentation
Dokument45 Seiten
SPC Presentation
danaka007
Noch keine Bewertungen
QTM Cycle 7 Session 8
Dokument75 Seiten
QTM Cycle 7 Session 8
Ottilie
Noch keine Bewertungen
Statistics For Data Science
Dokument30 Seiten
Statistics For Data Science
ArminSayadi
Noch keine Bewertungen
Predictive Modeling Questions and Answers
Dokument32 Seiten
Predictive Modeling Questions and Answers
Asim Mazin
100% (1)
Modeling and Simulation: ME 635/IPD 611 Kishore Pochiraju
Dokument48 Seiten
Modeling and Simulation: ME 635/IPD 611 Kishore Pochiraju
Fred
Noch keine Bewertungen
Clustering (Unit 3)
Dokument71 Seiten
Clustering (Unit 3)
vedang maheshwari
100% (1)
Input Modeling For Simulation
Dokument48 Seiten
Input Modeling For Simulation
ロサカルメン
Noch keine Bewertungen
Tolerance Stackup Course
Dokument256 Seiten
Tolerance Stackup Course
jack mcall
Noch keine Bewertungen
Demantra
Dokument49 Seiten
Demantra
Essam Zhdy
Noch keine Bewertungen
Data Mining Primer
Dokument5 Seiten
Data Mining Primer
JoJo Bristol
Noch keine Bewertungen
Week 7 - Tree-Based Model
Dokument8 Seiten
Week 7 - Tree-Based Model
Nguyễn Trường Sơn
100% (1)
Model Selection Strategies
Dokument20 Seiten
Model Selection Strategies
Ilinca Maria
Noch keine Bewertungen
Missing Data Analysis: University College London, 2015
Dokument37 Seiten
Missing Data Analysis: University College London, 2015
charudattasonawane55
Noch keine Bewertungen
Data Analysis Using SPSS: Research Workshop Series
Dokument86 Seiten
Data Analysis Using SPSS: Research Workshop Series
Muhammad Asad Ali
Noch keine Bewertungen
10 - APM 1205 Linear Model
Dokument40 Seiten
10 - APM 1205 Linear Model
Teddy Bonitez
Noch keine Bewertungen
A Recipe For Training Neural Networks
Dokument15 Seiten
A Recipe For Training Neural Networks
Choukha Ram (cRc)
Noch keine Bewertungen
J Sir-PCA - SPSS
Dokument31 Seiten
J Sir-PCA - SPSS
sdsas
Noch keine Bewertungen
UDST Technical and Vocational Education Model Metrics
Dokument29 Seiten
UDST Technical and Vocational Education Model Metrics
fgfdgfdgfd
Noch keine Bewertungen
Introduction To SEM
Dokument64 Seiten
Introduction To SEM
Thu Le
Noch keine Bewertungen
Exam PA Knowledge Based Outline
Dokument22 Seiten
Exam PA Knowledge Based Outline
Trong Nghia Vu
Noch keine Bewertungen
Variable Selection
Dokument13 Seiten
Variable Selection
shishir
Noch keine Bewertungen
Path Testing Criteria
Dokument11 Seiten
Path Testing Criteria
bharathimanian
50% (2)
Surrogate Modelling: An Overview
Dokument17 Seiten
Surrogate Modelling: An Overview
Tapas Kumar Das
Noch keine Bewertungen
Unit 4
Dokument33 Seiten
Unit 4
Prathmesh Mane Deshmukh
Noch keine Bewertungen
LM-Webinar On Multivariate Techniques For Research - Intro and MRA
Dokument24 Seiten
LM-Webinar On Multivariate Techniques For Research - Intro and MRA
Rollan P. Inis
Noch keine Bewertungen
Data Analysis Checklist
Dokument2 Seiten
Data Analysis Checklist
Luca Camerini
Noch keine Bewertungen
Intro To Data Science Summary
Dokument17 Seiten
Intro To Data Science Summary
Hussein ElGhoul
Noch keine Bewertungen
Cluster Analysis: Prentice-Hall, Inc
Dokument33 Seiten
Cluster Analysis: Prentice-Hall, Inc
ankur_saini_17
Noch keine Bewertungen
Multivariate Analysis
Dokument57 Seiten
Multivariate Analysis
shishirk12
Noch keine Bewertungen
Regression PDF
Dokument33 Seiten
Regression PDF
波唐
Noch keine Bewertungen
Practical Design of Experiments: DoE Made Easy
Von Everand
Practical Design of Experiments: DoE Made Easy
Colin Hardwick
Bewertung: 4.5 von 5 Sternen
4.5/5 (7)
Ways to Achieve Quality
Von Everand
Ways to Achieve Quality
chakrapani srinivasa
Noch keine Bewertungen
How to Find Inter-Groups Differences Using Spss/Excel/Web Tools in Common Experimental Designs: Book 1
Von Everand
How to Find Inter-Groups Differences Using Spss/Excel/Web Tools in Common Experimental Designs: Book 1
P.Y. Cheng
Noch keine Bewertungen
Shawndra Hill Upenn Jasonalb Big Data WK11
Dokument16 Seiten
Shawndra Hill Upenn Jasonalb Big Data WK11
sargentshriver
Noch keine Bewertungen
s18 RecSys
Dokument70 Seiten
s18 RecSys
sargentshriver
Noch keine Bewertungen
S10
Dokument101 Seiten
S10
sargentshriver
Noch keine Bewertungen
S7 WEKAIntro
Dokument28 Seiten
S7 WEKAIntro
sargentshriver
Noch keine Bewertungen
Shawndra Hill Spring 2013 TR 1:30 - 3pm and 3 - 4:30
Dokument104 Seiten
Shawndra Hill Spring 2013 TR 1:30 - 3pm and 3 - 4:30
sargentshriver
Noch keine Bewertungen
S6 Evaluation
Dokument78 Seiten
S6 Evaluation
sargentshriver
Noch keine Bewertungen
Shawndra Hill Spring 2013 TR 1:30 - 3pm and 3 - 4:30
Dokument75 Seiten
Shawndra Hill Spring 2013 TR 1:30 - 3pm and 3 - 4:30
sargentshriver
Noch keine Bewertungen
S4
Dokument85 Seiten
S4
sargentshriver
Noch keine Bewertungen
Syllabus
Dokument5 Seiten
Syllabus
sargentshriver
Noch keine Bewertungen
S1 Introduction To Course
Dokument102 Seiten
S1 Introduction To Course
sargentshriver
Noch keine Bewertungen
S2 DataStructuresandSQL
Dokument180 Seiten
S2 DataStructuresandSQL
sargentshriver
Noch keine Bewertungen
The Spring 2013 Syllabus For OPIM 472
Dokument1 Seite
The Spring 2013 Syllabus For OPIM 472
sargentshriver
Noch keine Bewertungen
Syllabus
Dokument5 Seiten
Syllabus
sargentshriver
Noch keine Bewertungen
Acvuracy Precision Error Unit-1
Dokument29 Seiten
Acvuracy Precision Error Unit-1
manjot kaur
Noch keine Bewertungen
FEM Questions
Dokument7 Seiten
FEM Questions
N Dhanunjaya Rao Borra
Noch keine Bewertungen
Wxmaxima For Calculus I CQ
Dokument158 Seiten
Wxmaxima For Calculus I CQ
Risdita Putra Arfiyan
Noch keine Bewertungen
3 Properties of Real Numbers Chart
Dokument1 Seite
3 Properties of Real Numbers Chart
wloch
Noch keine Bewertungen
Summative Test in MATHEMATICS
Dokument2 Seiten
Summative Test in MATHEMATICS
Joanes Ocamia
100% (4)
Results: Paired Samples T-Test
Dokument3 Seiten
Results: Paired Samples T-Test
Satya Dharma
Noch keine Bewertungen
Legal Medicine and Medical Jurisprudence
Dokument47 Seiten
Legal Medicine and Medical Jurisprudence
t7uyuytu
Noch keine Bewertungen
Uji Hipotesis Rata-Rata 2 Populasi
Dokument4 Seiten
Uji Hipotesis Rata-Rata 2 Populasi
testing
Noch keine Bewertungen
PB 2 Rayleigh Ritz Method For General Plate Analysis 1993
Dokument6 Seiten
PB 2 Rayleigh Ritz Method For General Plate Analysis 1993
cisco
Noch keine Bewertungen
Deriving Using Product and Quotient Rules: Michael Turner Alex Barbolovici
Dokument31 Seiten
Deriving Using Product and Quotient Rules: Michael Turner Alex Barbolovici
Alex Barbolovici
Noch keine Bewertungen
Direct Stiffness Method
Dokument6 Seiten
Direct Stiffness Method
MazharYasin
Noch keine Bewertungen
In Calibrating A 10
Dokument4 Seiten
In Calibrating A 10
GrenlyKereh
Noch keine Bewertungen
Module 4 Educ - Stat
Dokument4 Seiten
Module 4 Educ - Stat
ERICSON SABANGAN
Noch keine Bewertungen
Understanding Bond Price Volatility
Dokument37 Seiten
Understanding Bond Price Volatility
Harpreet
Noch keine Bewertungen
Ffjord: F - C D S R G M: REE Form Ontinuous Ynamics For Calable Eversible Enerative Odels
Dokument13 Seiten
Ffjord: F - C D S R G M: REE Form Ontinuous Ynamics For Calable Eversible Enerative Odels
jeff chen
Noch keine Bewertungen
Optimization Technique
Dokument30 Seiten
Optimization Technique
rahuljiit
100% (6)
Eng-Math-3, ch-1, 1st Order ODE
Dokument94 Seiten
Eng-Math-3, ch-1, 1st Order ODE
GUIDE ON BIO-MEDICAL ENGINEERING UNDERGRADUATE PROGRAM:
100% (2)
15.093J Optimization Methods: Lecture 4: The Simplex Method II
Dokument10 Seiten
15.093J Optimization Methods: Lecture 4: The Simplex Method II
Anup scribd
Noch keine Bewertungen
Problem 5 Problem Set 3.4B Pages 101-102 Maximize Subject To The Constraints
Dokument30 Seiten
Problem 5 Problem Set 3.4B Pages 101-102 Maximize Subject To The Constraints
Potnuru Vinay
Noch keine Bewertungen
The Wartegg Ziechen Test - A Literature Overview and A Meta-Analysis of Reliability and Validity PDF
Dokument14 Seiten
The Wartegg Ziechen Test - A Literature Overview and A Meta-Analysis of Reliability and Validity PDF
Selección y Gestión
Noch keine Bewertungen
Routh-Hurwitz Stability Criteria Explained
Dokument7 Seiten
Routh-Hurwitz Stability Criteria Explained
Revathi Krishnan
Noch keine Bewertungen
Project Cycle Management
Dokument19 Seiten
Project Cycle Management
nawtamson
Noch keine Bewertungen
Intersection of Planes
Dokument18 Seiten
Intersection of Planes
Eugene Sze
Noch keine Bewertungen
JBI - Ceklist Cross Sectional 1
Dokument9 Seiten
JBI - Ceklist Cross Sectional 1
Nabilah Mukti Rifahmi
Noch keine Bewertungen
Three-hour exam with 150 maximum marks
Dokument7 Seiten
Three-hour exam with 150 maximum marks
शिवम् सुनील कुमार
Noch keine Bewertungen
Manipal Institute of Technology
Dokument2 Seiten
Manipal Institute of Technology
Priyavrat Uniyal
Noch keine Bewertungen
Spectrophotometric Determination of The Equilibrium Constant of A Reaction
Dokument7 Seiten
Spectrophotometric Determination of The Equilibrium Constant of A Reaction
Viron Gil Estrada
100% (1)
Which of The Following Statements About The Equivalence Point of An Acid
Dokument10 Seiten
Which of The Following Statements About The Equivalence Point of An Acid
Corrine Perez
Noch keine Bewertungen
ACJC 2014 H2 Math JC2 Supp QP Paper
Dokument7 Seiten
ACJC 2014 H2 Math JC2 Supp QP Paper
RaymondZhang
100% (1)
General Mathematics - M02 - L01 - WEEK 2
Dokument2 Seiten
General Mathematics - M02 - L01 - WEEK 2
Ji Pao
Noch keine Bewertungen