Willkommen bei Scribd!

Regression, Classification and Clustering

Hochgeladen von

100% fanden dieses Dokument nützlich (2 Abstimmungen)

347 Ansichten23 Seiten

DATA MINING - Exploring hidden information models of DATA MINING Prediction Model Makes prediction using known results found from different data objects. REGRESSION Definition Numeric prediction of the value of dependent variable. Relationship between dependent and independent variable(s) are expressible through mathematical equation. CLASSIFICATION Definition Predicts class membership of data instances Classes are non-overlapping Classes are already defined.

Originalbeschreibung:

Copyright

Verfügbare Formate

PPTX, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPTX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

100% fanden dieses Dokument nützlich (2 Abstimmungen)

347 Ansichten23 Seiten

Regression, Classification and Clustering

Hochgeladen von

Mahrukh Fida

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als PPTX, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 23

Im Dokument suchen

Mah-Rukh Fida June 2012

Topics to be discussed
DATA MINING
REGRESSION CLASSIFICATION

CLUSTERING

DATA MINING

Definition
Definition : Exploring hidden information
Models of data mining

Two categories of data mining models

Prediction Model

Makes prediction using known results found from different data objects.

Descriptive Model

Identifies patterns or relationships in data. Explores properties of the data examined Does not predict new properties.

REGRESSION

Definition
Numeric prediction of the value of dependent variable.
Relationship

between dependent and independent variable(s) are expressible through mathematical equation.

Types of regression

Types of Regression
Linear regression y=c+mx, where c and m are regression coefficients. Multi-Linear regression y=c0+c1x1+c2x2++cnxn where c0,c1,cn are regression coefficients and x1, x2,,xn are independent variables.

Basic Steps of Prediction

m= (270,000-180,000) / (33,000-17,000) = 90/16 =5.6 Now y = 100,000 + 5.6 x, put x=30,000, then y=100,000+ (5.6) (30,000) =268,000

Regression Continued
Regression model is selected when Prediction of a continuous or numerical value is needed The relationship of predictor and response can be expressed in the form of a curve or a mathematical equation Regression is not suitable when Data may not fit in linear model Linear data may be poor due to noise or outliers. Data is non-numeric

CLASSIFICATION

Definition
Predicts class membership of data instances Classes are non-overlapping

Classes are already defined

Basic Steps for Prediction

Model Construction Model Usage Example :

Height based Output follows the below given division criteria: 2m Height 1.7m < Height < 2m Height 1.7m Classify :<Pat, F, 1.6> using KNN with K=5. Tall Medium Short

- {<Kristina, F, 1.6>, <Kathy, F, 1.6>, < Stephanie, F, 1.7>, <Dave, M, 1.7>, <Wynette, F, 1.75>}. - Pat is Short.

Validation Criteria

CLUSTERING

Definition
Grouping of like terms
Groups are not predefined

Four Clusters

Clustering Algorithms

Four Basic Steps in Clustering Feature Selection

E.g. We have to make groups of students in a class, let the grouping is done on the basis of intelligence level of students

Similarity Measure
The intelligence level of students can be found by

taking a quiz. Marks obtained by students in the quiz are as follows Marks obtained by nine students: {2, 4, 10, 12, 3, 20, 30, 11, 25} The students who have little differences in the marks obtained should be grouped together.

Clustering Algorithm

Result Validation

If clusters do not make sense, go back to prior stage Check for tendency of clusters in the data set

Selection Criteria
Simplification
Useful in data concept construction Unsupervised learning

Validation Criteria
External criteria Entropy, F-Measure, NMI-Measure, Purity Internal criteria Sum of Squared Error, BIC, CH, DB, SIL, DUNN Relative criteria Entropy, SSE

END

Das könnte Ihnen auch gefallen

Trackpad Ver. 2.0 Class 5
Von Everand
Trackpad Ver. 2.0 Class 5
Nidhi Arora
Noch keine Bewertungen
Unit-Ii Chapter-3 Beyond Binary Classification Handling More Than Two Classes
Dokument16 Seiten
Unit-Ii Chapter-3 Beyond Binary Classification Handling More Than Two Classes
products info
Noch keine Bewertungen
Machine Learning Proceedings 1992: Proceedings of the Ninth International Workshop (ML92)
Von Everand
Machine Learning Proceedings 1992: Proceedings of the Ninth International Workshop (ML92)
Peter Edwards
Noch keine Bewertungen
Bayesian Networks, Dumpster-Shafer Theory
Dokument33 Seiten
Bayesian Networks, Dumpster-Shafer Theory
Atul Pawar
Noch keine Bewertungen
18CSC305J - Artificial Intelligence Unit IV Question Bank Part A
Dokument7 Seiten
18CSC305J - Artificial Intelligence Unit IV Question Bank Part A
axar kumar
Noch keine Bewertungen
Data Mining Lab Questions
Dokument47 Seiten
Data Mining Lab Questions
Sneha Pinky
100% (1)
AI Question Bank
Dokument19 Seiten
AI Question Bank
Karthikeyan Selva
Noch keine Bewertungen
Exercises With Solutions On OOP
Dokument8 Seiten
Exercises With Solutions On OOP
Bianca Balaita
Noch keine Bewertungen
Unit 3 AI Srs 13-14
Dokument45 Seiten
Unit 3 AI Srs 13-14
Supriya Attarkar
Noch keine Bewertungen
Artificial Intelligence Mcqs
Dokument173 Seiten
Artificial Intelligence Mcqs
MUHAMMAD KHUBAIB
Noch keine Bewertungen
Final Csi4107 2006
Dokument10 Seiten
Final Csi4107 2006
heroriss
100% (1)
Class X IT - 402 (Session 2022-23) Sample Paper-02
Dokument9 Seiten
Class X IT - 402 (Session 2022-23) Sample Paper-02
Neha Parmanandka
Noch keine Bewertungen
Applications of Community Mining Algorithms
Dokument17 Seiten
Applications of Community Mining Algorithms
Nelson Raja
Noch keine Bewertungen
Soft Computing Introduction
Dokument29 Seiten
Soft Computing Introduction
Harshali Y. Patil
Noch keine Bewertungen
Nr-35-Mca-Design and Analysis of Algorithm
Dokument2 Seiten
Nr-35-Mca-Design and Analysis of Algorithm
Srinivasa Rao G
100% (1)
Problem Formulation & Solving by Search
Dokument37 Seiten
Problem Formulation & Solving by Search
taurai
Noch keine Bewertungen
OOSE Syllabus
Dokument2 Seiten
OOSE Syllabus
Srikar Chintala
Noch keine Bewertungen
AI Log Book Final
Dokument37 Seiten
AI Log Book Final
VIVAAS .S
Noch keine Bewertungen
Issues in Knowledge Representation: Inverses
Dokument4 Seiten
Issues in Knowledge Representation: Inverses
Senthil Murugan
Noch keine Bewertungen
Applied Probability HW01-Sol
Dokument3 Seiten
Applied Probability HW01-Sol
Zunaash Rasheed
Noch keine Bewertungen
Lab Manual B.Sc. (CA) : Department of Computer Science Ccb-2P2: Laboratory Course - Ii
Dokument31 Seiten
Lab Manual B.Sc. (CA) : Department of Computer Science Ccb-2P2: Laboratory Course - Ii
Jennifer Ledesma-Pido
Noch keine Bewertungen
MA7155-Applied Probability and Statistics Question Bank
Dokument15 Seiten
MA7155-Applied Probability and Statistics Question Bank
selvakrishnan_s
Noch keine Bewertungen
Galgotias University Datascience Lab Manual
Dokument39 Seiten
Galgotias University Datascience Lab Manual
Raj Singh
Noch keine Bewertungen
IMP Questions ADA
Dokument7 Seiten
IMP Questions ADA
Heena Barad
Noch keine Bewertungen
Cbse - Department of Skill Education Artificial Intelligence
Dokument10 Seiten
Cbse - Department of Skill Education Artificial Intelligence
Aditya Tripathi
Noch keine Bewertungen
Forward Chaining and Backward Chaining in Ai: Inference Engine
Dokument18 Seiten
Forward Chaining and Backward Chaining in Ai: Inference Engine
Sanju Shree
Noch keine Bewertungen
Question bank-AI-12-13-10144CS601
Dokument30 Seiten
Question bank-AI-12-13-10144CS601
Bhaskar Veeraraghavan
100% (1)
Introduction: Introduction To Soft Computing Introduction To Fuzzy Sets and Fuzzy Logic Systems Introduction
Dokument1 Seite
Introduction: Introduction To Soft Computing Introduction To Fuzzy Sets and Fuzzy Logic Systems Introduction
Yaksh Shah
Noch keine Bewertungen
LOGIC TO CNF AND RESOLUTION FOR MATCH RESULT
Dokument2 Seiten
LOGIC TO CNF AND RESOLUTION FOR MATCH RESULT
Raj saranya
Noch keine Bewertungen
AI STUDY Metarial
Dokument9 Seiten
AI STUDY Metarial
Arohan Buddy
Noch keine Bewertungen
Algebraic Systems Examples and General Properties Semi Groups and Monoids Groups Sub Groups Homomorphism Isomorphism
Dokument32 Seiten
Algebraic Systems Examples and General Properties Semi Groups and Monoids Groups Sub Groups Homomorphism Isomorphism
naman jaiswal
Noch keine Bewertungen
Question Bank: Subject Name: Artificial Intelligence & Machine Learning Subject Code: 18CS71 Sem: VII
Dokument8 Seiten
Question Bank: Subject Name: Artificial Intelligence & Machine Learning Subject Code: 18CS71 Sem: VII
Dileep Kn
Noch keine Bewertungen
Unit 2 Fod
Dokument27 Seiten
Unit 2 Fod
it hod
Noch keine Bewertungen
AL3391 AI UNIT 4 NOTES EduEngg
Dokument42 Seiten
AL3391 AI UNIT 4 NOTES EduEngg
Karthik king K
Noch keine Bewertungen
15cs204j-Algorithm Design and Analysis
Dokument3 Seiten
15cs204j-Algorithm Design and Analysis
Anugrah Singhal
Noch keine Bewertungen
CS 391L Machine Learning Course Syllabus
Dokument2 Seiten
CS 391L Machine Learning Course Syllabus
Om Singh
Noch keine Bewertungen
TOC Question Bank
Dokument95 Seiten
TOC Question Bank
ayush
Noch keine Bewertungen
CS6659 AI UNIT 2 Notes
Dokument51 Seiten
CS6659 AI UNIT 2 Notes
profBalamurugan
100% (4)
Lab Manual in Theory of Computation
Dokument20 Seiten
Lab Manual in Theory of Computation
rhejlim6354
100% (2)
AKTU Syllabus CS 3rd Yr
Dokument1 Seite
AKTU Syllabus CS 3rd Yr
PPDC NAGAUR
Noch keine Bewertungen
Here are the answers to the questions on Python revision:1. _type 2. >3. and 4. i5. ii6. ii 7. i8. i9. i10. No output is printed as the code is just assigning values to variables
Dokument185 Seiten
Here are the answers to the questions on Python revision:1. _type 2. >3. and 4. i5. ii6. ii 7. i8. i9. i10. No output is printed as the code is just assigning values to variables
Naresh Kumawat
Noch keine Bewertungen
Lab 5 Best First Search For Scheduling
Dokument3 Seiten
Lab 5 Best First Search For Scheduling
chakravarthyashok
Noch keine Bewertungen
Analysis of Algorithms: Issues
Dokument37 Seiten
Analysis of Algorithms: Issues
Jeff Torralba
0% (1)
Machine Learning Techniques Exam Questions
Dokument2 Seiten
Machine Learning Techniques Exam Questions
Ritesh Tiwari
Noch keine Bewertungen
RGPV 7th Sem Scheme CSE.
Dokument1 Seite
RGPV 7th Sem Scheme CSE.
Ankit Agrawal
Noch keine Bewertungen
Cryptography & Number Theory
Dokument12 Seiten
Cryptography & Number Theory
Anji
Noch keine Bewertungen
18CSO106T Data Analysis Using Open Source Tool: Question Bank
Dokument26 Seiten
18CSO106T Data Analysis Using Open Source Tool: Question Bank
Shivaditya singh
Noch keine Bewertungen
Quiz Assignment
Dokument7 Seiten
Quiz Assignment
prateek
100% (1)
Question Paper Code: Reg. No.
Dokument2 Seiten
Question Paper Code: Reg. No.
Ponraj Park
100% (1)
Sigmoid Function: Soft Computing Assignment
Dokument12 Seiten
Sigmoid Function: Soft Computing Assignment
OMSAINATH MPONLINE
100% (1)
Cse325 Os Laboratory Manual PDF
Dokument37 Seiten
Cse325 Os Laboratory Manual PDF
Shoaib Akhter
Noch keine Bewertungen
Question Paper Code: X10326: Computer Science and Engineering
Dokument2 Seiten
Question Paper Code: X10326: Computer Science and Engineering
Samraj Jebasingh
Noch keine Bewertungen
Machine Learning Lesson - Plan
Dokument3 Seiten
Machine Learning Lesson - Plan
nalluri_08
Noch keine Bewertungen
OOSE Unitwise Questions
Dokument11 Seiten
OOSE Unitwise Questions
Jayaramsai Panchakarla
100% (1)
Int. To Data Analytics and Cyber Security Syllabus
Dokument2 Seiten
Int. To Data Analytics and Cyber Security Syllabus
nalluri_08
Noch keine Bewertungen
Question Bank (Unit I) Cs6402-Design and Analysis of Algorithms Part - A
Dokument12 Seiten
Question Bank (Unit I) Cs6402-Design and Analysis of Algorithms Part - A
viju001
Noch keine Bewertungen
Assignment Nptel
Dokument5 Seiten
Assignment Nptel
Vishal Kumar
Noch keine Bewertungen
Lab Report 1 PDF
Dokument6 Seiten
Lab Report 1 PDF
mr xyz
Noch keine Bewertungen
Lec-1 ML Intro
Dokument15 Seiten
Lec-1 ML Intro
Simanta Hazra
Noch keine Bewertungen
Software Development Life Cycle & Project Management
Dokument153 Seiten
Software Development Life Cycle & Project Management
Aakash
Noch keine Bewertungen
F Memory
Dokument17 Seiten
F Memory
Mahrukh Fida
Noch keine Bewertungen
G-Types of Software
Dokument22 Seiten
G-Types of Software
Mahrukh Fida
Noch keine Bewertungen
Econdary Torage Evices: Compiled by Mah-Rukh Fida
Dokument54 Seiten
Econdary Torage Evices: Compiled by Mah-Rukh Fida
Mahrukh Fida
Noch keine Bewertungen
Research Proposal Format-Producing Skilled Community
Dokument5 Seiten
Research Proposal Format-Producing Skilled Community
Mahrukh Fida
Noch keine Bewertungen
Lecture 1
Dokument42 Seiten
Lecture 1
Mahrukh Fida
100% (1)
Infineon EVAL - PASCO2 - SENSOR DataSheet v01 - 00 EN
Dokument22 Seiten
Infineon EVAL - PASCO2 - SENSOR DataSheet v01 - 00 EN
Tom Talicni
Noch keine Bewertungen
Data Visualization Question Bank eDBDA Sept 21
Dokument5 Seiten
Data Visualization Question Bank eDBDA Sept 21
Somesh Rewadkar
Noch keine Bewertungen
Introduction To Computer and Programming
Dokument5 Seiten
Introduction To Computer and Programming
MA Valdez
Noch keine Bewertungen
@isaacverse Thumbnail Guide
Dokument1 Seite
@isaacverse Thumbnail Guide
naosouofelipeneto
Noch keine Bewertungen
9k France Combolist
Dokument153 Seiten
9k France Combolist
acolyte546
Noch keine Bewertungen
Epicor ERP General Ledger Course 10 2 50
Dokument89 Seiten
Epicor ERP General Ledger Course 10 2 50
it puma
Noch keine Bewertungen
Top 10 SharePoint Interview Questions and Answers
Dokument9 Seiten
Top 10 SharePoint Interview Questions and Answers
ravindhar
Noch keine Bewertungen
Question Bank: Class: Tycm Chapter No. 01 Introduction To AWT
Dokument9 Seiten
Question Bank: Class: Tycm Chapter No. 01 Introduction To AWT
332 Prathamesh Sonawane
Noch keine Bewertungen
2G/3G/4G Personal GPS Tracker: MT90 Series
Dokument2 Seiten
2G/3G/4G Personal GPS Tracker: MT90 Series
danfred
Noch keine Bewertungen
Pielog
Dokument4 Seiten
Pielog
koghwin
Noch keine Bewertungen
Pciu Final Graph - Part - 1
Dokument72 Seiten
Pciu Final Graph - Part - 1
Md Sabbir Ahmed Ekhon
Noch keine Bewertungen
Simulation Examples in Spreadsheet
Dokument39 Seiten
Simulation Examples in Spreadsheet
Xuân Trường
Noch keine Bewertungen
Selenium Real Time Scenarios
Dokument41 Seiten
Selenium Real Time Scenarios
venunaini
83% (12)
Gate Level Minimization Lecture
Dokument39 Seiten
Gate Level Minimization Lecture
Dania
Noch keine Bewertungen
The Effect of Icon Spacing and Size On The Speed of Icon Processing in The Human Visual System
Dokument10 Seiten
The Effect of Icon Spacing and Size On The Speed of Icon Processing in The Human Visual System
Harver
Noch keine Bewertungen
Staple - 1
Dokument56 Seiten
Staple - 1
tomandjerry625
Noch keine Bewertungen
Chapter 3. The Fundamentals: Algorithms The Integers: Please Write Your Name
Dokument2 Seiten
Chapter 3. The Fundamentals: Algorithms The Integers: Please Write Your Name
Quang Nguyen
Noch keine Bewertungen
Cover Letter It Manager Examples
Dokument5 Seiten
Cover Letter It Manager Examples
e76jgwqc
100% (1)
Best VTU Student App
Dokument119 Seiten
Best VTU Student App
Lekhu Reddy
100% (3)
Tune Up Your Sound With Pulseeffects: Speakers - Fedora Magazine
Dokument10 Seiten
Tune Up Your Sound With Pulseeffects: Speakers - Fedora Magazine
gencinoza
Noch keine Bewertungen
SP Maths Basic 10
Dokument7 Seiten
SP Maths Basic 10
G Ashith
Noch keine Bewertungen
Cyberbullying Detection On Social Networks Using Machine Learning Approaches
Dokument7 Seiten
Cyberbullying Detection On Social Networks Using Machine Learning Approaches
Zobayer Ahmed
Noch keine Bewertungen
PacDrive C200 C200 A2 Controller Operating Manual
Dokument43 Seiten
PacDrive C200 C200 A2 Controller Operating Manual
Hadazah Joy Dela Cruz
100% (1)
Computer Tamil
Dokument19 Seiten
Computer Tamil
Kanda Velan
Noch keine Bewertungen
Finger scan ZKTeco K50 product details and specs
Dokument1 Seite
Finger scan ZKTeco K50 product details and specs
Laocyberspace MIT
Noch keine Bewertungen
OA-2000 Service Manual Optical Biometer
Dokument48 Seiten
OA-2000 Service Manual Optical Biometer
Abi
100% (2)
The Rise of Fog Computing in The Digital Era PDF
Dokument305 Seiten
The Rise of Fog Computing in The Digital Era PDF
nestorcerecer
Noch keine Bewertungen
Continue: Ae 9000 BM User Manual
Dokument1 Seite
Continue: Ae 9000 BM User Manual
kunal sanaf
Noch keine Bewertungen
TVL - CSS 12 - Q1 - M11
Dokument9 Seiten
TVL - CSS 12 - Q1 - M11
Henry Pescasio
Noch keine Bewertungen
CATIA V5 Foundation Course - Part Design Workbench
Dokument90 Seiten
CATIA V5 Foundation Course - Part Design Workbench
Raghavendra
Noch keine Bewertungen