Willkommen bei Scribd!

Mining Class Comparisons

Hochgeladen von

100% fanden dieses Dokument nützlich (1 Abstimmung)

2K Ansichten4 Seiten

V Method: - Partition the set of relevant data into the target class and the contrasting class(es) v Present for every tuple its description and two measures: u support - distribution within single class u comparison - distribution between classes. V Relevance Analysis: - Find attributes (features) which best distinguish different classes.

Originalbeschreibung:

Copyright

Verfügbare Formate

DOC, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

100% fanden dieses Dokument nützlich (1 Abstimmung)

2K Ansichten4 Seiten

Mining Class Comparisons

Hochgeladen von

murali_20c

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 4

Im Dokument suchen

Mining Class Comparisons

v Comparison: Comparing two or more classes.

v Method:
– Partition the set of relevant data into the target class and the contrasting
class(es)
– Generalize both classes to the same high level concepts
– Compare tuples with the same high level descriptions
– Present for every tuple its description and two measures:
u support - distribution within single class
u comparison - distribution between classes
– Highlight the tuples with strong discriminant features
v Relevance Analysis:
– Find attributes (features) which best distinguish different classes.
Example: Analytical comparison
v Task
– Compare graduate and undergraduate students using discriminant rule.
– DMQL query

use Big_University_DB
mine comparison as “grad_vs_undergrad_students”
in relevance to name, gender, major, birth_place, birth_date, residence, phone#, gpa
for “graduate_students”
where status in “graduate”
versus “undergraduate_students”
where status in “undergraduate”
analyze count%
from student

v 1. Data collection
– target and contrasting classes

v 2. Attribute relevance analysis

– remove attributes name, gender, major, phone#

v 3. Synchronous generalization
– controlled by user-specified dimension thresholds
– prime target and contrasting class(es) relations/cuboids
v 4. Drill down, roll up and other OLAP operations on target and contrasting classes
to adjust levels of abstractions of resulting description

v 5. Presentation
– as generalized relations, crosstabs, bar charts, pie charts, or rules
– contrasting measures to reflect comparison between target and contrasting
classes
u e.g. count%
Example: Analytical
comparison (4)
Birth_country Age_range
Canada 20-25
Canada 25-30
Prime generalized relation for the target class: Graduate students

Birth_country
Canada Age_range
Over_30
…Canada 15-20
…
Canada
Other 15-20
Over_30
Prime generalized relation for the contrasting class: Undergraduate students

discriminant

Status …Birth_country Age_range … Count

Gpa
Graduate
Canada 25-30
Canada
Undergraduate Canada
25-30
25-30
Good 90
Good 210

… …
Other Over_30
Measuring the Central
Tendency
1 n
x= ∑ xi
n i =1 n

∑w x i i
x= i =1
n

∑w
Mean
i
i =1

Weighted arithmetic mean

Median: A holistic measure
Middle value if odd number of values, or average of
n / 2 − (∑ f )l
the middle two values otherwise
median = L + (
f
1 )c
median

estimated by interpolation
Mode
Value that occurs most frequently in the data
Unimodal, bimodal, trimodal
Empirical formula:

mean − mode = 3 × (mean − median)

Measuring the Dispersion of
Data

Quartiles, outliers and boxplots

Quartiles: Q1 (25th percentile), Q3 (75th percentile)
Inter-quartile range: IQR = Q3 – Q1
Five number summary: min, Q1, M, Q3, max
Boxplot: ends of the box are the quartiles, median is
marked, whiskers, and plot outlier individually
Outlier: usually, a value higher/lower than 1.5 x IQR
Variance and standard deviation
Variance s2: (algebraic, scalable computation)
1 n 1 n 2 1 n
s2 = ∑ ( xi − x ) 2 = [∑ xi − (∑ xi ) 2 ]
Standard deviation s is the square root of variance s2
n − 1 i =1 n − 1 i =1 n i =1

Das könnte Ihnen auch gefallen

Proctorial Report
Dokument57 Seiten
Proctorial Report
gopalankush
100% (3)
Chapter 5 Concept Description Characterization and Comparison 395
Dokument64 Seiten
Chapter 5 Concept Description Characterization and Comparison 395
Sailaja Naidu
Noch keine Bewertungen
Machine Learning Approach For Diabetes Prediction
Dokument7 Seiten
Machine Learning Approach For Diabetes Prediction
IJRASETPublications
Noch keine Bewertungen
A Data Mining Approach To Construct Graduates Employability Model in Malaysia
Dokument13 Seiten
A Data Mining Approach To Construct Graduates Employability Model in Malaysia
International Journal of New Computer Architectures and their Applications (IJNCAA)
Noch keine Bewertungen
Be It 2019 Lp-Vi (BCT)
Dokument47 Seiten
Be It 2019 Lp-Vi (BCT)
Aarti Rathi
Noch keine Bewertungen
JSPM'S Bhivarabai Sawant Institute of Technology & Research: Mini Project Report On
Dokument33 Seiten
JSPM'S Bhivarabai Sawant Institute of Technology & Research: Mini Project Report On
kirti reddy
Noch keine Bewertungen
The Database Life Cycle
Dokument3 Seiten
The Database Life Cycle
Petros Gavai
Noch keine Bewertungen
Unit 7
Dokument46 Seiten
Unit 7
zoya fathima
Noch keine Bewertungen
UNIT - II Part 1 LC& LP
Dokument39 Seiten
UNIT - II Part 1 LC& LP
Girish
Noch keine Bewertungen
Online Blood Bank Management
Dokument10 Seiten
Online Blood Bank Management
Divya
100% (1)
College Voting System Full
Dokument34 Seiten
College Voting System Full
Jaid Mulla UT
Noch keine Bewertungen
Bigdata PPT Slides (E)
Dokument10 Seiten
Bigdata PPT Slides (E)
sai project
Noch keine Bewertungen
MCA I Year Syllabus
Dokument55 Seiten
MCA I Year Syllabus
Krishna Chandra Sekhar Reddy
Noch keine Bewertungen
DL System Architecture for Skin Cancer Detection
Dokument5 Seiten
DL System Architecture for Skin Cancer Detection
Melrown Barretto
100% (1)
TCS NQT (Reasoning Ability) Memory Based 2020
Dokument11 Seiten
TCS NQT (Reasoning Ability) Memory Based 2020
sreenu
Noch keine Bewertungen
Application of Anova in Medical Research
Dokument6 Seiten
Application of Anova in Medical Research
fatinkiflee
Noch keine Bewertungen
Chapter 6 Basic Input and Output Interface
Dokument38 Seiten
Chapter 6 Basic Input and Output Interface
Petra Kalasa
100% (1)
DBMS Module-1 PPT Updated
Dokument100 Seiten
DBMS Module-1 PPT Updated
Harsshitha
Noch keine Bewertungen
Complaint Management System PR
Dokument39 Seiten
Complaint Management System PR
Andrew Patrick
Noch keine Bewertungen
Ums Software Requirement Specification Srs
Dokument20 Seiten
Ums Software Requirement Specification Srs
DeeP Navi
Noch keine Bewertungen
Suresh Gyan Vihar University: Assignment Response Sheet
Dokument16 Seiten
Suresh Gyan Vihar University: Assignment Response Sheet
Sonu Singh
100% (1)
CS504MCQs - Final - Bydr - TariqHanif PDF
Dokument21 Seiten
CS504MCQs - Final - Bydr - TariqHanif PDF
Amjad Ali
0% (1)
Quize 1 There Are Several Different Deployments of Qlik Sense
Dokument19 Seiten
Quize 1 There Are Several Different Deployments of Qlik Sense
Francisco Santizo
Noch keine Bewertungen
Project Synopsis On Breast Cancer Detection Using Data Mining
Dokument3 Seiten
Project Synopsis On Breast Cancer Detection Using Data Mining
rishabh kumar
Noch keine Bewertungen
Mca 2020-2022 Syalbus
Dokument64 Seiten
Mca 2020-2022 Syalbus
dinesh
Noch keine Bewertungen
6QPG2 Cse CS8651 QB3
Dokument2 Seiten
6QPG2 Cse CS8651 QB3
VIJAY VIDHYA SAGAR S
Noch keine Bewertungen
Simple and Complex Query
Dokument6 Seiten
Simple and Complex Query
Saibullah Khan
Noch keine Bewertungen
Credit Management Trascation System
Dokument37 Seiten
Credit Management Trascation System
Nishaan Nishaan
Noch keine Bewertungen
Stqa Unit 3 Notes
Dokument22 Seiten
Stqa Unit 3 Notes
chandan kumar giri
Noch keine Bewertungen
A Minor Project Report ON "CONNECT-4": Dibrugarh University
Dokument26 Seiten
A Minor Project Report ON "CONNECT-4": Dibrugarh University
Sandeep Kamalapuri
Noch keine Bewertungen
116222942-Data Mining-On-Forest-Cover-Prediction
Dokument21 Seiten
116222942-Data Mining-On-Forest-Cover-Prediction
ankit rathi
Noch keine Bewertungen
10 Total Mark: 10 X 1 10: NPTEL Online Certification Courses Indian Institute of Technology Kharagpur
Dokument7 Seiten
10 Total Mark: 10 X 1 10: NPTEL Online Certification Courses Indian Institute of Technology Kharagpur
vit
Noch keine Bewertungen
Multimodal Medical Image Fusion Based On Sugeno's Intuitionistic Fuzzy Sets
Dokument8 Seiten
Multimodal Medical Image Fusion Based On Sugeno's Intuitionistic Fuzzy Sets
tirupal
Noch keine Bewertungen
LJIET-ERD
Dokument14 Seiten
LJIET-ERD
BHAVESH
Noch keine Bewertungen
WEKA Machine Learning Tool Overview
Dokument81 Seiten
WEKA Machine Learning Tool Overview
whaleed
Noch keine Bewertungen
Mini Project Guideline
Dokument2 Seiten
Mini Project Guideline
Kavin Cavin
Noch keine Bewertungen
A Movie Recommender System: MOVREC: Manoj Kumar D.K. Yadav Ankur Singh Vijay Kr. Gupta
Dokument5 Seiten
A Movie Recommender System: MOVREC: Manoj Kumar D.K. Yadav Ankur Singh Vijay Kr. Gupta
Deepak Jain
Noch keine Bewertungen
K - Nearest Neighbor
Dokument2 Seiten
K - Nearest Neighbor
Anshika Tyagi
Noch keine Bewertungen
Project Proposal About Blood Donation Management System
Dokument32 Seiten
Project Proposal About Blood Donation Management System
Mwenda Dennis
Noch keine Bewertungen
FINAL AnswerBank Data Science Sem VI PDF
Dokument90 Seiten
FINAL AnswerBank Data Science Sem VI PDF
Vishal Chauhan
Noch keine Bewertungen
Data Warehousing: Online Analytical Processing (OLAP)
Dokument44 Seiten
Data Warehousing: Online Analytical Processing (OLAP)
sana faiz
Noch keine Bewertungen
Project Report On Image Segmentation
Dokument6 Seiten
Project Report On Image Segmentation
SAURABH RAJ
Noch keine Bewertungen
DBMS Module 1
Dokument56 Seiten
DBMS Module 1
Vaidehi Verma
Noch keine Bewertungen
Nptel
Dokument3 Seiten
Nptel
Amarjit
Noch keine Bewertungen
Fourth Semester: CS4B07: Fundamentals of Database Manage-Ment Systems
Dokument2 Seiten
Fourth Semester: CS4B07: Fundamentals of Database Manage-Ment Systems
harisummath5195
Noch keine Bewertungen
Solution To Assi1
Dokument8 Seiten
Solution To Assi1
Yogesh Gandhi
Noch keine Bewertungen
Jagadish
Dokument13 Seiten
Jagadish
MARAM JAGADESWARA REDDY 322010408026
Noch keine Bewertungen
Introduction and Basic of Software Modelling
Dokument19 Seiten
Introduction and Basic of Software Modelling
trupti
Noch keine Bewertungen
Multiple Choice Questions
Dokument56 Seiten
Multiple Choice Questions
ashish kumar
Noch keine Bewertungen
MSAMB Web App Automates Maharashtra Agri Markets
Dokument6 Seiten
MSAMB Web App Automates Maharashtra Agri Markets
Anuja J Patil
Noch keine Bewertungen
Software Quality Assurance Plan (SQA Plan
Dokument18 Seiten
Software Quality Assurance Plan (SQA Plan
pavithrasubburaj
Noch keine Bewertungen
CS Project File Shubham Lagwal
Dokument15 Seiten
CS Project File Shubham Lagwal
Dhruv Jain
100% (1)
Predictive Machine Learning Applying Cross Industry Standard Process For Data Mining For The Diagnosis of Diabetes Mellitus Type 2
Dokument14 Seiten
Predictive Machine Learning Applying Cross Industry Standard Process For Data Mining For The Diagnosis of Diabetes Mellitus Type 2
IAES IJAI
Noch keine Bewertungen
Industrial Internship Final Report
Dokument44 Seiten
Industrial Internship Final Report
Eshwar
Noch keine Bewertungen
Sentiment Analysis of Restaurant Customer
Dokument6 Seiten
Sentiment Analysis of Restaurant Customer
AC Cahulogan
Noch keine Bewertungen
Diabetes Prediction Using Data Mining
Dokument17 Seiten
Diabetes Prediction Using Data Mining
Fariha Tabassum
Noch keine Bewertungen
Simon-Game: Integrated Project Report
Dokument13 Seiten
Simon-Game: Integrated Project Report
Bhumika Sharma2626
100% (1)
TQM Tools and Techniques
Dokument39 Seiten
TQM Tools and Techniques
Tharun Kumar U
100% (1)
Project Report On Data Analytics
Dokument44 Seiten
Project Report On Data Analytics
dhruvraii811
Noch keine Bewertungen
COMPARING MINING CLASS DESCRIPTIONS AND STATISTICAL MEASURES
Dokument24 Seiten
COMPARING MINING CLASS DESCRIPTIONS AND STATISTICAL MEASURES
Yogesh Bansal
Noch keine Bewertungen
Ite 001a
Dokument6 Seiten
Ite 001a
joshua
Noch keine Bewertungen
Eurox Cross Flow Scrubber
Dokument8 Seiten
Eurox Cross Flow Scrubber
Robin Layog
Noch keine Bewertungen
7.qad-Dpr-11 Imte
Dokument4 Seiten
7.qad-Dpr-11 Imte
Dhinakaran
Noch keine Bewertungen
Waukesha Engine, Dresser, Inc. - Express Limited Warranty Covering Products Used in Continuous Duty Applications
Dokument6 Seiten
Waukesha Engine, Dresser, Inc. - Express Limited Warranty Covering Products Used in Continuous Duty Applications
LUISA FERNANDA TORRES MANOSALVA
Noch keine Bewertungen
IEC Certificate 1000V Single Glass 202304
Dokument35 Seiten
IEC Certificate 1000V Single Glass 202304
Marian Prozorianu
Noch keine Bewertungen
L04-L05 Parts 13-25-550 v05 42021
Dokument84 Seiten
L04-L05 Parts 13-25-550 v05 42021
Brandi Hill
Noch keine Bewertungen
Builder's Greywater Guide Branched Drain
Dokument4 Seiten
Builder's Greywater Guide Branched Drain
Green Action Sustainable Technology Group
Noch keine Bewertungen
DC Motor Direction Control Report
Dokument6 Seiten
DC Motor Direction Control Report
Engr Farhanullah Sarki
Noch keine Bewertungen
KSB Megaflow V: Pumps For Sewage, Effuents and Mistures
Dokument18 Seiten
KSB Megaflow V: Pumps For Sewage, Effuents and Mistures
Kornelius
Noch keine Bewertungen
Newsletter Template New
Dokument4 Seiten
Newsletter Template New
api-458544253
Noch keine Bewertungen
A1.2.3 Method Statement 4a Redacted Version2
Dokument98 Seiten
A1.2.3 Method Statement 4a Redacted Version2
Chanel
Noch keine Bewertungen
Template Icme 13 Poster
Dokument1 Seite
Template Icme 13 Poster
Zulma Xiomara Rueda Garcia
Noch keine Bewertungen
I) Centrifuges
Dokument46 Seiten
I) Centrifuges
iahim87
Noch keine Bewertungen
DML Sro Karnal RMS
Dokument5 Seiten
DML Sro Karnal RMS
Er Rohit Mehra
Noch keine Bewertungen
Powerful Cooling and Easy Installation For Really Large Spaces
Dokument4 Seiten
Powerful Cooling and Easy Installation For Really Large Spaces
alkaf08
Noch keine Bewertungen
DSSSB 01 2017
Dokument9 Seiten
DSSSB 01 2017
Praneeta Katdare
Noch keine Bewertungen
RDSO - Specification No.M&C NDT 125 2004 Rev I
Dokument6 Seiten
RDSO - Specification No.M&C NDT 125 2004 Rev I
Niking Thomsan
Noch keine Bewertungen
Detector of FM Signal
Dokument4 Seiten
Detector of FM Signal
R. JaNNaH
100% (1)
Damage To Stern Tube Bearing and Seals
Dokument4 Seiten
Damage To Stern Tube Bearing and Seals
João Henrique Volpini Mattos
Noch keine Bewertungen
Touch Panel Debug Info Register Values
Dokument17 Seiten
Touch Panel Debug Info Register Values
Alghazy
Noch keine Bewertungen
BQ Mechanical (Sirim)
Dokument7 Seiten
BQ Mechanical (Sirim)
mohd farhan ariff zaiton
Noch keine Bewertungen
Brake Pedals and Valve
Dokument4 Seiten
Brake Pedals and Valve
ala17
Noch keine Bewertungen
Answers About HubSpot
Dokument1 Seite
Answers About HubSpot
Prasetya
Noch keine Bewertungen
OceanPixel Abundo Marine Renewable Energy An Emerging Option
Dokument96 Seiten
OceanPixel Abundo Marine Renewable Energy An Emerging Option
jopaypagas
Noch keine Bewertungen
Ahmad Humayun Sohail
Dokument6 Seiten
Ahmad Humayun Sohail
Humayun Sohail
Noch keine Bewertungen
Astral Column Pipe Pricelist
Dokument4 Seiten
Astral Column Pipe Pricelist
Vaisham
Noch keine Bewertungen
Strategic Information Systems Planning: Course Overview
Dokument18 Seiten
Strategic Information Systems Planning: Course Overview
Emmy W. Rosyidi
Noch keine Bewertungen
Budget Estimates
Dokument251 Seiten
Budget Estimates
MUHAMMAD QASIM RAJPAR
Noch keine Bewertungen
Write Like An Academic: Designing An Online Advanced Writing Course For Postgraduate Students and Researchers
Dokument9 Seiten
Write Like An Academic: Designing An Online Advanced Writing Course For Postgraduate Students and Researchers
Lexi Tronics
Noch keine Bewertungen
Design of A 120 In.-Diameter Steel Bifurcation With A Small Acute Angle For A High-Pressure Penstock
Dokument10 Seiten
Design of A 120 In.-Diameter Steel Bifurcation With A Small Acute Angle For A High-Pressure Penstock
StalynMEc
Noch keine Bewertungen