Willkommen bei Scribd!

Karussell überspringen

Data Understanding and Visualization (Part-1) : Homework-2

Hochgeladen von

muhammad mubasher

0% fanden dieses Dokument nützlich (0 Abstimmungen)

12 Ansichten4 Seiten

here is a project of mine in uni

Originaltitel

project

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

here is a project of mine in uni

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

12 Ansichten4 Seiten

Data Understanding and Visualization (Part-1) : Homework-2

Hochgeladen von

muhammad mubasher

here is a project of mine in uni

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 4

Im Dokument suchen

Homework-2

1. Data Understanding and Visualization(Part-1)

Homework-2: First two pages contain assignment while page 3&4 contains helping material to solve
some problems. Use internet to read for more clarity.
Data Mining

2. Data Understanding and Visualization(Part-2)

Download the Wine (https://archive.ics.uci.edu/ml/datasets/wine) and Forest Fire datasets

(https://archive.ics.uci.edu/ml/datasets/forest+fires) from UCI Machine Learning Repository.
Read the datasets instructions and report the following:

a. The number of each type of attributes (continuous [interval, ratio], categorical [nominal,
ordinal]). Also identify which attribute(s) are input attribute(s) and which are class
attribute(s) (if any). For each type of attribute give a few example attributes and their
values.
b. Compute the five-number summary for the continuous attributes (you may create
boxplots for this). Compute the mode for categorical attributes.
c. Generate the quantile (percentile) plots for two key attributes in each dataset.
d. Generate the histogram or distribution plot for each of the two attributes selected in (c).
e. Generate the scatter plots for the two attributes selected in (c).
f. Compute and visualize the covariance and correlation matrices for the continuous
attributes.
g. Comment on the results regarding characteristics of this database.

2. Data Preprocessing
Download the Communities & Crime
(http://archive.ics.uci.edu/ml/datasets/communities+and+crime) dataset from UCI repository.
Study the dataset, and perform the following tasks:
a. Generate basic stats on missing values in the dataset (fraction of missing values for each
attribute, fraction of missing values for each object). You may report only the top 10
attributes and objects with high missing values.
b. Fill in the missing values in the data using an appropriate filter.
c. Standardize the dataset to zero mean and unit variance (z-score normalization).

Page 2
Data Mining

Attribute Transformation Comments

Level

Nominal Any permutation of values If all employee ID numbers

were reassigned, would it
make any difference?

Ordinal An order preserving change of An attribute encompassing

values, i.e., the notion of good, better
new_value = f(old_value) best can be represented
where f is a monotonic function. equally well by the values
{1, 2, 3} or by { 0.5, 1,
10}.
Interval new_value =a * old_value + b Thus, the Fahrenheit and
where a and b are constants Celsius temperature scales
differ in terms of where
their zero value is and the
size of a unit (degree).

Ratio new_value = a * old_value Length can be measured in

meters or feet.

Attribute Description Examples Operations

Type

Nominal The values of a nominal attribute are zip codes, employee mode, entropy,
just different names, i.e., nominal ID numbers, eye color, contingency
attributes provide only enough sex: {male, female} correlation, c 2 test
information to distinguish one object
from another. (=, ¹)

Ordinal The values of an ordinal attribute hardness of minerals, median, percentiles,

provide enough information to order {good, better, best}, rank correlation,
objects. (<, >) grades, street numbers run tests, sign tests

Interval For interval attributes, the calendar dates, mean, standard

differences between values are temperature in Celsius deviation, Pearson's
meaningful, i.e., a unit of or Fahrenheit correlation, t and F
measurement exists. tests
(+, - )

Ratio For ratio variables, both differences temperature in Kelvin, geometric mean,
and ratios are meaningful. (*, /) monetary quantities, harmonic mean,
counts, age, mass, percent variation
length, electrical
current

Page 3
Data Mining

Page 4

Das könnte Ihnen auch gefallen

Science: Modified Strategic Intervention Material
Dokument32 Seiten
Science: Modified Strategic Intervention Material
Mar Angelo Tangcangco
Noch keine Bewertungen
Modern Multidimensional Calculus
Von Everand
Modern Multidimensional Calculus
Marshall Evans Munroe
Noch keine Bewertungen
List of Least Learned Competencies With Interventions Conducted
Dokument2 Seiten
List of Least Learned Competencies With Interventions Conducted
Gerry Chel-Nunez Awa-Laurente Aga
100% (1)
Flare Tip Failure
Dokument4 Seiten
Flare Tip Failure
mohammadazrai
Noch keine Bewertungen
Reinforced Concrete Design of A 5 Storey Seminary Main Building
Dokument117 Seiten
Reinforced Concrete Design of A 5 Storey Seminary Main Building
jedsclement
100% (1)
K Nearest Neighbor Algorithm: Fundamentals and Applications
Von Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
Noch keine Bewertungen
UNU - Geothermal Well Testing
Dokument30 Seiten
UNU - Geothermal Well Testing
Zakariya
Noch keine Bewertungen
CFBC Design
Dokument28 Seiten
CFBC Design
Thanga Kalyana Sundaravel
100% (2)
DocumentsData Preprocessing
Dokument102 Seiten
DocumentsData Preprocessing
Roy Deep
Noch keine Bewertungen
Lecture 3-Know Your Data - M
Dokument19 Seiten
Lecture 3-Know Your Data - M
Khizar Shahid
Noch keine Bewertungen
DWDM Unit6-Data Similarity Measures
Dokument40 Seiten
DWDM Unit6-Data Similarity Measures
mounika
Noch keine Bewertungen
Pokok Bahasan 02-1 Data
Dokument70 Seiten
Pokok Bahasan 02-1 Data
Satria Arif
Noch keine Bewertungen
Data
Dokument84 Seiten
Data
20je0426HritikGupta
Noch keine Bewertungen
Lect 2 DM Converted 1
Dokument29 Seiten
Lect 2 DM Converted 1
Manahil Noor
Noch keine Bewertungen
CH 2
Dokument96 Seiten
CH 2
楊喻妃
Noch keine Bewertungen
Data Warehousing and Mining: Dr. Hossen Asiful Mustafa
Dokument49 Seiten
Data Warehousing and Mining: Dr. Hossen Asiful Mustafa
Sheikh Abujar
Noch keine Bewertungen
Knowing Your Data
Dokument43 Seiten
Knowing Your Data
Yogesh Pandey
Noch keine Bewertungen
DWM Merged
Dokument388 Seiten
DWM Merged
amulya
Noch keine Bewertungen
Data Mining Notes C2
Dokument12 Seiten
Data Mining Notes C2
wuziqi
Noch keine Bewertungen
CL 2
Dokument85 Seiten
CL 2
Rajiv Ranjan Sah
Noch keine Bewertungen
Lecture 10
Dokument44 Seiten
Lecture 10
QUANG ANH B18DCCN034 PHẠM
Noch keine Bewertungen
Penggalian Data & Analitika Bisnis: Faculties Teknologi Informasi - ITS
Dokument69 Seiten
Penggalian Data & Analitika Bisnis: Faculties Teknologi Informasi - ITS
Galih Khairulfalah
Noch keine Bewertungen
Lecture Notes For Chapter 2 Introduction To Data Mining: by Tan, Steinbach, Kumar
Dokument66 Seiten
Lecture Notes For Chapter 2 Introduction To Data Mining: by Tan, Steinbach, Kumar
Abu Kafsha
100% (1)
Part Two PDF
Dokument39 Seiten
Part Two PDF
Nashowan
Noch keine Bewertungen
Sess02 Data
Dokument96 Seiten
Sess02 Data
Kriti Sinha
Noch keine Bewertungen
Data Preprocessing and Exploring
Dokument9 Seiten
Data Preprocessing and Exploring
Neeru Redhu
Noch keine Bewertungen
Lecture Notes For Chapter 2 Introduction To Data Mining, 2 Edition
Dokument87 Seiten
Lecture Notes For Chapter 2 Introduction To Data Mining, 2 Edition
عبد الحافظ عبد الحافظ
Noch keine Bewertungen
Lecture Notes For Chapter 2: by Tan, Steinbach, Kumar
Dokument25 Seiten
Lecture Notes For Chapter 2: by Tan, Steinbach, Kumar
yoniazhar
Noch keine Bewertungen
DM - P4 - Data Dan Preprocessing Data
Dokument45 Seiten
DM - P4 - Data Dan Preprocessing Data
Acip Suracip
Noch keine Bewertungen
Lecture Notes For Chapter 2 Introduction To Data Mining: by Tan, Steinbach, Kumar
Dokument70 Seiten
Lecture Notes For Chapter 2 Introduction To Data Mining: by Tan, Steinbach, Kumar
Prateek Gupta
Noch keine Bewertungen
Data Mining Chapter 2 Notes
Dokument87 Seiten
Data Mining Chapter 2 Notes
Md Mahfoozur Rahman
Noch keine Bewertungen
Lecture Notes For Chapter 2 Introduction To Data Mining
Dokument34 Seiten
Lecture Notes For Chapter 2 Introduction To Data Mining
raad
Noch keine Bewertungen
Lecture Notes For Chapter 2 Introduction To Data Mining, 2 Edition
Dokument96 Seiten
Lecture Notes For Chapter 2 Introduction To Data Mining, 2 Edition
sumahals
Noch keine Bewertungen
Wk. 3. Data (12-05-2021)
Dokument57 Seiten
Wk. 3. Data (12-05-2021)
Nusrat Badhon
Noch keine Bewertungen
ML 1,2 Unit Peter Flach Machine Learning. The Art and Scienc
Dokument22 Seiten
ML 1,2 Unit Peter Flach Machine Learning. The Art and Scienc
kanchan khade
Noch keine Bewertungen
Getting To Know Your Data: - Chapter 2
Dokument63 Seiten
Getting To Know Your Data: - Chapter 2
Moneeb Abbas
Noch keine Bewertungen
01 Data
Dokument100 Seiten
01 Data
20bme094
Noch keine Bewertungen
DMDW 2
Dokument68 Seiten
DMDW 2
Anu agarwal
Noch keine Bewertungen
Week 5 - Data Mining Exploring Data With R
Dokument146 Seiten
Week 5 - Data Mining Exploring Data With R
Yna Foronda
Noch keine Bewertungen
Unit 2 - Data Preprocessing
Dokument23 Seiten
Unit 2 - Data Preprocessing
evanjames038
Noch keine Bewertungen
Data Preprocess
Dokument82 Seiten
Data Preprocess
Ra Abhishek
Noch keine Bewertungen
Data Preprocessing II
Dokument21 Seiten
Data Preprocessing II
Dhruvi Thakrar
Noch keine Bewertungen
Java - Introduction To Programming: 1. Variables
Dokument3 Seiten
Java - Introduction To Programming: 1. Variables
Abhinav Ashish
Noch keine Bewertungen
Java Lecture 2
Dokument3 Seiten
Java Lecture 2
SHiVaM KR
Noch keine Bewertungen
Java 2 Homework For Ne
Dokument3 Seiten
Java 2 Homework For Ne
dad dunno
Noch keine Bewertungen
Machine Learning Machine Learning Data
Dokument43 Seiten
Machine Learning Machine Learning Data
Wang Chen Yu
Noch keine Bewertungen
Novotech Brochure
Dokument8 Seiten
Novotech Brochure
hahaer
Noch keine Bewertungen
II. Machine Learning Basics
Dokument27 Seiten
II. Machine Learning Basics
Shantam
Noch keine Bewertungen
Data Preprocessing - UG - 2019 (Compatibility Mode)
Dokument43 Seiten
Data Preprocessing - UG - 2019 (Compatibility Mode)
Prakrit Uprety
Noch keine Bewertungen
2.1 Data Types and Attributes: Attribute
Dokument23 Seiten
2.1 Data Types and Attributes: Attribute
Anand Kumar Bhagat
Noch keine Bewertungen
CH 01
Dokument11 Seiten
CH 01
ohmumu140
Noch keine Bewertungen
Data Mining: Data
Dokument50 Seiten
Data Mining: Data
Abdul Aowal
Noch keine Bewertungen
Quantitative Validation of Mathematical Models: Kevin Dowding
Dokument14 Seiten
Quantitative Validation of Mathematical Models: Kevin Dowding
Supriya Diwan
Noch keine Bewertungen
Java Lecture 2
Dokument3 Seiten
Java Lecture 2
Muhammad Ahmad
Noch keine Bewertungen
21-22 8th Grade Pacing (EnVision)
Dokument4 Seiten
21-22 8th Grade Pacing (EnVision)
Greg Walker
Noch keine Bewertungen
Use of Statistics in Our Daily Life: Example 1 Data Types (P 54)
Dokument8 Seiten
Use of Statistics in Our Daily Life: Example 1 Data Types (P 54)
Kelly
Noch keine Bewertungen
L2-4 - Data
Dokument83 Seiten
L2-4 - Data
Veena Tella
Noch keine Bewertungen
Quantitative Approach
Dokument54 Seiten
Quantitative Approach
Muhamad Ridwan Fauzi
Noch keine Bewertungen
Curve fitting-I-II
Dokument12 Seiten
Curve fitting-I-II
Rajan Singh
Noch keine Bewertungen
CC 101 - Basics in C++
Dokument3 Seiten
CC 101 - Basics in C++
Sheena Villanueva
Noch keine Bewertungen
Session-5.1-Measuring Data Similarity and Dissimilarity - Part-2
Dokument16 Seiten
Session-5.1-Measuring Data Similarity and Dissimilarity - Part-2
minni
Noch keine Bewertungen
Bergman1976 PDF
Dokument9 Seiten
Bergman1976 PDF
juan
Noch keine Bewertungen
A Comparative Study On The Consistency of Features in On Line Signature Verification
Dokument11 Seiten
A Comparative Study On The Consistency of Features in On Line Signature Verification
calimelo
Noch keine Bewertungen
Attributes Types and Datasets PDF
Dokument24 Seiten
Attributes Types and Datasets PDF
User name
Noch keine Bewertungen
Concepts and Techniques: - Chapter 2
Dokument31 Seiten
Concepts and Techniques: - Chapter 2
Esraa Samir
Noch keine Bewertungen
DWDM Chapter2
Dokument53 Seiten
DWDM Chapter2
Pranav A.R
Noch keine Bewertungen
Arid Agriculture University, Rawalpindi: Mid Exam / Spring 2021 (Paper Duration 12 Hours) To Be Filled by Teacher
Dokument8 Seiten
Arid Agriculture University, Rawalpindi: Mid Exam / Spring 2021 (Paper Duration 12 Hours) To Be Filled by Teacher
muhammad mubasher
Noch keine Bewertungen
CC
Dokument5 Seiten
CC
muhammad mubasher
Noch keine Bewertungen
Application To PEEF.: Subject: Acknowledgement Sheet To Continue Scholarship Installment
Dokument1 Seite
Application To PEEF.: Subject: Acknowledgement Sheet To Continue Scholarship Installment
muhammad mubasher
Noch keine Bewertungen
Cellular Metabolism - Answer-Booklet
Dokument17 Seiten
Cellular Metabolism - Answer-Booklet
muhammad mubasher
Noch keine Bewertungen
DBT1
Dokument3 Seiten
DBT1
muhammad mubasher
Noch keine Bewertungen
Important
Dokument1 Seite
Important
muhammad mubasher
Noch keine Bewertungen
1) What Is The Difference Between Dialect' and Accent"'? What Role Do Dialects of A Answer
Dokument17 Seiten
1) What Is The Difference Between Dialect' and Accent"'? What Role Do Dialects of A Answer
muhammad mubasher
Noch keine Bewertungen
Assignment 3 Software Project Management
Dokument3 Seiten
Assignment 3 Software Project Management
muhammad mubasher
100% (1)
Oop Java Codes Summary
Dokument20 Seiten
Oop Java Codes Summary
Sahil Khan
Noch keine Bewertungen
Name: Ayesha Siddique ID: F2016231023 Subject: Applications of
Dokument4 Seiten
Name: Ayesha Siddique ID: F2016231023 Subject: Applications of
muhammad mubasher
Noch keine Bewertungen
Introduction &: Operating Systems
Dokument36 Seiten
Introduction &: Operating Systems
junaid
Noch keine Bewertungen
Yes, No, Maybe... : Boolean Algebra
Dokument23 Seiten
Yes, No, Maybe... : Boolean Algebra
Aulia Ullah
Noch keine Bewertungen
HTTPSWWW - Mathsgenie.co - Ukresources4 Plans and Elevations PDF
Dokument8 Seiten
HTTPSWWW - Mathsgenie.co - Ukresources4 Plans and Elevations PDF
ruth.ameyxx
Noch keine Bewertungen
Department of Environmental Sciences
Dokument19 Seiten
Department of Environmental Sciences
Rezaul Karim
Noch keine Bewertungen
D R 800 Dust Concentration Meter: Before Starting Any Work, Read The Operating Instructions (The Manual) !
Dokument154 Seiten
D R 800 Dust Concentration Meter: Before Starting Any Work, Read The Operating Instructions (The Manual) !
Phạm Thanh Sơn
Noch keine Bewertungen
Course Structure B.tech.2012-13
Dokument4 Seiten
Course Structure B.tech.2012-13
fortunatesanjib
Noch keine Bewertungen
Unit 1 - Homework Assignment 2: The Hydrogen Atom
Dokument2 Seiten
Unit 1 - Homework Assignment 2: The Hydrogen Atom
周子暄
Noch keine Bewertungen
Fmath p2 j99
Dokument6 Seiten
Fmath p2 j99
Sean
Noch keine Bewertungen
Transmission Syn FE 75W-90 A 0410
Dokument1 Seite
Transmission Syn FE 75W-90 A 0410
Fer Emil
Noch keine Bewertungen
Comparative Study of Performance of CDS, CdSe
Dokument7 Seiten
Comparative Study of Performance of CDS, CdSe
Ali Ahmed
Noch keine Bewertungen
Elements of Feedback Control Systems
Dokument53 Seiten
Elements of Feedback Control Systems
chanon
Noch keine Bewertungen
Hw2 Machining Solutions 2016
Dokument9 Seiten
Hw2 Machining Solutions 2016
BARNABAS DOGO
Noch keine Bewertungen
Dell 1815dn Service Manual PDF
Dokument150 Seiten
Dell 1815dn Service Manual PDF
Hugo Manuel Sánchez Martínez
Noch keine Bewertungen
Department of Mathematics I.I.T Madras MA1101: Functions of Several Variables Assignment-I (A) (July-Nov, 2017)
Dokument2 Seiten
Department of Mathematics I.I.T Madras MA1101: Functions of Several Variables Assignment-I (A) (July-Nov, 2017)
Rahul
Noch keine Bewertungen
Maxima and Minima
Dokument4 Seiten
Maxima and Minima
Anudeex Shetty
Noch keine Bewertungen
Evaluating Risks of Construction-Induced Building Damage For Large Underground Construction Projects
Dokument28 Seiten
Evaluating Risks of Construction-Induced Building Damage For Large Underground Construction Projects
Giuseppe Squillacioti
Noch keine Bewertungen
Ahi Evran Sunum en
Dokument26 Seiten
Ahi Evran Sunum en
denizakbay
Noch keine Bewertungen
A New Fatigue Damage Accumulation Rating Life Model of Ball Bearings Under Vibration Load
Dokument11 Seiten
A New Fatigue Damage Accumulation Rating Life Model of Ball Bearings Under Vibration Load
Alberto
Noch keine Bewertungen
Range Gate Generator For FMCW Doppler Raradr PDF
Dokument5 Seiten
Range Gate Generator For FMCW Doppler Raradr PDF
Srinivas Cheruku
Noch keine Bewertungen
QMOTheory
Dokument16 Seiten
QMOTheory
ShubhamNandi
Noch keine Bewertungen
31 M.E Ed R2010
Dokument61 Seiten
31 M.E Ed R2010
Jason Johnson
Noch keine Bewertungen
Herschel 400 2 Log Book
Dokument29 Seiten
Herschel 400 2 Log Book
Everaldo Faustino
Noch keine Bewertungen
Task 3 Ronald Garzon
Dokument23 Seiten
Task 3 Ronald Garzon
Ronal Enrique Garzon Sanchez
Noch keine Bewertungen
Test 2 Semester 2, 2022
Dokument3 Seiten
Test 2 Semester 2, 2022
Kalana Gamage
Noch keine Bewertungen
ANSA v17.0.0 Release Notes
Dokument63 Seiten
ANSA v17.0.0 Release Notes
Vishnu Raghavan
Noch keine Bewertungen