Willkommen bei Scribd!

Assignment 1 3

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

172 Ansichten4 Seiten

This document is an assignment for a course on knowledge discovery and data mining. It contains 4 questions covering topics like decision tree induction, rule-based classification, naive Bayes classification, and Bayesian networks. The assignment is worth 100 points and is due on October 4th, 2013. Late submissions will be penalized.

Originalbeschreibung:

cs5228

Copyright

Verfügbare Formate

PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

172 Ansichten4 Seiten

Assignment 1 3

Hochgeladen von

violentv

Copyright:

Verfügbare Formate

Als PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 4

Im Dokument suchen

CS5228: Knowledge Discovery and Data Mining

(2013-14, Semester I)
Assignment 1 (100 points)
1 Notes and Requirements
This assignment contributes 15% to the nal course grade.
Submission options: 1) to hand in hard copies, or 2) to submit soft copies via
IVLE (submission folder: Student Submission/Assignment 1).
Due time and date: Oct. 4, 2013. If you prefer to hand in your assignments,
please hand in them before or right after the class on Oct. 4, 2013. If you prefer
to submit your assignments via ILVE, please upload them to the folder Student
Submission/Assignment 1 before 11:59pm on Oct. 4, 2013.
Note: Late submission of an assignment would result in a reduced grade for
the assignment, unless an extension has been granted by the instructor. A late
submission receives an additional 20% penalty for every 24 hours delay.
2 Question Sets
Question 1: (15 points) Consider the data set shown in Table 1 for a binary classi-
cation problem.
1. Calculate the information gain when splitting on Aand B. Which attribute would
the decision tree induction algorithm choose? (5 points)
2. Calculate the gain in the Gini index when splitting on A and B. Which attribute
would the decision tree induction algorithm choose? (5 points)
3. Figure 1 (on the 48
th
page of the lecture notes L3:Classication I) shows
that entropy and the Gini index are both monotonically increasing on the range
[0, 0.5] and they are both monotonically decreasing on the range [0.5, 1]. Is it
possible that information gain and the gain in the Gin index favor different at-
tributes? Explain. (5 points)
1
Table 1: Data set for Question 1.
A B Class Label
T F +
T T +
T T +
T F -
T T +
F F -
F F -
F F -
T T -
T F -
Figure 1: For a binary class problem.
Question 2: (20 points) Consider a binary classication problem with the following
set of attributes and attribute values:
Air Conditioner = {Working, Broken}
Engine = {Good, Bad}
Mileage = {High, Medium, Low}
Rust = {Yes, No}
Suppose a rule-based classier produces the following rule set:
1. Are the rules mutually exclusive? (5 points)
2
Mileage = High Value = Low
Mileage = Low Value = High
Air Conditioner = Working Engine = Good Value = High
Air Conditioner = Working Engine = Bad Value = Low
Air Conditioner = Broken Value = Low
2. Is the rule set exhaustive? (5 points)
3. Is ordering needed for this set of rules? (5 points)
4. Do you need a default class for the rule set? (5 points)
Question 3: (35 points) Consider the data set shown in Table 2
Table 2: Data set for Question 3.
Record A B C Class
1 0 0 0 +
2 0 0 1 -
3 0 1 1 -
4 0 1 1 -
5 0 0 1 +
6 1 0 1 +
7 1 0 1 -
8 1 0 1 -
9 1 1 1 +
10 1 0 1 +
1. Estimate the conditional probabilities for P(A|+), P(B|+), P(C|+), P(A|),
P(B|), and P(C|)? (5 points)
2. Use the estimate of conditional probabilities given in the previous question to
predict the class label for a test example (A = 0, B = 1, C = 0) using the nave
Bayes approach. (10 points)
3. Estimate the conditional probabilities using the m-estimate approach, with p =
1/2, and m = 4. (5 points)
4. Repeat part (2) using the conditional probabilities given in part (3). (10 points)
5. Compare the two methods for estimating probabilities. Which method is better
and why? (5 points)
3
Figure 2: Bayesian belief network for Question 4.
Question 4: (30 points) Given the Bayesian network shown in Figure 2, compute the
following probabilities:
1. P(B = good, F = empty, G = empty, S = yes). (10 points)
2. P(B = bad, F = empty, G = not empty, S = no). (10 points)
3. Given that the battery is bad, compute the probability that the car will start. (10
points)
4

Das könnte Ihnen auch gefallen

15 Day Detox Challenge
Dokument84 Seiten
15 Day Detox Challenge
Danii Supergirl Bailey
100% (4)
Practice Questions for Tableau Desktop Specialist Certification Case Based
Von Everand
Practice Questions for Tableau Desktop Specialist Certification Case Based
Exam OG
Bewertung: 5 von 5 Sternen
5/5 (1)
Final Sol
Dokument8 Seiten
Final Sol
Jasmine117
100% (1)
Quarter 1 - Module 1
Dokument31 Seiten
Quarter 1 - Module 1
Roger Santos Peña
75% (4)
DL - Assignment 3 Solution
Dokument7 Seiten
DL - Assignment 3 Solution
swathisreejith6
Noch keine Bewertungen
UltimateBeginnerHandbookPigeonRacing PDF
Dokument21 Seiten
UltimateBeginnerHandbookPigeonRacing PDF
MartinPalm
Noch keine Bewertungen
Test Questions - Recruitment Test - AFGT02 Courseware - Arbisoft Fresh Grad Online Test - 2020
Dokument26 Seiten
Test Questions - Recruitment Test - AFGT02 Courseware - Arbisoft Fresh Grad Online Test - 2020
Ammar Farooq Khan
80% (5)
DL - Assignment 2 Solution
Dokument7 Seiten
DL - Assignment 2 Solution
swathisreejith6
Noch keine Bewertungen
Dermatology Skin in Systemic Disease
Dokument47 Seiten
Dermatology Skin in Systemic Disease
Nariska Cooper
Noch keine Bewertungen
Baseline Scheduling Basics - Part-1
Dokument48 Seiten
Baseline Scheduling Basics - Part-1
Perwaiz
100% (1)
Design of Penstock: Reference Code:IS 11639 (Part 2)
Dokument4 Seiten
Design of Penstock: Reference Code:IS 11639 (Part 2)
sunchitk
100% (3)
SFC Sept 2015 Exam MS - Final
Dokument11 Seiten
SFC Sept 2015 Exam MS - Final
David Iyodo
Noch keine Bewertungen
Performance Monitoring and Coaching Form
Dokument3 Seiten
Performance Monitoring and Coaching Form
janine masilang
100% (2)
IMCI Chart Booklet
Dokument43 Seiten
IMCI Chart Booklet
mysticeyes_17
100% (1)
(Fall 2011) CS-402 Data Mining - Final Exam-SUB - v03
Dokument6 Seiten
(Fall 2011) CS-402 Data Mining - Final Exam-SUB - v03
taaloos
Noch keine Bewertungen
MLT Assign PDF
Dokument137 Seiten
MLT Assign PDF
Praveen Choudhary
Noch keine Bewertungen
Practice Exam 2
Dokument4 Seiten
Practice Exam 2
Mikey Zhou
Noch keine Bewertungen
B.E Odd Semester (3) Examinations 2020-21
Dokument2 Seiten
B.E Odd Semester (3) Examinations 2020-21
red sparrow
Noch keine Bewertungen
BDA1 - Batch Evaluation Test - Answer Key
Dokument16 Seiten
BDA1 - Batch Evaluation Test - Answer Key
M
Noch keine Bewertungen
Ass 1 Unit 26 16-17
Dokument3 Seiten
Ass 1 Unit 26 16-17
Anonymous RzVl4YDC
0% (1)
Data Mining Questions Q&A
Dokument11 Seiten
Data Mining Questions Q&A
aaakandoh
Noch keine Bewertungen
Exam DM 071214 Ans
Dokument7 Seiten
Exam DM 071214 Ans
Eyad Goudaa
Noch keine Bewertungen
Practice Final CS61c
Dokument19 Seiten
Practice Final CS61c
Edward Yixin Guo
Noch keine Bewertungen
Week3 Assignment
Dokument6 Seiten
Week3 Assignment
SURENDRAN D CS085
Noch keine Bewertungen
Midterm Sol
Dokument23 Seiten
Midterm Sol
Muhammad Murtaza
Noch keine Bewertungen
Database Management Systems
Dokument4 Seiten
Database Management Systems
Kanika Bhalla
Noch keine Bewertungen
Mid Term Test
Dokument6 Seiten
Mid Term Test
silence123444488
Noch keine Bewertungen
ES2F3-6 QMP Formative Practice Exam (March24) - QUESTIONS
Dokument8 Seiten
ES2F3-6 QMP Formative Practice Exam (March24) - QUESTIONS
crochetbyellaa4
Noch keine Bewertungen
SLA Mid-termV2 Soln
Dokument5 Seiten
SLA Mid-termV2 Soln
cadi0761
Noch keine Bewertungen
SS ZG568 EC 2R SECOND SEM 2020 2021 Solution 1617000149821
Dokument6 Seiten
SS ZG568 EC 2R SECOND SEM 2020 2021 Solution 1617000149821
amrasirah
Noch keine Bewertungen
De1 ML186 NLTK-va-TKDN 260921
Dokument4 Seiten
De1 ML186 NLTK-va-TKDN 260921
tri le huynh duc
Noch keine Bewertungen
BITS - AIML-Cohort 10 - Regression - Assignment 1
Dokument2 Seiten
BITS - AIML-Cohort 10 - Regression - Assignment 1
kirtikarandikar1
Noch keine Bewertungen
CSC 5825 Intro. To Machine Learning and Applications Midterm Exam
Dokument13 Seiten
CSC 5825 Intro. To Machine Learning and Applications Midterm Exam
rana
Noch keine Bewertungen
Sample Midterm CSC 201
Dokument3 Seiten
Sample Midterm CSC 201
pavanil
Noch keine Bewertungen
Quiz 6: Multiple Choice
Dokument6 Seiten
Quiz 6: Multiple Choice
Anupam
Noch keine Bewertungen
De1 ML184 Nguyen-Ly-Thong-Ke 260921
Dokument4 Seiten
De1 ML184 Nguyen-Ly-Thong-Ke 260921
ngô long phạm
Noch keine Bewertungen
DEEP LEARNING IIT Kharagpur Assignment - 4 - 2024
Dokument7 Seiten
DEEP LEARNING IIT Kharagpur Assignment - 4 - 2024
Mangaiyarkarasi K
Noch keine Bewertungen
Midterm2012 Sol
Dokument8 Seiten
Midterm2012 Sol
Nishank Modi
Noch keine Bewertungen
2019 Bd-Mid Spring Regular Solution - Evaluation Scheme
Dokument4 Seiten
2019 Bd-Mid Spring Regular Solution - Evaluation Scheme
Gourav
Noch keine Bewertungen
MCA Assignment 2013 14 - III Sem
Dokument14 Seiten
MCA Assignment 2013 14 - III Sem
Shagun Roy
Noch keine Bewertungen
Software Testing - 2024 - Assignment 2 22.01.2024
Dokument6 Seiten
Software Testing - 2024 - Assignment 2 22.01.2024
Viraj Sawant
Noch keine Bewertungen
Coa 2
Dokument6 Seiten
Coa 2
YASH BAJPAI
Noch keine Bewertungen
Assignment 6: Unit 8 - Week 6
Dokument5 Seiten
Assignment 6: Unit 8 - Week 6
cse_julie
Noch keine Bewertungen
2.HW Assignment
Dokument2 Seiten
2.HW Assignment
amanlalwani
Noch keine Bewertungen
Uecs3213 / Uecs3483 Data Mining SESSION: January 2020 Tutorial 5 Chapter 3-4 - Classification
Dokument3 Seiten
Uecs3213 / Uecs3483 Data Mining SESSION: January 2020 Tutorial 5 Chapter 3-4 - Classification
Yuven Raj
Noch keine Bewertungen
Coa 5
Dokument6 Seiten
Coa 5
YASH BAJPAI
Noch keine Bewertungen
Spring-Bus 120 Assignment
Dokument6 Seiten
Spring-Bus 120 Assignment
aboubakr3000
Noch keine Bewertungen
W7 Lab
Dokument3 Seiten
W7 Lab
chaitanyach650
Noch keine Bewertungen
ACFrOgBhrvP0NmnjxW3VC4snPc2fmQciQKCgkbZ90OJV 5x-H3DgwlaSYf8DwUkyarIN6KvkGJQ 2jimOm5xvbsjdFeKWwsWs Yg1ltHBvwjc0yGaYoFvuDeRNGuplpdGl4A5LShuT MPnQCqtN1
Dokument4 Seiten
ACFrOgBhrvP0NmnjxW3VC4snPc2fmQciQKCgkbZ90OJV 5x-H3DgwlaSYf8DwUkyarIN6KvkGJQ 2jimOm5xvbsjdFeKWwsWs Yg1ltHBvwjc0yGaYoFvuDeRNGuplpdGl4A5LShuT MPnQCqtN1
Tan Vuong
Noch keine Bewertungen
Midterm Question - Time Series Analysis - Updated
Dokument3 Seiten
Midterm Question - Time Series Analysis - Updated
Aakriti Jain
Noch keine Bewertungen
Google
Dokument3 Seiten
Google
akshay patri
Noch keine Bewertungen
Data Structures - Assignment 6 IDC, Spring 2022
Dokument3 Seiten
Data Structures - Assignment 6 IDC, Spring 2022
eleanor
Noch keine Bewertungen
Mid 1 Exam Solutions PDF
Dokument7 Seiten
Mid 1 Exam Solutions PDF
things
Noch keine Bewertungen
SEMESTER I, 20152016 Midterm
Dokument6 Seiten
SEMESTER I, 20152016 Midterm
কফি ওয়ান টু
Noch keine Bewertungen
Pm-Ii Scopes
Dokument1 Seite
Pm-Ii Scopes
padmapriya.loyola2023
Noch keine Bewertungen
Mock Exam For Module Quantitative Methods With Solutions
Dokument12 Seiten
Mock Exam For Module Quantitative Methods With Solutions
Hanqiu Wang
Noch keine Bewertungen
Final Exam (2) On DSS (MCSE 677) - Attempt Review
Dokument4 Seiten
Final Exam (2) On DSS (MCSE 677) - Attempt Review
Kazi Ryhan
Noch keine Bewertungen
Noc20-Cs28 Week 04 Assignment 001 PDF
Dokument3 Seiten
Noc20-Cs28 Week 04 Assignment 001 PDF
UKANI VEDANT
Noch keine Bewertungen
Econometrics I: Problem Set II: Prof. Nicolas Berman November 30, 2018
Dokument4 Seiten
Econometrics I: Problem Set II: Prof. Nicolas Berman November 30, 2018
Pulkit Bajpai
Noch keine Bewertungen
4th Sem. Asst. 2018-19
Dokument18 Seiten
4th Sem. Asst. 2018-19
GOPAL SHARMA
Noch keine Bewertungen
COA With Ans - Merged
Dokument110 Seiten
COA With Ans - Merged
Ayush Singh
Noch keine Bewertungen
Final Assignment
Dokument4 Seiten
Final Assignment
Talha Tariq
Noch keine Bewertungen
6.034 Quiz 1 October 13, 2005: Name Email
Dokument15 Seiten
6.034 Quiz 1 October 13, 2005: Name Email
ارسلان علی
Noch keine Bewertungen
Integrity Statement: by Typing My Name Below, I Acknowledge That I Have Completed This Exam
Dokument6 Seiten
Integrity Statement: by Typing My Name Below, I Acknowledge That I Have Completed This Exam
Jiayu Xu
Noch keine Bewertungen
CS 672 - Neural Networks - Practice - Midterm - Solutions
Dokument7 Seiten
CS 672 - Neural Networks - Practice - Midterm - Solutions
Mohammed AL-waaely
Noch keine Bewertungen
Noc20-Cs07 Week 01 Assignment 02
Dokument3 Seiten
Noc20-Cs07 Week 01 Assignment 02
Ravi
Noch keine Bewertungen
2020 Applications Unit1 CF
Dokument12 Seiten
2020 Applications Unit1 CF
Ralph Rezin Moore
Noch keine Bewertungen
Eps B301
Dokument4 Seiten
Eps B301
Ezekiel Maina
Noch keine Bewertungen
Shakespeare Sonnet Essay
Dokument3 Seiten
Shakespeare Sonnet Essay
api-505859466
0% (1)
EqualLogic Release and Support Policy v25
Dokument7 Seiten
EqualLogic Release and Support Policy v25
du2efs
Noch keine Bewertungen
Music 10 (2nd Quarter)
Dokument8 Seiten
Music 10 (2nd Quarter)
Dafchen Villarin Mahasol
Noch keine Bewertungen
postedcontentadminuploadsFAQs20for20Organization PDF
Dokument10 Seiten
postedcontentadminuploadsFAQs20for20Organization PDF
Mohd Adil Ali
Noch keine Bewertungen
7TH Maths F.a-1
Dokument1 Seite
7TH Maths F.a-1
Marrivada Suryanarayana
Noch keine Bewertungen
Quarter 1-Week 2 - Day 2.revised
Dokument4 Seiten
Quarter 1-Week 2 - Day 2.revised
Jigz Famulagan
Noch keine Bewertungen
C2 - Conveyors Diagram: Peso de Faja Longitud de Carga
Dokument1 Seite
C2 - Conveyors Diagram: Peso de Faja Longitud de Carga
Ivan Cruz
Noch keine Bewertungen
Sample Resume For Supply Chain Logistics Person
Dokument2 Seiten
Sample Resume For Supply Chain Logistics Person
Ammar Abbas
Noch keine Bewertungen
Systems Analysis and Design in A Changing World, Fourth Edition
Dokument41 Seiten
Systems Analysis and Design in A Changing World, Fourth Edition
Koko Dwika Putra
Noch keine Bewertungen
Canon Powershot S50 Repair Manual (CHAPTER 4. PARTS CATALOG) PDF
Dokument13 Seiten
Canon Powershot S50 Repair Manual (CHAPTER 4. PARTS CATALOG) PDF
Rita Caselli
Noch keine Bewertungen
Iguana Joe's Lawsuit - September 11, 2014
Dokument14 Seiten
Iguana Joe's Lawsuit - September 11, 2014
cindy_george
Noch keine Bewertungen
Close Enough To Touch by Victoria Dahl - Chapter Sampler
Dokument23 Seiten
Close Enough To Touch by Victoria Dahl - Chapter Sampler
HarlequinAustralia
Noch keine Bewertungen
2011-2012 - Medical - Directory
Dokument112 Seiten
2011-2012 - Medical - Directory
Јелена Кошевић
Noch keine Bewertungen
Cooperative Learning: Complied By: ANGELICA T. ORDINEZA
Dokument16 Seiten
Cooperative Learning: Complied By: ANGELICA T. ORDINEZA
Alexis Kaye Gulla
Noch keine Bewertungen
Obligatoire: Connectez-Vous Pour Continuer
Dokument2 Seiten
Obligatoire: Connectez-Vous Pour Continuer
Raja Shekhar Chinna
Noch keine Bewertungen
Determination Rules SAP SD
Dokument2 Seiten
Determination Rules SAP SD
kssumanth
Noch keine Bewertungen
PDF Chapter 5 The Expenditure Cycle Part I Summary - Compress
Dokument5 Seiten
PDF Chapter 5 The Expenditure Cycle Part I Summary - Compress
Cassiopeia Cashmere Godheid
Noch keine Bewertungen
ML Ass 2
Dokument6 Seiten
ML Ass 2
Santhosh Kumar P
Noch keine Bewertungen
CL57T V4.0
Dokument14 Seiten
CL57T V4.0
dimitri
Noch keine Bewertungen
Injections Quiz 2
Dokument6 Seiten
Injections Quiz 2
Allysa Macalino
Noch keine Bewertungen
Mechanical Production Engineer Samphhhhhle Resume
Dokument2 Seiten
Mechanical Production Engineer Samphhhhhle Resume
Anirban Mazumdar
Noch keine Bewertungen
Sem4 Complete File
Dokument42 Seiten
Sem4 Complete File
ghufra baqi
Noch keine Bewertungen