Willkommen bei Scribd!

2003data Mining Tut 3

Hochgeladen von

0% fanden dieses Dokument nützlich (0 Abstimmungen)

51 Ansichten4 Seiten

Explain the operation of the k-means clustering algorithm using pseudo code. Explain the meaning of support and confidence in the context of association rule discovery algorithms. Find all rules between single items that have support >= 60%. For each rule report both support and confidence.

Originalbeschreibung:

Originaltitel

2003Data Mining Tut 3

Copyright

Verfügbare Formate

DOC, PDF, TXT oder online auf Scribd lesen

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Dieses Dokument melden

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

0% fanden dieses Dokument nützlich (0 Abstimmungen)

51 Ansichten4 Seiten

2003data Mining Tut 3

Hochgeladen von

sreekarscribd

Copyright:

Attribution Non-Commercial (BY-NC)

Verfügbare Formate

Als DOC, PDF, TXT herunterladen oder online auf Scribd lesen

Markieren Sie unangemessene Inhalte

Zu Seite

Sie sind auf Seite 1von 4

Im Dokument suchen

Intelligent Data Analysis and Probabilistic Inference Data Mining Tutorial 3: Clustering and Associations Rules

1. i. ii. Explain the operation of the k-means clustering algorithm using pseudo code. Given the following eight points, and assuming initial cluster centroids given by A, B, C, and that a Euclidean distance function is used for measuring distance between points, use k-means to show only the three clusters and calculate their new centroids after the second round of execution.

ID A B C D E F G H 2. i. ii.

X 2 2 8 5 7 6 1 4

Y 10 5 4 8 5 4 2 9

Explain the meaning of support and confidence in the context of association rule discovery algorithms and explain how the a priori heuristic can be used to improve the efficiency of such algorithms. Given the transactions described below, find all rules between single items that have support >= 60%. For each rule report both support and confidence. 1: (Beer) 2: (Cola, Beer) 3: (Cola, Beer) 4: (Nuts, Beer) 5: (Nuts, Cola, Beer) 6: (Nuts, Cola, Beer) 7: (Crisps, Nuts, Cola) 8: (Crisps, Nuts, Cola, Beer) 9: (Crisps, Nuts, Cola, Beer) 10:(Crisps, Nuts, Cola, Beer)

yg@doc.ic.ac.uk, mmg@doc.ic.ac.uk

16th Dec2003

a. Explain how hierarchical clustering algorithms work, make sure your answer describes what is meant by a linkage method and how it is used. b. Explain the advantages and disadvantages of hierarchical clustering compared to K-means clustering.

The following table shows the distance matrix between five genes, G1 G2 G3 G4 G5 i. ii. iii. G1 0 9 3 6 11 G2 0 7 5 10 G3 G4 G5

0 9 2

0 8

Based on a complete linkage method show the distance matrix between the first formed cluster and the other data points. Draw a dendrogram showing the full hierarchical clustering tree for five points based on complete linkage. Draw a dendrogram showing the full hierarchicatree for the five points based on single linkage.

yg@doc.ic.ac.uk, mmg@doc.ic.ac.uk

16th Dec2003

Data Mining Tutorial 3: Answers

1. Clusters after 1st iteration Cluster1: A (2,10), D (5,8), H (4,9) Cluster2: B: B (2,5), G (1,2) Cluster3: C (8,4), E (7,5), F (6,4) Centroids after 1st iteration Cluster1: centroid: (3.66, 9) Cluster2: centroid: (1.5, 3.5) Cluster3: centroid: (7, 4.33) Clusters after 2nd iteration(no change) Cluster1: A (2,10), D (5,8), H (4,9) Cluster2: B: B (2,5), G (1,2) Cluster3: C (8,4), E (7,5), F (6,4) Centroids after 2nd iteration (no change) Cluster1: centroid: (3.66, 9) Cluster2: centroid: (1.5, 3.5) Cluster3: centroid: (7, 4.33)

2. Initial Supports Beer: Support = 9/10 Cola: Support=8/10 Nuts: Support=7/10 Crisps: Support=4/10 (Drop Crisps) Beer, Cola: Support=7/10 Beer, Nuts: Support=6/10 Cola, Nuts: Support=6/10 Beer->Cola (Support=70%, Confidence= 7/9=77% Cola->Beer (Support=70%, Confidence= 7/8=87.5 Beer->Nuts (Support=60%, Confidence= 6/9=66% Nuts->Beer (Support= 60%, Confidence= 6/7=85.7% Cola->Nuts (Support=60%, Confidence= 6/8=75% Nuts->Cola (Support=60%, Confidence= 6/7=85.7%

yg@doc.ic.ac.uk, mmg@doc.ic.ac.uk

16th Dec2003

4. The first cluster will be formed from G3 and G5 since they have the minimum distance. G35 0 11 10 9 G1 0 9 6 0 5 G2 G4

G35 G1 G2 G4

Single Linkage

Complete Linkage

yg@doc.ic.ac.uk, mmg@doc.ic.ac.uk

16th Dec2003

Das könnte Ihnen auch gefallen

Flourishing
Dokument110 Seiten
Flourishing
Sebastian Vaida
Noch keine Bewertungen
Bokeh Cheat Sheet
Dokument1 Seite
Bokeh Cheat Sheet
sreekarscribd
Noch keine Bewertungen
Flip Flops
Dokument28 Seiten
Flip Flops
sreekarscribd
Noch keine Bewertungen
Python MCQs
Dokument39 Seiten
Python MCQs
Kanadam Karteeka Pavan
100% (3)
NMIMS PGDM Marketing Analytics Course Overview
Dokument6 Seiten
NMIMS PGDM Marketing Analytics Course Overview
harshit
Noch keine Bewertungen
The 2020 NBA Offseason
Dokument482 Seiten
The 2020 NBA Offseason
Zach Smith
Noch keine Bewertungen
Financial Performance Evaluation PDF
Dokument109 Seiten
Financial Performance Evaluation PDF
shahulsuccess
100% (1)
Chapter-12 ANOVA For-Homework
Dokument16 Seiten
Chapter-12 ANOVA For-Homework
Andrea Marie Calma
Noch keine Bewertungen
Software Testing
Dokument50 Seiten
Software Testing
Abdulraheman
100% (4)
2015 Computational Intelligence Applications in Modeling and Control
Dokument433 Seiten
2015 Computational Intelligence Applications in Modeling and Control
chaothanai
Noch keine Bewertungen
Mathematical and Computational Modeling: With Applications in Natural and Social Sciences, Engineering, and the Arts
Von Everand
Mathematical and Computational Modeling: With Applications in Natural and Social Sciences, Engineering, and the Arts
Roderick Melnik
Noch keine Bewertungen
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
Dokument4 Seiten
Assignment 10: Introduction To Machine Learning Prof. B. Ravindran
Praveen Kumar Kandhala
100% (1)
(3825) - 102 M.Sc. Microbiology MB-502: Quantitative Biology (2008 Pattern)
Dokument65 Seiten
(3825) - 102 M.Sc. Microbiology MB-502: Quantitative Biology (2008 Pattern)
Nandkumar Bhosale
Noch keine Bewertungen
Answer All Questions, Each Carries 4 Marks
Dokument3 Seiten
Answer All Questions, Each Carries 4 Marks
Karthika
Noch keine Bewertungen
CS467 A
Dokument3 Seiten
CS467 A
E3 Tech
Noch keine Bewertungen
K-Means Clustering Clustering Algorithms Implementation and Comparison
Dokument4 Seiten
K-Means Clustering Clustering Algorithms Implementation and Comparison
FrankySaputra
Noch keine Bewertungen
BCA
Dokument76 Seiten
BCA
Arvinder Singh
Noch keine Bewertungen
Cs 60
Dokument80 Seiten
Cs 60
Sirsendu Roy
Noch keine Bewertungen
Computational Biology 2nd Test
Dokument7 Seiten
Computational Biology 2nd Test
miguel_zas_1
Noch keine Bewertungen
DWDM MID - 2 Question Paper and Online Bits
Dokument3 Seiten
DWDM MID - 2 Question Paper and Online Bits
Nanaji Uppe
Noch keine Bewertungen
Learn Lab3
Dokument12 Seiten
Learn Lab3
Andika Bayu Aji
Noch keine Bewertungen
2 Question Bank
Dokument3 Seiten
2 Question Bank
ghukl
Noch keine Bewertungen
Gujarat Technological University
Dokument2 Seiten
Gujarat Technological University
20IT003 Dharmik Vanpariya
Noch keine Bewertungen
Assignment DMBI 2
Dokument2 Seiten
Assignment DMBI 2
IMMORTAL'S PLAYZ
Noch keine Bewertungen
CHT397 - Ktu Qbank
Dokument7 Seiten
CHT397 - Ktu Qbank
Jo Mon
Noch keine Bewertungen
2 1 T2-ModuloArithmetic
Dokument1 Seite
2 1 T2-ModuloArithmetic
Jason Christian
Noch keine Bewertungen
SSC JE Syllabus PDF
Dokument5 Seiten
SSC JE Syllabus PDF
Ichigo
Noch keine Bewertungen
Roll No. B.E/ B.Tech (Fulltime) Degreeend Semesterexaminations, April/May2013
Dokument3 Seiten
Roll No. B.E/ B.Tech (Fulltime) Degreeend Semesterexaminations, April/May2013
gpalanimca
Noch keine Bewertungen
CS1602-Data Structures and Algorithms-Anna University-Question Papers
Dokument13 Seiten
CS1602-Data Structures and Algorithms-Anna University-Question Papers
bhuvangates
100% (1)
Paper 1 73
Dokument6 Seiten
Paper 1 73
Kavi Kumaresan J
Noch keine Bewertungen
Assignment 2
Dokument2 Seiten
Assignment 2
Shuvendu Rana
Noch keine Bewertungen
Assignment 2
Dokument2 Seiten
Assignment 2
Shuvendu Rana
Noch keine Bewertungen
Clustring
Dokument20 Seiten
Clustring
parasharstella
Noch keine Bewertungen
Stat4006 2022-23 PS4
Dokument3 Seiten
Stat4006 2022-23 PS4
resulmamiyev1
Noch keine Bewertungen
07a80303 Neuralnetworksandfuzzylogicsystems
Dokument8 Seiten
07a80303 Neuralnetworksandfuzzylogicsystems
Sharanya Thirichinapalli
Noch keine Bewertungen
Data Mining Algorithms in R - Clustering - Fuzzy Clustering - Fuzzy C-Means - Wikibooks, Open Books For An Open World
Dokument8 Seiten
Data Mining Algorithms in R - Clustering - Fuzzy Clustering - Fuzzy C-Means - Wikibooks, Open Books For An Open World
Snr Kofi Agyarko Ababio
Noch keine Bewertungen
K-medoids and PAM Clustering of Rules from Insurance Data
Dokument6 Seiten
K-medoids and PAM Clustering of Rules from Insurance Data
moldova89
Noch keine Bewertungen
Universiti Teknologi Mara Final Examination: Confidential CS/APR 2010/CSC508/518
Dokument7 Seiten
Universiti Teknologi Mara Final Examination: Confidential CS/APR 2010/CSC508/518
master_proyo
Noch keine Bewertungen
Machine Learning
Dokument4 Seiten
Machine Learning
Techno Tech
Noch keine Bewertungen
Xii CS PB1
Dokument10 Seiten
Xii CS PB1
lalita nagar
Noch keine Bewertungen
Graph Partitioning Advance Clustering Technique
Dokument14 Seiten
Graph Partitioning Advance Clustering Technique
ijcses
Noch keine Bewertungen
Cps 8210 Assignment 2
Dokument3 Seiten
Cps 8210 Assignment 2
Sarama Kamal Syed
Noch keine Bewertungen
Information Assurance & Security Test Exam Questions
Dokument5 Seiten
Information Assurance & Security Test Exam Questions
Mohan Kumar
Noch keine Bewertungen
UEC735 (1)
Dokument2 Seiten
UEC735 (1)
Abhi Mittal
Noch keine Bewertungen
Neural Networks and Fuzzy Logic PDF
Dokument9 Seiten
Neural Networks and Fuzzy Logic PDF
badamsmith
Noch keine Bewertungen
Important Questions of Machine Learning
Dokument5 Seiten
Important Questions of Machine Learning
zeeshanahmad12030
Noch keine Bewertungen
Algorithm Its Clustering: Detecting
Dokument11 Seiten
Algorithm Its Clustering: Detecting
qqqqq
Noch keine Bewertungen
Logic Circuit
Dokument2 Seiten
Logic Circuit
Raman yadav
Noch keine Bewertungen
Data Stream Clustering
Dokument3 Seiten
Data Stream Clustering
john949
Noch keine Bewertungen
Total Pages: 2: Answer All Questions, Each Carries 3 Marks
Dokument2 Seiten
Total Pages: 2: Answer All Questions, Each Carries 3 Marks
shakirck
Noch keine Bewertungen
Data Structures and Algorithms Final Exam Questions
Dokument5 Seiten
Data Structures and Algorithms Final Exam Questions
Voranto Asad
Noch keine Bewertungen
The International Journal of Engineering and Science (The IJES)
Dokument4 Seiten
The International Journal of Engineering and Science (The IJES)
theijes
Noch keine Bewertungen
Assignment - Week 8 Type of Question: MCQ/MSQ: Course Name: Introduction To Machine Learning Clustering
Dokument6 Seiten
Assignment - Week 8 Type of Question: MCQ/MSQ: Course Name: Introduction To Machine Learning Clustering
SURENDRAN D CS085
Noch keine Bewertungen
Btech It 6 Sem Data Analytics Kit601 2022
Dokument2 Seiten
Btech It 6 Sem Data Analytics Kit601 2022
Harsh Srivastav
Noch keine Bewertungen
PRACTICE QUESTIONS - Unit 1
Dokument1 Seite
PRACTICE QUESTIONS - Unit 1
Neeraj Gour
Noch keine Bewertungen
CLAD Homework 2 Questions
Dokument3 Seiten
CLAD Homework 2 Questions
Meylin Portocarrero Elias
Noch keine Bewertungen
CLAD Homework 2 Questions
Dokument3 Seiten
CLAD Homework 2 Questions
Rayen Askri
Noch keine Bewertungen
K-Means Algorithm: Clustering Methods: Part 2a
Dokument10 Seiten
K-Means Algorithm: Clustering Methods: Part 2a
Phạm Trường An
Noch keine Bewertungen
Lab 08 Solutions
Dokument5 Seiten
Lab 08 Solutions
dawit gebreyohans
Noch keine Bewertungen
DM HW2 Sol
Dokument4 Seiten
DM HW2 Sol
Wafaa Basil
Noch keine Bewertungen
T, Eft: T (N) - (2T (N - 1, If N 0 1, Otherwise
Dokument2 Seiten
T, Eft: T (N) - (2T (N - 1, If N 0 1, Otherwise
TS Origami
Noch keine Bewertungen
An Efficient Incremental Clustering Algorithm
Dokument3 Seiten
An Efficient Incremental Clustering Algorithm
World of Computer Science and Information Technology Journal
Noch keine Bewertungen
Fuzzy Assignment
Dokument2 Seiten
Fuzzy Assignment
Mohammed Mansoor
Noch keine Bewertungen
2018 Fin Econ
Dokument7 Seiten
2018 Fin Econ
TAKUDZWA OSCAR NYAKUDYA
Noch keine Bewertungen
Data Structure Prvious Paper
Dokument4 Seiten
Data Structure Prvious Paper
flipkart6392
Noch keine Bewertungen
Ce 317
Dokument4 Seiten
Ce 317
all work
Noch keine Bewertungen
Fourth Semester BE Degree Exam Model Question Paper Analysis and Design of Algorithms
Dokument4 Seiten
Fourth Semester BE Degree Exam Model Question Paper Analysis and Design of Algorithms
Mohnish Raju
Noch keine Bewertungen
Temporal Data Mining via Unsupervised Ensemble Learning
Von Everand
Temporal Data Mining via Unsupervised Ensemble Learning
Yun Yang
Noch keine Bewertungen
Evolutionary Algorithms for Mobile Ad Hoc Networks
Von Everand
Evolutionary Algorithms for Mobile Ad Hoc Networks
Bernabé Dorronsoro
Noch keine Bewertungen
Chapter6 ArtifactsoftheProcess
Dokument43 Seiten
Chapter6 ArtifactsoftheProcess
sreekarscribd
Noch keine Bewertungen
SPM Unit 6
Dokument9 Seiten
SPM Unit 6
sreekarscribd
Noch keine Bewertungen
SPM Unit 5
Dokument17 Seiten
SPM Unit 5
sreekarscribd
Noch keine Bewertungen
Welcome TO PHP Summer Class IN 2010
Dokument41 Seiten
Welcome TO PHP Summer Class IN 2010
sreekarscribd
Noch keine Bewertungen
Memory Handling in C & C++
Dokument16 Seiten
Memory Handling in C & C++
sreekarscribd
Noch keine Bewertungen
Cse r07 Syllabus Book
Dokument95 Seiten
Cse r07 Syllabus Book
sreekarscribd
Noch keine Bewertungen
Unix Questions
Dokument7 Seiten
Unix Questions
Kushal Sen Laskar
Noch keine Bewertungen
BSBMKG507 Assessment Task 1 (AT1) Written Assessment
Dokument4 Seiten
BSBMKG507 Assessment Task 1 (AT1) Written Assessment
Nathalia Caroline
Noch keine Bewertungen
Chapter Three: Research Methology
Dokument6 Seiten
Chapter Three: Research Methology
Diela Kasim
Noch keine Bewertungen
UREC2 Low Risk Human Participants 2021-22
Dokument9 Seiten
UREC2 Low Risk Human Participants 2021-22
Edgar Pampulah
Noch keine Bewertungen
Question Text: Correct Mark 1.00 Out of 1.00
Dokument6 Seiten
Question Text: Correct Mark 1.00 Out of 1.00
sosa farrelle
Noch keine Bewertungen
JNTU KAKINADA - B.Tech - STATISTICS WITH R PROGRAMMING R16 R1621051102017 FR 200
Dokument5 Seiten
JNTU KAKINADA - B.Tech - STATISTICS WITH R PROGRAMMING R16 R1621051102017 FR 200
Likhitha Chowdary
Noch keine Bewertungen
Ug 3 Statistics
Dokument23 Seiten
Ug 3 Statistics
Sri Vatsadhar Kanjarla Chakri
Noch keine Bewertungen
Lecture No 10
Dokument28 Seiten
Lecture No 10
Wra Arirmiwni
Noch keine Bewertungen
Data Analytics Test
Dokument10 Seiten
Data Analytics Test
Deepak Pundir
Noch keine Bewertungen
June 13 s1
Dokument6 Seiten
June 13 s1
annabellltf
Noch keine Bewertungen
Toronto FinTech Curriculum
Dokument13 Seiten
Toronto FinTech Curriculum
Thanh
Noch keine Bewertungen
Microsoft Malware Prediction
Dokument16 Seiten
Microsoft Malware Prediction
vikram k
Noch keine Bewertungen
How mileage and age impact used Toyota Yaris prices
Dokument16 Seiten
How mileage and age impact used Toyota Yaris prices
Bflygraydude
Noch keine Bewertungen
Forecasting
Dokument50 Seiten
Forecasting
Mitika Tuteja
Noch keine Bewertungen
Database Systems
Dokument181 Seiten
Database Systems
gomar01
Noch keine Bewertungen
Those Who Do Not Remember The Past Are Condemned To Repeat It George Santayana Spanish Philosopher, Poet and Novelist (1863-1952)
Dokument32 Seiten
Those Who Do Not Remember The Past Are Condemned To Repeat It George Santayana Spanish Philosopher, Poet and Novelist (1863-1952)
Tejas Mahajan
Noch keine Bewertungen
Exemplar 1 PDF
Dokument57 Seiten
Exemplar 1 PDF
Were
Noch keine Bewertungen
Evaluation of Relative Importance of Environmental Issues Associated With A Residential Estate in Hong Kong
Dokument13 Seiten
Evaluation of Relative Importance of Environmental Issues Associated With A Residential Estate in Hong Kong
Mohammed Younus AL-Bjari
Noch keine Bewertungen
Krajewski Om12 02
Dokument69 Seiten
Krajewski Om12 02
Keana Flowers
100% (1)
Tutorial
Dokument42 Seiten
Tutorial
Revathi Belur
Noch keine Bewertungen
Correlation Regression 1
Dokument9 Seiten
Correlation Regression 1
Mae Dionisio
Noch keine Bewertungen
Customer-Centric Companies Are 60% More Profitable!
Dokument1 Seite
Customer-Centric Companies Are 60% More Profitable!
Pham Van Thanh
Noch keine Bewertungen
Daily Dose of Data Science - Archive
Dokument354 Seiten
Daily Dose of Data Science - Archive
rodrigofmarques
Noch keine Bewertungen
Probablity and Statistics
Dokument11 Seiten
Probablity and Statistics
Jeevitha Bandi
Noch keine Bewertungen
BIG DATA ANALYTICS - Syllabus
Dokument4 Seiten
BIG DATA ANALYTICS - Syllabus
amitroy2866
Noch keine Bewertungen