Sie sind auf Seite 1von 48

GE3143

Statistik Deskriptif

Pengenalan

Statistik adalah teknik dan kaedah untuk


penyelidik mengumpul, mengelas,
meringkas, menyusun, menganalisis dan
menginterpretasi data kuantitatif.

Jenis statistik

Statistik deskriptif
Memerihalkan

ciri sesuatu sampel


Merumuskan dan menyusun bilangan data
yang banyak.

Statistik inferensi
Satu kaedah untuk membuat keputusan atau
penganggaran mengenai populasi berdasarkan
keputusan yg didapati drp sampel.
3

Istilah dan Simbol Statistik

Populasi- Semua ahli dalam


sesuatu kumpulan yang
mempunyai ciri yang
mendefinasikan populasi
kajian
Sampel- satu subset atau
pewakilan daripada populasi
yang dipilih untuk kajian
Subjek- individu dalam
sesuatu sampel

Parameter (nilai yang


digunakan untuk menerangkan
populasi) (, 2)

Statistik (nilai yang digunakan


untuk menerangkan sampel)
( X , s)

Contoh
Populasi

Sampel

Statistik
deskriptif

Statistik
inferensi

100,000
pelajar
ting. 3
mendudu
ki ujian
matematk
PMR

Pengkaji
memilih
secara
rawak
skor/
markah
1000
pelajar

Guna
untuk
memerihal
kan sampel

X (min)
dan
s (sisihan
piawai)

Berdasarkan
statstik
deskriptif
digunakan
untuk
mengganggar
skor untuk
populasi
100,000
pelajar
(min) dan
2 (sisihan
piawai)
5

Fikir dan buat


Nyatakan apakah populasi, sampel dan
pembolehubah bagi pernyataan kajian
di bawah:
Satu kajian dijalankan untuk
mengetahui tahap pengetahuan ICT
bagi pelajar-pelajar sekolah rendah di
Selangor.
6

GB6023

Pengkelasan data

Tiga cara:
Cara data diwakil
Kuantitatif (boleh diukur dan wujud dalam skala nombor)
Kualitatif (tidak boleh diukur dalam skala nombor)
Bentuk
Diskrit (mempunyai sukatan data tertentu- cth: bilangan
komputer)
Selanjar (mempunyai sukatan yang berterusan cth:
ketinggain sesuatu bangunan)
Tahap

ukuran

Skala Pengukuran

Nominal: data boleh dikategorikan mempunyai nama atau label


tertentu

Ordinal: data yang boleh disusun ikut tertib tetapi perbezaan nilai
tidak memberi makna

cth., pengetahuan komputer pelajar dikelaskan kepada cemerlang, baik


dan sederhana.

Interval: data yang boleh disusun ikut tertib dan perbezaan nilai data
adalah bermakna,nilai sifar memberi nilai kuantiti dan bukannya
tiada kuantiti.

cth., jantina, bangsa, jawapan ya/tidak.

cth., skor ujian, ujian IQ, suhu

Ratio: data yang boleh disusun ikut tertib dan perbezaan nilai data
adalah bermakna, dan nilai sifar menunjukkan tiada kuantiti

e.g., umur, halaju kereta.

Jenis Analisis Deskriptif


Analisis univariatememerihalkan data
mengenai sesuatu pembolehubah
selalunya pembolehubah bersandar.
Analisis Bivariatemencari korelasi
antara pembolehubah, membanding
kumpulan atau mencari mencari
pembezaan antara kumpulan

Dua cara pemerihalan


Dengan menyusun data melalui jadual dan
graf
Dengan mendapatkan ukuran berbentuk
numerik bagi data

10

Taburan frekuensi

Students by Region of the United States

North East
South East
West

Frequency
679
415
423

Percent
44.8
27.4
27.9

11

Plot Stem-and-Leaf

Stem ditunjukkan
pada lajur menegak
dan ia mewakili digit
pertama di sesuatu
skor.
Leaf mewakili digit
yang terakhir yang
terdapat pada stem.

Age of Students
2 335678889
3 01224445555699
4 22445566678
5 1244589

12

Histogram

Mewakili data dalam


dua dimensi di mana
nilai frekuensi adalah
pada paksi y dan
maklumat mengenai
pembolehubah
bersandar (skor)
adalah pada paksi x

600

500

400

300

200

100

Std. Dev = 3.46


Mean = 10.8
N = 1233.00

0
0.0

2.5

5.0

7.5

10.0

12.5

15.0

17.5

20.0

Highest Year School Completed, Mother

13

Carta Bar
Mewakili data dalam
bentuk dimensi dan
sesuai untuk data
berbentuk nominal,
iaitu frekuensi diwakili
pada paksi y dan
kategori diwakili oleh
paksi x.

600

500

400

300

200

100

Count

0
Missing

Exciting

Routine

Dull

Is Life Exciting or Dull

14

Poligon frekuensi
500

Menggmbarkan data
seperti histogram.
Titik tengah di setiap
bar pada histogram
dikenalpasti dan
disambungkan
dengan satu garisan.

400

300

200

100

Count

0
Missing
0

5
4

7
6

9
8

11
10

13
12

15
14

17
16

19
18

20

Highest Year of School Completed

15

Carta Pie- mewakili %


frekuensi

100%- 360 darjah


1%- 3.6 darjah

Sudut ditentukan melalui:

1st Qtr

2nd Qtr

3rd Qtr

4th Qtr

Frekuensi relatif
(frekuensi/jumlah
responden x 360 darjah)

16

Ukuran numerik statistik deskriptif

Untuk merumuskan taburan frekuensi atau


sekumpulan data dengan satu ukuran (nilai)
Ukuran Kecenderungan Memusat- keadaan
purata atau indeks kepusatan sesuatu
taburan data
Terdapat tiga jenis ukuran:
1. Min
2. Median
3. Mod
17

Min
Nilai purata bagi suatu kumpulan
Dikirakan dengan menjumlahkan semua
data dibahagikan dengan bilangan data
Simbol by x atau M

18

Min

min populasi, =
N
+ + ... +
2
N
= 1
N

min sampel, =
n
+ + ... + n
2
= 1
n
GB6023

19
19

Min
Contoh:
Markah ujian statistik bagi 10 pelajar adalah seperti berikut.
Dapatkan min markah ujian statistik.
75.60

52.40

85.00

43.00

72.00

70.00

60.00

81.50

51.00

49.00

N
75.60 + 52.40 + 85.00 + 43.00 + 72.00 + 70.00 + 60.00 + 81.50 + 51.00 + 49.00
=
10
= 63.95

Min, =

GB6023

20
20

Median
Bacaan data yang wujud di tengah-tengah
apabila data disusun dalam tertib menarik
atau menurun.
Simbol Mdn atau X
Jika bilangan data ganjil, median- data di
tengah-tengah
Jika bilangan data genap, median= purata
dua data di tengah-tengah

21

Median
Contoh:
Berikut merupakan markah ujian statistik bagi 9
orang pelajar.

69 57 61 53 70 67 59 65 70

22
22

Median
Contoh:
Susun data secara meningkat.

53 57 59 61 65 67 69 70 70
Data di tengah2
~

Median,

adalah 65
23

Mod

Bilangan skor yang mempunyai kekerapan


terbanyak didalam satu set data/taburan
Diperolehi daripada melihat taburan sahaja
Terdapat tiada mod/ lebih daripada satu mod
Jarang digunakan

24

Mod
Contoh:
Berikut merupakan markah ujian statistik bagi 20 orang
pelajar.
33

25

33

75

84

75

65

57

84

70

61

53

38

70

81

69

70

71

59

67

25
25

Mod
Contoh:
Susun data secara meningkat

25 33 33 38 53 57 59 61 65 67 69 70 70 70 71 75 75 81 84 84
Kekerapan paling tinggi

Mod,

adalah 70

26

Perbandingan di antara min, median dan mod


Kesesuaian
Skala pengukuran

Min

Median

Mod

Nominal

tidak

tidak

ya

Ordinal

tidak

ya

ya

Interval

ya

ya

ya

Ratio

ya

ya

ya
27

LATIHAN

Kriteria yg diberikan di bawah merujuk


kepada uku. kecenderungan memusat
yang mana?
Paling boleh dipercayai
Paling kurang dipercayai
Mudah dipengaruhi oleh sesuatu
nilai dalam cerapan
Boleh dianggarkan secara langsung
drp taburan data
Boleh dianggarkan secara langsung
drp histogram
28

Hubungan di antara Min, Mod dan Median


Bentuk Simetri

Pembolehubah
Min = Median = Mod
29
29

Frekuensi

Bentuk Terpencong Ke Kanan

Pembolehubah
Mod

Min
Median
30
30

Frekuensi

Bentuk Terpencong Ke Kiri

Pembolehubah
Median
Min
Mod

31
31

32

LATIHAN
Jika kebanyakan drp pelajar dlm kelas anda
tidak mengulangkaji dengan baik topik yang
anda ajarkan, skor ujian yang bakal diberikan
nanti akan cenderung untuk bertabur:
- secara NORMAL?
- secara TERPENCONG POSITIF?
- secara TERPENCONG NEGATIF?

33
33

Serakan
Ukuran

memusat tidak dapat


menggambarkan perbezaan antara
suatu skor dengan skor yang lain

Perlu lapur juga ukuran serakan untuk


menggambarkan keadaaan kepelbagaian
atau keseragaman

34

Contoh
Kedua-dua

taburan skor set di bawah


mempunyai nilai min yang sama ( = 50), tetapi
taburan skor set 2 adalah lebih terserak.
Taburan skor untuk set 1: 48 49 49 50 50 50 51
51 52 (serakan rendah)
Taburan skor untuk set 2: 10 30 30 50 50 50 70
70 90 (serakan tinggi)

35

Jenis ukuran serakan


Julat
Varians
Sisihan

Piawai

36

Julat
Julat= Skor mak- skor min
Kurang sesuai untuk mengukur serakan
data kerana ia hanya mengambil kira niala
minima dan nilai maksima saja

37

Julat
Contoh:

44 49 50 58 58 60 61 68 70 72
Julat = data maksimum data minimum
= 72 44
=28

GB6023

38
38

SISIHAN PIAWAI & VARIANS


Sisihan piawai adalah pengukuran yang paling
sesuai digunakan untuk mengukur serakan data

Sisihan piawai yang diperolehi memberikan nilai


x
bagi kedudukan data yang
bertabur sekitar min

Nilai sisihan piawai yang tinggi memberikan


x
gambaran bahawa data itu tertabur jauh
daripada
min (kurang padat)

39

Sisihan piawai
Simbol adalah SD, , or s
Sisihan

piawai sering digunakan dengan


mengaitkannya

Antara sisihan piawai dan taburan normal

40

Taburan normal

Satu poligon frekuensi yang garisannya telah


dilatarkan

41

Ciri Taburan Normal


Unimodal
Simetrikal(samaukur)
Min=Median=mod
Lengkuk akan menghampiri paksi x
apabila skor menjauhi min tetapi tidak
akan mencecah paksi x

42

Kaitan antara Luas di bawah taburan


normal dan sisihan piawai
Jumlah luas di bawah taburan normal
mewakili semua skor dalam taburan
tersebut
68% skor adalah antara MIN + 1s
95% skor adalah antara MIN + 2s
99.7% skor adalah antara MIN + 3s

43

44

Peratus berkaitan dengan luas di bawah


taburan juga boleh ditulis dalam bentuk
perpuluhan
84.13%=

0.8413

Jika dalam bentuk perpuluhan, merujuk


kepada konsep Kebarangkalian atau
bahagian (pecahan) luas kawasan
(proportion of area)
84.13%

skor adalah dibawah nilai 115


Kebarangkalian untuk memilih skor dibawah nilai
115 ialah 0.8413
Bahagian (pecahan) luas kawasan dibawah nilai
115 ialah 0.8413

45

STATISTIK KORELASI
Mengambarkan kekuatan hubungan di antara dua
pembolehubah:
Contohnya: hubungan antara sikap pelajar
terhadap matapelajaran dengan pencapaian
pelajar dalam matapelajaran
tersebut
x
Kekuatan hubungan diringkaskan dengan nilai r
(pekali korelasi).
Nilai r adalah dalam julat +1 dan 1.00 x
Tanda + @ - menunjukkan arah hubungan
Nilai menggambarkan kekuatan hubungan
46

STATISTIK KORELASI
Seandainya pembolehubah yang ingin
dihubungkan adalah bersifat interval, maka
korelasi Pearson digunakan.
Sebaliknya, jika data adalah
bersifat
x
nominal/ordinal maka, korelasi Spearman
digunakan
x

47

Terima Kasih
Sila hantar jawapan anda

48

Das könnte Ihnen auch gefallen