Sie sind auf Seite 1von 42

RemedialMeasures

RudiSalam
Jika modelRLStidak tepat untuk suatu dataset,
terdapat dua pilihan dasar:
1. Abaikan modelRLSdan cari modelyanglebih
tepat.
2. Gunakan beberapa transformasi terhadap
datasehingga modelregresi tepat untuk data
yangtelah ditransformasi.

rudisalam@stis.ac.id 2
Kedua pendekatan mempunyai keuntungan
dan kerugiannya.

rudisalam@stis.ac.id 3
Transformasi
Pengantar
Transformasi sederhana baik untuk variabel
dependen Yatau variabel independen X,atau
keduanya,sering cukup untuk membuat
modelRLStepat dengan datahasil
transformasi.

rudisalam@stis.ac.id 5
Transformasi untuk Hubungan
Nonlinier
Pertama kita pelajari transformasi untuk
melinierkan hubungan regresi nonlinier ketika
distribusi dari erroradalah mendekati normaldan
varians dari erroradalah konstan.
Pada situasi ini,transformasi terhadap X
sebaiknya diusahakan.
Alasan kenapa transformasi terhadap Ytidak
dilakukan adalah karena transformasi terhadap Y
seperti Y*=Ybisa secara materialmerubah
bentuk distribusi normaldari errordan bisa juga
mengarah ke varians erroryangberbeda.

rudisalam@stis.ac.id 6
Gambar 1
Beberapa
prototipe
hubungan
regresi nonlinier
dengan varians
errorkonstan
dan beberapa
transformasi
sederhana
terhadap X

rudisalam@stis.ac.id 7
Tabel sales daysof performance
trainee training score
i Xi Yi Xi'=Xi Xi'Yi (Xi')^2
1 0.5 46 0.7071 32.5269 0.5
2 0.5 51 0.7071 36.0624 0.5
3 1 71 1.0000 71.0000 1
4 1 75 1.0000 75.0000 1
5 1.5 92 1.2247 112.6765 1.5
6 1.5 99 1.2247 121.2497 1.5
7 2 105 1.4142 148.4924 2
8 2 112 1.4142 158.3919 2
9 2.5 121 1.5811 191.3178 2.5
10 2.5 125 1.5811 197.6424 2.5
rudisalam@stis.ac.id 8
Gambar 2.a
ScatterplotYdan X
140

120

100

80

60 Hubungan regresi adalah curvelinier


40

20

0
0 0.5 1 1.5 2 2.5 3

rudisalam@stis.ac.id 9
Transformasi untuk Hubungan
Nonlinier
Gambar 2.amenunjukkan hubungan regresi yang
curvelinear sehingga modelRLStidak tepat untuk
digunakan.
Karena variabilitas pada variabel Xterllihat agak
konstan,maka tranformasi dikenakan pada X.
Merujuk pada Gambar 1.a,transformasi yang
digunakan adalah mengambil akar dari X.
Gambar 2.bberikut adalah scatterplotantar Y
dan akar dari X.

rudisalam@stis.ac.id 10
Gambar 2.b
ScatterPlotYdengan X
140

120

100

80

60

40

20

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8

rudisalam@stis.ac.id 11
Transformasi untuk Hubungan
Nonlinier
Gambar 2.bmenunjukkan hubungan yang
lebih linier.
Variabilitas variabel Xmasih sama seperti
Gambar 2.akarena Ytidak ditransformasi.
Untuk memeriksa apakah modelRLStepat,
lakukan fittingantara Ydan Xhasil
transformasi.
Outputnya adalah sbb:

rudisalam@stis.ac.id 12
Transformasi untuk Hubungan
Nonlinier
Output:
Standard
Coefficients Error tStat Pvalue Lower95% Upper95%
Intercept 11.69 4.28 2.73 0.0259 21.57 1.81

XVariable1 85.53 3.50 24.45 0.0000 77.46 93.59

Fungsi regresi fitnya adalah


Y 11.69 85.53 X '
Gambar 2.cberikut menunjukkan tidak ada bukti
lackoffitatau varians erroryangunequal.

rudisalam@stis.ac.id 13
Gambar 2.c
ScatterPlotResidualMelawan X
8

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
2

rudisalam@stis.ac.id 14
Transformasi untuk Hubungan
Nonlinier
Residualdan expectedvalueundernormality:
ascending ordered expected
order residual valueunder
i ei A zA normality
1 4.27 0.06 1.55 5.27
2 2.84 0.16 1.00 3.41
3 2.79 0.26 0.66 2.23
4 2.54 0.35 0.38 1.28
5 1.06 0.45 0.12 0.42
6 1.16 0.55 0.12 0.42
7 1.46 0.65 0.38 1.28
8 2.21 0.74 0.66 2.23
9 2.73 0.84 1.00 3.41
10 5.94 0.94 1.55 5.27

rudisalam@stis.ac.id 15
Gambar 2.d
PlotResidualMelawan ExpectedValue
8

0
6 4 2 0 2 4 6
2

rudisalam@stis.ac.id 16
Transformasi untuk Hubungan
Nonlinier
Gambar 2.dadalah plotpeluang normaldari
residual.
Tidak ada indikasi kuat departuresyang
substansial dari normalitas.
Kesimpulan ini didukung oleh tingginya koefisien
korelasi antara residual(yangtelah diurutkan)
dengan nilai ekspektasinya dibawah normalitas
yaitu sebesar 0.972>0.918
Jadi,modelRLSadalah tepat untuk datahasil
transformasi.

rudisalam@stis.ac.id 17
Nilai Kritis Koefisien Korelasi
Criticalvaluefor
LevelofSignificance
coefficientsofcorrelation
n 0.1 0.05 0.01
betweenorderedresiduals
5 0.903 0.880 0.826
andexpectedvaluesunder
10 0.934 0.918 0.879
normalitywhen 15 0.951 0.939 0.910
distributionoferrorterms 20 0.960 0.951 0.926
isnormal 25 0.966 0.959 0.939
Tabel lengkap bisa dilihat 30 0.971 0.964 0.947
dijurnal Useofthe 40 0.977 0.972 0.959
CorrelationCoefficients 50 0.981 0.977 0.966
withNormalProbability 75 0.987 0.984 0.976
Plotsoleh Looneydan 100 0.989 0.987 0.982
Gulledge (1985)

rudisalam@stis.ac.id 18
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Varians errortidak sama dan erroryangtidak
normalseringnya muncul bersamasama.
Untuk memperbaiki departureini dari model
RLSdiperlukan transformasi terhadap Y
karena bentuk dan sebaran distribusi dari Y
perlu diubah.
Transformasi terhadap Yjugabisa melinierkan
hubungan regresi yangcurvelinear.

rudisalam@stis.ac.id 19
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Seringnya,ketidaknormalan dan varians yang
tidak sama menjauh dari modelRLSkarena
skewnessyangmeningkat dan variabilitas
distribusi erroryangmeningkat seiring dengan
meningkatnya meanrespon E{Y}.
Misalnya regresi antara pengeluaran rumah
tangga tahunan untuk liburan (Y)dan
pendapatan rumah tangga (X).

rudisalam@stis.ac.id 20
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Hubungan Ydan Xini akan cenderung mempunyai
variasi yangbesar dan skewnesspositif (i.e.ada
beberapa ruta dengan pengeluaran besar yangsangat
ekstrim)untuk rumah tangga dengan incometinggi
dibandingkan rumah tangga dengan incomerendah
yangcenderung secara konsisten menghabiskan
sebesar muchless.
Gambar 3berikut menunjukkan beberapa prototipe
hubungan regresi dimana skewnessdan varians error
meningkat seiring dengan meanrespon E{Y}yang
meningkat.

rudisalam@stis.ac.id 21
Gambar 3
Prototipe pola regresi dengan varians errorunequal
dan transformasi sederhana terhadap Y

rudisalam@stis.ac.id 22
Contoh
Tabel 4.9 plasma
child age level Yi'=
i Xi Yi log(10)*Yi
1 0 13.44 1.1284
2 0 12.84 1.1086
3 0 11.91 1.0759
4 0 20.09 1.3030
5 0 15.60 1.1931
: : : :
: : : :
21 4 4.86 0.6866
22 4 5.10 0.7076
23 4 5.67 0.7536
24 4 5.75 0.7597
25 4 6.23 0.7945
rudisalam@stis.ac.id 23
Gambar 4.a
PlotYdan X
25.00
Hubungan regresi adalah curvelinear
20.00 karena variabilitas semakin besar pada
umur muda dibandingkan umur tua
15.00

10.00

5.00

0.00
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

rudisalam@stis.ac.id 24
Gambar 4.b
PlotY=log(10)*Ydan X
1.4

1.2

0.8

0.6

0.4
Transformasi pada Ytidak hanya mengarah ke hubungan regresi
0.2 yanglinier,tetapi variabilitas pada Xjugamenjadi konstan.
0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

rudisalam@stis.ac.id 25
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Berikut adalah outputregresi antara Ydan X:
Standard
Coefficients Error tStat Pvalue Lower95% Upper95%

Intercept 1.13 0.02 52.44 0.0000 1.09 1.18

XVariable1 0.10 0.01 11.58 0.0000 0.12 0.08

Persamaan regresi fit:


Y ' 1.13 0.10 X

rudisalam@stis.ac.id 26
Gambar 4.c
PlotResidual*100dan X
20

15

10

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
5

10

15

rudisalam@stis.ac.id 27
Gambar 4.d
PlotResidual(x100)dan ExpectedValue(x100)
20

15

10

0
15 10 5 0 5 10 15
5

10

15

rudisalam@stis.ac.id 28
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Nilai koefisien korelasi antara residualterurut
dan nilai ekspektasi dibawah normalitas
adalah 0.981>criticalvaluetabel koefisien
korelasi sebesar 0.959.
Gambar 4.cdan 4.dserta nilai koefisien
korelasi yangtinggi mendukung bukti
ketepatan modelRLSmenggunakan dataY
hasil transformasi.

rudisalam@stis.ac.id 29
Transformasi untuk Ketidaknormalan
dan Varians ErrorTidak Sama
Untuk mengembalikan persamaan regresi
menjadi satuan asalnya,kita ambil antilognya:
Y ' 1.13 0.10 X Y antilog10 1.13 0.10 X

rudisalam@stis.ac.id 30
Transformasi BoxCox
BoxdanCoxtelahmengembangkanprosedur
untukmemilihsuatutransformasidarikeluarga
transformasipangkatterhadapY.
TransformasiBoxCoxbergunadalammengoreksi
skewnessdaridistribusierror,varianserroryang
unequal,danfungsiregresiyangnonlinier.
Bentuk keluarga transformasi pangkat adalah:
Y ' Y
dimana merupakan parameteryangditentukan
dari data.

rudisalam@stis.ac.id 31
Transformasi BoxCox
Keluarga transformasi pangkat ini meliputi
transformasi sederhana seperti berikut:
2 Y 'Y 2

0.5 Y' Y
0 Y ' log e Y
1
0.5 Y'
Y
1
1.0 Y'
Y
rudisalam@stis.ac.id 32
Transformasi BoxCox
Kriteria dalam mendapatkan parameter yang
tepat dari transformasi terhadap Ypada
pendekatan BoxCoxadalah dengan
menentukan nilai yangmeminimumkan SSE
pada regresi linierberdasarkan transformasi
tersebut.
Formula:
Dimana:
K1 Y 1

0 1
W n 1
K 2 Yi
n

K 2 log e Y 0 , K1
i 1 K 2 1
rudisalam@stis.ac.id 33
Transformasi BoxCox
Tahapan transformasi BoxCox:
1. Hitung rataratageometrik dari Y(mencari nilai
K2)
2. Tentukan nilai yangakan digunakan untuk
melakukan transformasi terhadap Ysehingga
diperoleh = .
Nilai dapat dicari dengan terlebih dahulu
menghitung nilai Wseperti pada formula.
3. Regresikan Wterhadap X,kemudian hitung SSE
nya.Nilai yangmenghasilkan nilai SSEterkecil
akan dipilih untuk transformasi.

rudisalam@stis.ac.id 34
Contoh
DataplasmaTabel 4.9, =1
K2 K1 i W X SSE
1 8.52 1 1 12.44 0 77.98
2 11.84 0
3 10.91 0
: : :
23 4.67 4
24 4.75 4
25 5.23 4

rudisalam@stis.ac.id 35
Contoh
=0.5

K2 K1 i W X SSE
0.5 8.52 5.84 1 15.56 0 48.37
2 15.08 0
3 14.31 0

23 8.06 4
24 8.16 4
25 8.73 4

rudisalam@stis.ac.id 36
Contoh
= 0.5
K2 K1 i W X SSE
0.5 8.52 49.71 1 36.15 0 30.56
2 35.83 0
3 35.30 0
: : :
23 28.83 4
24 28.98 4
25 29.79 4

rudisalam@stis.ac.id 37
Contoh
Hasil BoxCoxpada dataplasma
1
SSE
78
Nilai pangkat yangdekat
0.9 70.4 dengan =0.5adalah yang
0.7 57.8
0.5 48.4 tepat.
0.3 41.4 Nilai SSEsebagai fungsi dari
0.1 36.4
0 34.5 cukup stabil pada rentang
0.1 33.1 0sd 1.
0.3 31.2
0.4 30.7
0.5 30.6
0.6 30.7
0.7 31.1
0.9 32.7
1 33.9
rudisalam@stis.ac.id 38
Identifikasi Observasi XyangOutlier
Matriks Hat
Ingat matriks Hat:
H X X X XTT 1

Y Xb X X X XT Y HY
1
T

e I H Y
2 e 2 I H
hii =elemen kei pada
2
ei 1 hii
2
diagonalutama matriks hat

rudisalam@stis.ac.id 39
Identifikasi Observasi XyangOutlier
Matriks Hat
Formula:
X X
1
hii X T
i
T
Xi
1
X
Xi i .1

px1

X i. p 1
Keputusan:
Jika hii >2p/n dataoutlier

rudisalam@stis.ac.id 40
Identifikasi Observasi YyangOutlier
Studentized DeletedResiduals
Formula:
1
n p 1 2
d ei
*
2
SSE 1 hii ei
i

Keputusan:
Jika |di*|>t(np1) outlier

rudisalam@stis.ac.id 41
IdentifyingInfluentialCases
Metode CooksDistance
Formula:
ei2 hii
Di 2
pMSE 1 hii
Keputusan:
Jika nilai persentil dekat dengan 50%atau
lebih maka dikatakan berpengaruh.

rudisalam@stis.ac.id 42

Das könnte Ihnen auch gefallen