Sie sind auf Seite 1von 13

Kerangka Teoritis dan Pengembangan Hipotesis

Manajemen Penelitian Bisnis


Definisi Operasional, Skala, Reliabilitas dan Validitas

KELOMPOK 10
S411308008 Desy Sanggar Pratiwi
S411308013 Edi Mardani
S411308026 Murtiningsih

MAGISTER MANAJEMEN
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS SEBELAS MARET
SURAKARTA
2014
Page 0

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

DEFINISI OPERASIONAL, SKALA, RELIABILITAS DAN VALIDITAS


Ringkasan Mata Kuliah

Dalam skala reflektif, item (keseluruhan item) diharapkan untuk dapat


terkorelasi. Skala formatif digunakan ketika membangun pandangan yang jelas
indikatornya. Skala yang berisi item yang tidak selalu berhubungan disebut skala
formatif.

PERINGKAT SKALA
1.

Skala Dikotomi, digunakan untuk memperoleh respons dari responden dengan


memberikan jawaban ya atau tidak.

2.

Skala Kategori, digunakan untuk memperoleh respon tunggal dari responden


atas pilihan respon yang disediakan.

3.

Skala Diferensial Semantik, digunakan untuk memperoleh respon terhadap


objek tertentu dengan melakukan plotted untuk mendapatkan ide responden.

4.

Skala Numerikal, digunakan untuk memperoleh respon dengan memberikan


skala berupa angka dengan kata sifat berkutub kedua ujungnya.

5.

Skala Peringkat Terperinci, digunakan untuk dengan dasar skala numerical


dengan titik panduan sesuai dengan keperluan dalam penelitian.

6.

Skala Likert, didesain untuk menelaah seberapa kuat subjek setuju atau tidak
setuju dengan pernyataan pada skala 5 titik.

7.

Skala Peringkat Jumlah Konstan atau Tetap, didesain dimana responden


diminta untuk mendistribusikan sejumlah poin yang diberikan ke berbagai
item seperti dalam contoh di bawah. Skala jumlah konstan atau tetap (fixed or
constan sum scale) lebih bersifat skala ordinal (ordinal scale).

8.

Skala Stapel, secara simultan mengukur arah dan intensitas sikap terhadap
item yang dipelajari. Karakteristik minat terhadap studi ditempatkan di bagian
tengah dengan jarak skala numerik, katakanlah, dari +3 ke -3, pada tiap sisi
item seperti diilustraikan di bawah. Skala ini memberikan ide mengenai
seberap dekat atau jauh respons individu terhadap stimulus, sebagaimana
ditunjukkan dalam contoh berikut. Karena skala ini tidak memiliki titik nol
absolut, skala ini adalah skala interval.

Page 1

Kerangka Teoritis dan Pengembangan Hipotesis

Kelompok 10

1
OBSERVASI
Identifikasi
bidang
Permasalahan

6
PENGUMPULAN,
ANALISIS DAN
INTERPRETASI
DATA
3
PENDEFINISIAN
MASALAH
Pembatasan
masalah

4
KERANGKA
TEORI
Variabel sdh
didefisikan
dan diberi
label

6
RANCANGAN
RISET

7
PENGAMBILAN
KESIMPULAN
DEDUCTIVE

YA

2
PENGUMPULAN
DATA AWAL

5
PERUMUSAN
HIPOTESIS

TIDAK

Interview
Studi Pustaka

9
PPENULISAN
LAPORAN

Page 2

10
PRESENTASI
LAPORAN

11
PENGAMBILAN
KEPUTUSAN
MANAJERIAL

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

RINCIAN STUDI
Tujuan studi

PERNYATAAN MASALAH

Eksplorasi
Deskripsi
Pengujian
hipotesis

Jenis investigasi

Membuktikan :
- Hubungan kausal
- Korelasional
- Perbedaan
kelompok,
peringkat, dan
sebagainya

Tingkat intervensi
peneliti
Minimal : mempelajari peristiwa
sebagaimana
adanya.
Manipulasi
dan/atau kontrol
dan/atau simulasi.

PENGUKURAN
Konteks studi

Direncanakan
Tidak
direncanakan

Pengukuran dan
ukuran
Definisi
operasional item
(ukuran)
Skala
Kategori
Sandi

ANALISIS DATA

1.Feel for
data

2.Goodness
of data

Unit analisis
(populasi yang
diteliti)
Individu
Pasangan (Dyads)
Kelompok
Organisasi
Mesin
Dan sebagainya

Desain sampel

Probabilitas /
nonprobabilitas
Ukuran sampel (n)

Page 3

Horizon waktu

Metode
pengumpulan
data

Satu kali (one-shot)


atau lintas bagian
(cross-sectional)
Longitudinal

Pengamatan
Wawancara
Kuesioner
Pengukuran fisik
Unobtrusive

3.Pengujian
hipotesis

Kerangka Teoritis dan Pengembangan Hipotesis

9.

Kelompok 10

Skala Peringkat Grafik, memberikan gambaran grafis yang membantu


responden untuk menunjukkan pada skala peringkat grafik (graphic rating
scale) jawaban mereka untuk pertanyaan tertentu dengan menempatkan tanda
pada titik yang tepat pada garis, seperti dalam contoh berikut. Ini merupakan
skala ordinal, meskipun contohb erikut mungkin membuatnya terlihat seperti
skala interval.

10. Skala Konsenus, dibuat berdasarkan konsensus, di mana panel juri memilih
item tertentu, mengukur konsep yang menurut mereka releva. Item dipilih
terutama berdasarkan ketepatan atau relevansinya dengan konsep. Skala
konsensus (consensus scale) tersebut dibuat setelah item terpilih diperiksa dan
diuji validitas dan keandalannya.
11. Skala Lainnya, ada juga beberapa metode penskalaan yang sudah sangat maju
atau rumit (advance) seperti penskalaan multidimensional (multidimensional
scaling), di mana objek, orang, atau kedua-duanya, diskalakan secara visual,
dan dilakukan analisis gabungan (conjoint). Hal tersebut memberikan gambar
visual

mengenai

hubungan

yang

ada

dianara

dimensi

sebuah

konsep (construct).

RANKING SCALES
Ranking scales (skala peringkat) digunakan untuk memanfaatkan
kecenderungan antara dua atau lebih objek-objek atau item. Namun, peringkat
tersebut tidak dapat memberikan petunjuk pasti untuk beberapa jawaban yang
dicari. Sebagai contoh, katakanlah ada empat lini produk dan manajer mencari
informasi yang akan membantu memutuskan mana produk yang harus
mendapatkan perhatian yang besar. Mari kita juga berasumsi bahwa 35%
responden memilih produk pertama, 25% kedua, dan 20% memilih masingmasing produk tiga dan empat sebagai pilihan bagi mereka. Manajer tidak bisa
kemudian menyimpulkan bahwa produk pertama adalah yang paling disukai,
karena 65% dari responden tidak memilih produk itu. Metode alternatif yang
digunakan

adalah paired

comparisons (perbandingan

berpasangan), forced

choice (pilihan paksa), dan comparative scale (skala perbandingan).

Page 4

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

1. Paired comparisons
Skala perbandingan berpasangan digunakan ketika, di antara
sejumlah kecil objek, responden diminta untuk memilih antara objek pada
waktu yang bersamaan. Hal ini membantu untuk menilai kecenderungan
pilihan. Jika, misalnya, dalam contoh sebelumnya, selama perbandingan
berpasangan, responden secara konsisten menunjukkan pilihan untuk produk
yang satu atas produk dua, tiga dan empat, manajer andal dapat memahami
produk yang menuntut perhatian penuh nya. Namun, karena jumlah objek
yang akan dibandingkan meningkat, begitu juga jumlah perbandingan
berpasangan. Jumlah pilihan berpasangan untuk objek n akan menjadi [(n) (n1) / 2]. Semakin besar jumlah objek atau stimulus, semakin besar jumlah
perbandingan berpasangan disajikan kepada responden, dan semakin besar
kelelahan responden. Oleh karena itu, perbandingan berpasangan adalah
metode yang baik jika jumlah stimulus yang disajikan adalah kecil.
2. Forced choice
Forced choice memungkinkan responden untuk mengurutkan objek
dan membandingkan satu sama lain, di antara alternatif yang disediakan. Ini
adalah mudah bagi responden, terutama jika jumlah pilihan untuk
digolongkan terbatas jumlahnya.
3. Comparative scale
Skala komparatif menyediakan patokan atau titik acuan untuk
menilai sikap terhadap objek saat ini, peristiwa, atau situasi yang diteliti.
Skala penilaian yang digunakan untuk mengukur konsep perilaku. Skala
peringkat digunakan untuk membuat perbandingan atau peringkat variabel
yang telah disadap pada skala nominal.

DIMENSI SKALA INTERNASIONAL


Penelitian terbaru menunjukkan bahwa orang-orang dari berbagai negara
berbeda dalam hal kecenderungan mereka untuk menggunakan ekstrem dari skala
rating dan untuk merespon dengan cara yang diinginkan. Temuan ini

Page 5

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

menggambarkan bahwa menganalisis dan menafsirkan data yang dikumpulkan di


beberapa negara merupakan suatu usaha yang sangat menantang.
Selain kepekaan terhadap definisi operasional konsep dalam budaya lain,
masalah scaling juga perlu dibahas dalam lintas budaya penelitian. Budaya yang
berbeda bereaksi secara berbeda juga terhadap masalah scaling. Misalnya, titik
lima atau skala tujuh poin dapat membuat perbedaan di AS, tetapi bisa di respon
secara berbeda oleh subyek di negara lain.

KETEPATAN PENGUKURAN
Sekarang kita telah melihat bagaimana mendefinisikan variabel secara
operasional dan menerapkan teknik penskalaan yang berbeda, penting untuk
memastikan bahwa instrumen yang kami kembangkan untuk mengukur suatu
konsep tertentu memang akurat mengukur variabel, dan bahwa, pada
kenyataannya, kita benar-benar mengukur konsep yang kami tetapkan untuk
mengukur. Penggunaan instrumen yang lebih baik akan memastikan akurasi lebih
pada hasil, yang pada gilirannya akan meningkatkan kualitas ilmiah penelitian.
Mari kita memeriksa bagaimana kita dapat memastikan bahwa langkahlangkah yang dikembangkan adalah yang cukup baik. Pertama, analisis item
tanggapan terhadap pertanyaan-pertanyaan variabel yang dilakukan, dan
kemudian reliabilitas dan validitas dari langkah-langkah ditetapkan.

Item analysis
Analisis item dilakukan untuk melihat apakah item dalam instrumen
termasuk sana atau tidak. Dalam analisis item, berarti antara kelompok skor tinggi
dan kelompok skor rendah diuji untuk mendeteksi perbedaan yang signifikan
melalui t-nilai. Item dengan tinggi t-nilai (tes yang mampu mengidentifikasi item
yang sangat diskriminatif dalam instrumen) tersebut kemudian dimasukkan dalam
instrumen. Setelah itu, tes untuk keandalan instrumen dilakukan dan validitas
ukuran dibuat.
Sangat singkat, reliabilitas adalah tes tentang bagaimana instrumen alat
ukur dapat konsisten apapun konsepnya dalam mengukur. Sekali lagi reliability

Page 6

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

adalah indikator apakah sebuah pertanyaan jika ditanyakan berulang-ulang kali


baik kepada orang yang sama maupun kepada orang lain jawabannya akan
cenderung sama (konsisten/berulang).Validitas adalah tes dari seberapa baik
sebuah alat yang dikembangkan untuk mengukur konsep tertentu yang ditujukan
untuk mengukur. Dengan kata lain, validitas berkaitan dengan apakah kita
mengukur konsep yang tepat, dan kehandalan dengan stabilitas dan konsistensi
pengukuran. Validitas dan keandalan ukuran membuktikan kekuatan ilmiah yang
telah dilakukan untuk studi penelitian.

VALIDITAS
Validitas berasal dari kata validity yang artinya sejauhmana ketepatan
dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Kita akan
peduli tentang masalah keaslian penyebab dan akibat hubungan (validitas
internal), dan generalisasi terhadap lingkungan eksternal (validitas eksternal).
Beberapa jenis uji validitas digunakan untuk menguji kebaikan ukuran dan penulis
menggunakan istilah yang berbeda untuk menunjukkan mereka. Demi kejelasan,
kita kelompokan uji validitas dengan tiga judul: content validity (validitas
isi), criterion-related validity (kriteria yang berhubungan dengan validitas),
dan construct validity (validitas konstruk).
1. Content validity
Content validity adalah validitas yang berkaitan dengan baik atau
buruknya sampel yang diambil dari populasi. Validitas isi memastikan bahwa
mengukur mencakup set yang memadai dan representatif item yang
memanfaatkan konsep tersebut. Semakin banyak item skala mewakili domain
atau semesta dari konsep yang diukur, semakin besar validitas konten. Untuk
dimasukkan ke dalam cara yang berbeda, validitas isi adalah fungsi dari
seberapa baik dimensi dan elemen dari sebuah konsep yang telah digambarkan.
Face validity atau validitas rupa adalah validitas yang berhubungan
dengan apa yang kelihatan dalam mengukur sesuatu, tetapi bukan terhadap apa
yang seharusnya akan diukur.

Page 7

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

2. Criterion-related validity
Validitas kriteria terkait dibuat ketika mengukur membedakan
individu pada kriteria yang diharapkan diprediksi. Hal ini dapat dilakukan
dengan membentuk concurrent validity (validitas konkuren) atau predictive
validity (validitas prediktif).
Concurrent validity adalah validitas yang berkaitan dengan hubungan
(korelasi) antara skor dalam item instrumen dengan kinerja, atau objek
penelitian yang lain.
Predictive validity adalah validitas perkiraan yang berkenaan dengan
hubungan antara skor suatu alat ukur dengan kinerja atau seseorang di masa
mendatang berdasarkan pengukuran awal. Validitas prediksi adalah validitas
instrumen yang diharapkan bisa memiliki hubungan dengan hasil yang
diharapkan dari instrumen yang dibuat. Validitas prediktif menunjukkan
kemampuan alat ukur untuk membedakan antara individu dengan mengacu
pada kriteria masa depan.
3. Construct validity
Validitas konstruk adalah validitas yang berkenaan dengan kualitas
dalam aspek psikologis tentang apa yang diukur oleh suatu pengukuran serta
terdapat evaluasi bahwa suatu konstruk tertentu itu bisa menyebabkan kinerja
dan hasil yang baik dalam pengukuran. Validitas konstruk membuktikan
seberapa baik hasil yang diperoleh dari penggunaan ukuran sesuai dengan
teori-teori sekitar yang tes dirancang. Hal ini dinilai melalui convergent
validity (validitas konvergen) dan discriminant validity (validitas diskriminan).
Convergent validity adalah sejauh mana operasi ini mirip dengan
(menyatu pada) operasi lain yang secara teoritis juga harus sama dengan.
Validitas konvergen akan dibuat bila nilai yang diperoleh dengan dua
instrumen yang berbeda mengukur konsep yang sama sangat berkorelasi.
Discriminant validity dibuat bila, berdasarkan teori, dua variabel yang
diprediksi akan berkorelasi, dan skor yang diperoleh dengan mengukur mereka
memang secara empiris ditemukan begitu. Validitas dengan demikian dapat

Page 8

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

dibentuk dalam berbagai cara. Beberapa cara di mana bentuk-bentuk di atas


validitas dapat dibentuk adalah melalui:
a. Korelasional analisis (seperti dalam kasus validitas konkuren dan validitas
prediktif atau validitas konvergen dan diskriminan)
b. Analisis faktor, teknik multivariat yang menegaskan dimensi konsep yang
telah didefinisikan secara operasional, serta menunjukkan yang mana dari
item yang paling tepat untuk setiap dimensi.
c. Sifat multi, multi metode matriks korelasi berasal dari konsep pengukuran
dengan berbagai bentuk dan metode yang berbeda, selain itu membangun
kekokohan pengukuran.
Singkatnya, kebaikan ukuran dibentuk melalui berbagai jenis validitas
dan reliabilitas. Hasil penelitian apapun hanya dapat sama baiknya dengan
tindakan yang memanfaatkan konsep-konsep dalam kerangka teoritis (seperti
pada bagan Goodness of Measures).

RELIABILITY
Keandalan dari suatu pengukuran menunjukkan sejauh mana hal itu tanpa
bias (bebas kesalahan) dan karenanya menjamin pengukuran yang konsisten
sepanjang waktu dan di berbagai item dalam instrumen. Dalam kata lain,
keandalan ukuran adalah indikasi dari stabilitas dan konsistensi dengan instrumen
ukuran konsep tersebut dan membantu untuk menilai "kebaikan" dari ukuran.

Stabilitas Tindakan
Kemampuan ukuran untuk tetap dari waktu ke waktu yang sama
merupakan indikasi dari stabilitas dan kerentanan yang rendah terhadap perubahan
situasi. Ini membuktikan "kebaikan" karena konsep ini secara stabil diukur, tidak
peduli ketika hal itu dilakukan. Dua pengujian kestabilan adalah test-retest
reliability (reliabilitas tes ulang) dan parallel-form reliability (reliabilitas bentuk
paralel).

Page 9

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

Pengujian Ketepatan Pengukuran: Bentuk Keandalan dan Validitas

1. Test-retest reliability
Test-tes ulang koefisien reliabilitas diperoleh dengan pengulangan
ukuran yang sama pada kesempatan kedua disebut uji reliabilitas tes ulang.
Ini cara paling sederhana menguji reliabilitas sesuai dengan definisinya di
atas, yakni dengan cara mencoba kuisioner yang sama kepada responden yang
sama lebih dari satu kali (misal 2x) dalam waktu yang berbeda (jeda waktu
tertentu). Jadi nilai reliabilitasnya ditentukan nilai korelasi item-item yang
sama untuk periode survey yang berbeda.

2. Parallel-form reliability
Ketika tanggapan pada dua set pengukuran sebanding, terbentuk
konstruk yang sama dan sangat berkorelasi, maka kita memiliki reliabilitas
bentuk paralel.

Page 10

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

Internal consistency of measures


Konsistensi internal dari tindakan pengukuran merupakan indikasi dari
homogenitas item dalam ukuran yang menekan susunannya. Dengan kata lain,
item harus "bersatu sebagai satu set," dan mampu secara independen mengukur
konsep yang sama sehingga responden melampirkan keseluruhan arti yang sama
untuk setiap item. Hal ini dapat dilihat dengan memeriksa apakah item dan
himpunan bagian dari berbagai item dalam alat ukur yang berkorelasi tinggi.
Konsistensi dapat diperiksa melalui interim consistency reliability (reliabilitas
konsistensi sementara) dan split-half reliability tests (reliabilitas split-setengah
tes).
1. Interim consistency reliability
Interim consistency reliability adalah uji konsistensi jawaban
responden untuk semua item di dalam ukuran. Pada tingkatan bahwa item
adalah ukuran independen dari konsep yang sama, mereka akan berkorelasi
satu sama lain. Tes yang paling populer untuk reliabilitas konsistensi interim
adalah koefisien alpha Cronbach.
2. Split-half reliability
Split-half reliability mencerminkan korelasi antara dua bagian dari
instrumen. Perkiraan yang akan bervariasi tergantung pada bagaimana item
dalam ukuran dibagi menjadi dua bagian. Split-setengah keandalan mungkin
lebih tinggi dari alpha Cronbach hanya dalam keadaan dari sana menjadi
lebih dari satu dimensi yang mendasari respon terpilih oleh ukuran dan ketika
kondisi lain tertentu terpenuhi juga. Oleh karena itu, dalam hampir semua
kasus, alpha Cronbach dapat dianggap sebagai indeks yang sangat cukup
dari Interim consistency reliability.

PENGUKURAN SKALA REFLEKTIF VS FORMATIF


What is reflective scale?
Dalam skala yang reflektif, semua item diharapkan berkorelasi. Tidak
seperti item yang digunakan dalam skala formatif, yang akan didiskusikan,
masing-masing item dalam skala reflektif diasumsikan untuk berbagi secara

Page 11

Definisi Operasional, Skala, Reliabilitas dan Validitas

Kelompok 10

umum. Oleh karena itu, peningkatan nilai construct akan diterjemahkan ke dalam
peningkatan nilai untuk semua item yang mewakili construct.

What is a formative scale and why do the items of a formative scale not
necessarily hang together?
Sebuah skala formatif digunakan ketika membangun sesuatu ditinjau
sebagai kombinasi penjelas dari indikator tersebut. Ambil Job Description Index,
suatu ukuran gabungan yang dimaksudkan untuk mengevaluasi kepuasan kerja.
Langkah ini meliputi lima dimensi: jenis pekerjaan (18 item), kesempatan untuk
promosi (9 item), kepuasan terhadap pengawasan (18 item), rekan kerja (18 item),
dan pembayaran (9 item).
Lima dimensi dijabarkan ke dalam 72 elemen yang dapat diamati dan
terukur seperti "Kesempatan Baik untuk kemajuan", "promosi Reguler", "Cukup
kesempatan baik untuk promosi", "Penghasilan yang memadai untuk biaya
normal",

"Sangat

dibayar

tinggi",

dan

"Memberikan

rasa

prestasi

".

Singkatnya, Job Description Index meliputi lima dimensi dan 72 item. Sebuah
skala yang berisi item yang tidak selalu berhubungan disebut skala formatif.

Page 12

Das könnte Ihnen auch gefallen