A. Pendahuluan
Dalam sebuah
penelitian, salah satu segi yang penting adalah penggunaan instrument
(alat pengukuran). Sebab instrument pada hakikatnya adalah untuk
mengungkapkan fakta-fakta dari data yang diharapkan. Kemudian instrument dipergunakan
juga untuk melaporkan data dan beberapa informasi, atau kesimpulan yang benar
dari kegiatan penelitian.
Menurut James A.
Black dan Dean J. Champion menyebutkan, bahwa : “Alat pengukuran
setidak-tidaknya mempunyai dua perangkat penting yang menjadi perhatian para
ilmuan sosial, yakni kesahihan (validity), dan keterandalan (reliability)”.[1]
Dengan demikian
dapat dipahami, bahwa suatu instrumen dikatakan valid atau sahih apabila instrumen tersebut mampu
mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang tepat dari
suatu variabel yang diteliti. Misalnya timbangan emas dapat mengukur berat emas,
atau meteran dapat digunakan untuk mengukur tinggi badan.
Kemudian, suatu
instrumen dikatakan reliable apabila alat ukur yang dipakai dapat
dipercaya atau handal. Dalam konteks pengukuran, reliabilitas menyangkut
ketepatan alat ukur. Dalam artian alat ukur tersebut stabil, dapat dihandalkan
(dependability), dan dapat diramalkan (predictability). Menurut
Syaifuddin Azwar “Reliabilitas adalah tingkat kepercayaan hasil suatu
pengukuran. Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang
mampu memberikan hasil ukur yang terpercaya, disebut reliabel”.[2]
Jadi sifat
reliabel (terandal) dari suatu alat ukur berhubungan dengan kemampuan alat ukur
tersebut memberikan hasil yang konsisten. Misalnya, ketika kita melakukan
pengukuran tinggi benda seperti tinggi meja digunakan alat ukur jengkal tangan.
Hasilnya lima jengkal pada pengukuran pertama, ukuran yang sama juga akan
didapatkan pada pengukuran berikutnya. Artinya alat ukur yang dipakai adalah
valid dan juga reliabel. Akan tetapi bila objek yang diukur adalah gedung
berlantai limabelas, mungkinkah jengkal tangan akan memberikan hasil yang
konsisten? Kemungkinan besar tidak. Ini berarti alat pengukurannya valid,
tetapi tidak reliabel.
Sehubungan dengan
pokok pemikiran tersebut diatas, maka dalam makalah ini penulis akan membahas “Instrument
Validity dan Reliability”, sehingga kita mendapatkan gambaran yang
jelas tentang hal tersebut.
B. Validity (
Kesahihan)
1.
Pengertian
Menurut
Kamus Besar Bahasa Indonesia “ Validity
(validitas) adalah sifat benar menurut bahan bukti yang ada, logika berfikir,
atau kekuatan hukum; sifat Valid: kesahihan: menentukan suatu tes dengan tepat
memang sukar”.[3]
Jack
R. Fraenkel dan Norman E. Wallen, mengemukakan bahwa “ Validity adalah gambaran kesimpulan yang benarberdasarkan data yang
diperoleh melalui penggunaan instrumen”.[4]
Selltiz,
(dkk) dalam James A. Black dan Dean J. Champion menyatakan, bahwa “ Kesahihan
sebuah alat pengukuran didefenisikan sebagai perangkat ukuran yang
memperkenankan peneliti untuk menyatakan bahwa alat pengukur apa yang ia
katakan akan mengukur”.[5]
Dari
pengertian tersebut diatas dapat dipahami, bahwa validitas (kesahihan)
meruapakan hal yang sangat penting dalam mempersiapkan sebuah instrumen. Sebab
instrumen pada hakikatnya adalah untuk memperoleh informasi dan melaporkan data
yang benar tentang sesuatu yang diteliti. Sehubungan dengan itu, maka validitas
dijadikan sebagai bahan penuh arti, dan memberi laporan secara spesifik
berdasarkan data yang terkumpul. Jadi ketepatan sebuah pengukuran adalah proses
pengumpulan bukti-bukti pendukung, sehingga sampai kepada suatu kesimpulan yang
akurat, penuh arti, dan bermamfa’at.
Dengan
demikian dapat disimpulkan, bahwa suatu instrumen dikatakan sahih apabila
relevan antara alat ukur dengan apa yang akan diukur. Misalnya dalam suatu tes
mengukur sifat X. Alat pengukuran dikatakan sahih apabila pada tes tersebut
benar-benar mengukur sifat X. Akan tetapi apabila mengukur sifat lain yang
bukan sifat X, sementara alat pengukuran yang dipakai adalah untuk mengukur
sifat X, maka alat pengukuran tersebut tidak sahih, dan begitu juga sebaliknya.
2. Jenis-Jenis Kesahihan
Kesahihan
sebuah ukuran bisa ditinjau dari beberapa perspektif yang berbeda. Setidaknya
terdapat tiga jenis kesahihan, yaitu konten, konkuren (prediktif), dan
konstruk.
Secara
umum, kesahihan sebuah tes berstandar pada dua faktor penting, yaitu logika dan
pembuktian statistik. Masing-masing dari tiga jenis kesahihan diatas selalu
menggunakan logika dan verifikasi statistik sebagai cara untuk menetapkan
derajat kesahihan dari alat pengukuran.
a. Content-related evidence of validity
Content
related evidence of validity
adalah kesahihan dari instrumen yang menjadi pengukur sebuah penelitian.
Sejauhmana sebuah instrumen bisa memberikan pemahaman dan tingkat ketepatannya.
Apakah yang digambarkan sebuah variabel dapat diterima dengan logis ?,
bagaimana sampel dari soal-soal atau pertanyaan memadai untuk dapat menjadi
sebuah penilaian? Apakah polanya benar ? Semuanya itu menunjukkan bahwa antara content
dengan polanya harus bersesuaian dengan variabel dan sampel pokok penelitian.
Content validity disebut juga
dengan validitas isi, yaitu suatu model yang digunakan dalam menentukan
validitas suatu alat ukur, atau tes dengan cara menilai sejauhmana item-item
yang dibuat sesuai dengan tingkat tingkah laku yang akan diukur, atau sejauh
isi alat ukur tersebut mewakili semua aspek yang dianggap sebagai aspek
kerangka konsep. Jadi, validitas isi mempersoalkan apakah isi dari suatu alat
ukur (bahannnya, topiknya, substansinya) cukup representatif, maka dalam
validitas isi dipandu dengan pertanyaan “ apakah isi atau substansi dari suatu
alat ukur merupakan representatif dari isi dan sifat-sifat yang ingin diukur?”.
Seorang peneliti ingin meneliti tentang “ pengaruh program ilmu
pasti baru terhadap kemampuan matematika kelas 5 (lima)”. Selama penyelesaian
dari program ini, peneliti berharap siswa mampu menyelesaikan permasalahan kata
dari sejumlah tipe atau bentuk yang berbeda dengan benar. Untuk mengukur
kemampuan matematika siswa, peneliti merencanakan memberikan siswa latihan
matematika dengan 15 (lima belas) soal. Pada tes ini siswa perlu menggambarkan
tingkatan-tingkatan yang dibutuhkan dari kemampuan mereka untuk menyelesaikan
permasalahan tersebut. Sebab itu, pelaksanaan pada alat-alat dalam hal ini
(pengujian matematika) akan memberikan
bukti yang valid dari kemampuan matematika siswa ini untuk kelas/ tingkatan
pada instrumen diberikan contoh yang cukup dari bentuk permasalahan yang
dipelajari dalam program ini. Jika tes hanya mencakup permasalahan yang
mudah, sulit, lama waktunya, dan
permasalahan mengurangi, atau tes tidak mewakili, maka tidak akan memberikan
informasi dari laporan yang valid.
Kunci dasar dalam content-related evidence, berkisar
tentang kecukupan sampel dalam instrumen, seperti pada tes prestasi, hanya
menyajikan sebuah sampel dari bermacam permasalahan yang dipertanyakan. Content
validation adalah acuan/ pertimbangan dari pembagian permasalahan, jika
kandungan instrumen dapat mewakili
sampel yang ada disekitar kandungan tersebut.
Bentuk lain untuk kadar kevalidan harus dilakukan penyusunan
atau pembentukan instrumen yang dapat mencatat secara jelas tentang sesuatu,
seperti bentuk ukur, waktu yang dibutuhkan, ketepatan bahasa, kejelasan
petunjuk, dan lain-lain. Hal tersebut tidak akan berarti, apabila diberikan
pertanyaan pada sebuah instrumen dalam tes bahasa Inggris kepada anak yang
minim bahasa Inggrisnnya. Oleh karena itu, perlu dipahami bahwa pertanyaan yang
akan diberikan harus sesuai dengan karakteristik sampel yang diinginkan.
Bagaimana seseorang akan memperoleh keakuratan instrumen sebagai
alat ukur? Langkah umum untuk memperoleh ini, seseorang harus memperhatikan
kadar isi atau rancangan instrumen serta menela’ah tepat atau tidaknya.
Seseorang tidak harus seperti orang lain, tetapi harus berprinsip sebagai
seorang individu yang bisa diharapkan, cenderung untuk memberikan penilaian
kemampuan tetang keterukuran instrumen. Sebagai langkah umum yang dapat
dipedomani adalah : (1). Peneliti menyalin defenisi dari apa yang akan diukur,
(2). Peneliti menulis defenisi dan gambaran sampel yang dituju untuk satu
penilaian atau lebih, (3). Penilaian dilihat pada defenisi; mengenal soal-soal
atau pertanyaan pada instrumen dan membubuhkan penandaaan diakhir soal atau pertanyaan.
Dalam hal ini yang perlu mendapat penandaan adalah soal yang dirasa tidak dapat
mengukur satu pokok permasalahan atau lebih, serta menandai soal pada setiap
pokok pembahasan yang tidak dinilai/ diujikan. Kemudian, penilaian juga menguji
ketepatan bentuk instrumen. (4). Peneliti menyalin dan memeriksa kembali setiap
soal atau pertanyaan yang akan diujikan, (5). Semua soal dan pertanyaan
disetujui dalam instrumen dan mengindentifikasikan jumlah keseluruhan dari
soal-soal, apakah cukup mewakili bagian isi dari variabel yang diukur.
Untuk menggambarkan bagaimana peneliti mencoba untuk membuat
kesahihan instrumen sebagai alat ukur, dapat diperhatikan contoh berikut:
Contoh 1 :
Peneliti meneliti kemampuan siswa untuk
menggunakan laporan-laporan yang mereka perdapat pada waktu dulu, peneliti
memberikan defenisi: “untuk laporan yang dapat siswa pakai dari perolehan
imformasi sebelumnya, mereka harus mampu untuk:
a.
Melukiskan kesimpulan yang tepat (secara lisan atau tertulis) berdasarkan
informasi-informasi yang diberikan.
b. Mengindentifikasikan satu kesimpulan logis
atau lebih beserta sebuah penjelasan (point of view)
c. Menyajikan bahwa ide-ide tersebut adalah
setara, sama, tidak berhubungan atau berlawanan.
Dari hal diatas,
bagaimana peneliti bisa bisa mendapatkan bukti-bukti seperti itu? Peneliti
memutuskan untuk mempersiapkan tes yang berisikan banyak pertanyaan untuk
siswa-siswa untuk jawaban. Jawaban-jawaban merupakan bukti yang mereka
butuhkan. Ada tiga buah contoh dari bermacam-macam pertanyaan peneliti berikan.
Satu rancangan untuk mendapatkan setiap tiga buah tipe dari bukti yang
disebutkan diatas.
1. Jika
A besar dari B, dan B besar dari C, maka:
a.
A harus besar dari C
b.
C harus kecil dari A
c.
B harus kecil dari A
d.
Semua yang diatas benar
2. Hal-hal yang meyakini peningkatan pemakaian
konsumen menjadi cara yang benar untuk mendorong ekonomi akan menunjang:
a. Peningkatan-peningkatan atau rata-rata
permintaan
b.
Persediaan menipis
c. Penurunan pemasukan (income)
3. Bandingkan pengeluaran yang dikeluarkan
pemerintahan untuk state selama tahun-tahun yang lalu:
a. Hutang gaji
b. Keamanan
c. Pelayanan sosial
Sekarang perhatikan
setiap pertanyaan dan yang berhubungan dengan pokok bahasan didapatkan, atau
diukur. Apakah setiap pertanyaan dirancang permasalahannya, jika tidak kenapa?
Contoh 2:
Disini apa yang
dirancang peneliti untuk pengukuran kemampuan siswa untuk menerangkan
kemungkinan terjadi?
Derection : Ada beberapa fakta
Fakta
W :
Pekemah mulai menyalakan api untuk memasak makanan dimusim kemarau/
waktu ada angin didalam hutan.
Fakta
X : Api
mulai menyala pada rumput yang kering disekitar perkemahan
Fakta
Y : Sebuah
rumah di dalam hutan terbakar
Terangkan
kemungkinan penyebab rumah terbakar (fakta Y). Sedangkan fakta W dan fakta X
bisa membantu menerangkannya.
a Ya. Fakta W dan X kemungkinan penyebab (
karena keduanya menggambarkan hubungan).
b. Ya. Kedua W dan X berguna, tak satupun
penyebab lain yang mengakibatkannya.
c. Tidak. Sebab Cuma satu fakta X atau Y yang
menjadi penyebab.
d. Tidak. Karena tak satupun W atau X yang
menjadi penyebab.
Perhatikan
pertanyaan dan pokok pembahasan yang dirancang untuk diukur, apakah itu
mengukur objektifnya? Jika tidak mengapa? Lakukanlah kembali seperti ini, untuk
perolehan bukti-bukti sampel. Contoh diatas pendukung penilaian, dimana
soal-soal mengukur apa-apa yang diinginkan, seperti halnya dalam proses
memperoleh keakuratan dari pemilihan alat/ instrumen. Namun satu hal yangperlu
dipahami, bahwa kualitas dari penilaian selalu merupakan acuan penting dan
karakteristik dari sampel yang diinginkan harus diketahui.
b. Criterion-related evidence of
validity
Criterion-related evidence of validity
(validitas keriteria) adalah keterangan yang diperoleh sama dari penggunaan
instrumen dengan instrumen yang lainnya, atau ukuran yang satu dengan yang
lainnya.
Untuk
mendapatkan keriteria dari kesahihan dari instrumen, biasanya peneliti
membandingkan antara suatu instrumen hasil satu kesatuan yang valid dengan
pengukuran tersendiri. Dengan demikian dapat dipahami, bahwa validitas
keriteria adalah validats yang dilihat dengan membandingkan suatu keriteria
atau variabel yang diketahui atau yang dipercaya dapat digunakan untuk mengukur
suatu atribut tertentu. Jika skor atau skala yang diukur dibandingkan dengan
satu, atau lebih keriteria (variabel) yang dianggap dapat mengukur apa yang
ingin diukur, maka yang dikerjakan adalah menetapkan validitas dari alat ukurnya.
Dalam
validitas berdasrkan keriteria, umumnya alat ukur yang akan diuji validitasnya
disebut sebagai prediktor. Statistik yang diperlukan dalam pengujian valitas
ini adalah koefisien korelasi antara skor tes sebagai prediktor, dan skor suatu
kriteria yang relevan.
Validitas berdasarkan kriteria dapat dibedakan atas
dua macam, yaitu: (1). Validitas prediktif, (2). Validitas konkuren
a. Predictive
validity ( Validitas prediktif)
Alat
ukur yang dirancang oleh peneliti, sering kali ditujukan untuk memprediksi apa
yang akan terjadi dimasa yang akan datang. Tingkat suatu alat ukur yang dibuat
dapat dengan akurat meramalkan suatu kriteria dimasa yang akan datang. Inilah
yang disebut dengan predictive validity. Jadi, suatu alat ukur dikatakan
valid jika hasil dari pengukuran ini sesuai dengan tingkah laku atau
gejala-gejala yang diramalkan.
Contoh “
ujian seleksi masuk perguruan tinggi”. Bila ternyata terdapat korelasi yang
tinggi antara ujian seleksi masuk perguruan tinggi dengan indeks prestasi
belajar mahasiswa, maka soal ujian seleksi memiliki validitas prediktif.
Artinya alat ukur tersebut dapat memprediksi apa yang akan terjadi dimasa yang
akan datang.
b. Concurrent
validity (validitas konkuren).
Validitas
konkuren atau valitas pada sa’at bersamaan adalah pengujian validitas, suatu
alat ukur dengan melihat sejauhmana kesulitan antara hasil ukur skala tersebut
dengan hasil ukur instrumen lain yang sudah teruji kualitasnya, atau dengan
ukuran-ukuran yang dianggap dapat menggambarkan aspek-aspek yang telah diukur.
Validitas ini digunakan dalam membuat alat ukur baru, karena alat ukur lama
untuk variabel yang sama kurang praktis.
Untuk
menguji kesesuaian hasil ukur skala (alat ukur baru) dengan hasil ukur kriteria
(alat ukur lama), maka kedua alat ukur tersebut diterapkan pada kelompok sampel
dan diberi nilai. Perhitungan koefisien korelasi antara skor subjek pada
skalanya (alat ukur baru), dan skor subjek pada kriterianya (alat ukur lama)
akan menghailkan koefisien korelasi yang merupakan koefisien validitas skala
yang bersangkutan. Jika hasil pengukuran menunjukan korelasi positif yang
tinggi, maka berarti bahwa alat ukur yang baru tersebut mempunyai validitas
konkuren yang tinggi.
c. Construct-related evidence of validity
Construct-related
evidence of validity adalah keakuratan dari sifat atau karakter yang diukur
oleh sebuah instrumen. Bagaimana kebenaran/ konsepsi membangun perbedaan
kesimpulan pada tingkah laku dari individu atau kebiasaan-kebiasaan pada
waktu-waktu tertentu.
Disisi
lain, construct validity (valitas
konstrak) adalah suatu abstraksi dan generalisasi khusus, dan merupakan suatu
konsep yang secara khusus diciptakan untuk kebutuhan ilmiah dan mempunyai
pengertian terbatas. Konstrak tersebut diberi defenisi dapat diamati dan
diukur.
Dalam
penelitian ilmiah, konstrak diperoleh melalui beberapa cara:
a. Mencari defenisi-defenisi konsep yang
dikemukakan oleh para ahli didalam berbagai literatur. Defenisi suatu konsep
biasanya berisi kerangka dari konsep tersebut. Apabila sudah ditemukan,
defenisi yang jelas dan cukup operasional untuk dijadikan dasar penyusunan alat
ukur, maka defenisi tersebut sudah dapat digunakan secara lansung untuk
menyusun item-item pertanyaan dalam kuisioner. Tetapi apabila defenisi yang
dikemukakan belum operasional, maka defenisi tersebut harus dijabarkan lebih
lanjut, agar lebih operasional, sehingga dapat dijadikan sebagai dasar
penyusunan pertanyaan dalam kuisioner.
b. Apabila defenisi suatu konsep tidak ditemukan
dalam literatur, maka peneliti harus mendefenisikan sendiri konsep tersebut.
Dalam merumuskan dfenisi suatu konsep ini, peneliti sebaiknya mendiskusikannya
dengan ahli yang kompeten dibidang tersebut. Pendapat ahli tentang konsep
tersebut, kemudian dibandingkan dengan pendapat peneliti sendiri.
c. Apabila pendapat para ahli tidak ditemukan,
maka peneliti dapat menyatakan defenisi suatu konsep yang akan diukur kepada
calon responden atau kepada orang-orang yang memiliki karakteristik yang sama
dengan responden. Misalnya peneliti ingin mengukur konsep stres di sekolah.
Untuk mendefenisikan konsep tersebut, peneliti dapat lansung menanyakan kepada
beberapa calon responden tentang faktor-faktor penyebab ia mengalami stres
disekolah..
Untuk keperluan penelitian ilmiah,
konstrak yang digunakan harus valid. Dalam
melihat validitas konstrak, setidaknya ada beberapa pertanyaan yang perlu
dijawab.
- Komponen atau dimensi apa saja yang membentuk
konsep tersebut?
- Apakah landasan teoritis yang merangkum
dimensi tersebut?
- Bukti empris
apakah yang memperlihatkan ada atau tidaknya keterkaitan antara komponen atau
dimensi-dimensi.
Untuk
menguji validitas konstrak psikologis, seperti intelegensia, persepsi, sikap,
dan lain-lain hal yang pertama sekali yang dilakukan oleh seorang peneliti
adalah menganalisa unsur-unsur yang menjadi bagian dari konstrak tersebut.
Kemudian dilihat isi dan makna dari komponen-komponennya serta alat ukur yang
digunakan untuk mengukur konstrak tersebut. Misalnya untuk menentukan
kecerdasan interpersonal seseorang dapat dilihat dari empat dimensi, yaitu: 1).
Mengorganisir kelompok, 2). Merundingkan pemecahan, 3). Hubungan pribadi, 4).
Analisis sosial. Apabila terdapat konsistensi
antara dimensi konsep yang satu dengan dimensi yang lainnya, maka
konstrak tersebut dianggap memiliki validitas.
Dari sisi
lain, adalah dalam mengukur validitas konstrak dari konsep intelegensi. Langkah
pertama, yang perlu dilakukan adalah menentukan apakah yang sebenarnya
diukur oleh tes intelegensi yang mempunyai imensi banyak itu, apakah kemampuan
menghafal, kemampuan menganalisa, kemampuan mengadakan evaluasi, kemampuan
membuat sintesa, atau kemampuan menerapkan sesuatu ? Setelah dimensi dari
intelegensi diukur, baru disusun alat ukur untuk masing-masing dimensi
intelegensi tersebut. Langkah kedua, adalah menentukan suatu
kriteria yang secara umum dapat digunakan untuk membedakan orang yang mempunyai
intelegensi rendah.
C. Reliability ( Keterandalan)
1. Pengertian
Saifuddin
Azwar mendefenisikan “Reliability/ reliabilitas (keterandalan) adalah tingkat
kepercayaan hasil suatu pengukuran. Pengukuran yang memiliki reliabilitas
tinggi, yaitu pengukuran yang mampu memberikan hasil ukur yang terpercaya,
disebut reliabel”.[6]
Selltiz,
dkk dalam James A. Black dan Dean J. Champion menyebutkan “ keterandalan dari
suatu alat pengukuran didefenisikan sebagai kemampuan alat untuk mengukur
gejala secara konsisten yang dirancang untuk mengukur”.[7]
Moh.
Nazir menjelaskan bahwa suatu alat ukur disebut mempunyai reliabilitas tinggi
atau dapat dipercaya, jika alat ukur itu mantap, dalam pengertian bahwa alat
ukur tersebut stabil, dapat diandalkan (dependability) dan dapat diramalkan (predictability). Suatu alat ukur yang
mantap tidak berubah-rubah pengukurannya dan dapat diandalkan, karena
penggunaan alat ukur tersebut berkali-kali akan memberikan hasil yang serupa”.[8]
Dari
pengertian diatas dapat dipahami, bahwa reliability (reliabilitas) alat ukur
adalah suatu alat yang digunakan untuk tujuan mengungkapkan aspek-aspek
psikologis atau dimensi-dimensi kepribadian manusia, maka skala psikologi harus
mengandung pernyataan-pernyataan yang baik serta memiliki tingkat reliabilitas
yang tinggi.
Dalam
hal pengukuran, reliabilitas berhubungan dengan ketepatan alat ukur.
Reliabilitas disebut juga kepercayaan, keterandalan, konsistensi, atau
kestabilan suatu alat ukur. Dikatakan memiliki reliabilitas yang tinggi atau
dapat dipercaya apabila alat ukur tersebut stabil, dapat diandalkan, serta
diramalkan.
Jadi
sifat reliabel dari suatu alat ukur berkenaan dengan kemampuan alat ukur
tersebut memberikan hasil yang konsisten. Bisa dibayangkan, jika kita mempunyai
alat ukur yang hasil pengukurannya berbeda-beda pada setiap kali melakukan pengukuran,
lalu bagaimana kita menggunakan datanya.
2. Metode keandalan ukuran
Metode yang dapat digunakan untuk menentukan
keterandalan suatu alat pengukuran, dapat dikelompokkan kepada dua kategori,
yaitu : Prosedur konsistensi eksternal dan prosedur konsistensi internal,
dengan menggunakan metode-metode berikut ini:
a). Tes-Retest Method, yaitu untuk
menentukan keterandalan suatu alat ukur, seperti pengukuran sikap dan berbagai
gejala sosial serta psikologis. Tes ini diberikan kepada suatu sampel individu
pada suatu sa’at tertentu. Setelah melewati interval waktu tertentu, alat ukur
diberikan kembali kepada sampel individu yang sama. Kemudian dua set hasil tes
ini dikorelasikan, dan hasil koefisien korelaasinya merupakan ukuran dari
tingkat keterandalan alat ukur sikap.
b). Equivalent-Forms
Method, adalah bentuk dari sebuah pengukuran dilaksanakan untuk
kelompok yang sama dari individu-individu selama waktu tertentu, dengan
pertanyaan yang berbeda. Mereka diharapkan dapat menyuguhkan isi yang sama dan
harus terpisah dari yang lainnya. Ketetapan koefisien dihitung dihitung dari
dua bentuk nilai-nilai yang diperoleh. Sebuah koefisien yang tinggi menunjukan
bukti yang kuat dari reliabilitas atau ketepatan dua bentuk pengukuran yang
sama.
c). Internal-consistency
method, yaitu suatu metode yang digunakan dalam soal-soal mengukur
gejala yang sama secara logis, harus berdampingan dalam suatu pola yang
konsisten. Seseorang yang menyukai pekerjaannya tidak akan memberi jawaban yang
menggambarkan bahwa ia tidak menyukai pekerjaannya. Dalam artian seseorang
dengan beberapa sifat khusus akan menjawab soal dengan cara yang dapat
diramalkan serta dipengaruhi oleh sifat-sifat tersebut.
d). Alpha-Coeffecient,
adalah bentuk umum dari pengukuran kereliabelan soal-soalyang tidak cocok,
seperti beberapa tes Essay yang memerlukan lebih dari satu jawaban. Selain itu,
pengukuran ini mengharapkan rata-rata dari semua kemungkinan nilai
reliabilitas, dihitung dengan cara belah dua. Dengan menggunakan pendekatan
ini, kita tidak perlu menghitung semua reliabilitas belah dua tersebut.
e). Scoring-Agreement, adalah suatu
metode yang digunakan dengan cara khusus, dan dinilai secara objektif.
Sedangkan kunci jawaban yang tersedia sesuai dengan nilai-nilai tertentu.
Perbedaan nilai seseorang dari dua kali tes dengan pelaksanaan yang berbeda,
ditujukan pada yang mempunyai nilai tinggi. Tak ada kesalahan dengan alat-alat
yang cocok untuk membedakan pelaksanaan penilaian, seperti penilaian sebuah
essay.
Itulah
beberapa metode yang digunakan dalam mengukur reliabilitas sebuah alat ukur,
yang kesemuanya itu mempunyai keuntungan dan kelemahan. Hanya saja kita tentu
akan merelevankan dengan keadaan dimana penelitian itu dilansungkan, serta
dalam kondisi apa responden tersebut menyelesaikan soal-soal dalam tes.
D. Penutup
1. Kesimpulan
a. Validity (validilitas) disebut juga
kesahihan suatu alat ukur, yaitu suatu alat ukur (instrumen) mampu mengukur apa
yang ingin diukur, atau dapat mengungkapkan data yang tepat dari suatu variabel
yang diteliti.
b. Kesahihan terdiri dari beberapa jenis, yaitu:
1). Content-related
evidence of validity, disebut juga validitas isi, yaitu suatu medel yang
digunakan, apakah isi atau substansi dari suatu alat ukur merupakan
representatif dari isi dan sifat-sifat yang ingin diukur.
2). Criterion-related evidence of validity
(validitas kriteria), adalah keterangan yang diperoleh sama dari penggunaan
instrumen dengan instrumen yang lainnya, atau ukuran yang satu dengan yang
lainnya. Validitas ini terdiri dari dua jenis, yaitu:
> Predictive
validity (Validitas prediktif), yaitu alat ukur yang digunakan untuk
memprediksi apa yang akan terjadi dimasa yang akan datang.
> Concurrent-validity (validitas
konkuren), yaitu pengujian validitas suatu alat ukur dengan melihat sejauhmana
kesulitan antara hasil ukur skala dengan instrumen yang sudah teruji
kualitasnya.
3). Construct-related evidence of validity,
yaitu keakuratan dari sifat atau karakter yang diukur oleh sebuah instrumen.
c. Reliability (reliabilitas) adalah
keterandalan, kepercayaan, konsistensi, atau kestabilan suatu alat ukur. Jadi
sifat reliabel suatu alat ukur berkenaan dengan kemampuan alat ukur.
d. Metode yang digunakan untuk menentukan
keterandalan suatu alat pengukuran terdiri dari: 1). Prosedu konsistensi
eksternal, dan 2). Prosedur konsistensi internal, dengan menggunakan
metode-metode sebagai berikut:
1). Tes-Retest method, yaitu metode yang
digunakan untuk pengukuran sikap dan berbagai gejala sosial atau psikologis.
2). Equivalent-forms method, yaitu metode
yang digunakan dalam pengukuranuntuk kelompok yang sama dari individu selama
waktu tertentu, dengan pertanyaan yang berbeda.
3). Internal-consistency method, yaitu
metode yang digunakan dalam soal-soal, mengukur
gejala yang sama secara logis, harus berdampingan dalam suatu pola yang
konsisten.
4). Alpha-coeffecient, adalah bentuk umum
dari pengukuran kereliabelan, yang mengharapkan rata-rata dari semua
kemungkinan nilai reliabilitas, dihitung dengan cara belah dua.
5). Scoring-agrrement, adalah suatu metode
yang digunakan secara khusus, dan dinilai secara objektif.
e. Validitas dan reliabilitas suatu alat ukur
(instrumen) sangat penting dalam penelitian, sebab hal ini akan menentukan
keberhasilan seseorang dalam penelitian, terutama mengungkapkan fakta-fakta
dari data yang diharapkan, kebenaran kesimpulan, serta informasi yang konkrit
dari suatu teori.
2. Saran-saran.
Demikianlah
makalah yang sederhana ini penulis sampaikan, diharapkan kepada semua pihak
dapat menyampaikan kritik yang membangun untuk kesempurnaannya buat masa yang
akan datang.
DAFTAR
KEPUSTAKAAN
Azwar, Saifuddin , Penyusunan
Skala Psikologis, Yokyakarta: Pustaka fajar, 2003
Arikunto, Suharsimi, dkk, Penelitian
Tindakan Kelas ,Jakarta: Bumi Aksara, 2007.
Manajemen Penelitian, Jakarta: Rineka Cipta, 2003.
A. Black, James dan Dean J. Champion, Metode dan
Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001
Departemen Pendidikan Nasional, Kamus Besar bahasa
Indonesia, Jakarta: Balai Pustaka,
2005
Emizir, Metodologi
Penelitian Pendidikan, Kuantitatif dan Kualitatif, Jakarta: Rajagrafindo
Persada, 2008.
Frenkel, Jack R. dan Norman E. Wallen, How to Design and
Evaluate Research, In Education Singapore: Me graw-Hill, 1993
Hopkins, David, A. Teache’r Guide to Classroom
Research, Philadelphia: Open University Press, 1993.
James A. Black, James dan Dean J. Champion, Metode
dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001
Nazir, Moh., Metode
Penelitian, Bogor: Ghalia Indonesia, 2005.
Narbuko, Cholid dan Abu Achmadi, Metode Penelitian,
Jakarta: Bumi Aksara, 2003.
Rory O’Brien, An
Overview of the Methological Approach of Aktion Research.http:// www.web. net/
~robrien/papers/ arfinal.html (29/11/2005).
Sudjana, Nana dan Ibrahim, Penelitian dan Penilaian
Pendidikan, Bandung: Sinar Baru Algensindo, 2007.
Madja,
Rochiati, Metode Penelitian Tindakan Kelas, Bandung: Remaja Rosda
Karya, 2007.
[1]Naskah Asli Dapat Dipesan Via email di buku tamu