A. Pendahuluan
Dalam
sebuah penelitian, salah satu segi yang penting adalah penggunaan
instrument
(alat pengukuran). Sebab instrument pada hakikatnya adalah untuk
mengungkapkan fakta-fakta dari data yang diharapkan. Kemudian instrument dipergunakan
juga untuk melaporkan data dan beberapa informasi, atau kesimpulan yang benar
dari kegiatan penelitian.
Menurut
James A. Black dan Dean J. Champion menyebutkan, bahwa : “Alat pengukuran
setidak-tidaknya mempunyai dua perangkat penting yang menjadi perhatian para
ilmuan sosial, yakni kesahihan (validity), dan keterandalan (reliability)”.[1]
Dengan
demikian dapat dipahami, bahwa suatu instrumen dikatakan valid atau sahih apabila instrumen tersebut mampu
mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang tepat dari
suatu variabel yang diteliti. Misalnya timbangan emas dapat mengukur berat
emas, atau meteran dapat digunakan untuk mengukur tinggi badan.
Kemudian,
suatu instrumen dikatakan reliable apabila alat ukur yang dipakai dapat
dipercaya atau handal. Dalam konteks pengukuran, reliabilitas menyangkut
ketepatan alat ukur. Dalam artian alat ukur tersebut stabil, dapat dihandalkan
(dependability), dan dapat diramalkan (predictability). Menurut
Syaifuddin Azwar “Reliabilitas adalah tingkat kepercayaan hasil suatu
pengukuran. Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang
mampu memberikan hasil ukur yang terpercaya, disebut reliabel”.[2]
Jadi
sifat reliabel (terandal) dari suatu alat ukur berhubungan dengan kemampuan
alat ukur tersebut memberikan hasil yang konsisten. Misalnya, ketika kita
melakukan pengukuran tinggi benda seperti tinggi meja digunakan alat ukur
jengkal tangan. Hasilnya lima jengkal pada pengukuran pertama, ukuran yang sama
juga akan didapatkan pada pengukuran berikutnya. Artinya alat ukur yang dipakai
adalah valid dan juga reliabel. Akan tetapi bila objek yang diukur adalah
gedung berlantai limabelas, mungkinkah jengkal tangan akan memberikan hasil
yang konsisten? Kemungkinan besar tidak. Ini berarti alat pengukurannya valid,
tetapi tidak reliabel.
Sehubungan
dengan pokok pemikiran tersebut diatas, maka dalam makalah ini penulis akan
membahas “Instrument Validity dan Reliability”, sehingga kita
mendapatkan gambaran yang jelas tentang hal tersebut.
B. Validity (
Kesahihan)
1.
Pengertian
Menurut
Kamus Besar Bahasa Indonesia “ Validity
(validitas) adalah sifat benar menurut bahan bukti yang ada, logika berfikir,
atau kekuatan hukum; sifat Valid: kesahihan: menentukan suatu tes dengan tepat
memang sukar”.[3]
Jack
R. Fraenkel dan Norman E. Wallen, mengemukakan bahwa “ Validity adalah gambaran kesimpulan yang benarberdasarkan data yang
diperoleh melalui penggunaan instrumen”.[4]
Selltiz,
(dkk) dalam James A. Black dan Dean J. Champion menyatakan, bahwa “ Kesahihan
sebuah alat pengukuran didefenisikan sebagai perangkat ukuran yang
memperkenankan peneliti untuk menyatakan bahwa alat pengukur apa yang ia
katakan akan mengukur”.[5]
Dari
pengertian tersebut diatas dapat dipahami, bahwa validitas (kesahihan)
meruapakan hal yang sangat penting dalam mempersiapkan sebuah instrumen. Sebab
instrumen pada hakikatnya adalah untuk memperoleh informasi dan melaporkan data
yang benar tentang sesuatu yang diteliti. Sehubungan dengan itu, maka validitas
dijadikan sebagai bahan penuh arti, dan memberi laporan secara spesifik
berdasarkan data yang terkumpul. Jadi ketepatan sebuah pengukuran adalah proses
pengumpulan bukti-bukti pendukung, sehingga sampai kepada suatu kesimpulan yang
akurat, penuh arti, dan bermamfa’at.
Dengan
demikian dapat disimpulkan, bahwa suatu instrumen dikatakan sahih apabila
relevan antara alat ukur dengan apa yang akan diukur. Misalnya dalam suatu tes
mengukur sifat X. Alat pengukuran dikatakan sahih apabila pada tes tersebut
benar-benar mengukur sifat X. Akan tetapi apabila mengukur sifat lain yang
bukan sifat X, sementara alat pengukuran yang dipakai adalah untuk mengukur
sifat X, maka alat pengukuran tersebut tidak sahih, dan begitu juga sebaliknya.
2. Jenis-Jenis Kesahihan
Kesahihan
sebuah ukuran bisa ditinjau dari beberapa perspektif yang berbeda. Setidaknya
terdapat tiga jenis kesahihan, yaitu konten, konkuren (prediktif), dan
konstruk.
Secara
umum, kesahihan sebuah tes berstandar pada dua faktor penting, yaitu logika dan
pembuktian statistik. Masing-masing dari tiga jenis kesahihan diatas selalu
menggunakan logika dan verifikasi statistik sebagai cara untuk menetapkan
derajat kesahihan dari alat pengukuran.
a. Content-related evidence of validity
Content related evidence of validity adalah kesahihan dari instrumen yang menjadi
pengukur sebuah penelitian. Sejauhmana sebuah instrumen bisa memberikan
pemahaman dan tingkat ketepatannya. Apakah yang digambarkan sebuah variabel
dapat diterima dengan logis ?, bagaimana sampel dari soal-soal atau pertanyaan
memadai untuk dapat menjadi sebuah penilaian? Apakah polanya benar ? Semuanya
itu menunjukkan bahwa antara content dengan polanya harus bersesuaian
dengan variabel dan sampel pokok penelitian.
Content validity disebut juga
dengan validitas isi, yaitu suatu model yang digunakan dalam menentukan
validitas suatu alat ukur, atau tes dengan cara menilai sejauhmana item-item
yang dibuat sesuai dengan tingkat tingkah laku yang akan diukur, atau sejauh
isi alat ukur tersebut mewakili semua aspek yang dianggap sebagai aspek
kerangka konsep. Jadi, validitas isi mempersoalkan apakah isi dari suatu alat
ukur (bahannnya, topiknya, substansinya) cukup representatif, maka dalam validitas
isi dipandu dengan pertanyaan “ apakah isi atau substansi dari suatu alat ukur
merupakan representatif dari isi dan sifat-sifat yang ingin diukur?”.
Seorang peneliti ingin meneliti tentang “
pengaruh program ilmu pasti baru terhadap kemampuan matematika kelas 5 (lima)”.
Selama penyelesaian dari program ini, peneliti berharap siswa mampu
menyelesaikan permasalahan kata dari sejumlah tipe atau bentuk yang berbeda
dengan benar. Untuk mengukur kemampuan matematika siswa, peneliti merencanakan
memberikan siswa latihan matematika dengan 15 (lima belas) soal. Pada tes ini
siswa perlu menggambarkan tingkatan-tingkatan yang dibutuhkan dari kemampuan
mereka untuk menyelesaikan permasalahan tersebut. Sebab itu, pelaksanaan pada
alat-alat dalam hal ini (pengujian
matematika) akan memberikan bukti yang valid dari kemampuan matematika
siswa ini untuk kelas/ tingkatan pada instrumen diberikan contoh yang cukup
dari bentuk permasalahan yang dipelajari dalam program ini. Jika tes hanya
mencakup permasalahan yang mudah, sulit,
lama waktunya, dan permasalahan mengurangi, atau tes tidak mewakili, maka tidak
akan memberikan informasi dari laporan yang valid.
Kunci dasar dalam content-related
evidence, berkisar tentang kecukupan sampel dalam instrumen, seperti pada
tes prestasi, hanya menyajikan sebuah sampel dari bermacam permasalahan yang
dipertanyakan. Content validation adalah acuan/ pertimbangan dari
pembagian permasalahan, jika kandungan
instrumen dapat mewakili sampel yang ada disekitar kandungan tersebut.
Bentuk lain untuk kadar kevalidan harus
dilakukan penyusunan atau pembentukan instrumen yang dapat mencatat secara
jelas tentang sesuatu, seperti bentuk ukur, waktu yang dibutuhkan, ketepatan
bahasa, kejelasan petunjuk, dan lain-lain. Hal tersebut tidak akan berarti,
apabila diberikan pertanyaan pada sebuah instrumen dalam tes bahasa Inggris
kepada anak yang minim bahasa Inggrisnnya. Oleh karena itu, perlu dipahami
bahwa pertanyaan yang akan diberikan harus sesuai dengan karakteristik sampel
yang diinginkan.
Bagaimana seseorang akan memperoleh
keakuratan instrumen sebagai alat ukur? Langkah umum untuk memperoleh ini,
seseorang harus memperhatikan kadar isi atau rancangan instrumen serta
menela’ah tepat atau tidaknya. Seseorang tidak harus seperti orang lain, tetapi
harus berprinsip sebagai seorang individu yang bisa diharapkan, cenderung untuk
memberikan penilaian kemampuan tetang keterukuran instrumen. Sebagai langkah
umum yang dapat dipedomani adalah : (1). Peneliti menyalin defenisi dari apa
yang akan diukur, (2). Peneliti menulis defenisi dan gambaran sampel yang
dituju untuk satu penilaian atau lebih, (3). Penilaian dilihat pada defenisi;
mengenal soal-soal atau pertanyaan pada instrumen dan membubuhkan penandaaan
diakhir soal atau pertanyaan. Dalam hal ini yang perlu mendapat penandaan
adalah soal yang dirasa tidak dapat mengukur satu pokok permasalahan atau
lebih, serta menandai soal pada setiap pokok pembahasan yang tidak dinilai/
diujikan. Kemudian, penilaian juga menguji ketepatan bentuk instrumen. (4).
Peneliti menyalin dan memeriksa kembali setiap soal atau pertanyaan yang akan diujikan,
(5). Semua soal dan pertanyaan disetujui dalam instrumen dan
mengindentifikasikan jumlah keseluruhan dari soal-soal, apakah cukup mewakili
bagian isi dari variabel yang diukur.
Untuk menggambarkan bagaimana peneliti
mencoba untuk membuat kesahihan instrumen sebagai alat ukur, dapat diperhatikan
contoh berikut:
Contoh 1 :
Peneliti meneliti kemampuan siswa untuk
menggunakan laporan-laporan yang mereka perdapat pada waktu dulu, peneliti
memberikan defenisi: “untuk laporan yang dapat siswa pakai dari perolehan
imformasi sebelumnya, mereka harus mampu untuk:
a.
Melukiskan kesimpulan yang tepat (secara lisan atau tertulis) berdasarkan
informasi-informasi yang diberikan.
b. Mengindentifikasikan satu kesimpulan logis
atau lebih beserta sebuah penjelasan (point of view)
c. Menyajikan bahwa ide-ide tersebut adalah
setara, sama, tidak berhubungan atau berlawanan.
Dari hal diatas,
bagaimana peneliti bisa bisa mendapatkan bukti-bukti seperti itu? Peneliti
memutuskan untuk mempersiapkan tes yang berisikan banyak pertanyaan untuk
siswa-siswa untuk jawaban. Jawaban-jawaban merupakan bukti yang mereka
butuhkan. Ada tiga buah contoh dari bermacam-macam pertanyaan peneliti berikan.
Satu rancangan untuk mendapatkan setiap tiga buah tipe dari bukti yang
disebutkan diatas.
1. Jika
A besar dari B, dan B besar dari C, maka:
a.
A harus besar dari C
b.
C harus kecil dari A
c.
B harus kecil dari A
d.
Semua yang diatas benar
2. Hal-hal yang meyakini peningkatan pemakaian
konsumen menjadi cara yang benar untuk mendorong ekonomi akan menunjang:
a. Peningkatan-peningkatan atau rata-rata
permintaan
b.
Persediaan menipis
c. Penurunan pemasukan (income)
3. Bandingkan pengeluaran yang dikeluarkan
pemerintahan untuk state selama tahun-tahun yang lalu:
a. Hutang gaji
b. Keamanan
c. Pelayanan sosial
Sekarang
perhatikan setiap pertanyaan dan yang berhubungan dengan pokok bahasan
didapatkan, atau diukur. Apakah setiap pertanyaan dirancang permasalahannya,
jika tidak kenapa?
Contoh 2:
Disini apa yang
dirancang peneliti untuk pengukuran kemampuan siswa untuk menerangkan
kemungkinan terjadi?
Derection : Ada beberapa fakta
Fakta
W :
Pekemah mulai menyalakan api untuk memasak makanan dimusim kemarau/
waktu ada angin didalam hutan.
Fakta
X : Api
mulai menyala pada rumput yang kering disekitar perkemahan
Fakta
Y : Sebuah
rumah di dalam hutan terbakar
Terangkan
kemungkinan penyebab rumah terbakar (fakta Y). Sedangkan fakta W dan fakta X
bisa membantu menerangkannya.
a Ya. Fakta W dan X kemungkinan penyebab (
karena keduanya menggambarkan hubungan).
b. Ya. Kedua W dan X berguna, tak satupun
penyebab lain yang mengakibatkannya.
c. Tidak. Sebab Cuma satu fakta X atau Y yang
menjadi penyebab.
d. Tidak. Karena tak satupun W atau X yang
menjadi penyebab.
Perhatikan
pertanyaan dan pokok pembahasan yang dirancang untuk diukur, apakah itu
mengukur objektifnya? Jika tidak mengapa? Lakukanlah kembali seperti ini, untuk
perolehan bukti-bukti sampel. Contoh diatas pendukung penilaian, dimana
soal-soal mengukur apa-apa yang diinginkan, seperti halnya dalam proses
memperoleh keakuratan dari pemilihan alat/ instrumen. Namun satu hal yangperlu
dipahami, bahwa kualitas dari penilaian selalu merupakan acuan penting dan
karakteristik dari sampel yang diinginkan harus diketahui.
b. Criterion-related evidence of
validity
Criterion-related
evidence of validity (validitas keriteria) adalah keterangan yang diperoleh
sama dari penggunaan instrumen dengan instrumen yang lainnya, atau ukuran yang
satu dengan yang lainnya.
Untuk mendapatkan keriteria dari kesahihan dari
instrumen, biasanya peneliti membandingkan antara suatu instrumen hasil satu
kesatuan yang valid dengan pengukuran tersendiri. Dengan demikian dapat
dipahami, bahwa validitas keriteria adalah validats yang dilihat dengan
membandingkan suatu keriteria atau variabel yang diketahui atau yang dipercaya
dapat digunakan untuk mengukur suatu atribut tertentu. Jika skor atau skala
yang diukur dibandingkan dengan satu, atau lebih keriteria (variabel) yang
dianggap dapat mengukur apa yang ingin diukur, maka yang dikerjakan adalah
menetapkan validitas dari alat ukurnya.
Dalam validitas berdasrkan keriteria, umumnya alat
ukur yang akan diuji validitasnya disebut sebagai prediktor. Statistik yang
diperlukan dalam pengujian valitas ini adalah koefisien korelasi antara skor
tes sebagai prediktor, dan skor suatu kriteria yang relevan.
Validitas berdasarkan kriteria dapat dibedakan atas
dua macam, yaitu: (1). Validitas prediktif, (2). Validitas konkuren
a. Predictive
validity ( Validitas prediktif)
Alat
ukur yang dirancang oleh peneliti, sering kali ditujukan untuk memprediksi apa
yang akan terjadi dimasa yang akan datang. Tingkat suatu alat ukur yang dibuat
dapat dengan akurat meramalkan suatu kriteria dimasa yang akan datang. Inilah
yang disebut dengan predictive validity. Jadi, suatu alat ukur dikatakan
valid jika hasil dari pengukuran ini sesuai dengan tingkah laku atau
gejala-gejala yang diramalkan.
Contoh “
ujian seleksi masuk perguruan tinggi”. Bila ternyata terdapat korelasi yang
tinggi antara ujian seleksi masuk perguruan tinggi dengan indeks prestasi
belajar mahasiswa, maka soal ujian seleksi memiliki validitas prediktif.
Artinya alat ukur tersebut dapat memprediksi apa yang akan terjadi dimasa yang
akan datang.
b. Concurrent
validity (validitas konkuren).
Validitas
konkuren atau valitas pada sa’at bersamaan adalah pengujian validitas, suatu
alat ukur dengan melihat sejauhmana kesulitan antara hasil ukur skala tersebut
dengan hasil ukur instrumen lain yang sudah teruji kualitasnya, atau dengan
ukuran-ukuran yang dianggap dapat menggambarkan aspek-aspek yang telah diukur.
Validitas ini digunakan dalam membuat alat ukur baru, karena alat ukur lama
untuk variabel yang sama kurang praktis.
Untuk
menguji kesesuaian hasil ukur skala (alat ukur baru) dengan hasil ukur kriteria
(alat ukur lama), maka kedua alat ukur tersebut diterapkan pada kelompok sampel
dan diberi nilai. Perhitungan koefisien korelasi antara skor subjek pada
skalanya (alat ukur baru), dan skor subjek pada kriterianya (alat ukur lama)
akan menghailkan koefisien korelasi yang merupakan koefisien validitas skala
yang bersangkutan. Jika hasil pengukuran menunjukan korelasi positif yang
tinggi, maka berarti bahwa alat ukur yang baru tersebut mempunyai validitas
konkuren yang tinggi.
c. Construct-related
evidence of validity
Construct-related evidence of validity adalah
keakuratan dari sifat atau karakter yang diukur oleh sebuah instrumen.
Bagaimana kebenaran/ konsepsi membangun perbedaan kesimpulan pada tingkah laku
dari individu atau kebiasaan-kebiasaan pada waktu-waktu tertentu.
Disisi lain,
construct validity (valitas konstrak) adalah suatu abstraksi dan
generalisasi khusus, dan merupakan suatu konsep yang secara khusus diciptakan
untuk kebutuhan ilmiah dan mempunyai pengertian terbatas. Konstrak tersebut
diberi defenisi dapat diamati dan diukur.
Dalam penelitian ilmiah, konstrak diperoleh melalui
beberapa cara:
a. Mencari
defenisi-defenisi konsep yang dikemukakan oleh para ahli didalam berbagai
literatur. Defenisi suatu konsep biasanya berisi kerangka dari konsep tersebut.
Apabila sudah ditemukan, defenisi yang jelas dan cukup operasional untuk
dijadikan dasar penyusunan alat ukur, maka defenisi tersebut sudah dapat
digunakan secara lansung untuk menyusun item-item pertanyaan dalam kuisioner. Tetapi
apabila defenisi yang dikemukakan belum operasional, maka defenisi tersebut
harus dijabarkan lebih lanjut, agar lebih operasional, sehingga dapat dijadikan
sebagai dasar penyusunan pertanyaan dalam kuisioner.
b. Apabila
defenisi suatu konsep tidak ditemukan dalam literatur, maka peneliti harus
mendefenisikan sendiri konsep tersebut. Dalam merumuskan dfenisi suatu konsep
ini, peneliti sebaiknya mendiskusikannya dengan ahli yang kompeten dibidang
tersebut. Pendapat ahli tentang konsep tersebut, kemudian dibandingkan dengan
pendapat peneliti sendiri.
c. Apabila
pendapat para ahli tidak ditemukan, maka peneliti dapat menyatakan defenisi
suatu konsep yang akan diukur kepada calon responden atau kepada orang-orang
yang memiliki karakteristik yang sama dengan responden. Misalnya peneliti ingin
mengukur konsep stres di sekolah. Untuk mendefenisikan konsep tersebut,
peneliti dapat lansung menanyakan kepada beberapa calon responden tentang
faktor-faktor penyebab ia mengalami stres disekolah..
Untuk
keperluan penelitian ilmiah, konstrak yang digunakan harus valid. Dalam melihat validitas konstrak, setidaknya
ada beberapa pertanyaan yang perlu dijawab.
- Komponen atau dimensi apa saja yang membentuk
konsep tersebut?
- Apakah landasan teoritis yang merangkum dimensi
tersebut?
- Bukti empris
apakah yang memperlihatkan ada atau tidaknya keterkaitan antara komponen atau
dimensi-dimensi.
Untuk
menguji validitas konstrak psikologis, seperti intelegensia, persepsi, sikap,
dan lain-lain hal yang pertama sekali yang dilakukan oleh seorang peneliti
adalah menganalisa unsur-unsur yang menjadi bagian dari konstrak tersebut.
Kemudian dilihat isi dan makna dari komponen-komponennya serta alat ukur yang
digunakan untuk mengukur konstrak tersebut. Misalnya untuk menentukan kecerdasan
interpersonal seseorang dapat dilihat dari empat dimensi, yaitu: 1).
Mengorganisir kelompok, 2). Merundingkan pemecahan, 3). Hubungan pribadi, 4).
Analisis sosial. Apabila terdapat konsistensi
antara dimensi konsep yang satu dengan dimensi yang lainnya, maka
konstrak tersebut dianggap memiliki validitas.
Dari sisi
lain, adalah dalam mengukur validitas konstrak dari konsep intelegensi. Langkah
pertama, yang perlu dilakukan adalah menentukan apakah yang sebenarnya
diukur oleh tes intelegensi yang mempunyai imensi banyak itu, apakah kemampuan
menghafal, kemampuan menganalisa, kemampuan mengadakan evaluasi, kemampuan
membuat sintesa, atau kemampuan menerapkan sesuatu ? Setelah dimensi dari
intelegensi diukur, baru disusun alat ukur untuk masing-masing dimensi
intelegensi tersebut. Langkah kedua, adalah menentukan suatu
kriteria yang secara umum dapat digunakan untuk membedakan orang yang mempunyai
intelegensi rendah.
C. Reliability ( Keterandalan)
1. Pengertian
Saifuddin Azwar mendefenisikan “Reliability/
reliabilitas (keterandalan) adalah tingkat kepercayaan hasil suatu pengukuran.
Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu
memberikan hasil ukur yang terpercaya, disebut reliabel”.[6]
Selltiz, dkk dalam James A. Black dan Dean J. Champion
menyebutkan “ keterandalan dari suatu alat pengukuran didefenisikan sebagai
kemampuan alat untuk mengukur gejala secara konsisten yang dirancang untuk
mengukur”.[7]
Moh. Nazir menjelaskan bahwa suatu alat ukur disebut
mempunyai reliabilitas tinggi atau dapat dipercaya, jika alat ukur itu mantap,
dalam pengertian bahwa alat ukur tersebut stabil, dapat diandalkan (dependability)
dan dapat diramalkan (predictability).
Suatu alat ukur yang mantap tidak berubah-rubah pengukurannya dan dapat diandalkan,
karena penggunaan alat ukur tersebut berkali-kali akan memberikan hasil yang
serupa”.[8]
Dari pengertian diatas dapat dipahami, bahwa
reliability (reliabilitas) alat ukur adalah suatu alat yang digunakan untuk
tujuan mengungkapkan aspek-aspek psikologis atau dimensi-dimensi kepribadian
manusia, maka skala psikologi harus mengandung pernyataan-pernyataan yang baik
serta memiliki tingkat reliabilitas yang tinggi.
Dalam hal pengukuran, reliabilitas berhubungan dengan
ketepatan alat ukur. Reliabilitas disebut juga kepercayaan, keterandalan,
konsistensi, atau kestabilan suatu alat ukur. Dikatakan memiliki reliabilitas
yang tinggi atau dapat dipercaya apabila alat ukur tersebut stabil, dapat
diandalkan, serta diramalkan.
Jadi sifat reliabel dari suatu alat ukur berkenaan
dengan kemampuan alat ukur tersebut memberikan hasil yang konsisten. Bisa
dibayangkan, jika kita mempunyai alat ukur yang hasil pengukurannya
berbeda-beda pada setiap kali melakukan pengukuran, lalu bagaimana kita
menggunakan datanya.
2. Metode keandalan ukuran
Metode yang dapat digunakan untuk menentukan
keterandalan suatu alat pengukuran, dapat dikelompokkan kepada dua kategori,
yaitu : Prosedur konsistensi eksternal dan prosedur konsistensi internal,
dengan menggunakan metode-metode berikut ini:
a). Tes-Retest Method, yaitu untuk
menentukan keterandalan suatu alat ukur, seperti pengukuran sikap dan berbagai
gejala sosial serta psikologis. Tes ini diberikan kepada suatu sampel individu
pada suatu sa’at tertentu. Setelah melewati interval waktu tertentu, alat ukur
diberikan kembali kepada sampel individu yang sama. Kemudian dua set hasil tes
ini dikorelasikan, dan hasil koefisien korelaasinya merupakan ukuran dari
tingkat keterandalan alat ukur sikap.
b). Equivalent-Forms
Method, adalah bentuk dari sebuah pengukuran dilaksanakan untuk
kelompok yang sama dari individu-individu selama waktu tertentu, dengan
pertanyaan yang berbeda. Mereka diharapkan dapat menyuguhkan isi yang sama dan
harus terpisah dari yang lainnya. Ketetapan koefisien dihitung dihitung dari
dua bentuk nilai-nilai yang diperoleh. Sebuah koefisien yang tinggi menunjukan
bukti yang kuat dari reliabilitas atau ketepatan dua bentuk pengukuran yang
sama.
c). Internal-consistency
method, yaitu suatu metode yang digunakan dalam soal-soal mengukur
gejala yang sama secara logis, harus berdampingan dalam suatu pola yang
konsisten. Seseorang yang menyukai pekerjaannya tidak akan memberi jawaban yang
menggambarkan bahwa ia tidak menyukai pekerjaannya. Dalam artian seseorang
dengan beberapa sifat khusus akan menjawab soal dengan cara yang dapat
diramalkan serta dipengaruhi oleh sifat-sifat tersebut.
d). Alpha-Coeffecient,
adalah bentuk umum dari pengukuran kereliabelan soal-soalyang tidak cocok,
seperti beberapa tes Essay yang memerlukan lebih dari satu jawaban. Selain itu,
pengukuran ini mengharapkan rata-rata dari semua kemungkinan nilai
reliabilitas, dihitung dengan cara belah dua. Dengan menggunakan pendekatan
ini, kita tidak perlu menghitung semua reliabilitas belah dua tersebut.
e). Scoring-Agreement,
adalah suatu metode yang digunakan dengan cara khusus, dan dinilai secara
objektif. Sedangkan kunci jawaban yang tersedia sesuai dengan nilai-nilai
tertentu. Perbedaan nilai seseorang dari dua kali tes dengan pelaksanaan yang
berbeda, ditujukan pada yang mempunyai nilai tinggi. Tak ada kesalahan dengan
alat-alat yang cocok untuk membedakan pelaksanaan penilaian, seperti penilaian
sebuah essay.
Itulah
beberapa metode yang digunakan dalam mengukur reliabilitas sebuah alat ukur,
yang kesemuanya itu mempunyai keuntungan dan kelemahan. Hanya saja kita tentu
akan merelevankan dengan keadaan dimana penelitian itu dilansungkan, serta
dalam kondisi apa responden tersebut menyelesaikan soal-soal dalam tes.
D. Penutup
1.
Kesimpulan
a. Validity (validilitas) disebut juga
kesahihan suatu alat ukur, yaitu suatu alat ukur (instrumen) mampu mengukur apa
yang ingin diukur, atau dapat mengungkapkan data yang tepat dari suatu variabel
yang diteliti.
b. Kesahihan terdiri dari beberapa jenis, yaitu:
1).
Content-related evidence of validity, disebut juga validitas isi, yaitu
suatu medel yang digunakan, apakah isi atau substansi dari suatu alat ukur
merupakan representatif dari isi dan sifat-sifat yang ingin diukur.
2). Criterion-related evidence of validity
(validitas kriteria), adalah keterangan yang diperoleh sama dari penggunaan
instrumen dengan instrumen yang lainnya, atau ukuran yang satu dengan yang
lainnya. Validitas ini terdiri dari dua jenis, yaitu:
> Predictive
validity (Validitas prediktif), yaitu alat ukur yang digunakan untuk
memprediksi apa yang akan terjadi dimasa yang akan datang.
> Concurrent-validity (validitas
konkuren), yaitu pengujian validitas suatu alat ukur dengan melihat sejauhmana
kesulitan antara hasil ukur skala dengan instrumen yang sudah teruji
kualitasnya.
3). Construct-related evidence of validity,
yaitu keakuratan dari sifat atau karakter yang diukur oleh sebuah instrumen.
c. Reliability (reliabilitas) adalah
keterandalan, kepercayaan, konsistensi, atau kestabilan suatu alat ukur. Jadi
sifat reliabel suatu alat ukur berkenaan dengan kemampuan alat ukur.
d. Metode yang digunakan untuk menentukan
keterandalan suatu alat pengukuran terdiri dari: 1). Prosedu konsistensi
eksternal, dan 2). Prosedur konsistensi internal, dengan menggunakan metode-metode
sebagai berikut:
1). Tes-Retest method, yaitu metode yang
digunakan untuk pengukuran sikap dan berbagai gejala sosial atau psikologis.
2). Equivalent-forms method, yaitu metode
yang digunakan dalam pengukuranuntuk kelompok yang sama dari individu selama
waktu tertentu, dengan pertanyaan yang berbeda.
3). Internal-consistency method, yaitu
metode yang digunakan dalam soal-soal, mengukur
gejala yang sama secara logis, harus berdampingan dalam suatu pola yang
konsisten.
4). Alpha-coeffecient, adalah bentuk umum
dari pengukuran kereliabelan, yang mengharapkan rata-rata dari semua
kemungkinan nilai reliabilitas, dihitung dengan cara belah dua.
5). Scoring-agrrement, adalah suatu metode
yang digunakan secara khusus, dan dinilai secara objektif.
e. Validitas dan reliabilitas suatu alat ukur
(instrumen) sangat penting dalam penelitian, sebab hal ini akan menentukan
keberhasilan seseorang dalam penelitian, terutama mengungkapkan fakta-fakta
dari data yang diharapkan, kebenaran kesimpulan, serta informasi yang konkrit
dari suatu teori.
2.
Saran-saran.
Demikianlah
makalah yang sederhana ini penulis sampaikan, diharapkan kepada semua pihak
dapat menyampaikan kritik yang membangun untuk kesempurnaannya buat masa yang
akan datang.
Terakhir, ucapan
terima kasih yang tak terhingga kepada semua pihak, terutama kepada Bapak Prof.
Dr. H. Syafruddin Nurdin, M.Pd. yang telah mengarahkan serta membimbing penulis
dalam pembuatan makalah ini, semoga Allah swt membalasi dengan amalan yang
berlipat ganda. Amin .
Wassalam
Penulis,
.
DAFTAR
KEPUSTAKAAN
Azwar, Saifuddin , Penyusunan
Skala Psikologis, Yokyakarta: Pustaka fajar, 2003
Arikunto, Suharsimi, dkk, Penelitian
Tindakan Kelas ,Jakarta: Bumi Aksara, 2007.
________,
Manajemen Penelitian, Jakarta: Rineka Cipta, 2003.
A. Black, James dan Dean J. Champion, Metode dan
Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001
Departemen Pendidikan Nasional, Kamus Besar bahasa
Indonesia, Jakarta: Balai Pustaka,
2005
Emizir, Metodologi
Penelitian Pendidikan, Kuantitatif dan Kualitatif, Jakarta: Rajagrafindo
Persada, 2008.
Frenkel, Jack R. dan Norman E.
Wallen, How to Design and Evaluate Research, In Education Singapore: Me
graw-Hill, 1993
Hopkins, David, A. Teache’r Guide to Classroom
Research, Philadelphia: Open University Press, 1993.
James A. Black, James dan Dean J. Champion, Metode
dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001
Nazir, Moh., Metode
Penelitian, Bogor: Ghalia Indonesia, 2005.
Narbuko, Cholid dan
Abu Achmadi, Metode Penelitian, Jakarta: Bumi Aksara, 2003.
Rory O’Brien, An
Overview of the Methological Approach of Aktion Research.http:// www.web. net/ ~robrien/papers/ arfinal.html
(29/11/2005).
Sudjana, Nana dan Ibrahim, Penelitian dan Penilaian
Pendidikan, Bandung: Sinar Baru Algensindo, 2007.
Wiriaat Madja, Rochiati, Metode Penelitian Tindakan Kelas,
Bandung: Remaja Rosda Karya, 2007.
[1]
James A. Black dan Dean J. Champion, Metode dan Masalah Penelitian Sosial,
(Bandung:
Refika Aditama, 2001), h.193
[2]
Saifuddin Azwar, Penyusunan Skala Psikologis, (Yokyakarta: Pustaka
fajar, 2003), h.
[3]
Departemen Pendidikan Nasional, Kamus Besar bahasa Indonesia, ( Jakarta: Balai Pustaka, 2005), h.1258
[4]Jack
R. Fraenkel dan Norman E. Wallen, How to Design and Evaluate Research, In
Education, (Singapore: Me graw-Hill, 1993), h. 139
[5]
James A. Black dan Dean J. Champion, op.cit, h. 193
[6]
Saifuddin Azwar, lok.cit.
[7]
James A. Black dan Dean J. Champion, op.cit,
h. 204
[8] Moh. Nazir, Metode Penelitian, (Bogor: Ghalia Indonesia, 2005), Cet. Ke-6,
h. 133-134