INSTRUMENT VALIDITY AND RELIABILITY

A. Pendahuluan

Dalam sebuah penelitian, salah satu segi yang penting adalah penggunaan instrument (alat pengukuran). Sebab instrument pada hakikatnya adalah untuk mengungkapkan fakta-fakta dari data yang diharapkan. Kemudian instrument dipergunakan juga untuk melaporkan data dan beberapa informasi, atau kesimpulan yang benar dari kegiatan penelitian.

Menurut James A. Black dan Dean J. Champion menyebutkan, bahwa : “Alat pengukuran setidak-tidaknya mempunyai dua perangkat penting yang menjadi perhatian para ilmuan sosial, yakni kesahihan (validity), dan keterandalan (reliability)”.[1]

Dengan demikian dapat dipahami, bahwa suatu instrumen dikatakan valid atau sahih apabila instrumen tersebut mampu mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang tepat dari suatu variabel yang diteliti. Misalnya timbangan emas dapat mengukur berat emas, atau meteran dapat digunakan untuk mengukur tinggi badan.

Kemudian, suatu instrumen dikatakan reliable apabila alat ukur yang dipakai dapat dipercaya atau handal. Dalam konteks pengukuran, reliabilitas menyangkut ketepatan alat ukur. Dalam artian alat ukur tersebut stabil, dapat dihandalkan (dependability), dan dapat diramalkan (predictability). Menurut Syaifuddin Azwar “Reliabilitas adalah tingkat kepercayaan hasil suatu pengukuran. Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu memberikan hasil ukur yang terpercaya, disebut reliabel”.[2]

Jadi sifat reliabel (terandal) dari suatu alat ukur berhubungan dengan kemampuan alat ukur tersebut memberikan hasil yang konsisten. Misalnya, ketika kita melakukan pengukuran tinggi benda seperti tinggi meja digunakan alat ukur jengkal tangan. Hasilnya lima jengkal pada pengukuran pertama, ukuran yang sama juga akan didapatkan pada pengukuran berikutnya. Artinya alat ukur yang dipakai adalah valid dan juga reliabel. Akan tetapi bila objek yang diukur adalah gedung berlantai limabelas, mungkinkah jengkal tangan akan memberikan hasil yang konsisten? Kemungkinan besar tidak. Ini berarti alat pengukurannya valid, tetapi tidak reliabel.

Sehubungan dengan pokok pemikiran tersebut diatas, maka dalam makalah ini penulis akan membahas “Instrument Validity dan Reliability”, sehingga kita mendapatkan gambaran yang jelas tentang hal tersebut.

B. Validity ( Kesahihan)

1. Pengertian

Menurut Kamus Besar Bahasa Indonesia “ Validity (validitas) adalah sifat benar menurut bahan bukti yang ada, logika berfikir, atau kekuatan hukum; sifat Valid: kesahihan: menentukan suatu tes dengan tepat memang sukar”.[3]

Jack R. Fraenkel dan Norman E. Wallen, mengemukakan bahwa “ Validity adalah gambaran kesimpulan yang benarberdasarkan data yang diperoleh melalui penggunaan instrumen”.[4]

Selltiz, (dkk) dalam James A. Black dan Dean J. Champion menyatakan, bahwa “ Kesahihan sebuah alat pengukuran didefenisikan sebagai perangkat ukuran yang memperkenankan peneliti untuk menyatakan bahwa alat pengukur apa yang ia katakan akan mengukur”.[5]

Dari pengertian tersebut diatas dapat dipahami, bahwa validitas (kesahihan) meruapakan hal yang sangat penting dalam mempersiapkan sebuah instrumen. Sebab instrumen pada hakikatnya adalah untuk memperoleh informasi dan melaporkan data yang benar tentang sesuatu yang diteliti. Sehubungan dengan itu, maka validitas dijadikan sebagai bahan penuh arti, dan memberi laporan secara spesifik berdasarkan data yang terkumpul. Jadi ketepatan sebuah pengukuran adalah proses pengumpulan bukti-bukti pendukung, sehingga sampai kepada suatu kesimpulan yang akurat, penuh arti, dan bermamfa’at.

Dengan demikian dapat disimpulkan, bahwa suatu instrumen dikatakan sahih apabila relevan antara alat ukur dengan apa yang akan diukur. Misalnya dalam suatu tes mengukur sifat X. Alat pengukuran dikatakan sahih apabila pada tes tersebut benar-benar mengukur sifat X. Akan tetapi apabila mengukur sifat lain yang bukan sifat X, sementara alat pengukuran yang dipakai adalah untuk mengukur sifat X, maka alat pengukuran tersebut tidak sahih, dan begitu juga sebaliknya.

2. Jenis-Jenis Kesahihan

Kesahihan sebuah ukuran bisa ditinjau dari beberapa perspektif yang berbeda. Setidaknya terdapat tiga jenis kesahihan, yaitu konten, konkuren (prediktif), dan konstruk.

Secara umum, kesahihan sebuah tes berstandar pada dua faktor penting, yaitu logika dan pembuktian statistik. Masing-masing dari tiga jenis kesahihan diatas selalu menggunakan logika dan verifikasi statistik sebagai cara untuk menetapkan derajat kesahihan dari alat pengukuran.

a. Content-related evidence of validity

Content related evidence of validity adalah kesahihan dari instrumen yang menjadi pengukur sebuah penelitian. Sejauhmana sebuah instrumen bisa memberikan pemahaman dan tingkat ketepatannya. Apakah yang digambarkan sebuah variabel dapat diterima dengan logis ?, bagaimana sampel dari soal-soal atau pertanyaan memadai untuk dapat menjadi sebuah penilaian? Apakah polanya benar ? Semuanya itu menunjukkan bahwa antara content dengan polanya harus bersesuaian dengan variabel dan sampel pokok penelitian.

Content validity disebut juga dengan validitas isi, yaitu suatu model yang digunakan dalam menentukan validitas suatu alat ukur, atau tes dengan cara menilai sejauhmana item-item yang dibuat sesuai dengan tingkat tingkah laku yang akan diukur, atau sejauh isi alat ukur tersebut mewakili semua aspek yang dianggap sebagai aspek kerangka konsep. Jadi, validitas isi mempersoalkan apakah isi dari suatu alat ukur (bahannnya, topiknya, substansinya) cukup representatif, maka dalam validitas isi dipandu dengan pertanyaan “ apakah isi atau substansi dari suatu alat ukur merupakan representatif dari isi dan sifat-sifat yang ingin diukur?”.

Seorang peneliti ingin meneliti tentang “ pengaruh program ilmu pasti baru terhadap kemampuan matematika kelas 5 (lima)”. Selama penyelesaian dari program ini, peneliti berharap siswa mampu menyelesaikan permasalahan kata dari sejumlah tipe atau bentuk yang berbeda dengan benar. Untuk mengukur kemampuan matematika siswa, peneliti merencanakan memberikan siswa latihan matematika dengan 15 (lima belas) soal. Pada tes ini siswa perlu menggambarkan tingkatan-tingkatan yang dibutuhkan dari kemampuan mereka untuk menyelesaikan permasalahan tersebut. Sebab itu, pelaksanaan pada alat-alat dalam hal ini (pengujian matematika) akan memberikan bukti yang valid dari kemampuan matematika siswa ini untuk kelas/ tingkatan pada instrumen diberikan contoh yang cukup dari bentuk permasalahan yang dipelajari dalam program ini. Jika tes hanya mencakup permasalahan yang mudah, sulit, lama waktunya, dan permasalahan mengurangi, atau tes tidak mewakili, maka tidak akan memberikan informasi dari laporan yang valid.

Kunci dasar dalam content-related evidence, berkisar tentang kecukupan sampel dalam instrumen, seperti pada tes prestasi, hanya menyajikan sebuah sampel dari bermacam permasalahan yang dipertanyakan. Content validation adalah acuan/ pertimbangan dari pembagian permasalahan, jika kandungan instrumen dapat mewakili sampel yang ada disekitar kandungan tersebut.

Bentuk lain untuk kadar kevalidan harus dilakukan penyusunan atau pembentukan instrumen yang dapat mencatat secara jelas tentang sesuatu, seperti bentuk ukur, waktu yang dibutuhkan, ketepatan bahasa, kejelasan petunjuk, dan lain-lain. Hal tersebut tidak akan berarti, apabila diberikan pertanyaan pada sebuah instrumen dalam tes bahasa Inggris kepada anak yang minim bahasa Inggrisnnya. Oleh karena itu, perlu dipahami bahwa pertanyaan yang akan diberikan harus sesuai dengan karakteristik sampel yang diinginkan.

Bagaimana seseorang akan memperoleh keakuratan instrumen sebagai alat ukur? Langkah umum untuk memperoleh ini, seseorang harus memperhatikan kadar isi atau rancangan instrumen serta menela’ah tepat atau tidaknya. Seseorang tidak harus seperti orang lain, tetapi harus berprinsip sebagai seorang individu yang bisa diharapkan, cenderung untuk memberikan penilaian kemampuan tetang keterukuran instrumen. Sebagai langkah umum yang dapat dipedomani adalah : (1). Peneliti menyalin defenisi dari apa yang akan diukur, (2). Peneliti menulis defenisi dan gambaran sampel yang dituju untuk satu penilaian atau lebih, (3). Penilaian dilihat pada defenisi; mengenal soal-soal atau pertanyaan pada instrumen dan membubuhkan penandaaan diakhir soal atau pertanyaan. Dalam hal ini yang perlu mendapat penandaan adalah soal yang dirasa tidak dapat mengukur satu pokok permasalahan atau lebih, serta menandai soal pada setiap pokok pembahasan yang tidak dinilai/ diujikan. Kemudian, penilaian juga menguji ketepatan bentuk instrumen. (4). Peneliti menyalin dan memeriksa kembali setiap soal atau pertanyaan yang akan diujikan, (5). Semua soal dan pertanyaan disetujui dalam instrumen dan mengindentifikasikan jumlah keseluruhan dari soal-soal, apakah cukup mewakili bagian isi dari variabel yang diukur.

Untuk menggambarkan bagaimana peneliti mencoba untuk membuat kesahihan instrumen sebagai alat ukur, dapat diperhatikan contoh berikut:

Contoh 1 :

Peneliti meneliti kemampuan siswa untuk menggunakan laporan-laporan yang mereka perdapat pada waktu dulu, peneliti memberikan defenisi: “untuk laporan yang dapat siswa pakai dari perolehan imformasi sebelumnya, mereka harus mampu untuk:

a. Melukiskan kesimpulan yang tepat (secara lisan atau tertulis) berdasarkan informasi-informasi yang diberikan.

b. Mengindentifikasikan satu kesimpulan logis atau lebih beserta sebuah penjelasan (point of view)

c. Menyajikan bahwa ide-ide tersebut adalah setara, sama, tidak berhubungan atau berlawanan.

Dari hal diatas, bagaimana peneliti bisa bisa mendapatkan bukti-bukti seperti itu? Peneliti memutuskan untuk mempersiapkan tes yang berisikan banyak pertanyaan untuk siswa-siswa untuk jawaban. Jawaban-jawaban merupakan bukti yang mereka butuhkan. Ada tiga buah contoh dari bermacam-macam pertanyaan peneliti berikan. Satu rancangan untuk mendapatkan setiap tiga buah tipe dari bukti yang disebutkan diatas.

1. Jika A besar dari B, dan B besar dari C, maka:

a. A harus besar dari C

b. C harus kecil dari A

c. B harus kecil dari A

d. Semua yang diatas benar

2. Hal-hal yang meyakini peningkatan pemakaian konsumen menjadi cara yang benar untuk mendorong ekonomi akan menunjang:

a. Peningkatan-peningkatan atau rata-rata permintaan

b. Persediaan menipis

c. Penurunan pemasukan (income)

3. Bandingkan pengeluaran yang dikeluarkan pemerintahan untuk state selama tahun-tahun yang lalu:

a. Hutang gaji

b. Keamanan

c. Pelayanan sosial

Sekarang perhatikan setiap pertanyaan dan yang berhubungan dengan pokok bahasan didapatkan, atau diukur. Apakah setiap pertanyaan dirancang permasalahannya, jika tidak kenapa?

Contoh 2:

Disini apa yang dirancang peneliti untuk pengukuran kemampuan siswa untuk menerangkan kemungkinan terjadi?

Derection : Ada beberapa fakta

Fakta W : Pekemah mulai menyalakan api untuk memasak makanan dimusim kemarau/ waktu ada angin didalam hutan.

Fakta X : Api mulai menyala pada rumput yang kering disekitar perkemahan

Fakta Y : Sebuah rumah di dalam hutan terbakar

Terangkan kemungkinan penyebab rumah terbakar (fakta Y). Sedangkan fakta W dan fakta X bisa membantu menerangkannya.

a Ya. Fakta W dan X kemungkinan penyebab ( karena keduanya menggambarkan hubungan).

b. Ya. Kedua W dan X berguna, tak satupun penyebab lain yang mengakibatkannya.

c. Tidak. Sebab Cuma satu fakta X atau Y yang menjadi penyebab.

d. Tidak. Karena tak satupun W atau X yang menjadi penyebab.

Perhatikan pertanyaan dan pokok pembahasan yang dirancang untuk diukur, apakah itu mengukur objektifnya? Jika tidak mengapa? Lakukanlah kembali seperti ini, untuk perolehan bukti-bukti sampel. Contoh diatas pendukung penilaian, dimana soal-soal mengukur apa-apa yang diinginkan, seperti halnya dalam proses memperoleh keakuratan dari pemilihan alat/ instrumen. Namun satu hal yangperlu dipahami, bahwa kualitas dari penilaian selalu merupakan acuan penting dan karakteristik dari sampel yang diinginkan harus diketahui.

b. Criterion-related evidence of validity

Criterion-related evidence of validity (validitas keriteria) adalah keterangan yang diperoleh sama dari penggunaan instrumen dengan instrumen yang lainnya, atau ukuran yang satu dengan yang lainnya.

Untuk mendapatkan keriteria dari kesahihan dari instrumen, biasanya peneliti membandingkan antara suatu instrumen hasil satu kesatuan yang valid dengan pengukuran tersendiri. Dengan demikian dapat dipahami, bahwa validitas keriteria adalah validats yang dilihat dengan membandingkan suatu keriteria atau variabel yang diketahui atau yang dipercaya dapat digunakan untuk mengukur suatu atribut tertentu. Jika skor atau skala yang diukur dibandingkan dengan satu, atau lebih keriteria (variabel) yang dianggap dapat mengukur apa yang ingin diukur, maka yang dikerjakan adalah menetapkan validitas dari alat ukurnya.

Dalam validitas berdasrkan keriteria, umumnya alat ukur yang akan diuji validitasnya disebut sebagai prediktor. Statistik yang diperlukan dalam pengujian valitas ini adalah koefisien korelasi antara skor tes sebagai prediktor, dan skor suatu kriteria yang relevan.

Validitas berdasarkan kriteria dapat dibedakan atas dua macam, yaitu: (1). Validitas prediktif, (2). Validitas konkuren

a. Predictive validity ( Validitas prediktif)

Alat ukur yang dirancang oleh peneliti, sering kali ditujukan untuk memprediksi apa yang akan terjadi dimasa yang akan datang. Tingkat suatu alat ukur yang dibuat dapat dengan akurat meramalkan suatu kriteria dimasa yang akan datang. Inilah yang disebut dengan predictive validity. Jadi, suatu alat ukur dikatakan valid jika hasil dari pengukuran ini sesuai dengan tingkah laku atau gejala-gejala yang diramalkan.

Contoh “ ujian seleksi masuk perguruan tinggi”. Bila ternyata terdapat korelasi yang tinggi antara ujian seleksi masuk perguruan tinggi dengan indeks prestasi belajar mahasiswa, maka soal ujian seleksi memiliki validitas prediktif. Artinya alat ukur tersebut dapat memprediksi apa yang akan terjadi dimasa yang akan datang.

b. Concurrent validity (validitas konkuren).

Validitas konkuren atau valitas pada sa’at bersamaan adalah pengujian validitas, suatu alat ukur dengan melihat sejauhmana kesulitan antara hasil ukur skala tersebut dengan hasil ukur instrumen lain yang sudah teruji kualitasnya, atau dengan ukuran-ukuran yang dianggap dapat menggambarkan aspek-aspek yang telah diukur. Validitas ini digunakan dalam membuat alat ukur baru, karena alat ukur lama untuk variabel yang sama kurang praktis.

Untuk menguji kesesuaian hasil ukur skala (alat ukur baru) dengan hasil ukur kriteria (alat ukur lama), maka kedua alat ukur tersebut diterapkan pada kelompok sampel dan diberi nilai. Perhitungan koefisien korelasi antara skor subjek pada skalanya (alat ukur baru), dan skor subjek pada kriterianya (alat ukur lama) akan menghailkan koefisien korelasi yang merupakan koefisien validitas skala yang bersangkutan. Jika hasil pengukuran menunjukan korelasi positif yang tinggi, maka berarti bahwa alat ukur yang baru tersebut mempunyai validitas konkuren yang tinggi.

c. Construct-related evidence of validity

Construct-related evidence of validity adalah keakuratan dari sifat atau karakter yang diukur oleh sebuah instrumen. Bagaimana kebenaran/ konsepsi membangun perbedaan kesimpulan pada tingkah laku dari individu atau kebiasaan-kebiasaan pada waktu-waktu tertentu.

Disisi lain, construct validity (valitas konstrak) adalah suatu abstraksi dan generalisasi khusus, dan merupakan suatu konsep yang secara khusus diciptakan untuk kebutuhan ilmiah dan mempunyai pengertian terbatas. Konstrak tersebut diberi defenisi dapat diamati dan diukur.

Dalam penelitian ilmiah, konstrak diperoleh melalui beberapa cara:

a. Mencari defenisi-defenisi konsep yang dikemukakan oleh para ahli didalam berbagai literatur. Defenisi suatu konsep biasanya berisi kerangka dari konsep tersebut. Apabila sudah ditemukan, defenisi yang jelas dan cukup operasional untuk dijadikan dasar penyusunan alat ukur, maka defenisi tersebut sudah dapat digunakan secara lansung untuk menyusun item-item pertanyaan dalam kuisioner. Tetapi apabila defenisi yang dikemukakan belum operasional, maka defenisi tersebut harus dijabarkan lebih lanjut, agar lebih operasional, sehingga dapat dijadikan sebagai dasar penyusunan pertanyaan dalam kuisioner.

b. Apabila defenisi suatu konsep tidak ditemukan dalam literatur, maka peneliti harus mendefenisikan sendiri konsep tersebut. Dalam merumuskan dfenisi suatu konsep ini, peneliti sebaiknya mendiskusikannya dengan ahli yang kompeten dibidang tersebut. Pendapat ahli tentang konsep tersebut, kemudian dibandingkan dengan pendapat peneliti sendiri.

c. Apabila pendapat para ahli tidak ditemukan, maka peneliti dapat menyatakan defenisi suatu konsep yang akan diukur kepada calon responden atau kepada orang-orang yang memiliki karakteristik yang sama dengan responden. Misalnya peneliti ingin mengukur konsep stres di sekolah. Untuk mendefenisikan konsep tersebut, peneliti dapat lansung menanyakan kepada beberapa calon responden tentang faktor-faktor penyebab ia mengalami stres disekolah..

Untuk keperluan penelitian ilmiah, konstrak yang digunakan harus valid. Dalam melihat validitas konstrak, setidaknya ada beberapa pertanyaan yang perlu dijawab.

- Komponen atau dimensi apa saja yang membentuk konsep tersebut?

- Apakah landasan teoritis yang merangkum dimensi tersebut?

- Bukti empris apakah yang memperlihatkan ada atau tidaknya keterkaitan antara komponen atau dimensi-dimensi.

Untuk menguji validitas konstrak psikologis, seperti intelegensia, persepsi, sikap, dan lain-lain hal yang pertama sekali yang dilakukan oleh seorang peneliti adalah menganalisa unsur-unsur yang menjadi bagian dari konstrak tersebut. Kemudian dilihat isi dan makna dari komponen-komponennya serta alat ukur yang digunakan untuk mengukur konstrak tersebut. Misalnya untuk menentukan kecerdasan interpersonal seseorang dapat dilihat dari empat dimensi, yaitu: 1). Mengorganisir kelompok, 2). Merundingkan pemecahan, 3). Hubungan pribadi, 4). Analisis sosial. Apabila terdapat konsistensi antara dimensi konsep yang satu dengan dimensi yang lainnya, maka konstrak tersebut dianggap memiliki validitas.

Dari sisi lain, adalah dalam mengukur validitas konstrak dari konsep intelegensi. Langkah pertama, yang perlu dilakukan adalah menentukan apakah yang sebenarnya diukur oleh tes intelegensi yang mempunyai imensi banyak itu, apakah kemampuan menghafal, kemampuan menganalisa, kemampuan mengadakan evaluasi, kemampuan membuat sintesa, atau kemampuan menerapkan sesuatu ? Setelah dimensi dari intelegensi diukur, baru disusun alat ukur untuk masing-masing dimensi intelegensi tersebut. Langkah kedua, adalah menentukan suatu kriteria yang secara umum dapat digunakan untuk membedakan orang yang mempunyai intelegensi rendah.

C. Reliability ( Keterandalan)

1. Pengertian

Saifuddin Azwar mendefenisikan “Reliability/ reliabilitas (keterandalan) adalah tingkat kepercayaan hasil suatu pengukuran. Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu memberikan hasil ukur yang terpercaya, disebut reliabel”.[6]

Selltiz, dkk dalam James A. Black dan Dean J. Champion menyebutkan “ keterandalan dari suatu alat pengukuran didefenisikan sebagai kemampuan alat untuk mengukur gejala secara konsisten yang dirancang untuk mengukur”.[7]

Moh. Nazir menjelaskan bahwa suatu alat ukur disebut mempunyai reliabilitas tinggi atau dapat dipercaya, jika alat ukur itu mantap, dalam pengertian bahwa alat ukur tersebut stabil, dapat diandalkan (dependability) dan dapat diramalkan (predictability). Suatu alat ukur yang mantap tidak berubah-rubah pengukurannya dan dapat diandalkan, karena penggunaan alat ukur tersebut berkali-kali akan memberikan hasil yang serupa”.[8]

Dari pengertian diatas dapat dipahami, bahwa reliability (reliabilitas) alat ukur adalah suatu alat yang digunakan untuk tujuan mengungkapkan aspek-aspek psikologis atau dimensi-dimensi kepribadian manusia, maka skala psikologi harus mengandung pernyataan-pernyataan yang baik serta memiliki tingkat reliabilitas yang tinggi.

Dalam hal pengukuran, reliabilitas berhubungan dengan ketepatan alat ukur. Reliabilitas disebut juga kepercayaan, keterandalan, konsistensi, atau kestabilan suatu alat ukur. Dikatakan memiliki reliabilitas yang tinggi atau dapat dipercaya apabila alat ukur tersebut stabil, dapat diandalkan, serta diramalkan.

Jadi sifat reliabel dari suatu alat ukur berkenaan dengan kemampuan alat ukur tersebut memberikan hasil yang konsisten. Bisa dibayangkan, jika kita mempunyai alat ukur yang hasil pengukurannya berbeda-beda pada setiap kali melakukan pengukuran, lalu bagaimana kita menggunakan datanya.

2. Metode keandalan ukuran

Metode yang dapat digunakan untuk menentukan keterandalan suatu alat pengukuran, dapat dikelompokkan kepada dua kategori, yaitu : Prosedur konsistensi eksternal dan prosedur konsistensi internal, dengan menggunakan metode-metode berikut ini:

a). Tes-Retest Method, yaitu untuk menentukan keterandalan suatu alat ukur, seperti pengukuran sikap dan berbagai gejala sosial serta psikologis. Tes ini diberikan kepada suatu sampel individu pada suatu sa’at tertentu. Setelah melewati interval waktu tertentu, alat ukur diberikan kembali kepada sampel individu yang sama. Kemudian dua set hasil tes ini dikorelasikan, dan hasil koefisien korelaasinya merupakan ukuran dari tingkat keterandalan alat ukur sikap.

b). Equivalent-Forms Method, adalah bentuk dari sebuah pengukuran dilaksanakan untuk kelompok yang sama dari individu-individu selama waktu tertentu, dengan pertanyaan yang berbeda. Mereka diharapkan dapat menyuguhkan isi yang sama dan harus terpisah dari yang lainnya. Ketetapan koefisien dihitung dihitung dari dua bentuk nilai-nilai yang diperoleh. Sebuah koefisien yang tinggi menunjukan bukti yang kuat dari reliabilitas atau ketepatan dua bentuk pengukuran yang sama.

c). Internal-consistency method, yaitu suatu metode yang digunakan dalam soal-soal mengukur gejala yang sama secara logis, harus berdampingan dalam suatu pola yang konsisten. Seseorang yang menyukai pekerjaannya tidak akan memberi jawaban yang menggambarkan bahwa ia tidak menyukai pekerjaannya. Dalam artian seseorang dengan beberapa sifat khusus akan menjawab soal dengan cara yang dapat diramalkan serta dipengaruhi oleh sifat-sifat tersebut.

d). Alpha-Coeffecient, adalah bentuk umum dari pengukuran kereliabelan soal-soalyang tidak cocok, seperti beberapa tes Essay yang memerlukan lebih dari satu jawaban. Selain itu, pengukuran ini mengharapkan rata-rata dari semua kemungkinan nilai reliabilitas, dihitung dengan cara belah dua. Dengan menggunakan pendekatan ini, kita tidak perlu menghitung semua reliabilitas belah dua tersebut.

e). Scoring-Agreement, adalah suatu metode yang digunakan dengan cara khusus, dan dinilai secara objektif. Sedangkan kunci jawaban yang tersedia sesuai dengan nilai-nilai tertentu. Perbedaan nilai seseorang dari dua kali tes dengan pelaksanaan yang berbeda, ditujukan pada yang mempunyai nilai tinggi. Tak ada kesalahan dengan alat-alat yang cocok untuk membedakan pelaksanaan penilaian, seperti penilaian sebuah essay.

Itulah beberapa metode yang digunakan dalam mengukur reliabilitas sebuah alat ukur, yang kesemuanya itu mempunyai keuntungan dan kelemahan. Hanya saja kita tentu akan merelevankan dengan keadaan dimana penelitian itu dilansungkan, serta dalam kondisi apa responden tersebut menyelesaikan soal-soal dalam tes.

D. Penutup

1. Kesimpulan

a. Validity (validilitas) disebut juga kesahihan suatu alat ukur, yaitu suatu alat ukur (instrumen) mampu mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang tepat dari suatu variabel yang diteliti.

b. Kesahihan terdiri dari beberapa jenis, yaitu:

1). Content-related evidence of validity, disebut juga validitas isi, yaitu suatu medel yang digunakan, apakah isi atau substansi dari suatu alat ukur merupakan representatif dari isi dan sifat-sifat yang ingin diukur.

2). Criterion-related evidence of validity (validitas kriteria), adalah keterangan yang diperoleh sama dari penggunaan instrumen dengan instrumen yang lainnya, atau ukuran yang satu dengan yang lainnya. Validitas ini terdiri dari dua jenis, yaitu:

> Predictive validity (Validitas prediktif), yaitu alat ukur yang digunakan untuk memprediksi apa yang akan terjadi dimasa yang akan datang.

> Concurrent-validity (validitas konkuren), yaitu pengujian validitas suatu alat ukur dengan melihat sejauhmana kesulitan antara hasil ukur skala dengan instrumen yang sudah teruji kualitasnya.

3). Construct-related evidence of validity, yaitu keakuratan dari sifat atau karakter yang diukur oleh sebuah instrumen.

c. Reliability (reliabilitas) adalah keterandalan, kepercayaan, konsistensi, atau kestabilan suatu alat ukur. Jadi sifat reliabel suatu alat ukur berkenaan dengan kemampuan alat ukur.

d. Metode yang digunakan untuk menentukan keterandalan suatu alat pengukuran terdiri dari: 1). Prosedu konsistensi eksternal, dan 2). Prosedur konsistensi internal, dengan menggunakan metode-metode sebagai berikut:

1). Tes-Retest method, yaitu metode yang digunakan untuk pengukuran sikap dan berbagai gejala sosial atau psikologis.

2). Equivalent-forms method, yaitu metode yang digunakan dalam pengukuranuntuk kelompok yang sama dari individu selama waktu tertentu, dengan pertanyaan yang berbeda.

3). Internal-consistency method, yaitu metode yang digunakan dalam soal-soal, mengukur gejala yang sama secara logis, harus berdampingan dalam suatu pola yang konsisten.

4). Alpha-coeffecient, adalah bentuk umum dari pengukuran kereliabelan, yang mengharapkan rata-rata dari semua kemungkinan nilai reliabilitas, dihitung dengan cara belah dua.

5). Scoring-agrrement, adalah suatu metode yang digunakan secara khusus, dan dinilai secara objektif.

e. Validitas dan reliabilitas suatu alat ukur (instrumen) sangat penting dalam penelitian, sebab hal ini akan menentukan keberhasilan seseorang dalam penelitian, terutama mengungkapkan fakta-fakta dari data yang diharapkan, kebenaran kesimpulan, serta informasi yang konkrit dari suatu teori.

2. Saran-saran.

Demikianlah makalah yang sederhana ini penulis sampaikan, diharapkan kepada semua pihak dapat menyampaikan kritik yang membangun untuk kesempurnaannya buat masa yang akan datang.

DAFTAR KEPUSTAKAAN

Azwar, Saifuddin , Penyusunan Skala Psikologis, Yokyakarta: Pustaka fajar, 2003

Arikunto, Suharsimi, dkk, Penelitian Tindakan Kelas ,Jakarta: Bumi Aksara, 2007.

Manajemen Penelitian, Jakarta: Rineka Cipta, 2003.

A. Black, James dan Dean J. Champion, Metode dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001

Departemen Pendidikan Nasional, Kamus Besar bahasa Indonesia, Jakarta: Balai Pustaka, 2005

Emizir, Metodologi Penelitian Pendidikan, Kuantitatif dan Kualitatif, Jakarta: Rajagrafindo Persada, 2008.

Frenkel, Jack R. dan Norman E. Wallen, How to Design and Evaluate Research, In Education Singapore: Me graw-Hill, 1993

Hopkins, David, A. Teache’r Guide to Classroom Research, Philadelphia: Open University Press, 1993.

James A. Black, James dan Dean J. Champion, Metode dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001

Nazir, Moh., Metode Penelitian, Bogor: Ghalia Indonesia, 2005.

Narbuko, Cholid dan Abu Achmadi, Metode Penelitian, Jakarta: Bumi Aksara, 2003.

Rory O’Brien, An Overview of the Methological Approach of Aktion Research.http:// www.web. net/ ~robrien/papers/ arfinal.html (29/11/2005).

Sudjana, Nana dan Ibrahim, Penelitian dan Penilaian Pendidikan, Bandung: Sinar Baru Algensindo, 2007.

Madja, Rochiati, Metode Penelitian Tindakan Kelas, Bandung: Remaja Rosda Karya, 2007.

[1]Naskah Asli Dapat Dipesan Via email di buku tamu

menu melayang

INSTRUMENT VALIDITY AND RELIABILITY

Back to Top

Cari Artikel

Popular Post

TEORI DAN HUKUM PERKEMBANGAN

STRATEGI PEMBELAJARAN LANGSUNG DAN STRATEGI PEMBELAJARAN TIDAK LANGSUNG

MASALAH PENELITIAN KUALITATIF

METODE PEMBELAJARAN SKI DAN IMPLIKASINYA DALAM PEMBELAJARAN

TIGA ALIRAN ILMU KALAM (RASIONAL,TRADISIONAL DAN ANTARA RASIONAL DAN TRADISIONAL)

Label

Pengunjung Bulan Ini