Instrument Validity And Reliability

A. Pendahuluan

Dalam suatu penelitian, salah satu sisi yang penting yakni penggunaan instrument (alat pengukuran). Sebab instrument pada hakikatnya adalah untuk mengungkapkan fakta-fakta dari data yang dibutuhkan. Kemudian instrument dipergunakan juga untuk melaporkan data dan beberapa info, atau kesimpulan yang benar dari kegiatan observasi.

Menurut James A. Black dan Dean J. Champion menyebutkan, bahwa : “Alat pengukuran setidak-tidaknya memiliki dua perangkat penting yang menjadi perhatian para ilmuan sosial, yaitu kesahihan (validity), dan keterandalan (reliability)”.[1]

Dengan demikian dapat diketahui, bahwa suatu instrumen dikatakan valid atau otentik kalau instrumen tersebut bisa mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang tepat dari suatu variabel yang diteliti. Misalnya timbangan emas mampu mengukur berat emas, atau meteran dapat digunakan untuk mengukur tinggi tubuh.

Kemudian, sebuah instrumen dibilang reliable jika alat ukur yang digunakan sanggup menerima amanah atau tangguh. Dalam konteks pengukuran, reliabilitas menyangkut ketepatan alat ukur. Dalam artian alat ukur tersebut stabil, dapat dihandalkan (dependability), dan mampu diramalkan (predictability). Menurut Syaifuddin Azwar “Reliabilitas yaitu tingkat iman hasil sebuah pengukuran. Pengukuran yang mempunyai reliabilitas tinggi, adalah pengukuran yang mampu memberikan hasil ukur yang terpercaya, disebut reliabel”.[2]

Jadi sifat reliabel (terandal) dari sebuah alat ukur berafiliasi dengan kesanggupan alat ukur tersebut menunjukkan hasil yang konsisten. Misalnya, ketika kita melaksanakan pengukuran tinggi benda mirip tinggi meja dipakai alat ukur jengkal tangan. Hasilnya lima jengkal pada pengukuran pertama, ukuran yang sama juga akan ditemukan pada pengukuran selanjutnya. Artinya alat ukur yang dipakai yakni valid dan juga reliabel. Akan namun jika objek yang diukur adalah gedung berlantai limabelas, mungkinkah jengkal tangan akan memperlihatkan hasil yang konsisten? Kemungkinan besar tidak. Ini mempunyai arti alat pengukurannya valid, tetapi tidak reliabel.

Sehubungan dengan pokok pemikiran tersebut diatas, maka dalam makalah ini penulis akan membahas “Instrument Validity dan Reliability”, sehingga kita mendapatkan gambaran yang terang wacana hal tersebut.

B. Validity ( Kesahihan)

1. Pengertian

Menurut Kamus Besar Bahasa Indonesia “ Validity (validitas) ialah sifat benar berdasarkan bahan bukti yang ada, akal berfikir, atau kekuatan hukum; sifat Valid: kesahihan: memilih sebuah tes dengan tepat memang susah”.[3]

Jack R. Fraenkel dan Norman E. Wallen, mengemukakan bahwa “ Validity yaitu citra kesimpulan yang benarberdasarkan data yang diperoleh lewat penggunaan instrumen”.[4]

Selltiz, (dkk) dalam James A. Black dan Dean J. Champion menyatakan, bahwa “ Kesahihan sebuah alat pengukuran didefenisikan sebagai perangkat ukuran yang memperkenankan peneliti untuk menyatakan bahwa alat pengukur apa yang dia katakan akan mengukur”.[5]

Dari pemahaman tersebut diatas mampu dimengerti, bahwa validitas (kesahihan) meruapakan hal yang sangat penting dalam mempersiapkan suatu instrumen. Sebab instrumen pada hakikatnya yaitu untuk mendapatkan gosip dan melaporkan data yang benar ihwal sesuatu yang diteliti. Sehubungan dengan itu, maka validitas dijadikan sebagai bahan sarat arti, dan memberi laporan secara spesifik berdasarkan data yang terkumpul. Makara ketepatan sebuah pengukuran ialah proses pengumpulan bukti-bukti penunjang, sehingga sampai terhadap sebuah kesimpulan yang akurat, sarat arti, dan bermamfa’at.

Dengan demikian dapat ditarik kesimpulan, bahwa sebuah instrumen dibilang asli kalau berhubungan antara alat ukur dengan apa yang mau diukur. Misalnya dalam suatu tes mengukur sifat X. Alat pengukuran dikatakan asli bila pada tes tersebut sungguh-sungguh mengukur sifat X. Akan tetapi apabila mengukur sifat lain yang bukan sifat X, sementara alat pengukuran yang digunakan ialah untuk mengukur sifat X, maka alat pengukuran tersebut tidak asli, dan begitu pula sebaliknya.

2. Jenis-Jenis Kesahihan

Kesahihan sebuah ukuran bisa ditinjau dari beberapa perspektif yang berlawanan. Setidaknya terdapat tiga jenis kesahihan, adalah konten, konkuren (prediktif), dan konstruk.

Secara umum, kesahihan suatu tes berstandar pada dua aspek penting, ialah nalar dan pembuktian statistik. Masing-masing dari tiga jenis kesahihan diatas senantiasa memakai nalar dan verifikasi statistik selaku cara untuk menetapkan derajat kesahihan dari alat pengukuran.

a. Content-related evidence of validity

Content related evidence of validity yaitu kesahihan dari instrumen yang menjadi pengukur sebuah observasi. Sejauhmana sebuah instrumen bisa menunjukkan pemahaman dan tingkat ketepatannya. Apakah yang digambarkan suatu variabel mampu diterima dengan logis ?, bagaimana sampel dari soal-soal atau pertanyaan memadai untuk dapat menjadi suatu evaluasi? Apakah polanya benar ? Semuanya itu menawarkan bahwa antara content dengan polanya mesti bersesuaian dengan variabel dan sampel pokok penelitian.

Content validity disebut juga dengan validitas isi, yaitu suatu versi yang dipakai dalam memilih validitas suatu alat ukur, atau tes dengan cara menilai sejauhmana item-item yang dibuat sesuai dengan tingkat tingkah laris yang mau diukur, atau sejauh isi alat ukur tersebut mewakili semua aspek yang dianggap sebagai aspek kerangka konsep. Kaprikornus, validitas isi mempersoalkan apakah isi dari suatu alat ukur (bahannnya, topiknya, substansinya) cukup representatif, maka dalam validitas isi dipandu dengan pertanyaan “ apakah isi atau substansi dari sebuah alat ukur ialah representatif dari isi dan sifat-sifat yang ingin diukur?”.

Seorang peneliti ingin meneliti ihwal “ imbas acara ilmu pasti gres kepada kesanggupan matematika kelas 5 (lima)”. Selama penyelesaian dari program ini, peneliti berharap siswa bisa menyelesaikan problem kata dari sejumlah tipe atau bentuk yang berbeda dengan benar. Untuk mengukur kemampuan matematika siswa, peneliti merencanakan memperlihatkan siswa latihan matematika dengan 15 (lima belas) soal. Pada tes ini siswa perlu menggambarkan tingkatan-tingkatan yang diharapkan dari kesanggupan mereka untuk menyelesaikan persoalan tersebut. Sebab itu, pelaksanaan pada alat-alat dalam hal ini (pengujian matematika) akan memperlihatkan bukti yang valid dari kesanggupan matematika siswa ini untuk kelas/ tingkatan pada instrumen diberikan pola yang cukup dari bentuk masalah yang dipelajari dalam program ini. Jika tes cuma mencakup urusan yang gampang, sukar, usang waktunya, dan problem mengurangi, atau tes tidak mewakili, maka tidak akan menawarkan isu dari laporan yang valid.

Kunci dasar dalam content-related evidence, berkisar tentang kecukupan sampel dalam instrumen, mirip pada tes prestasi, cuma menyajikan sebuah sampel dari bermacam persoalan yang dipertanyakan. Content validation yaitu teladan/ pendapatdari pembagian permasalahan, kalau kandungan instrumen mampu mewakili sampel yang ada disekitar kandungan tersebut.

Bentuk lain untuk kadar kevalidan harus dijalankan penyusunan atau pembentukan instrumen yang mampu mencatat secara terang wacana sesuatu, mirip bentuk ukur, waktu yang dibutuhkan, ketepatan bahasa, kejelasan petunjuk, dan lain-lain. Hal tersebut tidak akan mempunyai arti, apabila diberikan pertanyaan pada suatu instrumen dalam tes bahasa Inggris terhadap anak yang minim bahasa Inggrisnnya. Oleh alasannya itu, perlu dimengerti bahwa pertanyaan yang mau diberikan harus sesuai dengan karakteristik sampel yang diinginkan.

Bagaimana seseorang akan menemukan keakuratan instrumen sebagai alat ukur? Langkah umum untuk menemukan ini, seseorang mesti memperhatikan kadar isi atau desain instrumen serta menela’ah sempurna atau tidaknya. Seseorang tidak harus mirip orang lain, tetapi harus berprinsip selaku seorang individu yang bisa dibutuhkan, condong untuk menawarkan evaluasi kemampuan tetang keterukuran instrumen. Sebagai langkah lazim yang dapat dipedomani yaitu : (1). Peneliti menyalin defenisi dari apa yang mau diukur, (2). Peneliti menulis defenisi dan gambaran sampel yang dituju untuk satu penilaian atau lebih, (3). Penilaian dilihat pada defenisi; mengenal soal-soal atau pertanyaan pada instrumen dan membubuhkan penandaaan diakhir soal atau pertanyaan. Dalam hal ini yang perlu menerima penandaan adalah soal yang dirasa tidak mampu mengukur satu pokok permasalahan atau lebih, serta menandai soal pada setiap pokok pembahasan yang tidak dinilai/ diujikan. Kemudian, evaluasi juga menguji ketepatan bentuk instrumen. (4). Peneliti menyalin dan mengusut kembali setiap soal atau pertanyaan yang mau diujikan, (5). Semua soal dan pertanyaan disetujui dalam instrumen dan mengindentifikasikan jumlah keseluruhan dari soal-soal, apakah cukup mewakili bab isi dari variabel yang diukur.

Untuk menggambarkan bagaimana peneliti menjajal untuk membuat kesahihan instrumen sebagai alat ukur, dapat diamati acuan berikut:

Contoh 1 :

Peneliti meneliti kemampuan siswa untuk memakai laporan-laporan yang mereka perdapat pada waktu dulu, peneliti menawarkan defenisi: “untuk laporan yang dapat siswa pakai dari perolehan imformasi sebelumnya, mereka mesti bisa untuk:

a. Melukiskan kesimpulan yang sempurna (secara mulut atau tertulis) berdasarkan berita-informasi yang diberikan.

b. Mengindentifikasikan satu kesimpulan logis atau lebih beserta sebuah klarifikasi (point of view)

c. Menyajikan bahwa wangsit-inspirasi tersebut yaitu setara, sama, tidak berafiliasi atau bertentangan.

Dari hal diatas, bagaimana peneliti mampu bisa menerima bukti-bukti seperti itu? Peneliti menetapkan untuk mempersiapkan tes yang berisikan banyak pertanyaan untuk siswa-siswa untuk balasan. Jawaban-balasan ialah bukti yang mereka butuhkan. Ada tiga buah pola dari beragam pertanyaan peneliti berikan. Satu rancangan untuk menerima setiap tiga buah tipe dari bukti yang disebutkan diatas.

1. Jika A besar dari B, dan B besar dari C, maka:

a. A harus besar dari C

b. C harus kecil dari A

c. B mesti kecil dari A

d. Semua yang diatas benar

2. Hal-hal yang meyakini peningkatan pemakaian konsumen menjadi cara yang benar untuk mendorong ekonomi akan menunjang:

a. Peningkatan-peningkatan atau rata-rata permintaan

b. Persediaan menipis

c. Penurunan pendapatan (income)

3. Bandingkan pengeluaran yang dikeluarkan pemerintahan untuk state selama tahun-tahun yang kemudian:

a. Hutang honor

b. Keamanan

c. Pelayanan sosial

Sekarang perhatikan setiap pertanyaan dan yang bekerjasama dengan pokok bahasan didapatkan, atau diukur. Apakah setiap pertanyaan dirancang permasalahannya, kalau tidak kenapa?

Contoh 2:

Disini apa yang dirancang peneliti untuk pengukuran kesanggupan siswa untuk mengambarkan kemungkinan terjadi?

Derection : Ada beberapa fakta

Fakta W : Pekemah mulai menyalakan api untuk memasak masakan dimusim kemarau/ waktu ada angin didalam hutan.

Fakta X : Api mulai menyala pada rumput yang kering disekitar perkemahan

Fakta Y : Sebuah rumah di dalam hutan terbakar

Terangkan kemungkinan penyebab rumah terbakar (fakta Y). Sedangkan fakta W dan fakta X bisa menolong menerangkannya.

a Ya. Fakta W dan X kemungkinan penyebab ( karena keduanya menggambarkan korelasi).

b. Ya. Kedua W dan X memiliki kegunaan, tak satupun penyebab lain yang mengakibatkannya.

c. Tidak. Sebab Cuma satu fakta X atau Y yang menjadi penyebab.

d. Tidak. Karena tak satupun W atau X yang menjadi penyebab.

Perhatikan pertanyaan dan pokok pembahasan yang dirancang untuk diukur, apakah itu mengukur objektifnya? Jika tidak mengapa? Lakukanlah kembali mirip ini, untuk perolehan bukti-bukti sampel. Contoh diatas penunjang evaluasi, dimana soal-soal mengukur apa-apa yang diharapkan, mirip halnya dalam proses menemukan keakuratan dari pemilihan alat/ instrumen. Namun satu hal yangperlu diketahui, bahwa mutu dari penilaian selalu ialah contoh penting dan karakteristik dari sampel yang diinginkan harus dimengerti.

b. Criterion-related evidence of validity

Criterion-related evidence of validity (validitas keriteria) ialah keterangan yang diperoleh sama dari penggunaan instrumen dengan instrumen yang yang lain, atau ukuran yang satu dengan yang lainnya.

Untuk mendapatkan keriteria dari kesahihan dari instrumen, umumnya peneliti membandingkan antara sebuah instrumen hasil satu kesatuan yang valid dengan pengukuran tersendiri. Dengan demikian dapat dimengerti, bahwa validitas keriteria yaitu validats yang dilihat dengan membandingkan suatu keriteria atau variabel yang dimengerti atau yang dipercaya dapat dipakai untuk mengukur suatu atribut tertentu. Jika skor atau skala yang diukur ketimbang satu, atau lebih keriteria (variabel) yang dianggap dapat mengukur apa yang ingin diukur, maka yang dikerjakan ialah menetapkan validitas dari alat ukurnya.

Dalam validitas berdasrkan keriteria, umumnya alat ukur yang akan diuji validitasnya disebut selaku prediktor. Statistik yang dibutuhkan dalam pengujian valitas ini yaitu koefisien kekerabatan antara skor tes selaku prediktor, dan skor suatu kriteria yang relevan.

Validitas menurut kriteria dapat dibedakan atas dua macam, yaitu: (1). Validitas prediktif, (2). Validitas konkuren

a. Predictive validity ( Validitas prediktif)

Alat ukur yang dirancang oleh peneliti, acap kali ditujukan untuk memprediksi apa yang akan terjadi dimasa yang akan datang. Tingkat suatu alat ukur yang dibuat mampu dengan akurat meramalkan sebuah patokan dimasa yang akan datang. Inilah yang disebut dengan predictive validity. Kaprikornus, sebuah alat ukur dikatakan valid kalau hasil dari pengukuran ini sesuai dengan tingkah laku atau tanda-tanda-gejala yang diramalkan.

Contoh “ ujian seleksi masuk akademi tinggi”. Bila ternyata terdapat relasi yang tinggi antara cobaan seleksi masuk akademi tinggi dengan indeks prestasi berguru mahasiswa, maka soal ujian seleksi mempunyai validitas prediktif. Artinya alat ukur tersebut mampu memprediksi apa yang akan terjadi dimasa yang akan datang.

b. Concurrent validity (validitas konkuren).

Validitas konkuren atau valitas pada sa’at serempak yakni pengujian validitas, suatu alat ukur dengan menyaksikan sejauhmana kesulitan antara hasil ukur skala tersebut dengan hasil ukur instrumen lain yang sudah teruji kualitasnya, atau dengan ukuran-ukuran yang dianggap mampu menggambarkan aspek-aspek yang sudah diukur. Validitas ini digunakan dalam menciptakan alat ukur gres, karena alat ukur usang untuk variabel yang sama kurang mudah.

Untuk menguji kesesuaian hasil ukur skala (alat ukur gres) dengan hasil ukur standar (alat ukur usang), maka kedua alat ukur tersebut dipraktekkan pada golongan sampel dan diberi nilai. Perhitungan koefisien kekerabatan antara skor subjek pada skalanya (alat ukur gres), dan skor subjek pada kriterianya (alat ukur usang) akan menghailkan koefisien hubungan yang ialah koefisien validitas skala yang bersangkutan. Jika hasil pengukuran menerangkan hubungan aktual yang tinggi, maka mempunyai arti bahwa alat ukur yang baru tersebut mempunyai validitas konkuren yang tinggi.

c. Construct-related evidence of validity

Construct-related evidence of validity ialah keakuratan dari sifat atau huruf yang diukur oleh suatu instrumen. Bagaimana kebenaran/ konsepsi membangun perbedaan kesimpulan pada tingkah laris dari individu atau kebiasaan-kebiasaan pada waktu-waktu tertentu.

Disisi lain, construct validity (valitas konstrak) adalah sebuah abstraksi dan generalisasi khusus, dan merupakan suatu konsep yang secara khusus diciptakan untuk keperluan ilmiah dan mempunyai pengertian terbatas. Konstrak tersebut diberi defenisi mampu diperhatikan dan diukur.

Dalam observasi ilmiah, konstrak diperoleh melalui beberapa cara:

a. Mencari defenisi-defenisi rancangan yang dikemukakan oleh para andal didalam aneka macam literatur. Defenisi sebuah desain umumnya berisi kerangka dari konsep tersebut. Apabila telah didapatkan, defenisi yang terang dan cukup operasional untuk dijadikan dasar penyusunan alat ukur, maka defenisi tersebut telah dapat digunakan secara lansung untuk menyusun item-item pertanyaan dalam kuisioner. Tetapi kalau defenisi yang dikemukakan belum operasional, maka defenisi tersebut harus dijabarkan lebih lanjut, biar lebih operasional, sehingga dapat dijadikan selaku dasar penyusunan pertanyaan dalam kuisioner.

b. Apabila defenisi sebuah rancangan tidak didapatkan dalam literatur, maka peneliti mesti mendefenisikan sendiri desain tersebut. Dalam merumuskan dfenisi sebuah rancangan ini, peneliti semestinya mendiskusikannya dengan jago yang kompeten dibidang tersebut. Pendapat mahir wacana desain tersebut, kemudian daripada usulan peneliti sendiri.

c. Apabila pertimbangan para mahir tidak didapatkan, maka peneliti mampu menyatakan defenisi sebuah rancangan yang hendak diukur terhadap calon responden atau terhadap orang-orang yang mempunyai karakteristik yang sama dengan responden. Misalnya peneliti ingin mengukur rancangan stres di sekolah. Untuk mendefenisikan konsep tersebut, peneliti mampu lansung menanyakan terhadap beberapa calon responden tentang aspek-aspek penyebab beliau mengalami stres disekolah..

Untuk kebutuhan observasi ilmiah, konstrak yang dipakai harus valid. Dalam menyaksikan validitas konstrak, setidaknya ada beberapa pertanyaan yang perlu dijawab.

– Komponen atau dimensi apa saja yang membentuk konsep tersebut?

– Apakah landasan teoritis yang merangkum dimensi tersebut?

– Bukti empris apakah yang memberikan ada atau tidaknya keterkaitan antara bagian atau dimensi-dimensi.

Untuk menguji validitas konstrak psikologis, mirip intelegensia, persepsi, sikap, dan lain-lain hal yang pertama sekali yang dilaksanakan oleh seorang peneliti yakni menganalisa unsur-bagian yang menjadi bagian dari konstrak tersebut. Kemudian dilihat isi dan makna dari bagian-komponennya serta alat ukur yang dipakai untuk mengukur konstrak tersebut. Misalnya untuk memilih kecerdasan interpersonal seseorang mampu dilihat dari empat dimensi, yaitu: 1). Mengorganisir kalangan, 2). Merundingkan pemecahan, 3). Hubungan langsung, 4). Analisis sosial. Apabila terdapat konsistensi antara dimensi desain yang satu dengan dimensi yang lainnya, maka konstrak tersebut dianggap memiliki validitas.

Dari sisi lain, adalah dalam mengukur validitas konstrak dari desain intelegensi. Langkah pertama, yang perlu dikerjakan ialah memilih apakah yang bantu-membantu diukur oleh tes intelegensi yang memiliki imensi banyak itu, apakah kemampuan menghafal, kesanggupan menganalisa, kemampuan menyelenggarakan penilaian, kesanggupan membuat sintesa, atau kesanggupan menerapkan sesuatu ? Setelah dimensi dari intelegensi diukur, gres disusun alat ukur untuk masing-masing dimensi intelegensi tersebut. Langkah kedua, ialah menentukan suatu kriteria yang secara lazim mampu dipakai untuk membedakan orang yang memiliki intelegensi rendah.

C. Reliability ( Keterandalan)

1. Pengertian

Saifuddin Azwar mendefenisikan “Reliability/ reliabilitas (keterandalan) yakni tingkat dogma hasil suatu pengukuran. Pengukuran yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu menunjukkan hasil ukur yang terpercaya, disebut reliabel”.[6]

Selltiz, dkk dalam James A. Black dan Dean J. Champion menyebutkan “ keterandalan dari sebuah alat pengukuran didefenisikan selaku kemampuan alat untuk mengukur gejala secara konsisten yang dirancang untuk mengukur”.[7]

Moh. Nazir menerangkan bahwa suatu alat ukur disebut mempunyai reliabilitas tinggi atau dapat mengemban amanah, bila alat ukur itu mantap, dalam pengertian bahwa alat ukur tersebut stabil, dapat dipercaya (dependability) dan mampu diramalkan (predictability). Suatu alat ukur yang mantap tidak berganti-rubah pengukurannya dan sanggup menerima amanah, sebab penggunaan alat ukur tersebut berkali-kali akan memberikan hasil yang serupa”.[8]

Dari pemahaman diatas mampu dipahami, bahwa reliability (reliabilitas) alat ukur yaitu suatu alat yang digunakan untuk tujuan mengungkapkan aspek-faktor psikologis atau dimensi-dimensi kepribadian manusia, maka skala psikologi harus mengandung pernyataan-pernyataan yang baik serta mempunyai tingkat reliabilitas yang tinggi.

Dalam hal pengukuran, reliabilitas berhubungan dengan ketepatan alat ukur. Reliabilitas disebut juga iman, keterandalan, konsistensi, atau kestabilan sebuah alat ukur. Dikatakan memiliki reliabilitas yang tinggi atau dapat mengemban amanah jika alat ukur tersebut stabil, dapat diandalkan, serta diramalkan.

Jadi sifat reliabel dari sebuah alat ukur berkenaan dengan kemampuan alat ukur tersebut menawarkan hasil yang konsisten. Bisa dibayangkan, jikalau kita mempunyai alat ukur yang hasil pengukurannya berlawanan-beda pada setiap kali melakukan pengukuran, lalu bagaimana kita menggunakan datanya.

2. Metode keandalan ukuran

Metode yang dapat dipakai untuk menentukan keterandalan sebuah alat pengukuran, mampu dikelompokkan terhadap dua klasifikasi, ialah : Prosedur konsistensi eksternal dan mekanisme konsistensi internal, dengan menggunakan sistem-metode berikut ini:

a). Tes-Retest Method, yaitu untuk menentukan keterandalan sebuah alat ukur, mirip pengukuran sikap dan berbagai gejala sosial serta psikologis. Tes ini diberikan kepada sebuah sampel individu pada suatu sa’at tertentu. Setelah melalui interval waktu tertentu, alat ukur diberikan kembali terhadap sampel individu yang serupa. Kemudian dua set hasil tes ini dikorelasikan, dan hasil koefisien korelaasinya merupakan ukuran dari tingkat keterandalan alat ukur perilaku.

b). Equivalent-Forms Method, yaitu bentuk dari sebuah pengukuran dilaksanakan untuk golongan yang sama dari individu-individu selama waktu tertentu, dengan pertanyaan yang berbeda. Mereka dibutuhkan mampu menghidangkan isi yang sama dan mesti terpisah dari yang yang lain. Ketetapan koefisien dijumlah dihitung dari dua bentuk nilai-nilai yang diperoleh. Sebuah koefisien yang tinggi membuktikan bukti yang kuat dari reliabilitas atau ketepatan dua bentuk pengukuran yang sama.

c). Internal-consistency method, adalah suatu metode yang digunakan dalam soal-soal mengukur tanda-tanda yang serupa secara logis, mesti berdampingan dalam sebuah acuan yang konsisten. Seseorang yang menyukai pekerjaannya tidak akan memberi jawaban yang menggambarkan bahwa dia tidak menggemari pekerjaannya. Dalam artian seseorang dengan beberapa sifat khusus akan menjawab soal dengan cara yang mampu diramalkan serta dipengaruhi oleh sifat-sifat tersebut.

d). Alpha-Coeffecient, ialah bentuk umum dari pengukuran kereliabelan soal-soalyang tidak sesuai, seperti beberapa tes Essay yang membutuhkan lebih dari satu balasan. Selain itu, pengukuran ini menginginkan rata-rata dari semua kemungkinan nilai reliabilitas, dijumlah dengan cara belah dua. Dengan memakai pendekatan ini, kita tidak perlu mengkalkulasikan semua reliabilitas belah dua tersebut.

e). Scoring-Agreement, yakni sebuah metode yang dipakai dengan cara khusus, dan dinilai secara objektif. Sedangkan kunci jawaban yang tersedia sesuai dengan nilai-nilai tertentu. Perbedaan nilai seseorang dari dua kali tes dengan pelaksanaan yang berlainan, ditujukan pada yang mempunyai nilai tinggi. Tak ada kesalahan dengan alat-alat yang sesuai untuk membedakan pelaksanaan penilaian, seperti penilaian suatu essay.

Itulah beberapa sistem yang dipakai dalam mengukur reliabilitas sebuah alat ukur, yang kesemuanya itu memiliki keuntungan dan kelemahan. Hanya saja kita pasti akan merelevankan dengan keadaan dimana penelitian itu dilansungkan, serta dalam keadaan apa responden tersebut menuntaskan soal-soal dalam tes.

D. Penutup

1. Kesimpulan

a. Validity (validilitas) disebut juga kesahihan sebuah alat ukur, yaitu suatu alat ukur (instrumen) bisa mengukur apa yang ingin diukur, atau dapat mengungkapkan data yang sempurna dari suatu variabel yang diteliti.

b. Kesahihan berisikan berbagai macam, yaitu:

1). Content-related evidence of validity, disebut juga validitas isi, yaitu suatu medel yang dipakai, apakah isi atau substansi dari sebuah alat ukur merupakan representatif dari isi dan sifat-sifat yang ingin diukur.

2). Criterion-related evidence of validity (validitas kriteria), yakni informasi yang diperoleh sama dari penggunaan instrumen dengan instrumen yang yang lain, atau ukuran yang satu dengan yang yang lain. Validitas ini berisikan dua jenis, adalah:

> Predictive validity (Validitas prediktif), yaitu alat ukur yang digunakan untuk memprediksi apa yang akan terjadi dimasa yang mau tiba.

> Concurrent-validity (validitas konkuren), ialah pengujian validitas suatu alat ukur dengan menyaksikan sejauhmana kesulitan antara hasil ukur skala dengan instrumen yang sudah teruji kualitasnya.

3). Construct-related evidence of validity, ialah keakuratan dari sifat atau abjad yang diukur oleh sebuah instrumen.

c. Reliability (reliabilitas) ialah keterandalan, iman, konsistensi, atau kestabilan suatu alat ukur. Kaprikornus sifat reliabel sebuah alat ukur berkenaan dengan kemampuan alat ukur.

d. Metode yang dipakai untuk memilih keterandalan sebuah alat pengukuran terdiri dari: 1). Prosedu konsistensi eksternal, dan 2). Prosedur konsistensi internal, dengan memakai tata cara-metode selaku berikut:

1). Tes-Retest method, ialah metode yang digunakan untuk pengukuran sikap dan aneka macam tanda-tanda sosial atau psikologis.

2). Equivalent-forms method, adalah tata cara yang digunakan dalam pengukuranuntuk kelompok yang sama dari individu selama waktu tertentu, dengan pertanyaan yang berlainan.

3). Internal-consistency method, ialah tata cara yang digunakan dalam soal-soal, mengukur gejala yang serupa secara logis, mesti berdampingan dalam suatu pola yang konsisten.

4). Alpha-coeffecient, ialah bentuk lazim dari pengukuran kereliabelan, yang menghendaki rata-rata dari semua kemungkinan nilai reliabilitas, dihitung dengan cara belah dua.

5). Scoring-agrrement, ialah suatu sistem yang digunakan secara khusus, dan dinilai secara objektif.

e. Validitas dan reliabilitas sebuah alat ukur (instrumen) sangat penting dalam observasi, sebab hal ini akan memilih keberhasilan seseorang dalam penelitian, terutama mengungkapkan fakta-fakta dari data yang diperlukan, kebenaran kesimpulan, serta berita yang konkrit dari suatu teori.

2. Saran-usulan.

Demikianlah makalah yang sederhana ini penulis sampaikan, diperlukan kepada semua pihak mampu menyampaikan kritik yang membangun untuk kesempurnaannya buat periode yang mau tiba.

DAFTAR KEPUSTAKAAN

Azwar, Saifuddin , Penyusunan Skala Psikologis, Yokyakarta: Pustaka fajar, 2003

Arikunto, Suharsimi, dkk, Penelitian Tindakan Kelas ,Jakarta: Bumi Aksara, 2007.

Manajemen Penelitian, Jakarta: Rineka Cipta, 2003.

A. Black, James dan Dean J. Champion, Metode dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001

Departemen Pendidikan Nasional, Kamus Besar bahasa Indonesia, Jakarta: Balai Pustaka, 2005

Emizir, Metodologi Penelitian Pendidikan, Kuantitatif dan Kualitatif, Jakarta: Rajagrafindo Persada, 2008.

Frenkel, Jack R. dan Norman E. Wallen, How to Design and Evaluate Research, In Education Singapore: Me graw-Hill, 1993

Hopkins, David, A. Teache’r Guide to Classroom Research, Philadelphia: Open University Press, 1993.

James A. Black, James dan Dean J. Champion, Metode dan Masalah Penelitian Sosial, Bandung: Refika Aditama, 2001

Nazir, Moh., Metode Penelitian, Bogor: Ghalia Indonesia, 2005.

Narbuko, Cholid dan Abu Achmadi, Metode Penelitian, Jakarta: Bumi Aksara, 2003.

Rory O’Brien, An Overview of the Methological Approach of Aktion Research.http:// www.web. net/ robrien/papers/ arfinal.html (29/11/2005).

Sudjana, Nana dan Ibrahim, Penelitian dan Penilaian Pendidikan, Bandung: Sinar Baru Algensindo, 2007.

Madja, Rochiati, Metode Penelitian Tindakan Kelas, Bandung: Remaja Rosda Karya, 2007.

Duduk Perkara Penelitian Dan Tinjauan Pustaka

[1]Naskah Asli Dapat Dipesan Via email di buku tamu