Pengertian Iteman dan Analisis Iteman
ITEMAN ialah acara komputer yang digunakan untuk menganalisis butir soal secara klasik. Program ini tergolong satu paket acara dalam MicroCAT°n yang dikembangkan oleh Assessment Systems Corporation mulai tahun 1982 dan mengalami revisi pada tahun 1984, 1986, 1988, dan 1993; mulai dari versi 2.00 sampai dengan versi 3.50. Alamatnya adalah Assessment Systems Corporation, 2233 University Avenue, Suite 400, St Paul, Minesota 55114, United States of America.
Program ini mampu dipakai untuk: (1) menganalisis data file (format ASCII) tanggapan butir soal yang dihasilkan melalui manual entry data atau dari mesin scanner; (2) menskor dan menganalisis data soal pilihan ganda dan skala Likert untuk 30.000 siswa dan 250 butir soal; (3) menganalisis suatu tes yang berisikan 10 skala (subtes) dan menawarkan gosip wacana validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi balasan pada setiap option), reliabilitas (KR-20/Alpha), kriteria error of measurement, mean, variance, kriteria deviasi, skew, kurtosis untuk jumlah skor pada jawaban benar, skor minimum dan maksimum, skor median, dan frekuensi distribusi skor.
Saat ini sudah tersedia ITEMAN tinder Windows 95, 98, NT, 2000, ME, dan XP dengan harga $299. Sebelum menggunakan program Iteman, bacalah manualnya/buku isyarat pengoperasionalnya secara seksama. Sebagai acuan, tahap permulaan adalah membuat “file data” (control tile) yang berisi 5 unsur utama.
- Baris pertama ialah baris pengontrol yang mendeskripsikan data.
- Baris kedua adalah daftar kunci tanggapan setiap butir soal.
- Baris ketiga ialah daftar jumlah option untuk setiap butir soal.
- Baris keempat yaitu daftar butir soal yang akan dianalisis (bila butir yang akan dianalisis diberi tanda Y (yes), jikalau tidak diikutkan dalam analisis diberi tanda N (no).
- Baris kelima dan seterusnya ialah data siswa dan opsi balasan siswa.
Setiap pilihan balasan siswa (untuk soal bentuk opsi ganda) diketik dengan memakai karakter, misal ABCD atau angka 1234 untuk 4 pilihan balasan atau ABCDE atau 12345 untuk 5 opsi balasan.
Cara menggunakan acara ini, pertama data diketik di DOS atau Windows.
Cara termudah adalah memakai acara Windows yakni dengan mengetik data di kawasan Notepad. Caranya yakni klik Start-Programs-Accessories-Notepad.
Korelasi point-biserial (r pbi) tidak sama dengan 0, relasi biserial (r bis) paling sedikit 25% lebih besar ketimbang r pbi untuk perkiraan pada data yang serupa. Korelasi point-biserial (r pbi) ialah hubungan product moment antara skor dikotomus dan pengukuran kriterion; sedangkan hubungan biserial (r bis) ialah kekerabatan product moment antara variabel latent distribusi wajar berdasarkan dikotomi benar-salah dan pengukuran kriterion.
Menurut Millman dan Greene (1989) dalam Educational Measurement, kedua korelasi ini memiliki keunggulan masing-masing. Kelebihan kekerabatan point biserial yakni: (1) memberikan refleksi kontribusi soal secara bahwasanya terhadap fungsi tes. Maksudnya ini mengukur bagaimana baiknya soal berkorelasi dengan kriterion (tidak bagaimana baiknya beberapa secara abstrak); (2) sederhana dan eksklusif berafiliasi dengan statistik tes; (3) tidak pernah mempunyai value 1,00 alasannya adalah cuma variabel-variabel dengan distribusi bentuk yang serupa yang mampu berkorelasi secara tepat, dan variabel kontinyu (kriterion) dan skor dikotomus tidak memiliki bentuk yang serupa. Kelebihan kekerabatan biserial yaitu: (1) condong lebih stabil dari sampel ke sampel, (2) penilaian lebih akurat ihwal bagaimana soal dapat diharapkan untuk membedakan pada beberapa perbedaan point di skala abilitas, (3) value r bis yang sederhana lebih langsung bekerjasama dengan indikator diskriminasi kurva karakteristik butir (Item Characteristic Curve atau ICC). Kebanyakan para ahli pendidikan, terutama di Indonesia, banyak yang memakai korelasi point biserial ketimbang kekerabatan biserial.
Kriteria baik tidaknya butir soal menurut Ebel dan Frisbie (1991) dalam Essentials of Educational Measurement halaman 232 adalah bila korelasi point biserial: >0.40=butir soal sangat bagus; 0.30 – 0.39=soal baik, namun perlu perbaikan; 0.20 – 0.29=soal dengan beberapa catatan, lazimnya diperlukan perbaikan; < 0. 19=soal buruk, dibuang, atau diperbaiki melalui revisi. Adapun tingkat kesukaran butir soal memiliki skala 0 - 1. Semakin mendekati 1 soal termasuk mudah dan mendekati 0 soal tergolong susah.
a. Interpretasi Hasil Analisis Program ITEMAN
Hasil dari analisis ITEMAN mampu berbentukdua file ialah file statistik dan file skor. Keduanya berupa file ASCII yang mampu dilihat dengan memakai program pengolah kata (word processor).
File statistik hasil analisis ITEMAN mampu dibedakan ke dalam 2 bagian, ialah : Statistik butir soal dan statistik tes (skala). Gambar 4 di atas menunjukkan hasil analisis statistik butir soal, sedangkan gambar 5 memperlihatkan hasil analisis statistik tes. Interpretasi kedua gambar di atas mampu diuraikan sebagai berikut :
I. Statistik Butir Soal
Untuk tes/skala yang terdiri dari butir-butir soal yang bersifat dikotomi misalnya pilihan ganda, statistik berikut yakni output dari setiap butir soal yang dianalisis :
- Seq. No yakni nomor urut butir soal dalam file data.
- Scala-item yakni nomor urut butir soal dalam skala (tes/subtes)
Prop. Correct adalah proporsi siswa( penerima tes) yang menjawab benar butir soal. Nilai ekstrim (mendekati nol atau satu) pertanda bahwa butir soal tersebut terlalu susah atau terlalu gampang untuk peserta tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.
Biser ialah indeks daya pembeda soal dengan memakai koefisien kekerabatan biserial. Nilai faktual pertanda bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukan bahwa penerima tes yang menjawab benar butir soal, mendapatkan skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik opsi tanggapan (alternative) hubungan biserial negatif sungguh tidak diharapkan untuk kunci balasan dan sungguh diinginkan untuk opsi balasan lainnya (pengecoh).
Point-biser yakni juga indeks daya pembeda soal dan pilihan tanggapan (alternatif) dengan menggunakan koefisien kekerabatan point-biserial. Penafsirannya sama dengan statistik biserial.
Catatan : Nilai -9.000 menunjukan bahwa statistik butir soal atas pilihan balasan tidak mampu di hitung. Hal ini kadang kala terjadii bila tidak ada penerima tes yang menjawab butir soal/ pilihan tanggapan tersebut
Statistik opsi balasan (alternative) menunjukkan berita yang serupa dengan statistik butir soal. Perbedaannya adalah bahwa statistik opsi tanggapan dihitung secara terpisah. Untuk setiap piihan balasan dan didasarkan pada diseleksi tidaknya alternatif tersebut, bukan pada benarnya jawaban. Tanda (*) yang muncul di sebelah kanan hasil analisis pertanda kunci balasan.
II. Statistik Tes/Skala
Analisis statistik untuk tes/skala dengan interpretasi berikut :
- N of items yaitu jumlah butir soal dalam tes/skala yang ikut dianalisis. Untuk tes/skala yang terdiri dari butir-butir soal dikotomi, hal ini ialah jumlah total butir soal dalam tes /skala.
- N of examines adalah jumlah penerima tes yang digunakan dalam analisis.
- Mean yaitu skor rata-rata peserta tes.
- Variance yaitu varian dari distribusi skor penerima tes yang memberikan gambaran wacana sebaran skor peserta tes.
- Std. Dev ialah deviasi tolok ukur dari distribusi skor akseptor tes. Deviasi persyaratan yakni akar dari variance.
- Skew yakni kemiringan distribusi skor peserta tes yang menawarkan citra perihal bentuk distribusi skor akseptor tes. Kemiringan negatif menandakan bahwa sebagian besar skor berada pada bagian atas (skor tinggi) dari distribusi skor. Sebaliknya kemiringan faktual menunjukan bahwa sebagian besar skor berada bagian bawah (skor rendah) dari distribusi skor. Kemiringan nol pertanda bahwa skor berdistribusi secara simetris di sekeliling skor rata-rata (Mean).
- Kurtosis yakni puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi wajar . Nilai nyata menandakan distribusi yang lebih lancip (memuncak) dan nilai negatif menandakan distribusi yang lebih landai (merata). Kurtosis untuk distribusi normal ialah nol.Minimun ialah skor terendah penerima tes dalam tes/skala tersebut.
- Maximum yakni skor tertinggi penerima tes dalam tes/skala tersebut.
- Median ialah skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.
- Alpha ialah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas tes/skala. Koefisien alpha bergerak dari 0,0 hingga 1,0. Koefisien alpha hanya cocok digunakan pada tes yang bukan mengukur kecepatan (speeded test ) dan yang cuma mengukur satu dimensi (single-trait).
- SEM adalah kesalahan pengukuran kriteria untuk setiap tes/skala. SEM ialah estimit dari deviasi persyaratan kesalahan pengukuran dalam skor tes.
- Mean P yaitu rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dijumlah dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes/skala.
- Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh dengan mengkalkulasikan nilai rata-rata point biserial dari semua soal dalam tes/skala.
- Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menjumlah nilai rata-rata hubungan biserial dari semua butir soal dalam tes/skala.
- Scale intercorrelation ialah indeks relasi antara skor-skor penerima tes yang diperoleh dari setiap subtes/subskala
III. File Skor
Program iteman juga menunjukkan hasil skor untuk setiap peserta tes yang menunjukan jumlah benar dari seluruh balasan. Dari contoh diatas, kita dapat menyaksikan skor peserta tes pada file CONTOH_1.SCR mirip pada gambar 6.
Baris pertama dari output memberikan jumlah abjad untuk identitas akseptor tes (dalam pola di atas 24), jumlah skala (dalam teladan di atas 1), dan nama file input. Kemudian hasil skala diberikan secara berurutan sesuai dengan urutan peserta tes dalam file data.
BAB III
KESIMPULAN
Berdasarkan pemaparan di atas ada beberapa kesimpulan yang bisa diambil yakni:
- Salah satu cara untuk memperbaiki proses belajar mengajar yang paling efektif yakni dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari proses berguru mengajar
- Pengolahan tes hasil berguru dalam rangka memperbaiki proses berguru mengajar dapat dilakukan antara lain dengan melaksanakan analisis soal
- Tujuan khusus dari analisis butir soal yaitu mencari soal tes mana yang baik dan mana yang tidak baik, dan mengapa item atau soal itu dikatakan baik atau tidak baik
- Soal mampu di analisis dengan memakai analisis kualitatif (teoritis) dan kuantitatif (empiris)
- Salah satu cara analisis butir soal secara kuantitatif mampu dilaksanakan dengan menggunakan acara komputer, mirip ITEMAN, SPSS, SPS, Statpro, Microsat, Bigstep, Anates dll
DAFTAR PUSTAKA;
- Depdikbud, 1999, Pengelolaan Pengujian Bagi Guru Mata Pelajaran, Jakarta.
- Djemari Mardapi, 2004, Penyusunan Tes Hasil Belajar. Yogyakarta: UNY
- Ign. Masidjo. 1995, Penilaian Hasil Belajar Siswa di Sekolah. Yogyakarta: Kanisius.
- Nana Sudjana, 2005, Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya
- Ngalim Purwanto, 2004, Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
- Suharsimi Arikunto, 2006, Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
- Sukardjo, 2008, Modul Perkuliahan Evaluasi Pembelajaran Sains Pascasarjana UNY. Yogyakarta