Analisis butir soal pilihan ganda
Statistika

Analisis Butir Soal Pilihan Ganda dan Esai

Di dalam penelitian eksperimen, selain peneliti harus mengukur tingkat validitas dan reliabilitas suatu instrumen, peneliti juga harus melakukan analisis butir soal pilihan ganda dan esai terhadap alat tes (non-kuesioner) yang digunakan untuk mengumpulkan data.

Tapi…

Sebelum jauh membahas mengenai analisis butir soal, saya mau memberikan penjelasan singkat dulu mengenai Apa itu Tes? Apa itu pengukuran? Apa itu penilaian? dan Bagaimana relevansi dari ketiganya?

Pengertian Tes

Tes adalah suatu pernyataan, tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan dan psikologi. Setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul, dkk :1997).

Pengertian Pengukuran

Pengukuran adalah pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau formula tertentu (Asmawi Zainul, dkk :1997)

Pengertian Penilaian

Penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes atau non tes. Dengan kata lain, penilaian adalah pemberian nilai terhadap kualitas sesuatu.

Relevansi Tes, Pengukuran, dan Penilaian

Keterkaitan antara tes, pengukuran dan penilaian adalah penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila menggunakan informasi yang diperoleh melalui pengukuran hasil belajar yang menggunakan tes sebagai alat ukurnya.

Kegunaan tes, pengukuran dan penilaian dalam pendidikan antara lain adalah untuk seleksi, penempatan, diagnosa, remedial, umpan balik, memotivasi dan membimbing, perbaikan kurikulum, program pendidikan serta pengembangan ilmu.


Terkait dengan pemaparan di atas dapat disimpulkan bahwa perencanaan dalam pengujian sangat penting karena tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara representatif. Ada enam hal yang perlu dipertimbangkan dalam perencanaan tes yaitu:

  • Pengambilan sampel dan pemilihan butir soal,
  • Tipe tes yang akan digunakan,
  • Aspek yang akan diuji,
  • Format butir soal,
  • Jumlah butir soal, dan
  • Distribusi tingkat kesukaran butir soal

Yakin gak mau baca ini: Seluk beluk Instrumen Penelitian

Butir Soal Pilihan Ganda dan Esai

Kelemahan butir soal tidak terletak pada bentuk atau tipe butir soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi dengan baik atau tidak baik.

Butir soal obyektif akan sama baiknya dengan butir soal esai untuk mengukur keberhasilan belajar yang dikonstruksi secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar resikonya daripada butir soal obyektif.

Hal tersebut disebabkan mutu butir soal esai tidak hanya terletak pada kemampuan siswa untuk menjawab soal tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas pembuat soal dalam memberikan skor pada hasil tes tersebut.

Berbeda dengan analisis terhadap soal esai, analisis butir soal pilihan ganda dapat memberikan hasil analisis yang lebih akurat dan bertanggung jawab sehingga dapat diketahui kelemahannya secara tepat.

Di sisi lain, butir soal pilihan ganda juga dapat digunakan berulang-ulang, asalkan tidak dalam perangkat tes yang sama. Oleh karena itu ada manfaat atau kegunaan analisis butir soal, kemudian direvisi sehingga butir soal yang kurang baik konstruksinya dapat diperbaiki. Akhirnya akan diperoleh butir soal yang telah teruji dan secara akurat mengukur hasil belajar yang ingin diukur.

Mengapa Perlu  Analisis Butir Soal

Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut (Asmawi Zainul, dkk :1997) alasan tersebut antara lain:

  • Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat dilakukan seleksi dan revisi butir soal.
  • Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih memudahkan bagi pembuat soal dalam menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam bidang dan tingkat tertentu.
  • Untuk segera dapat mengetahui masalah yang terkandung dalam butir soal.
  • Untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal.
  • Untuk memperoleh informasi tentang butir soal sehingga memungkinkan untuk menyusun beberapa perangkat soal yang paralel

Naaaah… Sekarang kita masuk ke pembahasan utama, mengenai analisis butir soal, nih!

Analisis Butir Soal

Penilaian terhadap butir soal pada dasarnya merupakan analisis butir soal, dan selama ini pada umumnya para ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi kualitas butir soal.

Pendekatan untuk menganalisis butir soal yang berkembang saat ini terdiri dari dua pendekatan yaitu pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing memiliki kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam analisis butir soal.

CATATAN: di sini saya akan fokus dulu bahas analisis butir soal dengan pendekatan klasik atau berdasarkan teori tes klasik ya..

Dengan melihat beberapa persyaratan yang harus dipenuhi, penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta dianalisis untuk mendapatkan karakteristik butir soal.

Terkait dengan analisis butir soal ini, para ahli mengelompokkan analisi butir soal ke dalam dua jenis; yaitu analisis butir soal secara kualitatif dan analisis butir soal secara kuantitatif.

Adapun dalam pembahasan kali ini, saya hanya akan fokus kepada analisi butir soal secara kuantitatif saja, untuk analisis butir soal secara kualitatif nanti menyusul yaa..

Analisis butir soal secara kuantitatif dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba dari suatu perangkat tes.

Analisis kuantitatif sering disebut dengan analisis item yang menghasilkan karakteristik atau parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran dalam tes.

Analisis butir soal secara kuantitatif mengenal beberapa karakteristik butir soal, yaitu:

  • Tingkat kesukaran.
  • Daya beda, dan
  • Distribusi jawaban

Tingkat Kesukaran Soal

Tingkat kesukaran butir soal adalah proporsi peserta tes menjawab benar terhadap butir soal tersebut. Tingkat kesukaran butir soal biasanya dilambangkan dengan p.

Makin besar nilai p yang berarti makin besar proporsi yang menjawab benar terhadap butir soal tersebut, makin rendah tingkat kesukaran butir soal itu. Hal ini mengandung arti bahwa soal itu makin mudah, demikian pula sebaliknya.

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.

Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya (Suharsimi Arikunto, 2001).

Terkait dengan pemaparan Arikunto tersebut, perlu dipahami bahwa tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baik atau tidak. Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukar atau mudah untuk kelompok peserta tes tertentu.

Rumus Tingkat Kesukaran

Tingkat Kesukaran

Jika tingkat kesukaran telah dihitung, selanjutnya kawan-kawan harus mengkategorikan koefisien hasil dari perhitungan tingkat kesukaran yang dilakukan. Di sini besarnya tingkat kesukaran berkisar antara 0,00 sampai 1,00. Untuk sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi tiga kelompok, yaitu:

  • Soal mudah,
  • Soal sedang, dan
  • Soal sukar.

Peneliti dapat menggunakan kategori di bawah ini untuk mengukur mana soal yang berkategori mudah, sedang, dan sukar.

Tingkat KesukaranNilai p
Sukar0,00 - 0,25
Sedang0,26 - 0,75
Mudah0,76 - 1,00

CATATAN: Terkait dengan kategori di atas, masing-masing ahli memiliki pendapat yang berbeda-beda tergantung kawan-kawan mau merujuk kepada pendapat yang mana.

Untuk menyusun suatu naskah ujian sebaiknya digunakan butir soal yang mempunyai tingkat kesukaran berimbang, yaitu : soal berkategori sukar sebanyak 25%, kategori sedang 50% dan kategori mudah 25%.

Uji Daya Beda

Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal membedakan kelompok yang berprestasi tinggi (kelompok atas) dari kelompok yang berprstasi rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul, dkk; 1997).

Suryabrata (1999) menyatakan tujuan pokok mencari daya beda adalah untuk menentukan apakah butir soal tersebut memiliki kemampuan membedakan kelompok dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada kelompok itu.

Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan menggunakan indeks korelasi antara skor butir dengan skor totalnya.

Daya beda dengan cara ini sering disebut validitas internal, karena nilai korelasi diperoleh dari dalam tes itu sendiri. Daya beda dapat dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi point biserial.

Dalam analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya beda butir soal. Koefisien korelasi biserial menunjukkan hubungan antara dua skor, yaitu skor butir soal dan skor keseluruhan dari peserta tes yang sama.

Rumus Uji Daya Beda

rumus daya beda

Sebagaimana di sampaikan di atas bahwa rumus untuk menghitung daya beda dapat memakai rumus DP atau rumus rpbis, adapun untuk menghitung uji daya beda soal esai dapat menggunakan rumus berikut ini:

daya beda

Selanjutnya untuk menentukan kategori daya beda dapat dilihat dari kategorisasi di bawah ini sebagaimana dikemukakan oleh Dali S Naga (1992) kriteria besarnya koefesien daya beda diklasifikasikan menjadi empat kategori. Secara lebih rinci dijelaskan dalam tabel di bawah ini.

Kategori Daya BedaKoefisien Korelasi
Baik0,40 - 1,00
Sedang
(tidak perlu direvisi)
0,30 – 0,39
Jelek
(Perlu direvisi)
0,20 – 0,29
Sangat jelek
(tidak dipakai)
-1,00 – 0,19

CATATAN: Terkait dengan kategori di atas, masing-masing ahli memiliki pendapat yang berbeda-beda tergantung kawan-kawan mau merujuk kepada pendapat yang mana.

Distribusi Jawaban (Distraktor)

Dilihat dari konstruksi butir soal terdiri dari dua bagian, yaitu pokok soal dan alternatif jawaban. Alternatif jawaban jawaban juga terdiri dari dua bagian, yaitu kunci jawaban dan pengecoh.

Pengecoh dikatakan berfungsi apabila semakin rendah tingkat kemampuan peserta tes semakin banyak memilih pengecoh, atau makin tinggi tingkat kemampuan peserta tes akan semakin sedikit memilih pengecoh.

Hal demikian dapat ditunjukkan dengan adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis. Apabila proporsi peserta tes yang menjawab dengan salah atau memilih pengecoh kurang dari 0,025 maka pengecoh tersebut harus direvisi.

Dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau proporsinya 0,00 (Proporsi alternatif jawaban masing-masing butir soal dapat dilihat pada kolom proportion endorsing pada hasil analisis butir soal).

Selain memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes, pengecoh soal juga perlu memperhatikan daya beda (koefisien korelasi) yang ditunjukkan oleh masing-masing alternatif jawaban.

Setiap pengecoh diharapkan memiliki daya beda negatif, artinya suatu pengecoh diharapkan lebih sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok bawah. Atau daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban setiap butir soal.

Menurut Depdikbud (1997) untuk menilai pengecoh (distraktor) dari masingmasing butir soal dapat dikategorikan sebagai berikut:

Kategori DistraktorNilai Proportion Endorsing
Baik≥ 0,025
Revisi< 0,025
Tidak Baik / Tolak 0,000

Reliabilitas Alat Tes

Tujuan untuk menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan (precision) dan kajegan (consistency) skor tes. Biasanya indeks reliabilitas ini berkisar 0 -1, artinya semakin tinggi koefisien reliabilitas suatu tes, maka semakin tinggi pula ketepatannya.

Jadi, sebuah tes yang memiliki reliabilitas tinggi, tesnya adalah akurat, reproducibel, dan generalizabel terhadap kesempatan testing dan instrumen tes yang sama lainnya.

Di sini rumus untuk menghitung reliabilitas alat tes, pada umumnya berbeda dengan rumus uji reliailibilitas pada umumnya. Terkait dengan hal tersebut, para ahli mengemukakan bahwa untuk menghitung reliabilitas dalam analisis butir soal  pilihan ganda biasnaya menggunakan rumus KR-20 (Kurder Richardson 20).

Di sisi lain, analisis butir soal esai bisanya menggunakan perhitungan koefisien Alpha Cronbach.

hmmm terkait rumusnya bisa googling sendiri ya… hahahaha

For your information, uji reliabilitas dan validitas ini bisa dilakukan dengan software SPSS atau menggunakan rumus-rumus yang tersedia dalam Ms. Excel. Nah untuk uji validitas dan reliabilitas via SPSS ini, kalian biawa baca-baca artikel saya mengenai tutorial uji validitas dan uji reliabilitas ya guys!

Analisis Butir Soal Melalui Ms. Excel

Di sini saya mencoba menyusun sebuah aplikasi berbasis Microsoft Excel yang bisa kawan-kawan gunakan untuk melakukan analisis butir soal pilihan ganda berdasarkan teori tes klasik.

CATATAN: untuk rumus daya pembeda, dalam aplikasi ini saya menggunakan rumus pertama, bukan rumus yang kedua (rumus rpbis dan rbis), adapun validitas dan reliabilitas bisa dicek melalui SPSS ya kawan-kawan..

Download Aplikasi Analisis Butir Soal Pilihan Ganda Berbasis Ms. Excel

Sekian dulu ya guys pembahasan kali ini, semoga bermanfaat!

You might also like

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *