Salah satu komponen terpenting yang menentukan hasil dari
pelaksanaan evaluasi adalah kualitas alat evaluasi yang digunakan. Baik
digunakan dalam proses penelitian yang menggunakan metode kuantitatif maupun
evaluasi dalam proses bukan dalam bentuk penelitian.
Alat evaluasi yang digunakan dalam proses-proses yang disebutkan di atas (termasuk instrumen tes) dapat disebut berkualitas apabila memenuhi beberapa kriteria, diantaranya:
Alat evaluasi yang digunakan dalam proses-proses yang disebutkan di atas (termasuk instrumen tes) dapat disebut berkualitas apabila memenuhi beberapa kriteria, diantaranya:
1.
Validitas,
Validitas
Validitas memiliki pengertian valid, sahih, atau tepat. Suatu alat evaluasi dikatakan valid (sahih) jika alat evaluasi tersebut mampu mengevaluasi apa yang seharusnya dievaluasi. Atau, dengan kata lain alat evaluasi (instrumen) tersebut memiliki tingkat kevalidan apabila memiliki ketepatan dalam melakukan evaluasi.
Validitas memiliki pengertian valid, sahih, atau tepat. Suatu alat evaluasi dikatakan valid (sahih) jika alat evaluasi tersebut mampu mengevaluasi apa yang seharusnya dievaluasi. Atau, dengan kata lain alat evaluasi (instrumen) tersebut memiliki tingkat kevalidan apabila memiliki ketepatan dalam melakukan evaluasi.
Bahasa
sederhananya "alat evalusi atau instrumen-instrumen yang digunakan
bertujuan untukmengukur apa yang seharusnya di ukur."
Dalam menganalisis tingkat validitas alat evaluasi (termasuk instrumen) tergantung jenis alat evaluasi yang digunakan. Misalkan alat evaluasi dalam bentuk buku siswa, LKS, dan sbg. maka lebih cocok diukur tingkat kesahihannya dengan menggunakan pendapat pakar atau jika alat evalusi dalam bentuk tes lebih baik menggunakan validator siswa dalam hal ini dilakukan uji coba kepada siswa.
Beberapa jenis validasi berdasarkan cara-cara melakukan pengukuran tingkat validitas sebuah alat evaluasi, yaitu validitas teoritik (validitas logika) dan validitas empirik (validitas kriterium).
1.
Validitas
Teoritik (Validitas Logika)
Validitas teoritik atau validitas logika lebih menekankan pada tingkat ketepatan alat evaluasi ditinjaui dari isi (materi) alat evaluasi tersebut. Oleh karena itu validitas teoritik lebih tepat dilakukan dengan meminta pertimbangan para pakar. Tentunya pakar yang dimaksud adalah orang-orang yang memiliki keahliaan pada bisangnya. Misalnya mengukur validitas sebuah media pembelajaran komputer, maka pakar yang dimaksud adalah ahli yang berkecimpung pada dunia media pembelajaran baik dari segi pekerjaan atau keahlian berdasarkan gelar tingkat pendidikan. Berikut jenis-jenis validitas teoritik:
Validitas teoritik atau validitas logika lebih menekankan pada tingkat ketepatan alat evaluasi ditinjaui dari isi (materi) alat evaluasi tersebut. Oleh karena itu validitas teoritik lebih tepat dilakukan dengan meminta pertimbangan para pakar. Tentunya pakar yang dimaksud adalah orang-orang yang memiliki keahliaan pada bisangnya. Misalnya mengukur validitas sebuah media pembelajaran komputer, maka pakar yang dimaksud adalah ahli yang berkecimpung pada dunia media pembelajaran baik dari segi pekerjaan atau keahlian berdasarkan gelar tingkat pendidikan. Berikut jenis-jenis validitas teoritik:
§ Validitas Isi
Validitas isi berkenan dengan tingkat ketepatan alat evaluasi tersebut ditinjau dari segi materi. Suatu alat evaluasi dikatakan memiliki validitas isi jika mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang dievaluasi.
Validitas isi berkenan dengan tingkat ketepatan alat evaluasi tersebut ditinjau dari segi materi. Suatu alat evaluasi dikatakan memiliki validitas isi jika mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang dievaluasi.
§ Validitas Konstruksi
Validitas konstruksi berkenan dengan kesesuaian butir dengan tujuan pembelajaran khusus (atau indikator hasil belajar). Suatu alat evalusi dikatakan memiliki validitas konstruksi jika butir-butir pertanyaan atau pernyataan pada alat evaluasi tersebut mengukur tujuan pembelajaran khusus (atau indikator hasil belajar) yang telah ditetapkan
Validitas konstruksi berkenan dengan kesesuaian butir dengan tujuan pembelajaran khusus (atau indikator hasil belajar). Suatu alat evalusi dikatakan memiliki validitas konstruksi jika butir-butir pertanyaan atau pernyataan pada alat evaluasi tersebut mengukur tujuan pembelajaran khusus (atau indikator hasil belajar) yang telah ditetapkan
Beberapa diantaranya yang diukur validitasnya
dalam validitas teoritik adalah tujuan, isi materi, bahasan, dll. Beberapa
format validitas (lembaran penilaian) untuk/dari validator biasanya digabungkan
antara validitas isi maupun validitas konstruksi.
Validitas Empirik (Validitas Kriterium)
Validitas empirik atau validitas kriterium adalah validitas yang bertujuan untuk mengukur ketepatan sebuah alat evalusi berdasarkan kriterium tertentu. Validitas kriterium lebih banyak menggunakan validator dari subjek walaupun tidak menutup kemungkinan menggunakan (validatornya) adalah ahli. Validitas kriterium juga memliki dua jenis, yaitu:
Validitas empirik atau validitas kriterium adalah validitas yang bertujuan untuk mengukur ketepatan sebuah alat evalusi berdasarkan kriterium tertentu. Validitas kriterium lebih banyak menggunakan validator dari subjek walaupun tidak menutup kemungkinan menggunakan (validatornya) adalah ahli. Validitas kriterium juga memliki dua jenis, yaitu:
§ Validitas Banding
Validitas banding disebut demikian jika alat evaluasi tersebut tepat mengukur dengan berdsarakan pengalaman.
Validitas banding disebut demikian jika alat evaluasi tersebut tepat mengukur dengan berdsarakan pengalaman.
§ Validitas Ramalan
Validitas ramalan adalah validitas yang tepat mengukur dalam memprediksi kejadian di proses masa mendatang.
Validitas ramalan adalah validitas yang tepat mengukur dalam memprediksi kejadian di proses masa mendatang.
Jika pengumpulan data hasil penilaian validator maka selanjutnya
adalah menganalisis hasil penilaian tersebut. Analisis tersebut dimaksudkan
untuk menentukan korelasi antara skor yang dikumpulkan melalui alat evaluasi
tersebut dengan skor yang telah ada atau melalui alat ukur lainnya, tentunya
alat ukur yang telah dibakukan dan diasumsikan memiliki tingkat validitas yang
tinggi.
Beberapa jenis analisis yang dapat digunakan untuk menentukan koefisien validitasnya, antara lain:
Beberapa jenis analisis yang dapat digunakan untuk menentukan koefisien validitasnya, antara lain:
1.
Korelasi
Product Moment dengan Simpangan
Korelasi Product Moment, dengan persamaan:
Korelasi Product Moment, dengan persamaan:
Keterangan:
§ rxy adalah
koefisien korelasi antara variabel X dan variabel Y
§ x adalah
selilih antara X dengan X rata-rata (x =X-Xrata-rata)
§ y adalah
selilih antara X dengan X rata-rata (y =Y-Yrata-rata)
Korelasi Product Moment dengan Angka Kasar
Korelasi Product Moment dengan Angka Kasar, dengan persamaan:
Korelasi Product Moment dengan Angka Kasar, dengan persamaan:
Keterangan, N adalah banyaknya subjek
Korelasi Metode Ranking
Korelasi Metode Ranking, dengan persamaan:
Korelasi Metode Ranking, dengan persamaan:
Keterangan: N adalah jumlah subjek dan d adalah selisih rangking antara X dan Y
Hasil analisis data dalam
menentukan koefisien validitasnya selanjutnya dicocokan dengan kriteria
validitas dari alat evaluasi tersebut, yaitu:
|
Koefisien validitas
|
Kriteria
|
|
0,80
- 1,00
|
Sangat
tinggi
|
|
0,60
- 0,80
|
Tinggi
|
|
0,40
- 0,60
|
Sedang
|
|
0,20
- 0,40
|
Rendah
|
|
0,00
- 0,20
|
Sangat
rendah
|
|
<
0,00
|
Tidak
valid
|
Apakah dengan kriteria Sangat Rendah, Rendah, dan Sedang masuk pada kategori valid atau tidak?,
Untuk menghindari rendahnya tingkat validitas terutama pada
kategori valid Rendah danSangat Rendah atau berada pada koefisien validitas di bawah nilai 0,40 dikategorikan tidak valid hal ini bertujuan
untuk mempertahankan tingkat kesahihan alat evaluasi tersebut, sedangkan pada
koefisien validitas 0,40-0,60 (kriteria sedang) dikategorikan valid setelah
sebelumnya diadakan revisi terhadap alat evaluasi tersebut.
Pada tulisan sebelumnya tentang validitas sudah diposting,
postingan yang membahas secara teori mengenai validitas sebuah alat evaluasi
termasuk jika alat evaluasi tersebut adalah hasil tes atau soal.
Pada postingan kita kali akan membahas tentang cara menganalisis (menghitung) tingkat validitas tiap butir soal yang sebelumnya soal tersebut diperoleh data-datanya melalui proses uji coba, teknik analisis yang digunakan adalah dengan menggunakan Microsoft Excel 2007.
Pada postingan kita kali akan membahas tentang cara menganalisis (menghitung) tingkat validitas tiap butir soal yang sebelumnya soal tersebut diperoleh data-datanya melalui proses uji coba, teknik analisis yang digunakan adalah dengan menggunakan Microsoft Excel 2007.
Validitas
butir soal diartikan soal tersebut diujicoba untuk menentukan apakah
butir-butir soal tersebut sahih digunakan atau tidak pada evaluasi yang
sebenarnya
Langkah-langkah Validitas
Rumus yang digunakan dalam menentukan tingkat validitas butir soal tes objektif dapat menggunakan Korelasi Product Moment dengan Simpangan, secara matematis dituliskan:
Rumus yang digunakan dalam menentukan tingkat validitas butir soal tes objektif dapat menggunakan Korelasi Product Moment dengan Simpangan, secara matematis dituliskan:
Misalkan:
Anda memiliki 4 butir soal (variabel X: X1, X2, X3, dan X4), selanjutnya soal terebut diuji oleh 9 0rang atau responden. Hasil uji coba seperti di masukkan pada halaman kerja Microsoft Excel (lihat gambar)
Anda memiliki 4 butir soal (variabel X: X1, X2, X3, dan X4), selanjutnya soal terebut diuji oleh 9 0rang atau responden. Hasil uji coba seperti di masukkan pada halaman kerja Microsoft Excel (lihat gambar)
Dengan menggunakan persamaan Korelasi Product Moment dengan Simpangan, kita menghitung validitas butir soal nomor 1 (X1), dengan langkah-langkah berikut ini:
1.
Hitung
skor total jawaban benar tiap responden (variabel Y)
2.
Hitung skor
rata-rata butir soal nomor 1 (variabel X1)
3.
Hitung
skor rata-rata semua responden (Skor rata-rata variabel Y)
4.
Hitung x1
untuk responden pertama dengan rumus =skor responden 1 - skor rata-rata butir
soal nomor, selanjutnya dengan responden ke-2 sampai ke-9
5.
Hitung y
dengan untuk responden pertama dengan rumus =skor responden 1 - skor rata-rata
semua responden, selanjutnya dengan responden ke-2 sampai ke-9
6.
Hitung
x1^2 (^=pangkat) untuk responden ke-1 sampai responden ke-9, kemudian jumlahkan
hasilnya
7.
Hitung
x1*y (*=kali) untuk responde ke-1 sampai responden ke-9, kemudian jumlahkan
hasilnya
8.
Hitung
y^2 (^=pangkat) untuk responden ke-1 sampai responden ke-9, kemudian jumlahkan
hasilnya
9.
Kali
hasil jumlah langkah 6 dan8
10.
Cari
nilai akar dari langkah 9
11.
Terakhir,
bagi langkah ke-7 dengan langkah 10
12.
Jika
benar Anda memperoleh jawaban 0,8111
Lanjutkan mencari validitas untuk butir soal nomor 2 (X2), dan
seterusnya. Dengan variabel Y tetap sebagai pembanding.
Di atas dijelaskan tentang cara uji validitas dengan menggunakan Korelasi Product Moment dengan Simpangan, dengan cara mencari variabel-variabel tertentu. Dengan rumus yang sama kita akan mencari nilai validitas atau bisa dikatakan membuktikan nilai validitas di atas dengan menggunakan fungsi PEARSON pada Microsoft Excel.
Bentuk umum Fungsi PEARSON
Di atas dijelaskan tentang cara uji validitas dengan menggunakan Korelasi Product Moment dengan Simpangan, dengan cara mencari variabel-variabel tertentu. Dengan rumus yang sama kita akan mencari nilai validitas atau bisa dikatakan membuktikan nilai validitas di atas dengan menggunakan fungsi PEARSON pada Microsoft Excel.
Bentuk umum Fungsi PEARSON
=PEARSON(Array1;Array2)
Keterangan:
Array1 disebut sebagai variabel X (sesuai butir soal: X1, X2, X3, dan X4)
Array2 disebut sebagai variabel Y (Skor total yang diperoleh responden)
Berikut langkah-langkah uji validitas dengan fungsi PEARSON pada soal butir 1 (X1), yaitu:
1.
Aktifkan
cell dibagian bawah nilai rata-rata X1 atau sesudah jawaban validitas dengan
menggunakan rumus Korelasi Product Moment dengan Simpangan (Untuk menempatkan
jawaban nilai validitas dengan fungsi Pearson)
2.
Ketikkan
rumus PEARSON: =PEARSON(B3:B11;F3:F11)
3.
Tekan
Enter
4.
Muncul
jawaban 0,8111 (Jawaban yang sama jika menggunakan rumus Korelasi Product
Moment dengan Simpangan)
5.
Untuk
butir 2, 3, dan 4 cukup mendrag nilai validitas butir soal nomor 1 dengan
sebelumnya mengunci variabel Y (F3:F11) dengan menekan F4 sehingga hasilnya
(=PEARSON(B3:B11;$F$3:$F$11)
6.
Selesai
Selanjutnya, jika nilai validitas diperoleh dengan 2 cara dan
hasil yang sama (hanya sebagai pembuktian bahwa rumus Korelasi Product Moment
dengan Simpangan sama dengan fungsi PEARSON pada Excel) maka perlu dilakukan
konsultasi dengan kriteria-kriteria validitas [baca di sini].
Berdasarkan konsultasi nilai validitas yang diperoleh dengan kriteria-kriteria validitas, Anda bisa membuat kesimpulan terhadap butir-butir soal yang dianalisis, apakah soal tersebut valid atau tidak valid? atau valid tanpa perlu mengkoreksi butir soal tersebut, atau bisa jadi kriterianya rendah misalnya valid sedang sehingga perlu dikoreksi soalnya dan setelah itu baru dikatakan valid.
Berdasarkan konsultasi nilai validitas yang diperoleh dengan kriteria-kriteria validitas, Anda bisa membuat kesimpulan terhadap butir-butir soal yang dianalisis, apakah soal tersebut valid atau tidak valid? atau valid tanpa perlu mengkoreksi butir soal tersebut, atau bisa jadi kriterianya rendah misalnya valid sedang sehingga perlu dikoreksi soalnya dan setelah itu baru dikatakan valid.
Ada 2 tulisan yang terakhir diposting tentang hal-hal yang
membahas tentang kualitas sebuah alat evaluasi yang disusun oleh seseorang,
yaitu yang pertama tentang validitas yang berbicara tentang tentang tingkat
kesahihan alat evaluasi tersebut dan yang kedua adalah tentang reliabilitas
yang membahas tentang konsistensi dan ketepatan alat evaluasi khususnya instrumen-instrumen
penilaian dalam mengevaluasi.
Selain 2 hal tersebut di atas yang menggambarkan tingkat kualitas alat evaluasi termasuk instrumen tes, masih terdapat 2 hal yang memberikan pengaruh yaitu: Objektivitas dan Keparaktisan.
Objektivitas yang dimaksud dalam kualitas alat evaluasi berkaitan erat dengan ketetapan atau konsistensi pada sistem pemberian skor, khususnya dalam menilai hasil kerja seseorang. Misalnya seorang guru yang memeriksa hasil pekerjaan peserta didiknya dengan menggunakan tes uraian. Tes uraian jika tidak memiliki format penilaian per item (butir soal) rawan dengan kesalahan dalam memeriksa. Selain itu, beberapa faktor X yang mempengaruhi dalam penilaian ini, misalnya karena kedekatan, keleluargaan dan sbg.
Untuk itu, objektivitas perlu untuk dijaga dalam mengevaluasi, bahkan beberapa pendapat mengatakan bahwa objektivitas dan reliabilitas akan saling mempengaruhi dan saling menunjang satu sama lain.
Kepraktisan sebuah alat evaluasi lebih menekankan pada tingkat efisiensi dan efektivitas alat evaluai tersebut, beberapa kriteria yang dikemukakan oleh Gerson, dkk dalam mengukur tingkat kepraktisan, diantaranya adalah:
Selain 2 hal tersebut di atas yang menggambarkan tingkat kualitas alat evaluasi termasuk instrumen tes, masih terdapat 2 hal yang memberikan pengaruh yaitu: Objektivitas dan Keparaktisan.
Objektivitas yang dimaksud dalam kualitas alat evaluasi berkaitan erat dengan ketetapan atau konsistensi pada sistem pemberian skor, khususnya dalam menilai hasil kerja seseorang. Misalnya seorang guru yang memeriksa hasil pekerjaan peserta didiknya dengan menggunakan tes uraian. Tes uraian jika tidak memiliki format penilaian per item (butir soal) rawan dengan kesalahan dalam memeriksa. Selain itu, beberapa faktor X yang mempengaruhi dalam penilaian ini, misalnya karena kedekatan, keleluargaan dan sbg.
Untuk itu, objektivitas perlu untuk dijaga dalam mengevaluasi, bahkan beberapa pendapat mengatakan bahwa objektivitas dan reliabilitas akan saling mempengaruhi dan saling menunjang satu sama lain.
Kepraktisan sebuah alat evaluasi lebih menekankan pada tingkat efisiensi dan efektivitas alat evaluai tersebut, beberapa kriteria yang dikemukakan oleh Gerson, dkk dalam mengukur tingkat kepraktisan, diantaranya adalah:
§ Waktu yang diperlukan untuk menyusun tes tersebut
§ Biaya yang diperlukan untuk menyelenggarakan tes tersebut
§ Waktu yang diperlukan untuk melaksanakan tes
§ Tingkat kesulitas menyusun tes
§ Tingkat kesulitan dalam proses pemeriksaan tes
§ Tingkat kesulitan melakukan intrepetasi terhadap hasil tes
Kepraktisan alat evaluasi
akan memberikan manfaat yang besar bagi pelaksanaan maupun bagi peserta didik
karena dirancang sedemikian sistematis terutama materi instrumen tersebut.
RELIABELITAS
Reliabilitas dapat diartikan sebagai tingkat konsistensi skor yang
dicapai oleh orang yang sama dan tes yang sama pula ketika diuji pada waktu
yang berbeda. Atau, konsistensi skor juga dapat diperoleh dengan soal yang
berbeda tetapi memiliki kesamaan dari berbagai aspek.
Dalam menentukan reliabilitas sebuah alat evaluasi dalam hal ini instrumen tes, dapat dikelompokkan berdasarkan jenis instrumen tersebut, yaitu: (1) Tes Objektif , (2) Tes Uraian, dan (3) Tes Afektif.
1. Reliabilitas Tes Objektif
Menentukan koefisien reliabilitas tes objektif dapat dilakukan dengan 2 cara, yaitu:
A. Teknik Belah Dua
Teknik belah dua adalah teknik analisis yang digunakan dengan cara instrumen tes objektif dibelaj menjadi dua bagian yang sama, artinya jumlah soal yang harus dianalisis memiliki jumlah soal yang genap (agar terbagi rata), berikut ini beberapa fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari teknik belah dua, yaitu:
Dalam menentukan reliabilitas sebuah alat evaluasi dalam hal ini instrumen tes, dapat dikelompokkan berdasarkan jenis instrumen tersebut, yaitu: (1) Tes Objektif , (2) Tes Uraian, dan (3) Tes Afektif.
1. Reliabilitas Tes Objektif
Menentukan koefisien reliabilitas tes objektif dapat dilakukan dengan 2 cara, yaitu:
A. Teknik Belah Dua
Teknik belah dua adalah teknik analisis yang digunakan dengan cara instrumen tes objektif dibelaj menjadi dua bagian yang sama, artinya jumlah soal yang harus dianalisis memiliki jumlah soal yang genap (agar terbagi rata), berikut ini beberapa fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari teknik belah dua, yaitu:
1.
Formula
Spearman-Brown
Langkah pertama yang dilakukan adalah menghitung reliabilitas bagian (setengah) instrumen tes objektif tersebut, dengan rumus:
Langkah pertama yang dilakukan adalah menghitung reliabilitas bagian (setengah) instrumen tes objektif tersebut, dengan rumus:
Jika reliabilitas bagiannya telah ditemukan maka
langkah selanjutnya adalah menghitung nilai koefisien reliabilitasnya dengan
rumus:
Keterangan:
n adalah banyaknya subjek
X1 adalah data belahan pertama
X2 adalah data belahan kedua
n adalah banyaknya subjek
X1 adalah data belahan pertama
X2 adalah data belahan kedua
2.
Formula
Rulon
Konsep formula Rulon adalah perbedaan antara skor yang diperoleh subjek pada belahan pertama dengan belahan kedua, perbedaan ini dipandang sebagai galat (error) dari instrumen tes objektif. Persamaan yang digunakan adalah:
Konsep formula Rulon adalah perbedaan antara skor yang diperoleh subjek pada belahan pertama dengan belahan kedua, perbedaan ini dipandang sebagai galat (error) dari instrumen tes objektif. Persamaan yang digunakan adalah:
Dengan:
3.
Formula
Flanangan
Koefisien reliabilitas menurut Flanangan berdasarkan pada varians masing-masing belahan dan varians totalnya. Dengan formula, sebagai berikut:
Koefisien reliabilitas menurut Flanangan berdasarkan pada varians masing-masing belahan dan varians totalnya. Dengan formula, sebagai berikut:
B. Teknik Non Belah Dua
Uji reliabilitas dengan teknik non belah dua dikembangkan oleh Kuder dan Richardson, hasil pengembangan ini kemudian disebut dengan rumus KR-20 dan KR-21.
Uji reliabilitas dengan teknik non belah dua dikembangkan oleh Kuder dan Richardson, hasil pengembangan ini kemudian disebut dengan rumus KR-20 dan KR-21.
1.
Formula
KR-20
Rumus yang digunakan adalah:
Rumus yang digunakan adalah:
Keterangan:
r11 : Reliabilitas tes secara keseluruhan
p : proporsi subjek yang menjawab benar butir soal ke-i
q : proporsi subjek yang menjawab salah butir soal ke-I (q = 1 – p)
Jum.pq : Jumlah hasil kali p dan q
n : Banyaknya item
S : Standar deviasi (akar varians)
r11 : Reliabilitas tes secara keseluruhan
p : proporsi subjek yang menjawab benar butir soal ke-i
q : proporsi subjek yang menjawab salah butir soal ke-I (q = 1 – p)
Jum.pq : Jumlah hasil kali p dan q
n : Banyaknya item
S : Standar deviasi (akar varians)
2.
Formula
KR-21
Rumus yang digunakan adalah:
Rumus yang digunakan adalah:
Keterangan:
n : Banyaknya item
Xt : Rerata skor total
n : Banyaknya item
Xt : Rerata skor total
Tulisan sebelumnya tentang Reliabilitas Instrumen Tes (Bag. 1)
berisi tentang reliabilitas pada instrumen tes jenis objektif pada tulisan
terakhir ini akan dibahas tentang instrumen jenis uraian dan afektif.
Reliabilitas Instrumen Tes Uraian
Menilai realibilitas soa tes uraian tidak hanya dengan menentukan “benar” atau “salah” seperti tes objektif. Butir soal uraian menghendaki gradualisasi penilaian, hal ini dilakukan bobot penilaian setiap butir soal tidak sama.
Dalam melakukan analisis menentukan tingkat realibitas tes uraian secara keseluruhan juga dilakukan analisis tiap butir soal, rumus yang digunakan:
Reliabilitas Instrumen Tes Uraian
Menilai realibilitas soa tes uraian tidak hanya dengan menentukan “benar” atau “salah” seperti tes objektif. Butir soal uraian menghendaki gradualisasi penilaian, hal ini dilakukan bobot penilaian setiap butir soal tidak sama.
Dalam melakukan analisis menentukan tingkat realibitas tes uraian secara keseluruhan juga dilakukan analisis tiap butir soal, rumus yang digunakan:
Keterangan:
Sedangkan, untuk mencari nilai varians (item maupun total) dapat menggunakan persamaan berikut ini:
Reliabilitas Instrumen Afektif
Menilai realibilitas soal tes afektif dapat dilkukan dengan cara yang sama dengan menentukan reliabilitas tes uraian, dengan persamaan:
Menilai realibilitas soal tes afektif dapat dilkukan dengan cara yang sama dengan menentukan reliabilitas tes uraian, dengan persamaan:
Jika pada tes uraian n adalah jumlah subjek yang
memberikan jawaban, maka pada tes afektif n adalah jumlah belahan. Jadi
dalam menganalisis tes afektif, maka salah satu cara adalah mengelompokkan
tanggapan (sikap) subjek. Misalkan 30 nomor skala sikap, jumlah belahan ada 3
maka tiap belahan memiliki 10 nomor, kemudian skor masing-masing nomor
dijumlahkan pada tiap belahan.
Nilai hasil analisis validitas kemudian dicocokkan dengan kriteria
reliabilitas, berikut ini kriteria validitas yang dikemukakan oleh Gerson, dkk.
|
Koefisien validitas
|
Kriteria
|
|
>=
0,80
|
Relibilitas
Tinggi
|
|
0,40
- < 0,80
|
Relibilitas
Sedang
|
|
<
0,40
|
Relibilitas
Rendah
|
Tidak ada komentar:
Posting Komentar