Makalah Pengujian instrumen Penilaian Kel 6

January 12, 2018 | Author: Lewi Salema | Category: Macam macam panel dalam pengujian organoleptik
Share Embed


Deskripsi Singkat

18





BAB I
PENDAHULUAN

Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis dari evaluasi. Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan kelemahan pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena itu begitu pentingnya guru mengadakan analisis butir soal dengan pengujian instrumen penilaian yaitu validitas, reliabilitas, daya beda dan pola contoh soal.
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu terhadap guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru terutama untuk mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk merevisi dan mengembangkan pembelajaran dan tes.
Bagi siswa, analisis diharapkan berfungsi mengetahui keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa belajar lebih baik. Pada makalah ini akan dibahas mengenai analisis soal berupa validitas, reliabilitas, daya beda dan pola contoh soal yang berguna sebagai pedoman bagi pendidikan dalam melakukan analisis soal terutama untuk soal objektif.

Rumusan Masalah
Apa yang dimaksud dengan Pengujian Instrumen Penilaian?
Jelaskan jenis-jenis instrumen penilaian!

Tujuan
Menjelaskan pengertian dari Pengujian Instrumen Penilaian.
Menjelaskan jenis-jenis instrumen penilaian.


BAB II
PEMBAHASAN
2.1 Pengertian Pengujian Instrumen Penilaian
Pengujian merupakan bagian dari pengukuran yang dilanjutkan dengan penilaian. Instrumen penilaian bisa berupa metode atau prosedur formal atau nonformal, untuk menghasilkan informasi tentang peserta didik.
2.2 Jenis-Jenis Pengujian Instrumen Penilaian
Validitas
Merupakan derajat sejauh mana test mengukur apa yang ingin diukur. Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan yang akan diukurnya. Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Terdapat 2 macam metode pengujian validitas, antara lain :
Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara, yaitu melalui penganalisisan dengan cara berpikir secara rasional atau menggunakan logika dan penganalisisan dengan cara menggunakan analisis empiris.
Pengujian Validitas Tes secara rasional
Merupakan validitas yang diperoleh dengan berpikir secara logis. Dengan demikian maka suatu tes hasil belajar telah memiliki validitas rasional, apabila setelah dilakukan penganilisisan secara rasional ternyata bahwa tes hasil belajar itu memang dengan tepat telah dapat mengukur apa yang seharusnya dapat diukur.
Validitas rasional dapat dilakukan dari 2 segi, yaitu :
Validitas Isi
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar. Dimana hal ini dilihat dari segi isi tes sebagai alat pengukur hasil belajar peserta didik. Yaitu, sejauh mana tes hasil belajar peserta didik isinya telah mewakili keseluruhan materi pelajaran yang diujikan.
Contohnya, dalam suatu kelas peserta didik telah menerima materi tentang " Gelombang ", maka soal-soal tes yang diujikan oleh pendidik harus mencakup keseluruhan materi tentang " Gelombang ". Selain itu, bentuk soal yang diberikan telah melalui pengujian atau penganalisisan terlebih dahulu.
Validitas Konstruk
Yaitu validitas yang dilihat dari segi susunan, kerangka atau rekaannya. Dimana validitas ini bukan dipandang dari susunan kalimat soalnya, atau urutan nomor butir soal yang runtut, melainkan bahwa tes hasil belajar dikatakan telah memiliki validitas apabila butir-butir soal yang membangun tes tersebut dapat dengan tepat mengukur aspek kognitif, afektif dan psikomotorik peserta didik. Dengan demikian, penganalisisan validitas konstruk dilakukan secara rasional dengan berpikir logis atau logika.

Pengujian Validitas Tes Secara Empiris
Validitas Empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiris. Dengan kata lain validitas empiris adalah validitas yang bersumber pada atau diperoleh dari atas dasar pengamatan di lapangan. Untuk menentukan tes hasil belajar sudah memiliki validitas empiris atau belum dapat dilakukan penelusuran dari dua segi, yaitu:


Validitas Ramalan
Validitas Ramalan suatu tes adalah suatu kondisi yang menunjukkan seberapa jauh sebuah tes sudah dapat dengan tepat menunjukkan kemampuannya untuk meramalkan apa yang terjadi pada masa depan.
Contohnya, tes seleksi penerimaan calon mahasiswa baru pada sebuah perguruan tinggi. Tes ini diharapkan mampu meramalkan keberhasilan studi para calon mahasiswa dalam mengikuti program pendidikan di perguruan tinggi tersebut pada masa-masa yang akan datang.
Validitas Bandingan
Tes sebagai alat pengukur telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya. Dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang di peroleh pada masa lalu di bandingkan dengan data hasil tes yang di peroleh sekarang. Jika tes yang ada sekarang memiliki hubungan searah dengan hasil tes berdasarkan pengalaman yang lalu, maka tes memiliki karakteristik validitas bandingan.
Contohnya, seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk itu perlu sebuah kreteria masa lalu yang datanya dimiliki sekarang. Misalnya nilai ulangan harian atau nilai semester yang lalu.

Validitas Item Tes Hasil Belajar
Validitas item tes hasil belajar adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Tes-tes hasil belajar yang dibuat atau disusun oleh para pengajar, baik guru, dosen dan staf pengajar lainnnya, sebenarnya adalah kumpulan dari sekian banyak butir-butir item. Dimana dengan item tersebut para penyusun tes ingin mengukur hasil belajar yang telah dicapai oleh masing-masing individu peserta didik setelah mengikuti proses pembelajaran dalam jangka waktu tertentu.
Pengujian Validitas Item Tes Hasil Belajar
Sebutir item dapat dikatakan validitas yang tinggi atau dapat dikatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya. Skor total disini berkedudukan sebagai variable terikat, sedangkan skor item berkedudukan sebagai variable bebasnya. Contohnya 20 orang testee dihadapkan pada tes objektif bentuk multiple choice item yang menghidangkan 10 butir item, dimana setiap item yang dijawab betul diberi skor 1, sedangkan butir item yang dijawab salah diberi skor 0. Setelah tes berakhir, dilakukan koreksi dan dihitung skornya, diperoleh data hasil tes sebagaimana tertera pada table berikut ini:

Testee
Skor untuk butir item nomor
Skor Total (Xt)

1
2
3
4
5
6
7
8
9
10

A
0
1
0
0
0
1
0
0
0
1
3
B
1
0
1
0
1
0
1
1
1
1
7
C
0
1
0
1
1
0
0
1
1
1
6
D
1
1
1
1
1
1
1
1
1
1
10
E
1
0
1
1
0
1
0
1
1
1
7
F
0
1
0
0
0
1
0
1
0
0
3
G
1
0
0
1
1
1
1
1
1
1
8
H
1
0
1
1
1
1
1
1
1
1
9
I
0
1
0
1
0
1
0
1
0
1
5
J
1
1
1
1
1
1
1
1
1
1
10
K
0
1
1
1
1
1
1
0
0
0
6
L
0
1
1
0
1
0
1
0
1
0
5
M
0
1
0
0
1
0
1
1
0
0
4
N
1
0
1
1
0
1
0
1
1
1
7
O
1
0
0
1
1
1
1
1
1
1
8
P
0
1
0
1
0
1
0
1
0
1
5
Q
1
0
1
1
1
1
1
1
1
1
9
R
0
1
0
1
1
1
0
1
0
1
6
S
1
0
0
1
1
1
1
1
1
1
8
T
0
1
1
0
0
0
1
0
0
1
4
20=N
10
12
10
14
13
15
12
16
12
16
Xt=130

Reliabilitas
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan dan kebenaran. Seorang dikatakan dapat di percaya apabila orang tersebut berbicara benar, tidak berubah-ubah pembicaraannya dari waktu ke waktu. Dalam sebuah tes pentingnya diamati kebenaran dan kepastian tes tersebut dilihat dari hasil tes yang didapat.
Terdapat 2 macam metode reliabilitas tes, antara lain :
Reliabilitas Eksternal
Merupakan kestabilan hasil pengukuran apabila tes hasil belajar diujikan beberapa kali. Reliabitas sebagai stabilitas eksternal ini memandang bahwa tes hasil belajar dikatakan reliabel apabila diujikan beberapa kali akan memberikan hasil pengukuran yang relatif konsisten.
Reliabilitas eksternal dapat digolongkan dalam 2 metode, yaitu :
Metode Tes Ulang
Merupakan metode pengujian reliabilitas yang dilakukan dengan mengujikan sebuah perangkat tes hasil belajar kepada kelompok peserta uji coba yang sama sebanyak dua kali.
Contohnya, dapat disajikan skor hasil testing pada uji coba I dan II suatu tes hasil belajar yang direspons oleh lima orang siswa memberikn hasil sebagai berikut :
Responden
X
Y
1
50
65
2
90
87
3
60
50
4
90
95
5
85
74
Keterangan :
X = skor responden pada testing uji coba I
Y = skor responden pada testing uji coba II
N = jumlah responden
Rumus Korelasi Product Moment :
rxy=NXY-XYNX2-(X)2{NY2-(Y)2}
Maka hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,82.
Metode Pararel
Merupakan pengujian reliabilitas yang dilakukan dengan cara membuat dua perangkat tes hasil belajar yang pararel dan uji sekaligus. Dua perangkat tes hasil belajar paralel adalah dua perangkat yang dikembangkan dari spesifikasi yang sama seperti jumlah butir, pelaksanaan, bentuk, waktu uji coba, peserta uji coba, dan kisi-kisi. Spesifikasi ini merupakan detail rancangan yang mengarahkan pada penulisan buti-butir tes hasil belajar yang akan digunakan untuk pengumpulan data.
Contoh perhitungan koefisien reliabilitas menggunakan metode paralel pada lima orang siswa memberikan hasil sebagai berikut :
Responden
X
Y
1
60
55
2
85
90
3
70
63
4
85
70
5
75
80

Keterangan :
X = skor pada peringkat I
Y = skor pada peringkat II
Perhitungan dilakukan menggunakan rumus Korelasi Product moment, sehingga memberikan hasil korelasi koefisien reliabilitas sebesar 0,79.

Reliabilitas Internal
Merupakan konsistensi internal hasil pengukuran butir-butir tes hasil belajar. Tes hasil belajar dikatakan reliabel apabila, diantara butir tes hasil belajar dihasilkan pengukuran yang konsisten.
Reliabilitas sebagai koefisien konsistensi internal dapat dikelompokkan menjadi dua, yaitu :
Jumlah Butir Genap
Metode pengujian reliabilitas dilakukan atas tes hasil belajar yang mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi 2 bagian yang sama besar.
Metode Belah Dua
Merupakan metode pengujian reliabilitas yang dilakukan dengan cara membagi butir perangkat tes hasil belajar menjadi dua belahan, selanjutnya mengkorelasikan skor total kedua belahan.
Menurut cara membelahnya pembelahan dapat dilakukan dengan membelah butir dalam butir ganjil dan genap atau awal dan akhir. Contohnya, pada instrumen yang terdiri dari sepuluh butir, pembelahan ganjil-genap dilakukan dengan mengelompokkan butir 1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Atau dengan cara lain, pembelahan atas dasar awal-akhir dengan mengelompokkan butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.

No
Butir Ganjil

Butir Genap



1
3
5
7
9

2
4
6
8
10


1
1
1
1
1
1
5
1
0
0
1
1
3
8
2
0
1
0
0
0
1
0
0
1
0
1
2
3
3
1
1
1
1
1
5
1
1
0
1
1
4
9
4
0
0
0
0
0
0
1
0
0
1
0
2
2
5
1
1
0
1
1
4
1
1
1
1
0
4
8

Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai berikut :
Responden
X
Y
1
5
3
2
1
2
3
5
4
4
0
2
5
4
4
Keterangan :
X = Jumlah skor butir belahan ganjil
Y = Jumlah skor butir belahan genap
Hasil korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus korelasi product moment yang memberikan hasil koefisien korelasi sebesar 0,85.
Metode Flanagan
Metode ini seperti metode belah dua, juga membagi data manjadi dua belahan. Pembelahan dapat dilakukan atas dasar ganjil – genap atau awal – akhir. Selanjutnya, perhitungan koefisien reliabilitas dilakukan dengan rumus :
r1 1=21-S12+S22St2
Keterangan :
r11 = Koefisien reliabilitas
S12 = Varians skor butir belahan ganjil
S22 = Varians skor butir belahan genap
St2 = Varians skor total
Contoh perhitungan koefisien reliabilitas dilakukan dengan langkah sebagai berikut :
-. Menyusun tabel persiapan
No
Butir Ganjil
Xi
Xi2
Butir Genap
Xi
Xi2
Xt
Xt2

1
3
5
7
9


2
4
6
8
10




1
1
1
1
1
1
5
25
1
0
0
1
1
3
9
8
64
2
0
1
0
0
0
1
1
0
0
1
0
1
2
4
3
9
3
1
1
1
1
1
5
25
1
1
0
1
1
4
16
9
81
4
0
0
0
0
0
0
0
1
0
0
1
0
2
4
2
4
5
1
1
0
1
1
4
16
1
1
1
1
0
4
16
8
64






15
67





15
49
30
222

-. Menghitung Varians
Perhitungan varians dilakukan dengan menggunakan rumus sebagai berikut :
Si2 = Xi2-( Xi2)NN
Varians hasil perhitungan adalah sebagai berikut :
Skor Kelompok butir belahan ganjil
Si2 = 64-(15)255 = 3,8
Skor kelompok butir belahan genap
Si2 = 49-(15)255 = 0,8

Skor Total
Si2 = 222-(30)255 = 8,4
Menghitung Koefisien reliabilitas
r1 1=21-3,8+0,88,4=0,90
Metode Rulon
Metode ini dilakukan dengan menghitung selisih skor pada kedua belahan. Rumus yang digunakan yaitu :
r11 = 1-Sd2St2
Keterangan :
Sd2 = varians beda
St2 = varians total
Jumlah Butir Ganjil
Merupakan pengujian reliabilitas sebagai koefisien konsistensi internal dimana butir instrumen berjumlah ganjil dapat menggunakan metode -metode, yaitu :
Metode Kuder – Richardson
Perhitungan koefisien reliabilitas menggunakan metode Kuder – Richardson di lakukan dengan rumus berikut :
r11= nn-1St2- pqSt2
Keterangan :
n = jumlah butir
St2 = varians total
p = proporsi skor yang diperoleh
q = proporsi skor maksimum dikurangi skor yang diperoleh
Metode Hoyt
Perhitungan koefisien reliabilitas menggunakan metode Hoyt dilakukan dengan rumus berikut :
r11=1- V (s)V (r)

Keterangan :
r11 = koefisien reliabilitas
V(r) = Varians responden
V(s) = Varians sisa
Alpha Cronbach
Perhitungan koefisien reliabilitas dapat dilakukan menggunakan metode Alpha cronbach dengan rumus berikut :

r11=1- nn-11-Si2St2

Keterangan :
n = jumlah butir
Si2 = varians butir
St2 = varians total

Daya Beda
Daya beda adalah kemampuan item untuk membedakan antara individu yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu membedakan antara siswa kelompok atas (yang mampu) dan siswa kelompok bawah (kurang mampu). Siswa kelompok atas adalah kelompok siswa yang tergolong pandai atau mencapai skor total hasil belajar yang tinggi dan siswa kelompok bawah adalah kelompok siswa yang kurang pandai atau memperoleh skor total hasil belajar yang rendah.
Daya Beda (DB) dapat ditentukan besarannya dengan rumus sebagai berikut :
DB = PT – PR atau
DB = TBT- RBR
Keterangan :
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.
PR = proporsi siswayang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.
TB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.
T = jumlah kelompok siswa yang mempunyai kemampuan tinggi.
RB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.
R = jumlah kelompok siswa yang mempunyai kemampuan rendah.
Contohnya, 10 orang mengikuti uji coba tes hasil belajar berbentuk objektif dengan hasil dengan hasil sebagai berikut :
Siswa
Butir Soal
Jumlah

1
2
3
4
5
6
7
8
9
10

A
1
1
1
1
1
1
1
1
1
1
10
B
0
1
0
0
1
0
0
1
0
0
3
C
1
1
1
0
1
1
1
1
1
0
8
D
1
0
1
1
1
1
1
1
1
1
9
E
0
0
0
1
1
1
0
0
0
1
4
F
1
0
1
1
1
1
1
1
1
1
9
G
0
0
1
1
0
1
1
0
1
0
5
H
0
1
0
0
0
1
0
0
0
1
3
I
1
0
0
0
0
0
0
0
1
0
2
J
1
1
1
1
1
1
1
1
1
1
10
Perhitungan Daya beda dapat dilakukan dengan langkah-langkah sebagai berikut:
Menetukan siswa kelompok atas dan bawah. Kelompok atas adalah setengah kelompok siswa ( 5 orang ) yang memperoleh jumlah skor tertinggi. Kelompok bawah adalah setengah kelompok siswa ( 5 orang ) yang memperoleh skor terendah. Penentuan kelompok atas dan kelompok bawah dapat disajikan dalam tabel berikut :

Kelompok atas
Kelompok bawah
Siswa
Skor
Siswa
Skor
A
10
B
3
C
8
E
4
D
9
G
5
F
9
H
3
J
10
I
2

Menghitung perolehan skor butir pada kelompok atas dan kelompok
Kelompok atas
Siswa
Butir Soal

1
2
3
4
5
6
7
8
9
10
A
1
0
1
1
1
1
1
1
1
1
C
1
1
1
0
1
1
1
1
1
0
D
1
0
1
1
1
1
1
1
1
1
F
1
0
1
1
1
1
1
1
1
1
J
1
1
1
1
1
1
1
1
1
1
Jumlah
5
2
5
4
5
5
5
5
5
4

Kelompok bawah
Siswa
Butir Soal

1
2
3
4
5
6
7
8
9
10
B
0
1
0
0
1
0
0
1
0
0
E
0
1
0
1
1
1
0
0
0
1
G
0
1
1
1
0
1
1
0
1
0
H
0
1
0
0
0
0
0
0
1
1
I
1
0
0
0
0
0
0
0
0
0
Jumlah
1
4
1
2
2
2
1
1
2
2

Menghitung Daya Beda
Daya beda dihitung sebagaimana rumusnya sebagai berikut :
Butir 1
Daya Beda (1) = 55-15= 45=0,80
Butir 2
Daya beda (2) = 25- 45= - 25= -0,40

Tingkat Kesukaran Soal
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan baik, bila memenuhi fungsinya secara tepat. Butir soal yang terlalu sukar tidak berhasil mengungkapkan apa yang diketahui siswa. Semua tidak bisa menjawab pertanyaan dengan benar. Sebaliknya, butir soal yang terlalu mudah ,tidak berhasil mengungkap apa yang belum diketahui siswa. Tidak bisa mengukur secara tepat kemampuan yang dimiliki siswa. Semua bisa menjawab dengan betul.
Untuk itu, dalam merumuskan butir soal, perlu dilihat tingkat kesukarannya secara empiric. Rumusannya adalah sebagai berikut :
Keterangan :
P = Indeks Kesukaran
B = Banyaknya testee menjawab butir soal dengan benar.
Js = Jumlah seluruh testee (siswa)
Soal yang baik adalah soal yang memiliki tingkat kesukaran yang memadai untuk mengungkap penguasaan siswa secara tepat. Soal dengan P sebesar 0,0 sampai dengan 0,30 adalah soal sukar. Soal dengan P sebesar 0,3 sampai dengan 0,70 adalah sola sedang. Soal dengan P sebesar 0,70 sampai dengan 0,70 sampai dengan 1,00 termasuk soal mudah.
Untuk merumuskan butir soal yang baik, secara umum, bisa digunakan acuan soal yang cukup memadai; bila memiliki tingkat kesukaran 0,30 sampai dengan 0,70. Namun hal ini juga perlu mempertimbangkan proporsi butir soal yang sukar, sedang dan mudah, sehingga bisa benar-benar tepat dalam mengukur kemampuan siswa.







BAB III
PENUTUP

Kesimpulan
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan yang akan diukurnya.
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan dan kebenaran.
Daya beda adalah kemampuan item untuk membedakan antara individu yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah.
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan baik, bila memenuhi fungsinya secara tepat.












DAFTAR PUSTAKA
Purwanto. 2008. Evaluasi hasil Belajar. Yogyakarta: Pustaka Belajar
Sudijono, A. 2012. Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada
Tumardi. 2008. Evaluasi Pembelajaran. Malang : Laboratorium Teknologi Pendidikan Fakultas Ilmu Pendidikan Universitas Negeri Malang



Deskripsi

18





BAB I
PENDAHULUAN

Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis dari evaluasi. Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan kelemahan pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena itu begitu pentingnya guru mengadakan analisis butir soal dengan pengujian instrumen penilaian yaitu validitas, reliabilitas, daya beda dan pola contoh soal.
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu terhadap guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru terutama untuk mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk merevisi dan mengembangkan pembelajaran dan tes.
Bagi siswa, analisis diharapkan berfungsi mengetahui keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa belajar lebih baik. Pada makalah ini akan dibahas mengenai analisis soal berupa validitas, reliabilitas, daya beda dan pola contoh soal yang berguna sebagai pedoman bagi pendidikan dalam melakukan analisis soal terutama untuk soal objektif.

Rumusan Masalah
Apa yang dimaksud dengan Pengujian Instrumen Penilaian?
Jelaskan jenis-jenis instrumen penilaian!

Tujuan
Menjelaskan pengertian dari Pengujian Instrumen Penilaian.
Menjelaskan jenis-jenis instrumen penilaian.


BAB II
PEMBAHASAN
2.1 Pengertian Pengujian Instrumen Penilaian
Pengujian merupakan bagian dari pengukuran yang dilanjutkan dengan penilaian. Instrumen penilaian bisa berupa metode atau prosedur formal atau nonformal, untuk menghasilkan informasi tentang peserta didik.
2.2 Jenis-Jenis Pengujian Instrumen Penilaian
Validitas
Merupakan derajat sejauh mana test mengukur apa yang ingin diukur. Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan yang akan diukurnya. Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Terdapat 2 macam metode pengujian validitas, antara lain :
Teknik Pengujian Validitas Tes Hasil Belajar
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara, yaitu melalui penganalisisan dengan cara berpikir secara rasional atau menggunakan logika dan penganalisisan dengan cara menggunakan analisis empiris.
Pengujian Validitas Tes secara rasional
Merupakan validitas yang diperoleh dengan berpikir secara logis. Dengan demikian maka suatu tes hasil belajar telah memiliki validitas rasional, apabila setelah dilakukan penganilisisan secara rasional ternyata bahwa tes hasil belajar itu memang dengan tepat telah dapat mengukur apa yang seharusnya dapat diukur.
Validitas rasional dapat dilakukan dari 2 segi, yaitu :
Validitas Isi
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar. Dimana hal ini dilihat dari segi isi tes sebagai alat pengukur hasil belajar peserta didik. Yaitu, sejauh mana tes hasil belajar peserta didik isinya telah mewakili keseluruhan materi pelajaran yang diujikan.
Contohnya, dalam suatu kelas peserta didik telah menerima materi tentang " Gelombang ", maka soal-soal tes yang diujikan oleh pendidik harus mencakup keseluruhan materi tentang " Gelombang ". Selain itu, bentuk soal yang diberikan telah melalui pengujian atau penganalisisan terlebih dahulu.
Validitas Konstruk
Yaitu validitas yang dilihat dari segi susunan, kerangka atau rekaannya. Dimana validitas ini bukan dipandang dari susunan kalimat soalnya, atau urutan nomor butir soal yang runtut, melainkan bahwa tes hasil belajar dikatakan telah memiliki validitas apabila butir-butir soal yang membangun tes tersebut dapat dengan tepat mengukur aspek kognitif, afektif dan psikomotorik peserta didik. Dengan demikian, penganalisisan validitas konstruk dilakukan secara rasional dengan berpikir logis atau logika.

Pengujian Validitas Tes Secara Empiris
Validitas Empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiris. Dengan kata lain validitas empiris adalah validitas yang bersumber pada atau diperoleh dari atas dasar pengamatan di lapangan. Untuk menentukan tes hasil belajar sudah memiliki validitas empiris atau belum dapat dilakukan penelusuran dari dua segi, yaitu:


Validitas Ramalan
Validitas Ramalan suatu tes adalah suatu kondisi yang menunjukkan seberapa jauh sebuah tes sudah dapat dengan tepat menunjukkan kemampuannya untuk meramalkan apa yang terjadi pada masa depan.
Contohnya, tes seleksi penerimaan calon mahasiswa baru pada sebuah perguruan tinggi. Tes ini diharapkan mampu meramalkan keberhasilan studi para calon mahasiswa dalam mengikuti program pendidikan di perguruan tinggi tersebut pada masa-masa yang akan datang.
Validitas Bandingan
Tes sebagai alat pengukur telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya. Dalam rangka menguji validitas bandingan, data yang mencerminkan pengalaman yang di peroleh pada masa lalu di bandingkan dengan data hasil tes yang di peroleh sekarang. Jika tes yang ada sekarang memiliki hubungan searah dengan hasil tes berdasarkan pengalaman yang lalu, maka tes memiliki karakteristik validitas bandingan.
Contohnya, seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk itu perlu sebuah kreteria masa lalu yang datanya dimiliki sekarang. Misalnya nilai ulangan harian atau nilai semester yang lalu.

Validitas Item Tes Hasil Belajar
Validitas item tes hasil belajar adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Tes-tes hasil belajar yang dibuat atau disusun oleh para pengajar, baik guru, dosen dan staf pengajar lainnnya, sebenarnya adalah kumpulan dari sekian banyak butir-butir item. Dimana dengan item tersebut para penyusun tes ingin mengukur hasil belajar yang telah dicapai oleh masing-masing individu peserta didik setelah mengikuti proses pembelajaran dalam jangka waktu tertentu.
Pengujian Validitas Item Tes Hasil Belajar
Sebutir item dapat dikatakan validitas yang tinggi atau dapat dikatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya. Skor total disini berkedudukan sebagai variable terikat, sedangkan skor item berkedudukan sebagai variable bebasnya. Contohnya 20 orang testee dihadapkan pada tes objektif bentuk multiple choice item yang menghidangkan 10 butir item, dimana setiap item yang dijawab betul diberi skor 1, sedangkan butir item yang dijawab salah diberi skor 0. Setelah tes berakhir, dilakukan koreksi dan dihitung skornya, diperoleh data hasil tes sebagaimana tertera pada table berikut ini:

Testee
Skor untuk butir item nomor
Skor Total (Xt)

1
2
3
4
5
6
7
8
9
10

A
0
1
0
0
0
1
0
0
0
1
3
B
1
0
1
0
1
0
1
1
1
1
7
C
0
1
0
1
1
0
0
1
1
1
6
D
1
1
1
1
1
1
1
1
1
1
10
E
1
0
1
1
0
1
0
1
1
1
7
F
0
1
0
0
0
1
0
1
0
0
3
G
1
0
0
1
1
1
1
1
1
1
8
H
1
0
1
1
1
1
1
1
1
1
9
I
0
1
0
1
0
1
0
1
0
1
5
J
1
1
1
1
1
1
1
1
1
1
10
K
0
1
1
1
1
1
1
0
0
0
6
L
0
1
1
0
1
0
1
0
1
0
5
M
0
1
0
0
1
0
1
1
0
0
4
N
1
0
1
1
0
1
0
1
1
1
7
O
1
0
0
1
1
1
1
1
1
1
8
P
0
1
0
1
0
1
0
1
0
1
5
Q
1
0
1
1
1
1
1
1
1
1
9
R
0
1
0
1
1
1
0
1
0
1
6
S
1
0
0
1
1
1
1
1
1
1
8
T
0
1
1
0
0
0
1
0
0
1
4
20=N
10
12
10
14
13
15
12
16
12
16
Xt=130

Reliabilitas
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan dan kebenaran. Seorang dikatakan dapat di percaya apabila orang tersebut berbicara benar, tidak berubah-ubah pembicaraannya dari waktu ke waktu. Dalam sebuah tes pentingnya diamati kebenaran dan kepastian tes tersebut dilihat dari hasil tes yang didapat.
Terdapat 2 macam metode reliabilitas tes, antara lain :
Reliabilitas Eksternal
Merupakan kestabilan hasil pengukuran apabila tes hasil belajar diujikan beberapa kali. Reliabitas sebagai stabilitas eksternal ini memandang bahwa tes hasil belajar dikatakan reliabel apabila diujikan beberapa kali akan memberikan hasil pengukuran yang relatif konsisten.
Reliabilitas eksternal dapat digolongkan dalam 2 metode, yaitu :
Metode Tes Ulang
Merupakan metode pengujian reliabilitas yang dilakukan dengan mengujikan sebuah perangkat tes hasil belajar kepada kelompok peserta uji coba yang sama sebanyak dua kali.
Contohnya, dapat disajikan skor hasil testing pada uji coba I dan II suatu tes hasil belajar yang direspons oleh lima orang siswa memberikn hasil sebagai berikut :
Responden
X
Y
1
50
65
2
90
87
3
60
50
4
90
95
5
85
74
Keterangan :
X = skor responden pada testing uji coba I
Y = skor responden pada testing uji coba II
N = jumlah responden
Rumus Korelasi Product Moment :
rxy=NXY-XYNX2-(X)2{NY2-(Y)2}
Maka hasil korelasi yang merupakan koefisien reliabilitas sebesar 0,82.
Metode Pararel
Merupakan pengujian reliabilitas yang dilakukan dengan cara membuat dua perangkat tes hasil belajar yang pararel dan uji sekaligus. Dua perangkat tes hasil belajar paralel adalah dua perangkat yang dikembangkan dari spesifikasi yang sama seperti jumlah butir, pelaksanaan, bentuk, waktu uji coba, peserta uji coba, dan kisi-kisi. Spesifikasi ini merupakan detail rancangan yang mengarahkan pada penulisan buti-butir tes hasil belajar yang akan digunakan untuk pengumpulan data.
Contoh perhitungan koefisien reliabilitas menggunakan metode paralel pada lima orang siswa memberikan hasil sebagai berikut :
Responden
X
Y
1
60
55
2
85
90
3
70
63
4
85
70
5
75
80

Keterangan :
X = skor pada peringkat I
Y = skor pada peringkat II
Perhitungan dilakukan menggunakan rumus Korelasi Product moment, sehingga memberikan hasil korelasi koefisien reliabilitas sebesar 0,79.

Reliabilitas Internal
Merupakan konsistensi internal hasil pengukuran butir-butir tes hasil belajar. Tes hasil belajar dikatakan reliabel apabila, diantara butir tes hasil belajar dihasilkan pengukuran yang konsisten.
Reliabilitas sebagai koefisien konsistensi internal dapat dikelompokkan menjadi dua, yaitu :
Jumlah Butir Genap
Metode pengujian reliabilitas dilakukan atas tes hasil belajar yang mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi 2 bagian yang sama besar.
Metode Belah Dua
Merupakan metode pengujian reliabilitas yang dilakukan dengan cara membagi butir perangkat tes hasil belajar menjadi dua belahan, selanjutnya mengkorelasikan skor total kedua belahan.
Menurut cara membelahnya pembelahan dapat dilakukan dengan membelah butir dalam butir ganjil dan genap atau awal dan akhir. Contohnya, pada instrumen yang terdiri dari sepuluh butir, pembelahan ganjil-genap dilakukan dengan mengelompokkan butir 1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Atau dengan cara lain, pembelahan atas dasar awal-akhir dengan mengelompokkan butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.

No
Butir Ganjil

Butir Genap



1
3
5
7
9

2
4
6
8
10


1
1
1
1
1
1
5
1
0
0
1
1
3
8
2
0
1
0
0
0
1
0
0
1
0
1
2
3
3
1
1
1
1
1
5
1
1
0
1
1
4
9
4
0
0
0
0
0
0
1
0
0
1
0
2
2
5
1
1
0
1
1
4
1
1
1
1
0
4
8

Jumlah skor kedua belahan selanjutnya dikorelasikan. Data jumlah skor kedua belahan adalah sebagai berikut :
Responden
X
Y
1
5
3
2
1
2
3
5
4
4
0
2
5
4
4
Keterangan :
X = Jumlah skor butir belahan ganjil
Y = Jumlah skor butir belahan genap
Hasil korelasi skor belahan ganjil dan genap (rxy) menggunakan rumus korelasi product moment yang memberikan hasil koefisien korelasi sebesar 0,85.
Metode Flanagan
Metode ini seperti metode belah dua, juga membagi data manjadi dua belahan. Pembelahan dapat dilakukan atas dasar ganjil – genap atau awal – akhir. Selanjutnya, perhitungan koefisien reliabilitas dilakukan dengan rumus :
r1 1=21-S12+S22St2
Keterangan :
r11 = Koefisien reliabilitas
S12 = Varians skor butir belahan ganjil
S22 = Varians skor butir belahan genap
St2 = Varians skor total
Contoh perhitungan koefisien reliabilitas dilakukan dengan langkah sebagai berikut :
-. Menyusun tabel persiapan
No
Butir Ganjil
Xi
Xi2
Butir Genap
Xi
Xi2
Xt
Xt2

1
3
5
7
9


2
4
6
8
10




1
1
1
1
1
1
5
25
1
0
0
1
1
3
9
8
64
2
0
1
0
0
0
1
1
0
0
1
0
1
2
4
3
9
3
1
1
1
1
1
5
25
1
1
0
1
1
4
16
9
81
4
0
0
0
0
0
0
0
1
0
0
1
0
2
4
2
4
5
1
1
0
1
1
4
16
1
1
1
1
0
4
16
8
64






15
67





15
49
30
222

-. Menghitung Varians
Perhitungan varians dilakukan dengan menggunakan rumus sebagai berikut :
Si2 = Xi2-( Xi2)NN
Varians hasil perhitungan adalah sebagai berikut :
Skor Kelompok butir belahan ganjil
Si2 = 64-(15)255 = 3,8
Skor kelompok butir belahan genap
Si2 = 49-(15)255 = 0,8

Skor Total
Si2 = 222-(30)255 = 8,4
Menghitung Koefisien reliabilitas
r1 1=21-3,8+0,88,4=0,90
Metode Rulon
Metode ini dilakukan dengan menghitung selisih skor pada kedua belahan. Rumus yang digunakan yaitu :
r11 = 1-Sd2St2
Keterangan :
Sd2 = varians beda
St2 = varians total
Jumlah Butir Ganjil
Merupakan pengujian reliabilitas sebagai koefisien konsistensi internal dimana butir instrumen berjumlah ganjil dapat menggunakan metode -metode, yaitu :
Metode Kuder – Richardson
Perhitungan koefisien reliabilitas menggunakan metode Kuder – Richardson di lakukan dengan rumus berikut :
r11= nn-1St2- pqSt2
Keterangan :
n = jumlah butir
St2 = varians total
p = proporsi skor yang diperoleh
q = proporsi skor maksimum dikurangi skor yang diperoleh
Metode Hoyt
Perhitungan koefisien reliabilitas menggunakan metode Hoyt dilakukan dengan rumus berikut :
r11=1- V (s)V (r)

Keterangan :
r11 = koefisien reliabilitas
V(r) = Varians responden
V(s) = Varians sisa
Alpha Cronbach
Perhitungan koefisien reliabilitas dapat dilakukan menggunakan metode Alpha cronbach dengan rumus berikut :

r11=1- nn-11-Si2St2

Keterangan :
n = jumlah butir
Si2 = varians butir
St2 = varians total

Daya Beda
Daya beda adalah kemampuan item untuk membedakan antara individu yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu membedakan antara siswa kelompok atas (yang mampu) dan siswa kelompok bawah (kurang mampu). Siswa kelompok atas adalah kelompok siswa yang tergolong pandai atau mencapai skor total hasil belajar yang tinggi dan siswa kelompok bawah adalah kelompok siswa yang kurang pandai atau memperoleh skor total hasil belajar yang rendah.
Daya Beda (DB) dapat ditentukan besarannya dengan rumus sebagai berikut :
DB = PT – PR atau
DB = TBT- RBR
Keterangan :
PT = proporsi siswa yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.
PR = proporsi siswayang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.
TB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan tinggi.
T = jumlah kelompok siswa yang mempunyai kemampuan tinggi.
RB = jumlah peserta yang menjawab benar pada kelompok siswa yang mempunyai kemampuan rendah.
R = jumlah kelompok siswa yang mempunyai kemampuan rendah.
Contohnya, 10 orang mengikuti uji coba tes hasil belajar berbentuk objektif dengan hasil dengan hasil sebagai berikut :
Siswa
Butir Soal
Jumlah

1
2
3
4
5
6
7
8
9
10

A
1
1
1
1
1
1
1
1
1
1
10
B
0
1
0
0
1
0
0
1
0
0
3
C
1
1
1
0
1
1
1
1
1
0
8
D
1
0
1
1
1
1
1
1
1
1
9
E
0
0
0
1
1
1
0
0
0
1
4
F
1
0
1
1
1
1
1
1
1
1
9
G
0
0
1
1
0
1
1
0
1
0
5
H
0
1
0
0
0
1
0
0
0
1
3
I
1
0
0
0
0
0
0
0
1
0
2
J
1
1
1
1
1
1
1
1
1
1
10
Perhitungan Daya beda dapat dilakukan dengan langkah-langkah sebagai berikut:
Menetukan siswa kelompok atas dan bawah. Kelompok atas adalah setengah kelompok siswa ( 5 orang ) yang memperoleh jumlah skor tertinggi. Kelompok bawah adalah setengah kelompok siswa ( 5 orang ) yang memperoleh skor terendah. Penentuan kelompok atas dan kelompok bawah dapat disajikan dalam tabel berikut :

Kelompok atas
Kelompok bawah
Siswa
Skor
Siswa
Skor
A
10
B
3
C
8
E
4
D
9
G
5
F
9
H
3
J
10
I
2

Menghitung perolehan skor butir pada kelompok atas dan kelompok
Kelompok atas
Siswa
Butir Soal

1
2
3
4
5
6
7
8
9
10
A
1
0
1
1
1
1
1
1
1
1
C
1
1
1
0
1
1
1
1
1
0
D
1
0
1
1
1
1
1
1
1
1
F
1
0
1
1
1
1
1
1
1
1
J
1
1
1
1
1
1
1
1
1
1
Jumlah
5
2
5
4
5
5
5
5
5
4

Kelompok bawah
Siswa
Butir Soal

1
2
3
4
5
6
7
8
9
10
B
0
1
0
0
1
0
0
1
0
0
E
0
1
0
1
1
1
0
0
0
1
G
0
1
1
1
0
1
1
0
1
0
H
0
1
0
0
0
0
0
0
1
1
I
1
0
0
0
0
0
0
0
0
0
Jumlah
1
4
1
2
2
2
1
1
2
2

Menghitung Daya Beda
Daya beda dihitung sebagaimana rumusnya sebagai berikut :
Butir 1
Daya Beda (1) = 55-15= 45=0,80
Butir 2
Daya beda (2) = 25- 45= - 25= -0,40

Tingkat Kesukaran Soal
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan baik, bila memenuhi fungsinya secara tepat. Butir soal yang terlalu sukar tidak berhasil mengungkapkan apa yang diketahui siswa. Semua tidak bisa menjawab pertanyaan dengan benar. Sebaliknya, butir soal yang terlalu mudah ,tidak berhasil mengungkap apa yang belum diketahui siswa. Tidak bisa mengukur secara tepat kemampuan yang dimiliki siswa. Semua bisa menjawab dengan betul.
Untuk itu, dalam merumuskan butir soal, perlu dilihat tingkat kesukarannya secara empiric. Rumusannya adalah sebagai berikut :
Keterangan :
P = Indeks Kesukaran
B = Banyaknya testee menjawab butir soal dengan benar.
Js = Jumlah seluruh testee (siswa)
Soal yang baik adalah soal yang memiliki tingkat kesukaran yang memadai untuk mengungkap penguasaan siswa secara tepat. Soal dengan P sebesar 0,0 sampai dengan 0,30 adalah soal sukar. Soal dengan P sebesar 0,3 sampai dengan 0,70 adalah sola sedang. Soal dengan P sebesar 0,70 sampai dengan 0,70 sampai dengan 1,00 termasuk soal mudah.
Untuk merumuskan butir soal yang baik, secara umum, bisa digunakan acuan soal yang cukup memadai; bila memiliki tingkat kesukaran 0,30 sampai dengan 0,70. Namun hal ini juga perlu mempertimbangkan proporsi butir soal yang sukar, sedang dan mudah, sehingga bisa benar-benar tepat dalam mengukur kemampuan siswa.







BAB III
PENUTUP

Kesimpulan
Validitas adalah salah satu syarat tes hasil belajar (THB) yang baik. Validitas berhubungan dengan kemampuan tes hasil belajar untuk mengukur keadaan yang akan diukurnya.
Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi pengukuran tes yang hasilnya menunjukan keakuratan dan kebenaran.
Daya beda adalah kemampuan item untuk membedakan antara individu yang memiliki performansi tinggi dan rendah. Daya beda adalah analisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah.
Tingkat kesukaran berhubungan dengan banyaknya testee (siswa) yang bisa menjawab dengan benar suatu butir soal tes. Suatu butir soal tes dikatakan baik, bila memenuhi fungsinya secara tepat.












DAFTAR PUSTAKA
Purwanto. 2008. Evaluasi hasil Belajar. Yogyakarta: Pustaka Belajar
Sudijono, A. 2012. Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada
Tumardi. 2008. Evaluasi Pembelajaran. Malang : Laboratorium Teknologi Pendidikan Fakultas Ilmu Pendidikan Universitas Negeri Malang

Lihat lebih banyak...

Komentar

Hak Cipta © 2017 CARIDOKUMEN Inc.