MAKALAH
VALIDITAS ITEM TES
Disusun untuk Memenuhi Tugas Mata Kuliah
Evaluasi Proses dan Hasil Pembelajaran Matematika
Dosen Pengampu : Indri Yuli Widya Rulanti, M. Pd.
Disusun oleh :
Ria Khoiria (10411.266)
Kelas : 5G
PROGRAM STUDI PENDIDIKAN MATEMATIKA
IKIP PGRI MADIUN
NOVEMBER 2012
KATA PENGANTAR
Assalamu’alaikum wr.wb
Dengan mengucapkan puji syukur kehadirat Allah SWT , yang telah
melimpahkan taufiq dan hidayahNya serta memberikan kekuatan pada penulis
sehingga dapat menyelesaikan tugas matakuliah Evaluasi Proses dan Hasil
Pembelajaran Matematika yang berjudul “Validitas Item Tes”.
Terima kasih penulis sampaikan kepada Indri Yuli Widya Rulanti, M.
Pd.. selaku dosen matakuliah Evaluasi Proses dan Hasil Pembelajaran Matematika
yang telah memberikan bimbingan dan arahan kepada penulis dalam
menyelesaikan makalah ini. Tak lupa penulis juga sampaikan terima kasih kepada
teman-teman dan semua pihak yang membatu dalam menyelesaikan makalah ini.
Semoga makalah ini dapat bermanfaat untuk pembaca. Penulis
menyadari bahwa makalah ini belumlah sempurna. Untuk itu, saran dan kritik dari
pembaca sangat diharapkan. Atas saran dan kritiknya, penulis ucapkan terima
kasih.
Wassalamu’alaikum wr.wb
Madiun , November 2012
Penulis
ii
DAFTAR ISI
KATA PENGANTAR........................................................................................................i
DAFTAR ISI.....................................................................................................................ii
BAB I : PENDAHULUAN...............................................................................................1
1.1.Latar Belakang.......................................................................................................1
1.2.Rumusan Masalah..................................................................................................2
1.3.Tujuan....................................................................................................................2
BAB II : PEMBAHASAN.................................................................................................3
2.1.Pengertian Validitas...............................................................................................3
2.2.Macam-macam Validitas.......................................................................................3
2.3.Cara Mengetahui Validitas Alat Ukur...................................................................6
2.4.Validitas Item Tes..................................................................................................7
2.5.Tes Berstandar sebagai Kriterium dalam menentukan Validitas ........................10
BAB III : PENUTUP......................................................................................................12
3.1. Kesimpulan.........................................................................................................12
DAFTAR PUSTAKA......................................................................................................14
ii
BAB I
PENDAHULUAN
1.1. Latar Belakang
Untuk mengukur kesesuaian efisiensi dan kemantapan (consistency)
suatu alat penilaian atau suatu tes digunakan bermacam-macam kualitas seperti
validitas, keandalan, objektivitas dan kepraktisan. Ketentuan penting dalam
mengevaluasi adalah bahwa hasilnya harus sesuai dengan keadaan yang
dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret.
Gambar potret atau foto dikatakan baik apabila sesuai dengan aslinya. Gambar
pemotretan hasil evaluasi tersebut dalam kegiatan evaluasi dikenal dengan data
evaluasi. Data evaluasi yang baik sesuai dnegan kenyataan disebut data valid.
Agar dapat diperoleh data yang valid, instrumen atau alat untuk mengevaluasinya
harus valid. Jika pernyataan tersebut dibalik, instrumen evaluasi dituntut untuk
valid karena diinginkan dapat memperoleh data yang valid. Dengan kata lain,
instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan
evaluasi valid.
Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi.
Validitas bukanlah suatu ciri atau sifat yang mutlak dari suatu teknik evaluasi, ia
merupakan suatu ciri yang relatif terhadap tujuan yang hendak dicapai oleh
pembuat tes. Teknik yang sama dapat digunakan untuk beberapa tujuan yang
berbeda, dan validitasnya dapat berbeda-beda dari yang tinggi kepada yang
rendah, bergantung pada tujuan. Suatu tes pengerjaan berhitung, misalnya, dapat
mempunyai validitas yang tinggi untuk menentukan status siswa-siswa sekarang
dalam kecakapannya mengerjakan berhitung. Validitas tes itu mungkin sedang
atau cukup untuk mengukur kecakapan murid-murid dalam hitung dagang
(business arithmetic). Dan mungkin juga tes tersebut mempunyai validitas rendah
dalam mengukur atau meramalkan keberhasilan dalam aspek-aspek matematis
dari suatu pelajaran ilmu alam yang akan datang. Oleh karena itu, validitas harus
ditentukan dalam hubungannya dengan tujuan yang akan dicapai dengan alat
evaluasiitu.
i1
2
Dalam makalah ini akan dibahas tentang validitas menyangkut soal
secara keseluruhan dan validitas item tes (butir soal). Namun yang akan
ditekankan dalam pembahasannya adalah validitas item tes. Validitas soal secara
keseluruhan hanya sebagai pengantar pembahasan validitas item tes.
1.2. Tujuan
1. Untuk mengetahui validitas secara umum (menyangkut soal secara
keseluruhan)
2. Untuk mengetahui validitas item tes (butir soal)
1.3. Rumusan Masalah
1. Pengertian validitas
2. Macam-macam validitas
3. Cara mengetahui validitas alat ukur
4. Validitas item tes (butir soal)
5. Tes terstandar sebagai kriteria dalam menentukan validitas
BAB II
PEMBAHASAN
2.1. Pengertian Validitas
Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan
antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau
tingkah laku. Beberapa kriteria dapat dipilih untuk memperlihatkan keefektifan
terhadap peramalan performance yang akan datang (yang akan terjadi), kriteria
yang lain untuk menunjukkan status yang muncul, kriteria yang lain lagi untuk
menimbulkan sifat-sifat yang representatif dari luasnya isi atau tingkah laku, dan
kriteria yang lain lagi untuk (melengkapi) penyediaan data untuk menunjang atau
menolak beberapa teori psikologis.
Kata valid sering diartikan dengan tepat, benar, shahih, absah. Jadi kata
validitas dapat diartikan dengan ketepatan, kebenaran, keshahihan atau keabsahan.
Jika kata valid itu dikaitkan dengan fungsi tes sebagai alat pengukur, maka sebuah
tes dikatakan valid apabila tes tersebut dengan secara tepat, benar, shahih atau
secara absah dapat mengukur apa yang seharusnya diukur.
2.2. Macam-macam Validitas
Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh
Scarvia B. Anderson dan kawan-kawan disebutkan:
A test is valid if it measures what it purpose to measure. Atau jika
diartikan kurang lebih demikian: sebuah tes dikatakan valid apabila tes tersebut
mengukur apa yang hendak diukur. Dalam bahasa Indonesia “valid” disebut
dengan istilah “shahih.”
Secara garis besar ada dua macam validitas yaitu validitas logis dan
validitas empiris.
1. Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika”,
yang berarti penalaran. Dengan makna demikian maka validitas logis untuk
3
sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang
memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut
dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang
secara baik, mengikuti teori dan ketentuan yang da. Sebagaimana pelaksanaan
tugas lain misalnya membuat suatu karangan, jika penulis sudah mengikuti
aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan
penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori
penyusunan instrumen, secara logis sudah valid. Validitas logis dapat dicapai
apabila instrumen disusun mengikuti ketentuan yang ada. Dengan demikian,
dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi
langsung diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu:
validitas isi dan validitas konstruksi.
a. Validitas isi (content validity)
Suatu tes dikatakan memiliki content validity jika scope dan isi tes itu sesuai
dengan scope dan isi kurikulum yang sudah diajarkan. Isi tes sesuai dengan
atau mewakili sampel hasil-hasil belajar yang seharusnya dicapai menurut
tujuan kurikulum. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi
kurikulum atau materi buku pelajaran.
b. Validitas Konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal
yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang
disebutkan dalam Tujuan Instruksional Khusus. Dengan kata lain jika butir-
butir soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir
yang menjadi tujuan instruksional.
”Konstruksi” dalam pengertian ini bukanlah ”susunan” seperti yang sering
dijumpai dalam teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan
yang dibuat oleh para ahli Ilmu Jiwa yang dnegan suatu cara tertentu
”memerinci” isi jiwa atas beberapa aspek seperti: ingatan (pengetahuan),
4
pemahaman, aplikasi dan seterusnya. Seperti halnya validitas isi, validitas
konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap
butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan
berdasarkan logika, bukan pengalaman.
2. Validitas empiris
Istilah ”validitas empiris” memuat kata ”empiris” yang artinya
”pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat
diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang
tersebut memang jujur. Validitas empiris tidak dapat diperoleh hanya dengan
menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi
harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris yaitu validitas ”ada sekarang”
(concurrent validity) dan validitas prediksi (predictive validity).
a. Validitas ”ada sekarang” (concurrent validity)
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu
mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang
sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah stes maka diperlukan suatu kriterium atau
alat banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Sebagai
contoh misalnya seorang guru ingin mengetahui apakah tes sumatif yang disusun
sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang
sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan
sumatif yang lalu.
b. Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai hal yang akan
datang, jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas
prediksi atau validitas ramalan apabila mempunyai kemampuan untuk
meramalkan apa yang akan terjadi pada masa yang akan datang. Tepat tidaknya
ramalan tersebut dapat dilihat dari korelasi koefisien antara hasil tes itu dengan
hasil alat ukur lain pada masa mendatang.
5
Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r). Kriteria
korelasi koefisien adalah sebagai berkiut:
0,00-0,20 sangat rendah (hampir tidak ada korelasi)
0,20-0,40 korelasi rendah
0,40-0,70 korelasi cukup
0,70-0,90 korelasi tinggi
0,90-1,00 korelasi sangat tinggi (sempurna)
2.3. Cara Mengetahui Validitas Alat Ukur
Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan
kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan
kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik
kerelasi product moment yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a. korelasi product moment dengan simpangan
rxy= koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x=X-X dan y=Y-Y)
nxy= jumlah perkalian x dengan y
x2 = kuadrat dari x
y2= kuadrat dari y
b. korelasi product moment dengan angka kasar
rxy= koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan
6
2.4. Validitas Butir Soal atau Validitas Item
Apa yang sudah dibicarakan diatas adalah validitas soal secara
keseluruhan tes. Disamping mencari validitas soal perlu juga dicari validitas item.
Jika seorang peneliti atau seoarng guru mengetahui bahwa validitas soal misalnya
terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir- butir tes
manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena
memiliki validitas rendah.Untuk keperluan inilah dicari validitas butir soal.
Pengertian umum untuk validitas item adalah sebuah item dikatakan
valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada
item menyebabkan skor total menjadi tinggi atau rendah. Dengan kata lain dapat
dikemukakan disini bahwa sebuah item memiliki validitas yang tinggi jika skor
pada item mempunyai skor total. Kesejajaran ini dapat diartikan dengan korelasi
sehingga untuk mengetahui validitas item digunakan rumus korelasi seperti sudah
diterangka diatas.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan
dengan 1 (bagi item yang dijawab benar ) dan 0 ( item yang dijawab salah ),
sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item
yamg membangun soal tersebut.
Contoh Perhitungan :
TABEL ANALISIS ITEM UNTUK PERHITUNGAN
VALIDITAS ITEM
No. Nama Butir soal / item Skor
total1 2 3 4 5 6 7 8 9 10
1. Hartati 1 0 1 0 1 1 1 1 1 1 8
2. Yoyok 0 0 1 0 1 0 0 1 1 1 5
3. Oktaf 0 1 0 0 0 1 0 1 0 1 4
4. Wendi 1 1 0 0 1 1 0 0 1 0 5
5. Diana 1 1 1 1 1 1 0 0 0 0 6
5. Paul 1 0 1 0 1 0 1 0 0 0 4
7. Susana 1 1 1 1 1 1 1 0 0 0 7
8. Helen 0 1 0 1 1 1 1 1 1 1 8
7
Misalnya akan dihitung validitas item nomor 6, maka mskor item tersebur disebut
variabel X dan skor total dtsebut variabel Y. Selanjutnya perhitungan dilakuka
dengan menggunaka rumus korelasi pruduct moment, baik dengan rumus
simpanga maupun rumus angka kasar.
Pengguanan kedua rumus tersebut masing- masinga ada keuntungannya.
Menggunakan rumus simpangan angkanya kecil- kecil, tetapi kadang- kadang
pecahannya rumit. Jika skor rata- rata ( mean ) – nya pecahan, simpangannya
cenderung banyak pecahan. Mengalikan pecahan persepuluhan ditambah dengan
tanda- tanda + (plus) dan – (minus) kadang- kadang bisa menyesatkan.
Penggunaan rumus angka kasar bilangannya besar- besar tetapi bulat. Jika ada
kalkulator sttistik disarankan menggunakan rumus angka kasar saja. Yang
dibutuhkan hanyalah: nX,nY,nX2 dan nXY, tidak perlu membuat tabel
seutuhnya.
Conyoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel
persiapannya sebagai berikut.
TABEL PERSIAPAN UNTUK MENHITUNG VALIDITAS NOMOR 6
No. Nama X Y
1. Hartati 1 8
2. Yoyok 0 5
3. Oktaf 1 3
4. Wendi 1 5
5. Diana 1 6
6 Paul 0 4
7. Susana 1 7
8. Helan 1 8
Keterangan :
X = Skor item nomor 6
Y = skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
8
nX = 6 nX2 = 6nY = 46 nY2 = 288nXY = 37 p=6/8=0,75Xt=5,57 q=2/8=0,25
Xp=6,17
Sesudah diketahui nX, nX2 , nY, nY2 , dan nXY tinggal memasukkan bilangan- bilangan tersebut ke dalam rumus korelasi product moment dengan rumus angka kasar.Data diatas dimasukkan kedalam rumus korelasi product moment dengan angka
kasar sebagai berikut :
Koefisien validitas item nomor 6 adalah 0,421. Dilihat secara sepintas
bilangan ini memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari
skor- skor yang tertera baik pada item maupun skor total. Oktaf yang hanya
memiliki skor 3 dapat memperoleh skor 1 pada item, sedangkan Yoyok dan
Wendi yang mempunyai skor total sama yaitu 5 skor pada item tidak sama.
Validitas item tersebut kurang meyakinkan. Tentu saja validitasnya tidak tinggi.
Masih ada cara- cara lain untuk menghitung validitas item. Salah satu
cara yang terkenal adalah menggunakan rumus γpbi yang rumus lengkapnya
adalah sebagai berikut:
Keterangan :
γpbi = koefisien korelasi biserial
MP = rata- rata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya.
Mt = rerata skor total
St = standar deviasi dari skor total
p = proporsi siswa yang menjawab benar (p=banyak siswa yang menjawab
benar/jumlah seluruh siswa)
9
q = proporsi siswa yang menjawab salah
( q = 1- p)
Apabila item 6 tersebut dicari validitasnya dengan rumus ini maka
perhitungaannya melalui langkah sebagai berikut:
1. Mencari
Mp= (8+3+5+6+7+8)/6 = 37/6 = 6,17
2. Mencari
Mt= (8+5+3+5+6+4+7+8)/8 = 46/8=5,75
3. Dari kalkulator diperoleh harga standar deviasi ke-n, yaitu 1,7139 atau standar
deviasi ke n-1=1,8323. Untuk n kecil, diambil standar deviasi yang 1,7139.
4. Menentukan harga p, yaitu 6/8= 0,17
5. Menentukan harga q, yaitu 2/8= 0,25 atau 1-0,75=0,25
6. Memasukkan ke rumus γpbi, didapatkan hasil 0,4244
Dari perhitungan validitas item 6 dengan cara dua ternyata hasilnya
berbeda tetapi sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena
adanya pembulatan angka.
2.5. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang telah dicobakan berkali- kali sehingga
dapat dijamin kebaikannya. Di negara- negara berkembang biasanya biasa tersedia
tes semacam ini, dan dikenal dengan nama standardized test. Sebuah tes
terstandar biasanya memilki identitas antara lain : sudah dicobakan berapa kali
dan dimana, berapa koefisien validitas, reliabilitas, taraf kesukaran, daya pembeda
dan lain- lain keterangan yang dianggap perlu.
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan
koefisien validitas tes terstandar tersebut.
Contoh Perhitungan:
TABEL PERSIAPAN PERHITUNGAN VALIDITAS
TES MATEMATIKA DENGAN KRITERIUM
TES TERSTANDAR MATEMATIKA
10
No. Nama X Y X2 Y2 XY Keterangan
1. Nining 5 7 25 49 35 X= hasil tes
Matematika
yang dicari
validitasnya
Y=hasil tes
terstandar
2. Maruti 6 6 36 36 36
3. Bambang 5 6 25 36 30
4. Seno 6 7 36 49 42
5. Hartini 7 7 49 49 49
6. Heru 6 5 36 25 30
Jumlah 35 38 207 244 222
Dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
menghasilkan 0,108
Jika seandainya dari tes trerstandar diketahui bahwa validitasnya 0,89 maka
bilangan 0,108 ini belum merupakan validitas soal Matematika yang
dicari.Validitas tersebut harus dikalikan dengan 0,89 yang hasilnya 0,108 x 0,89 =
0,096.
11
BAB III
PENUTUP
3.1 Kesimpulan
Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan
antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau
tingkah laku. Secara garis besar ada dua macam validitas yaitu validitas logis dan
validitas empiris. Validitas logis untuk sebuah instrumen evaluasi menunjuk pada
kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu: validitas isi dan validitas konstruksi. Suatu tes dikatakan
memiliki content validity jika scope dan isi tes itu sesuai dengan scope dan isi
kurikulum yang sudah diajarkan. Sebuah tes dikatakan memiliki validitas
konstruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap
aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus.
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji
dari pengalaman. Ada dua macam validitas empiris yaitu validitas ”ada sekarang”
(concurrent validity) dan validitas prediksi (predictive validity).
Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r).
Kriteria korelasi koefisien adalah sebagai berkiut:
0,00-0,20 sangat rendah (hampir tidak ada korelasi)
0,20-0,40 korelasi rendah
0,40-0,70 korelasi cukup
0,70-0,90 korelasi tinggi
0,90-1,00 korelasi sangat tinggi (sempurna)
Rumus korelasi product moment ada dua macam, yaitu:
a. korelasi product moment dengan simpangan
12
13
b. korelasi product moment dengan angka kasar
validitas item adalah sebuah item dikatakan valid apabila mempunyai
dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total
menjadi tinggi atau rendah. Dengan kata lain dapat dikemukakan disini bahwa
sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai skor
total.
Tes terstandar adalah tes yang telah dicobakan berkali- kali sehingga dapat
dijamin kebaikannya. Di negara- negara berkembang biasanya biasa tersedia tes
semacam ini, dan dikenal dengan nama standardized test. Sebuah tes terstandar
biasanya memilki identitas antara lain : sudah dicobakan berapa kali dan dimana,
berapa koefisien validitas, reliabilitas, taraf kesukaran, daya pembeda dan lain-
lain keterangan yang dianggap perlu.
DAFTAR PUSTAKA
Hamid Darmadi. 2011. Validitas Tes dan Item Tes. (online)
http://hamiddarmadi.blogspot.com/2011/05/validitas-tes-dan-item-tes-hasil.html.
Diunduh Minggu 25 November 2012, pukul 12.33 WIB
Ngalim Purwanto. 2010. Prinsip-prinsip an Teknik Evaluasi Pengajaran.
Bandung: PT. Remaja Rosdakarya
Suharsimi Arikunto. 1999. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi).
Jakarta: Bumi Aksara
14
Top Related