Jumat, Februari 22

VALIDITAS DAN REABILITAS EVALUASI ( sem 5 Intensif)

VALIDITAS DAN REABILITAS EVALUASI

Pengertian Validatas

 Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketetapan dan kecermatan suatu instrumen pengukuran dalam melaksanakan fungsi ukurnya.

Suatu alat evaluasi (tes) dikatakan mempunyai validitas yang tinggi (disebut valid) jika alat evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud dikenakannya tes tersebut.
Sedangkan suatu tes yang menghasilkan data yang tidak relevan dengan tujuan diadakannya pengukuran dikatakan sebagai tes yang memiliki validitas yang rendah.
Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang diukur, sehingga betul betul mengukur apa yang seharusnya diukur.
Contoh, ingin mengukur kemampuan siswa dalam matematika. Kemudian diberikan soal dengan kalimat yang panjang dan yang berbelit belit sehingga sukar ditangkap maknanya. Akhimya siswa tidak dapat menjawab, akibat tidak memahami pertanyaannya.
Contoh lain, peneliti ingin mengukur kemampuan berbicara, tapi ditanya mengenai tata bahasa atau kesusastraan seperti puisi atau sajak. Pengukur tersebut tidak tepat (valid).
Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penelitian. Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
Dalam menggunakan validitas suatu tes, ada beberapa hal yang perlu diperhatikan, yaitu;
q  Mengacu pada materi yang hendak diujikan.
q  Mengacu pada hasil dari suatu tes atau instrument evaluasi yang dikenakan pada sekelompok individu.
q  Berkaitan dengan derajat dengan istilah validasi tinggi, sedang, rendah.
q  Mengacu pada penggunaan hasil evaluasi.

Validitas suatu instrumen evaluasi mempunyai beberapa makna penting diantaranya adalah
       Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup individual
Validitas diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori  rendah, menengah, dan tinggi.
Macam-Macam Validitas

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa penalaran atau penelaahan.
Validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada.
Misalnya membuat sebuah karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori penyusunan instrumen, secara logis sudah valid.
Validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada.  Dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.
Validitas Empiris

Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”.
Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris.
Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda dan reliabilitas.
Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternative jawaban dari subyek-subyek yang dites.
 Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal dapat diterima karena telah didukung oleh data statistik yang memadai, diperbaiki karena terbukti terdapat beberapa kelemahan atau bahkan tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.

Cara Mengetahui Validitas alat ukur

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kreterium, dalam arti memiliki kesajajaran antara hasil tes tersebut dengan kreterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson. Salah satunya korelasi dengan product moment

Reabilitas

 Pengertian Reabilitas

Reliabel berarti dapat dipercaya. Reliabilitasberarti dapat dipercaya sesuatu. Tes yang yang reliable bararti tes itu dapat dipercaya. Reliabilitas alat ukur adalah ketetapan atau keajegan alat tersebut dalam mengukur apa yang diukurnya.
Artinya, kapan pun alat ukur tersebut digunakan akan memberikan hasil ukur yang sama.
Contoh paling nyata adalah timbangan atau meteran. Hal yang sama terjadi untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat individu dan lain lain. Misalnya alat ukur prestasi belajar seperti tes hasil belajar, alat ukur sikap, kuesioner dan lain lain, hendaknya meneliti sifat ke¬ajegan tersebut. Misalnya seorang akan menimbang berat badannya. Pada waktu ia naik timbangan, jarum menunjukan angka 52. Berarti berat badan orang tersebut itu 52 kg
Faktor-faktor yang Mempengaruhi Reliabilitas

Koefisien reliabilitas dapat di pengaruhi di antaranya oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas.
Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai beriku;

Panjang tes
Semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.
 Ini menunjukkan dua kemungkinan, yaitu a) tes semakin mendekati kebenaran, dan b) dalam mengikuti tes, semakin kecil siswa menebak. Berarti akan semakin tinggi nilai koefisien reliabilitas.
Penyebaran skor
Koefisien reliabilitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang diukur. semakin tinggi sebaran, semakin tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor siswa secara individual mempunyai kedudukan sama pada tes-retes lain, sebagai acuan.

Kesulitan tes
Tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi.

Objektivitas
Objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki obejektivitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik penskoran
Pengujian Reabilitas Instrumen

Metode pengujian Reabilitas instrument ini dapata dilakukan dengan berbagai cara, antara lain: belah dua (split half), Spearman Brown, Kuder Richardson-20 (KR-20), KR-21, Cronbach’s Alpha dan lain sebagainya.



Mengolah hasil evaluasi ( sem 5 Intensif)



Mengolah hasil evaluasi ( sem 5 Intensif)

Skor adalah hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang dijawab betul oleh siswa.
Menskor merupakan proses pemberian angka atau sering disebut dengan pengukuran.
Pengukuran yang bersifat kuantitatif dapat dibedakan menjadi tiga macam, yaitu:
(1)     Pengukuran yang dilakukan bukan untuk menguji sesuatu: misalnya, pengukuran yang dilakukan oleh penjahit pakaian mengenai ukuran pakaian.
(2)     Pengukuran yang dilakukan untuk menguji sesuatu: misalnya, pengukuran yang dilakukan untuk menguji daya tahan perbaja terhadap tekanan berat, pengukuran untuk menguji daya tahan nyala lampu pijar.
(3)     pengukuran untuk menilai, yang dilakukan dengan jalan menguji sesuatu; misalnya, mengukur kemajuan belajar peserta didik dalam rangka mengisi nilai rapor yang dilakukan dengan menguji mereka dalam bentuk tes hasil belajar. pengukuran jenis ketiga inilah yang biasa dikenal dalam dunia pendidikan
(4)    Nilai merupakan angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau acuan standar.
(5)     Penilaian berarti menilai sesuatu. Sedangkan menilai itu mengandung arti: mengambil keputusan terhadap sesuatu dengan mendasarkan diri atau berpegang pada ukuran baik atau buruk, sehat atau sakit, pandai atau bodoh dan sebagainya. Jadi penilaian itu bersifat kualitatif.
(6)    Evaluasi adalah mencakup dua kegiatan, yaitu mencakup pengukuran atau menskor dan penilaian.
(7)     Evaluasi adalah kegiatan atau proses menilai sesuatu. Hal ini sesuai dengan pernyataan Edwind Wandt dan Gerald  yang menyatakan bahwa Evaluasi merupakan suatu tindakan atau suatu proses untuk menentukan nilai dari sesuatu.
TEKNIK PEMBERIAN SKOR           
Pemberian skor bukanlah kegiatan yang mudah, seorang pendidik harus mengetahui teknik-teknuk menskor dan apa saja yang perlu diperhatikan dalam kegiatan menskor.
Dalam hal pekerjaan menskor atau menentukan angka, dapat digunakan 3 macam alat bantu yaitu:
1.      Pembantu menentukan jawaban yang benar, disebut kunci jawaban.
2.    Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci skoring.
3.      Pembantu menentukan angka, disebut pedoman penilaian.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah
Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau soal-soal yang kita susun, sedangkan kunci skoring adalah alat yang kita gunakan untuk mempercepat pekerjaan skoring.
Oleh karena dalam hal ini testee (tercoba) hanya diminta melingkari huruf B atau S maka kunci jawaban yang disediakan hanya berbentuk urutan nomor sareta huruf dimana kita menghendaki untuk melingkari (atau dapat juga diberi tanda X)
Dalam menentukan angka (skor) untuk tes bentuk B-S ini kita dapat menggunakan 2 cara yaitu:
a)      Tanpa hukuman atau tanpa denda.
b)      Dengan hukuman atau dengan denda.
Tanpa hukuman adalah apabila banyaknya angka yang diperoleh siswa sebanyak jawaban yang cocok dengan kunci. Sedangkan dengan hukuman di gunakan 2 2 macam rumus, tetapi hasilnya sama.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda (multiple choice)
Dengan tes bentuk pilihan ganda, testee diminta melingkari slah satu huruf  di depan pilihan jawaban yang disediakan atau membubuhkan tanda lingkaran atau tanda silang pada tempat yang sesuai di lembar jawaban.
Dalam menentukan skor untuk tes bentuk pilihan ganda, dikenal 2 macam cara pula yakni tanpa hukuman dan dengan hukuman. Tanpa hukuman apabila banyaknya angka dihitung dari banyaknya jawaban yang cocok dengan kunci jawaban.
Dengan hukuman menggunakan rumus:
S = Score
W = Wrong
N = Banyaknya pilihan jawaban (yang pada umumnya di Indonesia 3, 4, atau 5)
Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawaban singkat (Short answer test)
Tes bentuk jawaban singkat adalah bentuk tes yang menghendaki jawaban bentuk kata atau kalimat pendek. Jawaban untuk tes tersebut tidak boleh berbentuk kalimat-kalimat panjang, tetapi harus sesingkat mungkin dan mengandung satu pengertian. Dengan persyaratan inilah maka bentuk tes ini dapat digolongkan ke dalam bentuk tes objektif.
Tes bentuk isian, dianggap setaraf dengan tes jawaban singkat ini.
Cara pemberian skor untuk jenis tes ini dengan memberikan skor 2 (dua) untuk setiap soal. Akan tetapi, bisa juga skornya kita samakan dengan bentuk tes betul-salah atau pilihan ganda jika memang jawabannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap maka dapat diberi skor yang bervariasi pula misalnya 2; 1,5; dan 1.
Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan (matching)
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan ganda, dimana jawaban-jawaban dijadikan satu, demikian pula pertanyaan-pertanyaanya. Dengan demikian, maka pilihan jawabannya akan lebih banyak. Satu kesulitan lagi adalah bahwa jawaban yang dipilih dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan bagi pertanyaan lain.
Bentuk menjodohkan adalah tes bentuk pilihan ganda yang lebih kompleks. Maka skor/angka yang diberikan sebgai imbalan juga harus lebih banyak. Dapat ditentukan bahwa angka untuk tiap nomor adalah 2 (dua).
Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (essay test)
Dalam tes bentuk uraian setiap jawaban yang diberikan oleh siswa tentu berbeda-beda. Maka cara meberikan angka/skor menggunkan cara pemberian angka yang relative.
 Misalnya untuk suatu nomor soal jawaban yang paling lengkap hanya mengandung 3 unsur, padahal kita menghendaki 5 unsur, maka kepada jawaban yang paling lengkap itulah kita berikan angka 5, sedangkan untuk yang menjawab hanya 2 atau 1 unsur, kita ber angka lebih sedikit, yaitu misalnya 3,5; 2; 1,5; dan seterusnya.
Kunci jawaban dan kunci pemberian skr untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang harus termuat di dalam pekerjaan siswa. Hal ini menyangkut criteria tentang isi tugas. Namun sebagai kelengkapan dalam pemberian skor, digunakan suatu tolak ukur tertentu.
Tolak ukur yang disarankan dalam buku ini sebagai ukuran keberhasilan tugas adalah:
a)      Ketepatan waktu penyerahan tugas.
b)      Bentuk fisik pekerjaan tugas yang menandakan keseriusan mahasiswa dalam mengenakan tugas.
c)      Sistematika yang menunjukan alur keruntutan pikiran.
d)     Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan isi.
e)      Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang sudah ditentukan oleh dosen.
Dalam mempertimbangkan nilai akhir perlu dipikirkan peranan masing-masing aspek criteria tersebut, misalnya demikian:
A1 : ketepatan waktu, diberi bobot 2
A2 : bentuk fisik, diberi bobot 1
A3 : Sistematika, diberi bobot 3
A4 : kelengkapan isi, diberi bobot 3
A5 : mutu hasil, diberi bobot 3
Maka nilai akhir untuk tugas tersebut diberikan dengan rumus:
             2 x A1 + 1 x A2 + 3 x A3 + 3 x A4 + 3 x A5
NAT =  —————————————————
                                                       12
NAT adalah Nilai Akhir Tugas.
Dalam mempertimbangkan nilai akhir perlu dipikirkan peranan masing-masing aspek criteria tersebut, misalnya demikian:
A1 : ketepatan waktu, diberi bobot 2
A2 : bentuk fisik, diberi bobot 1
A3 : Sistematika, diberi bobot 3
A4 : kelengkapan isi, diberi bobot 3
A5 : mutu hasil, diberi bobot 3
Maka nilai akhir untuk tugas tersebut diberikan dengan rumus:
              A1 +  A2 +  A3 +  A4 +  A5
NAT =  —————————————————
                                12
NAT =( 2+1+3+3+3)x10
                                12
                                                      
NAT adalah Nilai Akhir Tugas.
Cara Memberi Skor Skala Sikap
Untuk mengukur sikap dan minat belajar siswa, guru dapat menggunakan alat penilaian model skala, seperti sikap dan skala minat.
 Skala sikap dapat menggunakan lima skala, yaitu; Sangat Setuju (SS), Setuju (S), Tidak Tahu (TT), Tidak Setuju (TS), dan Sangat Tidak Setuju (STS).
 Skala yang digunakan 5,4,3,2,1 (untuk pernyataan positif) dan 1,2,3,4,5 (untuk pernyataan negative).
 Begitupun dengan skala minat, guru dapat menggunakan lima skala, seperti Sangat Berminat (SB), Berminat (B), Sama Saja (SS), Kurang Berminat  (KB), dan Tidak Berminat (TB).
Cara Memberi Skor untuk Domain Psikomotor
Dalam domain psikomotor, pada umumnya yang diukur adalah penampilan atau kinerja.
Untuk mengukurnya, guru dapat menggunakan tes tindakan melalui simulasi, unjuk kerja atau tes identifikasi.
 Salah satu instrument yang dapat digunakan adalah skala penilaian yang terentang dari Sangat Baik (5), Baik (4), Cukup (3), Kurang Baik (2), sampai dengan Tidak Baik (1).

. PENDEKATAN PENILAIAN
Skor itu masih mentah karena diperoleh dari langsung dari koreksi. Untuk menjadi bermakna, ia masih harus diolah menjadi nilai akhir.
Nilai merupakan angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan normal atau acuan standard. Dengan demikian dapat kita tarik kesimpulan bahwa penilaian merupakan kegiatan menilai sesuatu yang berdasarkan perolehan skor/angka.
Untuk mengubah skor mentah menjadi nilai akhir, adalah dengan membandingkannya dengan skor standard. Prinsip yang mendasarinya adalah bahwa kepandaian seseorang di dalam suatu tes, dapat dilihat dari perbandingan antara skor mentah (yang berhasil dicapai) dengan skor standard (yang mungkin dicapainya).
Nilai akhir yang dihitung dengan cara membandingkan antara skor mentah dengan skr standard ini sangat mudah menghitungnya, yakni dengan mencari rasio antara skor mentah dengan skor standar.
Disekolah menengah skematis skala itu digambarkan sebagai berikut:
1 = amat buruk  6 = cukup
2 = buruk             7 = lebih dari cukup
3 = amat kurang                8 = baik
4 = kurang           9 = amat baik
5 = tidak cukup  10 = istimewa
Skala penilaian di perguruan tinggi menggunakan huruf-huruf sebagai lambang, yaitu sebagai berikut:
A = baik sekali
B = baik (lebih dari cukup)
C = cukup (batas lulus)
D = kurang (tidak lulus)
E = sangat kurang (tidak lulus)
Ada dua macam standar yaitu standard mutlak dan standard relatif.
1.      Dengan standar mutlak
Apabila nantinya pengolahan dan penentuan nilai hasil tes uraian itu akan didasarkan pada standar mutlak (dimana penentuan nilai secara mutlak akan didasarkan pada prestasi individual), maka prosedur pemeriksaannya adalah sebagai berikut:
a)      Membaca setiap jawaban yang diberikan oleh testee untuk butir soal tes uraian dan membandingkannya dengan pedoman  jawaban betul yang sudah disiapkan.
b)      Atas dasar hasil pembandingan antara jawaban testee dengan pedoman jawaban betul yang telah disiapkan itu, tester lalu memberikan skor untuk setiap butir soal dan menuliskannya dibagian kiri dari jawaban testee tersebut.
c)      Menjumlah skor-skor yang telah diberikan kepada testee (yang nantinya akan dijadikan bahan dalam pengolahan dan penentuan nilai lebih lanjut).
Dari beberapa langkah diatas standar mutlak juga dapat dilakukan dengan 2 cara yang lebih singkat, yaitu:
a)      Pemberian skor terhadap siswa, didasarkan atas pencapaian siswa terhadap tujuan yang telah ditentukan.
b)      Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor mentah
  Dengan standar relatif
Apabila nantinya pengolahan dan penentuan nilai akan didasarkan pada standar relative (dimana penentuan nilai akan didasarkan pada prestasi kelompok), maka prosedur pemeriksaannya adalah sebagai berikut:
a)      Memeriksa jawaban atas butir soal nomor 1 yang diberikan oleh seluruh testee, sehingga diperoleh gambaran secara umum mengenai keseluruhan jawaban yang ada. Setelah pemeriksaan terhadap seluruh jawaban itemnomor 1 dapat diselesaikan, maka tester akan menjadi tahu, testee manakah yang jawabannya termasuk lengkap, kurang lengkap, menyimpang, dan tidak memberikan jawaban sama sekali.
b)      Memberikan skor terhadap jawaban soal nomor 1 untuk seluruh testee; misalnya, untuk jawaban lengkap diberi skor 2, kurang lengkap diberikan skor 1, dan yang menyimpang atau tidak memberikan jawaban sama sekali diberikan skor 0.
c)      Setelah pemeriksaan atas jawaban butir soal nomor 1 dari seluruh testee dapat diselesaikan, lalu dilanjutkan dengan pemeriksaan terhadap jawaban butir soal nomor 2, dengan cara yang sama.
d)     Memberikan skor terhadap jawaban butir soal nomor 2 dari seluruh testee, dengan cara yang sama.
e)      Setelah jawaban atas seluruh butir soal yang diberikan oleh seluruh testee dapat diselesaikan, akhirnya dilakukanlah penjumlahan skor (yang nantinya akan dijadikan bahan dalam pengolahan dan penentuan nilai).


INSTRUMEN ( Sem 5 Intensif)



INSTRUMEN ( Sem 5 Intensif)

Instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat dipergunakan sebagai alat untuk mengukur suatu obyek ukur atau mengumpulkan data mengenai suatu variable. Dalam bidang pendidikan instrument digunakan untuk mengukur prestasi belajar siswa, factor-faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar, perkembangan hasil belajar siswa, keberhasilan proses belajar mengajar guru, dan keberhasilan pencapaian suatu program tertentu.
Jenis instrumen evaluasi dibagi menjadi dua, yaitu:
1.      TES
Menurut Sudijono dalam Djali dan Muljono (2008), tes adalah alat atau prosedur yang dipergunakan dalam rangka pengukuran dan penilaian.
Tes sebagai alat penilaian pertanyaan-pertanyaan yang diberikan kepada siswa untuk mendapat jawaban dari siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), dan dalam bentuk perbuatan (tes tindakan). Tes pada umumnya digunakan untuk menilai dan mengukur hasil belajar siswa, terutama hasil belajar kognitif berkenaan dengan penguasaan bahan pengajaran sesuai dengan tujuan pendidkan dan pengajaran.
2.      NON TES
Nontes adalah cara penilaian hasil belajar peserta didik yang dilakukan tanpa menguji peserta didik tetapi dengan melakukan pengamatan secara sistematis. Cara nontes yaitu pengamatan/observasi, wawancara/interview, angket, dan pemeriksaan dokumen
Tes dapat dibagi menjadi dua, yaitu
a.       Tes tertulis, yakni jenis tes dimana tester dalam mengajukan butir-butir pertanyaan atau soalnya dilakukan secara tertulis dan testee memberikan jawabannya juga secara tertulis.
Bentuk-bentuk tes tertulis, diantaranya:
1)      Tes objective
Macam-macam tes objective:
a)      Pilihan ganda
b)      Benar-salah
c)      Menjodohkan
d)     Melengkapi
2)      Tes subjective
Macam-macam tes subjektif:
a)      Jawaban singkat
b)      Uraian objektif
c)      Uraian bebes
b.      Tes lisan, yakni tes dimana tester didalam mengajukan pertanyaan-pertanyaan atau soalnya dialkukan secara lisan, dan testee memberikan jawabannya secara lisan juga.
  1. Bentuk Pilihan Ganda (Multiple Choice Test)
Tes pilihan ganda merupakan tes yang menggunakan pengertian/ pernyataan yang belum lengkap dan untuk melengkapinya maka kita harus memilih satu dari beberapa kemungkinan jawaban benar yang telah disiapkan.
Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari dua hal pokok yaitu stem atau pokok soal dengan 4 atau 5 alternatif jawaban. Satu di antara alternatif jawaban tersebut adalah kunci jawaban. Alternatif jawaban selain kunci disebut dengan pengecoh (distractor). Semakin banyak alternatif jawaban yang ada (misalnya 5) maka probabilitas menebaknya akan semakin kecil. Ada lima ragam tes pilihan ganda yang sering digunakan yaitu:
Pilihan ganda biasa (melengkapi pilihan)
Bentuk ini merupakan suatu kalimat pernyataan yang belum lengkap dan diikuti empat atau lima kemungkinan jawaban yang tepat dan melengkapi pernyataan tersebut.
b.      Hubungan antar hal (Sebab akibat)
Bentuk tes ini terdiri dari dua kalimat : satu kalimat pernyataan dan satu kalimat alasan. Ditanyakan apakah pernyataan memiliki hubungan sebab akibat atau tidak dengan alasan.
c. Analisa Kasus
Bentuk tes analisa kasus ini menghadapkan peserta pada satu masalah.
d.      Membaca Diagram, atau tabel
Bentuk soal ini mirip dengan bentuk pilihan ganda biasa, hanya saja disertai dengan tabel.
e.       Asosiasi pilihan ganda
Bentuk soal ini sama dengan bentuk soal melengkapi pilihan, yakni suatu pernyataan yang tidak lengkap yang diikuti dengan beberapa kemungkinan, hanya perbedaan pada bentuk asosiasi pilihan ganda kemungkinan jawaban bisa lebih dari satu, sedangkan melengkapi pilihan hanya satu yang paling tepat.
Petunjuk :
Pilih A jika (1), (2) dan (3) benar
Pilih B jika (1) dan (3) benar
Pilih C jika (2) dan (4) benar
Pilih D jika hanya (4) yang benar
Pilih E jika semuanya benar
Saran Pembuatan Soal Pilihan Ganda:
-          Pernyataan dan pilihan merupakan suatu rangkaian kalimat
-          Hindari pilihan yang tidak ada kaitannya satu sama lain
-          Buat pilihan yang mirip dengan jawaban kunci
-          Letak kunci jawaban sebaiknya tidak selalu berada pada tempat (poin) yang sama
-          Hindari kaitan antara satu soal dengan soal lainnya
Cara Memberikan Skor:
-          Tanpa Denda
Skor = Banyaknya jawaban yang benar
-          Dengan Denda
2.  Bentuk Tes Benar Salah (True-False Test)
Tes benar salah adalah bentuk tes yang mengajukan beberapa pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang berarti pernyataan tersebut salah. Tugas peserta tes adalah menentukan apakah pernyataan tersebut benar atau salah.
Contoh salah satu tes bentuk uraian adalah :
B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara
Kelebihan Tes Benar Salah:
-          Dapat mencakup bahan yang luas dan tidak memakan tempat yang banyak
-          Mudah dalam penyusunannya
-          Petunjuk mengerjakannya mudah dimengerti
-          Dapat digunakan berkali-kali
-          Objektif
-          Praktis
Kelemahan Tes Benar Salah:
-          Mudah ditebak
-          Banyak masalah yang tidak dapat dinyatakan hanya dengan kemungkinan benar atau salah
-          Reliabilitasnya rendah.
-          Hanya dapat mengungkapkan daya ingat dan pengenalan kembali

3. Menjodohkan (Matching Test)
Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya. Siswa ditugaskan untuk memasangkan atau mencocokkan, sehingga setiap pertanyaan mempunyai jawaban yang benar.
             Kelebihan:
-          Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem dan penyelesaiannya, sebab akibat, istilah dan definisinya, dsb.
-          Relatif mudah disusun.
-          Jika disusun dengan baik, maka faktor menerka-nerka dapat dihilangkan.
-          Dapat dinilai dengan mudah, cepat dan objektif.
Kelemahan:
-          Sukar menyusun test jenis ini yang benar-benar baik.
-          Untuk menilai ingatan saja.
-          Pengarahan jawaban sering terjadi
-          Memakan banyak waktu dan tenaga untuk menyusunnya.
Saran Penulisan:
-          Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri
-          Lebihnya jawaban hendaknya menunjukkan jawaban yang salah
-          Materinya setiap sisi baiknya mengenai satu pokok bahasan saja
-          Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor soal dan pertanyaan. Sedangkan kolom kedua memuat kode dan pilihan jawaban.
Cara Memberikan Skor:
Penskoran pada tes menjodohkan tidak diberikan denda terhadap jawaban yang salah. Skor = Jumlah jawaban benar
4. Tes Isian (Complementary Test)
Tes isian terdiri dari kalimat yang dihilangkan (diberi titik-titik). Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan pengertian yang diminta agar pernyataan yang dibuat menjadi pernyataan yang benar.
             Contoh:
1.      Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..
2.      Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari kitab suci atau ajaran agama, tidak juga dari para penguasa, tetapi dari diri manusia sendiri. Namun tentang aspek mana yang berperan ada beda pendapat. Aliran ……………….. beranggapan bahwa sumber pengetahuan adalah rasio: kebenaran pasti berasal dari rasio (akal). Aliran ……………, sebaliknya, meyakini pengalamanlah sumber pengetahuan itu, baik yang batin, maupun yang inderawi.
Cara Memberikan Skor:
Pada tes ini sulit dilakukan tebakan, sehingga tidak diperlukan denda terhadap jawaban yang salah. Maka rumus yang digunakan adalah :
Skor = Jumlah jawaban benar
Petunjuk Penyusunan Tes Objektif
-          Pokok soal harus dirumuskan dengan singkat, jelas, dan tegas.
-          Hindari pengulangan kata yang sama pada pokok soal.
-          Hindari penggunaan kalimat yang berlebihan pada pokok soal.
-          Soal harus sesuai dengan indikator.
-          Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja.
-          Gambar, grafik, tabel, diagram, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi.
-          Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
-          Jangan menggunakan bahasa yang berlaku setempat, jika soal akan digunakan untuk daerah lain atau nasional.
-          Setiap soal harus menggunakan bahasa yang komunikatif.
-          Jumlah pilihan jawaban untuk soal SD dan SMP adalah empat pilihan
-          Jumlah pilihan jawaban untuk SMA dan sederajat yaitu lima pilihan
-          Alternatif jawaban yang dibuat harus logis, homogen, dan pengecoh menarik untuk dipilih.
-          Dalam merumuskan pokok soal, hindari adanya petunjuk ke arah jawaban yang benar.
-          Setiap butir soal hanya mempunyai satu jawaban yang benar.
-          Hindari penggunaan ungkapan negatif pada pokok soal.
-          Hindari altenatif-jawaban yang berbunyi semua jawaban benar atau semua jawaban salah.
Jika alternatif jawaban berbentuk angka, urutkan mulai dari yang besar atau yang kecil.
-          Hindari penggunaan istilah yang terlalu teknis pada pokok soal.
-          Upayakan agar jawaban butir soal yang satu tidak tergantung soal yang lain.
-          Pokok soal tidak menggunakan pernyataan yang bersifat negatif ganda;
-          Panjang rumusan pilihan jawaban relatif sama;
-          Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecil atau secara kronolis
-          Pilihan jawaban tidak mengulang kata/kelompok kata yang sama.
.    Ketepatan penggunaan Tes Objektif
Soal tes objektif sangat bermanfaat untuk mengukur hasil belajar kognitif tingkat rendah. Hasil-hasil belajar kompleks seperti menciptakan dan mengorganisasikan gagasan kurang cocok diukur menggunakan soal bentuk ini.
Ketentuan Pokok:
-          Kelompok yang akan dites banyak dan tesnya akan digunakan lagi berkali-kali
-          Skor yang diperoleh diperkirakan akan dapat dipercaya (mempunai reliabilitas yang tinggi).
-          Guru lebih mampu menyusun tes bentuk objektif dapri pada tes bentuk uraian.
-          Hanya mempunyai waktu sedikit untuk koreksi dibandingkan dengan waktu yang digunakan untuk menyusun test
Kelebihan dan kelemahan Tes Objektif
1.      Kelebihan
-          Penilaiannya yang sangat objektif: Sebuah jawaban hanya mempunyai dua kemungkinan, benar atau salah.
-          Toleransi di antara salah dan benar tidak diberikan karena tingkat kebenarannya bersifat mutlak.
-          Soal objektif memiliki reliabilitas yang tinggi, siapapun yang menilai dan kapanpun dinilai, hasilnya akan tetap sama.
-          Butir soal yang banyak memungkinkan untuk mencakup semua daerah prestasi yang hendak diukur (representatif).
-          Lebih mudah dan cepat karena pemeriksaannya menggunakan kunci.
-          Dapat digunakan untuk menilai kelompok yang besar
-          Menghindari kemungkinan siswa berspekulasi dalam mempelajari bahan pelajaran.
-          Tidak ada unsur subjektif yang mempengaruhi.
-          Dalam satu kali ujian dapat menanyakan banyak materi yang telah diajarkan dalam proses pembelajaran.
-          Validitas isi tes dapat dipertanggungjawabkan.
-          Jika dikonstruksi dengan baik tes objektif dapat mengukur semua jenjang proses berpikir dari yang sederhana (ingatan) sampai dengan yang kompleks (evaluasi).
Kelemahan
-          Tes objektif diragukan kemampuannya untuk mengukur hasil belajar yang kompleks dan tinggi.
-          Peluang melakukan tebakan (guessing) sangat tinggi.
-          Penyusunan tes sukar dan memerlukan waktu yang cukup banyak
-          Kurang memberi kesempatan kepada siswa untuk menyatakan kemampuan ilmiahnya
-          Sukar untuk mengukur proses mental yang tinggi
-          Kerjasama antar siswa dalam mengerjakan soal lebih terbuka
-          Menggunakan bahan (kertas) yang lebih banyak
   Kelebihan dan kelemahan Tes Subjektif/Tes Uraian
1.      Kelebihan
-          Kekuatan soal untuk mengukur hasil belajar yang kompleks dan melibatkan level kognitif yang tinggi.
-          Memberi kesempatan pada anak untuk menyusun jawaban sesuai dengan jalan pikirannya sendiri.
-          Tepat digunakan untuk melatih siswa dalam mengemukakan dan mengorganisasi gagasan atau ide, serta lebih cepat dan mudah membuatnya.
2.      Kelemahan
-          Terdapat subjektivitas dalam penilaiannya karena penilai yang berbeda atau situasi yang berbeda.
-          Tes esai menghendaki jawaban yang panjang, sehingga tidak memungkinkan ditulis butir tes dalam jumlah banyak (soal menjadi tidak representatif).
-          Penggunaan soal esai membutuhkan waktu koreksi yang lama dalam menentukan nilai.
-          Sering terjadi hallo effect, carry over effect, dan order effect.
Bentuk-bentuk non tes:
a.       Pengamatan
Pengertian observasi menurut Anas Sudijono adalah cara menghimpun bahan-bahan keterangan (data) yang dilakukan dengan mengadakan pengamatan dan pencatatan secara sistematis terhadap fenomena-fenomena yang sedang dijadikan sasaran pengamatan.
b.      Wawancara
Wawancara adalah cara menghimpun bahan-bahan keterangan yang dilaksanakan dengan melakukan tanya jawab lisan secara sepihak, berhadapan muka, dan dengan serata tujuan yang telah ditentukan
Ada dua jenis wawancara yang dapat dipergunakan sebagai alat evaluasi, yaitu:
1)      Wawancara terpimpin (guided interview) yang juga sering dikenal dengan istilah wawancara berstruktur (structured interview) atau wawancara sistematis (systematic interview).
2)      Wawancara tidak terpimpin (un-guided interview) yang sering dikenal dengan istilah wawancara sederhana (simple interview) atau wawancara tidak sistematis (non-systematic interview)
c.       Angket
Angket adalah alat pengumpulan data secara tertulis yang berisi daftar pertanyaan atau pernyataan yang disusun secara khusus dan digunakan untuk menggali dan menghimpun keterangan dan atau informasi sebagaimana dibutuhkan dan cocok untuk dianalisis.
d.      Pemeriksaan dokumen
       Evaluasi mengenai kemajuan, perkembangan atau keberhasilan belajar peserta didik tanpa menguji (teknik non-tes)
       Dapat dilengkapi atau diperkaya dengan cara melakukan pemeriksaan terhadap dokumen-dokumen, misalnya: dokumen yang menganut informasi mengenai riwayat hidup (auto biografi), seperti kapan kapan dan dimana peserta didik dilahirkan, agama yang dianut, kedudukan anak didalam keluarga dan sebagainya.
       Dokumen yang memuat informasi tentang orang tua peserta didik, dokumen yang memuat tentang lingkungan non-sosial, seperti kondisi bangunan rumah, ruang belajar, lampu penerangan dan sebagainya.
       Beberapa informasi, pada saat-saat tertentu sangat diperlukan sebagai bahan pelengkap bagi pendidik dalam melakukan evaluasi hasil belajar terhadap peserta didiknya