Selasa, Juni 21, 2016

Penyusunan Perangkat Evaluasi


Semua negara pada era yang mengglobal saat ini, mau tidak mahu harus berhadap-hadapan dalam berkompetisi untuk meningkatkan kualitas pendidikan. Melalui pendidikan maka sumber daya manusia dapat ditingkatkan, sehngga dampaknya pada tingkat kesejahteraan masyarakat yang diharpkan akan meningkat.
Lembaga pendidikan, seperti sekokah-sekolah memiliki peran penting dalam menghasilkan sumber daya manusia yang berkualitas, yaitu yang mampu mengelola sumber daya alam secara efektif dan efisien, memberi layanan jasa yang baik, serta mampu mengembangkan usaha-usaha baru yang dapat meningkatkan kesejahteraan masyarakat. Oleh karena itu, maka merupakan impian bagi pengelola pendidikan di sekolah bahwa seluruh proses pengelolaan yang berlangsung dapat berlangsung dengan standar proses yang bermutu atau berkualitas. Harapan ini wajar, karena begitu pentingnya kualitas pendidikan di sekolah dalam rangka menghasilkan output yang berkualitas pula, yaitu dihasilkannya manusia yang berkualitas, yaitu manusia yang dapat memenuhi harapan dan tuntutan kehidupan nyata di masyarakat. Olehnya demikian lembaga pendidikan haru betul-betul dapat memahami seluruh proses pendidikan yang berlangsung mulai dari proses perencanaa, penyediaan sarana pendukung, proses implementasi, maupun output yang dihasilkan. Dalam rangka memahami rangkaian proses yang terjadi dalam dunia pendidikan, khususnya sekolah maka diperlukan adanya proses evaluasi yang berkualitas.
Menurut Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar (2014: 2) menyimpulkan dari beberapa pendapat para ahli, bahwa evaluasi adalah kegiatan untuk mengumpulkan informasi tentang bekerjanya sesuatu, yang selanjutnya informasi tersebut digunakan untuk  menentukan alternatif yang tepat dalam mengambil sebuah keputusan. Selanjutnya Stufflebeam dan Shinkfiel (1985),  dalam Djemari Mardapi (2012: 26) mengatakan bahwa evaluasi disevinisikan sebagai proses untuk memperoleh informasi guna memilih alternatif yang terbaik.
Dengan menggunakan istilah “pengukuran”, Djemari Mardapi (2012: 1) menjelaskan bahwa semua kegiatan didunia ini tidak lepas dari kegiatan pengukuran. Tingkat keberhasilan suatu program hanya dapat diketahui melalui pengukuran. Pengukuran memegang peranan penting, baik untuk pengembangan ilmu pengetahuan dan teknologi maupun penyajian informasi bagia pembuat kebijakan. Jadi jika hasil pengukuran tidak baik, dengan teknik apapun yang digunakan untuk menganalisa data, hasilnya tetap tidak baik. Data yang tidak baik tidak bisa diolah menjadi informasi yang baik. Oleh karena itu, pengukuran memegang peran penting dalam bidang pendidikan.
Dengan demikian, sebuah lembaga pendidikan (sekolah) agar dapat memastikan bahwa seluruh proses pendidikan yang telah dilaksanakan berlangsung dengan baik atau tidak maka mutlak diperlukan kegiatan evaluasi. Hal ini dimaksudkan untuk melihat secara obyektif keterlaksanaan dari semua rangkaian proses pendidikan yang berlangsung. Hal ini sejalan dengan pendapat dari Purwanto (2014: 5) yang mengatakan bahwa kegiatan apapun yang dilakukan, jika ingin memperoleh informasi mengenai kinerjanya maka perlu dilakukan evaluasi. Demikian juga Djemari Mardapi (2012: 4) mengatakan bahwa melalui evaluasi akan diperoleh informasi tentang apa yang telah dicapai dan mana yang belum, dan selanjutnya informasi ini digunakan untuk perbaikan suatu program. Dari kedua pendapat ahli ini maka dapat dipahami bahwa dalam rangka mengusahakan secara terus menerus peningkatan kualitas suatu lembaga pendidikan (sekolah) maka mutlak diperlukan pelaksanaan evaluasi dari proses pendidikan dalam lembaga pendidikan (sekolah) tersebut. Evaluasi ini dikenakan terhadap semua tahapan proses pendidikan, mulai dari perencanaan, pengadaan sarana pendukung, proses implementasi, serta hasilnya (output).
Selain itu juga evaluasi sangat berguna untuk meningkatkan kualitas sistem pembelajaran. Evaluasi tidak dapat dipisahkan dari pembelajaran, karena keefektifan pembelajaran hanya dapat diketahui melalui evaluasi. Dengan kata lain, melalui evaluasi semua komponen pembelajaran dapat diketahui apakah dapat berfungsi sebagaimana mestinya atau tidak. Guru dapat mengetahui tingkat kemampuan peserta didik , baik secara kelompok maupun perseorangan. Guru juga dapat melihat berbagai perkembangan hasil belajar peserta didik, baik yang menyangkut domain kognitif, efektif, maupun psikomotorik. Pada akhirnya, guru akan memperoleh gambaran tentang keefektifan proses  pembelajaran (Zainal Arifin, 2009: 68-69).
Ada empat istilah yang berkaitan dengan kegiatan evaluasi pendidikan, yaitu pengukuran, pengujian, asesmen, dan evaluasi. Pengukuran adalah penetapan angka dengan cara yang sistimatik untuk menyatakan keadaan individu atau obyek (Allen & Yen, 1979). Pengujian merupakan kegiatan untuk mengetahui kemampuan yang dimiliki peserta didik. Asesmen mencakup semua cara yang digunakan untuk menilai unjuk kerja individu atau kelompok (TGAT, 1987), melalui pengumpulan bukti-bukti tentang pencapaian belajar peserta didik (Djemari Mardapi, 2012: 5-6).
Menurut Griffin dan Nix (1991, dalam Djemari Mardapi, 2012: 6) bahwa kegiatan pengukuran, asesmen, dan evaluasi adalah hirarki. Pengukuran membandingkan hasil pengamatan dengan kriteria, asesmen menjelaskan dan menafsirkan hasil pengukuran, sedangkan evaluasi adalah penetapan nilai atau implikasi suatu kebijakan atau putusan. Sifat hirarkis ini mrnunjukkan bahwa setiap kegiatan evaluasi melibatkan pengukuran dan asesmen. Hal ini sejalan dengan Purwanto (2014: 2) yang menegaskan bahwa pengukuran dan evaluasi merupakan dua kegiatan yang berkesinambungan, evaluasi dilakukan setelah dilakukan pengukuran dan keputusan evaluasi dilakukan berdasarkan hasil pengukuran. Dengan demikian bahwa proses evaluasi yang baik dan tepat hanya akan terjadi jika didukung oleh keterlaksanaan pengukuran dan asesmen yang baik dan tepat pula.
Pengukuran pada dasarnya merupakan kegiatan penentuan angka bagi suatu obyek secara sistematik. Penentuan angka ini merupakan usaha untuk menggambarkan karakteristik suatu obyek (Djemari Mardapi, 2012: 7). Selanjutnya angka-angka hasil pengukuran inilah yang akan dijadikan sebagai dasar dalam melakukan kesimpulan dalam proses evaluasi.
Pertanyaan mendasarnya adalah bagaimanakah angka hasil pengukuran tersebut bisa dipercaya? Apakah angka-angka hasil pengkuran tersebut bebas dari unsur-unsur subyektif dari orang yang mengukur? Sementara itu Purwanto (2014: 57) menjelaskan bahwa data hasil pengukuran yang benar haruslah memenuhi beberapa persyaratan  dasar seperti: positif, nyata, bebas dari prasangka subyektifitas, dan harus selalu terbuka untuk diragukan dan duuji ulang kebenarannya. Lebihlanjut dikatakan bahwa data yang memenuhi persyaratan kebenaran itu hanya didapat melalui kegiatan pengkuran, karena pengukuran ternyata dapat membebaskan data dari subyektifitas dan kepentingan karena  dalam pengumpulan data mandat pengumpulan data telah diserahkan oleh pengumpul data kepada alat ukur atau instrumen.
Pemahaman tentang instrumen menjadi penting karena dalam praktik evaluasi dan penilaian, pada umumnya guru selalu mendasarkan pada proses pengukuran. Dalam pengukuran tentu harus ada alat ukur (instrumen), baik tes maupun non tes (Zainal Arifin, 2009: 69). Demikian juga Purwanto (2014: 56) mengatakan bahwa dalam pendidikan, instrumen alat ukur yang digunakan untuk mengumpulkan data dapat berupa tes dan nontes. Untuk memperoleh hasil dari evaluasi yang valid, maka harus digunakan instrumen alat ukur (tes atau non tes) yang memenuhi kriteria yang baik yang digunakan pada pengumpulan data-data saat pengukuran.
Bagi pengelola pendidikan (sekolah), proses pengadaan instrumen alat ukur yang baik merupakan suatu hal yang sangat penting dalam rangka evaluasi pendidikan. Untuk itu maka diperlukan juga pemahaman yang menyeluruh dan mendalam mengenai cara penyusunan instrumen alat ukur yang baik, serta memahami tentang kriteria atau persyaratan-persyaratan yang perlu dipenuhi oleh instrumen sebagai alat ukur penilaian yang baik itu. Oleh karena itu, dalam makalah ini akan mencoba menyajikan berbagai informasi mengenai pentingnya instrumen evaluasi, macam-macam instrumen evaluasi, dan prosedur penyusunan instrumen evaluasi yang baik.


A.    Instrumen atau Perangkat Evaluasi Pendidikan.
A.1. Pengertian dan Pentingnya Instrumen atau Perangkat Evaluasi Pendidikan
a. Pengertian Instrumen Evaluasi
    Dalam Buku Kamus Bahasa Indonesia, instrumen mengandung pengertian; 1) alat yang dipakai untuk mengerjakan sesuatu perkakas; 2) alat-alat musik (spt piano, biola, dsb); 3) orang yang dimanfaatkan sebagai alat (diperalat) orang lain (pihak lain); 4) sarana penelitian (berupa seperangkat tes dsb) untuk memeroleh data sebagai bahan pengolahan.
Dari pengertian instrumen di atas, pengertian yang cocok dengan topik pembicaraan kita tentang evaluasi adalah pengertian pada nomor 4 yaitu bahwa instrumen adalah sarana penelitian (berupa seperangkat tes dsb) untuk memeroleh data sebagai bahan pengolahan.
    Farida Yusuf Tayibnapis (2008: 102), instrumen ialah alat untuk merekam informasi yang akan dikumpulkan, contohnya antara lain wawancara, kuesioner, tes, ceklis, observasi dan lain-lain.
    Selanjutnya Purwanto (2014: 56) mengemukakan bahwa instrumen adalah alat ukur yang digunakan untuk mengukur dalam rangka pengumpulan data. Misalnya timbangan adalah instrumen alat ukur yang digunakan untuk mengumpulkan data berat dengan cara melakukan penimbangan, termometer adalah alat ukur yang digunakan untuk mengumpulkan data suhu, meteran untuk mengukur jarak dan sebagainya.
    Pendapat Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar (2014: 90) bahwa dari arti istilahnya, instrumen menunjuk pada sesuatu yang dapat berfungsi sebagai  pembantu agar usaha pencapaian tujuan lebih mudah. Dalam usaha mengumpulkan data, instrumen berfungsi untuk mempermudah, memperlancar, dan membuat pekerjaan pengumpulan data menjadi lebih sistimatis. Selanjutnya Suharsimi Arikunto (2010: 192) dalam bukunya berjudul “Prosedur Penelitian Suatu Pendekatan Praktis” mengatakan bahwa instrumen adalah alat pada waktu penelitian menggunakan suatu metode pengumpulan data tertentu. Misalnya instrumen tes atau soal tes untuk metode tes, instrumen chek-list untuk metode observasi, dan sebagainya.
    Dengan demikian berdasarkan dari beberapa pengertian instrumen yang telah dikemukakan di atas, maka dapat disimpulkan bahwa instrumen dalam evaluasi atau penelitian dapat didefinisikan  sebagai suatu sarana berupa seperangkat alat yang dipergunakan yang disesuaikan dengan metode tertentu dalam rangka mempermudah  pengumpulan informasi berupa data yang dibutuhkan untuk suatu keperluan evaluasi atau penelitian.
b. Pentingnya Instrumen Dalam Evaluasi atau Penelitian.
    Dari pengertian instrumen di atas, secara sederhana dapat dikatakan bahwa instrumen memiliki fungsi atau bermanfaat untuk mempermudah dan memperlancar evaluator atau peneliti dalam mengumpulkan informasi atau data yang dinginkan sesuai dengan metode tertentu yang digunakan. Atau dengan kata lain suatu proses evaluasi atau penelitian akan mengalami hambatan dan masalah dalam pengumpulan informasi atau data, jika tidak menggunakan instrumen. Bisa jadi masalah yang dimaksud, yaitu berupa informasi atau data yang ingin didapatkan tidak akurat, keliru, atau bahkan salah sama sekali. Jadi dengan demikian, adanya instrumen maka proses pengumpulan data atau informasi dapat dilakukan dengan mudah serta menghasilkan data dan informasi yang akurat dan benar.
    Menurut Purwanto (2014: 57) bahwa data yang benar harus memenuhi beberapa persyaratan dasar seperti: positif, nyata, bebas dari prasangka subyektifitas, dan harus selalu terbuka untuk diragukan dan diuji ulang kebenarannya. Lebih lanjut dikatakan bahwa data yang demikian itu hanya diperoleh melalui kegiatan pengukuran dengan menggunakan alat atau instrumen. Hal ini karena pengukuran membebaskan data dari unsur subyektifitas dan kepentingan karena dalam pengumpulan data mandat pengumpulan data telah diserahkan oleh pengumpul data kepada alat ukur atau instrumen. Dengan demikian salah satu arti pentingnya instrumen adalah dapat menghindarkan subyektifitas evaluator atau peneliti terhadap data atau informasi yang dihasilkan.
    Selanjutnya menurut Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar (2014: 90-91) memberikan sebuah contoh, bahwa dalam melakukan suatu pengumpulan data atau informasi melalui wawancara kepada responden bisa jadi ditengah proses wawancara sangat mungkin perhatian pewawancara teralihkan kepada hal-hal yang diluar topik permasalahan yang diinginkan. Jika sudah terjadi situasi seperti ini, wawancara dapat menyimpang dari niat semula.  Tetapi dengan adanya instrumen berupa semacam panduan wawancara maka perhatian pewawancara akan kembali ke topik semula. Itu sebabnya di dalam melakukan wawancara seorang evaluator atau peneliti perlu instrumen yang berupa panduan wawancara. Dengan demikian bahwa instrumen sangat penting untuk memandu kegiatan pengumpulan data agar tidak melenceng dari yang direncanakan.
    Dari beberapa penjelasan diatas, maka dapat dikemukakan arti penting dari sebuah instrumen dalam proses evaluasi atau penelitian adalah sebagai berikut:
1.    Membantu mempermudah dan memperlancar proses pengumpulan data.
2.    Menjamin ketepatan dalam pengumpulan data atau informasi yang dibutuhkan.
3.    Menghindarkan unsur subyektifitas terhadap data atau informasi hasil evaluasi atau penelitian.
4.    Dijadikan sebagai peta jalan dalam pengumpulan data atau informasi, sehingga evaluator atau peneliti tidak menyimpang.
Selanjutnya Zainal Arifin (2009: 69-70), menjelaskan bahwa instrumen yang baik adalah instrumen yang memenuhi syarat-syarat atau kaidah-kaidah tertentu, dapat memberikan data yang akurat sesuai dengan fungsinya, dan hanya mengukur sampel perilaku tertentu. Adapun karakteristik instrumen evaluasi  yang baik adalah valid, reliabel, relevan, representatif, praktis, deskriminatif, spesifik, dan proporsional.
   
A.2. Jenis-Jenis Instrumen atau Perangkat Evaluasi Pendidikan
    Dalam dunia pendidikan, instrumen alat ukur yang digunakan untuk mengumpulkan data dapat berupa tes dan nontes. Tes merupakan alat ukur pengumpulan data yang mendorong peserta memberikan penampilan maksimal. Instrumen nontes merupakan alat ukur yang mendorong peserta untuk memberikan penampilan tipikal, yaitu melaporkan keadaan dirinya dengan memberikan respon secara jujur sesuai dengan pikiran dan perasaannya (Purwanto, 2014: 58).
    Selanjutnya dijelaskan pula bahwa instrumen alat ukur dalam pendidikan sangat bergantung dengan variabel yang hendak diukur. Berdasarkan perlu tidaknya alat ukur atau instrumen dibakukan maka ada dua jenis  instrumen yaitu instrumen yang tidak perlu dibakukan dan instrumen yang perlu dibakukan. Instrumen yang tidak perlu dibakukan adalah instrumen yang dibuat untuk mengukur variabel aktual, sedangkan instrumen yang perlu dibakukan adalah instrumen yang dibuat untuk mengukur variabel konseptual. Oleh karena variabel konseptual adalah variabel yang tidak terlihat dalam fakta tetapi tersembunyi dalam konsep (Purwanto, 2014: 59).

    A.2.1. Instrumen bentuk tes
    Secara garis besar dari berbagai jenis tes dapat dikelompokkan menjadi dua yaitu tes penguasaan dan tes kemampuan. Tes penguasaan (mastering test) adalah tes yang diujikan setelah peserta memperoleh sejumlah materi, dan bertujuan untuk mengukur penguasaan siswa terhadap materi yang disampaikan guru dan dipelajari oleh siswa. Sedangkan tes kemampuan (competence test) adalah tes yang diujikan untuk mengetahui kepemilikan kemampuan peserta tes (Purwanto, 2014: 65-66).
Sedangkan menurut Granlund dan Linn (1990: 12-13, dalam Purwanto, 2014: 67) bahwa berdasarkan peranan fungsionalnya dalam pembelajaran tes hasil belajar dibagi menjadi 4 macam, yaitu tes formatif, tes sumatif, tes diagnostik, dan tes penenmpatan.
Keempat jenis tes tersebut akan dijelaskan sebagai berikut: (Djemari Mardapi, 2012: 111-1120
•    Tes penempatan digunakan untuk mengetahui tingkat kemampuan yang telah dimiliki peserta didik. Tes yang dilaksanakan pada awal pelajaran ini juga untuk mempelajari apakah suatu mata pelajaran membutuhkan pengetahuan pendukung atau tidak. Pengetahuan pendukung ini diketahui dengan menelaah hasil tes penempatan, apakah seorang peserta didik perlu matrikulasi, tambahan materi pelajaran tertentu atau tidak.
•    Tes diagnostik berguna untuk mengetahui kesulitan belajar yang dihadapi peserta didik, termasuk kesalahan pemahaman konsep. Hasil tes diagnostik memberikan informasi tentang konsep-konsep yang telah dipahami dan yang belum dipahami. Oleh karena itu, tes ini mengandung materi yang dirasa sulit oleh peserta didik, namun tingkat kesulitasn tes ini cenderung rendah.
•    Tes formatif bertujuan untuk memperoleh masukan tentang tingkat keberhasilan pelaksanaan proses pembelajaran. Masukan ini berguna untuk memperbaiki strategi pembelajaran. Tes  ini dilakukan secara periodik sepanjang semester. Materi tes dipilih berdasarkan tujuan pembelajaran atau standar kompetensi tiap pokok bahasan atau sub pokok bahasan. Jadi tes ini bertujuan untuk mengetahui keberhasilan proses pembelajaran.
•    Tes sumatif digunakan untuk menentukan keberhasilan belajar peserta didik. Oleh karena itu, tes ini diberikan di akhir semester atau akhir suatu pelajaran. Tingkat keberhasilan ini dinyatakan dengan skor atau nilai, pemberian sertifikat, atau sejenisnya. Tingkat kesukaran soal pada tes sumatif ini bervariasi, sedangkan materi tes harus mewakili bahan yang telah dipelajari. Hasil tes bisa ditafsirkan  sebagai keberhasilan belajar dan atau keberhasilan melaksanakan pembelajaran.
    Berdasarkan jumlah peserta didik , tes hasil belajar ada dua jenis yaitu tes kelompok dan tes perorangan. Tes kelompok, yaitu tes yang diadakan secara kelompok. Guru akan berhadapan dengan sekelompok peserta didik. Tes perorangan yaitu tes yang dilakukan  secara perorangan. Guru akan berhadapan dengan seorang peserta didik. Dilihat dari cara penyusunannya, tes dibagi dua jenis, yaitu tes buatan guru (teacher-made test) dan tes yang dibakukan (standarized test). Tes buatan guru adalah tes yang disusun oleh guru yang akan mempergunakan tes tersebut. Tes yang dibakukan atau tes baku adalah tes yang sudah memiliki derajat validitas dan reliabilitas yang tinggi berdasarkan percobaan-percobaan terhadap sampel yang cukup besar dan representatif. Tes baku adalah tes yang dikaji berulang-ulang kepada sekelompok besar peserta didik, dan item-itemnya relevan  serta mempunyai daya beda yang tinggi (Zainal Arifin, 2009: 118).
    Bentuk tes yang digunakan dalam satuan pendidikan ada dua kategori, yaitu tes obyektif dan tes nonobjektif. Adapun tes objektif yang sering digunakan adalah:
•    Bentuk pilihan ganda,
•    Bentuk benar salah,
•    Bentuk menjodohkan, dan
•    Uraian objektif, yang terdiri dari uraian objektif dan uraian nonobjektif.
(Djemari Mardapi, 2012: 109)
    Selain itu instrumen tes lain yang dipakai untuk mengukur kemampuan hasil belajar siswa adalah tes unjuk kerja atau performansi dan portofolio (Masnur Muslich, 2011: 109).

    A.2.2. Instrumen non tes.
    Instrumen non tes dapat digunakan jika kita ingin mengetahui kualitas proses dan produk dari suatu pekerjaan serta hal-hal yang berkenaan dengan domain efektif, seperti sikap, minat, bakat dan motivasi. Setiap dimensi dan aspek yang diukur memerlukan alat atau intrumen yang berbeda. Fungsi khusus teknik non tes dalam evaluasi hasil belajar adalah  untuk mengukur perubahan sikap dan pertumbuhan anak dalam psikologi. Adapun intrumen evaluasi jenis non tes itu banyak macamnya, diantaranya yaitu observasi (observation), wawancara (interview), skala sikap (attitude), daftar cek (check list), skala penilaian (rating scale), angket (quetioner), studi kasus (case study), catatan insidental (anecdotal records), sosiometri, dan inventori kepribadian (Zainal Arifin, 2009: 152).
Instrumen nontes merupakan alat ukur yang mendorong peserta untuk memberikan penampilan tipikal, yaitu melaporkan keadaan dirinya dengan memberikan respons secara jujur sesuai dengan pikiran dan perasaannya (Purwanto, 2014: 56). Dalam makalah ini, instrumen nontes yang dimaksud yang juga akan dibahas adalah instrumen untuk mengukur kemampuan hasil belajar pada ranah efektif, yang meliputi sikap, minat, nilai, dan konsep diri. Dengan demikian ada empat instrumen nontes yang juga akan dibahas dalam makalah ini yaitu:
•    Instrumen sikap,
•    Instrumen minat,
•    Instrumen konsep diri,
•    Instrumen nilai, dan
•    Instrumen moral.

B.    Prosedur Penyusunan Instrumen atau Perangkat Evaluasi Pendidikan
B.1. Langkah-langkah Penyusunan Instrumen Tes
    Ada delapan langkah yang harus ditempuh dalam menyusun tes hasil atau prestasi belajar yang baku seperti berikut ini: (Djemari Mardapi, 2012: 110)
1.    menyusun spesifikasi tes,
2.    menulis tes,
3.    mentelaah tes,
4.    melakukan ujicoba tes,
5.    menganalisis butir tes,
6.    memperbaiki tes,
7.    merakit tes, dan
8.    melaksanakan tes.
Sedangkan menurut Masnur Muslich (2011: 106-107) bahwa ada sembilan langkah yang harus ditempuh guru dalam pengembangan tes hasil belajar atau tes prestasi belajar, yaitu (a) menyusun spesifikasi tes, (b) menulis soal tes, (c) menelaah soal tes, (d) melakukan uji coba tes, (e) menganalisis butir soal, (f) memperbaiki tes, (g) merakit tes, (h) melaksanakan tes, dan (i) menafsirkan hasil tes.
    Berikut akan dijelaskan sati persatu langkah-langkah yang harus ditempuh dalam menyusun tes sebagaimana tersebut di atas.

a.    Menyusun spesifikasi tes.
Berisi uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Prosedur penyusunan spesifikasi tes adalah sebagai berikut: menentukan tujuan tes, menyusun kisi-kisi tes, menentukan bentuk tes, dan menentukan panjang tes.
    a.1. Menentukan tujuan tes.
Tujuan tes yang paling penting adalah: (1) mengetahui tingkat kemampuan peserta didik, (2) mengukur pertumbuhan dan perkembangan peserta didik, (3) mendiagnosis kesulitan belajar, (4) mengetahui hasil pembelajaran, (5) mengetahui pencapaian kurikulum, (6) mendorong peserta didik belajar, (7) mendorong peserta didik melaksanakan pembelajaaran yang lebih baik.
Selain itu dalam menentukan tujuan tes ini juga didasarkan pada jenis-jenis tes berdasarkan tujuannya yaitu tes penempatan, tes diagnostik, tes formatiaf dan tes sumatif.
a.2. Penusunan kisi-kisi tes.
    Kisi-kisi merupakan tabel matrik yang berisi spesifikasi soal yang akan dibuat. Kisi-kisi ini merupakan acuan bagi penulis soal, sehingga siapapun yang menulis soal akan menghasilkan soal yang isi dan tingkat kesulitannya relatif sama. Matrik kisi-kisi soal terdiri dari dua jalur, yaitu kolom dan baris. Kolom menyatakan standar kompetensi, kompetensi dasar, indikator, dan bentuk tes. Standar kompetensi dan kompetensi dasar diambil dari kurikulum, sedang indikator dikembangkan oleh guru (Djemari Mardapi, 2012: 113).
Ada tiga langkah dalam mengembangkan  kisi-kisi tes, yaitu:
1)    Menuliskan standar kompetensi
2)    Menuliskan kompetensi dasar
3)    Menentukan indikator, dan
4)    Menentukan jumlah soal tiap indikator
Semua standar kompetensi mata pelajaran dan kompetensi dasar yang telah diajarkan diujikan. Kriteria yang digunakan dalam memilih kompetensi dasar adalah: (1) sering digunakan, (2) memiliki nilai terapan, (3) digunakan pada mata pelajaran lain, (4) terdapat pada buku teks mata pelajaran. Penentuan indikator-indikator mengacu pada kompetensi dasar, dan menggunakan kata kerja yang dapat diukur.
Jumlah soal tiap kompetensi dasar tergantung pada tingkat kompleksitas, dan luasan cakupannya. Kompetensi dasar yang kompleks memerlukan butir soal yang lebih banyak dibanding kompetensi dasar yang tidak kompleks. Tiap kompetensi dasar diuraikan menjadi sejumlah indikator. Indikator adalah ciri-ciri peserta didik menguasai kompetensi dasar dan menggunakan kata kerja operasional, yaitu yang bisa diukur (Djemari Mardapi, 2012: 113-114)

 Sedangkan menurut Masnur Muslich (2011: 108), bahwa matrik kisi-kisi soal terdiri atas kolom dan jalur. Kolom mengatakan standar kompetensi, kompetensi dasar, materi pokok, indikator, jenis tagihan, bentuk soal, dan contoh soal.

 Ada juga yang mengembangkan bahwa dalam kisi-kisi tertuang rambu-rambu tentang kriteria soal yang akan ditulis, meliputi KD yang akan diukur, materi, indikator soal, bentuk soal, dan nomor soal (Anonim: 2015: 24).

    a.3. Menentukan bentuk tes
    Pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta tes, waktu yang tersedia untuk memeriksa lembaran jawaban tes, cakupan materi tes, dan karakteristik mata pelajaran yang diujikan.
Bentuk tes obyektif pilihan sangat tepat digunakan bila jumlah peserta tes banyak, waktu koreksi singkat, dan cakupan materi yang diujikan banyak. Kelebihan tes obyektif bentuk pilihan adalah lembaran jawaban dapat diperiksa dengan komputer, sehingga objektifitas penskoran dapat dijamin, namun membuat tes objektif yang baik tidak mudah.
Bentuk tes uraian obyektif sering digunakan pada mata pelajaran yang batasnya jelas, misalnya mata pelajaran fisika, matematika, biologi, dan sebagainya. Dan pada tes bentuk uraian objektif ini, sistim penskorannya dapat dibuat dengan jelas dan rinci.
Bentuk tes uraian non objektif sering digunakan pada ilmu-ilmu sosial, yaitu yang jawabannya luas dan tidak hanya satu jawaban yang benar, tergantung argumentasi peserta tes (Djemari Mardapi, 2012: 115-116).
a.4. Menentukan panjang tes.
    Panjang tes mencakup lama pengerjaan soal tes dan jumlah butir soal. Jumlah butir soal ditentukan oleh waktu yang tersedia untuk mengerjakan ujian. Waktu yang tersedia didasarkan pada tingkat perkembangan peserta didik dan jenjang pendidikan. untuk sekolah dasar biasa waktu yang disediakan adalah 2 x 45 menit, yaitu 90 menit. Untuk sekolah menengah waktu yang disiapkan juga sekitar 90 menit atau 120 menit. Untuk pelajaran praktek waktu yang disediakan lebih lama dibanding dengan ujian teori.
Waktu yang diperlukan untuk mengerjakan tiap butir soal ditentukan oleh tingkat kesulitan soal. Waktu untuk mengerjakan tiap butir soal pilihan ganda dengan tingkat kesulitan sedang adalah 2 (dua) menit, dan untuk yang mudah adalah 1 (satu) menit, dan untuk kategori sulit adalah 3 (tiga) menit. Apabila waktu yang tersedia adalah 90 menit, maka jumlah butir soal yang diperlukan adalah 90 butir soal kategori mudah, atau 45 butir soal kategori sedang, atau 30 butir soal kategori tinggi.
Untuk tes bentuk uraian obyektif, waktu yang diperlukan untuk mengerjakannya adalah 120 menit. Jumlah butir soal uraian sebaiknya banyak, agar mencakup sebagian besar materi yang diajarkan. Dengan demikian persyaratan validitas isi tes dapat dipenuhi. Jumlah butir yang lebih banyak lebih baik dibandingkan dengan jumlah soal yang sedikit walau mendalam (Djemari Mardapi, 2012: 116-117).
    Jumlah soal yang diperlukan tiap jenis tes juga harus diperhitungkan dengan tepat waktu yang diperlukan peserta didik dalam pengerjaannya. Hal ini untuk menjaga agar waktu yang disediakan tidak kurang atau berlebih. Bagi guru yang berpengalaman dapat menentukan jumlah soal dengan tepat (Masnur Muslich, 2011: 109).

b.    Menulis tes.
Ada beberapa kaidah yang harus diikuti agar soal yang tersusun  baik. Kaidah-kaidah tersebut mencakup aspek materi, konstruksi, dan bahasa.
Ada beberapa bentuk tes kognitif yang biasa diterapkan dalam authentik assesment, yaitu (1) tes lisan, (2) pilihan ganda, (3) uraian obyektif, (4) uraian non-objektif, (5) jawaban singkat, (6) menjodohkan, (7) unjuk kerja atau performansi, dan (8) portofolio.
c.        Menelaah soal tes.
Kriteria yang digunakan untuk melakukan telaah butir tes mengikuti pedoman penyusunan tes. Telaah dilakukan terhadap kebenaran konsep, teknik penulisan, dan bahasa yang digunakan (Djemari Mardapi, 2012: 126).
d.    Melakukan uji coba tes
Sebelum soal digunakan dalam tes yang sesungguhnya, uji coba perlu dilakukan untuk semakin memperbaiki kulitas soal. Ujicoba ini dapat digunakan sebagai sarana memperoleh data empirik tentang tingkat kebaikan soal yang telah disusun. Melalui uji coba diperoleh data tentang: reliabilitas, validitas, tingkat kesukaran, pola jawaban, efektifitas pengecoh, daya beda, dan lain-lain. Jika memang soal yang disusun belum memenuhi kualitas yang diharapkan, berdasar hasil uji coba tersebut maka kemudian dilakukan pembenahan atau perbaikan.
e.    Menganalisis butir tes.
Analisis butir soal yaitu menganalisis semua butir soal berdasarkan data empirik, hasil uji coba. Melalui analisis butir ini dapat diketahui tingkat kesukaran butir soal, daya pembeda, dan juga efektivitas pengecoh.
f.    Memperbaiki tes.
Yaitu melakukan perbaikan-perbaikan tentang bagian soal yang masih belum sesuai dengan yang diharapkan. Ada kemungkinan beberapa soal sudah baik sehingga tidak perlu direvisi, beberapa butir mungkin perlu direvisi, dan beberapa yang lain mungkin harus dibuang karena tidak memenuhi standar kualitas yang diharapkan.
g.    Merakit tes.
Keseuruhan butir perlu disusun secara hati-hati menjadi kesatuan soal tes yang terpadu. Dalam merakit soal, hal-hal yang dapat mempengaruhi validitas soal seperti nomer urut soal, pengelompokkan bentuk soal, lay out, dan sebagainya harus diperhatikan. Hal ini sangat penting karena walaupun butir-butir yang disusun telah baik tetapi jika penyusunannya sembarangan dapat menyebabkan soal yang dibuat tersebut menjadi tidak baik.
h.    Melaksanakan tes.
Tes yang telah disusun diberikan kepada teste untuk diselesaikan. Pelaksanaan tes dilakukan sesuai dengan waktu yang telah ditentukan. Dalam pelaksanaan tes ini memerlukan pemantauan atau pengawasan agar tes tersebut benar-benar dikerjakan oleh testee dengan jujur dan sesuai dengan ketentuan yang telah digariskan.
i.    Menafsirkan hasil tes.
Hasil tes menghasilkan data kuantitatif yang berupa skor. Skor ini kemudian ditafsirkan sehingga menjadi nilai, yaitu rendah, menengah, atau tinggi. Tinggi rendahnya nilai ini selalu dikaitkan dengan acuan penilaian. Ada dua acuan penilaian yang sering digunakan dalam bidang psikologi dan pendidikan, yaitu acuan norma dan kriteria. Jadi tinggi dan rendahnya suatu nilai dibandingkan dengan kelompoknya atau dengan kriteria yang harus dicapai.
   
    B.2. Menyusun Instrumen Tes
    B.2.1. menyusun tes lisan di kelas
Tes lisan adalah tes yang menuntun siswa memberikan jawaban secara lisan. Pertanyaan-pertanyaan yang diberikan guru disampaikan secara lisan (oral), dan siswa merespon pertanyaan tersebut juga secara lisan. Jawaban berupa kata, frase, kalimat, ataupun paragraf yang diucapkan (Kusaeri: 2014: 196).
Pertanyaan lisan digunakan untuk mengetahui daya serap peserta didik untuk masalah yang berkaitam dengan pengetahuan kognitif. Beberapa prinsip yang harus diperhatikan guru dalam melakukan pertanyaan di kelas adalah: mengajukan pertanyaan dengan jelas, memberi waktu untuk berpikir peserta didik, kemudian menunjuk peserta didik untuk menjawab pertanyaan. Baik benar atau salah jawaban peserta didik, jawaban tersebut ditawarkan lagi ke kelas untuk mengaktifkan kelas. Tingkat berpikir untuk pertanyaan lisan di kelas cenderung rendah, seperti pengetahuan dan pemahaman (Masnur Muslich, 2011: 109-110), atau bisa juga untuk tingkat berpikir tinggi (Djemari Mardapi, 2012: 117). Pertanyaan lisan memiliki kebaikan, yaitu melatih peserta didik dalam berkomunikasi secara lisan (Djemari Mardapi, 2012: 117).
Beberapa hal yang perlu diperhatikan dalam merencanakan tes lisan diantaranya: (Kusaeri: 2014: 197).
1.    menentukan kompetensi pengetahuanyang sesuai dinilai melalui tes lisan.
2.    Menyusun indikator proses dan hasil belajar berdasarkan kompetensi pengetahuan yang dinilai melalui tes lisan.
3.    Menentukan kriteria kunci yang menunjukkan capaian indikator hasil belajar pada kompetensi pengetahuan.
4.    Menyusun pedoman pertanyaan.
5.    Menyiapkan rubrik penilaian.
Dalam penggunaan tes lisan di lapangan, ada beberapa hal yang perlu diperhatikan, seperti: (Kusaeri: 2014: 198).
1.    Menyusun daftar pertanyaan sebagai acuan dalam pelaksanaan tes lisan.
2.    Menyampaikan pertanyaan secara ringkas dan jelas.
3.    Menyeimbangkan alokasi waktu antar siswa.
4.    Menghindari penggunaan kalimat yang memberi petunjuk/mengarah pada kunci jawaban.
5.    Memberi waktu tunggu yang cukup untuk siswa.
6.    Menghindari sikap menekan dan menghakimi.
7.    Membandingkan jawaban siswa dengan rubrik.
8.    Mengisi lembar penilaian untuk setiap pertanyaan yang diajukan.
9.    Memberi skor bagi setiap jawaban yang dikemukakan siswa.

B.2.2. Bentuk pilihan ganda
Butir soal pilihan ganda terdiri atas pokok soal (stem) dan pilihan jawaban (option).
Untuk tingkat SMA biasanya digunakan 5 (lima) pilihan jawaban. Dari kelima pilihan jawaban tersebut, salah satu adalah kunci (key) yaitu jawaban yang benar atau paling tepat, dan lainnya disebut pengecoh (distractor). Kaidah penulisan soal bentuk pilihan ganda sebagai berikut.
(a) Substansi/Materi
•    Soal sesuai dengan indikator (menuntut tes bentuk PG).
•    Materi yang diukur sesuai dengan kompetensi (UKRK: urgensi, keberlanjutan, relevansi, dan keterpakaian).
•    Pilihan jawaban homogen dan logis.
•    Hanya ada satu kunci jawaban yang tepat.
(b) Konstruksi
•    Pokok soal dirumuskan dengan singkat, jelas, dan tegas.
•    Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang
•    diperlukan saja.
•    Pokok soal tidak memberi petunjuk kunci jawaban.
•    Pokok soal tidak menggunakan pernyataan negatif ganda.
•    Gambar/grafik/tabel/diagram dan sebagainya jelas dan berfungsi.
•    Panjang rumusan pilihan jawaban relatif sama.
•    Pilihan jawaban tidak menggunakan pernyataan "semua jawaban benar” atau “semua jawaban salah”.
•    Pilihan jawaban yang berbentuk angka atau waktu disusun berdasarkan besar kecilnya angka atau kronologis kejadian.
•    Butir soal tidak bergantung pada jawaban soal sebelumnya.
    (c) Bahasa
•    Menggunakan bahasa sesuai dengan kaidah Bahasa Indonesia.
•    Menggunakan bahasa yang komunikatif.
•    Pilihan jawaban tidak mengulang kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian.
•    Tidak menggunakan bahasa yang berlaku setempat/tabu.


    B.2.3. Bentuk uraian obyektif
Kaidah penulisan soal bentuk uraian sebagai berikut.
(a) Substansi/materi
•    Soal sesuai dengan indikator (menuntut tes bentuk uraian)
•    Batasan pertanyaan dan jawaban yang diharapkan sesuai
•    Materi yang diukur sesuai dengan kompetensi (UKRK)
•    Isi materi yang ditanyakan sesuai dengan jenjang, jenis satuan pendidikan, dan tingkat kelas
(b) Konstruksi
•    Ada petunjuk yang jelas mengenai cara mengerjakan soal
•    Rumusan kalimat soal/pertanyaan menggunakan kata tanya atau perintah yang menuntut jawaban terurai
•    Gambar/grafik/tabel/diagram dan sejenisnya harus jelas dan berfungsi
•    Ada pedoman penskoran
(c) Bahasa
•    Rumusan kalimat soal/pertanyaan komunikatif
•    Butir soal menggunakan bahasa Indonesia yang baku
•    Tidak mengandung kata-kata/kalimat yang menimbulkan penafsiran ganda atau salah pengertian
•    Tidak mengandung kata yang menyinggung perasaan
•    Tidak menggunakan bahasa yang berlaku setempat/tabu

    B.2.4. Bentuk uraian non obyektif.
    Langkah membuat tes non obyektif adalah sebagai berikut: (Djemari Mardapi, 2012: 122-123).
1.    Menulis soal berdasarkan kisi-kisi pada indikator.
2.    Mengedit pertanyaan:
Apakah pertanyaan mudah dimengerti?
Apakah data yang digunakan benar?
Apakah tata letak keseluruhan baik?
Apakah pemberian bobot skor sudah tepat?
Apakah kunci jawaban sudah benar?
Apakah waktu untuk mengerjakan tes cukup?
    Kaidah penulisan soal bentuk uraian non objektif:
1.    Gunakan kata-kata: mengapa, uraikan, jelaskan, bandingkan, tafsirkan, hitunglah, buktikan.
2.    Hindari menggunakan pertanyaan: siapa, apa, bila.
3.    Menggunakan bahasa Indonesia yang baku.
4.    Hindari penggunaan kata-kata yang dapat ditafsirkan ganda.
5.    Buat petunjuk mengerjakan soal.
6.    Buat kunci jawaba.
7.    Buat pedoman penskoran.
Pedoman penskoran merupakan panduan atau petunjuk yang menjelaskan tentang batasan atau konsep untuk melakukan penskoran, kemungkinan-kemungkinan jawaban yang diharapkan, dan kriteria-kriteria jawaban yang digunakan untuk penskoran. Agar hasil penyekoran soal uraian reliabel maka digunakan kriteria penyekoran atau rubrik penyekoran (Kusaeri, 2014: 93).
Ada dua jenis rubrik penyekoran yaitu rubrik penskoran analitik dan rubrik penskoran holistik. Rubrik penyekoran analitik mengidentifikasi jawaban dari berbagai aspek yang berbeda. Skor untuk masing-masing aspek diletakkan secara terpisah. Pada rubrik penyekoran holistik, guru memberi suatu skor tunggal berdasarkan pada keseluruhan jawaban peserta tes. Rubrik penyekoran holistik sering kali kurang detail dibandingkan dengan rubrik penyekoran analitik, namun lebih mudah dikembangkan dan proses penyekorannya juga lebih cepat (Kusaeri, 2014: 93-94).
        B.2.5. Tes bentuk benar-salah
    Tes bentuk benar-salah terdiri dari suatu pernyataan yang harus dijawab benar atau salah. Bentuk tes ini singkat sehingga bisa mencakup banyak materi yang akan diujikan (Djemari Mardapi, 2012: 117).
Pedoman penulisan tes benar-salah adalah sebagai berikut:
1.    tes mengukur ide atau konsep yang penting.
2.    Tes mengukur paling tidak pemahaman.
3.    Jawaban benar tidak mudah ditebak.
4.    Kalimat yang digunakan jelas.
5.    Tidak menggunakan proposisi dari buku.
6.    Panjang kalimat untuk jawaban benar atau salah diusahakan sama.
   
    B.2.6. Bentuk tes menjodohkan
        Bentuk tes menjodohkan terdiri dari sejumlah premis dan sejumlah respon. Bentuk tes ini sering digunakan untuk mengukur pengetahuan tentang fakta seperti arti suatu istilah, simbol kimia, dan sejenisnya. Oleh karenaa itu, bentuk tes ini cenderung mengukur tentang hafalan dan pemahaman saja. Pedoman untuk membuat tes bentuk menjodohkan adalah sebagai berikut: (Djemari Mardaphi, 2012: 119)
1.    Pernyataan atau premis harus homogen.
2.    Pernyataan dan respon singkat.
3.    Jumlah respon lebih banyak dari pernyataan.
4.    Pernyataan dan respon diurutkan menurut alphabet.
5.    Jawaban dapat digunakan lebih dari satu kali.
Adapun kaidah-kaidah pokok penulisan soal jenis menjodohkan ini adalah sebagai berikut: (Djemari Mardapi: 2012: 124)
1.    Soal harus sesuai indikator.
2.    Jumlah alternatif jawaban lebih banyak daripada premis.
3.    Alternatif jawaban harus “nyambung” atau berhubungan  secara logis dengan premisnya.
4.    Rumusan kalimat soal harus komunikatif.
5.    Butir soal menggunakan Bahasa Indonesia yang baik dan benar.
6.    Tidak menggunakan bahasa lokal.
    B.2.7. Tes Bentuk Isian.
Soal isian adalah soal yang menuntut peserta tes untuk memberikan jawaban singkat, berupa kata, frase, angka, atau simbol. Jenis soal isian meliputi melengkapi dan asosiasi (Kusaeri, 2014: 97).
Adapun beberapa ketentuan yang harus diperhatikan penulis soal jenis isian ini antara lain:
1.    Soal harus sesuai indikator;
2.    Soal harus menggunakan kata yang baik dan benar, serta kalimat singkat dan jelas, sehingga siswa dapat memahami dengan mudah;
3.    Jawaban yang dituntut oleh soal harus singkat dan pasti, yaitu berupa kata, frase, angka, simbol, tempat, atau waktu;
4.    Soal bukan merupakan kalimat yang dikutip langsung dari buku;
5.    Soal tidak memberi petunjuk ke kunci jawaban; dan
6.    Bagian kalimat yng harus dilengkapi sebaiknya hanya satu bagian dalam rasio butir soal, dan paling banyak dua bagian, supaya tidak membingungkan siswa.
    B.2.8. Tes Bentuk Uraian Jawaban Singkat.
Merupakan soal yang jawabannya berupa kata, kalimat pendek, atau frase terhadap suatu pertanyaan. Beberapa rambu-rambu yang harus dipatuhi bila menyusun soal bentuk ini, antara lain: (Kusaeri, 2014: 99)
1.    Menggunakan kalimat pertanyaan langsung atau kalimat perintah;
2.    Pertanyaan atau peruntah harus jelas, agar mendapat jawaban yang singkat;
3.    Panjang kata atau kalimat yang dijawab oleh siswa pada semua soal diusahakan relatif sama;
4.    Hindari penggunaan kata, kalimat, atau frase yang diambil langsung dari buku teks, sebab akan mendorong siswa untuk sekedar mengingat atau menghafal apa yang tertulis di buku; dan
5.    Buatlah pedoman penskoran yang akan digunakan waktu menyekor.
    B.2.9. Tes Perbuatan (Performance Test).
        Tes perbuatan atau tes praktik adalah tes yang menuntut jawaban peserta didik dalam bentuk perilaku, tindakan, atau perbuatan (Zainal Arifin, 2009: 149). Lebih lanjut Stiggins (1994) dalam Zainal Arifin (2009: 149) mengemukakan “tes tindakan adalah suatu bentuk tes yang peserta didiknya diminta untuk melakukan kegiatan khusus di bawah pengawasan penguji yang akan mengobservasi penampilannya dan membuat keputusan tentang kualitas hasil belajar yang disemonstrasikan”.
    Tes tindakan dari Stiggins ini (dalam Zainal Arifin, 2009: 149), dalam Masrukan (2014: 32) di sebutkan juga sebagai assesmen unjuk kerja (ketika mengutip pendapat Stiggins tentang pengertian assesmen unjuk kerja).
    Penilaian unjuk kerja/kinerja/praktik perlu mempertimbangkan hal-hal berikut: (Anonim, 2015: 23)
(1)    Langkah-langkah kinerja yang perlu dilakukan peserta didik untuk menunjukkan kinerja dari suatu kompetensi.
(2) Kelengkapan dan ketepatan aspek yang akan dinilai dalam kinerja tersebut.
(3) Kemampuan-kemampuan khusus yang diperlukan untuk menyelesaikan tugas.
(4) Kemampuan yang akan dinilai tidak terlalu banyak, sehingga dapat diamati.
(5) Kemampuan yang akan dinilai selanjutnya diurutkan berdasarkan langkah-langkah  
      Pekerjaan yang akan diamati.
Dalam pelaksanaan penilaian kinerja perlu disiapkan format observasi dan rubrik penilaian untuk mengamati perilaku peserta didik dalam melakukan praktik atau produk yang dihasilkan.

B.3. Penyusunan Instrumen Non Tes
    Instrumen non tes dapat digunakan jika kita ingin mengetahui kualitas proses dan produk dari suatu pekerjaan serta hal-hal yang berkenaan dengan domain efektif, seperti sikap, minat, bakat, dan motivasi. Diantaran teknik non-tes adalah observasi, wawancara (interview), skala sikap (attitude scale), daftar cek (ceck list), skala penilaian (rating scale), angket (quetioner), studi kasus (case study), catatan insidental (anecdotal records), sosiometri, inventori kepribadian, dan teknik pemebrian penghargaan peserta didik (Zainal Arifin, 2009: 152).
Secara umum ada beberapa langkah yang harus ditempuh oleh peneliti untuk menyusun instrumen penelitian (evaluasi) non tes, yaitu: (S. Eko Putro Widoyoko, 2016: 127-128)
1.    Menetapkan variabel yang akan diteliti. Dalam tahap ini seorang peneliti harus memutuskan variabel-variabel apa saja yang akan diukur. Dalam kasus tertentu, variabel yang telah ditetapkan kadang-kadang masih perlu dijabarkan lagi menjadi sub variabel, agar lebih rinci.
2.    Merumuskan devinisi konseptual. Devinisi konseptual adalah devinisi suatu variabel sesuai konsepsi peneliti, berada dalam pikiran peneliti berdasarkan pemahamannya tentang teori mengenai variabel itu.
3.    Definisi operasional. Definisi operasional yang diamksud adalah definisi operasional variabel ya ng akan diukur dalam suatu penelitian, agar seminimal mungkin dapat dihindari perbedaan penafsiran dalam memahami variabel penelitian. Devinisi operasional merupakan pernyataan yang sangat jelas yang didasarkan pada sifat-sifat yang disefinisikan yang dapat diamati sehingga tidak menimbulkan kesalah pahaman penafsiran karena dapat diobservasi dan dibuktikan perilakunya.
4.    Menyusun kisi-kisi instrumen.
5.    Menyusun butir-butir instrumen.
    Berikut akan dijelaskan secara singkat langkah-langkah penyusunan dari masing-masing instrumen non-tes diatas.
a.    Observasi.
Observasi adalah suatu proses pengamatan dan pencatatan secara sistimatis, logis, objektif, dan rasional mengenai berbagai fenomena, baik dalam situasi yang sebenarnya maupun dalam situasi buatan untuk mencapai tujuan tertentu.
    Adapun langkah-langkah penyusunan pedonam observasi adalah sebagai berikut:
1.    Merumuskan tujuan observasi.
2.    Membuat lay-out atau kisi-kisi observasi.
3.    Menyusun pedoman observasi.
4.    Menyusun aspek-aspek yang akan diobservasi.
5.    Melakukan uji coba pedoman obsertvasi.
6.    Merevisi pedoman observasi.
7.    Melaksanakan observasi pada saat kegiatan berlangsung.
8.    Mengolah dan menafsirkan hasil observasi.


b.    Wawancara (interview).
Wawancara adalah salah satu bentuk alat evaluasi jenis non tes yang dilakukan melalui percakapan dan tanya jawab, baik langsung maupun tak langsung dengan peserta didik (responden). Untuk menyusun pedoman wawancara, dapat mengikuti langkah-langkah sebagai berikut:
1.    Merumuskan tujuan wawancara.
2.    Membuat kisi-kisi atau lay-out dan pedoman wawancara.
3.    Menyusun pertanyaan sesuai dengan data yang diperlukan dan bentuk pertanyaan yang diinginkan. Untuk itu perlu diperhatikan kata-kata yang digunakan, cara bertanya, dan jangan membuat peserta didik bersikap defensif.
4.    Melaksanakan uji coba untuk melihat kelemahan-kelemahan pertanyaan yang disusun, sehingga dapat diperbaiki lagi.
5.    Melaksanakan wawancara dalam situasi yang sebenarnya.
       
c.    Skala sikap (attitude scale).
Sikap merupakan suatu kecenderungan tingkah laku untuk berbuat sesuatu dengan cara, metode teknik, dan pola tertentu terhadap dunia sekitarnya, baik berupa orang-orang maupun berupa objek-objek tertentu.
Adapun model-model skala sikap yang biasa digunakan untuk menilai sikap peserta didik terhadap suatu objek, antara lain:
•    Menggunakan bilangan untuk menunjukkan tingkat-tingkat dari objek sikap yang dinilai, seperti 1, 2, 3, 4, dan seterusnya.
•    Menggunakan frekuensi terjadinya atau timbulnya sikap itu, seperti: selalu, sering kali, kadang-kadang, pernah, dan tidak pernah.
•    Menggunakan istilah-istilah yang bersifat kualitatif, seperti bagus sekali, baik, sedang, dan kurang.
•    Menggunakan istilah yang menunjukkan status/kedudukan, seperti sangat rendah, dibawah rata-rata, di atas rata-rata, dan sangat tinggi.
•    Menggunakan kode bilangan atau huruf, seperti selalu (diberi kode 5), kadang-kadang (4), jarang (3), jarang sekali (2), dan tidak pernah (1).
Salah satu model untuk mengukur sikap, yaitu dengan menggunakan skala sikap yang dikembangkan oleh Likert. Untuk menyusun skala Likert, dapat mengikuti langkah-langkah sebagai berikut:
1.    Memilih variabel efektif yang akan diukur.
2.    Membuat beberapa pernyataan tentang variabel efektif yang akan diukur.
3.    Mengklasifikasikan pernyataan positif dan negatif.
4.    Menentukan jumlah gradual dan frase atau angka yang dapat menjadi alternatif pilihan.
5.    Menyusun pernyataan dan pilihan jawaban menjadi sebuah alat penilaian.
6.    Melakukan uji coba.
7.    Membuang butir-butir pernyataan yang kurang baik.
8.    Melaksanakan penilaian.

d.    Daftar cek (ceck list).
Daftar ceck list adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan diamati. Daftar cek dapat memungkinkan guru sebagai penilai mencatat tiap-tiap kejadian yang betapapun kecilnya, tetapi dianggap penting. Ada bermacam-macam aspek perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian tinggal memberikan tanda centang (v) pada tiap-tiap aspek tersebut sesuai dengan hasil penilaiannya.
Contohnya daftar cek tentang keefektifan peserta didik dalam diskusi kelompok pada mata pelajaran tertentu.

e.    Skala penilaian (rating scale)
Dalam skala penilaian fenomena-fenomena yang akan dinilai disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi, tidak hanya mengukur secara mutlak ada atau tidaknya variabel tertentu, tetapi lebih jauh mengukur bagaimana intensitas gejala yang ingin diukur.

f.    Angket (quetioner).
Angket termasuk alat untuk mengumpulkan data dan mencatat data atau informasi, pendapat, dan paham dalam hubungan kausal. Angkat mempunyai kesamaan dengan wawancara kecuali dalam implementasinya. Angket dilaksanakan secara tertulis, sedangkan wawancara dilaksanakan secara lisan.
Untuk menyusun angket, dapat mengikuti langkah-langkah sebagai berikut:
1.    Menyusun kisi-kisi angket.
2.    Menyusun pertanyaan-pertanyaan dan bentuk jawaban yang diinginkan, berstruktur atau tak berstruktur.
3.    Membuat pedoman atau petunjuk cara menjawab pertanyaan, sehingga memudahkan peserta didik untuk menjawabnya.
4.    Jika angket sudah tersusun dengan baik, perlu dilaksanakan uji coba.
5.    Hasil uji coba angket, jika ada kelemahan maka perlu direvisi.
6.    Menggandakan angket sesuai dengan banyaknya jumlah peserta didik.
Beberapa hal yang harus diperhatikan dalam menyusun dan menyebarkan angket, yaitu:
1.    Setiap pertanyaan harus menggunakan bahasa yang baik dan benar, jelas, singkat, tepat, dan sederhana sehingga mudah dimengerti oleh peserta didik, seperti: hindarkan pertanyaan yang ambiguous, kata tambahan, seperti biasanya, sering kali, hendaknya dihindari.
2.    Jangan membuat pertanyaan yang mengarahkan pada jawaban.
3.    Jangan menggunakan dua kata sangakal dalam satu kalimat pertanyaan.
4.    Hindari pertanyaan berlaras dua.
5.    Buatlah pertanyaan yang tepat sasaran.
6.    Jika terdapat angket yang tidak diisi, maka harus membagikan lagi angket itu kepada peserta didik yang lain sebanyak yang tidak menjawab.
7.    Dalam menyebarkan angket, hendaknya dilampirkan surat pengantar angket.
8.    Hendaknya jawaban tidak terlalu banyak dan tidak pula terlalu sedikit

g.    Studi kasus (Case Study)
Studi kasus adalah studi yang mendalam dan komprehensif tentang peserta didik, kelas atau sekolah yang memiliki kasus tertentu. Misalnya peserta didik yang sangat cerdas, sangat lamban, sangat rajin, sangat nakal atau kesulitan dalam belajar. Pengertian mendalam dan komprehensif adalah mengungkapkan semua variabel dan aspek-aspek yang melatarbelakanginya, yang diduga menjadi penyebab timbulnya perilaku atau kasus tersebut dalam kurun waktu  tertentu.
Dalam melakukan studi kasus, guru harus terlebih dahulu mengumpulkan data dari berbagai sumber dengan menggunakan berbagai teknik dan alat pengumpul data. Salah satu alat yang dapat digunakan adalah depth-interview, yaitu melakukan wawancara secara mendalam. Jenis data yang diperlukan, antara lain latar belakang kehidupan, latar belakang keluarga, kesanggupan dan kebutuhan, perkembangan kesehatan, dan sebagainya.

h.    Catatan insidental (Anecdotal Records).
Catatan insidental adalah catatan-catatan singkat tentang peristiwa-peristiwa sepintas yang dialami peserta didik secara perorangan. Catatan ini merupakan pelengkap dalam rangka penilaian guru terhadap peserta didiknya, terutama yang berkenaan dengan tingkah laku peserta didik.
Catatan insidental ini mungkin belum berarti apa-apa bagi keperluan penilaian individu siswa, tetapi setelah dihubungkan dengan data-data lain seringkali memberi petunjuk yang berguna. Catatan ini dapat dibuat di buku khusus atau pada kartu-kartu kecil, sehingga memudahkan dalam menafsirnya.
       
    Untuk mengatasi kesulitan-kesulitan dalam pelaksanaan catatan insidental, guru perlu memperhatikan hal-hal berikut ini:
1.    Tetapkan terlebih dahulu peserta didik yang sangat memerlukan penyelidikan. Dalam hal apakah penyelidikan itu harus dilakukan.
2.    Setiap kegiatan pencatatan suatu peristiwa hendaknya diambil kesimpulan sementara. Kesimpulan final baru ditentukan setelah membandingkan beberapa kesimpulan sementara dari beberapa kegiatan pencatatan.
3.    Fokus perhatian guru adalah tingkah laku peserta didik yang dianggap perlu diselidiki itu.

i.    Sosiometri.
Soaiometri adalah suatu prosedur untuk merangkum, menyusun, dan sampai batas tertentu dapat mengkuantifikasi pendapat-pendapat peserta didik tentang penerimaan teman sebayanya serta hubungan diantara mereka. Seperti diketahui, di sekolah banyak peserta didik kurang mampu menyesuaikan diri dengan lingkungannya. Kondisi seperti ini perlu diketahui dan dipelajari oleh guru dan dicarikan upaya untuk memperbaikinya, karena dapat mengganggu proses belajarnya.
Salah satu cara untuk mengetahui kemampuan soaial peserta didik adalah soaiomtri. Adapun beberapa langkah dalam menggunakan sosiometri, yaitu:
1.    Memberikan “petunjuk” atau pertanyaan-pertanyaan.
2.    Mengunpulkan jawaban yang sejujurnya dari semua peserta didik.
3.    Jawaban-jawaban tersebut dimasukkan ke dalam tabel.
4.    Pilihan-pilihan yang tertera dalam tabel digambarkan pada sebuah sosiogram.


C.     Prosedur Penyusunan Instrumen atau Perangkat Evaluasi Program Pendidikan.
    Dalam setiap penelitian, instrumen merupakan sesuatu yang mempunyai kedudukan sangat penting, karena instrumen akan menentukan kualitas data yang dikumpulkan. Semakin tinggi kualitas instrumen, maka semakin tinggi pula hasil evaluasinya. Sekurang-kurangnya ada empat persyaratan bagi instrumen yang baik, yaitu: (Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar, 2014: 92)
•    Valid atau sahih, yaitu tepat menilai apa yang akan dinilai.
•    Reliabel, dapat dipercaya, yaitu bahwa data yang dikumpulkan benar seperti apa adanya, bukan palsu.
•    Praktikebel, yaitu bahwa instrumen tersebut, mudah digunakan, praktis, dan tidak rumit.
•    Ekonomis, yaitu tidak boros dalam mewujudkan dan menggunakan sesuatu di dalam penyusunan, artinya tidak banyak membuang uang, waktu dan tenaga.
Jenis instrumen evaluasi yang disusun bergantung pada metode pengumpulan data yang dipilih. Apabila metode pengumpulan data yang dipilih adalah metode observasi maka instrumen evaluasi yang harus disusun adalah lembaran pengamatan. Apabila metode pengumpulan data yang dipilih adalah metode angket maka instuumen evaluasi yang harus disusun adalah angket. Dan seterusnya.
Adapun langkah-langkah dalam menyusun instrumen evaluasi program adalah: (Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar, 2014: 109)
•    Merumuskan tujuan yang akan dicapai dengan instrumen yang akan disusun. Contoh: tujuan menyusun lembar pengamatan adalah untuk mengetahui aktivitas belajar peserta didik dalam proses pembelajaran.
•    Membuat kisi-kisi yang berisi tentang perincian variabel dan jenis instrumen yang akan digunakan. Untuk mengukur bagian variabel yang bersangkutan ini dikembangkan dari kisi-kisi objek yang akan dievaluasi.
•    Membuat butir-butir instrumen, sesudah kisi-kisi tersusun maka langkah selanjutnya adalah membuat butir-butir instrumen.
•    Menyunting instrumen, hal yang dilakukan pada tahap ini meliputi:
a.    Mengurutkan butir menurut sistimatika yang dikehendaki evaluator untuk mempermudah pengolahan data;
b.    Menuliskan petunjuk pengisian, identitas dan sebagainya.
c.    Membuat pengantar permohonan pengisian bagi angket yang diberikan kepada orang lain (pedoman wawancara, pedoman dokumentasi, lembar pengamatan cukup membuat identitas yang menunjuk pada sumber data dan identitas pengisi).
Berkaitan dengan langkah-langkah di atas, maka di bawah ini akan dibahas  tentang identifikasi objek evaluasi, cara penyusunan kisi-kisi instrumen, dan penyusunan butir-butir instrumen.
    C.1. Identifikasi sasaran sebagai objek evaluasi
Komponen sebagai unsur program sering kali tidak mencukupi kebutuhan untuk mengenal kekuatan dan kelemahan program secara keseluruhan. Oleh karena itu, komponen program masih harus dirinci lebih jauh menjadi sub komponen yang bisa dikenal juga dengan istilah “indikator”. Indikator inilah yang menjadi objek sasaran evaluasi. Adapun petunjuk unttuk mengidentifikasi  indikator dapat dikemukakan sebagai berikut:
1.    Mulai dari yang bersifat kuantitatif, baru kualitatif; misalnya menilai bahan koleksi pertama dari banyaknya buku dan bahan koleksi lain, baru sesudah itu banyaknya buku menurut jenis. keduanya merupakan kuantitas, baru kemudian kondisi bahan-bahan koleksi yang ada, yaitu kualitas.
2.    Mulai dari luar, baru mengarah ke dalam; misalnya dari keadaan gedung, kemudian menilai kamar baru dilihat lebih cermat bahan dasar masing-masing ruangan. Penilaian dapat dilakukan  menggunakan cara kombinasi, yaitu melihat dari aspek kuantitatif, baru melihat kondisi masing-masing kamar dengan memperhatikan aspek kualitatif.
3.    Mulai dari yang umum, baru ke khusus; misalnya kualitas bahan koleksi secara umum, baru kondisi masing-masing bahan koleksi, dan dapat ke yang lebih khusus lagi.
4.    Jika yang diidentifikasi merupakan proses atau prosedur maka diurutkan dari pemunculannya. Misalnya komponen yang dinilai kemampuan mengajar, maka indikatornya urut dari proses yang terjadi, yaitu (a) membuat persiapan, (b) melaksanakan pembelajaran, dan (c) mengakhiri pelajaran.
Setelah mengetahui indikator, baru dapat ditentukan apa atau di mana sumber data. Setelah itu, baru dapat ditentukan metode pengumpulan data dan instrumennya.
Berikut ini akan ditampilkan contoh identifikasi indikator komponen bahan koleksi untuk program perpustakaan.

Dari tabel di atas, setidaknya ada tiga macam informasi yang termuat, yaitu:
1.    Indikator apa saja yang perlu diungkap melalui masing-masing instrumen yang akan disusun.
2.    Siapa atau apa sumber data yang akan dikenai instrumen.
3.    Jenis instrumen apa saja yang perlu dibuat dan perkiraan banyaknya butir pertanyaan untuk masing-masing instrumrn.

C.2. Penyusunan kisi-kisi instrumen.
Yang dimaksud dengan kisi-kisi dalam rangkaian proses penyusunan instrumen adalah semacam tabel kolom baris yang memberikan gambaran tentang kaitan antara objek sasaran evaluasi, instrumen, dan nomor-nomor butir dalam instrumen. Dengan membuat kisi-kisi, menunjukkan ketegasan evaluator untuk mrnunjuk instrumrn apa yang benar-benar akan digunakan, jumlah butir untuk masing-masing instrumen, dan butir berapa yang ditentukan untuk mengungkap suatu data. Jadi kisi-kisi dibuat khusus untuk jenis instrumen yang sudah dipilih.

C.3. Penyusunan butir-butir instrumen.
Dalam bagian ini akan diungkapkan mengenai kelemahan dan kesulitan yang banyak dijumpai dalam penyusunan butir-butir instrumen, agar tidak diulang oleh penyusun instrumen evaluasi program yang lain.
Hal yang banyak dikeluhkan dalam penyusunan instrumen oleh peneliti dan evaluator program pemula adalah cara membuat angket. Menurut Suharsimi Arikunto dan Cepi SafruddinAbdul Jabar (2014: 100), beberapa kekeliruan yang sering ditemui dalam penyusunan angket oleh peneliti atau evaluator adalah:
1.      Terdapat penyimpangan pertanyaan dari indikator yang akan dievaluasi. Untuk menghindari hal ini penyusun instrumen perlu mencoba menjawab sendiri beberapa (atau semua) pertanyaan yang mereka ajukan. Jika jawabannya tidak pas atau melenceng dari maksud pertanyaan, berarti butir tersebut rumusannya salah.
2.    Angket dengan opsi “selalu, sering, jarang, kadang, tidak pernah” (atau sejenisnya) hanya cocok untuk uraian pertanyaan yang menggali informasi yang sifatnya frekuentif tertentu yang jumlah dan pemunculannya sudah diketahui.

1.    Pengawas membimbing guru                   
Catatan: apakah pengawas selalu membimbing guru yang sudah menjadi kompeten, atau berkinerja baik? Apakah tidak pernah berhenti? Selain itu, ukuran “selalu” tidak jelas indikatornya.

3.    Untuk angket dengan opsi jawaban “ sangat setuju, setuju, tidak setuju, dan sangat tidak setuju” (atau sejenisnya), alternatif tersebut hanya cocok utuk jenis informasi yang sifatnya pendapat pribadi atau kesaksian seseorang terhadap suatu kejadian.
5.    Hindari pertanyaan yang cenderung dijawab oleh responden sesuai dengan yang seharusnya dilakukan, bukan yang menurut kenyataan yang dilakukan.
   

D.    Kesimpulan
Dari uraian pada pembahasan materi di atas, serta dengan didasarkan pada rumusan masalah maka dapat disampaikan beberapa kesimpulan sebagai berikut:
  1. Instrumen dalam evaluasi atau penelitian dapat didefinisikan  sebagai suatu sarana berupa seperangkat alat yang dipergunakan yang disesuaikan dengan metode tertentu dalam rangka mempermudah  pengumpulan informasi berupa data yang dibutuhkan untuk suatu keperluan evaluasi atau penelitian.
  2. Arti penting dari sebuah instrumen dalam proses evaluasi atau penelitian adalah sebagai berikut: (a) Membantu mempermudah dan memperlancar proses pengumpulan data; (b) Menjamin ketepatan dalam pengumpulan data atau informasi yang dibutuhkan; (c) Menghindarkan unsur subyektifitas terhadap data atau informasi hasil evaluasi atau penelitian; dan (d) Dijadikan sebagai peta jalan dalam pengumpulan data atau informasi, sehingga evaluator atau peneliti tidak menyimpang.
  3. Dalam dunia pendidikan, instrumen alat ukur yang digunakan untuk mengumpulkan data dapat berupa tes dan nontes. Tes merupakan alat ukur pengumpulan data yang mendorong peserta memberikan penampilan maksimal. Instrumen nontes merupakan alat ukur yang mendorong peserta untuk memberikan penampilan tipikal, yaitu melaporkan keadaan dirinya dengan memberikan respon secara jujur sesuai dengan pikiran dan perasaannya.
  4. Ada beberapa bentuk tes kognitif yang biasa diterapkan dalam authentik assesment, yaitu (1) tes lisan, (2) pilihan ganda, (3) uraian obyektif, (4) uraian non-objektif, (5) jawaban singkat, (6) menjodohkan, (7) unjuk kerja atau performansi, dan (8) portofolio.
  5. Diantaran teknik non-tes adalah observasi, wawancara (interview), skala sikap (attitude scale), daftar cek (ceck list), skala penilaian (rating scale), angket (quetioner), studi kasus (case study), catatan insidental (anecdotal records), sosiometri, inventori kepribadian, dan teknik pemebrian penghargaan peserta didik
  6. Ada sembilan langkah yang harus ditempuh guru dalam pengembangan tes hasil belajar atau tes prestasi belajar, yaitu (a) menyusun spesifikasi tes, (b) menulis soal tes, (c) menelaah soal tes, (d) melakukan uji coba tes, (e) menganalisis butir soal, (f) memperbaiki tes, (g) merakit tes, (h) melaksanakan tes, dan (i) menafsirkan hasil tes.
  7. Adapun langkah-langkah dalam menyusun instrumen evaluasi program adalah: merumuskan tujuan yang akan dicapai dengan instrumen yang akan disusun, membuat kisi-kisi yang berisi tentang perincian variabel dan jenis instrumen yang akan digunakan, membuat butir-butir instrumen, dan menyunting instrumen,

DAFTAR PUSTAKA
  1. Anonim. 2015. Panduan Penilaian Untuk Sekolah Menengah Atas. Jakarta: Direktorat Jenderal Pendidikan Dasar dan Menengah Kementerian Pendidikan dan Kebudayaan.
  2. Arikunto, S dan Abdul Jabar, C.S. 2014. Evaluasi Program Pendidikan, Pedoman Teoretis Praktis Bagi Mahasiswa dan Praktisi Pendidikan. cetakan ke-lima. Jakarta: Bumi Aksara.
  3. Arifin, Zainal. 2013. Evaluasi Pembelajaran, Prinsip Teknik Prosedur. Cetakan ke-lima. Bandung: PT. Remaja Rosdakarya Offset.
  4. Kusaeri. 2014. Acuan dan Teknik Penialaian Proses dan Hasil Belajar Dalam Kurikulum 2013. Cetakan I. Yogyakarta: Ar-Ruzz Media.
  5. Mardapi, Djemari. 2012. Pengukuran, Penilaian, dan Evaluasi Pendidikan. Cetakan I. Yogyakarta: Nuha Medika.
  6. Masrukan. 2014. Asesmen Otentik Pembelajaran Matematika, Mencakup Asesmen Efektif dan Karakter. Cetakan ke-dua. Semarang: FMIPA Unnes.
  7. Muslich, Masnur. 2011. Authentic Assesment: Penilaian Berbasis Kelas dan Kompetensi. Cetakan ke 1. Bandung: PT. Refika Aditama.
  8. Purwanto. 2014. Evaluasi Hasil Belajar. Cetakan ke-enam. Yogyakarta: Pustaka Pelajar.
  9. Tayibnapis, F.Y. 2008. Evaluasi Program dan Instrumen Evaluasi Untuk Program Pendidikan dan Penelitian. Jakarta: Rineka Cipta.

Tidak ada komentar:

Posting Komentar