RSS

DASAR-DASAR PENGUKURAN DAN EVALUASI PENDIDIKAN

08 Nov

DASAR-DASAR PENGUKURAN DAN EVALUASI PENDIDIKAN

Oleh: ABDUL ZAHIR, S.Pd

Pendidikan merupakan hal yang sangat penting dalam kehidupan ini. Pendidikan sebagai proses yang berkesinambungan dan sistematis dijalankan dalam rangka pencerdasan kehidupan sehingga ada perubahan yang signifikan bersifat gradasi dalam setiap individu-individu. Keberartian pendidikan senantiasa dipahamkan agar terjadi tumbuhkembang prilaku yang lebih baik.

Kesinambungan pendidikan harus senantiasa dilaksanakan. Kesinambungan ini bukan hanya diartikan akan adanya proses yang panjang, tapi adanya usaha sadar dalam rangka perbaikan kerja, kinerja, dan sistem pendidikan untuk menjadi lebih baik lagi. Satu hal yang tak bisa diabaikan dalam kesinambungan pendidikan adalah kegiatan evaluasi akan pendidikan itu sendiri.

Berbicara tentang evaluasi pendidikan, ada beberapa criteria dan klasifikasi yang mesti dirunut dan diterjemahkan. Sama halnya pendidikan, evaluasi pendidikan harus berjalan berkesinambungan dan sistematis pula. Evaluasi pendidikan yang memiliki cakupan yang cukup luas, tidak serta merta akan diterjemahkan dalam satu kegiatan saja. Kegiatan evaluasi mempunyai bangunan tersendiri dan tidak terpisahkan. Setidaknya dalam uraian ini, akan digambarkan bagaimana evaluasi pendidikan itu.

  1. 1.             Hakikat dan Lingkup Pengukuran dan Evaluasi Pendidikan

Secara umum orang hanya mengidentikkan kegiatan evaluasi sama dengan menilai, karena aktifitas mengukur sudah termasuk didalamnya. Pengukuran, penilaian dan evaluasi merupakan kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut dalam kaitannya dengan proses belajar mengajar tidak dapat dipisahkan satu sama lain dan dalam pelaksanaannya harus dilaksanakan secara berurutan.

Konsep Evaluasi

Menurut pengertian bahasa kata evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian atau penaksiran (John M. Echols dan Hasan Shadily: 1983). Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasi sebagai “The process of delineating, obtaining, and providing useful information for judging decision alternatives”. Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan informasi yang berguna untuk merumuskan suatu alternatif keputusan. Evaluasi adalah kegiatan mengukur dan menilai. Mengukur lebih besifat kuantitatif, sedangkan menilai lebih bersifat kualitatif.

Viviane dan Gilbert de Lansheere (1984) menyatakan bahwa evaluasi adalah proses penentuan apakah materi dan metode pembelajaran telah sesuai dengan tujuan yang diharapkan. Penentuannya bisa dilakukan salah satunya dengan cara pemberian tes kepada pembelajar. Terlihat disana bahwa acuan tes adalah tujuan pembelajaran.

Konsep Penilaian

Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang peserta didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif dalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses pencarian atau penentuan nilai kuantitatif tersebut.

Penilaian hasil belajar pada dasarnya adalah mempermasalahkan, bagaimana pengajar (guru) dapat mengetahui hasil pembelajaran yang telah dilakukan. Pengajar harus mengetahui sejauh mana pebelajar (learner) telah mengerti bahan yang telah diajarkan atau sejauh mana tujuan/kompetensi dari kegiatan pembelajaran yang dikelola dapat dicapai. Tingkat pencapaian kompetensi atau tujuan instruksional dari kegiatan pembelajaran yang telah dilaksanakan itu dapat dinyatakan dengan nilai.

Konsep Pengukuran

Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standar atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian, atau kepercayaan konsumen.

Pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untuk merepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang walau misalnya definisinya tidak dimengerti. Hal ini karena antara lain kita sering kali melakukan pengukuran.

Perbedaan Evaluasi, Penilaian dan Pengukuran

Berdasarkan pengertian di atas penulis menyimpulkan bahwa penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukur dan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan keputusan.Penilaian bersifat kualitatif.

Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing.

  • Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment atau tindakan dalam pembelajaran.
  • Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara berkala, berkesinambungan, dan menyeluruh tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui program kegiatan belajar.
  • Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris.

Berdasarkan pengertian di atas secara implisit menyatakan bahwa evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan penilaian. Hal ini diperkuat oleh beberapa pengertian yang lain seperti Wiersma dan Jurs membedakan antara evaluasi, pengukuran dan testing. Mereka
berpendapat bahwa evaluasi adalah suatu proses yang mencakup pengukuran dan
mungkin juga testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.

Ralph W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi sedikit berbeda. Ia menyatakan bahwa evaluation as the process of determining to what extent the educational objectives are actually being realized. Sementara Daniel Stufflebeam (1971) yang dikutip oleh Nana Syaodih S., menyatakan bahwa evaluation is the process of delinating, obtaining and providing useful information for judging decision alternatif. Demikian juga dengan Michael Scriven (1969) menyatakan evaluation is an observed
value compared to some standard. Beberapa definisi terakhir ini menyoroti evaluasi sebagai sarana untuk mendapatkan informasi yang diperoleh dari proses pengumpulan dan pengolahan data.

Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran.

Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh Norman E. Gronlund (1971) yang menyatakan “Measurement is limited to quantitative descriptions of pupil behavior” Pengertian penilaian yang ditekankan pada penentuan nilai suatu obyek juga dikemukakan oleh Nana Sudjana. Ia menyatakan bahwa penilaian adalah proses menentukan nilai suatu obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek. Seperti juga halnya yang dikemukakan oleh Richard H. Lindeman (1967) “The assignment of one or a set of numbers to each of a set of person or objects according to certain established rules”

  1. 2.             Alat Pengukuran dan Evaluasi Pendidikan

Secara umum yang dimaksud dengan instrumen adalah suatu alat yang memenuhi persyaratan akademis, sehingga dapat digunakan sebagai alat untuk mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variable. Dalam bidang penelitian, instrumen diartikan sebagai alat untuk mengumpulkan data mengenai variabel-variabel penelitian untuk kebutuhan penelitian, sedangkan dalam bidang pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa, faktor-faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar, perkembangan hasil belajar siswa, keberhasilan proses belajar mengajar guru, dan keberhasilan pencapaian suatu program tertentu.

Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non tes. Berdasarkan bentuk atau jenisnya, tes dibedakan menjadi tes uraian dan obyektif, sedangkan nontes terdiri dari observasi, wawancara (interview), angket (questionaire), pemeriksaan document (documentary analysis), dan sosiometri. Instrumen yang berbentuk test bersifat performansi maksimum sedang instrumen nontes bersifat performansi tipikal.

Instrumen hasil belajar bentuk tes uraian memiliki banyak keunggulan seperti mudah disusun, tidak memberi banyak kesempatan untuk berspekulasi dan mampu mendorong siswa untuk berani mengemukakan pendapat serta menyusun jawaban dalam bentuk kalimat. Namun perdebatan di kalangan guru dan bahkan dikalangan orang tua, adalah memandang bahwa tes uraian sering tidak adil. Bahkan ada pandangan bahwa cara pemberian skor tes uraian cukup dilihat dari panjang pendeknya tes uraian.

Di lain pihak, penggunaan nontes untuk menilai hasil dan proses belajar masih sangat terbatas jika dibandingkan dengan penggunaan alat melalui tes dalam menilai hasil dan proses belajar. Padahal ada aspek-aspek yang tidak bisa terukur secara “realtime” dengan hanya menggunakan test, seperti pada mata pelajaran matematika. Pada tes siswa dapat menjawab dengan tepat saat diberi pertanyaan tentang langkah-langkah melukis sudut menggunakan jangka tanpa busur, tetapi waktu diminta melukis secara langsung di kertas atau papan tulis ternyata cara menggunakan jangka saja mereka tidak bisa. Jadi dengan menggunakan nontes guru bisa menilai siswa secara komprehensif, bukan hanya dari aspek kognitif saja, tapi juga afektif dan psikomotornya.

Berdasarkan permasalahan-permasalahan yang telah disebutkan diatas, dapat disimpulkan bahwa alat ukur dapat dikategorisasi dalam dua bagian yaitu alat ukur berupa test dan non test. Adapun penggolongan lebih lanjutnya dapat diuraikan di bawah ini.

  1. Alat Ukur Tes/ujian

Ada banyak model ujian, di antaranya mencakup:

1)        Ujian ungkapan seperti essai, jawaban singkat, dan pengisian rumpang (blank)

2)        Ujian pilihan seperti betul-salah, pilihan ganda, dan penjodohan.

3)        Ujian perbuatan seperti melakukan suatu kegiatan

  1. Alat Ukur Non Tes

Tehnik penilaian nontes berarti melaksanakan penilaian dengan tidak mengunakan tes. Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidup dan lain-lain. Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik secara individu maupun secara kelompok. Alat ukur ini dapat berupa observasi (pengamatan), wawancara (interview), angket (quisioner), pemeriksaan dokumen (Ducumentary Analisis), dan sosiometri.

  1. 3.             Statistika Untuk Pengukuran

Skala Pengukuran

Untuk memilih uji statistik yang akan digunakan dalam menganalisa data maka tipe data memegang peranan yang penting. Jenis data pada gilirannya akan menentukan jenis uji statistik yang digunakan. Dalam statistik, data merupakan karakteristik, symbol atau angka dari sebuah variabel yang diukur. Pengukuran hanya dilakukan terhadap variabel yang dapat didefinisikan seperti minat, kinerja ataupun sikap. Agar hasil penelitian tidak memberikan interpretasi yang berbeda maka definisi operasional terhadap variabel yang diteliti perlu dijelaskan terlebih dahulu. Data dalam statistik secara umum dapat digolongkan menjadi 2 macam yaitu:

1)        Data nominal yaitu data yang didapat dari hasil perhitungan dan berbentuk kategori misalnya laki-laki-perempuan, tua-muda. Jika laki-laki disimbolkan dengan 1 dan perempuan disimbolkan dengan 2, maka bukan berarti perempuan lebih baik atau lebih banyak dua kali lipat dari laki. Data ini tidak bisa diberikan perlakuan matematika seperti penjumlahan ataupun perkalian. Yang termasuk data nominal juga adalah data ordinal.

2)        Data kontinu yaitu data yang didapat dari hasil pengukuran. Data hasil pengukuran diperoleh dari tes, kuesioner ataupun alat ukur lain yang sudah terstandar misalnya timbangan, panjang ataupun skala psikologis yang lain. yang termasuk data kontinum ini adalah interval dan rasio.
Data didapatkan dari perhitungan dan pengukuran. Pengukuran adalah penggunaan aturan untuk menetapkan bilangan pada obyek atau peristiwa.

Dengan kata lain, pengukuran memberikan nilai-nilai variabel dengan notasi bilangan. Aturan penggunaan notasi bilangan dalam pengukuran disebut skala atau tingkat pengukuran (scales of measurement).Secara lebih rinci, dalam statistik terdapat 4 skala pengukuran yaitu nominal, ordinal, interval dan rasio.

Skala nominal adalah skala mengelompokkan obyek atau peristiwa dalam berbentuk kategori. Skala nominal diperoleh dari pengukuran nominal yaitu suatu proses mengklasifikasian obyek-obyek yang berbeda kedalam kategori-kategori berdasarkan beberapa karakteristik tertentu.
Karakteristik data nominal adalah

1)        Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori)

2)        Kategori data tidak disusun secara logis

Skala ordinal adalah jenis skala yang menunjukkan tingkat. Skala ini biasanya dipergunakan dalam menentukan ranking seseorang dibandingkan dengan yang lain. misalnya ranking siswa dikelas dibuat dari nilai tertinggi sampai nilai terendah. Ranking pertama dan kedua tidak memiliki jarak rentangan yang sama dengan rankin kedua dan ketiga. Contoh lain skala ordinal adalah nilai mahasiswa dalam bentuk huruf, A, B, C, D dan E. skala ordinal memiliki karakteristik:

1)        Kategori data bersifat mutually eksklusif (setiap obyek hanya memiliki satu kategori),

2)        Kategori data tidak disusun secara logis,

3)        Kategori data disusun berdasarkan urutan logis dan sesuai dengan besarnya karakteristik yang dimiliki

Skala interval adalah skala yang yang memiliki jarak yang sama antar datanya akan tetapi tidak memiliki nol mutlak. Nol mutlak artinya tidak dianggap ada. Salah satu cirri matematis yang dimiliki skala interval adalah penjumlahan. Dengan demikian, kita dapat membuat operasi penambahan atau pengurangan. Misalnya, jarak pada temperature tertentu. Jarak antara 250F dengan 500F sama dengan jarak 750F dengan 1000F. akan tetapi, skala suhu ini tidak memiliki titik nol mutlak sehingga kita tidak bisa melakukan operasi perkalian dan pembagian. Untuk itu maka ada satu lagi skala yaitu skala rasio.

Skala rasio adalah skala pengukuran yang memiliki nol mutlak sehingga dapat dilakukan operasi perkalian dan pembagian. Misalnya berat badan, tinggi badan, pendapatan dan lain sebagainya.

Adapun desain pengukuran dapat digunakan beberapa skala seperti:

1)        Skala Likert

      Skala Likert’s digunakan untuk mengukur sikap, pendapat dan persepsi seseorang tentang fenomena sosial.

      Contoh:

     Pelayanan rumah sakit ini sudah sesuai dengan apa yang saudara harapkan.

     a. Sangat setuju                                   skor 5

     b. Setuju                                              skor 4

     c. Tidak ada pendapat                         skor 3

     d. Tidak setuju                                                skor 2

     e. Sangat tidak setuju                         skor 1

2)        Skala Guttman

      Skala Guttman akan memberikan respon yang tegas, yang terdiri dari dua alternatif.

      Misalnya :

Ya                              Tidak

Baik                           Buruk

Pernah                      Belum Pernah

Punya                        Tidak Punya

3)        Skala Semantic Deferensial

      Skala ini digunakan untuk mengukur sikap  tidak dalam bentuk pilihan ganda atau checklist, tetapi tersusun dari sebuah garis kontinuem dimana nilai yang sangat negatif terletak disebelah kiri sedangkan nilai yang sangat positif terletak disebelah kanan.

      Contoh:

Bagimana tanggapan saudara terhadap pelayanan dirumah sakit ini ?

1.Sangat buruk                           5.Sangat baik

4)        Skala Rating

      Dalam skala rating data yang diperoleh adalah data kuantitatif  kemudian peneliti baru mentranformasikan data kuantitatif tersebut menjadi data kualitatif.

      Contoh:

          Kenyaman ruang loby Bank  CBA:

          5          4          3          2          1         

          Kebersihan ruang parkir Bank  CBA:

          5          4          3          2          1

  1. 4.             Penskoran

Penskoran adalah suatu proses pengubahan jawaban instrumen menjadi angka-angka yang merupakan nilai kuantitatif dari suatu  jawaban terhadap item dalam instrumen (kuantifikasi terhadap jawaban instrumen).  Dengan memberikan Skor, kita dapat memperoleh deskripsi tentang seberapa nilai atau harga suatu variabel untuk masing-masing unit analisis dalam penelitian.

Dalam pemberian skor hasil belajar, tidak ada generalisasi di dalamnya. Hal ini berarti penskoran dilakukan berdasarkan alat ukur tesnya. Penskoran dengan menggunakan tes uraian tentu berbeda dengan tes dalam bentuk tes pilihan atau lebih luass alat ukur tes dengan alat ukur bukan tes.

Diffirensiasi penskoran ini diarahkan agar terjadi proporsional pengukuran sehingga terjadi pendistribusian skor yang seimbang dan mudah dilakukan penilaian. Sedangkan pemberian skor pada dasarnya mengacu dalam dua hal, yaitu berdasarkan acuan norma dan acuan patokan.

a)             Penilaian Acuan Norma

Ada beberapa pendapat tentang pengertian Penilaian Acuan Norma, yaitu:

1)      Acuan norma merupakan elemen pilihan yang memeberikan daftar dokumen normatif yang diacu dalam standar sehingga acuan tersebut tidak terpisahkan dalam penerapan standar. Data dokumen normatif yang diacu dalam standar yang sangat diperlukan dalam penerapan standar.

2)      Pengolahan dan pengubahan skor mentah menjadi nilai dilakukan dengan mengacu pada norma atau kelompok. Cara ini dikenal sebagai penilaian acuan norma (PAN).

3)      PAN adalah Nilai sekelompok peserta didik (siswa) dalam suatu proses pembelajaran didasarkan pada tingkat penguasaan di kelompok itu. Artinya pemberian nilai mengacu pada perolehan nilai di kelompok itu.

4)      Penilaian Acuan Norma (PAN) yaitu dengan cara membandingkan nilai seorang siswa dengan nilai kelompoknya. Jadi dalam hal ini prestasi seluruh siswa dalam kelas / kelompok dipakai sebagai dasar penilaian.

Dari beberapa pengertian ini dapat disimpulkan bahwa Penilaian Acuan Norma adalah penilaian yang dilakukan dengan mengacu pada norma kelmpok; nilai-nilai yang diperoleh siswa diperbandingkan dengan nilai-nilai siswa yang lain yang termasuk di dalam kelompok itu.

b)   Penilaian Acuan Patokan (PAP)

Penilaian acuan patokan (PAP) biasanya disebut juga criterion evaluation merupakan pengukuran yang menggunakan acuan yang berbeda. Dalam pengukuran ini siswa dikomperasikan dengan kriteria yang telah ditentukan terlebih dahulu dalam tujuan instruksional, bukan dengan penampilan siswa yang lain. Keberhasilan dalam prosedur acuan patokan tegantung pada penguasaaan materi atas kriteria yang telah dijabarkan dalam item-item pertanyaan guna mendukung tujuan instruksional .

Dengan PAP setiap individu dapat diketahui apa yang telah dan belum dikuasainya. Bimbingan individual untuk meningkatkan penguasaan siswa terhadap materi pelajaran dapat dirancang, demikian pula untuk memantapkan apa yang telah dikuasainya dapat dikembangkan. Guru dan setiap peserta didik (siswa) mendapat manfaat dari adanya PAP.

Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran dengan melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir dengan test awal merupakan petunjuk tentang kualitas proses pembelajaran.

Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan termuat pada kurikulum saat ini, PAP merupakan cara pandang yang harus diterapkan. PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya kurang terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar tuntas (mastery learning).

 

Tag: , , , ,

One response to “DASAR-DASAR PENGUKURAN DAN EVALUASI PENDIDIKAN

  1. talia

    11/08/2011 at 03:56

    bagus sekali tulisanx ….tapi mohon disertakan daftar referensi/ daftar pustakax

     

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

  • Masukkan alamat surat elektronik Anda untuk mengikuti blog ini dan menerima pemberitahuan tentang tulisan baru melalui surat elektronik.

    Bergabunglah dengan 6 pengikut lainnya

  •  
    %d blogger menyukai ini: