Pengujian komputer adalah salah satu bentuk teknologi komputer. Spesifik pengujian komputer dan bentuknya

Presentasi dengan topik: Pengujian komputer. Konsep dasar dan jenis pengujian komputer


























1 dari 25

Presentasi dengan topik:

geser nomor 1

Deskripsi slide:

geser nomor 2

Deskripsi slide:

Hampir semua universitas dan pusat teknologi informasi yang paling lengkap terlibat dalam pengembangan pelatihan komputer dan teknologi kontrol. Di antara masalah utama dalam pengembangan dan implementasi teknologi pembelajaran dan kontrol komputer, ada beberapa: - ambiguitas terminologi; - kurangnya pengembangan metodologi untuk membuat bahan kontrol untuk pengujian komputer; - tidak adanya pusat metodologi tunggal untuk pengujian komputer, yang dapat mengambil alih manajemen metodologis umum dari masalah penelitian.

geser nomor 3

Deskripsi slide:

Melakukan kontrol komputer atas pengetahuan siswa adalah dasar untuk memperoleh penilaian independen yang objektif dari tingkat pencapaian pendidikan (pengetahuan, keterampilan intelektual, dan keterampilan praktis), serta memberikan otoritas hasil yang andal dan tepat waktu untuk menilai tingkat kesiapan siswa. peserta didik dalam program pendidikan yang disusun sesuai dengan Standar Pendidikan Negara (SES). ). Analisis hasil kontrol komputer dari pengetahuan residual memungkinkan untuk mengembangkan rekomendasi yang bersifat prognostik untuk meningkatkan pengajaran disiplin akademik yang diuji.

geser nomor 4

Deskripsi slide:

Mari kita pisahkan konsepnya: kontrol dan pengujian Di bawah kontrol kita akan memahami prosedur yang memungkinkan kita menilai tingkat asimilasi dan pemahaman materi yang dipelajari untuk mengelola proses pembelajaran saat ini dan memastikan individualisasi pembelajaran. Pengujian adalah prosedur sertifikasi, menetapkan kepatuhan model pengetahuan pribadi dengan model pengetahuan standar yang diperlukan. Seperti yang dapat kita lihat dari definisi: kontrol adalah prosedur manajemen pelatihan; pengujian - prosedur untuk menyatakan fakta tahu - tidak tahu. Tentu saja, kedua prosedur ini penting untuk persiapan siswa, tetapi mereka juga memiliki fungsi target yang berbeda.

geser nomor 5

Deskripsi slide:

Persyaratan untuk pengembangan bahan kontrol Pengembangan persyaratan seragam harus berkontribusi pada penyatuan pengembangan bahan didaktik komputer untuk prosedur pengujian. Persyaratan untuk perangkat lunak dan bahan kontrol didaktik untuk pengujian komputer telah dikembangkan untuk menerapkan pendekatan terpadu di universitas di bidang merancang dan membentuk dana tugas kontrol untuk mengontrol sisa pengetahuan siswa dan memperoleh penilaian objektif tingkat pengetahuan, keterampilan dan kemampuan (prestasi belajar). Pada saat yang sama, persyaratan dasar untuk bahan pengujian kontrol juga dapat diterima untuk menetapkan tugas kontrol untuk pelatihan komputer.

geser nomor 6

Deskripsi slide:

Persyaratan yang diusulkan untuk pembuatan bahan kontrol untuk pengujian komputer didasarkan pada karya banyak peneliti dan kelompok penulis, termasuk: - pusat pengujian di Universitas Negeri Moskow "Teknologi Kemanusiaan" (pengawas pusat, Doktor Psikologi, Profesor Universitas Negeri Moskow A.G. Shmelev), yang tahun ini ia memenangkan kompetisi untuk melakukan ujian dalam bentuk komputer (К_ЕГЭ); – Pusat Pengujian Pendidikan Kejuruan di Universitas Seni Percetakan Universitas Negeri Moskow (Direktur Pusat, Doktor Ilmu Teknik V.I. Vasiliev); -departemen teknologi informasi modern OSU. Kuliah menggunakan prinsip dan persyaratan yang dikembangkan dalam praktik untuk menetapkan tugas kontrol, yang diperoleh selama pengembangan dan implementasi program kontrol dan pelatihan dalam proses pendidikan.

geser nomor 7

Deskripsi slide:

Jenis pengujian komputer - pengujian universitas terpusat berdasarkan bahan kontrol yang dikembangkan di UMO yang relevan, yang dialokasikan oleh pusat kementerian; – pengujian pengesahan (selama pemeriksaan sendiri departemen, konfirmasi lisensi negara); - pengujian akhir untuk menilai kepatuhan pengetahuan yang diperoleh dalam proses pelatihan dalam disiplin tertentu dengan persyaratan standar pendidikan negara bagian; - ujian tengah semester dan saat ini untuk menilai kesiapan dalam proses mempelajari disiplin; - penilaian sisa pengetahuan peserta pelatihan.

geser nomor 8

Deskripsi slide:

Metode pengujian komputer dapat digunakan untuk memperoleh informasi yang objektif, operasional, andal tentang pengetahuan yang diperoleh dalam proses pembelajaran dan tentang kesiapan siswa untuk memahami materi baru. Pengujian komputer memiliki sejumlah keunggulan: memastikan standarisasi; memastikan individualitas prosedur kontrol; meningkatkan objektivitas kontrol dan menghilangkan faktor subjektif (kelelahan guru dan emosinya atau suasana hatinya yang buruk, kurangnya atau ketidakcukupan waktu untuk komunikasi pribadi dengan guru, dll.); efisiensi pemrosesan statistik hasil pengendalian; aksesibilitas bagi siswa untuk melengkapi informasi tentang hasil pengendalian;

geser nomor 9

Deskripsi slide:

memberi guru kesempatan untuk dengan cepat menguji pengetahuan sejumlah besar siswa tentang berbagai topik, tugas, disiplin di kompleks; pembebasan guru dari melakukan pekerjaan padat karya dan rutin yang berulang pada organisasi kontrol massa, membebaskan waktu untuk peningkatan kreatif dari berbagai aspek kegiatan profesionalnya; memastikan verifikasi yang komprehensif dan lengkap; memberi siswa kesempatan untuk menguji sendiri pengembangan materi dalam mode operasi yang nyaman baginya (mode jaringan akses ke sistem kontrol dan bahan pengukuran); aksesibilitas dan kesetaraan semua peserta dalam prosedur pengujian.

geser nomor 10

Deskripsi slide:

Sistem pengujian komputer modern dibedakan oleh: pilihan cara kerja khusus untuk siswa: - mencoba menjawab lebih banyak pertanyaan dalam waktu yang lebih lama; - atau, sebaliknya, batasi jumlah pertanyaan, tetapi dapatkan lebih sedikit waktu; - pilih lebih sedikit pertanyaan sulit dan lebih sederhana, dll. fleksibilitas tertentu, ketika siswa dapat memilih jadwal individu untuk melewati pos pemeriksaan.

geser nomor 11

Deskripsi slide:

geser nomor 12

Deskripsi slide:

Pengembangan materi kontrol Tugas yang paling sulit dari seorang ahli dalam pengujian komputer adalah tugas mengembangkan tes yang memungkinkan penilaian paling objektif dari tingkat kesesuaian atau inkonsistensi antara model pengetahuan pribadi siswa dan model pengetahuan ahli. Pengembangan bahan uji untuk segala bentuk pengujian (kosong atau komputer), serta kontrol komputer, harus memenuhi prinsip-prinsip tertentu, persyaratan yang dikembangkan, aturan desain dan memenuhi persyaratan ahli dalam mengevaluasi tugas pengujian.

geser nomor 13

Deskripsi slide:

Jenis algoritma kontrol (pembelajaran) ditentukan oleh: tujuan pembelajaran; struktur bahan; metode pengajaran; kesiapan penonton; faktor waktu; kemungkinan didaktik teknologi. Saat mengembangkan tugas pengujian komputer, perlu dipandu oleh prinsip-prinsip dan persyaratan dasar dari masalah umum yang sebelumnya dipertimbangkan dalam menyusun tugas pengujian.

geser nomor 14

Deskripsi slide:

Dalam karya M. Gottlieb, diusulkan untuk mempertimbangkan 7 jenis tugas pelatihan sesuai dengan prinsip algoritma pembelajaran yang diterapkan di dalamnya: persiapan-sekuensial; persiapan paralel; korektif berurutan; paralel-korektif; algoritma transfer; algoritma analitik; algoritma pemesanan. Kami mengusulkan untuk memperluas jenis tugas pelatihan yang direkomendasikan dengan kombinasi algoritme ini, yang memungkinkan kami mengembangkan tugas pelatihan yang memiliki fokus praktis yang lebih besar, dan yang terakhir adalah salah satu momen yang menentukan dari model pembelajaran aktivitas individu.

geser nomor 15

Deskripsi slide:

Pertanyaan sebagai bentuk tugas belajar. Pengendalian dan pengendalian diri siswa merupakan mata rantai yang sangat penting dalam setiap bentuk pendidikan, sehingga terdapat berbagai bentuk pengendalian. Bentuk pengaturan tugas kendali/latihan berupa soal-soal merupakan salah satu yang paling sulit. Pertanyaan yang diajukan di BPK harus memenuhi sejumlah persyaratan dan, pertama-tama, persepsi yang jelas, dan ini, pada gilirannya, memerlukan karakteristik lain dari pertanyaan untuk pekerjaan CSR: kejelasan pertanyaan, kelengkapan Pernyataan, konsistensi dan ciri-ciri lain inilah yang paling penting dalam pengajaran suatu unit didaktik.

geser nomor 16

Deskripsi slide:

Algoritma analitis. Inti dari algoritma: untuk mencocokkan pertanyaan (latihan) dengan jumlah jawaban yang benar. Jumlah pertanyaan dalam algoritma ini bisa sama dengan jumlah jawaban atau kurang. Algoritma pencocokan. Inti dari algoritma: untuk mencocokkan setiap pertanyaan dengan satu jawaban. Algoritma pemesanan. Inti dari algoritma: untuk menentukan urutan tindakan yang benar. Belajar dengan bantuan algoritme subjek adalah salah satu cara untuk mencapai tingkat kesiapan siswa yang diperlukan, dan ini tidak selalu mengarah pada kinerja tindakan mekanis, melainkan menanamkan pendekatan yang benar dan rasional untuk melakukan pekerjaan tertentu. .

geser nomor 17

Deskripsi slide:

Algoritma seleksi/pengecualian. Inti dari algoritme: menunjukkan tindakan yang diperlukan dan urutan yang diikuti, atau sebaliknya, mengecualikan operasi yang tidak diinginkan dan tidak perlu. Metode pengaturan tugas pelatihan untuk menghilangkan tindakan yang tidak perlu atau berbahaya sangat efektif, karena memungkinkan dalam petunjuk (atau jenis penjelasan lainnya) untuk mengungkapkan esensi dari tindakan yang salah (untuk mengungkapkan dan melokalisasi kesalahan) dan konsekuensinya. Untuk meningkatkan efektivitas pelatihan, pada akhir jenis tugas pelatihan ini, perlu untuk menunjukkan urutan tindakan yang teratur, paling efektif atau rasional untuk mencapai tujuan.

geser nomor 18

Deskripsi slide:

Algoritma penambahan. Inti dari algoritma: penambahan tindakan yang hilang atau kata-kata yang hilang. Algoritma yang bersifat komputasional. Algoritma ini situasional. Inti dari algoritma: masalah diajukan, mungkin dikombinasikan dengan area lain, perlu untuk mengusulkan solusi khusus. Ini adalah jenis tugas kontrol dan pelatihan yang sangat menarik, yang membutuhkan pengetahuan luas dari guru dan tidak hanya bidang mata pelajaran yang sistem kontrolnya sedang dibangun.

geser nomor 19

Deskripsi slide:

Algoritma analitis. Inti dari algoritma: untuk mencocokkan pertanyaan dengan jumlah jawaban yang benar. Menurut A.N. Mayorova adalah bentuk jawaban tertutup. Algoritma pencocokan. Inti dari algoritma ini adalah untuk mengasosiasikan setiap objek dari satu grup dengan objek dari grup lain (1:1). Algoritma klasifikasi. Inti dari algoritma: untuk menghubungkan objek kelompok B ke kelas tertentu dari daftar kelas A. Guru harus menggambarkan karakteristik kelas dan dasar pembentukan kelas. Algoritma pemesanan. Inti dari algoritma: untuk menentukan urutan tindakan yang benar.

geser nomor 20

Deskripsi slide:

Aturan untuk menyusun tugas untuk pengujian komputer Konten tugas kontrol (KZ) harus difokuskan pada pemeriksaan konsep dan elemen signifikan dari konten subjek kontrol dan memperoleh kesimpulan yang jelas dari pengujian. Istilah utama item tes harus didefinisikan secara eksplisit dan jelas. Tugas tes harus benar secara pragmatis dan dirancang untuk menilai tingkat pencapaian pendidikan siswa. Tugas tes dapat dirumuskan dalam bentuk penilaian singkat, pertanyaan yang diajukan dengan jelas, dan tugas khusus. Tugas kontrol yang membutuhkan kesimpulan rinci dari subjek saat melakukan tugas kontrol harus dihindari.

geser nomor 21

Deskripsi slide:

Saat merancang tugas kontrol, dimungkinkan untuk menggunakan berbagai bentuk presentasinya, serta komponen grafis dan multimedia, tidak hanya untuk tujuan menyajikan konten materi pendidikan secara rasional, tetapi juga ketika mengatur tugas kontrol yang memerlukan bentuk grafis. dari jawabannya. Jumlah kata dalam tugas kontrol harus minimal jika struktur konseptual dari pernyataan tugas tidak terdistorsi. Hal utama adalah refleksi yang jelas dan eksplisit dari isi sebuah fragmen dari area subjek. Tetapi lebih baik menggunakan TESIS: Lebih baik memiliki pertanyaan "panjang" dan jawaban "pendek" daripada sebaliknya.

geser nomor 22

Deskripsi slide:

Isi tugas harus dinyatakan dalam konstruksi sintaksis yang sangat sederhana tanpa pengulangan dan negatif ganda. Saat menyiapkan tugas tes, Anda tidak boleh menggunakan tugas yang bersifat komposit, dalam jawaban di mana kinerja yang benar dari satu tugas akan bergantung pada kinerja yang benar dari tugas lain dari subtes yang sama. Teks tugas tes tidak boleh berisi petunjuk dan bahasa gaul yang tidak disengaja. Kesimpulan seperti: semua di atas benar, semua jawaban yang diberikan salah, dll. tidak diperbolehkan. Dalam tugas, jangan gunakan kata-kata yang dipahami secara berbeda oleh orang yang berbeda: kadang-kadang, sering, selalu, kadang-kadang, semuanya, tidak pernah, dll. Tugas tidak boleh menggunakan terminologi yang melampaui ruang lingkup disiplin akademik.

geser nomor 23

Deskripsi slide:

Butir tes tidak boleh mencerminkan opini subjektif atau pemahaman penulis individu. Seharusnya tidak ada petunjuk dalam teks atau jawaban. Tugas tidak boleh mengandung kesimpulan, pilihan jawaban: jelas salah; berisi petunjuk; dibedakan dengan jelas, terisolasi. 17. Tugas harus disusun dengan mempertimbangkan fakta bahwa waktu rata-rata untuk pembentukan kesimpulan orang yang diuji dengan tingkat kesiapan rata-rata tidak boleh lebih dari 2 menit (ditentukan secara empiris saat menjalankan tugas). Waktu respons rata-rata siswa terhadap tugas kontrol ditentukan oleh sikap guru - penulis tugas kontrol. Rata-rata waktu pelaksanaan tugas ditentukan secara empiris saat menjalankan tugas.

Deskripsi slide:

Situs untuk persiapan ujian negara terpadu dalam bentuk komputer ("Pusat Teknologi Kemanusiaan" di bawah kepemimpinan Shmelev menyajikan materi yang sangat menarik dan beragam untuk persiapan tugas kontrol komputer, berbagai tugas untuk menguji anak sekolah dan pelamar. Alamat situs http ://www.ege.ru/ .

Kuliah 11. Pengujian komputer dalam pendidikan.

1. Kekhususan pengujian komputer dan bentuknya.

2. Bentuk tugas tes yang inovatif dalam pengujian komputer.

3. Pengujian adaptif komputer.

4. Pengujian online, penerapannya dalam pembelajaran jarak jauh.

1. Kekhususan pengujian komputer dan bentuknya

Ide umum tentang pengujian komputer. Sejak awal abad XXI. Komputer telah menjadi banyak digunakan dalam pendidikan pengujian. Dalam inovasi pedagogis, arah terpisah telah muncul - pengujian komputer, di mana presentasi tes, evaluasi hasil siswa dan penerbitan hasil kepada mereka dilakukan menggunakan PC.

Tahap pembuatan tes secara teknologi dapat dilanjutkan dengan cara yang berbeda, termasuk dengan memasukkan tes kosong ke komputer. Sampai saat ini, ada banyak publikasi tentang pengujian komputer, perangkat lunak dan alat telah dikembangkan untuk menghasilkan dan menyajikan tes.

Bila perlu untuk beralih ke pengujian komputer. Meskipun pengujian komputer sangat memudahkan pekerjaan seorang guru dalam mempresentasikan dan mengevaluasi hasil tes, distribusinya dalam banyak hal tidak lebih dari penghargaan terhadap mode, semua konsekuensi negatifnya belum sepenuhnya diidentifikasi. Pilihan format ujian berbasis komputer harus didasarkan pada premis yang lebih penting dan masuk akal daripada sekadar hasrat untuk berinovasi, karena hal itu menciptakan banyak masalah dan menempatkan siswa pada medan permainan yang tidak seimbang. Pengujian terkomputerisasi harus dialihkan ke dalam kasus di mana ada kebutuhan mendesak untuk meninggalkan tes kosong tradisional.

Misalnya, pengujian komputer diperlukan saat melakukan Ujian Negara Terpadu di wilayah Rusia yang sulit dijangkau. Pengumpulan lulusan dari distrik tertentu pada waktu yang ditentukan untuk USE menjadi peristiwa yang kompleks dan mahal sehingga tidak mungkin dilakukan tanpa pengujian komputer dan sarana komunikasi modern. Juga disarankan untuk menggunakan pengujian komputer ketika melakukan pemeriksaan untuk anak-anak penyandang cacat yang memiliki gangguan penglihatan atau pendengaran yang serius. PC dapat menggunakan font besar, rekaman audio, perangkat entri data pengujian tambahan, dan perangkat lain untuk mengimbangi potensi keterlambatan dalam ujian bagi anak-anak penyandang disabilitas.

Bentuk-bentuk pelaksanaan pengujian komputer. Pengujian komputer dapat dilakukan dalam berbagai bentuk, berbeda dalam teknologi menggabungkan tugas menjadi tes (Gbr. 17). beberapa dari mereka belum menerima nama khusus dalam literatur tentang masalah tes.

Gambar 17. Bentuk pengujian komputer

Bentuk pertama adalah yang paling sederhana. Tes yang sudah jadi, distandarisasi atau dimaksudkan untuk kontrol saat ini, dimasukkan ke dalam cangkang khusus, yang fungsinya dapat bervariasi dalam tingkat kelengkapan. Biasanya, selama pengujian akhir, shell memungkinkan Anda menampilkan tugas di layar, mengevaluasi hasil pelaksanaannya, membentuk matriks hasil pengujian, memprosesnya, dan menskalakan skor utama subjek tes dengan mentransfernya ke salah satu skala standar untuk mengeluarkan skor tes untuk setiap subjek tes dan protokol penilaiannya pada item tes.

Bentuk kedua pengujian komputer melibatkan pembuatan opsi pengujian otomatis, yang dilakukan dengan bantuan alat. Varian dibuat sebelum ujian atau langsung selama ujian dari bank item tes yang dikalibrasi dengan karakteristik statistik yang stabil. Kalibrasi dicapai melalui pekerjaan pendahuluan yang panjang pada pembentukan formulir, parameter yang diperoleh pada sampel siswa yang representatif, sebagai aturan, selama 3-4 tahun menggunakan tes kosong. Validitas isi dan paralelisme opsi dipastikan dengan pemilihan tugas yang diatur secara ketat untuk setiap opsi sesuai dengan spesifikasi pengujian.

Bentuk ketiga - pengujian adaptif komputer - didasarkan pada tes adaptif khusus. Gagasan adaptabilitas didasarkan pada pertimbangan bahwa tidak ada gunanya seorang siswa memberikan tugas-tugas tes yang dia pasti akan melakukannya dengan benar tanpa kesulitan sedikit pun, atau dijamin tidak akan berhasil karena kesulitan yang tinggi. Oleh karena itu, diusulkan untuk mengoptimalkan kesulitan tugas, menyesuaikannya dengan tingkat kesiapan setiap mata pelajaran, dan mengurangi durasi tes dengan menghilangkan sebagian tugas.

Keuntungan dan kerugian dari pengujian komputer. Pengujian komputer memiliki keunggulan tertentu dibandingkan pengujian blanko tradisional, yang terutama terlihat selama pemeriksaan massal, misalnya, saat melakukan ujian nasional seperti USE. Menyajikan varian tes di komputer memungkinkan Anda menghemat uang, yang biasanya direkomendasikan untuk mencetak dan mengangkut tes kosong.

Berkat pengujian komputer, dimungkinkan untuk meningkatkan keamanan informasi dan mencegah deklasifikasi pengujian karena kecepatan tinggi transfer informasi dan perlindungan khusus file elektronik. Prosedur untuk menghitung skor yang dihasilkan juga disederhanakan dalam kasus di mana tes hanya berisi tugas dengan pilihan jawaban.

Keuntungan lain dari pengujian komputer diwujudkan dalam kontrol saat ini, dengan kontrol diri dan pelatihan diri siswa; berkat komputer, Anda dapat segera mengeluarkan skor tes dan mengambil tindakan mendesak untuk memperbaiki asimilasi materi baru berdasarkan analisis protokol berdasarkan hasil tes korektif dan diagnostik. Kemungkinan kontrol pedagogis dalam pengujian komputer meningkat secara signifikan karena perluasan jangkauan keterampilan dan kemampuan terukur dalam jenis tugas tes inovatif yang menggunakan beragam kemampuan komputer saat memasukkan file audio dan video, interaktivitas, pengajuan masalah dinamis menggunakan alat multimedia, dll.

Berkat pengujian komputer, kemampuan informasi dari proses kontrol meningkat, menjadi mungkin untuk mengumpulkan data tambahan tentang dinamika kelulusan tes oleh masing-masing siswa dan untuk membedakan antara item tes yang tidak terjawab dan tidak tersedia.

Selain keuntungan yang tak terbantahkan, pengujian komputer memiliki sejumlah kelemahan, yang ditunjukkan pada Gambar. delapan belas.

Gbr.18 Masalah yang muncul selama pengujian komputer

Reaksi psikologis dan emosional khas siswa pada pengujian komputer. Biasanya reaksi psikologis dan emosional siswa terhadap pengujian komputer adalah positif. Siswa menyukai penerbitan nilai ujian yang segera, protokol ujian dengan hasil untuk setiap tugas, serta sifat inovatif dari kontrol ketika teknologi hypermedia modern terlibat dalam mengeluarkan ujian. Dukungan multimedia dinamis untuk tugas di komputer, dikombinasikan dengan perangkat lunak untuk presentasi interaktif, menurut siswa, memberikan penilaian pengetahuan dan keterampilan yang lebih akurat, dan lebih termotivasi untuk menyelesaikan tugas dibandingkan dengan tes kosong. Juga nyaman bahwa alih-alih mengisi formulir khusus untuk jawaban, Anda cukup memilih jawabannya dengan mouse. Jika pengujian berlangsung dalam mode adaptif, maka waktu ujian dan durasi pengujian dikurangi.

Reaksi negatif biasanya menyebabkan berbagai batasan, yang terkadang dikenakan saat mengeluarkan tugas dalam pengujian komputer. Misalnya, urutan tugas disajikan tetap, atau waktu maksimum yang mungkin untuk menyelesaikan setiap tugas, setelah itu, terlepas dari keinginan subjek, tugas tes berikutnya muncul. Dalam pengujian adaptif, siswa tidak puas dengan kenyataan bahwa mereka tidak memiliki kesempatan untuk melewatkan tugas berikutnya, meninjau seluruh tes sebelum mulai mengerjakannya, dan mengubah jawaban untuk tugas sebelumnya. Terkadang anak sekolah keberatan dengan pengujian komputer karena kesulitan yang muncul saat melakukan dan merekam perhitungan matematis, dll.

Dampak pada kinerja pengujian tingkat pengalaman komputer sebelumnya. Hasil penelitian asing menunjukkan bahwa pengalaman bekerja dengan komputer yang dimiliki anak sekolah dalam banyak kasus secara signifikan mempengaruhi validitas hasil tes. Jika tes mencakup item pilihan ganda non-inovatif, dampak pengalaman komputer pada hasil tes dapat diabaikan, karena siswa dalam item tersebut tidak memerlukan tindakan kompleks apa pun dalam mengerjakan tes. Ketika disajikan di layar dengan jenis tugas inovatif yang menggunakan grafis komputer secara ekstensif dan inovasi lainnya, pengaruh pengalaman komputer sebelumnya pada skor tes menjadi sangat signifikan. Jadi, ketika pengujian komputer, perlu memperhitungkan tingkat tingkat komputer siswa yang menjadi tujuan tes tersebut.

Pengaruh antarmuka pengguna pada hasil pengujian komputer. Antarmuka pengguna mencakup fungsi yang tersedia bagi siswa dan kemampuan untuk bergerak melalui tugas-tugas tes, elemen menempatkan informasi di layar, serta gaya visual umum dalam menyajikan informasi. Antarmuka pengguna yang baik harus memiliki kejelasan dan kebenaran urutan logis interaksi dengan peserta ujian, yang mencerminkan prinsip-prinsip umum desain informasi grafis. Antarmuka yang lebih bijaksana, semakin sedikit perhatian siswa membayar untuk itu, memusatkan semua upaya mereka untuk menyelesaikan tugas-tugas tes.

2. Bentuk tugas tes yang inovatif untuk komputer pengujian.

Tujuan mengembangkan tugas inovatif dalam pengujian komputer . Tugas inovatif menggunakan kemampuan pengujian komputer sejauh ini merupakan arah yang paling menjanjikan dalam pengembangan otomatisasi pengukuran pedagogis. Alasan utama untuk ini adalah potensi besar tugas inovatif untuk meningkatkan konten informasi pengukuran pedagogis dan meningkatkan validitas konten tes.

Tujuan utama mengembangkan tugas-tugas inovatif untuk pengujian komputer adalah untuk menilai keterampilan kognitif, literasi fungsional dan keterampilan komunikasi yang tetap tidak terdeteksi oleh kontrol tradisional, atau penggunaan tes kosong.

Pokok penilaian dalam inovasi dapat berupa tingkat aktivitas analitis dan sintetik siswa, kecepatan generalisasi informasi baru, fleksibilitas proses berpikir dan banyak indikator aktivitas mental lainnya yang telah terbentuk dalam proses pembelajaran dan tidak dapat dinilai dengan menggunakan tes konvensional.

Kemungkinan tugas inovatif dalam pengujian komputer. Dalam penggunaan tugas inovatif, dua aspek dapat dibedakan: didaktik dan psikologis dan pedagogis. Yang pertama melibatkan interpretasi makna yang terperinci dari hasil tes dalam konteks keterampilan kognitif, pendidikan dan pendidikan umum yang dikuasai pada saat presentasi tes, dan yang kedua memungkinkan menilai tingkat perkembangan proses berpikir siswa dan mengidentifikasi fitur asimilasi pengetahuan baru. Sebagian besar tugas inovatif yang dikembangkan hingga saat ini memberikan peningkatan dalam pengukuran di kedua arah. Dengan demikian, tugas-tugas inovatif memungkinkan untuk memperluas kemungkinan dimensi pedagogis itu sendiri dengan memperoleh hasil dalam arah baru yang sebelumnya tidak dapat diakses untuk menilai kualitas kesiapan siswa. Misalnya, untuk menilai tingkat pembentukan literasi fungsional, peserta ujian dapat menawarkan bagian teks yang memiliki kesalahan, dan kemudian meminta mereka untuk mengidentifikasi dan memperbaikinya dengan mengetik ulang bagian teks.

Tugas inovatif membantu mengurangi dampak tebakan acak di belakang. dengan meningkatkan jumlah kemungkinan jawaban tanpa meningkatkan ukuran butir soal. Misalnya, saat menilai pemahaman bacaan, Anda dapat meminta siswa untuk memilih kalimat kunci dalam teks dan mengarahkannya dengan klik mouse. Dengan demikian, setiap kalimat dalam teks menjadi pilihan pilihan alih-alih 4-5 jawaban dalam tugas-tugas tradisional dengan jawaban siap pakai. Untuk meningkatkan bentuk tugas, gambar kompleks digunakan, elemen dinamis, termasuk gambar, animasi, atau video; sehingga mengurangi waktu membaca kondisi. Perluasan kemampuan pengujian terjadi ketika suara dihidupkan, yang memungkinkan Anda untuk melakukan dialog dengan siswa, mengevaluasi fitur fonetik pengucapannya saat menguji dalam bahasa asing, memeriksa interpretasi yang benar dari berbagai suara.

Arah utama inovasi dalam pengembangan tugas. Inovasi dalam pengembangan item untuk pengujian komputer mencakup lima bidang terkait. Ini termasuk: bentuk tugas, tindakan subjek saat menjawab, tingkat penggunaan teknologi multimedia, tingkat interaktivitas dan metode penilaian.

Inovasi dalam bentuk tugas meliputi rangkaian informasi visual dan audio atau kombinasi keduanya. Informasi visual dapat berupa karakter realistis (foto, bioskop) dan sintesa (gambar, animasi). Jenis informasi, dalam kombinasi dengan formulir tes, menentukan format jawaban yang dipilih atau dibuat oleh penguji. Saat menggunakan foto atau gambar, informasi yang terkandung dalam item tes bersifat statis. Sinema, yang mencerminkan dunia nyata, dan animasi membawa dinamika pada pelaksanaan ujian.

Tindakan siswa saat menjawab tugas bergantung pada alat inovatif yang disertakan dalam tes. Saat Anda menyertakan informasi audio dalam tugas yang memerlukan respons suara siswa, keyboard, mouse, atau mikrofon digunakan untuk merespons. Tempat yang signifikan dalam jawaban diberikan untuk proses interaktif. Modus interaktif kerja siswa selama pengujian komputer berarti output berurutan dari informasi audiovisual, di mana setiap pernyataan baru dari sisi siswa atau komputer dibangun dengan mempertimbangkan informasi sebelumnya dari kedua sisi. Saat mengatur mode interaktif dalam pengujian komputer, menu utama di layar digunakan, di mana siswa memilih, membuat, atau memindahkan objek - komponen jawaban untuk menjawab tugas tes. Lebih jarang dalam mode interaktif, input suara dari jawaban digunakan.

Secara umum, tingkat interaktivitas yang disediakan dalam pengujian berbasis komputer mencirikan sejauh mana bentuk tugas tertentu bereaksi atau merespons masukan dari peserta ujian. Level ini berkisar dari kasus yang paling sederhana, ketika satu langkah diambil, hingga tugas-tugas multi-langkah yang kompleks dengan percabangan setelah setiap jawaban siswa berikutnya.

Karakteristik komparatif dari bentuk tugas inovatif dalam pengujian komputer untuk berbagai tujuan meningkatkan dimensi pedagogis diberikan dalam Tabel. 5.

Masalah yang muncul saat menggunakan tugas meningkat kesulitan dalam pengujian komputer. Tugas dengan tingkat kesulitan yang lebih tinggi selalu membutuhkan lebih banyak waktu untuk menjawab, terlepas dari apakah itu disajikan menggunakan simulasi komputer realitas virtual, apakah itu dalam bentuk pekerjaan laboratorium, esai, atau menggunakan teknologi multimedia. Karena biaya waktu, jumlah tugas kompleks seharusnya tidak signifikan - tidak lebih dari 10-15%, dalam beberapa kasus - 20-25%. Variasi gambar suara dan visual dalam pengujian komputer menyebabkan kelelahan di antara anak-anak sekolah, oleh karena itu, ketika sejumlah kecil tugas inovatif yang sulit dimasukkan dalam pengujian, perlu untuk secara signifikan mengurangi durasi tes, yang berdampak negatif pada konten. validitas, reliabilitas dan keamanan informasi dari dimensi pedagogis.

Terlepas dari kelebihan bentuk tugas inovatif yang disajikan menggunakan komputer, tugas tersebut harus diperlakukan dengan hati-hati, dianalisis dengan cermat untuk kecukupannya terhadap tujuan pengukuran dan relevansi dalam ujian. Biasanya, tugas-tugas inovatif dengan tingkat kesulitan tinggi dipilih dalam blok terpisah dan ditempatkan di akhir ujian.

Tabel 5

Karakteristik komparatif dari bentuk tugas inovatif dalam pengujian komputer

Target meningkatkan dimensi pedagogis

Karakteristik formulir tanggapan

Utama

arah inovasi

Karakteristik kesulitan

tugas

Kurangi efek menebak

Jawaban numerik (atau tekstual) yang dibuat oleh siswa, input keyboard, atau suara melalui mikrofon

Menggunakan formulir tugas dengan respons yang dibangun

Biasanya

tinggi

Tingkatkan validitas konten

Jawabannya dipilih mouse pada gambar grafik, menu biasa atau hypertext digunakan

Penggunaan baris audiovisual. Aktifkan media tanpa interaktivitas

rendah atau

rata-rata

Menyediakan

peningkatan validitas konstruk dan konten

Jawabannya dipilih

mouse pada gambar grafik, informasi tambahan diminta, hypertext digunakan

Menggunakan multimedia untuk mensimulasikan lingkungan alam dan tindakan pengguna di dalamnya. Mewakili objek dengan animasi di luar interaktivitas

sedang atau tinggi

Perluas kemampuan untuk mengukur kecerdasan keterampilan, keterampilan kognitif

Jawabannya dilakukan dengan memindahkan objek di layar dan didesain oleh siswa, menggunakan tombol keyboard, tombol kiri dan kanan mouse. Kemungkinan interaktif

Menggunakan formulir tugas dengan respons yang dibangun dan interaktif tingkat dasar

sedang atau tinggi

Menyediakan

kemungkinan

evaluasi

kreatif dan

praktis

keterampilan

Saat menyusun respons, siswa harus menggunakan transisi interaktif bercabang dua tahap atau multi-tahap ke berbagai tahap tugas

Menggunakan formulir tugas dengan respons yang dibangun dan

interaktif tingkat lanjut

Rata-rata atau

tinggi

Memberikan peningkatan konstruk dan validitas isi; memperluas cakupan konten; menyadari kemungkinan mengukur komunikasi dan keterampilan intelektual, keterampilan kognitif

Respons dimodelkan oleh siswa selangkah demi selangkah menggunakan transisi interaktif percabangan multi-tahap ke berbagai tahap tugas dan realitas virtual

Tindakan subjek saat menjawab

tinggi

Menghitung nilai siswa. Jika pengujian komputer tidak menggunakan multimedia dan teknologi interaktif, maka nilai utama siswa secara tradisional dihitung dengan menjumlahkan nilai untuk tugas individu. Keterlibatan teknologi multimedia mengarah pada hasil tes multidimensi, karena penilaian seluruh rentang kreatif, komunikatif, mata pelajaran umum dan keterampilan lainnya menggunakan bentuk tugas yang inovatif selalu dikaitkan dengan beberapa variabel pengukuran. Munculnya interaktivitas semakin memperumit prosedur penghitungan nilai siswa, menjadi tergantung pada jawaban penguji pada setiap langkah tugas tes dan membutuhkan penilaian politomik.

Pengecekan hasil tugas dengan jawaban teregulasi yang disusun dilakukan dengan membandingkan jawaban pemeriksa dengan standar yang tersimpan dalam memori komputer, dan mencantumkan berbagai sinonim untuk jawaban yang benar dengan kesalahan ejaan yang dapat diterima.

Jauh lebih sulit adalah penilaian otomatis dalam tugas-tugas dengan jawaban yang dibangun secara bebas (seperti esai) dalam humaniora. Sampai saat ini, testolo asingGami mengembangkan program khusus untuk verifikasi esai otomatis. Kriteria evaluasi dalam program-program ini cukup beragam: dari pertimbangan karakteristik dangkal esai seperti panjang dan tingkat kelengkapan jawaban hingga kasus analisis yang kompleks menggunakan pencapaian linguistik komputasi. Biasanya, semua program penilaian otomatis yang beragam ini memerlukan masukan ahli hanya di awal pekerjaan, ketika pendidik yang memenuhi syarat perlu "mengajar" program komputer cara menilai respons yang diperluas.

Tes panjang tetap, pembuatan komputer dari kasus uji paralel

Komponen utama dari proses perakitan tes otomatis untuk presentasi komputer. Proses perakitan tes otomatis dalam kasus ketika itu. terjadi di muka dan tidak dalam mode adaptif, termasuk perakitan (pembuatan) opsi paralel, pilihan aturan untuk penilaian siswa tes, dan koreksi opsi untuk memenuhi persyaratan teori pengukuran pedagogis.

tidak bisa dihindari Perbedaan kesulitan opsi yang timbul dari adanya kesalahan pengukuran dihilangkan setelah pengujian dengan meratakan skala yang diperoleh saat menghitung nilai tes untuk opsi tes individual. Di antara masalah terkait, solusi yang juga diperlukan untuk perakitan pengujian otomatis, adalah pekerjaan mengisi bank tugas pengujian dan mengevaluasi keamanan informasi pengujian.

Generasi komputer varian paralel dari tes panjang tetap. Perakitan otomatis tes dengan jumlah tugas tetap mengasumsikan adanya panjang tes yang ditetapkan, spesifikasinya, dan banktugas terkalibrasi Sebuah bank yang bisa diterapkan yang mendukung pembuatan tes multivariat harus mencakup kerangka tugas dari berbagai kesulitan untuk setiap elemen konten dengan estimasi parameter yang stabil. Dengan bantuan perangkat lunak khusus dan perangkat lunak instrumental, analog dari tes kosong tradisional diperoleh, siap untuk dipresentasikan setelah beberapa menit dari awal pembuatan dan memberikan pengukuran pedagogis berkualitas tinggi.

Metode tata letak pengujian otomatisuntuk presentasi komputer dalam mode offline (tanpa menggunakan lokaljaringan komputer atau Internet) atau dalam mode on line (menggunakan jaringan komputer lokal atau internet) disebut desain pengujian otomatis. Tujuan dari desain adalah untuk membentuk varian uji yang memenuhi sejumlah kondisi, yang meliputi: jumlah tugas, struktur konten, frekuensi pemilihan tugas dalam varian, serta sejumlah persyaratan yang memastikan pembuatan varian uji paralel.

Teknologi tata letak varian harus mendukung kontrol sistematis atas. frekuensi penyertaan setiap tugas dari bank dalam ujian. Jumlah tugas identik dalam opsi paralel yang digunakan untuk menyelaraskan skala dengan opsi tidak boleh melebihi 15-20%. Untuk mengontrol frekuensi penyertaan tugas dalam varian, maksimumkemungkinan persentase dari setiap pemilihan tugas dari bank. Ketika tercapai, tugas tidak lagi digunakan dalam prosedur pembuatan tes lebih lanjut.

Biasanya banyak paralel atau kuasi-paralelvarian uji dibuat dalam mode offline untuk presentasi selanjutnya dalam mode on line , termasuk interaktifinteraksi dengan siswa. Hari memperluas kemampuan komunikasi kontrol komputer di waktu sebenarnya direkomendasikan, penggunaan pengujian adaptif: yang menyediakan langkah-demi-langkahoptimasi pemilihan-kesulitan item saat menghasilkan tes adaptif (lihat bagian 8.4).

3. Pengujian adaptif komputer

Pengujian adaptif dan kemungkinannya. Munculnya pengujian adaptif didorong oleh keinginan untuk meningkatkan efektivitas pengukuran pedagogis, yang umumnya dikaitkan dengan pengurangan jumlah tugas, waktu, biaya pengujian, serta peningkatan akurasi penilaian siswa. Pendekatan adaptif didasarkan pada individualisasi prosedur untuk memilih item tes, yang, dengan mengoptimalkan kesulitan item dalam kaitannya dengan tingkat kesiapan siswa, memastikan generasi tes yang efektif.

Pengoptimalan kesulitan tugas biasanya dilakukan selangkah demi selangkah. Jika siswa menyelesaikan tugas dengan benar, maka dia diberi tugas yang lebih sulit. Jika tugas dilakukan secara tidak benar, mundur kembali ke tugas bank yang lebih mudah. Jika tiga tugas berturut-turut tidak selesai, prosesnya juga dihentikan dengan metode khusus (paling sering dengan bantuan teori IRT ) nilai siswa untuk tugas yang diselesaikan ditentukan sesuai dengan tes adaptif yang dibentuk khusus untuknya. Jadi, dalam presentasi adaptif komputer, jumlah tugas tes dan kesulitannya dipilih secara individual untuk setiap penguji berdasarkan jawabannya, dan serangkaian tugas individu membentuk tes adaptif. Tes adaptif dalam kelompok tes terutama terdiri dari tugas yang berbeda dan berbeda dalam jumlah dan kesulitan tugas semakin kuat, semakin besar penyebaran di antara kelompok tes dalam hal kesiapan.

Tidak mungkin untuk mendapatkan peningkatan efisiensi pengukuran secara simultan untuk semua kriteria, oleh karena itu, biasanya, ketika mengatur pengujian adaptif, seseorang muncul; terbaik, dua kriteria. Misalnya, dalam beberapa kasus, dengan diagnostik ekspres dalam mode adaptif, perhatian terbesar diberikan untuk meminimalkan waktu pengujian dan jumlah tugas yang disajikan, sementara pertanyaan tentang keakuratan perkiraan memudar ke latar belakang. Dalam kasus lain, akurasi pengukuran mungkin menjadi prioritas, dan pengujian setiap subjek berlanjut hingga Norma, hingga kesalahan pengukuran minimum yang direncanakan tercapai.

Kualitas struktur pengetahuan siswa berpengaruh signifikan terhadap lamanya tes adaptif. Biasanya, subjek dengan struktur pengetahuan yang jelas melakukan tugas dengan tingkat kesulitan yang meningkat, menyempurnakan penilaian kesiapan mereka dengan setiap tugas yang diselesaikan dengan benar. Mereka melakukan sejumlah kecil tugas pada tes adaptif dan dengan cepat mencapai ambang batas kompetensi mereka. Siswa dengan struktur pengetahuan kabur, yang bergantian jawaban benar dan salah, menerima tugas yang berfluktuasi dalam kesulitan. Proses pengujian tertunda, karena dengan lompatan dalam kesulitan tugas, tidak ada peningkatan langkah demi langkah dalam akurasi pengukuran, dan jumlah tugas yang disesuaikan untuk kesulitan sering kali ternyata lebih besar daripada di normal, tes tradisional.

Manfaat pengujian adaptif. Keuntungan penting dari pengujian adaptif terkomputerisasi meliputi:

Efisiensi tinggi;

Tingkat kerahasiaan yang tinggi;

Individualisasi kecepatan tes;

Tingkat motivasi yang tinggi untuk pengujian di antara siswa terlemah karena pengecualian dari proses menyajikan tugas-tugas sulit yang tidak perlu;

Pesan hasil dalam skala interval skor tes untuk setiap mata pelajaran segera, segera setelah akhir pekerjaannya pada serangkaian tugas yang dipilih secara individual dalam tes adaptif.

Strategi pengujian adaptif. Strategi untuk menyajikan tugas-tugas pengujian dalam pengujian adaptif dapat dibagi menjadi dua langkah dan multi-langkah, yang dengannya teknologi yang berbeda untuk membentuk tes adaptif digunakan. Strategi dua langkah melibatkan dua tahap. Pada tahap pertama, semua mata pelajaran diberikan tes input yang sama, yang tujuannya untuk melakukan diferensiasi awal siswa sepanjang sumbu variabel pengukuran. Berdasarkan hasil diferensiasi pada tahap kedua, mode adaptif diatur dan tes adaptif dibangun. :

Sebagai hasil dari perkembangan teori IRT , yang menyediakan skala interval tunggal untuk menilai parameter mata pelajaran dan kesulitan item tes, menjadi mungkin untuk mengoptimalkan prosedur pemilihan item untuk memodelkan tes adaptif yang efektif dengan cara baru: lintasan individu.

Strategi pengujian adaptif multi-langkah dibagi menjadi: bercabang tetap dan percabangan variabel tergantung pada bagaimana tes adaptif multi-langkah dirancang. Jika rangkaian tugas yang sama dengan lokasi tetapnya pada sumbu kesulitan digunakan untuk semua mata pelajaran, tetapi setiap siswa bergerak melalui rangkaian tugas secara individual, tergantung pada hasil tugas berikutnya, maka strategi pengujian adaptif adalah bercabang tetap.

Tugas menurut kesulitan dalam serangkaian tugas biasanya ditempatkan pada jarak yang sama satu sama lain atau langkah yang menurun dipilih sesuai dengan peningkatan kesulitan, yang memungkinkan Anda untuk menyesuaikan kecepatan pengujian ke subjek tes, karena saat ia selesai tugas, kelelahannya meningkat dan motivasi untuk menyelesaikan tugas tes berkurang.

Strategi variable-branching dari pengujian adaptif melibatkan pemilihan tugas langsung dari bank sesuai dengan algoritma tertentu yang memprediksi kesulitan optimal dari tugas berikutnya berdasarkan hasil kinerja subjek tes dari tugas sebelumnya dari tes adaptif. Dengan demikian, langkah demi langkah, tes adaptif diperoleh dari tugas individu. Ini bervariasi tidak hanya kesulitan, tetapi juga langkah, ditentukan oleh perbedaan kesulitan dua tugas yang berdekatan dari tes adaptif. Ciri khas dari strategi percabangan variabel dari pengujian adaptif adalah penilaian ulang langkah demi langkah tingkat kesiapan subjek tes, yang dilakukan setelah setiap tes. menjalankan tugas tes berikutnya.


Beras. 19. Algoritma pengujian multi-langkah variabel

Algoritma yang mengimplementasikan strategi variabel pengujian adaptif bersifat siklik dan memiliki bentuk yang ditunjukkan pada Gambar. 19.

Masuk dan keluar dari pengujian adaptif . Pilihan perkiraan awal untuk memasuki pengujian adaptif dilakukan dengan cara yang berbeda, tergantung pada jenis strategi dan kemampuan teknologi yang tersedia saat menghasilkan pengujian adaptif. Salah satu metode untuk menentukan perkiraan awal didasarkan pada penerbitan protes masukan kepada subjek sebelum dimulainya pengujian adaptif. Protes biasanya mencakup 5-10 tugas dari bagian konten yang tumpah, mencakup seluruh rentang lokasi yang diharapkan dari sampel siswa yang diuji pada sumbu variabel pengukuran dalam hal kesulitan. Terkadang tes masuk digantikan oleh proses adaptasi diri di mana subjek tes ditawari serangkaian tugas yang semakin sulit. Dia melakukan tugas yang mencerminkan tingkat pengetahuan dan keterampilannya.

Untuk keluar dari mode pengujian, pembatasan dikenakan pada waktu atau jumlah tugas, atau ditentukan oleh akurasi pengukuran yang direncanakan. Fokus pada akurasi dalam organisasi siklus adaptif menghasilkan berbagai lintasan individu subjek, yang dapat divisualisasikan sebagai garis putus-putus. Simpul dari garis putus-putus sesuai dengan tugas individu dari tes adaptif, panjang tautan ditentukan oleh langkah yang bervariasi, ukurannya sama dengan perbedaan antara perkiraan parameter kesulitan dari dua tugas yang berdekatan dari adaptif uji. Jelas bahwa semakin pendek panjang garis putus-putus, semakin baik struktur pengetahuan siswa dan semakin efisien mereka dipilih sesuai dengan kesulitan tugas tes adaptif (Gbr. 20).


Beras. 20. Visualisasi lintasan individu subjek: dalam lingkaran - nomor tugas

pada gambar. 20 menunjukkan lintasan pengujian adaptif tiga siswa yang mulai masuk ke mode adaptif berdasarkan hasil protes. Semakin tinggi bagian atas polyline, semakin sulit tugas pertama dari tes adaptif. Pada saat masuk dalam protes, siswa pertama menunjukkan hasil tertinggi, sehingga ia memulai pengujian adaptif dengan tugas yang lebih sulit. Untuk memudahkan pembahasan hasil visualisasi, gambar menunjukkan lintasan yang tidak berpotongan. Sebuah "plus" ditempatkan di atas garis putus-putus dalam kasus di mana subjek menyelesaikan tugas dengan benar, atau "minus" jika subjek menyelesaikan tugas dengan benar. Aturan sederhana dipilih sebagai kriteria untuk akhir pengujian: pengujian berhenti jika siswa berturut-turut menyelesaikan, dengan benar, atau salah, tiga tugas tes adaptif.

Meskipun hasil awal yang tinggi, siswa pertama tampaknya memiliki pengetahuan yang kurang terstruktur, yang mengikuti dari pergantian jawaban yang benar dan salah. Pengujian siswa pertama berhenti jika ia berhasil mengatasi tiga tugas berturut-turut dari tes adaptif. Lintasan respons siswa kedua jauh lebih pendek karena pengetahuan yang terstruktur dengan baik. Setelah gagal pada tugas pertama, dia melakukan segalanya dengan benar, dan karena itu dengan cepat menyelesaikan tes adaptif. Siswa ketiga adalah yang terlemah. Dia mulai menguji dengan tugas termudah yang tidak bisa dia tangani. Tugas kedua, lebih mudah, dia juga melakukan dengan tidak benar. Akhirnya, setelah tiga jawaban salah berturut-turut, dia keluar dari tes adaptif.

Gambar yang disajikan adalah idealisasi yang menggambarkan situasi nyata dari berbagai strategi multi-langkah untuk menghasilkan tes adaptif, di mana, setelah menyelesaikan setiap tugas, penilaian tingkat kesiapan saat ini dihitung ulang untuk memilih tugas berikutnya dari tes adaptif.

Reliabilitas, validitas dan lamanya pengujian atau pengujian adaptif. Seperti dalam pengujian tradisional, pemilihan tugas untuk pengujian adaptif dilakukan sesuai dengan spesifikasi pengujian. Mengoptimalkan kesulitan; hanya mungkin untuk mengurangi jumlah tugas yang disajikan untuk setiap bagian dan pada saat yang sama mempertahankan rencana tes yang berarti untuk setiap mata pelajaran. Dengan demikian, pengujian adaptif, terlepas dari strategi untuk menyajikan tugas dan jumlahnya, harus memastikan validitas konten yang tinggi dari setiap tes adaptif yang dihasilkan.

Keandalan dalam pengujian adaptif tergantung pada kombinasi faktor. Ini termasuk: jumlah tugas, adanya kontrol sistematis atas frekuensi pemilihan tugas bank saat menghasilkan tes adaptif. Keandalan juga dipengaruhi oleh karakteristik bank item tes yang terkait dengan kualitas pengukuran (stabilitas dan kisaran variasi dalam perkiraan kesulitan) dan kualitas kontrol input (awal).

Algoritma adaptif diatur sedemikian rupa sehingga setelah setiap presentasi tugas berturut-turut, perbedaan antara akurasi pengukuran yang diperoleh dan yang direncanakan diperiksa. Setelah mencapai akurasi yang direncanakan, algoritme pemilihan tugas ditangguhkan, dan keandalan yang diharapkan dari uji adaptif tercapai.

5.Online -testing, aplikasinya di remote

sedang belajar

Tingkat interaktivitas . Dalam pemahaman yang paling sederhana tentang mode pembelajaran interaktif, siswa memiliki kesempatan untuk menerima (membaca, menonton, mendengarkan) hanya informasi yang dia pilih untuk dipelajari menggunakan komputer. Kompleksitas kemungkinan dan teknologi untuk penerapan mode interaktif mengarah pada pemodelan dunia sekitarnya dan perilaku objek di dalamnya, memungkinkan Anda untuk mensimulasikan kenyataan.

Tentu saja, hari ini, karena berbagai alasan, tidak semua kemungkinan mode interaktif digunakan dalam pelatihan. Secara khusus, menurut A. G: Shmelev, yang merupakan spesialis terbesar di Rusia dalam penggunaan teknologi interaktif dalam pengujian pendidikan dan psikologis (sistem Teletesting), bentuk penyajian informasi pendidikan non-interaktif mendominasi di Internet modern.

Mode interaktif paling sederhana di jaringan lokal dan Internet. Sesuai dengan klasifikasi jaringan komputer menjadi lokal dan global, mode interaktif paling sederhana diatur dalam ruangan yang sama, atau lembaga pendidikan, atau menggunakan Internet. Sebagai aturan, interaktivitas didasarkan pada komunikasi asinkron, ketika reaksi guru terhadap hasil tes tertunda karena waktu yang diperlukan untuk memeriksa tes dalam mode otomatis dan menghitung nilai siswa berdasarkan hasil implementasinya.

Dalam kasus pertama, ketika beberapa puluh atau ratusan komputer terhubung ke jaringan lokal, program implementasi khusus - cangkang alat - memastikan penerbitan tugas on line -test untuk seluruh kelompok testee, biasanya dalam mode waktu individu. Di layar setiap komputer dari jaringan lokal, tugas dari salah satu opsi paralel, sebuah tes, muncul. Saat memastikan rezim keamanan informasi untuk seluruh kelompok siswa, hanya satu opsi tes yang dapat digunakan.

Eksekusi online -tes menggunakan Internet tidak memiliki perbedaan mendasar dari kasus menggunakan jaringan lokal dengan tingkat interaktivitas paling sederhana tanpa mode adaptif, ketika semua siswa melakukan opsi tes yang sama. Tugas sangat menuntut siswa untuk memilih satu atau lebih jawaban yang benar menggunakan objek dialog terkenal seperti "tombol pemilih" ( tombol radio ). Skor tes dihitung dengan membandingkan tanggapan siswa dengan kunci dan dikurangi, paling sering, menjadi penjumlahan sederhana. Transfer nilai ujian akhir dapat dilakukan melalui email.

Waktu yang dihabiskan untuk menyajikan hasil tes ditentukan oleh durasi transfer (biasanya dari beberapa detik hingga beberapa jam) dan interval waktu yang akan berlalu sampai siswa membaca surat yang datang kepadanya. Dalam beberapa kasus, ketika seorang siswa membutuhkan bukti dokumenter tentang nilai, hasil tes dapat disampaikan offline dengan menulis ke media penyimpanan. Dengan demikian, tingkat interaktivitas yang rendah cukup cocok untuk pengujian akhir di luar mode adaptif, ketika siswa harus bekerja tanpa bantuan guru, dan hasilnya mungkin tertunda dalam waktu.

Rata-rata tingkat interaktivitas dalam pengujian online.Dalam kontrol saat ini dalam pembelajaran jarak jauh, tingkat interaktivitas rata-rata biasanya diterapkan. Sesuai dengan kemungkinan pertukaran informasi sinkron secara real time dengan bantuan pager Internet, siswa diberikan bantuan dan saran dari guru saat melakukan tugas tes korektif dan diagnostik.

Dengan tingkat interaktivitas rata-rata, banyak variasi mengambil bentuk tugas tes. Secara khusus, siswa memiliki kesempatan untuk mengedit teks yang disajikan dalam tugas dengan memperkenalkan kalimat baru atau mengganti satu bagian teks dengan yang lain. Dalam tugas untuk menetapkan urutan yang benar, segera setelah subjek memilih urutan elemen tertentu, komputer menampilkan urutan baru di layar, dan seterusnya. Jika zona waktu tidak mengganggu pembentukan komunikasi sinkron, interaktif segera memberikan efek "guru ada di sekitar", karena itu siswa menerima bantuan, penilaian atau petunjuk dari guru saat melakukan tugas kontrol saat ini.

Interaktivitas tingkat tinggi dalam pengujian online.Interaktivitas tingkat tinggi disediakan dalam kasus di mana gambar suara dan video digunakan dalam interaksi dengan guru, yang membutuhkan biaya keuangan yang signifikan, tetapi dengan mudah memungkinkan Anda untuk mengidentifikasi identitas siswa yang melakukan tes di remote control.

Dari sudut pandang pedagogis, pengujian adaptif, yang mencakup teknologi bercabang untuk mengoptimalkan kesulitan tugas tergantung pada jawaban siswa untuk setiap tugas sebelumnya dari tes adaptif, sesuai dengan tingkat interaktivitas yang tinggi.

Keuntungan dari pengujian komputer adalah:

  • * Objektivitas. Faktor pendekatan subjektif dari pihak pemeriksa dikecualikan. Hasil tes diproses melalui komputer.
  • * Validitas. Faktor "lotere" dari ujian reguler dikecualikan, di mana "tiket sial" atau tugas dapat diperoleh - sejumlah besar tugas tes mencakup seluruh volume materi mata pelajaran tertentu, yang memungkinkan peserta tes untuk menunjukkan cakrawalanya lebih luas dan tidak "gagal" karena kesenjangan pengetahuan yang acak.
  • * Kesederhanaan. Pertanyaan tes lebih spesifik dan ringkas daripada tiket dan tugas ujian biasa dan tidak memerlukan jawaban atau pembenaran terperinci - cukup pilih jawaban yang benar dan buat korespondensi.
  • * Demokrasi. Semua peserta tes dalam kondisi yang sama, hasil tes transparan.
  • * Karakter massa dan durasi pendek. Kemungkinan untuk jangka waktu tertentu untuk mencakup sejumlah besar peserta tes dengan kontrol akhir. Pada saat yang sama, waktu yang tersisa harus digunakan untuk mempelajari materi baru atau mengkonsolidasikan yang lama.
  • * Kemampuan manufaktur. Melakukan ujian dalam bentuk pengujian sangat maju secara teknologi, karena memungkinkan penggunaan pemrosesan otomatis.
  • * Keandalan informasi tentang jumlah materi yang dipelajari dan tingkat asimilasinya.
  • * Keandalan. Skor tes tidak ambigu dan dapat direproduksi.
  • * Membedakan kemampuan. Karena adanya tugas dari berbagai tingkat kesulitan.
  • * Implementasi pendekatan pembelajaran individu. Pengujian individu dan pengujian sendiri pengetahuan siswa adalah mungkin.

Selain kelebihan metode komputer, ada juga kelemahannya:

1) Komunikasi antara seseorang dan komputer memiliki spesifikasinya sendiri, dan tidak semua orang tenang tentang pengujian komputer. Misalnya, jika prosedur pengujian tertunda atau isi tes tidak menarik minat seseorang, sikap positif dapat diganti dengan yang sebaliknya: mereka akan melelahkan dan mengganggu pekerjaan yang monoton dan monoton, "kebodohan" pertanyaan dan tugas. Terkadang sikap negatif terhadap pengujian komputer juga disebabkan oleh kurangnya umpan balik. Dan ketika orang yang diuji tidak menerima umpan balik, kemungkinan jawaban yang salah meningkat (Anda dapat salah memahami instruksi, mencampuradukkan kunci jawaban, dll.).

Studi khusus telah dilakukan untuk menentukan bagaimana perasaan orang tentang pengujian komputer. Ternyata beberapa orang mengalami apa yang disebut efek penghalang psikologis, dan beberapa orang mengalami efek terlalu percaya diri. Kebetulan seseorang tidak dapat mengatasi tugas sama sekali karena dia "takut" pada komputer. Dimungkinkan juga untuk memasukkan mekanisme pertahanan psikologis yang terkait dengan keengganan orang yang diuji untuk mengungkapkan dirinya, keinginan untuk menghindari kejujuran yang berlebihan atau distorsi hasil yang disengaja.

  • 2) Dalam pengujian komputer, spesialis hanya berurusan dengan hasil yang diperoleh. Mereka tidak melihat orang yang sedang diuji, tidak berkomunikasi dengannya, dan karena itu tidak memiliki informasi tambahan tentang dia, tidak dapat mengetahui jumlah pengetahuannya yang sebenarnya.
  • 3) Kontrol tes tidak memberikan kontribusi terhadap perkembangan lisan dan tulisan siswa.
  • 4) Luasnya cakupan topik dalam pengujian memiliki kelemahan. Siswa selama pengujian, tidak seperti ujian lisan atau tertulis, tidak memiliki cukup waktu untuk analisis topik yang mendalam.
  • 5) Ada unsur keacakan dalam pengujian. Misalnya, seorang siswa yang tidak menjawab pertanyaan sederhana dapat memberikan jawaban yang benar untuk pertanyaan yang lebih kompleks. Alasan untuk ini bisa menjadi kesalahan yang tidak disengaja di pertanyaan pertama, dan menebak jawaban di pertanyaan kedua. Ini mendistorsi hasil tes dan mengarah pada kebutuhan untuk memperhitungkan komponen probabilistik dalam analisisnya.
- 246.00 Kb

Saat ini, ada banyak jenis tes, sehingga hampir tidak mungkin untuk memberikan definisi universal untuk semua jenis ini.

Analisis literatur menunjukkan bahwa terdapat perbedaan rumusan konsep “tes”. Tetapi terlepas dari jenis, tujuannya, saya akan memberikan definisi tes berikut.

Tes adalah salah satu metode pengendalian pengetahuan yang memungkinkan guru untuk menetapkan pengetahuan teoritis aktual siswa dan mengevaluasinya dalam waktu yang cukup singkat. Perlu dicatat bahwa tes tidak memperhitungkan karakteristik individu seseorang.

    1. Spesifik pengujian komputer dan bentuknya

Sejak awal abad ke-21, pengujian komputer (CT) telah menjadi banyak digunakan dalam pendidikan, di mana presentasi tes, evaluasi hasil siswa dan penerbitan hasil kepada mereka dilakukan dengan menggunakan PC. Namun, seseorang harus beralih ke pengujian komputer dalam kasus di mana ada kebutuhan mendesak untuk meninggalkan tes kosong tradisional: ketika melakukan ujian untuk anak-anak penyandang cacat, dengan gangguan penglihatan atau pendengaran yang serius, dll. Tahap pembuatan tes secara teknologi dapat dilanjutkan dengan cara yang berbeda, tergantung pada termasuk dengan memasukkan tes kosong ke komputer. Sampai saat ini, ada banyak publikasi tentang pengujian komputer, perangkat lunak dan alat untuk menghasilkan dan menyajikan tes telah dikembangkan.

Pengujian komputer dapat dilakukan dalam berbagai bentuk, berbeda dalam teknologi menggabungkan tugas menjadi tes. Beberapa dari mereka belum menerima nama khusus dalam literatur tentang masalah tes.

Bentuk pertama adalah yang paling sederhana. Tes siap pakai, distandarisasi atau dimaksudkan untuk kontrol saat ini, dimasukkan ke dalam cangkang khusus, yang fungsinya dapat bervariasi dalam tingkat kelengkapan. Biasanya, selama pengujian akhir, shell memungkinkan Anda untuk mempresentasikan tugas di layar, mengevaluasi hasil kinerjanya, membentuk matriks hasil tes, memprosesnya, dan menskalakan skor utama subjek tes dengan mentransfernya ke salah satu skala standar, sehingga setiap subjek tes menerima skor dan protokol skornya sendiri untuk tugas tes.

Bentuk kedua pengujian komputer melibatkan pembuatan opsi pengujian otomatis, yang dilakukan dengan bantuan alat. Varian dibuat sebelum ujian atau langsung selama ujian dari bank item tes yang dikalibrasi dengan karakteristik statistik yang stabil. Kalibrasi dicapai melalui pekerjaan awal yang panjang pada pembentukan bank, yang parameternya diperoleh pada sampel siswa yang representatif, sebagai aturan, selama 3-4 tahun menggunakan tes kosong. Validitas isi dan paralelisme opsi dipastikan dengan pemilihan tugas yang diatur secara ketat untuk setiap opsi sesuai dengan spesifikasi pengujian.

Bentuk ketiga - pengujian adaptif komputer - didasarkan pada tes adaptif khusus. Gagasan adaptabilitas didasarkan pada pertimbangan bahwa tidak ada gunanya seorang siswa memberikan tugas-tugas tes yang dia pasti akan melakukannya dengan benar tanpa kesulitan sedikit pun atau dijamin tidak akan mengatasinya karena tingkat kesulitan yang tinggi. Oleh karena itu, diusulkan untuk mengoptimalkan kesulitan tugas, menyesuaikannya dengan tingkat kesiapan setiap mata pelajaran, dan mengurangi durasi tes dengan menghilangkan sebagian tugas.

Saat melakukan pengujian komputer, perlu memperhitungkan reaksi psikologis dan emosional siswa. Reaksi negatif biasanya menyebabkan berbagai batasan, yang terkadang dikenakan saat mengeluarkan tugas dalam pengujian komputer. Misalnya, urutan tugas disajikan tetap, atau waktu maksimum yang mungkin untuk menyelesaikan setiap tugas, setelah itu, terlepas dari keinginan subjek, tugas tes berikutnya muncul. Siswa dengan tes adaptif tidak puas dengan kenyataan bahwa mereka tidak memiliki kesempatan untuk melewatkan tugas berikutnya, melihat seluruh tes sebelum mulai mengerjakannya dan mengubah jawaban untuk tugas sebelumnya. Terkadang anak sekolah keberatan dengan pengujian komputer karena kesulitan yang muncul saat melakukan dan merekam perhitungan matematis, dll.

Untuk mengurangi pengaruh pengalaman siswa dengan komputer pada nilai ujian, disarankan untuk memasukkan instruksi khusus dan latihan untuk setiap bentuk tugas inovatif dalam cangkang untuk pengujian komputer. Penting juga untuk membiasakan siswa dengan antarmuka program terlebih dahulu, melakukan pengujian latihan dan memisahkan siswa yang tidak memiliki pengalaman yang cukup dengan PC ke dalam kelompok independen untuk melatih mereka atau memberi mereka tes kosong.

Dengan demikian, pengujian komputer bertindak sebagai alat untuk mengelola proses pendidikan, sebagai elemen umpan balik, yang memungkinkan untuk menganalisis proses pendidikan, melakukan penyesuaian, mis. melakukan kontrol penuh atas proses pembelajaran. Penggunaan konstan tes komputer sebagai kontrol perantara kemajuan mendefinisikan proses pendidikan sebagai sistem pemantauan terus menerus dan pengendalian diri siswa, yang memungkinkan guru untuk menerima "umpan balik", dan siswa kesempatan untuk memantau tingkat kesiapan mereka di seluruh seluruh pelatihan.

    1. Keuntungan dan kerugian dari pengujian komputer

Keuntungan dari pengujian komputer adalah:

Objektivitas. Faktor pendekatan subjektif dari pihak pemeriksa dikecualikan. Hasil tes diproses melalui komputer.

Keabsahan. Faktor "lotere" dari ujian reguler dikecualikan, di mana "tiket sial" atau tugas dapat diperoleh - sejumlah besar tugas tes mencakup seluruh volume materi mata pelajaran tertentu, yang memungkinkan peserta tes untuk menunjukkan cakrawalanya lebih luas dan tidak "gagal" karena kesenjangan pengetahuan yang acak.

Kesederhanaan. Pertanyaan tes lebih spesifik dan ringkas daripada tiket dan tugas ujian biasa dan tidak memerlukan jawaban atau pembenaran terperinci - cukup pilih jawaban yang benar dan buat korespondensi.

Demokrasi. Semua peserta tes dalam kondisi yang sama, hasil tes transparan.

Massa dan durasi pendek. Kemungkinan untuk jangka waktu tertentu untuk mencakup sejumlah besar peserta tes dengan kontrol akhir. Pada saat yang sama, waktu yang tersisa harus digunakan untuk mempelajari materi baru atau mengkonsolidasikan yang lama.

kemampuan manufaktur. Melakukan ujian dalam bentuk pengujian sangat maju secara teknologi, karena memungkinkan penggunaan pemrosesan otomatis.

Keandalan informasi tentang jumlah materi yang dipelajari dan tingkat asimilasinya.

Keandalan. Skor tes tidak ambigu dan dapat direproduksi.

kemampuan membedakan. Karena adanya tugas dari berbagai tingkat kesulitan.

Penerapan pendekatan individual dalam pembelajaran. Pengujian individu dan pengujian sendiri pengetahuan siswa adalah mungkin.

Selain kelebihan metode komputer, ada juga kelemahannya:

1) Komunikasi antara seseorang dan komputer memiliki spesifikasinya sendiri, dan tidak semua orang tenang tentang pengujian komputer. Misalnya, jika prosedur pengujian tertunda atau isi tes tidak menarik minat seseorang, sikap positif dapat diganti dengan yang sebaliknya: mereka akan melelahkan dan mengganggu pekerjaan yang monoton dan monoton, "kebodohan" pertanyaan dan tugas. Terkadang sikap negatif terhadap pengujian komputer juga disebabkan oleh kurangnya umpan balik. Dan ketika orang yang diuji tidak menerima umpan balik, kemungkinan jawaban yang salah meningkat (Anda dapat salah memahami instruksi, mencampuradukkan kunci jawaban, dll.).

Studi khusus telah dilakukan untuk menentukan bagaimana perasaan orang tentang pengujian komputer. Ternyata beberapa orang memiliki apa yang disebut efek penghalang psikologis, dan beberapa memiliki efek terlalu percaya diri. Kebetulan seseorang tidak dapat mengatasi tugas sama sekali karena dia "takut" pada komputer. Dimungkinkan juga untuk memasukkan mekanisme pertahanan psikologis yang terkait dengan keengganan orang yang diuji untuk mengungkapkan dirinya, keinginan untuk menghindari kejujuran yang berlebihan atau distorsi hasil yang disengaja.

2) Dalam pengujian komputer, spesialis hanya berurusan dengan hasil yang diperoleh. Mereka tidak melihat orang yang sedang diuji, tidak berkomunikasi dengannya, dan karena itu tidak memiliki informasi tambahan tentang dia, tidak dapat mengetahui jumlah pengetahuannya yang sebenarnya.

3) Kontrol tes tidak memberikan kontribusi terhadap perkembangan lisan dan tulisan siswa.

4) Luasnya cakupan topik dalam pengujian memiliki kelemahan. Siswa selama pengujian, tidak seperti ujian lisan atau tertulis, tidak memiliki cukup waktu untuk analisis topik yang mendalam.

5) Ada unsur keacakan dalam pengujian. Misalnya, seorang siswa yang tidak menjawab pertanyaan sederhana dapat memberikan jawaban yang benar untuk pertanyaan yang lebih kompleks. Alasan untuk ini bisa menjadi kesalahan yang tidak disengaja di pertanyaan pertama, dan menebak jawaban di pertanyaan kedua. Ini mendistorsi hasil tes dan mengarah pada kebutuhan untuk memperhitungkan komponen probabilistik dalam analisisnya.

bab 2 kontrol pengetahuan komputer

    1. Klasifikasi jenis tes komputer

Jelas, tugas pertama dalam menguji pengetahuan yang diperoleh harus menentukan tujuan pengendalian. Jadi di perguruan tinggi lebih perlu untuk memeriksa kedalaman pengetahuan disiplin akademik di kalangan mahasiswa, kemampuan spesialis masa depan untuk berpikir logis, membandingkan berbagai objek dan fenomena, menarik kesimpulan yang tepat dan membuat keputusan yang optimal. Ini berarti bahwa satu set (basis data) tugas kontrol harus mencakup disiplin akademik semaksimal mungkin, dan pembagian tematiknya harus memungkinkan kontrol tahap demi tahap dalam proses mempelajari subjek, mengidentifikasi kesenjangan pengetahuan individu siswa, menyesuaikan kurikulum, dll.

Tempat penting dalam pembentukan basis tugas adalah perumusannya. Seperti kalimat apa pun, tugas dibagi menjadi eksplisit dan implisit, interogatif dan afirmatif, penilaian, pendapat, dan pertanyaan lainnya. Keragaman bentuknya, yang membawa kekayaan bahasa, banyaknya istilah khusus, tergantung pada seni guru. Penggunaan tugas-tugas tersebut membantu untuk meningkatkan kemampuan siswa untuk berpikir logis, serta tingkat budaya umum mereka.

Hal penting lainnya adalah menentukan kebenaran jawaban siswa terhadap pertanyaan yang diajukan. Ada berbagai jawaban yang disertakan dalam program. Lebih disukai bahwa siswa "merespon" komputer, seolah-olah secara lisan, sebagai guru (formulir jawaban terbuka). Ada kemungkinan bahwa sistem pakar semacam itu berdasarkan basis pengetahuan yang dikembangkan secara khusus akan muncul dalam waktu dekat dengan diperkenalkannya komputer generasi kelima. Sementara itu, beberapa ahli sudah mulai membuat basis pengetahuan. Masalah yang agak menarik dan kompleks ini memiliki kelemahan utama, yang awalnya hadir di dalamnya - subjektivitas sistem, berdasarkan penilaian peristiwa dan fenomena oleh spesialis individu, meskipun terkadang sangat otoritatif. Mungkin akan sangat tepat saat ini untuk menguasai sistem kontrol komputer berdasarkan database. Dalam hal ini, mereka biasanya menggunakan berbagai bentuk jawaban yang sudah jadi - templat.[ 3 ]

Bentuk jawaban seperti itu telah menyebar luas, ketika responden ditawari serangkaian jawaban yang telah ditentukan sebelumnya untuk memilih satu atau lebih yang menurut pendapatnya benar (bentuk jawaban tertutup). Program secara otomatis mengevaluasi kebenaran pilihan yang dibuat. Dalam kasus lain, orang yang dikendalikan memasukkan dari keyboard beberapa formulasi atau kata-kata individu yang merupakan jawaban atas pertanyaan yang diajukan (bentuk jawaban setengah terbuka). Jawaban-jawaban ini tidak ditampilkan di layar komputer, tetapi program ini berisi kumpulan jawaban semaksimal mungkin, menurut pendapat penulisnya. Diyakini bahwa dalam banyak kasus program memiliki modifikasi yang diperlukan dan, setelah membuat perbandingan, ia akan dapat memberikan pendapatnya tentang kebenaran jawaban. Ada pilihan lain juga. Setiap metode pembentukan respon terkontrol memiliki kelebihan dan kekurangannya masing-masing. Di sini Anda harus mematuhi tujuan dan memilih yang paling cocok untuk implementasinya.

Dalam hal ini, dapat diusulkan untuk menggunakan satu set opsi jawaban untuk semua tugas kontrol pada topik. Rumusan harus bersifat umum dan berkontribusi pada identifikasi kemampuan berpikir logis terkontrol, yang lebih penting dan berharga daripada menghafal data faktual individu. Dengan keterampilan guru yang memadai, dengan bantuan jawaban yang dirumuskan dengan cara ini, dimungkinkan untuk menentukan pengetahuan dan fakta individu, peristiwa.

Di sekolah-sekolah di negara maju, pengenalan dan peningkatan tes berlangsung dengan cepat. Tes diagnostik kinerja sekolah telah menyebar luas, menggunakan bentuk pilihan alternatif jawaban yang benar dari beberapa yang masuk akal, menulis jawaban yang sangat singkat (mengisi celah), menambahkan huruf, angka, kata, bagian dari rumus, dll. Dengan bantuan tugas-tugas sederhana ini, dimungkinkan untuk mengumpulkan materi statistik yang signifikan, memprosesnya secara matematis, dan memperoleh kesimpulan objektif dalam batas-batas tugas yang disajikan untuk verifikasi pengujian. Tes dicetak dalam bentuk koleksi, dilampirkan pada buku teks, didistribusikan pada disket komputer. Keuntungan dan kerugian dari pengujian komputer …………………..9
Bab 2 Komputer kontrol pengetahuan………………………………………...12
2.1 Klasifikasi Jenis Tes Komputer……………………………………… 12
2.2 Persyaratan untuk sistem pengujian komputer………………………………………………………………………………………...15
2.3 Pembentukan item tes untuk kontrol komputer pengetahuan……………………………………………………………………………………………… 19
2.4 Jenis pertanyaan kontrol komputer……………………………….…..24
Bab 3 Metodologi untuk melakukan survei komputer terhadap siswa …….. ………27
3.1 Metodologi untuk melakukan survei terprogram ..…. ..……….…….27
3.2 Memproses hasil tes……………………………….….…28
Kesimpulan……………………………………………………………………………………… 30
Daftar literatur yang digunakan …………

Kebutuhan untuk menilai dan memverifikasi tingkat dan kualitas pengetahuan muncul dalam setiap aktivitas manusia. Masalah kecukupan dan validitas hasil tes menjadi lebih akut dengan penggunaan teknologi informasi yang jauh dan meluas untuk menguji dan menguji pengetahuan siswa, anak sekolah, guru dan kategori orang lain yang hasil tesnya sangat penting secara pribadi.

Kontrol tingkat pengetahuan adalah bagian penting dari proses pembelajaran. Ini memberikan umpan balik dalam sistem "pelatih-guru". Kontrol pengetahuan melakukan fungsi pengendalian, pengajaran, diagnostik, pendidikan, motivasi, dan lainnya dalam proses pendidikan. Untuk mengelola proses pembelajaran pada berbagai tahap, spesialis pembimbing harus selalu memiliki informasi tentang bagaimana siswa memahami dan mengasimilasi materi pendidikan.

Kontrol dari sudut pandang guru adalah bagian pekerjaan yang panjang dan melelahkan. Ini dapat difasilitasi dan disistematisasikan dengan menggunakan apa yang disebut perangkat lunak. Masalah penerapan fungsi-fungsi yang berhubungan dengan kontrol jatuh ke dalam tiga bidang - fungsi mempersiapkan kontrol, fungsi melakukan kontrol, dan fungsi memberikan umpan balik dalam proses pembelajaran. Seperangkat alat yang terkait dengan logika dan ide dapat membentuk sistem alat. Penggunaan sistem kontrol instrumental komputer bertindak sebagai sarana untuk menerapkan sistem kontrol komputer.

Anda dapat mengontrol aktivitas siswa dengan adanya tes kontrol khusus. Tes adalah jenis tugas khusus yang memungkinkan Anda untuk dengan cepat mengontrol tingkat asimilasi pengetahuan dan perolehan keterampilan dan kemampuan oleh siswa di kelas pelatihan teoretis dan industri secara kelompok, untuk membangun umpan balik internal dan eksternal, atas dasar dimana siswa dan guru menjalankan fungsi mengelola proses pembelajaran. Pengujian telah lama muncul dalam pedagogi sebagai metode pengendalian pengetahuan.

Saat ini sudah banyak program komputer yang berfungsi untuk pengujian. Ada banyak produk (termasuk yang multimedia) dengan tugas pengujian yang sudah jadi, serta program shell untuk membuat pengujian sendiri. Ada sejumlah program instrumental yang dibuat oleh spesialis dalam dan luar negeri. Tes komputer yang dikembangkan atas dasar mereka memiliki sifat yang melekat dalam sistem seperti: kemampuan beradaptasi, keterbukaan, standarisasi, kemungkinan perluasan dan perluasannya, kemampuan untuk melatih kontrol individu dan kelompok pengetahuan siswa, dll. Sistem tes, karena fleksibilitasnya, adalah dukungan otomatis untuk pekerjaan mandiri siswa, memungkinkan untuk melakukan kontrol dan pengendalian diri dari tingkat asimilasi materi, untuk bertindak sebagai simulator dalam persiapan ujian.

Bab 1 Pengujian Komputer

1.1 Inti dari konsep "Uji"

Untuk memahami esensi tes, penting untuk memahami sistem konsep. Konsep secara umum membentuk dasar dari ilmu apapun, dan dalam pengertian ini, aktivitas mengembangkan dan menerapkan tes secara efektif tidak terkecuali. Mulai dari tahun 1930-an, ilmu tes disebut borjuis, yang semua tujuannya dianggap "reaksioner". Dan meskipun penilaian tersebut sekarang dianggap tidak memadai untuk semangat zaman kita, namun ada publikasi di mana mereka masih mencoba untuk menolak karakter ilmiah untuk tes.

Karya ilmiah pertama tentang teori tes muncul pada awal abad kedua puluh, di persimpangan psikologi, sosiologi, pedagogi, dan apa yang disebut ilmu perilaku lainnya. Psikolog asing menyebut ini psikometri sains, dan guru - pengukuran pedagogis. Karena belum ada nama umum dalam bahasa Rusia, penulis menyebut testologi sains ini, yang dapat bersifat pedagogis, psikologis atau sosiologis, tergantung di mana ia diterapkan dan dikembangkan. Tidak tertutup oleh ideologi dan politik, interpretasi nama "testologi" sederhana dan transparan: ilmu tentang tes. Pada abad ke-21, Avanesov membawa nama ilmu ini sesuai dengan namanya di Barat - Pengukuran pedagogis.

Mari kita membahas definisi konsep "tes", karena saat ini digunakan dalam jangkauan yang luas.

Tes (tes bahasa Inggris - tes, tes, penelitian) adalah metode eksperimental dalam psikologi dan pedagogi, tugas standar yang memungkinkan Anda mengukur karakteristik psikofisiologis dan pribadi, serta pengetahuan, keterampilan, dan kemampuan subjek.

Tes mulai digunakan pada tahun 1864 oleh J. Fisher di Inggris untuk menguji pengetahuan siswa. Landasan teoretis pengujian dikembangkan oleh psikolog Inggris F. Galton pada tahun 1883: penerapan serangkaian tes identik untuk sejumlah besar individu, pemrosesan statistik hasil, dan pemilihan standar evaluasi.

Istilah "tes" pertama kali diperkenalkan oleh psikolog Amerika J. Cattell pada tahun 1890. Serangkaian 50 tes yang dia usulkan sebenarnya adalah program untuk menentukan karakteristik psikofisiologis primitif berdasarkan eksperimen psikologis paling maju saat itu (misalnya, mengukur kekuatan tangan kanan dan kiri dengan dinamometer, kecepatan reaksi terhadap suara, dll.).

Kata "tes" membangkitkan berbagai ide. Beberapa percaya bahwa ini adalah pertanyaan atau tugas dengan satu jawaban siap pakai yang harus ditebak. Yang lain melihat tes sebagai bentuk permainan atau kesenangan. Yang lain lagi mencoba menafsirkan ini sebagai terjemahan dari kata bahasa Inggris "test", (test, test, check). Secara umum, tidak ada konsensus tentang masalah ini. Selain itu, buku teks pedagogi tidak menulis tentang ini. Dan jika mereka menulis di suatu tempat, seringkali sulit untuk memahami apa yang tertulis. Bukan kebetulan bahwa rentang pendapat tentang tes ternyata terlalu luas: dari penilaian kesadaran biasa hingga upaya interpretasi ilmiah tentang esensi tes.

Dalam sains, ada perbedaan yang signifikan antara terjemahan sederhana dari sebuah kata dan arti dari sebuah konsep. Paling sering, kita bertemu dengan persepsi yang disederhanakan tentang konsep "tes" sebagai pilihan sederhana dari satu jawaban dari beberapa yang diajukan ke tugas. Banyak contoh "tes" yang tampaknya mudah ditemukan di surat kabar dan majalah, di berbagai kompetisi dan di berbagai publikasi buku yang disebut "Tes". Tetapi bahkan ini seringkali bukan ujian, tetapi sesuatu yang secara lahiriah mirip dengan mereka. Biasanya ini adalah kumpulan pertanyaan dan tugas yang dirancang untuk memilih satu jawaban yang benar dari yang ditawarkan. Mereka hanya sekilas mirip dengan tes yang sebenarnya. Perbedaan pemahaman esensi tes menimbulkan perbedaan sikap terhadap tes.

Apa kata-kata dari konsep "TEST" dalam kamus?

Kamus Ensiklopedis Besar. Tes (eng. tes - sampel, tes, studi):

1) dalam psikologi dan pedagogi - tugas standar, yang hasilnya digunakan untuk menilai karakteristik psikofisiologis dan pribadi, serta pengetahuan, keterampilan, dan kemampuan subjek;

2) dalam fisiologi dan kedokteran - efek percobaan pada tubuh untuk mempelajari berbagai proses fisiologis di dalamnya, serta untuk menentukan keadaan fungsional organ individu, jaringan dan tubuh secara keseluruhan;

3) dalam teknologi komputer - tugas kontrol untuk memeriksa operasi komputer yang benar;

4) dalam pengenalan pola, seperangkat fitur yang saling bergantung secara fungsional yang mencirikan suatu gambar (kelas).

Kamus penjelasan modern dari bahasa Rusia T.F. Efremova. Uji:

1) tugas, tes bentuk standar, berdasarkan hasil yang dapat menilai kemampuan, kecenderungan, dll. seseorang untuk sesuatu, serta tentang pengetahuan, keterampilan subjek;

2) metode penelitian, diagnostik, yang terdiri dari efek percobaan pada tubuh (dalam fisiologi, kedokteran);

3) kuesioner yang digunakan dalam penelitian sosiologi.

4) masalah dengan solusi yang diketahui, dirancang untuk memeriksa pengoperasian komputer yang benar (dalam teknologi komputer).

Kamus penjelasan bahasa Rusia D.N. Ushakov. Tes (tes bahasa Inggris) (psych.):

Tes psikoteknik, yang terdiri dari fakta bahwa subjek diminta untuk menyelesaikan satu atau lebih tugas untuk menentukan satu atau lebih kemampuannya (memori, perhatian, kecepatan reaksi, dll.).

Saat ini, ada banyak jenis tes, sehingga hampir tidak mungkin untuk memberikan definisi universal untuk semua jenis ini.

Analisis literatur menunjukkan bahwa terdapat perbedaan rumusan konsep “tes”. Tetapi terlepas dari jenis, tujuannya, saya akan memberikan definisi tes berikut: metodologi persyaratan pengujian komputer

Tes adalah salah satu metode pengendalian pengetahuan yang memungkinkan guru untuk menetapkan pengetahuan teoritis aktual siswa dan mengevaluasinya dalam waktu yang cukup singkat. Perlu dicatat bahwa tes tidak memperhitungkan karakteristik individu seseorang.

1.2 Spesifik pengujian komputer dan bentuknya

Sejak awal abad ke-21, pengujian komputer (CT) telah menjadi banyak digunakan dalam pendidikan, di mana presentasi tes, evaluasi hasil siswa dan penerbitan hasil kepada mereka dilakukan dengan menggunakan PC. Namun, seseorang harus beralih ke pengujian komputer dalam kasus di mana ada kebutuhan mendesak untuk meninggalkan tes kosong tradisional: ketika melakukan ujian untuk anak-anak penyandang cacat, dengan gangguan penglihatan atau pendengaran yang serius, dll. Tahap pembuatan tes secara teknologi dapat dilanjutkan dengan cara yang berbeda, tergantung pada termasuk dengan memasukkan tes kosong ke komputer. Sampai saat ini, ada banyak publikasi tentang pengujian komputer, perangkat lunak dan alat untuk menghasilkan dan menyajikan tes telah dikembangkan.

Pengujian komputer dapat dilakukan dalam berbagai bentuk, berbeda dalam teknologi menggabungkan tugas menjadi tes. Beberapa dari mereka belum menerima nama khusus dalam literatur tentang masalah tes.

Bentuk pertama adalah yang paling sederhana. Tes siap pakai, distandarisasi atau dimaksudkan untuk kontrol saat ini, dimasukkan ke dalam cangkang khusus, yang fungsinya dapat bervariasi dalam tingkat kelengkapan. Biasanya, selama pengujian akhir, shell memungkinkan Anda untuk mempresentasikan tugas di layar, mengevaluasi hasil kinerjanya, membentuk matriks hasil tes, memprosesnya, dan menskalakan skor utama subjek tes dengan mentransfernya ke salah satu skala standar, sehingga setiap subjek tes menerima skor dan protokol skornya sendiri untuk tugas tes.

Bentuk kedua pengujian komputer melibatkan pembuatan opsi pengujian otomatis, yang dilakukan dengan bantuan alat. Varian dibuat sebelum ujian atau langsung selama ujian dari bank item tes yang dikalibrasi dengan karakteristik statistik yang stabil. Kalibrasi dicapai melalui pekerjaan awal yang panjang pada pembentukan bank, yang parameternya diperoleh pada sampel siswa yang representatif, sebagai aturan, selama 3-4 tahun menggunakan tes kosong. Validitas isi dan paralelisme opsi dipastikan dengan pemilihan tugas yang diatur secara ketat untuk setiap opsi sesuai dengan spesifikasi pengujian.

Bentuk ketiga - pengujian adaptif komputer - didasarkan pada tes adaptif khusus. Gagasan adaptabilitas didasarkan pada pertimbangan bahwa tidak ada gunanya seorang siswa memberikan tugas-tugas tes yang dia pasti akan melakukannya dengan benar tanpa kesulitan sedikit pun atau dijamin tidak akan mengatasinya karena tingkat kesulitan yang tinggi. Oleh karena itu, diusulkan untuk mengoptimalkan kesulitan tugas, menyesuaikannya dengan tingkat kesiapan setiap mata pelajaran, dan mengurangi durasi tes dengan menghilangkan sebagian tugas.

Dalam melakukan pengujian komputer perlu memperhatikan reaksi psikologis dan emosional siswa.Reaksi negatif biasanya menimbulkan berbagai batasan yang terkadang dikenakan pada saat mengeluarkan tugas dalam pengujian komputer. Misalnya, urutan tugas disajikan tetap, atau waktu maksimum yang mungkin untuk menyelesaikan setiap tugas, setelah itu, terlepas dari keinginan subjek, tugas tes berikutnya muncul. Siswa dengan tes adaptif tidak puas dengan kenyataan bahwa mereka tidak memiliki kesempatan untuk melewatkan tugas berikutnya, melihat seluruh tes sebelum mulai mengerjakannya dan mengubah jawaban untuk tugas sebelumnya. Terkadang anak sekolah keberatan dengan pengujian komputer karena kesulitan yang muncul saat melakukan dan merekam perhitungan matematis, dll.

Untuk mengurangi pengaruh pengalaman siswa dengan komputer pada nilai ujian, disarankan untuk memasukkan instruksi khusus dan latihan untuk setiap bentuk tugas inovatif dalam cangkang untuk pengujian komputer. Penting juga untuk membiasakan siswa dengan antarmuka program terlebih dahulu, melakukan pengujian latihan dan memisahkan siswa yang tidak memiliki pengalaman yang cukup dengan PC ke dalam kelompok independen untuk melatih mereka atau memberi mereka tes kosong.

Dengan demikian, pengujian komputer bertindak sebagai alat untuk mengelola proses pendidikan, sebagai elemen umpan balik, yang memungkinkan untuk menganalisis proses pendidikan, melakukan penyesuaian, mis. melakukan kontrol penuh atas proses pembelajaran. Penggunaan konstan tes komputer sebagai kontrol perantara kemajuan mendefinisikan proses pendidikan sebagai sistem kontrol berkelanjutan dan pengendalian diri siswa, yang memungkinkan guru untuk menerima "umpan balik", dan siswa kesempatan untuk memantau tingkat kesiapan mereka di seluruh seluruh pelatihan.

1.3 Keuntungan dan kerugian dari pengujian komputer

Keuntungan dari pengujian komputer adalah:

Objektivitas. Faktor pendekatan subjektif dari pihak pemeriksa dikecualikan. Pengolahan hasil tes dilakukan melalui komputer;

Keabsahan. Faktor "lotere" dari ujian reguler dikecualikan, yang bisa mendapatkan "tiket sial" atau tugas - sejumlah besar tugas tes mencakup seluruh volume materi mata pelajaran tertentu, yang memungkinkan peserta tes menunjukkan cakrawala mereka lebih luas dan tidak “gagal” karena kesenjangan pengetahuan yang acak;

Kesederhanaan. Pertanyaan tes lebih spesifik dan ringkas daripada tiket dan tugas ujian biasa dan tidak memerlukan jawaban atau pembenaran terperinci - cukup memilih jawaban yang benar dan membuat korespondensi;

Demokrasi. Semua peserta tes dalam kondisi yang sama, hasil tes transparan;

Massa dan durasi pendek. Kemungkinan untuk jangka waktu tertentu untuk mencakup sejumlah besar peserta tes dengan kontrol akhir. Pada saat yang sama, waktu yang tersisa harus digunakan untuk mempelajari materi baru atau mengkonsolidasikan yang lama;

kemampuan manufaktur. Melakukan ujian dalam bentuk pengujian sangat maju secara teknologi, karena memungkinkan penggunaan pemrosesan otomatis;

Keandalan informasi tentang jumlah materi yang dipelajari dan tingkat asimilasinya;

Keandalan. Skor tes tidak ambigu dan dapat direproduksi;

kemampuan membedakan. Karena adanya tugas dari berbagai tingkat kesulitan;

Penerapan pendekatan individual dalam pembelajaran. Pengujian individu dan pengujian sendiri pengetahuan siswa adalah mungkin.

Selain kelebihan metode komputer, ada juga kelemahannya:

    Komunikasi antara seseorang dan komputer memiliki spesifikasinya sendiri, dan tidak semua orang sama tenangnya dengan pengujian komputer. Misalnya, jika prosedur pengujian tertunda atau isi tes tidak menarik minat seseorang, sikap positif dapat diganti dengan yang sebaliknya: mereka akan melelahkan dan mengganggu pekerjaan yang monoton dan monoton, "kebodohan" pertanyaan dan tugas. Terkadang sikap negatif terhadap pengujian komputer juga disebabkan oleh kurangnya umpan balik. Dan ketika orang yang diuji tidak menerima umpan balik, kemungkinan jawaban yang salah meningkat (Anda dapat salah memahami instruksi, mencampuradukkan kunci jawaban, dll.).

Studi khusus telah dilakukan untuk menentukan bagaimana perasaan orang tentang pengujian komputer. Ternyata beberapa orang memiliki apa yang disebut efek penghalang psikologis, dan beberapa memiliki efek terlalu percaya diri. Kebetulan seseorang tidak dapat mengatasi tugas sama sekali karena dia "takut" pada komputer. Dimungkinkan juga untuk memasukkan mekanisme pertahanan psikologis yang terkait dengan keengganan orang yang diuji untuk mengungkapkan dirinya, keinginan untuk menghindari kejujuran yang berlebihan atau distorsi hasil yang disengaja;

    Dengan pengujian komputer, spesialis hanya menangani hasil yang diperoleh. Mereka tidak melihat orang yang diuji, tidak berkomunikasi dengannya, dan karena itu tidak memiliki informasi tambahan tentang dia, tidak dapat mengetahui jumlah pengetahuannya yang sebenarnya;

    Kontrol tes tidak berkontribusi pada pengembangan pidato lisan dan tertulis siswa;

    Luasnya cakupan topik dalam pengujian memiliki sisi negatifnya. Siswa selama pengujian, tidak seperti ujian lisan atau tertulis, tidak memiliki cukup waktu untuk analisis topik yang mendalam;

    Ada unsur keacakan dalam pengujian. Misalnya, seorang siswa yang tidak menjawab pertanyaan sederhana dapat memberikan jawaban yang benar untuk pertanyaan yang lebih kompleks. Alasan untuk ini bisa menjadi kesalahan yang tidak disengaja di pertanyaan pertama, dan menebak jawaban di pertanyaan kedua. Ini mendistorsi hasil tes dan mengarah pada kebutuhan untuk memperhitungkan komponen probabilistik dalam analisisnya.

Bab 2. Kontrol komputer atas pengetahuan

2.1 Klasifikasi jenis tes komputer

Jelas, tugas pertama dalam menguji pengetahuan yang diperoleh harus menentukan tujuan pengendalian. Jadi di perguruan tinggi lebih perlu untuk memeriksa kedalaman pengetahuan disiplin akademik di kalangan mahasiswa, kemampuan spesialis masa depan untuk berpikir logis, membandingkan berbagai objek dan fenomena, menarik kesimpulan yang tepat dan membuat keputusan yang optimal. Ini berarti bahwa set (basis data) tugas kontrol harus mencakup disiplin akademik semaksimal mungkin, dan pembagian tematiknya harus memungkinkan kontrol langkah demi langkah dalam proses mempelajari subjek, mengidentifikasi kesenjangan pengetahuan individu siswa, menyesuaikan kurikulum, dll.

Tempat penting dalam pembentukan basis tugas adalah perumusannya. Seperti kalimat apa pun, tugas dibagi menjadi eksplisit dan implisit, interogatif dan afirmatif, penilaian, pendapat, dan pertanyaan lainnya. Keragaman bentuknya, yang membawa kekayaan bahasa, banyaknya istilah khusus, tergantung pada seni guru. Penggunaan tugas-tugas tersebut membantu untuk meningkatkan kemampuan siswa untuk berpikir logis, serta tingkat budaya umum mereka.

Hal penting lainnya adalah menentukan kebenaran jawaban siswa terhadap pertanyaan yang diajukan. Ada berbagai jawaban yang disertakan dalam program. Lebih disukai bahwa siswa "merespon" komputer, seolah-olah secara lisan, sebagai guru (formulir jawaban terbuka). Ada kemungkinan bahwa sistem pakar semacam itu berdasarkan basis pengetahuan yang dikembangkan secara khusus akan muncul dalam waktu dekat dengan diperkenalkannya komputer generasi kelima. Sementara itu, beberapa ahli sudah mulai membuat basis pengetahuan. Masalah yang agak menarik dan kompleks ini memiliki kelemahan utama, yang awalnya hadir di dalamnya - subjektivitas sistem, berdasarkan penilaian peristiwa dan fenomena oleh spesialis individu, meskipun terkadang sangat otoritatif. Mungkin akan sangat tepat saat ini untuk menguasai sistem kontrol komputer berdasarkan database. Dalam hal ini, mereka biasanya menggunakan berbagai bentuk jawaban yang sudah jadi - templat.

Bentuk jawaban seperti itu telah menyebar luas, ketika responden ditawari serangkaian jawaban yang telah ditentukan sebelumnya untuk memilih satu atau lebih yang menurut pendapatnya benar (bentuk jawaban tertutup). Program secara otomatis mengevaluasi kebenaran pilihan yang dibuat. Dalam kasus lain, orang yang dikendalikan memasukkan dari keyboard beberapa formulasi atau kata-kata individu yang merupakan jawaban atas pertanyaan yang diajukan (bentuk jawaban setengah terbuka). Jawaban-jawaban ini tidak ditampilkan di layar komputer, tetapi program ini berisi kumpulan jawaban semaksimal mungkin, menurut pendapat penulisnya. Diyakini bahwa dalam banyak kasus program memiliki modifikasi yang diperlukan dan, setelah membuat perbandingan, ia akan dapat memberikan pendapatnya tentang kebenaran jawaban. Ada pilihan lain juga. Masing-masing metode pembentukan respon terhadap mata pelajaran memiliki kelebihan dan kekurangannya masing-masing. Di sini Anda harus mematuhi tujuan dan memilih yang paling cocok untuk implementasinya.

Dalam hal ini, dapat diusulkan untuk menggunakan satu set opsi jawaban untuk semua tugas kontrol pada topik. Rumusan harus bersifat umum dan berkontribusi pada identifikasi kemampuan untuk mengendalikan pemikiran logis, yang lebih penting dan berharga daripada menghafal data faktual individu. Dengan keterampilan guru yang memadai, dengan bantuan jawaban yang dirumuskan dengan cara ini, dimungkinkan untuk menentukan pengetahuan dan fakta individu, peristiwa.

Di sekolah-sekolah di negara maju, pengenalan dan peningkatan tes berlangsung dengan cepat. Tes diagnostik kinerja sekolah telah menyebar luas, menggunakan bentuk pilihan alternatif jawaban yang benar dari beberapa yang masuk akal, menulis jawaban yang sangat singkat (mengisi celah), menambahkan huruf, angka, kata, bagian dari rumus, dll. Dengan bantuan tugas-tugas sederhana ini, dimungkinkan untuk mengumpulkan materi statistik yang signifikan, memprosesnya secara matematis, dan memperoleh kesimpulan objektif dalam batas-batas tugas yang disajikan untuk verifikasi pengujian. Tes dicetak dalam bentuk koleksi, dilampirkan pada buku teks, didistribusikan pada disket komputer.

Tes belajar diterapkan pada semua tahap proses didaktik. Dengan bantuan mereka, kontrol awal, saat ini, tematik dan akhir dari pengetahuan, keterampilan, akuntansi untuk kinerja akademik, prestasi akademik disediakan secara efektif.

Tes pembelajaran semakin merambah ke praktik massal. Saat ini, survei jangka pendek semua siswa di setiap pelajaran menggunakan tes digunakan oleh hampir semua guru. Keuntungan dari pemeriksaan tersebut adalah bahwa seluruh kelas sibuk dan produktif pada saat yang sama, dan dalam beberapa menit Anda bisa mendapatkan gambaran tentang pembelajaran semua siswa. Ini memaksa mereka untuk mempersiapkan setiap pelajaran, untuk bekerja secara sistematis, yang memecahkan masalah efisiensi dan kekuatan pengetahuan yang diperlukan. Saat memeriksa, pertama-tama, kesenjangan dalam pengetahuan ditentukan, yang sangat penting untuk pembelajaran mandiri yang produktif. Pekerjaan individu dan berbeda dengan siswa untuk mencegah kegagalan akademik juga didasarkan pada pengujian yang sedang berlangsung.

Secara alami, tidak semua karakteristik asimilasi yang diperlukan dapat diperoleh melalui pengujian. Misalnya, indikator seperti kemampuan mengkonkretkan jawaban dengan contoh, pengetahuan tentang fakta, kemampuan mengungkapkan pikiran secara runtut, logis dan meyakinkan, beberapa karakteristik lain dari pengetahuan, keterampilan, dan kemampuan tidak dapat didiagnosis dengan tes. Ini berarti bahwa pengujian harus dikombinasikan dengan bentuk dan metode pengujian (tradisional) lainnya. Bertindak dengan benar guru-guru yang, dengan menggunakan tes tertulis, memungkinkan siswa untuk membenarkan jawaban mereka secara verbal. Dalam kerangka teori tes klasik, tingkat pengetahuan mata pelajaran dinilai dengan menggunakan skor individu mereka, diubah menjadi indikator turunan tertentu. Ini memungkinkan Anda untuk menentukan posisi relatif setiap subjek dalam sampel normatif.

Pendekatan lain untuk membuat tes dan menafsirkan hasil eksekusi mereka disajikan dalam apa yang disebut modern teori pengukuran pedagogis- Item Response Theory (IRT), yang banyak dikembangkan pada tahun 60-an - 80-an di sejumlah negara Barat. Studi terbaru ke arah ini termasuk karya-karya B.C. Avanesova, V.P. Bespalko, L.V. Makarova, V.I. Mikheeva, B.U. Rodionova, A.O. Tatura, V.S. Cherepanova, D.V. Lyusina, M.B. Chelyshkova, T.N. Rodygina. E.N. Lebedeva dan lainnya.

Keuntungan paling signifikan dari IRT termasuk mengukur nilai parameter subjek tes dan item tes pada skala yang sama, yang memungkinkan Anda untuk mengkorelasikan tingkat pengetahuan subjek tes apa pun dengan ukuran kesulitan setiap item tes. . Kritik terhadap tes secara intuitif menyadari ketidakmungkinan mengukur secara akurat pengetahuan mata pelajaran dari berbagai tingkat pelatihan menggunakan tes yang sama. Inilah salah satu alasan mengapa, dalam praktiknya, mereka biasanya mencoba membuat tes yang dirancang untuk mengukur pengetahuan mata pelajaran yang paling banyak, tingkat kesiapan rata-rata. Secara alami, dengan orientasi tes seperti itu, pengetahuan subjek kuat dan lemah diukur dengan akurasi yang lebih rendah.

Di luar negeri, dalam praktik pengendalian, yang disebut tes sukses, yang mencakup beberapa lusin tugas. Secara alami, ini memungkinkan Anda untuk lebih memahami semua bagian utama kursus. Ada dua jenis tugas yang digunakan:

a) mengharuskan siswa untuk menyusun jawaban secara mandiri (tugas dengan tipe jawaban konstruktif);

b) tugas dengan tipe jawaban selektif. Dalam kasus terakhir, siswa memilih dari antara jawaban yang disajikan, yang dianggapnya benar.

Penting untuk dicatat bahwa jenis tugas ini tunduk pada kritik yang signifikan. Perlu dicatat bahwa tugas dengan jenis jawaban yang konstruktif mengarah pada penilaian yang bias. Jadi, penguji yang berbeda dan seringkali bahkan penguji yang sama memberikan nilai yang berbeda untuk jawaban yang sama. Selain itu, semakin banyak kebebasan yang dimiliki siswa dalam menjawab, semakin banyak pilihan untuk mengevaluasi guru.

Saat membuat tes kontrol pengetahuan, Anda dapat dipandu oleh klasifikasi jenis tes lainnya. Biasanya mereka dibagi menjadi:

    tes "prestasi";

    tes "prestasi" standar;

    tes kecerdasan;

    tes kecenderungan;

    tes prediksi;

    tes berorientasi kriteria;

    tes bakat.

Klasifikasi lain yang ada praktis direduksi menjadi jenis yang disebutkan di atas. Selanjutnya, ketika membuat pilihan, perlu untuk fokus pada ketentuan pedagogis, yang menurutnya sistem kontrol harus dapat diterima untuk menguji pengetahuan profesional. Pengisian isinya harus berfungsi untuk menentukan baik tingkat kecerdasan maupun kemampuan yang dikuasai dalam bidang pengetahuan tertentu. Bentuk prosedur verifikasi harus mencakup pemantauan individu dan/atau kelompok.

Seperti yang telah ditunjukkan oleh penelitian, adalah paling bijaksana untuk menggunakan pendekatan berorientasi kriteria untuk menguji siswa.jenistes.

Tes Berbasis Kriteria memungkinkan kontrol program individu dan kolektif yang lebih lengkap dari jumlah pengetahuan yang diperoleh; menerima skor yang memungkinkan Anda untuk membandingkan tingkat pengetahuan siswa baik dalam kelompok yang terpisah maupun di antara mereka; mengidentifikasi hasil yang dicapai oleh setiap individu siswa selama tes dalam berbagai nilai (poin).

Ketertarikan pada jenis tes ini juga disebabkan oleh fakta bahwa dengan bantuannya dimungkinkan untuk mengidentifikasi tingkat pengetahuan siswa sesuai dengan yang telah ditentukan, umum untuk semua volume dan isi materi pendidikan. Pada saat yang sama, dua komponen dari jenis tes ini terlihat jelas. Di satu sisi, kemungkinan memperoleh data tentang pengetahuan individu setiap siswa, di sisi lain, kemungkinan membandingkan data yang diperoleh dalam berbagai kelompok belajar, asalkan lingkungan pengujian yang memadai diciptakan.

Pada akhirnya, penting untuk menentukan apa yang masing-masing siswa ketahui dan dapat lakukan, bukan apa yang dia lakukan pada level siswa lain. Konten (konten) tes yang terbentuk dengan baik memastikan bahwa setiap siswa menerima peringkat (indikator integral individu), pada saat yang sama memberi guru data yang mencirikan kemampuan siswa mana pun untuk belajar dibandingkan dengan teman-temannya. Dengan demikian, adalah mungkin untuk berhasil mengimplementasikan kedua masalah ini secara bersamaan. Kinerja siswa dalam tes tidak dinilai sesuai dengan norma tertentu, tetapi ditentukan oleh tingkat penguasaan disiplin yang ditunjukkan dalam tes, pencapaian tingkat kinerja tertentu dari tugas yang diusulkan. Jadi, dengan bantuan tes-tes ini, adalah mungkin untuk mengidentifikasi tingkat pengetahuan masing-masing siswa dari tugas-tugas individu dan bagian-bagian dari kurikulum; titik (tinggi) asimilasi mereka terhadap suatu disiplin ilmu tertentu.

2.2 Persyaratan untuk sistem pengujian berbantuan komputer

Baru-baru ini, sejumlah besar berbagai perangkat lunak untuk mengembangkan tes dan pengujian telah ditawarkan untuk menarik perhatian para guru. Namun, banyak dari mereka tidak dapat menerapkan persyaratan modern untuk kualitas bahan kontrol pedagogis (PCM), karena sendiri tidak memenuhi persyaratan untuk sistem pengujian komputer:

    kemungkinan menggunakan empat bentuk tugas tes pedagogis klasik;

    memperoleh dan mengumpulkan matriks profil respons subjek untuk penilaian dikotomis dan politomik dari hasil tugas;

    penyesuaian dan penataan kembali tugas tes tergantung pada hasil pengolahan statistik hasil tes;

    perlindungan matriks yang dihasilkan dari akses yang tidak sah.

Selain itu, dari sudut pandang seorang guru mata pelajaran, saya ingin memiliki fitur berikut dalam sistem pengujian komputer:

    penggunaan teknologi multimedia dalam pengujian. Di sebagian besar cangkang uji, tugas disajikan dalam bentuk teks (terkadang menggunakan grafik). Sistem pengujian multimedia menggabungkan teks, grafik, animasi, dan materi video dalam kombinasi yang paling efektif dan secara bersamaan menggunakan semua saluran komunikasi untuk mengirimkan informasi: teks, gambar, dan suara. Pilihan pertanyaan dan jawaban yang terdengar memungkinkan Anda untuk mengecualikan kesalahan subjek jika salah membaca tugas; dan dalam disiplin ilmu yang berkaitan dengan studi bahasa asing, penyampaian materi dalam bentuk audio adalah wajib. Grafik (gambar, diagram, foto) dapat dimasukkan dalam rumusan pertanyaan dan pilihan jawaban. Dalam hal ini, jawaban grafis dapat direpresentasikan dengan memilih area tertentu di layar (misalnya, area pada grafik fungsi, titik, atau fungsi). Kebenaran atau kesalahan jawaban yang dipilih oleh subjek juga dapat direpresentasikan secara grafis. Penggunaan grafik animasi, klip video memungkinkan untuk membuat tugas untuk menentukan urutan tindakan lebih visual, untuk mendemonstrasikan perkembangan situasi tergantung pada jawaban yang dipilih oleh subjek, dll.;

    penggunaan tugas tes semu, misalnya, rantai, teks, situasional dan bahkan non-tes, misalnya, teka-teki silang, teka-teki, dll .;

    penggunaan tes yang disiapkan tidak hanya untuk kontrol, tetapi juga untuk kontrol diri dari pengetahuan. Dalam hal ini, setelah menyelesaikan tes seperti itu, siswa menerima informasi tentang keberhasilan tindakannya, dan setelah kontrol diri berakhir, ia dapat kembali ke tugas yang memberikan jawaban yang salah dan mencoba menjawab lagi. Dengan demikian, unsur pelatihan akan dilaksanakan;

    penggunaan algoritma pengujian adaptif yang menentukan pilihan tugas berikutnya tergantung pada jawaban peserta tes atas pertanyaan sebelumnya;

    penggunaan tautan hypertext dalam mode kontrol diri dan pelatihan;

    pengujian dalam versi jaringan.

Fitur tambahan yang tercantum di atas akan memperluas cakupan sistem pengujian komputer.

Salah satu faktor yang menentukan keberhasilan pembuatan tes adalah pemilihan perangkat keras dan perangkat lunak yang tepat.

Istilah "alat bantu mengajar teknis" muncul di paruh kedua tahun 60-an. dan dipahami sebagai sistem, kompleks, perangkat dan peralatan yang digunakan untuk penyajian dan pemrosesan informasi dalam proses pembelajaran untuk meningkatkan efektivitasnya. Menurut tujuan fungsionalnya, mereka biasanya dibagi menjadi tiga kelas utama: informasi, kontrol, pelatihan. Teknik pengendalian alat peraga dirancang untuk menentukan derajat dan kualitas asimilasi materi pendidikan. Konsep informatisasi pendidikan di negara kita mendefinisikan komputer sebagai bahan utama dasar pendidikan modern, sarana teknis utamanya.

Parameter komputer yang digunakan sangat menentukan kemungkinan kontrol yang efektif dari pengetahuan siswa. Ciri-ciri terbaik dalam operasional di perguruan tinggi tanah air ditunjukkan oleh PC universal atau komputer yang dapat menggabungkan kemampuan hampir semua jenis alat peraga teknis. Keuntungan penting dari PC termasuk kemampuannya untuk menciptakan kondisi bagi siswa untuk membuat keputusan independen, mis. untuk mengindividualisasikan proses pembelajaran dengan membuat program komputer adaptif. Mereka memungkinkan Anda untuk berhasil mengotomatisasi proses pendidikan, termasuk prosedur kontrol pengetahuan. Menurut statistik, dari 80 hingga 90% komputer yang beroperasi di berbagai negara di dunia kompatibel dengan IBM.

Komputer yang kompatibel dengan IBM adalah alat teknis yang paling cocok untuk meningkatkan kualitas pendidikan dan memantau pengetahuan siswa dalam kondisi modern. Ia bekerja dengan bantuan sistem, program komputer instrumental dan terapan. Jenis program kedua adalah yang paling menarik dalam konteks pekerjaan ini. Program alat yang ditulis dalam bahasa tingkat tinggi memungkinkan pemrogram untuk membuat program untuk tujuan khusus - program pengguna, program aplikasi. Program aplikasi juga mencakup program kontrol pengetahuan siswa. Prinsip utama pembuatan program semacam itu adalah bahwa program tersebut berfokus pada program studi tertentu dan memungkinkan pengguna yang memenuhi syarat (programmer dan guru) untuk membuat program orisinal untuk melatih dan memantau pengetahuan siswa.

Kemungkinan terbatas dari pekerjaan ini tidak memungkinkan pertimbangan yang lebih rinci dan mendalam dari banyak masalah penting yang terkait dengan pengujian. Namun, itu hanya perlu untuk memberikan deskripsi singkat tentang sifat-sifat pengujian.

kemampuan beradaptasi – kemampuan sistem untuk beradaptasi dengan perubahan kondisi (perangkat keras dan perangkat lunak).

keterbukaan ditentukan oleh kemampuan sistem di bawah pengaruh pengguna yang memenuhi syarat untuk beradaptasi dengan kontrol disiplin akademis tertentu.

Standar sistem dinyatakan dengan penggunaan fungsi, desain, dll., yang digunakan dalam program publik. Pengguna yang terlatih merasa lebih nyaman, dan pengguna yang tidak terlatih dapat menggunakan pengalaman yang diperoleh saat bekerja dengan program lain.

keseragaman adalah untuk membuat sistem seperti itu, atas dasar yang memungkinkan untuk membuat yang serupa. Kesalahan besar para pengembang sistem pengujian pengetahuan komputer adalah pengembangan program yang sangat spesifik untuk mata pelajaran akademik tertentu. Jelas, aktivitas seperti itu sama sekali tidak efisien dan mengarah pada biaya tenaga kerja yang tidak dapat dibenarkan baik untuk programmer maupun ahlinya.

Kebutuhan untuk penyatuan program kontrol secara logis mengikuti dari formalisasi area subjek. Karena disarankan untuk menggunakan pengujian komputer dalam bentuk kontrol terprogram hanya di bidang subjek yang mudah diformalkan, oleh karena itu, masuk akal untuk mengembangkan metode universal untuk menyajikan pertanyaan kontrol, sistem terpadu untuk penilaian mereka, dan untuk membuat konten itu sendiri di bentuk terpisah, database pluggable.

Kemungkinan untuk memperluas dan membangun sistem juga merupakan karakteristik penting. Ketentuannya menciptakan kepercayaan bagi pengguna dalam penggunaan sistem yang lebih lanjut dan berkelanjutan, dalam modifikasinya, serta dalam penerapan berbagai solusi untuk peningkatannya.

Properti yang sama pentingnya adalah kemampuan sistem untuk melatih kontrol individu dan kelompok atas pengetahuan siswa. Selain keuntungan yang jelas, memungkinkan untuk menggunakan sistem dalam berbagai kondisi, yang ditentukan oleh guru, penulis tes, berdasarkan tujuan pembelajaran.

Jika semua properti di atas diperhitungkan, maka sebagai hasilnya sebuah sistem akan terbentuk, bekerja dengan mana siswa akan memiliki kesempatan untuk menguji pengetahuan mereka tentang setiap topik disiplin akademik dengan kecepatan individu yang nyaman dalam mode kontrol diri, mengidentifikasi kesenjangan dan kemudian menghilangkannya. Pada saat yang sama, siswa akan meningkatkan motivasi mereka untuk belajar dan, sebagian besar, situasi stres akan dihilangkan, studi mendalam tentang materi pendidikan akan dipastikan, kepercayaan diri akan muncul dalam pengetahuan yang mereka miliki dan kecukupan penilaian. mereka terima berdasarkan hasil pengendalian.

Selain persyaratan ini, sistem kontrol pengetahuan juga harus memenuhi kriteria berikut:

    bekerja di jaringan komputer (lokal dan global), kemungkinan pengujian secara bersamaan dengan sekelompok responden;

    sistem harus menyediakan kemungkinan untuk membuat pengujian baru dan menganalisis hasil pengujian;

    sistem harus berisi algoritma untuk menganalisis hasil tes (validitas tes, penilaian tingkat kerumitannya, perbandingan hasil tes dari kelompok yang berbeda, dll.);

    sistem harus memberikan fleksibilitas tinggi dalam memilih jenis pertanyaan dan tugas, tetapi pada saat yang sama harus memiliki tingkat keamanan yang tinggi;

    sistem instrumental harus memastikan pembedaan hak akses ke semua elemennya.

Peran penting dalam menguji pengetahuan dimainkan oleh objektivitas, akurasi hasil dan probabilitas minimum kesalahan estimasi, mengesampingkan pengaruh faktor subjektif apa pun, serta kondisi pengujian yang hampir identik untuk semua siswa, yang dicapai dalam kasus kami. dengan bantuan komputer dan program khusus. Memastikan kedalaman dan kelengkapan kontrol juga dicapai dengan meminta siswa menjawab beberapa ratus pertanyaan. Ini setidaknya urutan besarnya lebih tinggi dari nilai serupa dalam pengujian pengetahuan tradisional. Pada saat yang sama, baik penilaian yang berbeda dan terintegrasi dari tingkat penguasaan materi pendidikan dalam disiplin tertentu tercapai. Pengendalian dilakukan segera setelah selesai mempelajari setiap bagian kurikulum. Guru menerima informasi yang cepat dan objektif tentang hasil penguasaan siswa bagian ini. Oleh karena itu, data yang diperoleh dapat digunakan untuk melakukan penyesuaian yang sesuai dengan isi dan metodologi proses pendidikan.

2.3 Pembentukan tugas-tugas tes untuk kontrol pengetahuan komputer

Pengujian komputer untuk disiplin ilmu humaniora universitas hampir sepenuhnya diimplementasikan selama pekerjaan kontrol, kontrol atas pekerjaan independen siswa (input, saat ini, tematik), sebagian - kolokium, tes dan ujian (perbatasan, akhir, kontrol akhir).

tes pedagogis - ini adalah sistem tugas segi dari konten tertentu, meningkatkan kesulitan, bentuk spesifik, yang memungkinkan Anda untuk menilai struktur secara kualitatif dan secara efektif mengukur tingkat pengetahuan, keterampilan, dan ide.

Sangat sulit untuk menerapkan properti segi dalam pengetahuan kemanusiaan karena formalisasi yang lemah dan non-artikularitas.

Di satu sisi, tugas tes (TK) membuat persentase yang sangat tinggi, mungkin 80-90% dari program kontrol komputer dalam disiplin humaniora apa pun. Di sisi lain, tidak semua konten cocok untuk transformasi dengan bentuk tugas tes. Banyak bukti, deskripsi verbose sulit untuk diungkapkan, dan bahkan tidak diungkapkan sama sekali dalam bentuk tes.

Masalah pengisian basis data tampak jelas dan oleh karena itu, sebagai suatu peraturan, tidak menimbulkan kesulitan baik dalam teori maupun dalam praktik. Sekilas, pengembangan pertanyaan pengujian dan definisi standar respons tersedia untuk setiap guru. Namun, pada kenyataannya, situasi di daerah ini justru kebalikan dari apa yang tampak pada pandangan pertama.

Sangat mudah untuk merumuskan pertanyaan. Namun, sebagian besar pengembang tidak mengajukan pertanyaan utama kepada diri mereka sendiri: apa tujuan dari pertanyaan ini? Bagian mana dari topik yang sedang dipertimbangkan yang dicakup pertanyaan ini? Apakah pertanyaan dirumuskan dengan benar, apakah menimbulkan ketidaksesuaian, apakah memungkinkan jawaban yang ambigu, bagaimana persepsi siswa dari sudut pandang bukan guru (memiliki jumlah pengetahuan yang besar dibandingkan siswa), tetapi dari sudut pandang dari pandangan mata kuliah teori yang dilalui mahasiswa?

Upaya untuk menjawab pertanyaan-pertanyaan ini menunjukkan bahwa, pertama-tama, basis data harus dikembangkan bukan oleh guru yang antusias, tetapi oleh spesialis tingkat tinggi di bidang subjek ini. Selain itu, tidak peduli seberapa tinggi level pengembang, setiap orang mampu membuat kesalahan atau salah merumuskan ketentuan tertentu. Oleh karena itu, basis pengujian, sebelum commissioning, harus melalui penilaian setidaknya dewan metodologis dalam spesialisasi ini.

Namun, tidak ada komisi yang mampu menentukan persepsi soal kontrol oleh siswa. Ini hanya dapat menunjukkan pengujian nyata. Selain itu, penilaian semacam itu secara teknis sangat sederhana - hanya analisis statistik kumulatif dari jawaban untuk setiap pertanyaan spesifik yang diperlukan. Untuk melakukan ini, pertanyaan harus dapat diidentifikasi secara unik. Analisis statistik seperti itu, terutama ketika melakukan pengujian kontrol dalam kelompok pelatihan yang berbeda, memberikan hasil ganda: pertanyaan yang tidak dapat dijawab dengan benar oleh siapa pun, atau dirumuskan secara salah, atau topik ini diungkapkan dengan sangat buruk dalam proses pembelajaran. Pertanyaan yang dijawab dengan benar oleh semua orang, dirumuskan dengan buruk (memiliki petunjuk dalam teks pertanyaan), atau topik ini diungkapkan dengan sangat baik dalam proses pembelajaran dan diasimilasi dengan benar oleh seluruh kelompok.

Ambiguitas seperti itu dalam analisis statistik mengarah pada pertanyaan tentang waktu dan bentuk analisis dan pengujian statistik secara umum.

Utamaformulir tugas tes adalah: tugas bentuk terbuka, tertutup, untuk kepatuhan, untuk menetapkan urutan yang benar.

1. Tugas dengan pilihan satu atau lebih jawaban yang benar . Tugas-tugas ini termasuk jenis berikut:

1.1. Pilihan satu jawaban yang benar menurut prinsip: satu benar, semua yang lain (satu, dua, tiga, dll.) salah.

Misalnya, dengan kekurangan vitamin apa, ada pelanggaran pertumbuhan dan perkembangan tulang:

a) vitamin A;

b) vitamin B;

c) vitamin C;

d.vitamin D

1.2. Pilih beberapa jawaban yang benar.

1.3. Pilihan satu, jawaban yang paling benar.

Misalnya, zat organik meliputi:

a) protein;

b) protein dan karbohidrat;

c) protein, karbohidrat dan lemak;

d) protein, karbohidrat, lemak, dan garam mineral.

Setiap jawaban umumnya masuk akal, tetapi jawaban 1 dan 2 tidak lengkap. Jawaban ke-4 juga tidak benar, karena garam mineral bukan milik zat organik.

2. Buka tugas formulir . Tugas dirumuskan sedemikian rupa sehingga tidak ada jawaban yang siap; Anda perlu merumuskan dan memasukkan jawabannya sendiri, di tempat yang disediakan untuk ini.

3. Tugas kepatuhan , di mana elemen dari satu set harus cocok dengan elemen dari set lain.

Misalnya, cocokkan:

Habitat

organisme

1) Organisme

a) ikan mas

2) Air

b) ubur-ubur

3) Tanah

c) tahi lalat

4) Udara Darat

d.cacing tanah

5) Tanah-air

e) burung gereja

e) harimau

g) cacing gelang

h) katak

i) amuba disentri

4. Tugas untuk menetapkan urutan yang benar (perhitungan, tindakan, langkah, operasi, istilah dalam definisi).

Bentuk-bentuk representasi komputer dari tugas-tugas pengujian yang terdaftar tidak menghabiskan keragamannya. Banyak tergantung pada keterampilan dan kecerdikan guru. Saat membuat tes, penting untuk mempertimbangkan banyak keadaan, misalnya, kepribadian orang yang diuji, jenis kontrol, metodologi untuk menggunakan tes dalam proses pendidikan, dll.

Pilihan formulir tergantung pada:

    tujuan pengujian;

    konten tes;

    kemampuan teknis;

    tingkat kesiapan guru dalam bidang teori dan metodologi tes penguasaan pengetahuan.

Tes terbaik dapat dianggap sebagai tes yang memiliki konten luas, dan mencakup tingkat pengetahuan yang lebih dalam.

Tugas tes meliputi:

sebuah)bagian pernyataan, menggambarkan situasi (mungkin tidak ada), yang tidak memerlukan tindakan aktif dari orang yang diuji;

b)bagian prosedural berisi saran bagi siswa untuk melakukan tindakan spesifik apa pun - pilih elemen yang benar dari set yang diusulkan, buat korespondensi atau urutan yang benar, beri nama tanggal, tulis namanya, dll. Bagian prosedural adalah jenis informasi, setelah menerimanya, siswa dituntut untuk melakukan tindakan aktif yang tidak hanya terkait dengan mempelajari dan menganalisis materi yang terkandung dalam tugas, tetapi juga untuk menyusun dan memasukkan jawaban;

c) eelemen pilihan .

Aturan umum untuk semua bentuk tugas tes. Penting untuk memantau kebenaran kata-kata tugas. Tugas tes harus dirumuskan dengan jelas, jelas, spesifik, tanpa ambiguitas dalam jawabannya. Jumlah item respons yang optimal adalah 5-8, tetapi ada pengecualian.

Bagian prosedural dari tugas tes harus sesingkat mungkin. - jangan lebih dari 5-10 kata. Tugas tes harus dirumuskan dalam bentuk afirmatif. Tidak diperbolehkan mendefinisikan suatu konsep melalui pencacahan unsur-unsur yang tidak termasuk di dalamnya.

Untuk semua bentuk tugas tes, harus ada instruksi standar. Semua elemen dalam tugas harus dipilih menurut beberapa prinsip khusus yang dipilih oleh penulis. Preferensi untuk sejumlah besar tugas tes yang sederhana dalam struktur, daripada sejumlah kecil yang kompleks.

Dalam tugas tes pemisahan yang kompleks, perlu untuk membuat daftar semua alternatif yang mungkin, karena jika tidak, gagasan siswa tentang klasifikasi atau struktur objek dasar terdistorsi.

Uji tugas formulir terbuka harus memenuhi persyaratan sebagai berikut:

    kata atau frasa pelengkap diletakkan di akhir dan harus satu-satunya;

    perlu untuk melengkapi hanya yang penting;

    diinginkan bahwa ketika merumuskan tugas, penambahan harus dalam kasus nominatif;

    semua tanda hubung untuk penambahan harus sama panjangnya;

    itu diinginkan untuk memberikan peserta pelatihan jawaban sampel.

Bentuk tugas tes tertutup harus memenuhi persyaratan sebagai berikut:

    kemungkinan elemen yang sama;

    diinginkan bahwa semua elemen seleksi memiliki panjang yang sama;

    diinginkan untuk menggunakan satu objek atau jumlah objek yang sama dalam elemen seleksi;

    perlu untuk mengecualikan kata-kata yang berulang dalam jawaban;

    semua item harus merupakan pernyataan yang benar, tetapi hanya satu yang merupakan jawaban yang benar untuk item ini, dan sisanya mungkin benar untuk item lain dalam tes ini atau tes lainnya.

Uji Kepatuhan berisi dua set, kolom kanan untuk pilihan, kolom kiri untuk jawaban. Di sebelah kanan, misalnya, terbentuk 1-3 elemen lagi, sehingga pada penggantian terakhir, siswa memiliki pilihan, dan bukan sisa yang tersubstitusi secara otomatis. Semua elemen adalah pernyataan yang benar.

Dalam tugas tes untuk menetapkan urutan yang benar prinsip pembentukan elemen menurut abjad dapat dipilih. Jika daftar abjad adalah jawaban yang benar, maka item ditempatkan secara acak.

Untuk meratakan peminjaman jawaban dari tetangga di semua tugas formulir ini, perlu untuk merumuskan tugas tes dalam 2-3 opsi yang identik artinya, yang dipilih secara acak. Dalam tugas bentuk tertutup dan dalam tugas kepatuhan, elemen dikirimkan menggunakan sensor pengaturan acak. Unsur-unsur tugas dalam bentuk-bentuk ini dibentuk sesuai dengan prinsip pemain "utama" dan "cadangan". Misalnya, dengan 5 elemen yang diberikan kepada seorang siswa, penulis tidak membentuk himpunan "1 benar + 4 salah", tetapi "1 benar + 4 utama salah + 5 cadangan salah", di mana 9 yang salah dipilih secara acak.

Metode untuk menilai kriteria kualitas tes. Teori klasik tes didasarkan pada teori korelasi, yang parameter utamanya adalah reliabilitas dan validitas. Keandalan- stabilitas hasil pengujian yang diperoleh dengan penerapannya. Keabsahan– kesesuaian tes, mis. kemampuan untuk mengukur secara kualitatif untuk apa ia diciptakan sesuai dengan maksud penulisnya.

Ada teori tes ilmiah yang ketat, yang memungkinkan secara metodologis dan metodis untuk membenarkan penggunaan dan pemrosesan hasil tes. Tes berbasis bukti adalah metode yang memenuhi standar reliabilitas dan validitas yang telah ditetapkan (nilai antara 0 dan 1; semakin mendekati 1, semakin baik tesnya).

Menurut klasifikasi, ada tes yang difokuskan padanorma (diurutkan berdasarkan siswa kuat - lemah) dan tes difokuskan padakriteria (diurutkan berdasarkan tugas yang sulit - mudah).

Berdasarkan sifat tindakannya, tes dibagi menjadi:lisan (dinyatakan dengan kata-kata) dannon-verbal (diwakili oleh gambar).

Menurut tingkat homogenitas tugas, tes adalah:homogen (dalam satu disiplin) danheterogen (untuk beberapa disiplin ilmu).

Dengan golkegunaan: awal pelatihan, kemajuan dan kesulitan dalam proses pembelajaran, pencapaian di akhir pelatihan. Praktik pendidikan tinggi menunjukkan bahwa berorientasi pada kriteria, sangat verbal, homogen, bertujuan, sebagai suatu peraturan, pada akhir tes pendidikan adalah yang paling dapat diterapkan.

Penilaian item tes dapatpolitamik (jika salah satu dari 10 elemen tugas dilakukan dengan tidak benar, maka skor totalnya adalah 9);dikotomis (selesai semua elemen - 1 poin, tidak - 0 poin).

Menurut tingkat kesulitannya, tugas dapattingkat tunggal , yaitu dengan faktor pembobotan sama dengan satu danbertingkat dengan faktor pembobotan dari 0 sampai N.

Panjang tes adalah jumlah tugas yang termasuk dalam tes. Teori tes klasik mengatakan bahwa semakin lama tes, semakin dapat diandalkan. Tetapi latihan menunjukkan bahwa jika ujiannya sangat lama, maka motivasi dan perhatiannya menurun. Dalam praktiknya, panjang tes harus ditentukan secara empiris, dengan mempertimbangkan validitas, waktu pengujian, dll. Panjang tes yang optimal, seperti yang ditunjukkan oleh teori dan praktik, adalah 30-60 tugas. Rasio panjang tes dengan jumlah tugas tes di bank harus cenderung rasio 1:10.

Setiap tes memilikiwaktu pengujian yang optimal - waktu dari awal prosedur pengujian hingga timbulnya kelelahan. Penyebaran karakteristik ambang kelelahan cukup besar - dari 20 hingga 100 menit dalam satu kelompok usia Penyebab utama kelelahan: usia, motivasi, monoton pekerjaan yang dilakukan, karakteristik individu subjek. Oleh karena itu, perlu untuk mempertahankan motivasi pada tingkat yang tepat, diversifikasi pekerjaan sebanyak mungkin dengan memperkenalkan semua bentuk tugas dan dukungan non-verbal ke dalam sirkulasi, dan juga menyesuaikan produk perangkat lunak sesuai dengan karakteristik individu subjek. Rata-rata perkiraan waktu hingga momen kelelahan bagi siswa adalah 50-80 menit (durasi maksimum). Dan minimum tergantung pada bentuk, jumlah dan kesulitan tugas, elemen dalam tugas. Misalnya, untuk tugas tes yang mudah dari formulir tertutup dengan pilihan satu elemen dari yang diusulkan, 10-15 detik sudah cukup. Dalam proses persetujuan, tanggal sebenarnya harus diklarifikasi.

Rasio bentuk tugas dalam tes . Memilih bentuk tugas testergantung pada konten kursus, tujuan pembuatan tes, keterampilan pengembang. Tata letak rata-rata dapat sebagai berikut. Dalam tes dengan panjang, misalnya, 60 tugas, disarankan agar tidak lebih dari 10 tugas tes bentuk terbuka yang direkomendasikan, sekitar 10 untuk rasio dan urutan, lebih bijaksana untuk memberikan 30 tugas yang tersisa secara tertutup. membentuk.

2.4 Jenis pertanyaan kontrol komputer

Mungkin kesalahpahaman terbesar dari pengembang sebagian besar program kontrol adalah penggunaan apa yang disebut sampel tunggal: siswa ditanyai pertanyaan, dia diberikan beberapa jawaban yang sudah jadi (sebagai aturan, lima - lebih mudah untuk menurunkan penilaian), salah satunya benar. Terlepas dari kenyataan bahwa benar-benar ada kelas pertanyaan kontrol yang dapat diimplementasikan dengan cara yang sama, terlepas dari kenyataan bahwa kemungkinan menebak (20%) cukup rendah, pengulangan secara eksklusif pada satu sampel mengecualikan kemungkinan terkaya untuk menggunakan pedagogis. teknologi saat melakukan kontrol.

Selain itu, bukan rahasia lagi bagi siapa pun bagaimana siswa melewati jenis kontrol ini - cepat atau lambat cetakan dengan jawaban yang benar jatuh ke tangan siswa, dan urutan jawaban hanya dihafal atau dimasukkan pada lembar contekan. Tidak semua (pada kenyataannya, hanya beberapa) sistem kontrol pengetahuan menerapkan fungsi mengubah lokasi jawaban yang benar dengan setiap tes.

Jenis pertanyaan apa yang dapat digunakan dalam kontrol terprogram versi komputer?

Tipe sewenang-wenang, atau, masukan papan ketik. Alat yang paling ampuh untuk memeriksa segala macam istilah, konstanta, tanggal. Namun, implementasinya, sebagai suatu peraturan, sangat kompleks secara matematis dan oleh karena itu diabaikan oleh sebagian besar pengembang. Masalahnya terletak, pertama-tama, pada kenyataan bahwa frasa yang dimasukkan harus tunduk pada sintaksis, dan idealnya, analisis semantik yang memodelkan varian pemikiran responden yang mungkin. Selain itu, seorang siswa dapat membuat kesalahan ketik, dan di sebagian besar bidang pengetahuan kesalahan ketik tersebut tidak dapat dianggap sebagai kesalahan - dan ini membutuhkan implementasi logika komputer yang sangat fleksibel, yang tidak dapat dilakukan oleh setiap programmer. Banyak juga yang dapat dikatakan tentang kemungkinan bagi siswa untuk menggunakan berbagai sinonim ketika memasukkan jawaban sewenang-wenang, yang mungkin tidak disediakan oleh pengembang basis data dan pada saat yang sama mungkin sepenuhnya atau sebagian benar. Selain itu, dalam jenis pertanyaan arbitrer, mungkin ada beberapa kemungkinan jawaban.

Ada juga sejumlah variasi dari jenis pertanyaan khusus:

Memasukkan beberapa jawaban dalam urutan tertentu dapat digunakan dalam pertanyaan tentang urutan ketat dari setiap operasi, posisi relatif, dll. Jenis pertanyaan rumit untuk pemrograman karena bersifat arbitrer, sangat sulit untuk dirancang dan menyebabkan kesulitan tertentu bagi siswa, karena tidak hanya membutuhkan input jawaban yang bebas kesalahan, tetapi juga posisi relatif bebas kesalahan mereka. Namun, meskipun penggunaannya agak jarang, jenis ini sangat diperlukan dan merupakan alat yang ampuh untuk menentukan tingkat pengetahuan siswa dalam berbagai hal, misalnya, posisi relatif organ dalam anatomi topografi, urutan transformasi suatu zat dalam kimia. , urutan tindakan dalam berbagai jenis pekerjaan perbaikan, dll. .;

Memasukkan bagian garis atau huruf yang hilang, terlepas dari kesederhanaannya, ini adalah alat yang sangat diperlukan untuk menguji pemahaman berbagai konstruksi bahasa (dalam bahasa Rusia dan bahasa asing, dalam pemrograman, dll.). Berbeda dengan jenis pertanyaan "Gratis" standar, sebagai aturan, ini mengasumsikan jawaban yang tidak ambigu dan karenanya lebih mudah untuk diprogram;

Jenis pertanyaan selektif. Versi klasik, yang sebagian besar pengembang anggap perlu dan cukup untuk pengujian komputer. Jenis pertanyaan ini mungkin menyiratkan satu atau lebih jawaban yang benar dari yang ditawarkan. Beberapa ahli teori membagi kedua varietas ini menjadi jenis pertanyaan yang berbeda, tetapi dari sudut pandang logika formal, varietas ini benar-benar setara. Pertanyaannya hanya dalam metodologi untuk memperoleh hasil untuk varietas ini.

Implementasi komputer jenis ini sangat sederhana. Mungkin, inilah alasan penggunaannya secara luas di berbagai jenis program pengujian. Untuk menerapkan jenis ini, bahkan pengetahuan dasar dalam bahasa pemrograman apa pun atau dalam sistem perkantoran yang dapat diprogram seperti Excel atau Quattro sudah cukup.

Jenis pertanyaan selektif juga memiliki varietas:

Jenis alternatif adalah bentuk yang paling disederhanakan dan mengasumsikan jawaban yang sudah jadi dalam teks pertanyaan. Subjek hanya harus menunjukkan apakah jawabannya benar atau tidak (yaitu menjawab "Ya" atau "Tidak"). Terlepas dari kesederhanaan yang tampak, tipe ini dapat berhasil digunakan di beberapa bidang pengetahuan.

Variasi pada tipe selektif adalah tipe pertanyaan yang disebut " Pilihan Namun, perbedaan antara itu dan tipe selektif standar hanya pada sistem output.

Jenis pertanyaan berurutan. Jenis yang paling sulit bagi siswa, meskipun cukup sederhana untuk diterapkan, memberi guru alat yang ampuh untuk menilai tidak hanya pengetahuan khusus, tetapi juga logika.

Versi sederhana dari tipe serial - "Penyusunan kembali" melibatkan mengajukan pertanyaan kepada siswa dan diberi satu set jawaban benar yang sudah jadi. Tugasnya adalah untuk mengatur jawaban-jawaban ini dalam urutan yang diperlukan.

Seperti jenis "Urutan", variasi ini dapat digunakan di bidang subjek di mana pengetahuan yang jelas tentang urutan operasi, tindakan, atau posisi relatif objek yang benar diperlukan. Namun, tidak seperti tipe "Urutan", variasi ini dapat digunakan lebih luas, karena tidak mengandung "perangkap" rumusan istilah yang salah oleh siswa - semua jawaban sudah ada di layar.

Versi yang lebih rumit dari tipe serial - "Pengaturan" adalah yang paling kompleks dari semua jenis, baik dari segi kompleksitas pemrograman maupun kompleksitas persepsinya oleh siswa. Namun, tipe inilah yang memberikan peluang terluas untuk menguji logika. Konstruksi pertanyaan jenis ini secara formal terdiri dari konstruksi oleh siswa dari grafik struktur logis. Teks pertanyaan mencantumkan ketentuan (paragraf) bernomor tertentu, dan teks jawaban berisi kesimpulan atau fakta yang sesuai dengan paragraf tersebut. Siswa diminta untuk mencocokkan item yang tercantum dalam pertanyaan dengan jawaban yang sudah jadi.

Bab 3. Metodologi untuk melakukan survei komputer terhadap siswa

3.1 Metodologi untuk melakukan survei terprogram

Masalah pengorganisasian bentuk kolektif kegiatan pendidikan terutama diaktualisasikan oleh kekhususan penyelenggaraan kelas di ruang kelas yang dilengkapi dengan jaringan komputer lokal. Penggunaan jaringan memberi guru peluang baru untuk mengelola proses pendidikan, di satu sisi, di sisi lain, memberikan kemungkinan pekerjaan pendidikan mandiri yang efektif dari siswa untuk menyelesaikan tugas-tugas praktis.

Jaringan komputer lokal memungkinkan untuk menyajikan tindakan apa pun dalam urutan operasi yang terperinci, menunjukkan hasilnya, kondisi untuk eksekusi; memperbaiki hasil operasional menengah, memungkinkan menafsirkan dan mengevaluasi setiap langkah peserta pelatihan saat melakukan tugas, dll.

Untuk seorang guru, jaringan komputer memungkinkan kontrol akhir dan operasional, akumulasi informasi akhir yang terkait dengan siswa individu dan seluruh kelompok secara keseluruhan. Jaringan komputer memungkinkan Anda untuk secara kualitatif mengubah sistem untuk memeriksa aktivitas siswa, sambil memberikan fleksibilitas dalam mengelola proses pendidikan. Bekerja pada satu database umum memungkinkan Anda untuk memeriksa kebenaran pelaksanaan semua tugas dan tidak hanya memperbaiki kesalahan, tetapi juga menentukan sifatnya, yang membantu menghilangkan penyebab yang menyebabkannya tepat waktu.

Pemilihan topik dan opsi yang memungkinkan untuk tugas tes disiapkan terlebih dahulu. Isi tugas tes dirumuskan sedemikian rupa untuk menunjukkan penerapan dalam praktik pengetahuan dan keterampilan yang diperlukan untuk menguasai materi.

Individualisasi pelatihan dapat dilaksanakan dengan membedakan isi materi pendidikan yang disajikan, serta memilih tugas tes sesuai dengan tingkat kerumitannya.

Pemilihan tingkat kesulitan tugas memainkan peran penting. Tugas yang terlalu sederhana tidak memerlukan upaya mental dari peserta pelatihan, dan karena itu menghambat pembentukan keterampilan yang diperlukan. Kinerja yang benar dari tugas-tugas yang relatif mudah tidak dialami oleh peserta pelatihan sebagai keberhasilan. Pada saat yang sama, banyak kesalahan mengaktifkan potensi kreatif siswa dan memiliki efek positif pada pengaktifan kebutuhan kognitif dan pada lingkup motivasi.

Sarana untuk menciptakan motivasi pendidikan dan kognitif dapat berupa isi tugas tes dan bentuk organisasi kegiatan (belajar dan bermain, kelompok, individu).

Atas kebijaksanaan guru, siswa dapat ditawari rencana untuk menyelesaikan tugas tes, dan bekerja dengan buku kerja dan literatur diperbolehkan. Guru dapat mempertahankan minat peserta pelatihan dengan terlibat dalam proses membahas nuansa individu saat melakukan tugas tes.

Pelajaran dapat dibangun sedemikian rupa untuk mengarahkannya pada perkembangan yang maksimal dari peserta pelatihan. Untuk melakukan ini, pada saat mereka merasa telah menyelesaikan tugas tes yang diusulkan, guru, untuk meningkatkan aktivitas kognitif siswa lebih lanjut, dapat mengajukan pertanyaan bermasalah tentang topik yang dipelajari kepada mereka, yang menyebabkan minat kognitif. . Sebagai hasil dari pemecahan kesulitan ini, siswa menerima pengetahuan dan keterampilan baru. Dengan demikian, pekerjaan sekelompok peserta pelatihan pada kinerja tugas tes dapat dilakukan dalam mode pemecahan masalah berurutan.

Setelah peserta menyelesaikan pekerjaan mereka pada tugas-tugas tes, guru dapat mengatur diskusi kelompok, diskusi kolektif tentang tugas-tugas yang menyebabkan kesulitan terbesar. Adalah bijaksana untuk memasukkan pertanyaan-pertanyaan diskusi yang tetap tidak dipertimbangkan, untuk menemukan cara-cara yang mungkin untuk menyelesaikannya. Dengan demikian, guru tidak hanya dapat melakukan kontrol, tetapi juga menjadi penyelenggara proses perolehan pengetahuan baru secara aktif secara mandiri oleh siswa.

3.2 Menangani hasil tes

Masalah mendapatkan penilaian mungkin salah satu yang paling kompleks dan kontroversial dalam pedagogi. Memang, mengajukan pertanyaan mudah, tetapi untuk menentukan apakah siswa menjawab dengan benar, seberapa benar dia menjawab, apakah dia berpikir dengan benar, meskipun jawabannya salah, adalah tugas yang jauh dari penyelesaian sepenuhnya. Dengan demikian, analog komputer dari derivasi perkiraan juga menderita kekurangan yang sama, jika tidak lebih.

Dalam kebanyakan sistem kontrol terprogram, prinsip menurunkan hasilnya sederhana. Karena dalam sistem seperti itu, sebagai suatu peraturan, hanya satu sampel yang digunakan, perkiraannya dihitung secara sederhana: dijawab - plus, tidak menjawab - minus. Kemudian jumlah plus dan minus dikurangi menjadi skala lima poin dan skor ditampilkan.

Prinsip serupa untuk menurunkan penilaian, meskipun primitif, namun, dalam kasus ketika semua pertanyaan dalam database setara dan dari jenis yang sama, itu juga memiliki hak untuk ada. Namun, pengurangan langsung dari jumlah jawaban positif dan negatif ke sistem lima poin patut mendapat kritik serius. Secara umum diterima bahwa ambang batas kredit untuk koefisien asimilasi adalah 70%. Dalam kasus yang sedang dipertimbangkan, cukup untuk menjawab dengan benar 51% dari pertanyaan untuk menerima nilai ujian (yaitu "memuaskan"), untuk menerima nilai "baik" - sebesar 71%, untuk menerima nilai "sangat baik" - oleh 91%.

Namun, praktik di atas, sebagai suatu peraturan, tidak terjadi, karena semua pengembang sistem pengujian menyadari sifat pertanyaan yang tidak sama dalam database. Ada metode lain, ketika pengembang mengizinkan guru untuk menentukan "bobot", yaitu. kepentingan relatif dari setiap pertanyaan dalam database.

Teknik ini, terlepas dari keefektifannya, juga memiliki kekurangan. Faktanya adalah bahwa dari sudut pandang teori pedagogis, tidak ada pertanyaan sederhana dan kompleks (jika kita berbicara tentang pertanyaan, dan bukan tentang masalah matematika dan logis yang membutuhkan solusi multikomponen). Sebuah pertanyaan sederhana akan selalu untuk seseorang yang tahu jawabannya. Dan sulit - bagi mereka yang tidak tahu jawabannya. Dengan demikian, dengan menempatkan “bobot” soal, guru sebenarnya menyusunnya sesuai dengan gagasannya sendiri tentang kompleksitasnya, sesuai dengan tingkat kompetensi atau inkompetensinya.

Namun, ada pertanyaan yang membutuhkan waktu respons lebih banyak atau lebih sedikit. Adalah logis untuk mengasumsikan bahwa untuk setiap pertanyaan, dari sudut pandang psikofisiologi, lebih banyak atau lebih sedikit operasi mental (yang disebut esensial) dapat dihabiskan. Menentukan nomor ini, sebagai suatu peraturan, tidak sulit, dalam jenis pertanyaan sederhana itu sama dengan jumlah opsi jawaban yang diusulkan, dan sepenuhnya dapat diotomatisasi.

Jadi, saat ini ada dua cara untuk menentukan hasil jawaban - dengan jawaban yang benar atau salah untuk pertanyaan secara keseluruhan dan dengan transaksi yang signifikan. Ketika memilih prinsip penilaian, harus diasumsikan bahwa penilaian operasi yang signifikan lebih fleksibel dan objektif, karena memungkinkan Anda untuk mengidentifikasi jawaban yang tidak lengkap, tidak sepenuhnya benar, sebagian salah dan lainnya yang serupa dan menghitungnya dalam jumlah tertentu dari koefisien asimilasi .

Fleksibilitas menggunakan metode estimasi untuk operasi penting terletak pada kemungkinan memperkenalkan apa yang disebut "perkiraan lunak". Sistem penilaian berbasis jawaban pada umumnya selalu menggunakan “hard scoring”—yaitu. jika siswa membuat kesalahan, seluruh pertanyaan tidak dihitung. Namun, metode penilaian ini tidak dibenarkan untuk semua pertanyaan. Misalnya, di sebagian besar pertanyaan yang memiliki beberapa opsi untuk jawaban yang benar (tersirat jenis pertanyaan selektif), tidak perlu menandai semua jawaban yang benar secara lengkap. Dalam pertanyaan seperti itu, baik sebagian jawaban benar, atau, sebaliknya, tidak adanya jawaban yang salah cukup dapat diterima. Penggunaan prinsip evaluasi dengan operasi esensial memungkinkan dalam pertanyaan semacam itu untuk menentukan koefisien kebenaran jawaban dan menghitung sebagian jawaban yang benar.

Kesimpulan

Salah satu tren signifikan dalam pengembangan pendidikan adalah pencarian metode inovatif kontrol pengetahuan yang memenuhi persyaratan objektivitas, keandalan, dan kemampuan manufaktur. Pada tahap ini, di antara metode yang efektif untuk menilai kemampuan dan prestasi siswa, peran penting diberikan pada kontrol pengetahuan komputer, yang sekarang berhasil digunakan di lembaga pendidikan dari berbagai tingkatan - dari sekolah hingga universitas.

Dibandingkan dengan bentuk kontrol tradisional, pengujian komputer memiliki sejumlah keunggulan: penerimaan hasil tes yang cepat, membebaskan guru dari pekerjaan yang melelahkan dalam memproses hasil tes, fiksasi jawaban yang tidak ambigu, kerahasiaan dalam pengujian anonim.

Setelah menganalisis literatur modern tentang masalah ini, persyaratan berikut untuk sistem pengujian otomatis terpadu diidentifikasi:

    perlindungan terhadap akses tidak sah ke pertanyaan tes. Solusi untuk masalah ini dapat dilakukan dengan cara enkripsi data;

    basis tes tak terbatas, yang dirancang untuk keragaman tes dan pengulangan pertanyaan yang lebih sedikit;

    kesederhanaan antarmuka program. Banyak spesialis, terutama yang spesialisasinya tidak terkait dengan teknologi informasi, kurang mampu menangani komputer dan program komputer, sehingga kejelasan dan aksesibilitas antarmuka merupakan persyaratan penting untuk sistem pengujian;

    kemudahan administrasi tes. Persyaratan ini juga penting. Semakin mudah lingkungan pengembangan untuk tema dan tes, semakin sedikit pertanyaan yang akan muncul terkait pekerjaan di komputer. Kemudahan administrasi diselesaikan dengan menggunakan program terpisah untuk membuat atau menambahkan topik dan pengujian ke database dan mengatur parameter;

    otomatisasi penuh dari proses pengujian. Pengujian harus dilakukan tanpa kendali staf pengajar selama pengujian. Oleh karena itu, seluruh proses - mulai dari mengajukan pertanyaan tes oleh guru, mengidentifikasi spesialis, melakukan pengujian, hingga menilai hasil dan memasukkan hasil ini ke dalam file data, harus dilakukan dalam mode yang sepenuhnya otonom;

    kecepatan unduh. Kriteria ini penting untuk komputer dengan kinerja rendah. Seseorang tidak boleh menunggu pertanyaan dimuat untuk waktu yang lama. Setiap gambar, grafik harus dioptimalkan atau dikompresi. Mereka tidak boleh mengandung informasi yang berlebihan, tetapi hanya mencakup bagian yang diperlukan;

    portabilitas ke platform yang berbeda dengan dukungan Microsoft Windows GUI;

    akuntansi banding. Setiap uji coba harus direkam untuk memastikan kontrol. Ini diperlukan untuk memperhitungkan upaya pengujian yang gagal jika pengujian terputus karena alasan apa pun. Ini akan memberikan kontrol atas tindakan pengguna;

    menargetkan pengguna non-pemrograman. Penggunaan program uji tidak memerlukan pengalaman dengan aplikasi lain;

    sistem pengujian harus mendukung file multimedia (grafik, video, suara, animasi). Ini diperlukan untuk mengajukan pertanyaan yang kompleks, misalnya, untuk menampilkan grafik, gambar, video, dll.

Analisis literatur memungkinkan untuk mengidentifikasi jenis pertanyaan kontrol pengetahuan komputer berikut: tipe arbitrer, atau input keyboard; memasukkan beberapa jawaban dalam urutan tertentu (peringkat); memasukkan bagian garis atau huruf yang hilang; jenis pertanyaan selektif; jenis pertanyaan alternatif; jenis pertanyaan berurutan. Untuk pengendalian pengetahuan yang efektif, perlu menggunakan semua jenis pertanyaan dengan benar.

Saat ini, ada dua cara untuk menentukan hasil jawaban - dengan jawaban yang benar atau salah untuk pertanyaan secara keseluruhan dan dengan transaksi yang signifikan. Ketika memilih prinsip penilaian, harus diasumsikan bahwa penilaian operasi yang signifikan lebih fleksibel dan objektif, karena memungkinkan Anda untuk mengidentifikasi jawaban yang tidak lengkap, tidak sepenuhnya benar, sebagian salah dan lainnya yang serupa dan menghitungnya dalam jumlah tertentu dari koefisien asimilasi .

Sistem pengujian memiliki karakteristik penting sebagai berikut:

    kemampuan beradaptasi, yaitu kemampuan sistem untuk beradaptasi dengan perubahan kondisi (perangkat keras dan perangkat lunak);

    keterbukaan ditentukan oleh kemampuan sistem untuk beradaptasi dengan kontrol disiplin akademik tertentu;

    standarisasi sistem dinyatakan dengan penggunaan fungsi dan desain yang digunakan dalam program yang umum digunakan;

    penyatuan terletak pada kenyataan bahwa berdasarkan sistem ini, Anda dapat membuat yang serupa.

Sistem kontrol pengetahuan yang diterapkan dalam program studi ini adalah dukungan otomatis untuk pekerjaan mandiri siswa, yang memungkinkan pemantauan dan pengendalian diri dari tingkat asimilasi materi, bertindak sebagai simulator dalam persiapan ujian.

Sistem kontrol pengetahuan yang dikembangkan akan memecahkan masalah otomatisasi pembuatan tes dan prosedur pengujian, dan dapat digunakan untuk mengontrol proses penguasaan materi berbagai disiplin ilmu oleh siswa.