Pengenalan gambar dilakukan berdasarkan proses. Tugas kontrol kualitas pengakuan

Dan tanda-tanda. Tugas seperti itu cukup sering diselesaikan, misalnya, saat menyeberang atau mengemudi di lampu lalu lintas. Mengenali warna lampu lalu lintas yang menyala dan mengetahui aturan jalan memungkinkan Anda membuat keputusan yang tepat tentang apakah akan menyeberang jalan atau tidak saat ini.

Dalam proses evolusi biologis, banyak hewan memecahkan masalah dengan bantuan alat visual dan pendengaran. pengenalan pola cukup baik. Pembuatan sistem buatan pengenalan pola tetap menjadi masalah teoretis dan teknis yang sulit. Kebutuhan akan pengakuan semacam itu muncul di berbagai bidang - mulai dari urusan militer dan sistem keamanan hingga digitalisasi semua jenis sinyal analog.

Secara tradisional, tugas pengenalan gambar termasuk dalam lingkup tugas kecerdasan buatan.

Arah dalam pengenalan pola

Ada dua arah utama:

  • Studi tentang kemampuan pengenalan yang dimiliki makhluk hidup, penjelasan dan pemodelannya;
  • Pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu dalam masalah terapan.

Pernyataan resmi dari masalah

Pengenalan pola adalah penugasan data awal ke kelas tertentu dengan menyoroti fitur penting yang mencirikan data ini dari total massa data non-esensial.

Ketika mengatur masalah pengenalan, mereka mencoba menggunakan bahasa matematika, mencoba, tidak seperti teori jaringan saraf tiruan, di mana dasarnya adalah untuk mendapatkan hasil melalui percobaan, untuk menggantikan percobaan dengan penalaran logis dan bukti matematis.

Paling sering, gambar monokrom dipertimbangkan dalam masalah pengenalan pola, yang memungkinkan untuk mempertimbangkan gambar sebagai fungsi pada bidang. Jika kita mempertimbangkan set titik di pesawat T, dimana fungsi x(x,kamu) mengekspresikan pada setiap titik gambar karakteristiknya - kecerahan, transparansi, kerapatan optik, maka fungsi seperti itu adalah catatan formal gambar.

Himpunan semua fungsi yang mungkin x(x,kamu) di permukaan T- ada model kumpulan semua gambar X. Memperkenalkan konsep kesamaan antara gambar, Anda dapat mengatur tugas pengenalan. Bentuk khusus dari pengaturan tersebut sangat tergantung pada tahap-tahap selanjutnya dalam pengenalan sesuai dengan satu atau lain pendekatan.

Metode pengenalan pola

Untuk pengenalan gambar optik, Anda dapat menerapkan metode iterasi pada jenis objek pada berbagai sudut, skala, offset, dll. Untuk huruf, Anda perlu mengulangi font, properti font, dll.

Pendekatan kedua adalah menemukan kontur objek dan memeriksa propertinya (konektivitas, keberadaan sudut, dll.)

Pendekatan lain adalah dengan menggunakan jaringan saraf tiruan. Metode ini memerlukan sejumlah besar contoh tugas pengenalan (dengan jawaban yang benar), atau struktur jaringan saraf khusus yang memperhitungkan kekhususan tugas ini.

Perceptron sebagai metode pengenalan pola

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya menunjukkan bagaimana fenomena psikologis dapat muncul dalam beberapa sistem fisik, yang struktur dan sifat fungsionalnya diketahui - dijelaskan paling sederhana eksperimen diskriminasi. Eksperimen ini sepenuhnya terkait dengan metode pengenalan pola, tetapi berbeda karena algoritma solusi tidak deterministik.

Eksperimen paling sederhana, atas dasar yang memungkinkan untuk memperoleh informasi yang signifikan secara psikologis tentang sistem tertentu, bermuara pada fakta bahwa model disajikan dengan dua rangsangan berbeda dan diperlukan untuk menanggapinya dengan cara yang berbeda. Tujuan dari eksperimen tersebut mungkin untuk mempelajari kemungkinan diskriminasi spontan mereka oleh sistem tanpa adanya intervensi dari eksperimen, atau, sebaliknya, untuk mempelajari diskriminasi paksa, di mana eksperimen berusaha untuk mengajarkan sistem untuk melaksanakan klasifikasi yang diperlukan.

Dalam eksperimen pembelajaran, sebuah perceptron biasanya disajikan dengan urutan gambar tertentu, yang mencakup perwakilan dari masing-masing kelas untuk dibedakan. Menurut beberapa aturan modifikasi memori, pilihan reaksi yang benar diperkuat. Kemudian stimulus kontrol dipresentasikan ke perceptron dan probabilitas memperoleh respon yang benar untuk stimulus kelas ini ditentukan. Bergantung pada apakah stimulus kontrol yang dipilih cocok atau tidak cocok dengan salah satu gambar yang digunakan dalam urutan pelatihan, hasil yang berbeda diperoleh:

  • 1. Jika stimulus kontrol tidak sesuai dengan stimulus belajar mana pun, maka eksperimen tidak hanya dikaitkan dengan diskriminasi murni, tetapi juga termasuk elemen generalisasi.
  • 2. Jika stimulus kontrol menggairahkan seperangkat elemen sensorik tertentu yang sama sekali berbeda dari elemen-elemen yang diaktifkan di bawah pengaruh rangsangan yang disajikan sebelumnya dari kelas yang sama, maka eksperimen adalah studi generalisasi murni .

Perceptron tidak memiliki kapasitas untuk generalisasi murni, tetapi mereka berfungsi cukup memuaskan dalam eksperimen diskriminasi, terutama jika stimulus kontrol cukup cocok dengan salah satu pola yang telah dikumpulkan oleh perceptron beberapa pengalaman.

Contoh masalah pengenalan pola

  • Pengenalan huruf.
  • Pengenalan kode batang.
  • Pengenalan plat nomor.
  • Pengenalan wajah.
  • Pengenalan suara.
  • Pengenalan gambar.
  • Pengakuan daerah lokal kerak bumi di mana deposit mineral berada.

Program pengenalan pola

Lihat juga

Catatan

Tautan

  • Yuri Lifshit. Kursus "Masalah Modern Informatika Teoretis" - kuliah tentang metode statistik pengenalan pola, pengenalan wajah, klasifikasi teks
  • Jurnal Penelitian Pengenalan Pola (Journal of Pattern Recognition Research)

literatur

  • David A. Forsyth, Jean Pons Visi komputer. Pendekatan Modern = Computer Vision: Pendekatan Modern. - M.: "Williams", 2004. - S. 928. - ISBN 0-13-085198-1
  • George Stockman, Linda Shapiro Visi komputer = Visi Komputer. - M.: Binom. Laboratorium Pengetahuan, 2006. - S.752. - ISBN 5947743841
  • A.L. Gorelik, V.A. Skripkin, Metode Pengakuan, M.: Sekolah Tinggi, 1989.
  • S.-K. Cheng, Prinsip-prinsip desain sistem informasi visual, M.: Mir, 1994.

Yayasan Wikimedia. 2010 .

- dalam teknologi, arah ilmiah dan teknis yang terkait dengan pengembangan metode dan konstruksi sistem (termasuk berbasis komputer) untuk menetapkan kepemilikan suatu objek (subjek, proses, fenomena, situasi, sinyal) ke salah satu dari pra ... ... Kamus Ensiklopedis Besar

Salah satu daerah baru sibernetika. Isi dari teori R. tentang. adalah ekstrapolasi properti objek (gambar) milik beberapa kelas ke objek yang dekat dengan mereka dalam arti tertentu. Biasanya, ketika mengajar robot R. tentang. ada ... ... Ensiklopedia Geologi

Bahasa inggris pengakuan, gambar; Jerman Gestalt alterkennung. Cabang dari sibernetika matematika yang mengembangkan prinsip dan metode untuk mengklasifikasikan dan mengidentifikasi objek yang dijelaskan oleh serangkaian fitur terbatas yang menjadi ciri mereka. Antinazi. Ensiklopedia ... ... Ensiklopedia Sosiologi

Pengenalan pola- metode mempelajari objek kompleks dengan bantuan komputer; terdiri dari pemilihan fitur dan pengembangan algoritma dan program yang memungkinkan komputer untuk secara otomatis mengklasifikasikan objek menurut fitur ini. Misalnya untuk menentukan ... ... Kamus Ekonomi dan Matematika

- (teknis), arahan ilmiah dan teknis yang terkait dengan pengembangan metode dan konstruksi sistem (termasuk yang berbasis komputer) untuk menetapkan kepemilikan suatu objek (subjek, proses, fenomena, situasi, sinyal) ke salah satu sebelum ... ... kamus ensiklopedis

PENGENALAN POLA- bagian dari sibernetika matematika yang mengembangkan metode untuk mengklasifikasikan, serta mengidentifikasi objek, fenomena, proses, sinyal, situasi dari semua objek yang dapat dijelaskan oleh serangkaian fitur atau properti tertentu yang terbatas, ... ... Ensiklopedia sosiologi Rusia

pengenalan pola- 160 pengenalan pola: Identifikasi representasi bentuk dan konfigurasi menggunakan cara otomatis

Dalam artikel ini, saya menyoroti beberapa hasil mendasar dari teori pembelajaran mesin dengan cara yang membuat konsep dapat dipahami oleh pembaca yang agak akrab dengan masalah klasifikasi dan regresi. Gagasan untuk menulis artikel seperti itu semakin jelas memanifestasikan dirinya dalam pikiran saya dengan setiap buku yang saya baca, di mana ide-ide mengajar mesin pengenalan diceritakan seolah-olah dari tengah dan sama sekali tidak jelas apa penulis metode ini atau itu. diandalkan saat mengembangkannya. Di sisi lain, ada sejumlah buku yang dikhususkan untuk konsep dasar dalam pembelajaran mesin, tetapi penyajian materi di dalamnya mungkin tampak terlalu rumit untuk bacaan pertama.

Motivasi

Mari kita pertimbangkan tugas seperti itu. Kami memiliki apel dari dua kelas - enak dan tidak enak, 1 dan 0. Apel memiliki fitur - warna dan ukuran. Warna akan berubah terus menerus dari 0 ke 1, yaitu. 0 - apel benar-benar hijau, 1 - merah sepenuhnya. Ukurannya bisa berubah sama, 0 - apel kecil, 1 - besar. Kami ingin mengembangkan algoritme yang akan mengambil warna dan ukuran sebagai input, dan mengembalikan kelas apel sebagai output - apakah enak atau tidak. Sangat diharapkan bahwa jumlah kesalahan dalam hal ini semakin kecil semakin baik. Pada saat yang sama, kami memiliki daftar akhir yang berisi data historis tentang warna, ukuran, dan kelas apel. Bagaimana kita bisa memecahkan masalah seperti itu?

pendekatan logis

Memecahkan masalah kita, metode pertama yang mungkin muncul di benak mungkin adalah ini: mari kita buat aturan tipe if-else secara manual dan, tergantung pada nilai warna dan ukuran, kita akan menetapkan kelas tertentu ke apel. Itu. kami memiliki prasyarat - ini adalah warna dan ukuran, dan ada konsekuensinya - rasa apel. Cukup masuk akal bila ada beberapa tanda dan Anda dapat memperkirakan ambang batas untuk perbandingan dengan mata. Tetapi mungkin terjadi bahwa tidak mungkin untuk menghasilkan kondisi yang jelas, dan tidak jelas dari data ambang batas mana yang harus diambil, dan jumlah fitur dapat meningkat di masa mendatang. Tetapi bagaimana jika dalam daftar kami dengan data historis, kami menemukan dua apel dengan warna dan ukuran yang sama, tetapi yang satu ditandai enak, dan yang lainnya tidak? Jadi, metode pertama kami tidak sefleksibel dan terukur seperti yang kami inginkan.

Notasi

Mari kita perkenalkan notasi berikut. Kami akan menunjukkan apel th sebagai . Pada gilirannya, masing-masing terdiri dari dua angka - warna dan ukuran. Kami akan menunjukkan fakta ini dengan sepasang angka: . Kami menyatakan kelas setiap apel -th sebagai . Daftar dengan data historis akan dilambangkan dengan huruf , panjang daftar ini sama dengan . Elemen ke-th dari daftar ini adalah nilai atribut dari apel dan kelasnya. Itu. . Kami juga akan menyebutnya sampel. Dalam huruf kapital dan kami menunjukkan variabel yang dapat mengambil nilai dari fitur dan kelas tertentu. Kami memperkenalkan konsep baru - aturan keputusan adalah fungsi yang mengambil nilai warna dan ukuran sebagai input, dan mengembalikan label kelas sebagai output:

Pendekatan probabilistik

Mengembangkan ide metode logis dengan premis dan konsekuensi, mari kita ajukan pertanyaan pada diri sendiri - berapa probabilitas apel ke-, yang bukan milik sampel kita, akan enak, dengan nilai terukur​ dari warna dan ukuran? Dalam notasi teori probabilitas, pertanyaan ini dapat ditulis sebagai berikut:

Dalam ungkapan ini, dapat diartikan sebagai premis, sebagai konsekuensi, tetapi transisi dari premis ke konsekuensi akan mematuhi hukum probabilistik, bukan yang logis. Itu. alih-alih tabel kebenaran dengan nilai boolean 0 dan 1 untuk kelas, akan ada nilai probabilitas yang mengambil nilai dari 0 hingga 1. Mari kita terapkan rumus Bayes dan dapatkan ekspresi berikut:

Mari kita perhatikan sisi kanan dari ekspresi ini secara lebih rinci. Pengganda disebut probabilitas sebelumnya dan berarti probabilitas menemukan apel yang enak di antara semua apel yang mungkin. Peluang apriori untuk menemukan apel yang tidak enak adalah . Probabilitas ini mungkin mencerminkan pengetahuan pribadi kita tentang bagaimana apel yang baik dan buruk didistribusikan di alam. Misalnya, kita tahu dari pengalaman masa lalu kita bahwa 80% dari semua apel itu enak. Atau kita dapat memperkirakan nilai ini hanya dengan menghitung bagian apel lezat dalam daftar kita dengan data historis S. Pengganda berikutnya menunjukkan seberapa besar kemungkinannya untuk mendapatkan nilai warna dan ukuran tertentu untuk apel kelas 1. Ekspresi ini juga disebut fungsi kemungkinan dan dapat berupa beberapa distribusi tertentu, misalnya, normal. Kami menggunakan penyebut sebagai konstanta normalisasi sehingga probabilitas yang diinginkan bervariasi dari 0 hingga 1. Tujuan akhir kami bukanlah untuk menemukan probabilitas, tetapi untuk menemukan aturan keputusan yang akan segera memberi kami kelas. Bentuk akhir dari aturan keputusan tergantung pada nilai dan parameter apa yang kita ketahui. Misalnya, kita hanya dapat mengetahui nilai probabilitas sebelumnya, dan nilai lainnya tidak dapat diperkirakan. Kemudian aturan yang menentukan adalah sebagai berikut - untuk menetapkan ke semua apel nilai kelas yang probabilitas apriorinya paling besar. Itu. jika kita tahu bahwa 80% apel di alam itu enak, maka kita menempatkan kelas 1 untuk setiap apel, maka kesalahan kita adalah 20%. Jika kita juga dapat memperkirakan nilai fungsi kemungkinan $p(X=x_m | Y=1)$, maka kita juga dapat mencari nilai probabilitas yang diperlukan menggunakan rumus Bayes, seperti yang tertulis di atas. Aturan keputusan di sini adalah sebagai berikut: letakkan label kelas yang probabilitasnya maksimum:

Kami akan menyebut aturan ini classifier Bayesian. Karena kita berhadapan dengan probabilitas, bahkan nilai probabilitas yang besar tidak menjamin bahwa apel tersebut bukan milik kelas 0. Mari kita perkirakan probabilitas kesalahan pada apel sebagai berikut: jika aturan keputusan mengembalikan nilai kelas sama dengan 1, maka probabilitas kesalahan akan dan sebaliknya:

Kami tertarik pada probabilitas kesalahan pengklasifikasi tidak hanya dalam contoh khusus ini, tetapi secara umum untuk semua kemungkinan apel:

Ekspresi ini adalah ekspektasi matematis dari kesalahan. Jadi, memecahkan masalah awal, kami sampai pada pengklasifikasi Bayesian, tetapi apa kerugiannya? Masalah utama adalah untuk memperkirakan probabilitas bersyarat dari data. Dalam kasus kami, kami mewakili objek sebagai sepasang angka - warna dan ukuran, tetapi dalam tugas yang lebih kompleks, dimensi fitur bisa berkali-kali lebih tinggi, dan jumlah pengamatan dari daftar kami dengan data historis mungkin tidak cukup untuk memperkirakan probabilitas variabel acak multidimensi. Selanjutnya, kami akan mencoba untuk menggeneralisasi konsep kami tentang kesalahan pengklasifikasi, dan juga melihat apakah mungkin untuk memilih pengklasifikasi lain untuk menyelesaikan masalah.

Kerugian karena kesalahan pengklasifikasi

Misalkan kita sudah memiliki semacam aturan keputusan. Kemudian dapat membuat dua jenis kesalahan - yang pertama adalah untuk menetapkan objek ke kelas 0, yang memiliki kelas nyata 1, dan sebaliknya, untuk menetapkan objek ke kelas 1, yang memiliki kelas nyata 0. Dalam beberapa tugas, penting untuk membedakan antara kasus-kasus ini. Misalnya, kita lebih menderita karena apel yang diberi label enak ternyata tidak berasa dan sebaliknya. Kami memformalkan tingkat ketidaknyamanan kami dari harapan yang tertipu dalam konsep. Lebih umum, kami memiliki fungsi kerugian yang mengembalikan angka untuk setiap kesalahan pengklasifikasi. Membiarkan menjadi label kelas nyata. Fungsi kerugian kemudian mengembalikan nilai kerugian untuk label kelas aktual dan nilai aturan keputusan kami. Contoh penerapan fungsi ini - kami mengambil dari sebuah apel dengan kelas yang diketahui, kami meneruskan apel ke input dari aturan keputusan kami, kami mendapatkan perkiraan kelas dari aturan keputusan, jika nilainya dan cocok , maka kami menganggap bahwa pengklasifikasi tidak salah dan tidak ada kerugian, jika nilainya tidak cocok, maka jumlah kerugian fungsi kami akan mengatakan

Risiko bersyarat dan Bayesian

Sekarang kita memiliki fungsi kerugian dan mengetahui berapa banyak kita kehilangan dari kesalahan klasifikasi objek, akan lebih baik untuk memahami berapa banyak kita kehilangan rata-rata, lebih banyak objek. Jika kita mengetahui nilai - probabilitas bahwa apel ke-th akan enak, mengingat nilai warna dan ukuran yang diukur, serta nilai sebenarnya dari kelas (misalnya, ambil apel dari sampel S, lihat di awal artikel), maka kita dapat memperkenalkan konsep risiko bersyarat. Risiko bersyarat adalah nilai rata-rata kerugian pada fasilitas untuk aturan keputusan:

Dalam kasus klasifikasi biner kami, ternyata:

Di atas, kami menggambarkan aturan keputusan yang menetapkan objek ke kelas yang memiliki nilai probabilitas tertinggi Aturan seperti itu memberikan kerugian minimum rata-rata kami (risiko Bayesian), sehingga pengklasifikasi Bayesian optimal dalam hal fungsional risiko yang kami perkenalkan . Ini berarti bahwa pengklasifikasi Bayesian memiliki kesalahan klasifikasi sekecil mungkin.

Beberapa fungsi kerugian tipikal

Salah satu fungsi kerugian yang paling umum adalah fungsi simetris, ketika kerugian dari jenis kesalahan pertama dan kedua adalah setara. Misalnya, fungsi kerugian 1-0 (zero-one loss) didefinisikan sebagai berikut:

Maka risiko bersyarat untuk a(x) = 1 hanya akan menjadi nilai probabilitas mendapatkan kelas 0 pada objek :

Demikian pula untuk a(x) = 0:

Fungsi loss 1-0 mengambil nilai 1 jika pengklasifikasi membuat kesalahan pada objek dan 0 jika tidak. Sekarang mari kita buat agar nilai errornya bukan 1, melainkan fungsi Q yang lain, bergantung pada aturan keputusan dan label kelas sebenarnya:

Maka risiko bersyarat dapat ditulis sebagai berikut:

Catatan tentang notasi

Teks sebelumnya ditulis sesuai dengan notasi yang diadopsi dalam buku oleh Duda dan Hart. Dalam buku asli oleh V.N. Vapnik mempertimbangkan proses seperti itu: alam memilih objek sesuai dengan distribusi $p(x)$, dan kemudian memberikan label kelas untuk itu sesuai dengan distribusi bersyarat $p(y|x)$. Maka risiko (harapan kerugian) didefinisikan sebagai:

Dimana fungsi yang kita coba untuk mendekati ketergantungan yang tidak diketahui, adalah fungsi kerugian untuk nilai riil dan nilai fungsi kita . Notasi ini lebih deskriptif untuk memperkenalkan konsep selanjutnya - risiko empiris.

Risiko Empiris

Pada tahap ini, kami telah menemukan bahwa metode logis tidak cocok untuk kami, karena tidak cukup fleksibel, dan kami tidak dapat menggunakan classifier Bayesian ketika ada banyak fitur, dan jumlah data untuk pelatihan terbatas, dan kami tidak akan dapat mengembalikan probabilitas. Kita juga tahu bahwa pengklasifikasi Bayesian memiliki kesalahan klasifikasi sekecil mungkin. Karena kita tidak bisa menggunakan classifier Bayesian, mari kita ambil sesuatu yang lebih sederhana. Mari kita perbaiki beberapa keluarga parametrik fungsi H dan pilih pengklasifikasi dari keluarga ini.

Contoh: biarkan himpunan semua fungsi dari bentuk

Semua fungsi dari himpunan ini akan berbeda satu sama lain hanya dengan koefisien. Ketika kami memilih keluarga seperti itu, kami berasumsi bahwa dalam koordinat ukuran warna antara titik kelas 1 dan titik kelas 0 kita dapat menggambar garis lurus dengan koefisien sedemikian rupa cara bahwa titik-titik dengan kelas yang berbeda terletak di sepanjang sisi berlawanan dari garis lurus. Diketahui bahwa untuk garis lurus semacam ini, vektor koefisiennya adalah normal terhadap garis lurus. Sekarang kami melakukan ini - kami mengambil apel kami, mengukur warna dan ukurannya dan memplot titik dengan koordinat yang diperoleh pada grafik dalam sumbu ukuran warna. Selanjutnya, kita mengukur sudut antara titik ini dan vektor $w$. Kami mencatat bahwa titik kami dapat terletak di satu sisi atau di sisi lain dari garis. Maka sudut antara dan titik akan lancip atau tumpul, dan hasil kali skalarnya positif atau negatif. Di sinilah aturan keputusan masuk:

Setelah kami memperbaiki kelas fungsi $H$, muncul pertanyaan - bagaimana memilih fungsi darinya dengan koefisien yang diperlukan? Jawabannya adalah - mari kita pilih fungsi yang memberikan risiko Bayesian minimum $R()$ kita. Sekali lagi, masalahnya adalah untuk menghitung nilai risiko Bayesian, Anda perlu mengetahui distribusi $p(x,y)$, tetapi tidak diberikan kepada kami, dan tidak selalu mungkin untuk memulihkan dia. Ide lain adalah untuk meminimalkan risiko tidak pada semua objek yang mungkin, tetapi hanya pada sampel. Itu. meminimalkan fungsi:

Fungsi ini disebut risiko empiris. Pertanyaan selanjutnya adalah mengapa kami memutuskan bahwa dengan meminimalkan risiko empiris, kami juga meminimalkan risiko Bayesian? Biarkan saya mengingatkan Anda bahwa tugas praktis kita adalah membuat kesalahan klasifikasi sesedikit mungkin. Semakin sedikit kesalahan, semakin rendah risiko Bayesian. Alasan untuk konvergensi risiko empiris ke Bayesian dengan peningkatan jumlah data diperoleh pada tahun 70-an oleh dua ilmuwan - V. N. Vapnik dan A. Ya. Chervonenkis.

Jaminan Konvergensi. Kasus paling sederhana

Jadi, kami sampai pada kesimpulan bahwa pengklasifikasi Bayesian memberikan kesalahan sekecil mungkin, tetapi dalam banyak kasus kami tidak dapat melatihnya, dan kami juga tidak dapat menghitung kesalahan (risiko). Namun, kita dapat menghitung perkiraan risiko Bayesian, yang disebut risiko empiris, dan mengetahui risiko empiris, memilih fungsi pendekatan yang akan meminimalkan risiko empiris. Mari kita pertimbangkan situasi paling sederhana di mana minimalisasi risiko empiris menghasilkan pengklasifikasi yang juga meminimalkan risiko Bayesian. Untuk kasus yang paling sederhana, kita harus membuat asumsi yang jarang terpenuhi dalam praktik, tetapi dapat dilemahkan nanti. Kami memperbaiki kelas fungsi yang terbatas dari mana kami akan memilih pengklasifikasi kami dan menganggap bahwa fungsi nyata yang digunakan alam untuk menandai apel kami untuk rasa ada dalam kumpulan hipotesis yang terbatas ini: . Kami juga memiliki sampel yang diperoleh dari distribusi di atas objek. Semua objek sampel dianggap terdistribusi secara independen secara merata (iid). Maka yang berikut ini akan menjadi kenyataan

Dalil

Dengan memilih fungsi dari kelas menggunakan minimalisasi risiko empiris, kami dijamin menemukan satu yang memiliki nilai risiko Bayesian kecil jika sampel yang kami minimalkan berukuran cukup.

Untuk arti "nilai kecil" dan "ukuran cukup", lihat literatur di bawah ini.

Ide pembuktian

Dengan kondisi teorema, kami memperoleh sampel dari distribusi , yaitu. proses pemilihan objek dari alam dilakukan secara acak. Setiap kali kami mengumpulkan sampel, itu akan berasal dari distribusi yang sama, tetapi objek itu sendiri di dalamnya mungkin berbeda. Ide utama dari pembuktiannya adalah kita bisa mendapatkan sampel yang tidak menguntungkan sehingga algoritma yang kita pilih dengan meminimalkan risiko empiris pada sampel yang diberikan akan buruk dalam meminimalkan risiko Bayesian, tetapi pada saat yang sama akan baik untuk meminimalkan risiko empiris, tetapi probabilitas mendapatkan sampel seperti itu kecil dan ukuran sampel meningkat, probabilitas ini turun. Teorema serupa ada untuk asumsi yang lebih realistis, tetapi kami tidak akan membahasnya di sini.

Hasil praktis

Memiliki bukti bahwa fungsi yang ditemukan dengan meminimalkan risiko empiris tidak akan memiliki kesalahan besar pada data yang sebelumnya tidak teramati dengan ukuran sampel pelatihan yang cukup, kita dapat menggunakan prinsip ini dalam praktik, misalnya, sebagai berikut - kita ambil ekspresi:

Dan kami mengganti fungsi kerugian yang berbeda, tergantung pada masalah yang dipecahkan. Untuk regresi linier:

Untuk regresi logistik:

Meskipun mesin vektor pendukung terutama dimotivasi oleh geometri, mereka juga dapat dianggap sebagai masalah minimalisasi risiko empiris.

Kesimpulan

Banyak metode pengajaran yang diawasi dapat dipertimbangkan, antara lain, sebagai kasus khusus dari teori yang dikembangkan oleh V. N. Vapnik dan A. Ya. Chervonenkis. Teori ini memberikan jaminan mengenai kesalahan pada set pengujian, mengingat ukuran set pelatihan yang cukup dan beberapa persyaratan untuk ruang hipotesis di mana kami mencari algoritme kami.

Buku Bekas

  • Sifat Teori Pembelajaran Statistik, Vladimir N. Vapnik
  • Klasifikasi Pola, Edisi ke-2, Richard O. Duda, Peter E. Hart, David G. Stork
  • Memahami Pembelajaran Mesin: Dari Teori ke Algoritma, Shai Shalev-Shwartz, Shai Ben-David
P.S. Silakan tulis secara pribadi tentang semua ketidakakuratan dan kesalahan ketik

Tag: Tambahkan tag

Bab 3: Tinjauan Analitis Pengenalan Pola dan Metode Pengambilan Keputusan

Teori pengenalan pola dan otomatisasi kontrol

Tugas utama pengenalan pola adaptif

Recognition adalah proses informasi yang diimplementasikan oleh beberapa information converter (intelligent information channel, recognition system) yang memiliki input dan output. Masukan dari sistem adalah informasi tentang fitur apa saja yang dimiliki objek yang disajikan. Keluaran dari sistem menampilkan informasi tentang kelas mana (gambar umum) yang ditugaskan untuk objek yang dapat dikenali.

Saat membuat dan mengoperasikan sistem pengenalan pola otomatis, sejumlah tugas diselesaikan. Mari kita secara singkat dan sederhana mempertimbangkan tugas-tugas ini. Perlu dicatat bahwa perumusan masalah ini, dan himpunan itu sendiri, tidak sesuai dengan penulis yang berbeda, karena sampai batas tertentu tergantung pada model matematika tertentu yang menjadi dasar sistem pengenalan ini atau itu. Selain itu, beberapa tugas dalam model pengenalan tertentu tidak memiliki solusi dan, karenanya, tidak diajukan.

Tugas memformalkan area subjek

Padahal, tugas ini adalah tugas coding. Daftar kelas umum dikompilasi, yang mungkin mencakup implementasi objek tertentu, serta daftar fitur yang pada prinsipnya dapat dimiliki oleh objek ini.

Tugas membentuk sampel pelatihan

Sampel pelatihan adalah database yang berisi deskripsi implementasi objek tertentu dalam bahasa fitur, dilengkapi dengan informasi tentang kepemilikan objek ini ke kelas pengenalan tertentu.

Tugas melatih sistem pengenalan

Sampel pelatihan digunakan untuk membentuk gambar umum dari kelas pengenalan berdasarkan generalisasi informasi tentang fitur apa yang dimiliki objek sampel pelatihan yang termasuk dalam kelas ini dan kelas lainnya.

Masalah pengurangan dimensi ruang fitur

Setelah melatih sistem pengenalan (memperoleh statistik tentang distribusi frekuensi fitur berdasarkan kelas), menjadi mungkin untuk menentukan setiap fitur nilainya untuk memecahkan masalah pengenalan. Setelah itu, fitur yang paling tidak berharga dapat dihapus dari sistem fitur. Kemudian sistem pengenalan harus dilatih kembali, karena sebagai akibat dari penghapusan beberapa fitur, statistik distribusi fitur yang tersisa berdasarkan kelas berubah. Proses ini dapat diulang, mis. menjadi iteratif.

tugas pengakuan

Objek sampel dikenali diakui, yang, khususnya, dapat terdiri dari satu objek. Sampel yang dapat dikenali dibentuk mirip dengan sampel pelatihan, tetapi tidak mengandung informasi tentang kepemilikan objek ke kelas, karena inilah yang ditentukan dalam proses pengenalan. Hasil dari pengenalan setiap objek adalah distribusi atau daftar semua kelas pengenalan dalam urutan derajat kesamaan objek yang dikenali dengan mereka.

Tugas kontrol kualitas pengakuan

Setelah pengakuan, kecukupannya dapat ditetapkan. Untuk objek sampel pelatihan, ini dapat dilakukan segera, karena bagi mereka hanya diketahui dari kelas mana mereka berasal. Untuk objek lain, informasi ini dapat diperoleh nanti. Bagaimanapun, probabilitas kesalahan rata-rata aktual untuk semua kelas pengenalan dapat ditentukan, serta probabilitas kesalahan saat menetapkan objek yang dikenali ke kelas tertentu.

Hasil pengenalan harus ditafsirkan dengan mempertimbangkan informasi yang tersedia tentang kualitas pengenalan.

Tugas adaptasi

Jika, sebagai hasil dari prosedur pengendalian kualitas, ditemukan bahwa itu tidak memuaskan, maka deskripsi objek yang salah dikenali dapat disalin dari sampel yang dapat dikenali ke sampel pelatihan, dilengkapi dengan informasi klasifikasi yang memadai, dan digunakan untuk membentuk kembali keputusan. aturan, yaitu diperhitungkan. Selain itu, jika objek-objek ini tidak termasuk dalam kelas pengenalan yang sudah ada, yang dapat menjadi alasan untuk pengenalan yang salah, maka daftar ini dapat diperluas. Akibatnya, sistem pengenalan beradaptasi dan mulai mengklasifikasikan objek-objek ini secara memadai.

Masalah pengenalan terbalik

Tugas pengenalan adalah bahwa untuk objek tertentu, menurut fitur yang diketahui, sistem menetapkan miliknya ke beberapa kelas yang sebelumnya tidak diketahui. Dalam masalah pengenalan terbalik, sebaliknya, untuk kelas pengenalan yang diberikan, sistem menentukan fitur mana yang paling khas dari objek kelas ini dan mana yang bukan (atau objek sampel pelatihan mana yang termasuk dalam kelas ini).

Tugas cluster dan analisis konstruktif

Cluster adalah sekelompok objek, kelas, atau fitur sedemikian rupa sehingga dalam setiap cluster mereka semirip mungkin, dan di antara cluster yang berbeda mereka sedapat mungkin berbeda.

Sebuah konstruk (dalam konteks yang dipertimbangkan dalam bagian ini) adalah sistem dari cluster yang berlawanan. Jadi, dalam arti tertentu, konstruksi adalah hasil dari analisis klaster dari klaster.

Dalam analisis cluster, tingkat kesamaan dan perbedaan objek (kelas, fitur) diukur secara kuantitatif, dan informasi ini digunakan untuk klasifikasi. Hasil dari analisis klaster adalah pengklasifikasian objek berdasarkan klaster. Klasifikasi ini dapat direpresentasikan dalam bentuk jaringan semantik.

Tugas analisis kognitif

Dalam analisis kognitif, informasi tentang persamaan dan perbedaan kelas atau fitur menarik bagi peneliti itu sendiri, dan bukan untuk menggunakannya untuk klasifikasi, seperti dalam analisis klaster dan konstruktif.

Jika dua kelas pengenalan dicirikan oleh fitur yang sama, maka ini berkontribusi pada kesamaan kedua kelas ini. Jika untuk salah satu kelas fitur ini tidak seperti biasanya, maka ini berkontribusi pada perbedaan.

Jika dua tanda berkorelasi satu sama lain, maka dalam arti tertentu mereka dapat dianggap sebagai satu tanda, dan jika mereka antikorelasi, maka berbeda. Mempertimbangkan keadaan ini, kehadiran fitur yang berbeda di kelas yang berbeda juga memberikan kontribusi tertentu pada kesamaan dan perbedaannya.

Hasil analisis kognitif dapat disajikan dalam bentuk diagram kognitif.

Metode pengenalan pola dan karakteristiknya

Prinsip klasifikasi metode pengenalan pola

Pengenalan pola adalah tugas membangun dan menerapkan operasi formal pada representasi numerik atau simbolik dari objek dunia nyata atau ideal, yang hasil penyelesaiannya mencerminkan hubungan ekivalensi antara objek-objek ini. Relasi ekuivalensi mengungkapkan kepemilikan objek yang dievaluasi ke beberapa kelas, yang dianggap sebagai unit semantik independen.

Ketika membangun algoritma pengenalan, kelas ekivalensi dapat ditetapkan oleh seorang peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang kesamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian seseorang berbicara tentang "pengakuan dengan guru". Jika tidak, yaitu ketika sistem otomatis memecahkan masalah klasifikasi tanpa melibatkan informasi pelatihan eksternal, seseorang berbicara tentang klasifikasi otomatis atau "pengenalan tanpa pengawasan". Sebagian besar algoritma pengenalan pola membutuhkan daya komputasi yang sangat signifikan, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin dan lain-lain) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, nonparametrik, dan heuristik, sementara yang lain memilih kelompok metode berdasarkan aliran sejarah dan tren di lapangan. Misalnya, dalam karya yang memberikan gambaran akademis tentang metode pengenalan, tipologi metode pengenalan pola berikut digunakan:

  • metode berdasarkan prinsip pemisahan;
  • metode statistik;
  • metode yang dibangun berdasarkan "fungsi potensial";
  • metode untuk menghitung nilai (voting);
  • metode berdasarkan kalkulus proposisional, khususnya pada peralatan aljabar logika.

Klasifikasi ini didasarkan pada perbedaan dalam metode formal pengenalan pola, dan oleh karena itu pertimbangan pendekatan heuristik untuk pengenalan, yang telah menerima pengembangan penuh dan memadai dalam sistem pakar, dihilangkan. Pendekatan heuristik didasarkan pada pengetahuan dan intuisi peneliti yang sulit diformalkan. Pada saat yang sama, peneliti sendiri menentukan informasi apa dan bagaimana sistem harus digunakan untuk mencapai efek pengenalan yang diinginkan.

Tipologi metode pengenalan yang serupa dengan berbagai tingkat detail ditemukan di banyak karya tentang pengenalan. Pada saat yang sama, tipologi terkenal tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara pengetahuan tentang bidang subjek diwakili menggunakan beberapa algoritma pengenalan pola formal.

D.A. Pospelov (1990) mengidentifikasi dua cara utama untuk merepresentasikan pengetahuan:

  • intensional, berupa skema hubungan antar atribut (fitur).
  • ekstensional, dengan bantuan fakta spesifik (objek, contoh).

Representasi intensional menangkap pola dan hubungan yang menjelaskan struktur data. Berkenaan dengan tugas diagnostik, fiksasi tersebut terdiri dalam menentukan operasi pada atribut (fitur) objek yang mengarah pada hasil diagnostik yang diperlukan. Representasi intensional diimplementasikan melalui operasi pada nilai atribut dan tidak menyiratkan operasi pada fakta informasi tertentu (objek).

Pada gilirannya, representasi pengetahuan ekstensional dikaitkan dengan deskripsi dan fiksasi objek tertentu dari area subjek dan diimplementasikan dalam operasi, yang elemen-elemennya adalah objek sebagai sistem integral.

Adalah mungkin untuk menarik analogi antara representasi pengetahuan yang intensional dan ekstensional dan mekanisme yang mendasari aktivitas belahan kiri dan kanan otak manusia. Jika belahan kanan dicirikan oleh representasi prototipikal holistik dari dunia sekitarnya, maka belahan kiri beroperasi dengan pola yang mencerminkan hubungan atribut dunia ini.

Dua cara mendasar dari representasi pengetahuan yang dijelaskan di atas memungkinkan kami untuk mengusulkan klasifikasi metode pengenalan pola berikut:

  • metode intensional berdasarkan operasi dengan atribut.
  • metode ekstensional berdasarkan operasi dengan objek.

Perlu ditekankan bahwa keberadaan dua (dan hanya dua) kelompok metode pengenalan ini: yang beroperasi dengan fitur dan yang beroperasi dengan objek, sangat alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan untuk membentuk refleksi yang memadai dari area subjek. Menurut penulis, antara metode ini ada hubungan saling melengkapi dalam arti N. Bohr, oleh karena itu, sistem pengenalan yang menjanjikan harus memastikan penerapan kedua metode ini, dan bukan hanya salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang dikemukakan oleh D. A. Pospelov didasarkan pada hukum-hukum dasar yang melandasi cara kognisi manusia pada umumnya, yang menempatkannya pada posisi yang sangat istimewa (istimewa) dibandingkan dengan klasifikasi lain yang terlihat lebih ringan dan artifisial.

Metode Intensional

Ciri khas dari metode intensional adalah bahwa mereka menggunakan karakteristik yang berbeda dari fitur dan hubungan mereka sebagai elemen operasi dalam konstruksi dan penerapan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitik atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola intensional sangat luas, dan pembagiannya menjadi subclass agak sewenang-wenang.

Metode berdasarkan perkiraan kepadatan distribusi nilai fitur

Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek studi dianggap sebagai realisasi dari variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut beberapa hukum. Mereka didasarkan pada skema pengambilan keputusan Bayesian yang mengacu pada probabilitas apriori objek milik kelas tertentu yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini direduksi untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Pengelompokan metode berdasarkan estimasi densitas distribusi nilai ciri berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian untuk pengambilan keputusan adalah salah satu yang paling berkembang dalam statistik modern, yang disebut metode parametrik, di mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sebagian kecil jumlah parameter (vektor rata-rata dan matriks kovarians) perlu diestimasi.

Kesulitan utama dalam menerapkan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap ketidakterwakilan sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan

Dalam kelompok metode ini, bentuk umum dari fungsi keputusan dianggap diketahui dan kualitas fungsionalnya diberikan. Berdasarkan fungsional ini, pendekatan terbaik dari fungsi keputusan ditemukan dari urutan pelatihan. Yang paling umum adalah representasi dari fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Kualitas fungsional aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama dari metode berdasarkan asumsi tentang kelas fungsi keputusan adalah kejelasan rumusan matematis dari masalah pengenalan sebagai masalah menemukan ekstrem. Keragaman metode kelompok ini dijelaskan oleh berbagai fungsi kualitas aturan keputusan yang digunakan dan algoritma pencarian ekstrem. Generalisasi dari algoritma yang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik.

Kemungkinan algoritma gradien untuk menemukan ekstrem, terutama dalam kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kasus ketika kelas objek yang dapat dikenali ditampilkan dalam ruang fitur oleh struktur geometris yang kompak.

Kualitas aturan keputusan yang cukup tinggi dapat dicapai dengan menggunakan algoritme yang tidak memiliki bukti matematis yang ketat tentang konvergensi solusi ke ekstrem global. Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusioner. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna dari objek kompleks dengan pemodelan fenomenologis evolusinya. Perwakilan terkenal dari pemodelan evolusioner dalam pengenalan pola adalah metode akuntansi kelompok argumen (MGUA). GMDH didasarkan pada prinsip pengaturan diri, dan algoritma GMDH mereproduksi skema seleksi massal.

Namun, pencapaian tujuan praktis dalam hal ini tidak disertai dengan ekstraksi pengetahuan baru tentang sifat objek yang dapat dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), pada dasarnya dibatasi di sini oleh struktur tertentu dari interaksi tersebut, yang ditetapkan dalam bentuk yang dipilih dari fungsi yang menentukan.

Metode Boolean

Metode logika pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuk yang paling umum, metode logis dapat dicirikan sebagai semacam pencarian pola logis dalam sampel pelatihan dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang memiliki bobot sendiri. Kelompok metode logis beragam dan mencakup metode berbagai kompleksitas dan kedalaman analisis. Untuk fitur dikotomis (boolean), yang disebut pengklasifikasi seperti pohon, metode pengujian buntu, algoritma Bark, dll. sangat populer.

Algoritma Kora, seperti metode logis lainnya dari pengenalan pola, cukup melelahkan dalam hal perhitungan, karena enumerasi lengkap diperlukan saat memilih konjungsi. Oleh karena itu, ketika menerapkan metode logis, persyaratan tinggi ditempatkan pada organisasi yang efisien dari proses komputasi, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Metode linguistik (struktural)

Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa yang dapat digunakan untuk menggambarkan seperangkat properti objek yang dapat dikenali.

Untuk kelas objek yang berbeda, elemen non-turunan (atom) (subgambar, tanda) dan kemungkinan hubungan di antara mereka dibedakan. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jadi, setiap objek adalah kumpulan elemen non-turunan, "terhubung" satu sama lain dalam satu atau lain cara, atau, dengan kata lain, oleh "kalimat" dari beberapa "bahasa". Saya ingin menekankan nilai ideologis yang sangat signifikan dari pemikiran ini.

Dengan mem-parsing (mengurai) sebuah "kalimat", "kebenaran" sintaksisnya ditentukan, atau, secara setara, apakah beberapa tata bahasa tetap yang menggambarkan suatu kelas dapat menghasilkan deskripsi objek yang ada.

Namun, tugas memulihkan (mendefinisikan) tata bahasa dari serangkaian pernyataan (kalimat - deskripsi objek) tertentu yang menghasilkan bahasa tertentu sulit untuk diformalkan.

Metode Ekstensi

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang dipelajari diberikan nilai diagnostik independen pada tingkat yang lebih besar atau lebih kecil. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap orang bukan sebagai rantai objek yang diberi peringkat menurut satu atau lain indikator, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek studi tidak memungkinkan seseorang untuk mengecualikan atau kehilangan informasi tentang setiap objek individu, yang terjadi ketika menerapkan metode arah yang disengaja, menggunakan objek hanya untuk mendeteksi dan memperbaiki pola perilaku atributnya.

Operasi utama dalam pengenalan pola menggunakan metode yang dibahas adalah operasi menentukan kesamaan dan perbedaan objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Pada saat yang sama, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas terluas: dari partisipasi utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk solusi yang berhasil: dari satu di setiap kelas yang dapat dikenali hingga seluruh ukuran sampel, serta cara yang berbeda untuk menghitung ukuran kesamaan dan perbedaan objek. Persyaratan ini menjelaskan pembagian lebih lanjut dari metode ekstensional ke dalam subkelas.

Metode perbandingan prototipe

Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, dalam kasus ketika kelas yang dikenali ditampilkan di ruang fitur dengan pengelompokan geometris yang kompak. Dalam hal ini, pusat pengelompokan geometris kelas (atau objek yang paling dekat dengan pusat) biasanya dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, prototipe yang paling dekat dengannya ditemukan, dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelas, tidak ada gambar kelas umum yang terbentuk dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi indikatif informasi tentang struktur data. Menggunakan representasi di atas, misalnya, setiap skala pengukuran tradisional, yang merupakan fungsi linier dari nilai-nilai fitur dikotomis, dapat dianggap sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas yang dikenali memungkinkan kita untuk menyimpulkan bahwa mereka kompak secara geometris, maka cukup untuk mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dari contoh ideal yang digambarkan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan prototipe kelas diagnostik menghadapi masalah yang sulit.

Pertama, itu adalah pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial dari distribusi objek. Kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang khas untuk masalah nyata.

k metode tetangga terdekat

Metode k tetangga terdekat untuk memecahkan masalah analisis diskriminan pertama kali diusulkan kembali pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) objek lain yang secara geometris terdekat dengannya di ruang fitur (tetangga terdekat) dengan kelas yang dapat dikenali yang sudah diketahui. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang keanggotaan yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k tetangga terdekat dianggap sebagai metode nonparametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, estimasi teoritis dari efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Terbukti bahwa probabilitas kesalahan asimtotik untuk metode k tetangga terdekat melebihi kesalahan aturan Bayes tidak lebih dari dua kali.

Saat menggunakan metode k tetangga terdekat untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah dalam kondisi ruang fitur berdimensi tinggi ini sangat diperparah karena cukup melelahkannya metode ini, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, serta dalam metode perbandingan prototipe, perlu untuk memecahkan masalah kreatif dalam menganalisis struktur multidimensi data eksperimen untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Kebutuhan untuk mengurangi jumlah objek dalam sampel pelatihan (preseden diagnostik) adalah kerugian dari metode ini, karena mengurangi keterwakilan sampel pelatihan.

Algoritma untuk menghitung nilai ("voting")

Prinsip pengoperasian algoritma evaluasi (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan "kedekatan" dari objek yang dikenali dan referensi menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari serangkaian fitur yang diberikan. .

Tidak seperti semua metode yang dipertimbangkan sebelumnya, algoritme untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritma ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO membawa gagasan untuk menggunakan fitur ke tujuan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, di ABO tingkat kesamaan objek dihitung dengan membandingkan semua kemungkinan atau kombinasi fitur tertentu. termasuk dalam deskripsi objek.

Kombinasi atribut (subruang) yang digunakan disebut set pendukung atau set deskripsi parsial objek. Konsep kedekatan umum antara objek yang dikenali dan objek sampel pelatihan (dengan klasifikasi yang diketahui), yang disebut objek referensi, diperkenalkan. Kedekatan ini diwakili oleh kombinasi kedekatan objek yang dikenali dengan objek referensi yang dihitung pada kumpulan deskripsi parsial. Jadi, ABO adalah perluasan dari metode k tetangga terdekat, di mana kedekatan objek dianggap hanya dalam satu ruang fitur yang diberikan.

Perpanjangan lain dari ABO adalah bahwa dalam algoritma ini masalah penentuan kesamaan dan perbedaan objek dirumuskan sebagai satu parametrik dan tahap pengaturan ABO sesuai dengan sampel pelatihan dipilih, di mana nilai optimal dari ABO dipilih. parameter yang dimasukkan dipilih. Kriteria kualitas adalah kesalahan pengenalan, dan secara harfiah semuanya diparameterisasi:

  • aturan untuk menghitung kedekatan objek dengan fitur individu;
  • aturan untuk menghitung kedekatan objek di subruang fitur;
  • tingkat kepentingan objek referensi tertentu sebagai preseden diagnostik;
  • signifikansi kontribusi setiap set fitur referensi untuk penilaian akhir kesamaan objek yang dikenali dengan kelas diagnostik apa pun.

Parameter pendingin udara ditetapkan dalam bentuk nilai ambang batas dan (atau) sebagai bobot komponen yang ditentukan.

Kemungkinan teoritis ABO setidaknya tidak lebih rendah daripada algoritma pengenalan pola lainnya, karena dengan bantuan ABO semua operasi yang dapat dibayangkan dengan objek yang diteliti dapat diimplementasikan.

Tetapi, seperti yang biasa terjadi, perluasan potensi menghadapi kesulitan besar dalam implementasi praktisnya, terutama pada tahap konstruksi (penyetelan) algoritma jenis ini.

Kesulitan terpisah dicatat sebelumnya ketika membahas metode k tetangga terdekat, yang dapat ditafsirkan sebagai versi ABO yang terpotong. Ini juga dapat dipertimbangkan dalam bentuk parametrik dan masalahnya dapat direduksi menjadi menemukan metrik berbobot dari jenis yang dipilih. Pada saat yang sama, sudah di sini untuk masalah dimensi tinggi, pertanyaan teoretis kompleks dan masalah yang terkait dengan organisasi proses komputasi yang efisien muncul.

Untuk ABO, jika Anda mencoba menggunakan kemampuan algoritma ini secara penuh, kesulitan ini meningkat berkali-kali lipat.

Masalah yang dicatat menjelaskan bahwa dalam praktik penggunaan ABO untuk memecahkan masalah berdimensi tinggi disertai dengan pengenalan batasan dan asumsi heuristik. Secara khusus, ada contoh penggunaan ABO dalam psikodiagnostik, di mana jenis ABO diuji, yang sebenarnya setara dengan metode k tetangga terdekat.

Kolektif Aturan yang Menentukan

Di akhir tinjauan metode pengenalan pola, mari kita membahas satu pendekatan lagi. Inilah yang disebut tim aturan keputusan (CRC).

Karena algoritma pengenalan yang berbeda berperilaku berbeda pada sampel objek yang sama, pertanyaan secara alami muncul dari aturan keputusan sintetis yang secara adaptif menggunakan kekuatan algoritma ini. Aturan keputusan sintetik menggunakan skema pengenalan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi bekerja, yang hasilnya digabungkan pada tingkat kedua di blok sintesis. Metode yang paling umum dari kombinasi semacam itu didasarkan pada alokasi area kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan bidang kompetensi adalah dengan apriori membagi ruang atribut berdasarkan pertimbangan profesional dari ilmu tertentu (misalnya, stratifikasi sampel menurut beberapa atribut). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan dari objek yang dapat dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis menganggap indikator yang dihasilkan dari algoritma parsial sebagai fitur awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah membuat seperangkat aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan penelitian dan deskripsi konstruktif dari algoritma pengenalan, di mana semua jenis algoritma yang ada cocok.

Analisis komparatif metode pengenalan pola

Mari kita bandingkan metode pengenalan pola yang dijelaskan di atas dan mengevaluasi tingkat kecukupannya dengan persyaratan yang dirumuskan dalam Bagian 3.3.3 untuk model SDA untuk sistem kontrol otomatis adaptif untuk sistem yang kompleks.

Untuk memecahkan masalah nyata dari kelompok metode arah intensional, metode parametrik dan metode berdasarkan proposal dalam bentuk fungsi yang menentukan memiliki nilai praktis. Metode parametrik membentuk dasar metodologi tradisional untuk membangun indikator. Penerapan metode ini dalam masalah nyata dikaitkan dengan pengenaan pembatasan yang kuat pada struktur data, yang mengarah pada model diagnostik linier dengan perkiraan parameter yang sangat mendekati. Ketika menggunakan metode berdasarkan asumsi tentang bentuk fungsi keputusan, peneliti juga terpaksa beralih ke model linier. Hal ini disebabkan oleh dimensi tinggi dari ruang fitur, yang khas untuk masalah nyata, yang, dengan peningkatan derajat fungsi keputusan polinomial, memberikan peningkatan besar dalam jumlah anggotanya dengan peningkatan bermasalah seiring dalam kualitas pengakuan. Dengan demikian, memproyeksikan area penerapan potensial metode pengenalan intensional ke masalah nyata, kami mendapatkan gambaran yang sesuai dengan metodologi tradisional model diagnostik linier yang mapan.

Sifat-sifat model diagnostik linier, di mana indikator diagnostik diwakili oleh jumlah bobot fitur awal, dipelajari dengan baik. Hasil dari model ini (dengan normalisasi yang sesuai) diinterpretasikan sebagai jarak dari objek yang diteliti ke beberapa hyperplane di ruang fitur atau, secara ekuivalen, sebagai proyeksi objek ke beberapa garis lurus dalam ruang yang diberikan. Oleh karena itu, model linier hanya memadai untuk konfigurasi geometris sederhana dari wilayah ruang fitur di mana objek dari kelas diagnostik yang berbeda dipetakan. Dengan distribusi yang lebih kompleks, model ini pada dasarnya tidak dapat mencerminkan banyak fitur dari struktur data eksperimental. Pada saat yang sama, fitur tersebut dapat memberikan informasi diagnostik yang berharga.

Pada saat yang sama, penampilan dalam setiap masalah nyata dari struktur multidimensi sederhana (khususnya, distribusi normal multidimensi) harus dianggap sebagai pengecualian daripada sebagai aturan. Seringkali, kelas diagnostik dibentuk berdasarkan kriteria eksternal yang kompleks, yang secara otomatis memerlukan heterogenitas geometrik kelas-kelas ini dalam ruang fitur. Hal ini terutama berlaku untuk kriteria “kehidupan” yang paling sering ditemui dalam praktik. Dalam kondisi seperti itu, penggunaan model linier hanya memperbaiki pola informasi eksperimental yang paling "kasar".

Penggunaan metode ekstensional tidak dikaitkan dengan asumsi tentang struktur informasi eksperimental, kecuali bahwa dalam kelas yang diakui harus ada satu atau lebih kelompok objek yang agak mirip, dan objek dari kelas yang berbeda harus berbeda satu sama lain dalam beberapa hal. jalan. Jelas bahwa untuk setiap dimensi terbatas dari sampel pelatihan (dan tidak boleh berbeda), persyaratan ini selalu dipenuhi hanya karena ada perbedaan acak antara objek. Berbagai ukuran kedekatan (distance) objek dalam ruang fitur digunakan sebagai ukuran kesamaan. Oleh karena itu, penggunaan efektif metode pengenalan pola ekstensional bergantung pada seberapa baik ukuran kedekatan ini ditentukan, serta objek sampel pelatihan mana (objek dengan klasifikasi yang diketahui) memainkan peran preseden diagnostik. Solusi yang berhasil dari masalah ini memberikan hasil yang mendekati batas efisiensi pengenalan yang dapat dicapai secara teoritis.

Keuntungan dari metode ekstensional pengenalan pola ditentang, pertama-tama, oleh kompleksitas teknis yang tinggi dari implementasi praktisnya. Untuk ruang fitur berdimensi tinggi, tugas yang tampaknya sederhana untuk menemukan pasangan titik terdekat berubah menjadi masalah serius. Juga, banyak penulis mencatat sebagai masalah kebutuhan untuk mengingat sejumlah besar objek yang mewakili kelas yang dapat dikenali.

Dalam dirinya sendiri, ini bukan masalah, tetapi dianggap sebagai masalah (misalnya, dalam metode k tetangga terdekat) dengan alasan bahwa ketika mengenali setiap objek, enumerasi lengkap semua objek dalam sampel pelatihan terjadi.

Oleh karena itu, disarankan untuk menerapkan model sistem pengenalan, di mana masalah penghitungan lengkap objek sampel pelatihan selama pengenalan dihilangkan, karena itu dilakukan hanya sekali ketika membentuk gambar umum dari kelas pengenalan. Dalam pengenalan itu sendiri, objek yang diidentifikasi hanya dibandingkan dengan gambar umum dari kelas pengenalan, yang jumlahnya tetap dan tidak bergantung sama sekali pada dimensi sampel pelatihan. Pendekatan ini memungkinkan Anda untuk meningkatkan dimensi sampel pelatihan hingga kualitas gambar umum yang disyaratkan tercapai, tanpa rasa takut bahwa hal ini dapat menyebabkan peningkatan waktu pengenalan yang tidak dapat diterima (karena waktu pengenalan dalam model ini tidak bergantung pada dimensi pelatihan sama sekali).

Masalah teoritis penerapan metode pengenalan ekstensional terkait dengan masalah pencarian kelompok fitur yang informatif, menemukan metrik yang optimal untuk mengukur kesamaan dan perbedaan objek, dan menganalisis struktur informasi eksperimental. Pada saat yang sama, solusi sukses dari masalah ini memungkinkan tidak hanya merancang algoritma pengenalan yang efektif, tetapi juga membuat transisi dari pengetahuan ekstensional tentang fakta empiris ke pengetahuan intensional tentang pola strukturnya.

Transisi dari pengetahuan ekstensional ke pengetahuan intensional terjadi pada tahap ketika algoritma pengenalan formal telah dibangun dan efektivitasnya telah ditunjukkan. Kemudian studi tentang mekanisme yang digunakan untuk mencapai efisiensi yang diperoleh. Studi semacam itu, terkait dengan analisis struktur geometris data, dapat, misalnya, mengarah pada kesimpulan bahwa cukup untuk mengganti objek yang mewakili kelas diagnostik tertentu dengan satu perwakilan tipikal (prototipe). Ini setara, seperti disebutkan di atas, untuk menetapkan skala diagnostik linier tradisional. Mungkin juga cukup untuk mengganti setiap kelas diagnostik dengan beberapa objek yang bermakna sebagai perwakilan khas dari beberapa subkelas, yang setara dengan membangun kipas skala linier. Ada opsi lain, yang akan dibahas di bawah.

Dengan demikian, tinjauan metode pengenalan menunjukkan bahwa sejumlah metode pengenalan pola yang berbeda telah dikembangkan secara teoritis saat ini. Literatur memberikan klasifikasi rinci dari mereka. Namun, untuk sebagian besar metode ini, implementasi perangkat lunaknya tidak ada, dan ini sangat alami, bahkan dapat dikatakan "ditentukan sebelumnya" oleh karakteristik metode pengenalan itu sendiri. Hal ini dapat dinilai dari fakta bahwa sistem seperti itu sedikit disebutkan dalam literatur khusus dan sumber informasi lainnya.

Akibatnya, pertanyaan tentang penerapan praktis dari metode pengenalan teoretis tertentu untuk memecahkan masalah praktis dengan dimensi data nyata (yaitu, cukup signifikan) dan pada komputer modern nyata masih kurang berkembang.

Keadaan di atas dapat dipahami jika kita mengingat kembali bahwa kompleksitas model matematika secara eksponensial meningkatkan kompleksitas implementasi perangkat lunak dari sistem dan pada tingkat yang sama mengurangi kemungkinan bahwa sistem ini akan bekerja dalam praktik. Ini berarti bahwa hanya sistem perangkat lunak berdasarkan model matematika yang cukup sederhana dan "transparan" yang dapat diimplementasikan di pasar. Oleh karena itu, pengembang yang tertarik untuk mereplikasi produk perangkat lunaknya mendekati masalah pemilihan model matematika bukan dari sudut pandang ilmiah semata, tetapi sebagai seorang pragmatis, dengan mempertimbangkan kemungkinan implementasi perangkat lunak. Ia percaya bahwa model harus sesederhana mungkin, yang berarti harus dilaksanakan dengan biaya lebih rendah dan dengan kualitas yang lebih baik, dan juga harus bekerja (secara praktis efektif).

Dalam hal ini, tugas menerapkan dalam sistem pengenalan mekanisme untuk menggeneralisasi deskripsi objek yang termasuk dalam kelas yang sama, mis. mekanisme untuk pembentukan gambar umum yang kompak. Jelas bahwa mekanisme generalisasi seperti itu akan memungkinkan "mengompresi" sampel pelatihan apa pun dalam hal dimensi ke dasar gambar umum yang diketahui sebelumnya dalam hal dimensi. Ini juga akan memungkinkan kita untuk menetapkan dan memecahkan sejumlah masalah yang bahkan tidak dapat dirumuskan dalam metode pengenalan seperti perbandingan dengan metode prototipe, metode k tetangga terdekat, dan ABO.

Ini adalah tugas-tugasnya:

  • menentukan kontribusi informasi fitur ke potret informasi dari gambar umum;
  • analisis klaster-konstruktif dari gambar umum;
  • penentuan beban semantik atribut;
  • analisis semantik cluster-konstruktif fitur;
  • perbandingan yang bermakna dari gambar kelas umum satu sama lain dan fitur satu sama lain (diagram kognitif, termasuk diagram Merlin).

Metode yang memungkinkan untuk mencapai solusi dari masalah ini juga membedakan sistem perspektif berdasarkan itu dari sistem lain, sama seperti compiler berbeda dari interpreter, karena karena pembentukan gambar umum dalam sistem perspektif ini, waktu pengenalan tidak tergantung pada ukuran sampel pelatihan. Diketahui bahwa keberadaan ketergantungan inilah yang menyebabkan waktu komputer yang secara praktis tidak dapat diterima dihabiskan untuk pengenalan dalam metode seperti metode k tetangga terdekat, ABO, dan CLD pada dimensi sampel pelatihan seperti itu, ketika kita dapat berbicara tentang statistik yang cukup. .

Sebagai kesimpulan dari tinjauan singkat tentang metode pengenalan, kami menyajikan esensi di atas dalam tabel ringkasan (Tabel 3.1), yang berisi deskripsi singkat tentang berbagai metode pengenalan pola dalam parameter berikut:

  • klasifikasi metode pengenalan;
  • bidang penerapan metode pengenalan;
  • klasifikasi keterbatasan metode pengenalan.
Klasifikasi metode pengenalan Area aplikasi Keterbatasan (kekurangan)
Metode pengenalan intensif Metode berdasarkan perkiraan kepadatan distribusi nilai fitur (atau persamaan dan perbedaan antara objek) Masalah dengan distribusi yang diketahui, biasanya normal, kebutuhan untuk mengumpulkan statistik yang besar Kebutuhan untuk menghitung seluruh set pelatihan selama pengenalan, sensitivitas tinggi terhadap non-representatif dari set pelatihan dan artefak
Metode berdasarkan asumsi tentang kelas fungsi keputusan Kelas harus dapat dipisahkan dengan baik, sistem fitur harus ortonormal Bentuk fungsi keputusan harus diketahui terlebih dahulu. Ketidakmungkinan untuk mempertimbangkan pengetahuan baru tentang korelasi antar fitur
Metode Boolean Ketika memilih aturan keputusan logis (konjungsi), enumerasi lengkap diperlukan. Kompleksitas komputasi yang tinggi
Metode linguistik (struktural) Masalah dimensi kecil ruang fitur Tugas memulihkan (mendefinisikan) tata bahasa dari serangkaian pernyataan (deskripsi objek) tertentu sulit untuk diformalkan. Masalah teoretis yang belum terselesaikan
Metode pengenalan ekstensional Metode perbandingan prototipe Masalah dimensi kecil ruang fitur Ketergantungan yang tinggi dari hasil klasifikasi pada ukuran jarak (metrik). Metrik optimal tidak diketahui
k metode tetangga terdekat Ketergantungan yang tinggi dari hasil klasifikasi pada ukuran jarak (metrik). Kebutuhan untuk enumerasi lengkap dari sampel pelatihan selama pengakuan. Kompleksitas komputasi
Algoritma untuk menghitung nilai (voting) AVO Masalah dimensi kecil dalam hal jumlah kelas dan fitur Ketergantungan hasil klasifikasi pada ukuran jarak (metrik). Kebutuhan untuk enumerasi lengkap dari sampel pelatihan selama pengakuan. Kompleksitas teknis yang tinggi dari metode ini
Kolektif Aturan Tegas (CRC) Masalah dimensi kecil dalam hal jumlah kelas dan fitur Kompleksitas teknis metode yang sangat tinggi, sejumlah masalah teoretis yang belum terselesaikan, baik dalam menentukan bidang kompetensi metode tertentu, maupun dalam metode tertentu itu sendiri.

Tabel 3.1 - Tabel ringkasan klasifikasi metode pengenalan, perbandingan area aplikasi dan batasannya

Peran dan tempat pengenalan pola dalam otomatisasi manajemen sistem yang kompleks

Sistem kontrol otomatis terdiri dari dua bagian utama: objek kontrol dan sistem kontrol.

Sistem kontrol melakukan fungsi-fungsi berikut:

  • identifikasi keadaan objek kontrol;
  • pengembangan tindakan kontrol berdasarkan tujuan manajemen, dengan mempertimbangkan keadaan objek kontrol dan lingkungan;
  • memberikan efek kontrol pada objek kontrol.

Pengenalan pola tidak lebih dari identifikasi keadaan beberapa objek.

Oleh karena itu, kemungkinan penggunaan sistem pengenalan pola pada tahap mengidentifikasi keadaan objek kontrol tampaknya cukup jelas dan alami. Namun, ini mungkin tidak diperlukan. Oleh karena itu, muncul pertanyaan dalam kasus mana disarankan untuk menggunakan sistem pengenalan dalam sistem kontrol otomatis, dan di mana tidak.

Menurut data literatur, dalam banyak sistem kontrol otomatis yang dikembangkan sebelumnya dan modern dalam subsistem untuk mengidentifikasi keadaan objek kontrol dan menghasilkan tindakan kontrol, model matematika deterministik "penghitungan langsung" digunakan, yang secara jelas dan sederhana menentukan apa yang harus dilakukan. lakukan dengan objek kontrol jika memiliki parameter eksternal tertentu.

Pada saat yang sama, pertanyaan tentang bagaimana parameter ini terkait dengan keadaan tertentu dari objek kontrol tidak diangkat atau diselesaikan. Posisi ini sesuai dengan sudut pandang, yang terdiri dari fakta bahwa hubungan satu-ke-satu mereka diterima "secara default". Oleh karena itu, istilah: "parameter objek kontrol" dan "keadaan objek kontrol" dianggap sebagai sinonim, dan konsep "keadaan objek kontrol" tidak diperkenalkan secara eksplisit sama sekali. Namun, jelas bahwa, dalam kasus umum, hubungan antara parameter yang diamati dari objek kontrol dan keadaannya adalah dinamis dan probabilistik.

Dengan demikian, sistem kontrol otomatis tradisional pada dasarnya adalah sistem kontrol parametrik, yaitu sistem yang mengelola bukan status objek kontrol, tetapi hanya parameter yang dapat diamati. Keputusan tentang tindakan kontrol diambil dalam sistem seperti itu seolah-olah "secara membabi buta", yaitu. tanpa membentuk gambaran holistik dari objek kontrol dan lingkungan dalam keadaan mereka saat ini, serta tanpa memprediksi perkembangan lingkungan dan reaksi objek kontrol terhadap tindakan kontrol tertentu di atasnya, bertindak secara bersamaan dengan pengaruh lingkungan yang diprediksi. .

Dari posisi yang dikembangkan dalam makalah ini, istilah "pengambilan keputusan" dalam pengertian modern hampir tidak dapat diterapkan pada sistem kontrol otomatis tradisional. Faktanya adalah bahwa "pengambilan keputusan", setidaknya, melibatkan visi holistik dari suatu objek di lingkungan, dan tidak hanya dalam keadaan mereka saat ini, tetapi juga dalam dinamika, dan dalam interaksi baik satu sama lain maupun dengan sistem kontrol, melibatkan pertimbangan berbagai pilihan alternatif untuk pengembangan keseluruhan sistem ini, serta penyempitan keragaman (pengurangan) alternatif-alternatif tersebut berdasarkan kriteria sasaran tertentu. Tidak satu pun dari ini, jelas, tidak dalam ACS tradisional, atau memang demikian, tetapi dalam bentuk yang disederhanakan.

Tentu saja, metode tradisional memadai dan penerapannya cukup tepat dan dibenarkan dalam kasus di mana objek kontrol memang merupakan sistem yang stabil dan ditentukan secara kaku, dan pengaruh lingkungan terhadapnya dapat diabaikan.

Namun, dalam kasus lain, metode ini tidak efektif.

Jika objek kontrol bersifat dinamis, maka model yang mendasari algoritme kontrolnya dengan cepat menjadi tidak memadai, karena hubungan antara parameter input dan output berubah, serta kumpulan parameter penting itu sendiri. Intinya, ini berarti bahwa sistem kontrol otomatis tradisional dapat mengontrol keadaan objek kontrol hanya di dekat titik keseimbangan melalui tindakan kontrol yang lemah di atasnya, yaitu. dengan metode gangguan kecil. Jauh dari keadaan ekuilibrium, dari sudut pandang tradisional, perilaku objek kontrol terlihat tak terduga dan tak terkendali.

Jika tidak ada hubungan yang jelas antara parameter input dan output dari objek kontrol (yaitu, antara parameter input dan keadaan objek), dengan kata lain, jika hubungan ini memiliki sifat probabilistik yang nyata, maka model deterministik, dalam yang diasumsikan bahwa hasil pengukuran parameter tertentu hanyalah angka, awalnya tidak berlaku. Selain itu, bentuk hubungan ini mungkin tidak diketahui, dan kemudian perlu untuk melanjutkan dari asumsi yang paling umum: bahwa itu probabilistik, atau tidak terdefinisi sama sekali.

Sistem kontrol otomatis yang dibangun di atas prinsip-prinsip tradisional hanya dapat bekerja berdasarkan parameter, pola hubungan yang sudah diketahui, dipelajari, dan tercermin dalam model matematika, dalam penelitian ini tugas ditetapkan untuk mengembangkan metode tersebut untuk merancang kontrol otomatis. sistem yang memungkinkan pembuatan sistem yang dapat mengidentifikasi dan menetapkan parameter paling signifikan, dan menentukan sifat hubungan antara parameter tersebut dan status objek kontrol.

Dalam hal ini, perlu untuk menerapkan metode pengukuran yang lebih berkembang dan memadai untuk situasi nyata:

  • klasifikasi atau pengenalan pola (pembelajaran berdasarkan sampel pelatihan, kemampuan beradaptasi dari algoritma pengenalan, kemampuan beradaptasi set kelas dan parameter yang dipelajari, pemilihan parameter yang paling signifikan dan pengurangan dimensi deskripsi sambil mempertahankan redundansi yang diberikan, dll.);
  • pengukuran statistik, ketika hasil pengukuran parameter tertentu bukan angka tunggal, tetapi distribusi probabilitas: perubahan variabel statistik tidak berarti perubahan nilainya itu sendiri, tetapi perubahan karakteristik distribusi probabilitas dari nilai-nilainya.

Akibatnya, sistem kontrol otomatis berdasarkan pendekatan deterministik tradisional praktis tidak bekerja dengan objek kontrol multi-parameter dinamis kompleks yang ditentukan dengan lemah, seperti, misalnya, sistem makro dan mikro-sosial-ekonomi dalam ekonomi dinamis " masa transisi”, hierarki elit dan kelompok etnis, masyarakat dan pemilih, fisiologi dan jiwa manusia, ekosistem alam dan buatan, dan banyak lainnya.

Sangat penting bahwa pada pertengahan 80-an, sekolah I.Prigozhin mengembangkan pendekatan, yang menurutnya dalam pengembangan sistem apa pun (termasuk seseorang), periode bergantian di mana sistem berperilaku baik sebagai "kebanyakan deterministik", atau sebagai "kebanyakan acak." Secara alami, sistem kontrol nyata harus secara stabil mengelola objek kontrol tidak hanya pada bagian "deterministik" dari sejarahnya, tetapi juga pada titik-titik ketika perilaku selanjutnya menjadi sangat tidak pasti. Ini saja berarti bahwa perlu untuk mengembangkan pendekatan untuk pengelolaan sistem dalam perilaku yang ada elemen besar keacakan (atau apa yang saat ini secara matematis digambarkan sebagai "keacakan").

Oleh karena itu, komposisi sistem kontrol otomatis yang menjanjikan yang menyediakan kontrol sistem deterministik lemah multi-parameter dinamis yang kompleks, sebagai tautan fungsional penting, tampaknya akan mencakup subsistem untuk mengidentifikasi dan memprediksi keadaan lingkungan dan objek kontrol, berdasarkan metode kecerdasan buatan. (terutama pengenalan pola), metode pendukung pengambilan keputusan dan teori informasi.

Mari kita pertimbangkan secara singkat masalah penggunaan sistem pengenalan gambar untuk membuat keputusan tentang tindakan kontrol (masalah ini akan dibahas lebih rinci nanti, karena ini adalah kunci untuk pekerjaan ini). Jika kita mengambil target dan keadaan lain dari objek kontrol sebagai kelas pengenalan, dan faktor-faktor yang mempengaruhinya sebagai fitur, maka ukuran hubungan antara faktor dan keadaan dapat dibentuk dalam model pengenalan pola. Ini memungkinkan memperoleh informasi tentang faktor-faktor yang berkontribusi atau menghalangi transisinya ke keadaan ini, berdasarkan keadaan tertentu dari objek kontrol, dan, atas dasar ini, mengembangkan keputusan tentang tindakan kontrol.

Faktor-faktor tersebut dapat dibagi menjadi beberapa kelompok berikut:

  • mengkarakterisasi prasejarah objek kontrol;
  • mengkarakterisasi keadaan objek kontrol saat ini;
  • faktor lingkungan;
  • faktor teknologi (dikelola).

Dengan demikian, sistem pengenalan gambar dapat digunakan sebagai bagian dari sistem kontrol otomatis: dalam subsistem untuk mengidentifikasi keadaan objek kontrol dan menghasilkan tindakan kontrol.

Ini berguna ketika objek kontrol adalah sistem yang kompleks.

Membuat keputusan tentang tindakan kontrol dalam sistem kontrol otomatis

Solusi dari masalah sintesis sistem kontrol otomatis adaptif oleh sistem yang kompleks dibahas dalam makalah ini, dengan mempertimbangkan banyak analogi yang mendalam antara metode pengenalan pola dan pengambilan keputusan.

Di satu sisi, tugas pengenalan pola adalah keputusan tentang kepemilikan objek yang dapat dikenali ke kelas pengenalan tertentu.

Di sisi lain, penulis mengusulkan untuk mempertimbangkan masalah pengambilan keputusan sebagai masalah kebalikan dari decoding atau masalah kebalikan dari pengenalan pola (lihat bagian 2.2.2).

Kesamaan ide-ide dasar yang mendasari metode pengenalan pola dan pengambilan keputusan menjadi sangat jelas ketika mempertimbangkannya dari sudut pandang teori informasi.

Berbagai tugas pengambilan keputusan

Pengambilan keputusan sebagai realisasi dari sebuah tujuan

Definisi: membuat keputusan ("pilihan") adalah tindakan pada serangkaian alternatif, sebagai akibatnya rangkaian alternatif awal menyempit, mis. itu berkurang.

Pilihan adalah tindakan yang memberikan tujuan pada semua aktivitas. Melalui tindakan pilihan bahwa subordinasi dari semua aktivitas untuk tujuan tertentu atau satu set tujuan yang saling terkait diwujudkan.

Jadi, agar tindakan pilihan menjadi mungkin, berikut ini diperlukan:

  • generasi atau penemuan satu set alternatif untuk membuat pilihan;
  • penentuan tujuan untuk pencapaian pilihan yang dibuat;
  • pengembangan dan penerapan metode untuk membandingkan alternatif satu sama lain, yaitu penentuan peringkat preferensi untuk setiap alternatif menurut kriteria tertentu, memungkinkan secara tidak langsung menilai bagaimana setiap alternatif memenuhi tujuan.

Pekerjaan modern di bidang pendukung keputusan telah mengungkapkan situasi karakteristik, yang terdiri dari fakta bahwa formalisasi lengkap untuk menemukan solusi terbaik (dalam arti tertentu) hanya mungkin untuk masalah yang dipelajari dengan baik dan relatif sederhana, sedangkan dalam praktiknya, masalah terstruktur lemah lebih umum, yang algoritma yang sepenuhnya diformalkan belum dikembangkan (kecuali untuk enumerasi lengkap dan coba-coba). Namun, para profesional yang berpengalaman, kompeten, dan cakap sering kali membuat pilihan yang ternyata cukup bagus. Oleh karena itu, tren saat ini dalam praktik pengambilan keputusan dalam situasi alami adalah menggabungkan kemampuan seseorang untuk memecahkan masalah yang tidak formal dengan kemampuan metode formal dan pemodelan komputer: sistem pendukung keputusan interaktif, sistem pakar, adaptif manusia-mesin otomatis. sistem kontrol, jaringan saraf, dan sistem kognitif.

Pengambilan keputusan sebagai penghilangan ketidakpastian (pendekatan informasi)

Proses memperoleh informasi dapat dianggap sebagai penurunan ketidakpastian sebagai akibat dari menerima sinyal, dan jumlah informasi - sebagai ukuran kuantitatif dari tingkat penghapusan ketidakpastian.

Tetapi sebagai hasil dari memilih beberapa subset alternatif dari set, yaitu sebagai akibat dari pengambilan keputusan, hal yang sama terjadi (penurunan ketidakpastian). Ini berarti bahwa setiap pilihan, setiap keputusan menghasilkan sejumlah informasi tertentu, dan oleh karena itu dapat dijelaskan dalam istilah teori informasi.

Klasifikasi masalah pengambilan keputusan

Banyaknya tugas pengambilan keputusan disebabkan oleh fakta bahwa setiap komponen situasi di mana pengambilan keputusan dilakukan dapat diimplementasikan dengan cara yang berbeda secara kualitatif.

Berikut adalah beberapa opsi ini:

  • himpunan alternatif, di satu sisi, bisa terbatas, dapat dihitung atau terus-menerus, dan di sisi lain, itu bisa tertutup (yaitu, diketahui sepenuhnya) atau terbuka (termasuk elemen yang tidak diketahui);
  • alternatif dapat dievaluasi menurut satu atau lebih kriteria, yang, pada gilirannya, bisa kuantitatif atau kualitatif;
  • mode pemilihan bisa tunggal (satu kali), atau ganda, berulang, termasuk umpan balik pada hasil seleksi, yaitu. memungkinkan pembelajaran algoritma pengambilan keputusan, dengan mempertimbangkan konsekuensi dari pemilihan sebelumnya;
  • konsekuensi dari memilih setiap alternatif dapat diketahui secara tepat sebelumnya (choice under pasti), memiliki sifat probabilistik ketika probabilitas hasil yang mungkin diketahui setelah pilihan dibuat (choice under risk) atau memiliki hasil yang ambigu dengan probabilitas yang tidak diketahui (choice under risk) di bawah ketidakpastian);
  • tanggung jawab untuk pilihan mungkin tidak ada, menjadi individu atau kelompok;
  • tingkat konsistensi tujuan dalam pilihan kelompok dapat bervariasi dari kepentingan pihak-pihak yang kebetulan sepenuhnya (pilihan kooperatif) hingga kebalikannya (pilihan dalam situasi konflik). Pilihan menengah juga dimungkinkan: kompromi, koalisi, konflik yang berkembang atau memudar.

Berbagai kombinasi dari pilihan-pilihan ini menyebabkan banyak masalah pengambilan keputusan yang telah dipelajari pada tingkat yang berbeda-beda.

Bahasa untuk menggambarkan metode pengambilan keputusan

Satu dan fenomena yang sama dapat dibicarakan dalam bahasa yang berbeda dengan berbagai tingkat keumuman dan kecukupan. Sampai saat ini, ada tiga bahasa utama untuk menggambarkan pilihan.

Yang paling sederhana, paling berkembang dan paling populer adalah bahasa kriteria.

Bahasa kriteria

Nama bahasa ini dikaitkan dengan asumsi dasar bahwa setiap alternatif individu dapat dievaluasi oleh beberapa (satu) nomor tertentu, setelah itu perbandingan alternatif direduksi menjadi perbandingan nomor yang sesuai.

Misalkan, (X) adalah himpunan alternatif, dan x adalah beberapa alternatif pasti yang termasuk dalam himpunan ini: x∈X. Kemudian dianggap bahwa untuk semua x suatu fungsi q(x) dapat diberikan, yang disebut kriteria (kriteria kualitas, fungsi tujuan, fungsi preferensi, fungsi utilitas, dll.), yang memiliki sifat bahwa jika alternatif x 1 adalah lebih disukai daripada x 2 (dilambangkan: x 1 > x 2), lalu q (x 1) > q (x 2).

Dalam hal ini, pilihan direduksi menjadi mencari alternatif dengan nilai tertinggi dari fungsi kriteria.

Namun, dalam praktiknya, penggunaan hanya satu kriteria untuk membandingkan tingkat preferensi alternatif ternyata merupakan penyederhanaan yang tidak dapat dibenarkan, karena pertimbangan alternatif yang lebih rinci mengarah pada kebutuhan untuk mengevaluasinya tidak menurut satu, tetapi menurut banyak orang. kriteria yang dapat bersifat berbeda dan secara kualitatif berbeda satu sama lain.

Misalnya, ketika memilih jenis pesawat yang paling dapat diterima untuk penumpang dan organisasi operasi pada jenis rute tertentu, perbandingan dilakukan secara bersamaan sesuai dengan banyak kelompok kriteria: teknis, teknologi, ekonomi, sosial, ergonomis, dll.

Masalah multikriteria tidak memiliki solusi umum yang unik. Oleh karena itu, banyak cara yang diusulkan untuk memberikan masalah multikriteria bentuk tertentu yang memungkinkan solusi umum tunggal. Secara alami, solusi ini umumnya berbeda untuk metode yang berbeda. Oleh karena itu, mungkin hal utama dalam memecahkan masalah multikriteria adalah pembenaran jenis perumusannya.

Berbagai pilihan untuk menyederhanakan masalah seleksi multikriteria digunakan. Mari kita daftar beberapa dari mereka.

  1. Maksimisasi bersyarat (bukan ekstrem global dari kriteria integral yang ditemukan, tetapi ekstrem lokal dari kriteria utama).
  2. Cari alternatif dengan properti yang diberikan.
  3. Menemukan himpunan Pareto.
  4. Pengurangan masalah multikriteria menjadi satu kriteria dengan memperkenalkan kriteria integral.

Mari kita pertimbangkan secara lebih rinci formulasi formal metode pengurangan masalah multi-kriteria menjadi satu kriteria.

Kami memperkenalkan kriteria integral q 0 (x) sebagai fungsi skalar dari argumen vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteria integral memungkinkan untuk mengurutkan alternatif dengan q 0 , dengan demikian menyoroti yang terbaik (dalam pengertian kriteria ini). Bentuk fungsi q 0 ditentukan oleh seberapa spesifik kita membayangkan kontribusi setiap kriteria terhadap kriteria integral. Biasanya fungsi aditif dan perkalian digunakan:

q 0 = a i q i /s i

1 - q 0 = (1 - b i q i /s i)

Koefisien yang saya berikan:

  1. Tanpa dimensi atau satu dimensi dari bilangan a i q i /s i (kriteria tertentu yang berbeda mungkin memiliki dimensi yang berbeda, dan kemudian tidak mungkin untuk melakukan operasi aritmatika pada mereka dan mereduksinya menjadi kriteria integral).
  2. Normalisasi, mis. ketentuan kondisi: b i q i /s i<1.

Koefisien a i dan b i mencerminkan kontribusi relatif dari kriteria tertentu q i terhadap kriteria integral.

Jadi, dalam pengaturan multi-kriteria, masalah pengambilan keputusan untuk memilih salah satu alternatif direduksi menjadi memaksimalkan kriteria integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Masalah utama dalam perumusan multikriteria dari masalah pengambilan keputusan adalah bahwa perlu untuk menemukan bentuk analitik dari koefisien a i dan b i , yang akan memberikan sifat-sifat model berikut:

  • tingkat kecukupan yang tinggi dari bidang studi dan sudut pandang para ahli;
  • kesulitan komputasi minimal dalam memaksimalkan kriteria integral, yaitu perhitungannya untuk alternatif yang berbeda;
  • stabilitas hasil memaksimalkan kriteria integral dari gangguan kecil dari data awal.
  • Stabilitas solusi berarti bahwa perubahan kecil pada data awal harus menyebabkan perubahan kecil dalam nilai kriteria integral, dan, dengan demikian, perubahan kecil dalam keputusan yang dibuat. Jadi, jika data awal praktis sama, maka keputusan harus dibuat sama atau sangat dekat.

Bahasa Seleksi Biner Sekuensial

Bahasa hubungan biner adalah generalisasi dari bahasa multikriteria dan didasarkan pada kenyataan bahwa ketika kita mengevaluasi beberapa alternatif, penilaian ini selalu relatif, yaitu. secara eksplisit atau lebih sering secara implisit, alternatif lain dari himpunan yang diteliti atau dari populasi umum digunakan sebagai dasar atau kerangka acuan untuk perbandingan. Pemikiran manusia didasarkan pada pencarian dan analisis yang berlawanan (konstruk), sehingga selalu lebih mudah bagi kita untuk memilih salah satu dari dua opsi yang berlawanan daripada satu opsi dari himpunan yang besar dan sama sekali tidak teratur.

Dengan demikian, asumsi utama bahasa ini bermuara pada hal berikut:

  • satu alternatif tidak dievaluasi, mis. fungsi kriteria tidak diperkenalkan;
  • untuk setiap pasangan alternatif, dapat ditentukan dengan cara tertentu bahwa salah satunya lebih disukai daripada yang lain, atau bahwa mereka setara atau tidak dapat dibandingkan;
  • hubungan preferensi dalam setiap pasangan alternatif tidak bergantung pada alternatif lain yang disajikan untuk pilihan.

Ada berbagai cara untuk menentukan hubungan biner: langsung, matriks, menggunakan grafik preferensi, metode bagian, dll.

Hubungan antara alternatif satu pasangan diekspresikan melalui konsep ekivalensi, keteraturan, dan dominasi.

Fungsi bahasa pilihan yang digeneralisasi

Bahasa fungsi pilihan didasarkan pada teori himpunan dan memungkinkan seseorang untuk beroperasi dengan pemetaan himpunan ke himpunan bagiannya yang sesuai dengan pilihan yang berbeda tanpa perlu menghitung elemen. Bahasa ini sangat umum dan berpotensi memungkinkan pilihan apa pun untuk dijelaskan. Namun, perangkat matematika fungsi pilihan umum saat ini hanya dikembangkan dan diuji terutama pada masalah yang telah diselesaikan dengan menggunakan pendekatan kriteria atau biner.

pilihan kelompok

Biarlah ada sekelompok orang yang memiliki hak untuk mengambil bagian dalam pengambilan keputusan kolektif. Misalkan kelompok ini sedang mempertimbangkan beberapa set alternatif, dan setiap anggota kelompok membuat pilihannya sendiri. Tugasnya adalah mengembangkan solusi yang dengan cara tertentu mengoordinasikan pilihan individu dan dalam arti tertentu mengungkapkan "pendapat umum" kelompok, yaitu. diambil sebagai pilihan kelompok.

Secara alami, keputusan kelompok yang berbeda akan sesuai dengan prinsip yang berbeda untuk mengoordinasikan keputusan individu.

Aturan untuk mengoordinasikan keputusan individu dalam pilihan kelompok disebut aturan pemungutan suara. Yang paling umum adalah "aturan mayoritas", di mana keputusan kelompok diambil oleh alternatif yang menerima suara terbanyak.

Harus dipahami bahwa keputusan seperti itu hanya mencerminkan prevalensi sudut pandang yang berbeda dalam kelompok, dan bukan pilihan yang benar-benar optimal, yang tidak boleh dipilih sama sekali oleh siapa pun. "Kebenaran tidak ditentukan oleh pemungutan suara."

Selain itu, ada yang disebut "paradoks pemungutan suara", yang paling terkenal adalah paradoks Arrow.

Paradoks-paradoks ini dapat menyebabkan, dan kadang-kadang memang mengarah, ke fitur yang sangat tidak menyenangkan dari prosedur pemungutan suara: misalnya, ada kasus ketika kelompok tidak dapat membuat keputusan sama sekali (tidak ada kuorum atau semua orang memberikan suara untuk opsi unik mereka sendiri, dll. .), dan terkadang ( dalam pemungutan suara bertingkat) minoritas dapat memaksakan kehendaknya pada mayoritas.

Pilihan di bawah Ketidakpastian

Kepastian adalah kasus khusus dari ketidakpastian, yaitu: ketidakpastian mendekati nol.

Dalam teori pilihan modern, diyakini bahwa ada tiga jenis ketidakpastian utama dalam masalah pengambilan keputusan:

  1. Ketidakpastian informasional (statistik) dari data awal untuk pengambilan keputusan.
  2. Ketidakpastian konsekuensi dari pengambilan keputusan (pilihan).
  3. Ketidakjelasan dalam deskripsi komponen proses pengambilan keputusan.

Mari kita pertimbangkan mereka secara berurutan.

Ketidakpastian informasi (statistik) dalam data awal

Data yang diperoleh tentang area subjek tidak dapat dianggap benar-benar akurat. Selain itu, jelas bahwa data ini menarik bagi kita bukan untuk dirinya sendiri, tetapi hanya sebagai sinyal yang, mungkin, membawa informasi tertentu tentang apa yang benar-benar kita minati. Jadi, lebih realistis untuk mempertimbangkan bahwa kita berurusan dengan data yang tidak hanya berisik dan tidak akurat, tetapi juga tidak langsung, dan mungkin tidak lengkap. Selain itu, data ini tidak menyangkut seluruh populasi (umum) yang diteliti, tetapi hanya sebagian tertentu darinya, yang sebenarnya dapat kami kumpulkan datanya, tetapi pada saat yang sama kami ingin menarik kesimpulan tentang seluruh populasi, dan kami juga ingin mengetahui tingkat keandalan kesimpulan ini.

Dalam kondisi ini, teori keputusan statistik digunakan.

Ada dua sumber utama ketidakpastian dalam teori ini. Pertama, tidak diketahui distribusi apa yang dipatuhi oleh data asli. Kedua, tidak diketahui distribusi apa yang memiliki himpunan (populasi umum) yang ingin kita tarik kesimpulan dari himpunan bagiannya yang membentuk data awal.

Prosedur statistik adalah prosedur pengambilan keputusan yang menghilangkan kedua jenis ketidakpastian ini.

Perlu dicatat bahwa ada sejumlah alasan yang menyebabkan penerapan metode statistik yang salah:

  • kesimpulan statistik, seperti yang lainnya, selalu memiliki keandalan atau kepastian yang pasti. Namun, tidak seperti banyak kasus lainnya, keandalan temuan statistik diketahui dan ditentukan dalam penelitian statistik;
  • kualitas solusi yang diperoleh sebagai hasil penerapan prosedur statistik tergantung pada kualitas data awal;
  • data yang tidak bersifat statistik tidak boleh diproses secara statistik;
  • perlu menggunakan prosedur statistik yang sesuai dengan tingkat informasi apriori tentang populasi yang diteliti (misalnya, Anda tidak boleh menerapkan metode analisis varians pada data non-Gaussian). Jika distribusi data asli tidak diketahui, maka seseorang harus menetapkannya, atau menggunakan beberapa metode berbeda dan membandingkan hasilnya. Jika mereka sangat berbeda, ini menunjukkan tidak dapat diterapkannya beberapa prosedur yang digunakan.

Ketidakpastian Konsekuensi

Ketika konsekuensi dari memilih alternatif secara unik ditentukan oleh alternatif itu sendiri, maka kita tidak dapat membedakan antara alternatif dan konsekuensinya, menerima begitu saja bahwa memilih alternatif, kita benar-benar memilih konsekuensinya.

Namun, dalam praktik nyata, seseorang sering kali harus menghadapi situasi yang lebih kompleks, ketika pilihan satu atau lain alternatif secara ambigu menentukan konsekuensi dari pilihan yang dibuat.

Dalam kasus satu set diskrit alternatif dan hasil pilihan mereka, asalkan himpunan hasil yang mungkin adalah umum untuk semua alternatif, kita dapat mengasumsikan bahwa alternatif yang berbeda berbeda satu sama lain dalam distribusi probabilitas hasil. Distribusi probabilitas ini, dalam kasus umum, mungkin bergantung pada hasil pilihan alternatif dan hasil yang sebenarnya terjadi sebagai akibat dari ini. Dalam kasus yang paling sederhana, hasilnya sama-sama mungkin. Hasil itu sendiri biasanya memiliki arti keuntungan atau kerugian dan diukur.

Jika hasilnya sama untuk semua alternatif, maka tidak ada yang bisa dipilih. Jika mereka berbeda, maka alternatif dapat dibandingkan dengan memperkenalkan perkiraan kuantitatif tertentu untuk mereka. Keragaman masalah dalam teori permainan dikaitkan dengan pilihan karakteristik numerik yang berbeda dari kerugian dan keuntungan sebagai akibat dari pilihan alternatif, tingkat konflik yang berbeda antara pihak yang memilih alternatif, dll.

Pertimbangkan jenis ketidakpastian ini sebagai ketidakpastian yang tidak jelas

Setiap masalah pilihan adalah penyempitan tujuan dari kumpulan alternatif. Baik deskripsi formal alternatif (daftarnya sendiri, daftar atribut atau parameternya) dan deskripsi aturan untuk perbandingannya (kriteria, hubungan) selalu diberikan dalam satu atau lain skala pengukuran (bahkan ketika orang yang apakah ini tidak tahu tentang ini).

Diketahui bahwa semua skala kabur, tetapi pada tingkat yang berbeda-beda. Istilah "kabur" mengacu pada properti timbangan, yang terdiri dari kenyataan bahwa selalu mungkin untuk menyajikan dua alternatif yang dapat dibedakan, yaitu. berbeda dalam satu skala dan tidak dapat dibedakan, yaitu identik, di sisi lain - lebih kabur. Semakin sedikit gradasi dalam skala tertentu, semakin kabur.

Dengan demikian, kita dapat dengan jelas melihat alternatif dan pada saat yang sama mengklasifikasikannya secara samar, yaitu. menjadi ambigu untuk kelas mana mereka berasal.

Sudah dalam karya pertama mereka tentang pengambilan keputusan dalam situasi kabur, Bellman dan Zadeh mengajukan gagasan bahwa tujuan dan kendala harus direpresentasikan sebagai himpunan kabur (kabur) pada serangkaian alternatif.

Pada beberapa keterbatasan pendekatan optimasi

Dalam semua masalah pemilihan dan metode pengambilan keputusan yang dipertimbangkan di atas, masalahnya adalah menemukan yang terbaik di set awal dalam kondisi tertentu, yaitu. alternatif yang optimal dalam arti tertentu.

Ide optimalitas adalah ide sentral dari sibernetika dan telah dengan kuat memasuki praktik merancang dan mengoperasikan sistem teknis. Pada saat yang sama, gagasan ini membutuhkan sikap hati-hati ketika kita mencoba mentransfernya ke bidang pengelolaan sistem yang kompleks, besar, dan ditentukan secara lemah, seperti misalnya, sistem sosial-ekonomi.

Ada alasan bagus untuk kesimpulan ini. Mari kita pertimbangkan beberapa di antaranya:

  1. Solusi optimal seringkali ternyata tidak stabil, mis. perubahan kecil dalam kondisi masalah, input data atau kendala dapat menyebabkan pemilihan alternatif yang berbeda secara signifikan.
  2. Model optimasi telah dikembangkan hanya untuk kelas-kelas sempit dari tugas-tugas yang cukup sederhana yang tidak selalu secara memadai dan sistematis mencerminkan objek kontrol nyata. Paling sering, metode optimasi memungkinkan untuk mengoptimalkan hanya subsistem yang cukup sederhana dan dijelaskan secara formal dari beberapa sistem besar dan kompleks, mis. memungkinkan hanya optimasi lokal. Namun, jika setiap subsistem dari beberapa sistem besar bekerja secara optimal, ini tidak berarti bahwa sistem secara keseluruhan juga akan bekerja secara optimal. Oleh karena itu, optimasi subsistem tidak selalu mengarah pada perilakunya, yang diperlukan ketika mengoptimalkan sistem secara keseluruhan. Selain itu, terkadang optimasi lokal dapat menyebabkan konsekuensi negatif bagi sistem secara keseluruhan. Oleh karena itu, ketika mengoptimalkan subsistem dan sistem secara keseluruhan, perlu untuk menentukan pohon tujuan dan subtujuan serta prioritasnya.
  3. Seringkali, memaksimalkan kriteria optimasi menurut beberapa model matematika dianggap sebagai tujuan optimasi, tetapi pada kenyataannya tujuannya adalah untuk mengoptimalkan objek kontrol. Kriteria optimasi dan model matematika selalu berhubungan dengan tujuan hanya secara tidak langsung, yaitu kurang lebih memadai, tetapi selalu mendekati.

Dengan demikian, gagasan optimalitas, yang sangat bermanfaat untuk sistem yang memungkinkan formalisasi matematis yang memadai, harus ditransfer ke sistem yang kompleks dengan hati-hati. Tentu saja, model matematika yang terkadang dapat diusulkan untuk sistem seperti itu dapat dioptimalkan. Namun, kita harus selalu mempertimbangkan penyederhanaan yang kuat dari model-model ini, yang dalam kasus sistem yang kompleks tidak dapat lagi diabaikan, serta fakta bahwa tingkat kecukupan model ini dalam kasus sistem yang kompleks sebenarnya tidak diketahui. . Oleh karena itu, tidak diketahui apa arti praktis dari pengoptimalan ini. Kepraktisan tinggi optimasi dalam sistem teknis seharusnya tidak menimbulkan ilusi bahwa itu akan sama efektifnya dalam mengoptimalkan sistem yang kompleks. Pemodelan matematika yang berarti dari sistem yang kompleks sangat sulit, perkiraan dan tidak akurat. Semakin kompleks sistemnya, semakin berhati-hati tentang ide pengoptimalannya.

Oleh karena itu, ketika mengembangkan metode kontrol untuk sistem yang kompleks, besar, dan ditentukan dengan lemah, penulis mempertimbangkan hal utama tidak hanya optimalitas pendekatan yang dipilih dari sudut pandang matematika formal, tetapi juga kecukupannya untuk tujuan dan sifat alami dari objek kontrol.

Metode Seleksi Ahli

Dalam studi sistem yang kompleks, masalah sering muncul yang, karena berbagai alasan, tidak dapat diajukan dan diselesaikan secara ketat menggunakan peralatan matematika yang dikembangkan saat ini. Dalam kasus ini, layanan pakar (analis sistem) digunakan, yang pengalaman dan intuisinya membantu mengurangi kompleksitas masalah.

Namun, harus diperhitungkan bahwa para ahli itu sendiri adalah sistem yang sangat kompleks, dan aktivitas mereka juga bergantung pada banyak kondisi eksternal dan internal. Oleh karena itu, dalam metode pengorganisasian penilaian ahli, banyak perhatian diberikan untuk menciptakan kondisi eksternal dan psikologis yang menguntungkan bagi pekerjaan para ahli.

Faktor-faktor berikut mempengaruhi pekerjaan seorang ahli:

  • tanggung jawab atas penggunaan hasil pemeriksaan;
  • mengetahui bahwa ahli lain terlibat;
  • ketersediaan informasi kontak antar ahli;
  • hubungan interpersonal para ahli (jika ada kontak informasi di antara mereka);
  • kepentingan pribadi ahli dalam hasil penilaian;
  • kualitas pribadi para ahli (harga diri, konformitas, kemauan, dll.)

Interaksi antara para ahli dapat merangsang atau menghambat aktivitas mereka. Oleh karena itu, dalam kasus yang berbeda, metode pemeriksaan yang berbeda digunakan, yang berbeda dalam sifat interaksi para ahli satu sama lain: survei dan kuesioner anonim dan terbuka, rapat, diskusi, permainan bisnis, curah pendapat, dll.

Ada berbagai metode pengolahan matematis pendapat ahli. Para ahli diminta untuk mengevaluasi berbagai alternatif baik dengan satu atau dengan sistem indikator. Selain itu, mereka diminta untuk mengevaluasi tingkat kepentingan setiap indikator ("bobot" atau "kontribusinya"). Para ahli itu sendiri juga diberi tingkat kompetensi yang sesuai dengan kontribusi mereka masing-masing terhadap pendapat kelompok yang dihasilkan.

Metode yang dikembangkan untuk bekerja dengan para ahli adalah metode "Delphi". Ide utama dari metode ini adalah bahwa kritik dan argumentasi memiliki efek menguntungkan pada ahli, jika harga dirinya tidak terpengaruh dan kondisi disediakan yang mengecualikan konfrontasi pribadi.

Harus ditekankan bahwa ada perbedaan mendasar dalam sifat penggunaan metode pakar dalam sistem pakar dan dalam pendukung keputusan. Jika dalam kasus pertama, para ahli diminta untuk memformalkan metode pengambilan keputusan, maka dalam kasus kedua - hanya keputusan itu sendiri, seperti itu.

Karena para ahli terlibat dalam implementasi fungsi-fungsi yang saat ini tidak disediakan oleh sistem otomatis sama sekali, atau dilakukan lebih buruk daripada oleh manusia, arah yang menjanjikan dalam pengembangan sistem otomatis adalah otomatisasi maksimum dari fungsi-fungsi ini.

Sistem pendukung keputusan otomatis

Seseorang selalu menggunakan asisten dalam membuat keputusan: mereka hanyalah penyedia informasi tentang objek kontrol, dan konsultan (penasihat) yang menawarkan opsi untuk keputusan dan menganalisis konsekuensinya. Orang yang membuat keputusan selalu membuatnya dalam lingkungan informasi tertentu: untuk komandan militer, ini adalah markas, untuk rektor, dewan akademik, untuk menteri, untuk kolegium.

Saat ini, infrastruktur informasi pengambilan keputusan tidak terpikirkan tanpa sistem otomatis untuk evaluasi keputusan berulang, dan terutama sistem pendukung keputusan (DDS - Sistem Pendukung Keputusan), yaitu. sistem otomatis yang dirancang khusus untuk menyiapkan informasi yang dibutuhkan seseorang untuk membuat keputusan. Pengembangan sistem pendukung keputusan dilakukan, khususnya, dalam kerangka proyek internasional yang dilakukan di bawah naungan Institut Internasional untuk Analisis Sistem Terapan di Laxenburg (Austria).

Pilihan dalam situasi nyata membutuhkan kinerja sejumlah operasi, beberapa di antaranya dilakukan lebih efisien oleh seseorang, dan lainnya oleh mesin. Kombinasi yang efektif dari keuntungan mereka dengan kompensasi kekurangan simultan diwujudkan dalam sistem pendukung keputusan otomatis.

Seseorang membuat keputusan lebih baik daripada mesin di bawah kondisi ketidakpastian, tetapi untuk membuat keputusan yang tepat, ia juga membutuhkan informasi yang memadai (lengkap dan andal) yang menjadi ciri area subjek. Namun, diketahui bahwa seseorang tidak dapat mengatasi dengan baik sejumlah besar informasi "mentah" yang belum diproses. Oleh karena itu, peran mesin dalam pendukung keputusan mungkin untuk melakukan persiapan awal informasi tentang objek kontrol dan faktor-faktor yang tidak dapat dikendalikan (lingkungan), untuk membantu melihat konsekuensi dari pengambilan keputusan tertentu, dan juga untuk menyajikan semua informasi ini secara visual. dan cara yang nyaman untuk membuat keputusan.

Dengan demikian, sistem pendukung keputusan otomatis mengkompensasi kelemahan seseorang, membebaskannya dari pemrosesan awal informasi yang rutin, dan memberinya lingkungan informasi yang nyaman di mana ia dapat menunjukkan kekuatannya dengan lebih baik. Sistem ini tidak terfokus pada otomatisasi fungsi pembuat keputusan (dan, sebagai akibatnya, mengasingkan fungsi-fungsi ini darinya, dan karenanya tanggung jawab atas keputusan yang dibuat, yang seringkali tidak dapat diterima), tetapi pada penyediaan bantuan untuk menemukan solusi yang baik.

Ikhtisar metode pengenalan pola yang ada

L.P. Popova , DAN TENTANG. datiev

Kemampuan untuk "mengenali" dianggap sebagai milik utama manusia, seperti halnya organisme hidup lainnya. Pengenalan pola adalah cabang sibernetika yang mengembangkan prinsip dan metode untuk mengklasifikasikan dan mengidentifikasi objek, fenomena, proses, sinyal, situasi - semua objek yang dapat dijelaskan oleh serangkaian fitur atau properti terbatas yang menjadi ciri suatu objek.

Citra adalah gambaran dari suatu objek. Gambar memiliki sifat khas, yang memanifestasikan dirinya dalam kenyataan bahwa kenalan dengan sejumlah fenomena terbatas dari himpunan yang sama memungkinkan untuk mengenali sejumlah besar perwakilannya secara sewenang-wenang.

Ada dua arah utama dalam teori pengenalan pola:

    studi tentang kekuatan pengenalan yang dimiliki oleh manusia dan organisme hidup lainnya;

    pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu pengenalan pola di area aplikasi tertentu.

Selanjutnya, artikel menjelaskan masalah, prinsip dan metode penerapan sistem pengenalan pola yang terkait dengan pengembangan arah kedua. Bagian kedua dari artikel membahas metode jaringan saraf pengenalan pola, yang dapat dikaitkan dengan arah pertama teori pengenalan pola.

Masalah membangun sistem pengenalan gambar

Tugas yang muncul dalam pembangunan sistem pengenalan pola otomatis biasanya dapat diklasifikasikan ke dalam beberapa bidang utama. Yang pertama terkait dengan representasi data awal yang diperoleh sebagai hasil pengukuran untuk objek yang akan dikenali masalah sensitivitas. Setiap nilai yang diukur adalah beberapa "karakteristik gambar atau objek. Misalkan, misalnya, gambar adalah karakter alfanumerik. Dalam hal ini, retina pengukur, mirip dengan yang ditunjukkan pada Gambar 1 (a), dapat berhasil digunakan di sensor Jika retina terdiri dari n-elemen, maka hasil pengukuran dapat direpresentasikan sebagai vektor pengukuran atau vektor gambar ,

di mana setiap elemen xi mengambil, misalnya, nilai 1 jika gambar simbol melewati sel ke-i retina, dan nilai 0 sebaliknya.

Pertimbangkan Gambar. 2 (b). Dalam hal ini, gambar adalah fungsi kontinu (dari jenis sinyal suara) dari variabel t. Jika nilai fungsi diukur pada titik-titik diskrit t1,t2, ..., tn, maka vektor bayangan dapat dibentuk dengan mengambil x1= f(t1),x2=f(t2),... , xn = f(tn).

Gambar 1. Mengukur retina

Masalah pengenalan pola yang kedua berkaitan dengan pemilihan ciri atau sifat karakteristik dari data awal yang diperoleh dan pengurangan dimensi vektor pola. Masalah ini sering didefinisikan sebagai masalah prapemrosesan dan pemilihan fitur.

Fitur dari kelas gambar adalah properti karakteristik yang umum untuk semua gambar dari kelas tertentu. Fitur-fitur yang menjadi ciri perbedaan antar kelas individu dapat diartikan sebagai fitur antar kelas. Fitur intraclass yang umum untuk semua kelas yang dipertimbangkan tidak membawa informasi yang berguna dari sudut pandang pengenalan dan mungkin tidak diperhitungkan. Pilihan fitur dianggap sebagai salah satu tugas penting yang terkait dengan konstruksi sistem pengenalan. Jika hasil pengukuran memungkinkan untuk memperoleh satu set lengkap fitur pembeda untuk semua kelas, pengenalan dan klasifikasi pola yang sebenarnya tidak akan menyebabkan kesulitan tertentu. Pengenalan otomatis kemudian akan direduksi menjadi proses atau prosedur pencocokan sederhana seperti pencarian tabel. Dalam kebanyakan masalah pengenalan praktis, bagaimanapun, menentukan satu set lengkap fitur pembeda sangat sulit, jika bukan tidak mungkin. Dari data asli, biasanya dimungkinkan untuk mengekstrak beberapa fitur pembeda dan menggunakannya untuk menyederhanakan proses pengenalan pola otomatis. Secara khusus, dimensi vektor pengukuran dapat dikurangi dengan menggunakan transformasi yang meminimalkan hilangnya informasi.

Masalah ketiga yang terkait dengan konstruksi sistem pengenalan pola adalah menemukan prosedur keputusan optimal yang diperlukan untuk identifikasi dan klasifikasi. Setelah data yang dikumpulkan tentang pola yang akan dikenali diwakili oleh titik atau vektor pengukuran dalam ruang pola, biarkan mesin mencari tahu kelas pola mana yang sesuai dengan data ini. Biarkan mesin dirancang untuk membedakan antara kelas M, dilambangkan dengan w1, w2, ... ..., wm. Dalam hal ini, ruang gambar dapat dianggap terdiri dari M daerah, yang masing-masing berisi titik-titik yang sesuai dengan gambar dari kelas yang sama. Dalam hal ini, masalah pengenalan dapat dianggap sebagai konstruksi batas daerah keputusan yang memisahkan kelas M berdasarkan vektor pengukuran yang terdaftar. Biarkan batas-batas ini didefinisikan, misalnya, dengan fungsi keputusan d1(х),d2(x),..., dm(х). Fungsi-fungsi ini, juga disebut fungsi diskriminan, adalah fungsi skalar dan bernilai tunggal dari gambar x. Jika di (x) > dj (x), maka bayangan x termasuk kelas w1. Dengan kata lain, jika fungsi keputusan ke-i di(x) memiliki nilai tertinggi, maka ilustrasi yang berarti dari skema klasifikasi otomatis berdasarkan implementasi proses pengambilan keputusan ditunjukkan pada Gambar. 2 (pada skema "GR" - generator fungsi yang menentukan).

Gambar 2. Skema klasifikasi otomatis.

Fungsi keputusan dapat diperoleh dengan beberapa cara. Dalam kasus di mana informasi apriori lengkap tersedia tentang pola yang dapat dikenali, fungsi keputusan dapat ditentukan dengan tepat berdasarkan informasi ini. Jika hanya informasi kualitatif yang tersedia tentang pola, asumsi yang masuk akal dapat dibuat tentang bentuk fungsi keputusan. Dalam kasus terakhir, batas-batas wilayah keputusan dapat menyimpang secara signifikan dari yang sebenarnya, dan oleh karena itu perlu untuk membuat sistem yang mampu mencapai hasil yang memuaskan melalui serangkaian penyesuaian yang berurutan.

Objek (gambar) yang akan dikenali dan diklasifikasikan menggunakan sistem pengenalan pola otomatis harus memiliki seperangkat karakteristik yang terukur. Ketika untuk seluruh kelompok gambar hasil pengukuran yang sesuai ternyata serupa, dianggap bahwa benda-benda ini termasuk dalam kelas yang sama. Tujuan dari sistem pengenalan pola adalah untuk menentukan, berdasarkan informasi yang dikumpulkan, kelas objek dengan karakteristik yang serupa dengan yang diukur untuk objek yang dapat dikenali. Kebenaran pengenalan tergantung pada jumlah informasi pembeda yang terkandung dalam karakteristik yang diukur, dan efisiensi penggunaan informasi ini.

      Metode Dasar untuk Menerapkan Sistem Pengenalan Pola

Pengenalan pola adalah tugas membangun dan menerapkan operasi formal pada representasi numerik atau simbolis dari objek dunia nyata atau ideal, yang hasilnya, solusi yang mencerminkan hubungan ekivalensi antara objek-objek ini. Relasi ekuivalensi mengungkapkan kepemilikan objek yang dievaluasi ke beberapa kelas, yang dianggap sebagai unit semantik independen.

Ketika membangun algoritma pengenalan, kelas ekivalensi dapat ditetapkan oleh seorang peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang kesamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian seseorang berbicara tentang "berbeda dengan guru." Jika tidak, yaitu ketika sistem otomatis memecahkan masalah klasifikasi tanpa melibatkan informasi pelatihan eksternal, seseorang berbicara tentang klasifikasi otomatis atau "pengenalan tanpa pengawasan". Sebagian besar algoritma pengenalan pola membutuhkan daya komputasi yang sangat signifikan, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V.I., J. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin dan lain-lain) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, non-parametrik dan heuristik, sementara yang lain memilih kelompok metode berdasarkan aliran sejarah dan tren di bidang ini.

Pada saat yang sama, tipologi terkenal tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara pengetahuan tentang bidang subjek diwakili menggunakan algoritma pengenalan pola formal apa pun. D.A. Pospelov mengidentifikasi dua cara utama untuk merepresentasikan pengetahuan:

    Representasi intensional - dalam bentuk diagram hubungan antara atribut (fitur).

    Representasi ekstensional - dengan bantuan fakta spesifik (objek, contoh).

Perlu dicatat bahwa keberadaan dua kelompok metode pengenalan ini: yang beroperasi dengan fitur dan yang beroperasi dengan objek, sangat alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan untuk membentuk refleksi yang memadai dari area subjek. Antara metode ini ada hubungan saling melengkapi dalam arti N. Bohr, oleh karena itu, sistem pengenalan yang menjanjikan harus menyediakan implementasi kedua metode ini, dan bukan hanya salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang diusulkan oleh D.A. Pospelov didasarkan pada hukum-hukum dasar yang mendasari cara kognisi manusia pada umumnya, yang menempatkannya pada posisi yang sangat istimewa (istimewa) dibandingkan dengan klasifikasi lain, yang, dengan latar belakang ini, terlihat lebih ringan dan buatan.

Metode Intensional

Ciri khas dari metode intensional adalah bahwa mereka menggunakan karakteristik yang berbeda dari fitur dan hubungan mereka sebagai elemen operasi dalam konstruksi dan penerapan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitik atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola intensional sangat luas, dan pembagiannya menjadi subclass agak sewenang-wenang:

– metode berdasarkan perkiraan kepadatan distribusi nilai fitur

– metode berdasarkan asumsi tentang kelas fungsi keputusan

– metode logis

– metode linguistik (struktural).

Metode berdasarkan estimasi densitas distribusi nilai fitur. Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek studi dianggap sebagai realisasi dari variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut beberapa hukum. Mereka didasarkan pada skema pengambilan keputusan Bayesian yang mengacu pada probabilitas apriori objek milik kelas tertentu yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini direduksi untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Pengelompokan metode berdasarkan estimasi densitas distribusi nilai ciri berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian untuk pengambilan keputusan adalah salah satu yang paling berkembang dalam statistik modern, yang disebut metode parametrik, di mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sebagian kecil jumlah parameter (vektor rata-rata dan matriks kovarians) perlu diestimasi.

Grup ini juga mencakup metode untuk menghitung rasio kemungkinan untuk fitur independen. Metode ini, dengan pengecualian asumsi independensi fitur (yang praktis tidak pernah terpenuhi dalam kenyataan), tidak menyiratkan pengetahuan tentang bentuk fungsional dari hukum distribusi. Ini dapat dikaitkan dengan metode non-parametrik.

Metode non-parametrik lainnya, yang digunakan ketika bentuk kurva densitas distribusi tidak diketahui dan tidak ada asumsi yang dapat dibuat tentang sifatnya sama sekali, menempati posisi khusus. Ini termasuk metode histogram multidimensi yang terkenal, metode "k-nearest tetangga", metode jarak Euclidean, metode fungsi potensial, dll., generalisasinya adalah metode yang disebut "perkiraan Parzen". Metode ini secara formal beroperasi dengan objek sebagai struktur integral, tetapi tergantung pada jenis tugas pengenalan, mereka dapat bertindak baik dalam hipostasis intensional dan ekstensional.

Metode nonparametrik menganalisis jumlah relatif objek yang termasuk dalam volume multidimensi yang diberikan dan menggunakan berbagai fungsi jarak antara objek sampel pelatihan dan objek yang dikenali. Untuk fitur kuantitatif, ketika jumlahnya jauh lebih sedikit daripada ukuran sampel, operasi dengan objek memainkan peran perantara dalam memperkirakan kepadatan distribusi lokal dari probabilitas bersyarat, dan objek tidak membawa beban semantik unit informasi independen. Pada saat yang sama, ketika jumlah fitur sepadan atau lebih besar dari jumlah objek yang diteliti, dan fitur bersifat kualitatif atau dikotomis, maka tidak ada pembicaraan tentang perkiraan lokal dari kepadatan distribusi probabilitas. Dalam hal ini objek-objek dalam metode nonparametrik tersebut dianggap sebagai unit informasi yang berdiri sendiri (fakta empiris holistik) dan metode ini memperoleh makna penilaian atas persamaan dan perbedaan objek yang diteliti.

Dengan demikian, operasi teknologi yang sama dari metode non-parametrik, tergantung pada kondisi masalah, masuk akal baik perkiraan lokal dari kepadatan distribusi probabilitas nilai fitur, atau perkiraan kesamaan dan perbedaan objek.

Dalam konteks representasi intensional pengetahuan, sisi pertama dari metode non-parametrik dipertimbangkan di sini, sebagai perkiraan kepadatan distribusi probabilitas. Banyak penulis mencatat bahwa metode nonparametrik seperti perkiraan Parzen bekerja dengan baik dalam praktiknya. Kesulitan utama dalam menerapkan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap ketidakterwakilan sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan. Dalam kelompok metode ini, bentuk umum dari fungsi keputusan dianggap diketahui dan kualitas fungsionalnya diberikan. Berdasarkan fungsional ini, pendekatan terbaik dari fungsi keputusan dicari untuk urutan pelatihan. Yang paling umum adalah representasi dari fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Kualitas fungsional aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama dari metode berdasarkan asumsi tentang kelas fungsi keputusan adalah kejelasan rumusan matematis dari masalah pengenalan sebagai masalah menemukan ekstrem. Solusi untuk masalah ini sering dicapai dengan menggunakan beberapa jenis algoritma gradien. Keragaman metode kelompok ini dijelaskan oleh berbagai fungsi kualitas aturan keputusan yang digunakan dan algoritma pencarian ekstrem. Generalisasi dari algoritma yang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik. Tidak seperti metode pengenalan parametrik, keberhasilan kelompok metode ini tidak terlalu bergantung pada ketidaksesuaian gagasan teoretis tentang hukum distribusi objek dalam ruang fitur dengan realitas empiris. Semua operasi tunduk pada satu tujuan utama - menemukan ekstrem dari kualitas fungsional dari aturan keputusan. Pada saat yang sama, hasil parametrik dan metode yang dipertimbangkan mungkin serupa. Seperti yang ditunjukkan di atas, metode parametrik untuk kasus distribusi normal objek di kelas yang berbeda dengan matriks kovarians yang sama mengarah ke fungsi keputusan linier. Kami juga mencatat bahwa algoritme untuk memilih fitur informatif dalam model diagnostik linier dapat ditafsirkan sebagai varian tertentu dari algoritme gradien untuk mencari ekstrem.

Kemungkinan algoritma gradien untuk menemukan ekstrem, terutama dalam kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kasus ketika kelas objek yang dapat dikenali ditampilkan dalam ruang fitur oleh struktur geometris yang kompak. Namun, keinginan untuk mencapai kualitas yang cukup dari aturan keputusan sering dapat dipenuhi dengan bantuan algoritma yang tidak memiliki bukti matematis yang ketat dari konvergensi solusi ke ekstrem global.

Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusioner. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna dari objek kompleks dengan pemodelan fenomenologis evolusinya.

Perwakilan terkenal dari pemodelan evolusioner dalam pengenalan pola adalah metode akuntansi kelompok argumen (MGUA). GMDH didasarkan pada prinsip pengaturan diri, dan algoritma GMDH mereproduksi skema seleksi massal. Dalam algoritma GMDH, anggota polinomial umum disintesis dan dipilih dengan cara khusus, yang sering disebut polinomial Kolmogorov-Gabor. Sintesis dan seleksi ini dilakukan dengan semakin kompleksnya, dan tidak mungkin untuk memprediksi sebelumnya bentuk akhir dari polinomial yang digeneralisasikan. Pertama, kombinasi berpasangan sederhana dari fitur awal biasanya dipertimbangkan, dari mana persamaan fungsi yang menentukan disusun, sebagai aturan, tidak lebih tinggi dari orde kedua. Setiap persamaan dianalisis sebagai fungsi keputusan independen, dan nilai parameter persamaan yang disusun ditemukan dalam satu atau lain cara dari sampel pelatihan. Kemudian, dari kumpulan fungsi keputusan yang dihasilkan, bagian dari yang terbaik dalam beberapa hal dipilih. Kualitas fungsi keputusan individu diperiksa pada sampel kontrol (pengujian), yang kadang-kadang disebut prinsip penjumlahan eksternal. Fungsi keputusan parsial yang dipilih dianggap di bawah ini sebagai variabel perantara yang berfungsi sebagai argumen awal untuk sintesis serupa dari fungsi keputusan baru, dll. Proses sintesis hierarkis semacam itu berlanjut hingga ekstrem dari kriteria kualitas fungsi keputusan tercapai, yang dalam praktiknya memanifestasikan dirinya dalam penurunan kualitas ini ketika mencoba untuk lebih meningkatkan urutan anggota polinomial relatif terhadap fitur aslinya.

Prinsip pengorganisasian diri yang mendasari GMDH disebut pengorganisasian diri heuristik, karena seluruh proses didasarkan pada pengenalan tambahan eksternal yang dipilih secara heuristik. Hasil keputusan dapat secara signifikan bergantung pada heuristik ini. Model diagnostik yang dihasilkan tergantung pada bagaimana objek dibagi menjadi sampel pelatihan dan pengujian, bagaimana kriteria kualitas pengenalan ditentukan, berapa banyak variabel yang dilewati pada baris pemilihan berikutnya, dll.

Fitur-fitur algoritma GMDH ini juga merupakan karakteristik dari pendekatan lain untuk pemodelan evolusi. Tetapi kami mencatat di sini satu aspek lagi dari metode yang sedang dipertimbangkan. Ini adalah esensi konten mereka. Menggunakan metode berdasarkan asumsi tentang kelas fungsi keputusan (evolusioner dan gradien), dimungkinkan untuk membangun model diagnostik dengan kompleksitas tinggi dan memperoleh hasil yang dapat diterima secara praktis. Pada saat yang sama, pencapaian tujuan praktis dalam hal ini tidak disertai dengan ekstraksi pengetahuan baru tentang sifat objek yang dapat dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), pada dasarnya dibatasi di sini oleh struktur tertentu dari interaksi tersebut, yang ditetapkan dalam bentuk yang dipilih dari fungsi yang menentukan. Oleh karena itu, maksimum yang dapat dikatakan setelah membangun model diagnostik tertentu adalah membuat daftar kombinasi fitur dan fitur itu sendiri yang termasuk dalam model yang dihasilkan. Tetapi makna kombinasi yang mencerminkan sifat dan struktur distribusi objek yang diteliti sering kali masih belum ditemukan dalam kerangka pendekatan ini.

Metode Boolean. Metode logika pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuk yang paling umum, metode logis dapat dicirikan sebagai semacam pencarian pola logis dalam sampel pelatihan dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang memiliki bobot sendiri. Kelompok metode logis beragam dan mencakup metode berbagai kompleksitas dan kedalaman analisis. Untuk fitur dikotomis (boolean), yang disebut pengklasifikasi seperti pohon, metode pengujian buntu, algoritma Kora, dan lainnya populer. Metode yang lebih kompleks didasarkan pada formalisasi metode induktif D.S. Mill. Formalisasi dilakukan dengan membangun teori kuasi-aksiomatik dan didasarkan pada logika multi-nilai multi-urutan dengan quantifiers atas tupel panjang variabel.

Algoritme Kora, seperti metode logis lainnya untuk pengenalan pola, cukup melelahkan, karena penghitungan lengkap diperlukan saat memilih konjungsi. Oleh karena itu, ketika menerapkan metode logis, persyaratan tinggi ditempatkan pada organisasi yang efisien dari proses komputasi, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Linguistik (sintaksis atau struktural) metode. Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa, yang dengannya seperangkat properti objek yang dapat dikenali dapat dijelaskan. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jika deskripsi gambar dibuat dengan bantuan elemen non-turunan (sub-gambar) dan hubungannya, maka pendekatan linguistik atau sintaksis digunakan untuk membangun sistem pengenalan otomatis menggunakan prinsip kesamaan sifat. Sebuah gambar dapat dideskripsikan menggunakan struktur hierarki subgambar yang mirip dengan struktur sintaksis suatu bahasa. Keadaan ini memungkinkan untuk menerapkan teori bahasa formal dalam memecahkan masalah pengenalan pola. Diasumsikan bahwa tata bahasa gambar berisi kumpulan elemen hingga yang disebut variabel, elemen non-turunan, dan aturan substitusi. Sifat aturan substitusi menentukan jenis tata bahasa. Di antara tata bahasa yang paling banyak dipelajari adalah tata bahasa reguler, bebas konteks, dan tata bahasa konstituen langsung. Poin kunci dari pendekatan ini adalah pilihan elemen non-turunan dari gambar, penyatuan elemen-elemen ini dan hubungan yang menghubungkannya ke dalam tata bahasa gambar, dan, akhirnya, implementasi proses analisis dan pengenalan dalam bahasa yang sesuai. . Pendekatan ini sangat berguna ketika bekerja dengan gambar yang tidak dapat dijelaskan dengan pengukuran numerik, atau sangat kompleks sehingga fitur lokalnya tidak dapat diidentifikasi dan seseorang harus mengacu pada properti global objek.

Misalnya, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev mengusulkan struktur sistem berikut untuk pemrosesan gambar (Gbr. 3), menggunakan pendekatan linguistik, di mana masing-masing blok fungsional adalah kompleks perangkat lunak (mikroprogram) (modul) yang mengimplementasikan fungsi yang sesuai.

Gambar 3. Diagram struktural dari pengenal

Upaya untuk menerapkan metode linguistik matematika untuk masalah analisis gambar mengarah pada kebutuhan untuk memecahkan sejumlah masalah yang berkaitan dengan pemetaan struktur gambar dua dimensi ke rantai satu dimensi dari bahasa formal.

Metode Ekstensi

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang dipelajari diberikan nilai diagnostik independen pada tingkat yang lebih besar atau lebih kecil. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap orang bukan sebagai rantai objek yang diberi peringkat menurut satu atau lain indikator, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek studi tidak memungkinkan seseorang untuk mengecualikan atau kehilangan informasi tentang setiap objek individu, yang terjadi ketika menerapkan metode arah yang disengaja, menggunakan objek hanya untuk mendeteksi dan memperbaiki pola perilaku atributnya.

Operasi utama dalam pengenalan pola menggunakan metode yang dibahas adalah operasi menentukan kesamaan dan perbedaan objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Pada saat yang sama, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas terluas: dari partisipasi utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk solusi yang berhasil: dari satu di setiap kelas yang dapat dikenali hingga seluruh ukuran sampel, serta cara yang berbeda untuk menghitung ukuran kesamaan dan perbedaan objek. Persyaratan ini menjelaskan pembagian lebih lanjut dari metode ekstensional ke dalam subkelas:

    metode perbandingan prototipe;

    metode k-nearest neighbor;

    tim aturan keputusan.

Metode perbandingan prototipe. Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, ketika kelas yang dikenali ditampilkan di ruang fitur dalam pengelompokan geometris yang kompak. Dalam hal ini, pusat pengelompokan geometris kelas (atau objek yang paling dekat dengan pusat) biasanya dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, prototipe yang paling dekat dengannya ditemukan, dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelas, tidak ada gambar kelas umum yang terbentuk dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi indikatif informasi tentang struktur data. Menggunakan representasi di atas, misalnya, setiap skala pengukuran tradisional, yang merupakan fungsi linier dari nilai-nilai fitur dikotomis, dapat dianggap sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas yang dikenali memungkinkan kita untuk menyimpulkan bahwa mereka kompak secara geometris, maka cukup untuk mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dari contoh ideal yang dijelaskan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan prototipe kelas diagnostik menghadapi masalah yang sulit. Ini adalah, pertama-tama, pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial dari distribusi objek. Dan, kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang khas untuk masalah nyata.

Metode k-nearest tetangga. Metode k-nearest neighbor untuk memecahkan masalah analisis diskriminan pertama kali diusulkan pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) objek lain yang secara geometris terdekat dengannya di ruang fitur (tetangga terdekat) dengan kelas yang dapat dikenali yang sudah diketahui. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang keanggotaan yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k-nearest tetangga dianggap sebagai metode non-parametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, estimasi teoritis dari efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Terbukti bahwa peluang kesalahan asimtotik untuk metode k-nearest neighbor melebihi kesalahan aturan Bayes tidak lebih dari dua kali.

Seperti disebutkan di atas, dalam masalah nyata seringkali perlu untuk beroperasi dengan objek yang dijelaskan oleh sejumlah besar fitur kualitatif (dikotomis). Pada saat yang sama, dimensi ruang fitur sepadan dengan atau melebihi volume sampel yang diteliti. Dalam kondisi seperti itu, akan lebih mudah untuk menafsirkan setiap objek dari sampel pelatihan sebagai pengklasifikasi linier yang terpisah. Kemudian kelas diagnostik ini atau itu tidak diwakili oleh satu prototipe, tetapi oleh satu set pengklasifikasi linier. Interaksi gabungan dari pengklasifikasi linier menghasilkan permukaan linier sepotong-sepotong yang memisahkan kelas yang dapat dikenali dalam ruang fitur. Jenis permukaan pembagi, terdiri dari potongan-potongan hyperplanes, dapat bervariasi dan tergantung pada posisi relatif dari agregat yang diklasifikasikan.

Interpretasi lain dari mekanisme klasifikasi k-nearest neighbor juga dapat digunakan. Ini didasarkan pada gagasan adanya beberapa variabel laten, abstrak atau terkait dengan beberapa transformasi dengan ruang fitur asli. Jika jarak berpasangan antara objek di ruang variabel laten sama dengan di ruang fitur awal, dan jumlah variabel ini jauh lebih sedikit daripada jumlah objek, maka interpretasi metode k-nearest neighbor dapat dipertimbangkan. dari sudut pandang membandingkan perkiraan nonparametrik kepadatan distribusi probabilitas bersyarat. Konsep variabel laten yang disajikan di sini mirip dengan konsep dimensi sebenarnya dan representasi lain yang digunakan dalam berbagai metode pengurangan dimensi.

Saat menggunakan metode k-nearest neighbor untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah dalam kondisi ruang fitur berdimensi tinggi ini sangat diperparah karena cukup melelahkannya metode ini, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, serta dalam metode perbandingan prototipe, perlu untuk memecahkan masalah kreatif dalam menganalisis struktur multidimensi data eksperimen untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Algoritma untuk menghitung nilai (voting). Prinsip operasi algoritma untuk menghitung skor (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan "kedekatan" dari objek yang dikenali dan referensi menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari suatu kumpulan fitur.

Tidak seperti semua metode yang dipertimbangkan sebelumnya, algoritme untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritma ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO membawa gagasan untuk menggunakan fitur ke tujuan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, di ABO tingkat kesamaan objek dihitung dengan membandingkan semua kemungkinan atau kombinasi fitur tertentu. termasuk dalam deskripsi objek.

Tim aturan keputusan. Aturan keputusan menggunakan skema pengenalan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi bekerja, yang hasilnya digabungkan pada tingkat kedua di blok sintesis. Metode yang paling umum dari kombinasi semacam itu didasarkan pada alokasi area kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan area kompetensi adalah dengan apriori membagi ruang fitur berdasarkan pertimbangan profesional dari ilmu tertentu (misalnya, stratifikasi sampel menurut beberapa fitur). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan dari objek yang dapat dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis menganggap indikator yang dihasilkan dari algoritma parsial sebagai fitur awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah membuat seperangkat aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan penelitian dan deskripsi konstruktif tentang algoritma pengenalan, di mana semua jenis algoritma yang ada cocok.

Metode jaringan saraf

Metode neural network adalah metode yang didasarkan pada penggunaan berbagai jenis neural network (NN). Area utama penerapan berbagai NN untuk pengenalan pola dan gambar:

    aplikasi untuk mengekstraksi karakteristik atau fitur utama dari gambar yang diberikan,

    klasifikasi gambar itu sendiri atau karakteristik yang sudah diekstraksi darinya (dalam kasus pertama, ekstraksi karakteristik utama terjadi secara implisit di dalam jaringan),

    solusi dari masalah optimasi.

Jaringan saraf multilayer. Arsitektur jaringan saraf multilayer (MNN) terdiri dari lapisan yang terhubung secara berurutan, di mana neuron dari setiap lapisan terhubung dengan semua neuron dari lapisan sebelumnya dengan inputnya, dan dengan output dari lapisan berikutnya.

Aplikasi paling sederhana dari NN lapisan tunggal (disebut memori asosiatif otomatis) adalah melatih jaringan untuk merekonstruksi gambar umpan. Dengan memasukkan gambar uji ke input dan menghitung kualitas gambar yang direkonstruksi, seseorang dapat memperkirakan seberapa baik jaringan mengenali gambar input. Sifat positif dari metode ini adalah bahwa jaringan dapat memulihkan gambar yang terdistorsi dan bising, tetapi tidak cocok untuk tujuan yang lebih serius.

MNN juga digunakan untuk klasifikasi langsung gambar - inputnya adalah gambar itu sendiri dalam beberapa bentuk, atau satu set karakteristik kunci yang diekstraksi sebelumnya dari gambar, pada output, neuron dengan aktivitas maksimum menunjukkan milik kelas yang dikenali (Gbr. .4). Jika aktivitas ini berada di bawah ambang batas tertentu, maka dianggap bahwa gambar yang dikirimkan bukan milik salah satu kelas yang diketahui. Proses pembelajaran menetapkan korespondensi gambar input dengan milik kelas tertentu. Ini disebut pembelajaran terawasi. Pendekatan ini bagus untuk tugas kontrol akses untuk sekelompok kecil orang. Pendekatan ini memberikan perbandingan langsung dari gambar itu sendiri oleh jaringan, tetapi dengan peningkatan jumlah kelas, waktu pelatihan dan operasi jaringan meningkat secara eksponensial. Oleh karena itu, untuk tugas-tugas seperti mencari orang yang serupa dalam database yang besar, diperlukan penggalian sekumpulan fitur kunci yang ringkas untuk mencari.

Pendekatan klasifikasi menggunakan karakteristik frekuensi dari seluruh gambar dijelaskan dalam . Sebuah NS lapisan tunggal berdasarkan neuron multinilai digunakan.

B menunjukkan penggunaan NN untuk klasifikasi citra, ketika input jaringan menerima hasil dekomposisi citra dengan metode komponen utama.

Dalam MNS klasik, koneksi saraf interlayer terhubung sepenuhnya, dan gambar direpresentasikan sebagai vektor satu dimensi, meskipun dua dimensi. Arsitektur convolutional neural network bertujuan untuk mengatasi kekurangan tersebut. Ini menggunakan bidang reseptor lokal (menyediakan konektivitas dua dimensi lokal neuron), bobot umum (menyediakan deteksi beberapa fitur di mana saja dalam gambar), dan organisasi hierarkis dengan subsampling spasial (subsampling spasial). Convolutional NN (CNN) memberikan resistensi parsial terhadap perubahan skala, perpindahan, rotasi, distorsi.

MNS juga digunakan untuk mendeteksi objek dari tipe tertentu. Selain fakta bahwa setiap MNS terlatih dapat sampai batas tertentu menentukan milik gambar ke kelas "sendiri", itu dapat dilatih secara khusus untuk mendeteksi kelas tertentu dengan andal. Dalam hal ini, kelas keluaran akan menjadi kelas yang termasuk dan tidak termasuk dalam tipe gambar yang diberikan. Detektor jaringan saraf digunakan untuk mendeteksi citra wajah pada citra masukan. Gambar dipindai dengan jendela 20x20 piksel, yang diumpankan ke input jaringan, yang memutuskan apakah area yang diberikan termasuk dalam kelas wajah. Pelatihan dilakukan dengan menggunakan contoh positif (gambar berbagai wajah) dan contoh negatif (gambar bukan wajah). Untuk meningkatkan keandalan deteksi, tim NN yang dilatih dengan bobot awal yang berbeda digunakan, akibatnya NN membuat kesalahan dengan cara yang berbeda, dan keputusan akhir dibuat dengan pemungutan suara dari seluruh tim.

Gambar 5. Komponen utama (eigenfaces) dan dekomposisi gambar menjadi komponen utama

NN juga digunakan untuk mengekstrak karakteristik kunci dari citra, yang kemudian digunakan untuk klasifikasi selanjutnya. Dalam , metode untuk implementasi jaringan saraf dari metode analisis komponen utama ditampilkan. Inti dari metode analisis komponen utama adalah untuk mendapatkan koefisien dekorelasi maksimal yang mencirikan pola input. Koefisien ini disebut komponen utama dan digunakan untuk kompresi citra statistik, di mana sejumlah kecil koefisien digunakan untuk mewakili keseluruhan citra. Sebuah NN dengan satu lapisan tersembunyi yang mengandung N neuron (yang jauh lebih kecil dari dimensi gambar), dilatih dengan metode kesalahan backpropagation untuk mengembalikan gambar input pada output, membentuk koefisien komponen utama N pertama pada output dari neuron tersembunyi, yang digunakan untuk perbandingan. Biasanya, 10 hingga 200 komponen utama digunakan. Dengan bertambahnya jumlah komponen, keterwakilannya sangat berkurang, dan tidak masuk akal untuk menggunakan komponen dengan jumlah besar. Saat menggunakan fungsi aktivasi nonlinier elemen saraf, dekomposisi nonlinier menjadi komponen utama dimungkinkan. Nonlinier memungkinkan Anda untuk lebih akurat mencerminkan variasi dalam data input. Menerapkan analisis komponen utama untuk dekomposisi gambar wajah, kami memperoleh komponen utama, yang disebut wajah yang tepat, yang juga memiliki properti yang berguna - ada komponen yang terutama mencerminkan karakteristik wajah penting seperti jenis kelamin, ras, emosi. Saat direstorasi, komponen memiliki tampilan seperti wajah, dengan yang pertama mencerminkan bentuk wajah yang paling umum, yang terakhir mewakili berbagai perbedaan kecil di antara wajah (Gbr. 5). Metode ini dapat diterapkan dengan baik untuk mencari gambar wajah yang mirip dalam database besar. Kemungkinan pengurangan lebih lanjut dari dimensi komponen utama dengan bantuan NS juga ditunjukkan. Dengan mengevaluasi kualitas rekonstruksi gambar input, seseorang dapat dengan sangat akurat menentukan apakah itu termasuk dalam kelas wajah.

Jaringan saraf tingkat tinggi. Jaringan saraf tingkat tinggi (HNN) berbeda dari MNN karena hanya memiliki satu lapisan, tetapi input neuron juga menerima suku tingkat tinggi yang merupakan produk dari dua atau lebih komponen vektor input. Jaringan semacam itu juga dapat membentuk permukaan pemisah yang kompleks.

Jaringan saraf Hopfield. Hopfield NN (HSH) adalah lapisan tunggal dan terhubung penuh (tidak ada koneksi neuron ke dirinya sendiri), outputnya terhubung dengan input. Berbeda dengan MNS, NSH bersifat relaksasi, yaitu diatur ke keadaan awal, ia berfungsi hingga mencapai keadaan stabil, yang akan menjadi nilai outputnya. Untuk mencari minimum global dalam kaitannya dengan masalah optimasi, digunakan modifikasi stokastik dari NSH.

Penggunaan NSH sebagai memori asosiatif memungkinkan Anda untuk secara akurat mengembalikan gambar yang telah dilatih jaringan ketika gambar yang terdistorsi dimasukkan ke input. Dalam hal ini, jaringan akan "mengingat" gambar terdekat (dalam arti energi minimum lokal), dan dengan demikian mengenalinya. Fungsi tersebut juga dapat dianggap sebagai aplikasi berurutan dari memori auto-asosiatif yang dijelaskan di atas. Tidak seperti memori auto-associative, NSH akan mengembalikan gambar secara akurat dengan sempurna. Untuk menghindari gangguan minimal dan meningkatkan kapasitas jaringan, berbagai metode digunakan.

Jaringan saraf yang mengatur diri sendiri Kohonen. Kohonen self-organizing neural networks (SNNCs) menyediakan urutan topologi dari ruang gambar input. Mereka memungkinkan pemetaan kontinu topologi dari ruang n-dimensi input ke dalam output m-dimensi, m<

kognitron. Cognitron dalam arsitekturnya mirip dengan struktur korteks visual, ia memiliki organisasi multilayer hierarkis, di mana neuron antar lapisan hanya terhubung secara lokal. Dilatih dengan pembelajaran kompetitif (tanpa guru). Setiap lapisan otak menerapkan tingkat generalisasi yang berbeda; lapisan input peka terhadap pola sederhana, seperti garis, dan orientasinya di area tertentu dari area visual, sedangkan respons lapisan lain lebih kompleks, abstrak, dan tidak bergantung pada posisi pola. Fungsi serupa diimplementasikan dalam kognitron dengan memodelkan organisasi korteks visual.

Neocognitron adalah pengembangan lebih lanjut dari ide cognitron dan lebih akurat mencerminkan struktur sistem visual, memungkinkan Anda mengenali gambar terlepas dari transformasi, rotasi, distorsi, dan perubahan skalanya.

Cognitron adalah alat pengenalan gambar yang kuat, namun membutuhkan biaya komputasi yang tinggi, yang saat ini tidak dapat dicapai.

Metode jaringan saraf yang dipertimbangkan memberikan pengenalan gambar yang cepat dan andal, tetapi ketika menggunakan metode ini, masalah muncul dalam pengenalan objek tiga dimensi. Namun, pendekatan ini memiliki banyak keuntungan.

      Kesimpulan

Saat ini terdapat cukup banyak sistem pengenalan pola otomatis untuk berbagai masalah yang diterapkan.

Pengenalan pola dengan metode formal sebagai arahan ilmiah mendasar tidak ada habisnya.

Metode matematika pemrosesan gambar memiliki berbagai aplikasi: sains, teknologi, kedokteran, lingkungan sosial. Di masa depan, peran pengenalan pola dalam kehidupan manusia akan semakin meningkat.

Metode jaringan saraf memberikan pengenalan gambar yang cepat dan andal. Pendekatan ini memiliki banyak keuntungan dan merupakan salah satu yang paling menjanjikan.

literatur

    D.V. Brilyuk, V.V. Starovoitov. Metode jaringan saraf untuk pengenalan gambar // /

    Kuzin L.T. Dasar-dasar Sibernetika: Dasar-dasar Model Sibernetik. T.2. - M.: Energi, 1979. - 584 hal.

    Peregudov F.I., Tarasenko F.P. Pengantar Analisis Sistem: Buku Ajar. - M.: Sekolah Tinggi, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Landasan teoretis teknologi informasi. - M.: Energi, 1979. - 511s.

    Tu J., Gonzalez R. Prinsip Pengenalan Pola. / Per. dari bahasa Inggris. - M.: Mir, 1978. - 410-an.

    Winston P. Kecerdasan buatan. / Per. dari bahasa Inggris. - M.: Mir, 1980. - 520-an.

    Fu K. Metode struktural dalam pengenalan pola: Diterjemahkan dari bahasa Inggris. - M.: Mir, 1977. - 320-an.

    Tsypkin Ya.Z. Dasar-dasar Teori Informasi Identifikasi. - M.: Nauka, 1984. - 520-an.

    Pospelov G.S. Kecerdasan buatan adalah dasar dari teknologi informasi baru. - M.: Nauka, 1988. - 280-an.

    Yu Lifshits, Metode statistik pengenalan pola ///modern/07modernnote.pdf

    Bohr N. Fisika atom dan pengetahuan manusia. / Terjemahan dari bahasa Inggris. - M.: Mir, 1961. - 151 detik.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Pemrosesan gambar pada komputer. 1987.-236s.

    Duda R., Hart P. Pengenalan pola dan analisis adegan. / Terjemahan dari bahasa Inggris. - M.: Mir, 1978. - 510-an.

    Duke V.A. Psikodiagnostik komputer. - St. Petersburg: Persaudaraan, 1994. - 365 hal.

    Aizenberg I.N., Aizenberg N.N. dan Krivosheev G.A. Neuron Biner Multi-nilai dan Universal: Algoritma Pembelajaran, Aplikasi untuk Pemrosesan dan Pengenalan Gambar. Catatan Kuliah dalam Kecerdasan Buatan - Pembelajaran Mesin dan Penambangan Data dalam Pengenalan Pola, 1999, hlm. 21-35.

    Ranganath S. dan Arun K. Pengenalan wajah menggunakan fitur transformasi dan jaringan saraf. Pengenalan Pola 1997, Vol. 30, hal. 1615-1622.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 1. Organisasi dan pelatihan jaringan saraf dengan langsung dan umpan balik - Brest: BPI, 1999, - 260-an.

    Vetter T. dan Poggio T. Kelas Objek Linier dan Sintesis Gambar Dari Gambar Contoh Tunggal. Transaksi IEEE pada Analisis Pola dan Intelijen Mesin 1997, Vol. 19, hal. 733-742.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 2. Self-organisasi, toleransi kesalahan dan penggunaan jaringan saraf - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. dan Back A. D. Pengenalan Wajah: Pendekatan Jaringan Saraf Konvolusi. Transaksi IEEE di Neural Networks, Edisi Khusus Neural Networks and Pattern Recognition, hlm. 1-24.

    Wasserman F. Teknologi neurokomputer: Teori dan praktik, 1992 - 184p.

    Rowley H. A., Baluja S. dan Kanade T. Deteksi Wajah Berbasis Neural Network. Transaksi IEEE pada Analisis Pola dan Intelijen Mesin 1998, Vol. 20, hal. 23-37.

    Valentin D., Abdi H., O "Toole A. J. dan Cottrell G. W. Model Connectionist pemrosesan wajah: survei. DI: Pengenalan Pola 1994, Vol. 27, hlm. 1209-1230.

    Dokumen

    Mereka membuat algoritma pengakuangambar-gambar. Metodepengakuangambar-gambar Seperti disebutkan di atas ... kenyataannya tidak ada"ekosistem secara umum" dan ada hanya beberapa ... kesimpulan dari detail ini tinjauanmetodepengakuan kami hadirkan di...

  1. Ikhtisar metode untuk mengidentifikasi orang berdasarkan gambar wajah, dengan mempertimbangkan fitur pengenalan visual

    Tinjauan

    ... pengakuan oleh seseorang dari objek kontras rendah, termasuk. orang. Telah membawa tinjauan umum metode ... Ada seluruh baris metode ... jalan, sebagai hasil dari penelitian, sebuah platform untuk pengembangan metodepengakuan ...

  2. Imeni Glazkova Valentina Vladimirovna PENELITIAN DAN PENGEMBANGAN METODE KONSTRUKSI ALAT PERANGKAT LUNAK UNTUK KLASIFIKASI DOKUMEN HIPERTEKS MULTI TOPIK Spesialisasi 05

    Abstrak disertasi

    dokumen hiperteks. Bab ini berisi tinjauanadametode solusi dari masalah yang sedang dipertimbangkan, deskripsi ... dengan memotong kelas yang paling tidak relevan // Mathematical metodepengakuangambar-gambar: Konferensi Seluruh Rusia ke-13. wilayah Leningrad...

  3. Slide 0 Ikhtisar tugas bioinformatika terkait analisis dan pengolahan teks genetik

    Kuliah

    sekuens DNA dan protein. Tinjauan tugas bioinformatika sebagai tugas ... sinyal memerlukan penggunaan modern metodepengakuangambar-gambar, pendekatan statistik dan ... dengan kepadatan gen rendah. Ada program prediksi gen tidak...

Dll. objek yang dicirikan oleh sekumpulan terbatas dari properti dan fitur tertentu. Tugas seperti itu cukup sering diselesaikan, misalnya, saat menyeberang atau mengemudi di lampu lalu lintas. Mengenali warna lampu lalu lintas yang menyala dan mengetahui aturan jalan memungkinkan Anda membuat keputusan yang tepat tentang apakah akan menyeberang jalan atau tidak.

Kebutuhan akan pengakuan semacam itu muncul di berbagai bidang - mulai dari urusan militer dan sistem keamanan hingga digitalisasi sinyal analog.

Masalah pengenalan gambar menjadi sangat penting dalam kondisi kelebihan informasi, ketika seseorang tidak dapat mengatasi pemahaman urutan linier dari pesan yang masuk kepadanya, akibatnya otaknya beralih ke mode persepsi dan pemikiran simultan, yang merupakan ciri khas dari pengakuan tersebut.

Oleh karena itu, bukan kebetulan bahwa masalah pengenalan gambar ternyata berada di bidang penelitian interdisipliner - termasuk sehubungan dengan pekerjaan penciptaan kecerdasan buatan, dan penciptaan sistem teknis. pengenalan pola semakin menarik perhatian.

YouTube ensiklopedis

    1 / 4

    Pengantar Pengenalan Pola

    R.V. Syamin. Kuliah No. 6 Jaringan Hopfield dan Hamming dalam masalah pengenalan pola

    [DDSH-2016]: Jaringan saraf dan visi komputer modern

    Kuliah 9. Pemulusan eksponensial. Pengenalan Pola: metode tetangga terdekat ke-k

    Subtitle

Arah dalam pengenalan pola

Ada dua arah utama:

  • Studi tentang kemampuan pengenalan yang dimiliki oleh makhluk hidup, menjelaskan dan memodelkannya;
  • Pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu untuk tujuan yang diterapkan.

Pernyataan resmi dari masalah

Pengenalan pola adalah penugasan data awal ke kelas tertentu dengan menyoroti fitur penting yang mencirikan data ini dari total massa data non-esensial.

Ketika mengatur masalah pengenalan, mereka mencoba menggunakan bahasa matematika, mencoba - berbeda dengan teori jaringan saraf tiruan, di mana dasarnya adalah untuk mendapatkan hasil melalui percobaan - untuk menggantikan percobaan dengan penalaran logis dan bukti matematis.

Pernyataan klasik tentang masalah pengenalan pola: Diberikan satu set objek. Mereka perlu diklasifikasikan. Himpunan diwakili oleh himpunan bagian, yang disebut kelas. Mengingat: informasi tentang kelas, deskripsi seluruh himpunan, dan deskripsi informasi tentang objek yang milik kelas tertentu tidak diketahui. Diperlukan, sesuai dengan informasi yang tersedia tentang kelas dan deskripsi objek, untuk menentukan kelas mana yang dimiliki objek ini.

Paling sering, gambar monokrom dipertimbangkan dalam masalah pengenalan pola, yang memungkinkan untuk mempertimbangkan gambar sebagai fungsi pada bidang. Jika kita mempertimbangkan set titik di pesawat T (\gaya tampilan T), di mana fungsi menyatakan pada setiap titik gambar karakteristiknya - kecerahan, transparansi, kerapatan optik, maka fungsi tersebut adalah catatan formal gambar.

Himpunan semua fungsi yang mungkin f (x , y) (\gaya tampilan f(x, y)) di permukaan T (\gaya tampilan T)- ada model kumpulan semua gambar X (\gaya tampilan X). Memperkenalkan konsep kesamaan antara gambar, Anda dapat mengatur tugas pengenalan. Bentuk khusus dari pengaturan tersebut sangat tergantung pada tahap-tahap selanjutnya dalam pengenalan sesuai dengan satu atau lain pendekatan.

Beberapa metode pengenalan gambar grafis

Untuk pengenalan gambar optik, Anda dapat menerapkan metode iterasi pada jenis objek pada berbagai sudut, skala, offset, dll. Untuk huruf, Anda perlu mengulangi font, properti font, dll.

Pendekatan kedua adalah menemukan kontur objek dan memeriksa propertinya (konektivitas, keberadaan sudut, dll.)

Pendekatan lain adalah dengan menggunakan jaringan artifisial neural . Metode ini memerlukan sejumlah besar contoh tugas pengenalan (dengan jawaban yang benar), atau struktur jaringan saraf khusus yang memperhitungkan kekhususan tugas ini.

Perceptron sebagai metode pengenalan pola

F. Rosenblatt, memperkenalkan konsep model otak, yang tugasnya adalah menunjukkan bagaimana fenomena psikologis dapat muncul dalam beberapa sistem fisik, yang struktur dan sifat fungsionalnya diketahui, menggambarkan eksperimen diskriminasi yang paling sederhana. Eksperimen ini sepenuhnya terkait dengan metode pengenalan pola, tetapi berbeda karena algoritma solusi tidak deterministik.

Eksperimen paling sederhana, atas dasar yang memungkinkan untuk memperoleh informasi yang signifikan secara psikologis tentang sistem tertentu, bermuara pada fakta bahwa model disajikan dengan dua rangsangan berbeda dan diperlukan untuk menanggapinya dengan cara yang berbeda. Tujuan dari eksperimen tersebut mungkin untuk mempelajari kemungkinan diskriminasi spontan mereka oleh sistem tanpa adanya intervensi dari eksperimen, atau, sebaliknya, untuk mempelajari diskriminasi paksa, di mana eksperimen berusaha untuk mengajarkan sistem untuk melaksanakan klasifikasi yang diperlukan.

Dalam percobaan dengan pembelajaran, perceptron biasanya disajikan dengan urutan gambar tertentu, yang mencakup perwakilan dari masing-masing kelas untuk dibedakan. Menurut beberapa aturan modifikasi memori, pilihan reaksi yang benar diperkuat. Kemudian stimulus kontrol dipresentasikan ke perceptron dan probabilitas memperoleh respon yang benar untuk stimulus kelas ini ditentukan. Bergantung pada apakah stimulus kontrol yang dipilih cocok atau tidak cocok dengan salah satu gambar yang digunakan dalam urutan pelatihan, hasil yang berbeda diperoleh:

  1. Jika stimulus kontrol tidak sesuai dengan stimulus belajar mana pun, maka eksperimen tidak hanya dikaitkan dengan diskriminasi murni, tetapi juga termasuk elemen generalisasi.
  2. Jika stimulus kontrol menggairahkan seperangkat elemen sensorik tertentu yang sama sekali berbeda dari elemen-elemen yang diaktifkan di bawah pengaruh rangsangan yang disajikan sebelumnya dari kelas yang sama, maka eksperimen adalah penyelidikan. generalisasi murni.

Perceptron tidak memiliki kapasitas untuk generalisasi murni, tetapi mereka berfungsi cukup memuaskan dalam eksperimen diskriminasi, terutama jika stimulus kontrol bertepatan cukup dekat dengan salah satu pola yang perceptron telah mengumpulkan beberapa pengalaman.

Contoh masalah pengenalan pola

  • Pengenalan kode batang
  • Pengenalan plat nomor
  • Pengenalan gambar
  • Pengakuan daerah lokal kerak bumi di mana deposit berada