Definisi pengenalan pola. Klasifikasi menurut cara terdekat

Sistem kehidupan, termasuk manusia, secara konstan dihadapkan pada tugas pengenalan pola sejak awal. Secara khusus, informasi yang berasal dari organ indera diproses oleh otak, yang, pada gilirannya, menyortir informasi, memastikan pengambilan keputusan, dan kemudian, menggunakan impuls elektrokimia, mentransmisikan sinyal yang diperlukan lebih lanjut, misalnya, ke organ gerakan. , yang mengimplementasikan tindakan yang diperlukan. Kemudian terjadi perubahan lingkungan, dan fenomena di atas terjadi lagi. Dan jika Anda perhatikan, maka setiap tahap disertai dengan pengakuan.

Dengan perkembangan teknologi komputer, menjadi mungkin untuk memecahkan sejumlah masalah yang muncul dalam proses kehidupan, untuk memudahkan, mempercepat, meningkatkan kualitas hasil. Misalnya, pengoperasian berbagai sistem pendukung kehidupan, interaksi manusia-komputer, munculnya sistem robot, dll. Namun, kami mencatat bahwa saat ini tidak mungkin untuk memberikan hasil yang memuaskan dalam beberapa tugas (pengenalan objek serupa yang bergerak cepat , teks tulisan tangan).

Tujuan pekerjaan: untuk mempelajari sejarah sistem pengenalan pola.

Menunjukkan perubahan kualitatif yang terjadi di bidang pengenalan pola, baik teoretis maupun teknis, dengan menunjukkan alasannya;

Diskusikan metode dan prinsip yang digunakan dalam komputasi;

Berikan contoh prospek yang diharapkan dalam waktu dekat.

1. Apa itu pengenalan pola?

Penelitian pertama dengan teknologi komputer pada dasarnya mengikuti skema klasik pemodelan matematika - model matematika, algoritma dan perhitungan. Ini adalah tugas pemodelan proses yang terjadi selama ledakan bom atom, menghitung lintasan balistik, aplikasi ekonomi dan lainnya. Namun, selain ide klasik dari seri ini, ada juga metode yang didasarkan pada sifat yang sama sekali berbeda, dan seperti yang ditunjukkan oleh praktik penyelesaian beberapa masalah, mereka sering memberikan hasil yang lebih baik daripada solusi berdasarkan model matematika yang terlalu rumit. Ide mereka adalah untuk meninggalkan keinginan untuk membuat model matematis lengkap dari objek yang diteliti (selain itu, seringkali praktis tidak mungkin untuk membangun model yang memadai), dan bukannya puas dengan jawaban hanya untuk pertanyaan spesifik yang menarik bagi kami, dan jawaban-jawaban ini harus dicari dari pertimbangan-pertimbangan yang umum hingga kelas masalah yang luas. Penelitian semacam ini mencakup pengenalan citra visual, peramalan hasil, ketinggian sungai, masalah membedakan antara bantalan minyak dan akuifer menggunakan data geofisika tidak langsung, dll. Jawaban spesifik dalam tugas ini diperlukan dalam bentuk yang agak sederhana, seperti, misalnya, apakah suatu objek termasuk dalam salah satu kelas yang telah diperbaiki sebelumnya. Dan data awal dari tugas-tugas ini, sebagai suatu peraturan, diberikan dalam bentuk informasi terpisah-pisah tentang objek yang diteliti, misalnya, dalam bentuk satu set objek yang telah diklasifikasikan sebelumnya. Dari sudut pandang matematis, ini berarti bahwa pengenalan pola (dan kelas masalah ini dinamai di negara kita) adalah generalisasi luas dari gagasan ekstrapolasi fungsi.

Pentingnya formulasi semacam itu untuk ilmu-ilmu teknis tidak diragukan lagi, dan ini dengan sendirinya membenarkan banyak penelitian di bidang ini. Namun, masalah pengenalan pola juga memiliki aspek yang lebih luas untuk ilmu pengetahuan alam (namun, akan aneh jika sesuatu yang begitu penting untuk sistem sibernetik buatan tidak penting untuk yang alami). Konteks ilmu ini secara organik mencakup pertanyaan yang diajukan oleh para filsuf kuno tentang sifat pengetahuan kita, kemampuan kita untuk mengenali gambar, pola, situasi dunia sekitarnya. Faktanya, praktis tidak ada keraguan bahwa mekanisme untuk mengenali gambar paling sederhana, seperti gambar pemangsa atau makanan berbahaya yang mendekat, terbentuk jauh lebih awal daripada bahasa dasar dan perangkat logika formal muncul. Dan tidak ada keraguan bahwa mekanisme seperti itu juga cukup berkembang pada hewan tingkat tinggi, yang, dalam aktivitas vitalnya, juga sangat membutuhkan kemampuan untuk membedakan sistem tanda-tanda alam yang agak rumit. Jadi, di alam, kita melihat bahwa fenomena berpikir dan kesadaran jelas didasarkan pada kemampuan untuk mengenali pola, dan kemajuan lebih lanjut dari ilmu kecerdasan berhubungan langsung dengan kedalaman pemahaman tentang hukum dasar pengenalan. Memahami fakta bahwa pertanyaan-pertanyaan di atas jauh melampaui definisi standar pengenalan pola (dalam literatur bahasa Inggris, istilah pembelajaran yang diawasi lebih umum), perlu juga dipahami bahwa mereka memiliki hubungan yang dalam dengan ini yang relatif sempit (tetapi masih jauh). dari kelelahan) arah.

Bahkan sekarang, pengenalan pola telah memasuki kehidupan sehari-hari dengan kuat dan merupakan salah satu pengetahuan paling penting dari seorang insinyur modern. Dalam kedokteran, pengenalan pola membantu dokter membuat diagnosis yang lebih akurat; di pabrik, pengenalan pola digunakan untuk memprediksi cacat pada batch barang. Sistem identifikasi pribadi biometrik sebagai inti algoritmiknya juga didasarkan pada hasil disiplin ini. Pengembangan lebih lanjut dari kecerdasan buatan, khususnya desain komputer generasi kelima yang mampu berkomunikasi lebih langsung dengan seseorang dalam bahasa alami untuk orang-orang dan melalui ucapan, tidak terpikirkan tanpa pengenalan. Di sini, robotika, sistem kontrol buatan yang berisi sistem pengenalan sebagai subsistem vital, mudah dijangkau.

Itulah sebabnya banyak perhatian tertuju pada pengembangan pengenalan pola sejak awal oleh para spesialis dari berbagai profil - sibernetika, neurofisiologis, psikolog, matematikawan, ekonom, dll. Sebagian besar karena alasan ini, pengenalan pola modern itu sendiri didasarkan pada ide-ide dari disiplin ini. Tanpa mengklaim lengkap (dan tidak mungkin mengklaimnya dalam esai pendek), kami akan menjelaskan sejarah pengenalan pola, ide-ide kunci.

definisi

Sebelum melanjutkan ke metode utama pengenalan pola, kami memberikan beberapa definisi yang diperlukan.

Pengenalan gambar (objek, sinyal, situasi, fenomena, atau proses) adalah tugas untuk mengidentifikasi objek atau menentukan propertinya berdasarkan gambarnya (pengenalan optik) atau rekaman audio (pengenalan akustik) dan karakteristik lainnya.

Salah satu yang mendasar adalah konsep himpunan yang tidak memiliki rumusan khusus. Di komputer, satu set diwakili oleh satu set elemen yang tidak berulang dari jenis yang sama. Kata "tidak berulang" berarti bahwa beberapa elemen dalam himpunan ada atau tidak ada. Himpunan universal mencakup semua elemen yang mungkin untuk masalah yang diselesaikan, himpunan kosong tidak mengandung apapun.

Citra adalah suatu pengelompokan klasifikasi dalam sistem klasifikasi yang menyatukan (single out) suatu kelompok objek tertentu menurut beberapa atribut. Gambar memiliki sifat khas, yang memanifestasikan dirinya dalam kenyataan bahwa kenalan dengan sejumlah fenomena terbatas dari himpunan yang sama memungkinkan untuk mengenali sejumlah besar perwakilannya secara sewenang-wenang. Gambar memiliki sifat objektif yang khas dalam arti bahwa orang yang berbeda yang belajar dari bahan pengamatan yang berbeda, sebagian besar, mengklasifikasikan objek yang sama dengan cara yang sama dan secara independen satu sama lain. Dalam rumusan klasik masalah pengenalan, himpunan semesta dibagi menjadi bagian-gambar. Setiap pemetaan objek apa pun ke organ penerima dari sistem pengenalan, terlepas dari posisinya relatif terhadap organ-organ ini, biasanya disebut gambar objek, dan kumpulan gambar tersebut, disatukan oleh beberapa sifat umum, adalah gambar.

Metode menugaskan elemen ke gambar apa pun disebut aturan keputusan. Konsep penting lainnya adalah metrik, cara untuk menentukan jarak antara elemen himpunan universal. Semakin kecil jarak ini, semakin mirip objek (simbol, suara, dll.) yang kita kenal. Biasanya, elemen ditentukan sebagai kumpulan angka, dan metrik ditentukan sebagai fungsi. Efisiensi program tergantung pada pilihan representasi gambar dan implementasi metrik, satu algoritma pengenalan dengan metrik yang berbeda akan membuat kesalahan dengan frekuensi yang berbeda.

Belajar biasanya disebut proses mengembangkan dalam beberapa sistem reaksi tertentu terhadap kelompok sinyal identik eksternal dengan berulang kali mempengaruhi sistem koreksi eksternal. Penyesuaian eksternal seperti itu dalam pelatihan biasanya disebut "dorongan" dan "hukuman". Mekanisme untuk menghasilkan penyesuaian ini hampir sepenuhnya menentukan algoritma pembelajaran. Belajar mandiri berbeda dari belajar di sini informasi tambahan tentang kebenaran reaksi terhadap sistem tidak dilaporkan.

Adaptasi adalah proses mengubah parameter dan struktur sistem, dan mungkin juga mengontrol tindakan, berdasarkan informasi terkini untuk mencapai keadaan sistem tertentu dengan ketidakpastian awal dan kondisi operasi yang berubah.

Belajar adalah suatu proses, sebagai akibatnya sistem secara bertahap memperoleh kemampuan untuk merespons dengan reaksi yang diperlukan terhadap serangkaian pengaruh eksternal tertentu, dan adaptasi adalah penyesuaian parameter dan struktur sistem untuk mencapai kualitas yang diperlukan. kontrol dalam kondisi perubahan terus menerus dalam kondisi eksternal.

Contoh tugas pengenalan pola: - Pengenalan huruf;

Kuliah nomor 17.METODE PENGENALAN POLA

Ada kelompok metode pengenalan berikut:

Metode Fungsi Kedekatan

Metode Fungsi Diskriminan

Metode statistik pengakuan.

Metode Linguistik

metode heuristik.

Tiga kelompok metode pertama difokuskan pada analisis fitur yang dinyatakan oleh angka atau vektor dengan komponen numerik.

Kelompok metode linguistik memberikan pengenalan pola berdasarkan analisis strukturnya, yang dijelaskan oleh fitur struktural yang sesuai dan hubungan di antara mereka.

Kelompok metode heuristik menggabungkan teknik karakteristik dan prosedur logis yang digunakan oleh manusia dalam pengenalan pola.

Metode Fungsi Kedekatan

Metode kelompok ini didasarkan pada penggunaan fungsi yang mengevaluasi ukuran kedekatan antara gambar yang dapat dikenali dengan vektor. x * = (x * 1 ,….,x*n), dan gambar referensi dari berbagai kelas, yang diwakili oleh vektor x saya = (x saya 1 ,…, x saya tidak), saya = 1,…,N, di mana saya- nomor kelas gambar.

Prosedur pengenalan menurut metode ini terdiri dalam menghitung jarak antara titik dari gambar yang dikenali dan setiap titik yang mewakili gambar referensi, yaitu. dalam perhitungan semua nilai aku , saya = 1,…,N. Gambar milik kelas yang nilainya aku memiliki nilai terkecil di antara semuanya saya = 1,…,N .

Fungsi yang memetakan setiap pasangan vektor x saya, x * bilangan real sebagai ukuran kedekatan mereka, yaitu. menentukan jarak antara mereka bisa sangat sewenang-wenang. Dalam matematika, fungsi seperti itu disebut metrik ruang. Itu harus memenuhi aksioma berikut:

r(x,y)=r(y,x);

r(x,y) > 0 jika x tidak sama kamu dan r(x,y)=0 jika x=y;

r(x,y) <=r(x,z)+r(z, y)

Aksioma-aksioma ini dipenuhi, khususnya, oleh fungsi-fungsi berikut:

aku= 1/2 , j=1,2,…n.

b saya= jumlah, j=1,2,…n.

c saya= perut maksimal( x sayaxj *), j=1,2,…n.

Yang pertama disebut norma Euclidean dari ruang vektor. Dengan demikian, ruang di mana fungsi tertentu digunakan sebagai metrik disebut ruang Euclidean.

Seringkali, perbedaan akar-rata-rata-kuadrat dari koordinat gambar yang dikenali dipilih sebagai fungsi kedekatan x * dan standar x saya, yaitu fungsi

aku = (1/n) jumlah( x saya jxj *) 2 , j=1,2,…n.

Nilai aku secara geometris ditafsirkan sebagai kuadrat jarak antara titik-titik dalam ruang fitur, terkait dengan dimensi ruang.

Seringkali ternyata fitur yang berbeda tidak sama pentingnya dalam pengenalan. Untuk mempertimbangkan keadaan ini ketika menghitung fungsi kedekatan dari perbedaan koordinat, fitur yang lebih penting yang sesuai dikalikan dengan koefisien besar, dan yang kurang penting dengan yang lebih kecil.

Pada kasus ini aku = (1/n) jumlah wj (x saya jxj *) 2 , j=1,2,…n,

di mana wj- koefisien berat.

Pengenalan koefisien bobot setara dengan penskalaan sumbu ruang fitur dan, karenanya, meregangkan atau mengompresi ruang dalam arah yang terpisah.

Deformasi ruang fitur ini mengejar tujuan pengaturan titik-titik gambar referensi seperti itu, yang sesuai dengan pengenalan yang paling dapat diandalkan dalam kondisi sebaran gambar yang signifikan dari setiap kelas di sekitar titik gambar referensi.

Kumpulan titik-titik citra yang saling berdekatan (cluster of images) dalam ruang fitur disebut cluster, dan masalah mengidentifikasi kelompok-kelompok tersebut disebut masalah clustering.

Tugas mengidentifikasi cluster disebut sebagai tugas pengenalan pola yang tidak diawasi, mis. untuk masalah pengenalan tanpa adanya contoh pengenalan yang benar.

Metode Fungsi Diskriminan

Ide dari metode grup ini adalah untuk membangun fungsi yang mendefinisikan batas dalam ruang gambar, membagi ruang menjadi wilayah yang sesuai dengan kelas gambar. Fungsi paling sederhana dan paling sering digunakan dari jenis ini adalah fungsi yang bergantung secara linier pada nilai fitur. Di ruang fitur, mereka sesuai dengan memisahkan permukaan dalam bentuk hyperplanes. Dalam kasus ruang fitur dua dimensi, garis lurus bertindak sebagai fungsi pemisah.

Bentuk umum dari fungsi keputusan linier diberikan oleh rumus

d(x)=w 1 x 1 + w 2 x 2 +…+w n x n +w n +1 = wx+w n

di mana x- vektor gambar, w=(w 1 , w 2 ,…w n) adalah vektor koefisien bobot.

Ketika dibagi menjadi dua kelas X 1 dan X 2 fungsi diskriminan d(x) memungkinkan pengakuan menurut aturan:

x milik X 1 jika d(x)>0;

x milik X 2 jika d(x)<0.

Jika sebuah d(x)=0, maka kasus ketidakpastian terjadi.

Dalam kasus pemisahan menjadi beberapa kelas, beberapa fungsi diperkenalkan. Dalam hal ini, setiap kelas gambar dikaitkan dengan kombinasi tertentu dari tanda-tanda fungsi pembeda.

Misalnya, jika tiga fungsi diskriminan diperkenalkan, maka varian berikut dalam memilih kelas gambar dimungkinkan:

x milik X 1 jika d 1 (x)>0,d 2 (x)<0,d 3 (x)<0;

x milik X 2 jika d(x)<0,d 2 (x)>0,d 3 (x)<0;

x milik X 3 jika d(x)<0,d 2 (x)<0,d 3 (x)>0.

Diasumsikan bahwa untuk kombinasi nilai lainnya d 1 (x),d 2 (x),d 3 (x) ada kasus ketidakpastian.

Variasi dari metode fungsi diskriminan adalah metode fungsi yang menentukan. Di dalamnya, jika tersedia m kelas diasumsikan ada m fungsi aku(x), disebut menentukan, sehingga jika x milik X saya, kemudian aku(x) > d j(x) untuk semua j tidak sama saya,itu. fungsi penentu aku(x) memiliki nilai maksimum di antara semua fungsi d j(x), j=1,...,n..

Sebuah ilustrasi dari metode tersebut dapat menjadi pengklasifikasi berdasarkan perkiraan minimum jarak Euclidean di ruang fitur antara titik gambar dan standar. Mari kita tunjukkan.

Jarak Euclidean antara vektor fitur dari gambar yang dapat dikenali x dan vektor gambar referensi ditentukan oleh rumus || x sayax|| = 1/2 , j=1,2,…n.

vektor x akan ditugaskan ke kelas saya, yang nilainya || x sayax *|| minimum.

Alih-alih jarak, Anda dapat membandingkan kuadrat jarak, mis.

||x sayax|| 2 = (x sayax)(x sayax) t = x x- 2x x saya +x saya x saya

Karena nilai x x sama untuk semua orang saya, fungsi minimum || x sayax|| 2 akan bertepatan dengan maksimum fungsi keputusan

aku(x) = 2x x saya -x saya x saya.

yaitu x milik X saya, jika aku(x) > d j(x) untuk semua j tidak sama saya.

Itu. mesin pengklasifikasi jarak minimum didasarkan pada fungsi keputusan linier. Struktur umum mesin seperti itu menggunakan fungsi keputusan dalam bentuk

aku (x)=aku 1 x 1 + aku 2 x 2 +…+w dalam x n +apa aku tidak +1

Hal ini dapat secara visual diwakili oleh diagram blok yang sesuai.

Untuk mesin yang melakukan klasifikasi menurut jarak minimum, persamaan terjadi: w ij = -2x saya j , apa aku tidak +1 = x saya x saya.

Pengenalan ekuivalen dengan metode fungsi diskriminan dapat dilakukan jika fungsi diskriminan didefinisikan sebagai perbedaan dijo (x)=aku (x)‑dj (x).

Keuntungan dari metode fungsi diskriminan adalah struktur sederhana dari mesin pengenalan, serta kemungkinan implementasinya terutama melalui blok keputusan yang didominasi linier.

Keuntungan penting lainnya dari metode fungsi diskriminan adalah kemungkinan pelatihan otomatis mesin untuk pengenalan yang benar dari sampel (pelatihan) gambar yang diberikan.

Pada saat yang sama, algoritma pembelajaran otomatis ternyata sangat sederhana dibandingkan dengan metode pengenalan lainnya.

Untuk alasan ini, metode fungsi diskriminan telah mendapatkan popularitas yang luas dan sering digunakan dalam praktik.

Prosedur belajar mandiri pengenalan pola

Pertimbangkan metode untuk membangun fungsi diskriminan untuk sampel (pelatihan) yang diberikan seperti yang diterapkan pada masalah membagi gambar menjadi dua kelas. Jika dua himpunan gambar diberikan, masing-masing milik kelas A dan B, maka solusi untuk masalah membangun fungsi diskriminan linier dicari dalam bentuk vektor koefisien bobot W=(w 1 ,w 2 ,...,w n,w n+1), yang memiliki properti bahwa untuk gambar apa pun kondisinya

x termasuk kelas A jika >0, j=1,2,…n.

x termasuk kelas B jika<0, j=1,2,…n.

Jika sampel pelatihan adalah N gambar dari kedua kelas, masalahnya direduksi menjadi menemukan vektor w yang memastikan validitas sistem pertidaksamaan.Jika sampel pelatihan terdiri dari N gambar dari kedua kelas, masalahnya direduksi menjadi menemukan vektor w, yang memastikan validitas sistem ketidaksetaraan

x 1 1 aku+x 21 w 2 +...+x n 1 w n+w n +1 >0;

x 1 2 aku+x 22 w 2 +...+x n 2 w n+w n +1 <0;

x 1 sayaaku+x 2saya w 2 +...+x ni w n+w n +1 >0;

................................................

x 1 Nw saya +x 2N w 2 +...+x nN w n +w n + 1>0;

di sini x saya=(x saya 1 ,x i 2 ,...,x i n ,x i n+ 1 ) - vektor nilai fitur gambar dari sampel pelatihan, tanda > sesuai dengan vektor gambar x milik kelas A, dan tanda< - векторам x tergolong kelas B

vektor yang diinginkan w ada jika kelas A dan B dapat dipisahkan dan tidak ada sebaliknya. Nilai komponen vektor w dapat ditemukan terlebih dahulu, pada tahap sebelum implementasi perangkat keras SRO, atau langsung oleh SRO itu sendiri selama operasinya. Yang terakhir dari pendekatan ini memberikan fleksibilitas dan otonomi yang lebih besar dari SRO. Pertimbangkan pada contoh perangkat yang disebut persenron. ditemukan pada tahun 1957 oleh ilmuwan Amerika Rosenblatt. Representasi skema persenron, yang memastikan bahwa gambar ditetapkan ke salah satu dari dua kelas, ditunjukkan pada gambar berikut.

retina S retina A retina R

oh oh x 1

oh oh x 2

oh oh x 3

o(jumlah)-------> R(reaksi)

oh oh x saya

oh oh x n

oh oh x n +1

Perangkat ini terdiri dari elemen sensorik retina S, yang secara acak terhubung ke elemen asosiatif retina A. Setiap elemen retina kedua menghasilkan sinyal keluaran hanya jika sejumlah elemen sensorik yang terhubung ke inputnya dalam jumlah yang cukup dalam keadaan tereksitasi. Respon seluruh sistem R sebanding dengan jumlah reaksi elemen-elemen retina asosiatif yang diambil dengan bobot tertentu.

Menunjukkan melalui x saya reaksi saya elemen asosiatif dan melalui aku- koefisien berat reaksi saya unsur asosiatif, reaksi sistem dapat ditulis sebagai R= jumlah( w j x j), j=1,..,n. Jika sebuah R>0, maka gambar yang disajikan ke sistem termasuk ke dalam kelas A, dan jika R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений x 1 , x 2 ,...,x n sesuai dengan algoritma tertentu untuk pembentukan fitur berdasarkan sinyal dari sensor utama.

Secara umum, mungkin ada beberapa elemen R, yang membentuk reaksi perceptron. Dalam hal ini, seseorang berbicara tentang keberadaan retina di perceptron R unsur-unsur yang bereaksi.

Skema persen dapat diperluas untuk kasus ketika jumlah kelas lebih dari dua, dengan meningkatkan jumlah elemen retina R hingga jumlah kelas yang dapat dibedakan dan pengenalan blok untuk menentukan reaksi maksimum sesuai dengan skema yang disajikan pada gambar di atas. Dalam hal ini, gambar ditugaskan ke kelas dengan nomor saya, jika R i>Rj, untuk semua j.

Proses pembelajaran persenron terdiri dari pemilihan nilai-nilai koefisien bobot wj sehingga sinyal keluaran sesuai dengan kelas yang dimiliki oleh gambar yang dikenali.

Mari kita perhatikan algoritma aksi persen menggunakan contoh pengenalan objek dari dua kelas: A dan B. Objek kelas A harus sesuai dengan nilai R= +1, dan kelas B - nilainya R= -1.

Algoritma pembelajaran adalah sebagai berikut.

Jika gambar lain x milik kelas A, tapi R<0 (имеет место ошибка распознавания), тогда коэффициенты wj dengan indeks yang sesuai dengan nilai x j>0, meningkat dengan jumlah tertentu dw, dan koefisien lainnya wj berkurang sebanyak dw. Dalam hal ini, nilai reaksi R menerima kenaikan ke arah nilai positifnya sesuai dengan klasifikasi yang benar.

Jika sebuah x milik kelas B, tapi R>0 (ada kesalahan pengenalan), maka koefisien wj dengan indeks yang sesuai dengan x j<0, увеличивают на dw, dan koefisien lainnya wj dikurangi dengan jumlah yang sama. Dalam hal ini, nilai reaksi R bertambah ke arah nilai negatif yang sesuai dengan klasifikasi yang benar.

Algoritma dengan demikian memperkenalkan perubahan dalam vektor bobot w jika dan hanya jika gambar disajikan kepada k-langkah pelatihan, salah diklasifikasikan selama langkah ini, dan meninggalkan vektor bobot w tidak ada perubahan dalam hal klasifikasi yang benar. Bukti konvergensi algoritma ini disajikan di [Too, Gonzalez]. Pelatihan semacam itu pada akhirnya akan (dengan pilihan yang tepat dw dan pemisahan linier kelas gambar) mengarah ke vektor w untuk klasifikasi yang benar.

Metode statistik pengakuan.

Metode statistik didasarkan pada meminimalkan kemungkinan kesalahan klasifikasi. Probabilitas P dari klasifikasi yang salah dari gambar yang diterima untuk dikenali, dijelaskan oleh vektor fitur x, ditentukan oleh rumus

P = jumlah[ p(saya)masalah( D(x)+saya | x kelas saya)]

di mana m- jumlah kelas,

p(saya) = penyelidikan ( x milik kelas saya) - probabilitas apriori untuk menjadi bagian dari gambar arbitrer x ke saya kelas -th (frekuensi kemunculan gambar saya kelas th),

D(x) adalah fungsi yang membuat keputusan klasifikasi (vektor fitur x cocok dengan nomor kelas saya dari himpunan (1,2,..., m}),

masalah( D(x) tidak sama saya| x milik kelas saya) adalah peluang kejadian" D(x) tidak sama saya" ketika kondisi keanggotaan terpenuhi x kelas saya, yaitu probabilitas membuat keputusan yang salah oleh fungsi D(x) untuk nilai tertentu x dimiliki oleh saya-kelas.

Dapat ditunjukkan bahwa probabilitas kesalahan klasifikasi mencapai minimum jika D(x)=saya jika dan hanya jika p(x|sayap(saya)>p(x|jp(j), untuk semua i+j, di mana p(x|i) - kepadatan distribusi gambar saya kelas ke dalam ruang fitur.

Menurut aturan di atas, titik x milik kelas yang sesuai dengan nilai maksimum p(saya) p(x|i), yaitu produk dari probabilitas (frekuensi) apriori munculnya gambar saya-kepadatan distribusi kelas dan pola saya kelas ke dalam ruang fitur. Aturan klasifikasi yang disajikan disebut Bayesian, karena itu mengikuti dari rumus Bayes yang terkenal dalam teori probabilitas.

Contoh. Biarlah perlu untuk mengenali sinyal-sinyal diskrit pada keluaran saluran informasi yang dipengaruhi oleh derau.

Setiap sinyal input adalah 0 atau 1. Sebagai hasil dari transmisi sinyal, output saluran muncul nilai x, yang ditumpangkan dengan derau Gaussian dengan mean dan varians nol b.

Untuk sintesis pengklasifikasi yang melakukan pengenalan sinyal, kami akan menggunakan aturan klasifikasi Bayesian.

Di kelas No. 1 kami menggabungkan sinyal yang mewakili unit, di kelas No. 2 - sinyal yang mewakili nol. Perlu diketahui sebelumnya bahwa, rata-rata, dari setiap 1000 sinyal sebuah sinyal adalah satuan dan b sinyal - nol. Kemudian nilai probabilitas apriori munculnya sinyal dari kelas 1 dan 2 (satu dan nol), masing-masing, dapat diambil sama dengan

p(1)=a/1000, p(2)=b/1000.

Karena kebisingannya adalah Gaussian, mis. mematuhi hukum distribusi normal (Gaussian), maka kerapatan distribusi gambar kelas pertama, tergantung pada nilainya x, atau, yang sama, peluang memperoleh nilai keluaran x ketika sinyal 1 diterapkan pada input, itu ditentukan oleh ekspresi

p(x 1) =(2pib) -1/2 exp(-( x-1) 2 /(2b 2)),

dan kepadatan distribusi tergantung pada nilainya x gambar dari kelas kedua, yaitu probabilitas mendapatkan nilai keluaran x ketika sinyal 0 diterapkan pada input, itu ditentukan oleh ekspresi

p(x 2)= (2pib) -1/2 exp(- x 2 /(2b 2)),

Penerapan aturan keputusan Bayesian mengarah pada kesimpulan bahwa sinyal kelas 2 ditransmisikan, yaitu. melewati nol jika

p(2) p(x 2) > p(1) p(x 1)

atau, lebih khusus, jika

b exp(- x 2 /(2b 2)) > sebuah exp(-( x-1) 2 /(2b 2)),

Membagi ruas kiri pertidaksamaan dengan ruas kanan, kita peroleh

(b/sebuah)exp((1-2 x)/(2b 2)) >1,

dimana, setelah mengambil logaritma, kami menemukan

1-2x> 2b 2 ln(a/b)

x< 0.5 - б 2 ln(a/b)

Ini mengikuti dari ketidaksetaraan yang dihasilkan bahwa a=b, yaitu dengan probabilitas apriori yang sama dari kemunculan sinyal 0 dan 1, gambar diberi nilai 0 ketika x<0.5, а значение 1, когда x>0.5.

Jika diketahui sebelumnya bahwa salah satu sinyal muncul lebih sering, dan yang lainnya lebih jarang, mis. dalam hal nilai yang berbeda sebuah dan b, ambang respons pengklasifikasi digeser ke satu sisi atau sisi lainnya.

Jadi di a/b=2,71 (sesuai dengan transmisi 2,71 kali lebih sering) dan b 2 = 0,1, gambar diberi nilai 0 jika x<0.4, и значение 1, если x>0.4. Jika tidak ada informasi tentang probabilitas distribusi apriori, maka metode pengenalan statistik dapat digunakan, yang didasarkan pada selain aturan klasifikasi Bayesian.

Namun, dalam praktiknya, metode berdasarkan aturan Bayes paling umum karena efisiensinya yang lebih besar, dan juga karena fakta bahwa dalam sebagian besar masalah pengenalan pola, dimungkinkan untuk menetapkan probabilitas apriori untuk tampilan gambar dari setiap kelas.

Metode linguistik pengenalan pola.

Metode linguistik pengenalan pola didasarkan pada analisis deskripsi gambar yang diidealkan, direpresentasikan sebagai grafik atau untaian simbol, yang merupakan frasa atau kalimat bahasa tertentu.

Pertimbangkan gambar huruf ideal yang diperoleh sebagai hasil dari tahap pertama pengenalan linguistik yang dijelaskan di atas. Gambar-gambar ideal ini dapat didefinisikan dengan deskripsi grafik, diwakili, misalnya, dalam bentuk matriks koneksi, seperti yang dilakukan pada contoh di atas. Deskripsi yang sama dapat diwakili oleh frasa bahasa formal (ekspresi).

Contoh. Biarkan diberikan tiga gambar dari huruf A yang diperoleh sebagai hasil dari pemrosesan gambar awal. Mari kita tentukan gambar-gambar ini dengan pengidentifikasi A1, A2 dan A3.

Untuk deskripsi linguistik dari gambar yang disajikan, kami menggunakan PDL (Picture Description Language). Kamus bahasa PDL mencakup karakter berikut:

1. Nama-nama gambar paling sederhana (primitif). Seperti yang diterapkan pada kasus yang sedang dipertimbangkan, primitif dan nama yang sesuai adalah sebagai berikut.

Gambar dalam bentuk garis yang diarahkan:

atas dan kiri (le F t), ke utara (utara)), ke atas dan ke kanan (kanan), ke timur (timur)).

Nama: L, N, R, E.

2. Simbol operasi biner. (+,*,-) Artinya sesuai dengan koneksi berurutan primitif (+), koneksi awal dan akhir primitif (*), koneksi hanya ujung primitif (-).

3. Kurung kanan dan kiri. ((,)) Tanda kurung memungkinkan Anda untuk menentukan urutan operasi yang akan dilakukan dalam ekspresi.

Gambar yang dipertimbangkan A1, A2 dan A3 dijelaskan dalam bahasa PDL, masing-masing, dengan ekspresi berikut.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

Setelah deskripsi linguistik gambar dibangun, perlu untuk menganalisis, menggunakan beberapa prosedur pengenalan, apakah gambar yang diberikan termasuk kelas yang menarik bagi kita (kelas huruf A), yaitu. apakah gambar ini memiliki beberapa struktur atau tidak. Untuk melakukan ini, pertama-tama, perlu untuk menggambarkan kelas gambar yang memiliki struktur yang menarik bagi kita.

Jelas, huruf A selalu mengandung elemen struktural berikut: "kaki" kiri, "kaki" kanan, dan kepala. Mari kita beri nama elemen-elemen ini masing-masing STL, STR, TR.

Kemudian, dalam bahasa PDL, simbol kelas A - SIMB A digambarkan dengan ekspresi

SIMB A = STL + TR - STR

"Kaki" kiri STL selalu merupakan rantai elemen R dan N, yang dapat ditulis sebagai

STL > R N (STL + R) (STL + N)

(STL adalah karakter R atau N, atau string yang diperoleh dengan menambahkan karakter R atau N ke string STL sumber)

"Kaki" kanan STR selalu merupakan rantai elemen L dan N, yang dapat ditulis sebagai berikut, yaitu.

STR > L¦N¦ (STR + L)¦(STR + N)

Bagian kepala huruf - TR adalah kontur tertutup, terdiri dari elemen E dan rantai seperti STL dan STR.

Dalam bahasa PDL, struktur TR dijelaskan oleh ekspresi

TR > (STL - STR) * E

Akhirnya, kita mendapatkan deskripsi berikut dari kelas huruf A:

SIMB A > (STL + TR - STR),

STL > R¦N¦ (STL + R)¦(STL + N)

STR > L¦N¦ (STR + L)¦(STR + N)

TR > (STL - STR) * E

Prosedur pengenalan dalam hal ini dapat dilaksanakan sebagai berikut.

1. Ekspresi yang sesuai dengan gambar dibandingkan dengan struktur referensi STL + TR - STR.

2. Setiap elemen struktur STL, TR, STR, jika memungkinkan, mis. jika deskripsi gambar sebanding dengan standar, beberapa subekspresi dari ekspresi T(A) cocok. Sebagai contoh,

untuk A1: STL=R, STR=L, TR=(R-(L+N))*E

untuk A2: STL = R + N, STR = L, TR = ((N + R) - L) * E

untuk A3: STL = N + R, STR = L + N, TR = (R - L) * E 3.

Ekspresi STL, STR, TR dibandingkan dengan struktur referensi yang sesuai.

4. Jika struktur setiap ekspresi STL, STR, TR sesuai dengan referensi, maka gambar tersebut termasuk kelas huruf A. Jika pada salah satu tahap 2, 3, 4 terdapat ketidaksesuaian antara struktur dari ekspresi yang dianalisis dan referensi, disimpulkan bahwa gambar tidak termasuk dalam kelas SIMB A. Pencocokan struktur ekspresi dapat dilakukan dengan menggunakan bahasa algoritme LISP, PLANER, PROLOG dan bahasa kecerdasan buatan serupa lainnya.

Dalam contoh yang dipertimbangkan, semua string STL terdiri dari karakter N dan R, dan string STR terdiri dari karakter L dan N, yang sesuai dengan struktur string ini. Struktur TR dalam gambar yang dipertimbangkan juga sesuai dengan referensi, karena terdiri dari "selisih" string tipe STL, STR, "dikalikan" dengan simbol E.

Jadi, kami sampai pada kesimpulan bahwa gambar yang dipertimbangkan termasuk dalam kelas SIMB A.


Sintesis pengontrol penggerak listrik DC fuzzydi lingkungan "MatLab"

Sintesis kontroler fuzzy dengan satu input dan output.

Masalahnya adalah mendapatkan drive untuk mengikuti berbagai input secara akurat. Pengembangan aksi kontrol dilakukan oleh pengontrol fuzzy, di mana blok fungsional berikut dapat dibedakan secara struktural: fuzzifier, rule block, dan defuzzifier.

Gbr.4 Diagram fungsional umum dari sistem dengan dua variabel linguistik.

Gbr.5 Diagram skema kontroler fuzzy dengan dua variabel linguistik.

Algoritma kontrol fuzzy dalam kasus umum adalah transformasi dari variabel input dari kontroler fuzzy menjadi variabel output dengan menggunakan prosedur yang saling terkait sebagai berikut:

1. transformasi variabel fisik input yang diperoleh dari sensor pengukuran dari objek kontrol menjadi variabel input linguistik dari kontroler fuzzy;

2. pemrosesan pernyataan logis, yang disebut aturan linguistik, mengenai variabel linguistik input dan output pengontrol;

3. transformasi variabel linguistik keluaran dari kontroler fuzzy menjadi variabel kontrol fisik.

Mari kita pertimbangkan kasus yang paling sederhana, ketika hanya dua variabel linguistik yang diperkenalkan untuk mengontrol drive servo:

"sudut" - variabel masukan;

"tindakan kontrol" - variabel keluaran.

Kami akan mensintesis pengontrol di lingkungan MatLab menggunakan kotak peralatan Logika Fuzzy. Ini memungkinkan Anda untuk membuat inferensi fuzzy dan sistem klasifikasi fuzzy dalam lingkungan MatLab, dengan kemungkinan mengintegrasikannya ke dalam Simulink. Konsep dasar dari Fuzzy Logic Toolbox adalah FIS-structure - Fuzzy Inference System. Struktur FIS berisi semua data yang diperlukan untuk implementasi pemetaan fungsional "input-output" berdasarkan inferensi logika fuzzy sesuai dengan skema yang ditunjukkan pada gambar. 6.


Gambar 6. Inferensi fuzzy.

X - masukan vektor tajam; - vektor himpunan fuzzy yang sesuai dengan vektor input X;
- hasil inferensi logis berupa vektor himpunan fuzzy; Y - keluaran vektor crisp.

Modul fuzzy memungkinkan Anda untuk membangun sistem fuzzy dari dua jenis - Mamdani dan Sugeno. Dalam sistem tipe Mamdani, basis pengetahuan terdiri dari aturan bentuk “Jika x 1 = rendah dan x 2 = sedang, maka y = tinggi”. Dalam sistem tipe Sugeno, basis pengetahuan terdiri dari aturan bentuk “Jika x 1 =rendah dan x 2 =sedang, maka y=a 0 +a 1 x 1 +a 2 x 2 ". Dengan demikian, perbedaan utama antara sistem Mamdani dan Sugeno terletak pada cara pengaturan nilai variabel output yang berbeda dalam aturan yang membentuk basis pengetahuan. Dalam sistem tipe Mamdani, nilai variabel output diberikan oleh istilah fuzzy, dalam sistem tipe Sugeno - sebagai kombinasi linier dari variabel input. Dalam kasus kami, kami akan menggunakan sistem Sugeno, karena itu cocok untuk pengoptimalan.

Untuk mengontrol penggerak servo, dua variabel linguistik diperkenalkan: "kesalahan" (berdasarkan posisi) dan "tindakan kontrol". Yang pertama adalah input, yang kedua adalah output. Mari kita definisikan term-set untuk variabel yang ditentukan.

Komponen utama inferensi fuzzy. Fuzzifier.

Untuk setiap variabel linguistik, kami mendefinisikan kumpulan istilah dasar dari bentuk, yang mencakup himpunan fuzzy yang dapat ditentukan: tinggi negatif, rendah negatif, nol, rendah positif, tinggi positif.

Pertama-tama, mari kita definisikan secara subjektif apa yang dimaksud dengan istilah "kesalahan besar", "kesalahan kecil", dll., mendefinisikan fungsi keanggotaan untuk himpunan fuzzy yang sesuai. Di sini, untuk saat ini, seseorang hanya dapat dipandu oleh akurasi yang diperlukan, parameter yang diketahui untuk kelas sinyal input, dan akal sehat. Sejauh ini, belum ada yang dapat menawarkan algoritma kaku untuk memilih parameter fungsi keanggotaan. Dalam kasus kami, variabel linguistik "kesalahan" akan terlihat seperti ini.

Gbr.7. Variabel linguistik "kesalahan".

Lebih mudah untuk mewakili variabel linguistik "manajemen" dalam bentuk tabel:

Tabel 1

Blok aturan.

Pertimbangkan urutan mendefinisikan beberapa aturan yang menggambarkan beberapa situasi:

Misalkan, misalnya, sudut keluaran sama dengan sinyal masukan (yaitu, kesalahannya nol). Jelas, ini adalah situasi yang diinginkan, dan oleh karena itu kita tidak perlu melakukan apa pun (tindakan kontrol adalah nol).

Sekarang pertimbangkan kasus lain: kesalahan posisi jauh lebih besar dari nol. Secara alami, kita harus mengimbanginya dengan menghasilkan sinyal kontrol positif yang besar.

Itu. dua aturan telah disusun, yang secara formal dapat didefinisikan sebagai berikut:

jika kesalahan = nol, kemudian tindakan kontrol = nol.

jika kesalahan = positif besar, kemudian aksi kontrol = positif besar.

Gbr.8. Pembentukan kontrol dengan kesalahan positif kecil pada posisi.

Gbr.9. Pembentukan kontrol pada kesalahan nol berdasarkan posisi.

Tabel di bawah ini menunjukkan semua aturan yang sesuai dengan semua situasi untuk kasus sederhana ini.

Meja 2

Secara total, untuk kontroler fuzzy dengan n input dan 1 output, dapat ditentukan aturan kontrolnya, dimana jumlah himpunan fuzzy untuk input ke-i, tetapi untuk fungsi normal kontroler tidak perlu menggunakan semua kemungkinan aturan, tetapi Anda bisa bertahan dengan jumlah yang lebih sedikit. Dalam kasus kami, semua 5 aturan yang mungkin digunakan untuk membentuk sinyal kontrol fuzzy.

Defuzzifier.

Dengan demikian, dampak yang dihasilkan U akan ditentukan sesuai dengan penerapan aturan apa pun. Jika situasi muncul ketika beberapa aturan dieksekusi sekaligus, maka tindakan yang dihasilkan U ditemukan sesuai dengan ketergantungan berikut:

, di mana n adalah jumlah aturan yang dipicu (defuzzifikasi dengan metode pusat area), kamu tidak adalah nilai fisik dari sinyal kontrol yang sesuai dengan masing-masing himpunan fuzzy UBO, UMo, kamuZ, UMp, UBP. mUn(u) adalah derajat kepemilikan sinyal kontrol u ke himpunan fuzzy yang bersesuaian Un=( UBO, UMo, kamuZ, UMp, UBP). Ada juga metode defuzzifikasi lainnya, ketika variabel linguistik keluaran sebanding dengan aturan "kuat" atau "lemah" itu sendiri.

Mari kita simulasikan proses pengontrolan penggerak listrik menggunakan pengontrol fuzzy yang dijelaskan di atas.

Gambar 10. Blok diagram sistem di lingkunganmatlab.

Gbr.11. Diagram struktural pengontrol fuzzy di lingkunganmatlab.

Gambar 12. Proses sementara pada dampak satu langkah.

Beras. 13. Proses transien di bawah input harmonik untuk model dengan pengontrol fuzzy yang berisi satu variabel linguistik input.

Analisis karakteristik drive dengan algoritma kontrol yang disintesis menunjukkan bahwa mereka jauh dari optimal dan lebih buruk daripada dalam kasus sintesis kontrol dengan metode lain (terlalu banyak waktu kontrol dengan efek satu langkah dan kesalahan dengan yang harmonis) . Hal ini dijelaskan oleh fakta bahwa parameter fungsi keanggotaan dipilih secara acak, dan hanya besarnya kesalahan posisi yang digunakan sebagai input pengontrol. Secara alami, tidak ada pembicaraan tentang optimalitas pengontrol yang diperoleh. Oleh karena itu, tugas mengoptimalkan kontroler fuzzy menjadi relevan untuk mencapai indikator kualitas kontrol setinggi mungkin. Itu. tugasnya adalah untuk mengoptimalkan fungsi tujuan f(a 1 ,a 2 …a n), dimana a 1 ,a 2 …a n adalah koefisien yang menentukan jenis dan karakteristik kontroler fuzzy. Untuk mengoptimalkan kontroler fuzzy, kami menggunakan blok ANFIS dari lingkungan Matlab. Juga, salah satu cara untuk meningkatkan karakteristik pengontrol mungkin dengan meningkatkan jumlah inputnya. Hal ini akan membuat regulator lebih fleksibel dan meningkatkan kinerjanya. Mari tambahkan satu lagi variabel input linguistik - laju perubahan sinyal input (turunannya). Dengan demikian, jumlah aturan juga akan meningkat. Maka diagram rangkaian regulator akan berbentuk:

Gbr.14 Diagram skema kontroler fuzzy dengan tiga variabel linguistik.

Membiarkan menjadi nilai kecepatan sinyal input. Himpunan suku dasar Tn didefinisikan sebagai:

n=("negatif (VO)", "nol (Z)", "positif (VR)").

Lokasi fungsi keanggotaan untuk semua variabel linguistik ditunjukkan pada gambar.

Gbr.15. Fungsi keanggotaan variabel linguistik "kesalahan".

Gambar 16. Fungsi keanggotaan variabel linguistik "kecepatan sinyal input".

Karena penambahan satu variabel linguistik lagi, jumlah aturan akan meningkat menjadi 3x5=15. Prinsip kompilasi mereka sangat mirip dengan yang dibahas di atas. Semuanya disajikan dalam tabel berikut:

Tabel 3

sinyal kabur

pengelolaan

Kesalahan posisi

Kecepatan

Misalnya, jika jika error = nol dan turunan sinyal input = positif besar, kemudian tindakan kontrol = negatif kecil.

Gambar 17. Pembentukan kontrol di bawah tiga variabel linguistik.

Karena peningkatan jumlah input dan, dengan demikian, aturan itu sendiri, struktur pengontrol fuzzy juga akan menjadi lebih rumit.

Gambar 18. Diagram struktural dari kontroler fuzzy dengan dua input.

Tambahkan gambar

Gambar 20. Proses transien di bawah input harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik input.

Beras. 21. Sinyal kesalahan di bawah input harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik input.

Mari kita simulasikan operasi pengontrol fuzzy dengan dua input di lingkungan Matlab. Diagram blok model akan persis sama seperti pada Gambar. 19. Dari grafik proses transien untuk input harmonik, terlihat bahwa akurasi sistem meningkat secara signifikan, tetapi pada saat yang sama osilasinya meningkat, terutama di tempat-tempat di mana turunan dari koordinat output cenderung nol. Jelas bahwa alasan untuk ini, seperti yang disebutkan di atas, adalah pilihan yang tidak optimal dari parameter fungsi keanggotaan, baik untuk variabel linguistik input dan output. Oleh karena itu, kami mengoptimalkan pengontrol fuzzy menggunakan blok ANFISedit di lingkungan Matlab.

Optimasi pengontrol fuzzy.

Pertimbangkan penggunaan algoritma genetika untuk optimasi pengontrol fuzzy. Algoritma genetika adalah metode pencarian adaptif yang sering digunakan dalam beberapa tahun terakhir untuk menyelesaikan masalah optimasi fungsional. Mereka didasarkan pada kesamaan dengan proses genetik organisme biologis: populasi biologis berkembang selama beberapa generasi, mematuhi hukum seleksi alam dan sesuai dengan prinsip "survival of the fittest", ditemukan oleh Charles Darwin. Dengan meniru proses ini, algoritme genetika mampu "berkembang" solusi untuk masalah dunia nyata jika mereka dikodekan dengan tepat.

Algoritma genetika bekerja dengan satu set "individu" - sebuah populasi, yang masing-masing mewakili solusi yang mungkin untuk masalah yang diberikan. Setiap individu dievaluasi dengan ukuran "kebugarannya" sesuai dengan seberapa "baik" solusi dari masalah yang sesuai dengannya. Individu yang paling cocok mampu "mereproduksi" keturunan dengan "perkawinan silang" dengan individu lain dalam populasi. Hal ini menyebabkan munculnya individu-individu baru yang menggabungkan beberapa karakteristik yang diwarisi dari orang tuanya. Individu yang paling tidak cocok cenderung tidak bereproduksi, sehingga sifat yang mereka miliki secara bertahap akan menghilang dari populasi.

Ini adalah bagaimana seluruh populasi baru dari solusi yang layak direproduksi, memilih perwakilan terbaik dari generasi sebelumnya, menyilangkannya dan mendapatkan banyak individu baru. Generasi baru ini memiliki rasio karakteristik yang lebih tinggi yang dimiliki oleh anggota generasi sebelumnya yang baik. Dengan demikian, dari generasi ke generasi, karakteristik yang baik didistribusikan ke seluruh populasi. Pada akhirnya, populasi akan konvergen ke solusi optimal untuk masalah tersebut.

Ada banyak cara untuk mengimplementasikan ide evolusi biologis dalam kerangka algoritma genetika. Tradisional, dapat direpresentasikan dalam bentuk diagram blok berikut yang ditunjukkan pada Gambar 22, di mana:

1. Inisialisasi populasi awal - generasi sejumlah solusi tertentu untuk masalah, dari mana proses optimasi dimulai;

2. Penerapan operator crossover dan mutasi;

3. Kondisi berhenti - biasanya, proses optimasi dilanjutkan sampai solusi masalah dengan akurasi yang diberikan ditemukan, atau sampai terungkap bahwa proses telah konvergen (yaitu, tidak ada perbaikan dalam solusi masalah selama yang terakhir N generasi).

Dalam lingkungan Matlab, algoritme genetika diwakili oleh kotak peralatan terpisah, serta oleh paket ANFIS. ANFIS adalah singkatan dari Adaptive-Network-Based Fuzzy Inference System - Adaptive Fuzzy Inference Network. ANFIS adalah salah satu varian pertama dari jaringan neuro-fuzzy hybrid - jaringan saraf dari jenis khusus propagasi sinyal langsung. Arsitektur jaringan neuro-fuzzy adalah isomorfik terhadap basis pengetahuan fuzzy. Implementasi diferensial dari norma segitiga (perkalian dan OR probabilistik) serta fungsi keanggotaan yang halus digunakan dalam jaringan neuro-fuzzy. Hal ini memungkinkan untuk menggunakan algoritme cepat dan genetik untuk melatih jaringan saraf berdasarkan metode backpropagation untuk mengonfigurasi jaringan neuro-fuzzy. Arsitektur dan aturan untuk pengoperasian setiap lapisan jaringan ANFIS dijelaskan di bawah ini.

ANFIS mengimplementasikan sistem inferensi fuzzy Sugeno sebagai jaringan saraf umpan maju lima lapis. Tujuan dari lapisan adalah sebagai berikut: lapisan pertama adalah istilah dari variabel input; lapisan kedua - anteseden (paket) dari aturan fuzzy; lapisan ketiga adalah normalisasi tingkat pemenuhan aturan; lapisan keempat adalah kesimpulan dari aturan; lapisan kelima adalah agregasi dari hasil yang diperoleh menurut aturan yang berbeda.

Input jaringan tidak dialokasikan ke lapisan terpisah. Gambar 23 menunjukkan jaringan ANFIS dengan satu variabel input (“kesalahan”) dan lima aturan fuzzy. Untuk evaluasi linguistik dari variabel input "kesalahan" 5 istilah digunakan.


Gbr.23. StrukturANFIS-jaringan.

Mari kita perkenalkan notasi berikut, yang diperlukan untuk presentasi lebih lanjut:

Membiarkan menjadi input dari jaringan;

y - keluaran jaringan;

Aturan fuzzy dengan bilangan urut r;

m - jumlah aturan;

Istilah fuzzy dengan fungsi keanggotaan , digunakan untuk evaluasi linguistik dari suatu variabel dalam aturan ke-r (,);

Bilangan real dalam kesimpulan aturan ke-r (,).

ANFIS-jaringan berfungsi sebagai berikut.

lapisan 1 Setiap simpul dari lapisan pertama mewakili satu suku dengan fungsi keanggotaan berbentuk lonceng. Input jaringan hanya terhubung ke persyaratannya. Jumlah node pada lapisan pertama sama dengan jumlah kardinalitas dari himpunan term dari variabel input. Keluaran dari simpul adalah derajat kepemilikan nilai variabel masukan terhadap suku fuzzy yang sesuai:

,

di mana a, b, dan c adalah parameter yang dapat dikonfigurasi fungsi keanggotaan.

lapisan 2 Jumlah node pada layer kedua adalah m. Setiap node dari lapisan ini sesuai dengan satu aturan fuzzy. Node dari lapisan kedua terhubung ke node dari lapisan pertama yang membentuk anteseden dari aturan yang sesuai. Oleh karena itu, setiap node dari lapisan kedua dapat menerima dari 1 hingga n sinyal input. Output dari node adalah tingkat eksekusi aturan, yang dihitung sebagai produk dari sinyal input. Tunjukkan output dari node lapisan ini dengan , .

lapisan 3 Jumlah node pada layer ketiga juga m. Setiap node dari lapisan ini menghitung tingkat pemenuhan relatif dari aturan fuzzy:

lapisan 4 Jumlah node pada layer keempat juga m. Setiap node terhubung ke satu node dari lapisan ketiga serta ke semua input jaringan (koneksi ke input tidak ditunjukkan pada Gambar 18). Node dari lapisan keempat menghitung kontribusi dari satu aturan fuzzy ke keluaran jaringan:

lapisan 5 Node tunggal dari lapisan ini merangkum kontribusi dari semua aturan:

.

Prosedur pelatihan jaringan saraf tipikal dapat diterapkan untuk menyetel jaringan ANFIS, karena hanya menggunakan fungsi yang dapat dibedakan. Biasanya, kombinasi penurunan gradien dalam bentuk backpropagation dan kuadrat terkecil digunakan. Algoritma backpropagation menyesuaikan parameter anteseden aturan, yaitu. fungsi keanggotaan. Koefisien kesimpulan aturan diestimasi dengan metode kuadrat terkecil, karena berhubungan linier dengan keluaran jaringan. Setiap iterasi dari prosedur tuning dilakukan dalam dua langkah. Pada tahap pertama, sampel pelatihan diumpankan ke input, dan parameter optimal dari node lapisan keempat ditemukan dari perbedaan antara perilaku jaringan yang diinginkan dan aktual menggunakan metode kuadrat terkecil iteratif. Pada tahap kedua, perbedaan residual ditransfer dari output jaringan ke input, dan parameter node dari lapisan pertama dimodifikasi dengan metode backpropagation error. Pada saat yang sama, koefisien kesimpulan aturan yang ditemukan pada tahap pertama tidak berubah. Prosedur penyetelan iteratif berlanjut sampai residual melebihi nilai yang telah ditentukan. Untuk menyetel fungsi keanggotaan, selain metode backpropagation error, algoritma optimasi lain dapat digunakan, misalnya metode Levenberg-Marquardt.

Gambar 24. ANFISedit ruang kerja.

Sekarang mari kita coba mengoptimalkan pengontrol fuzzy untuk aksi satu langkah. Proses transien yang diinginkan kira-kira sebagai berikut:

Gbr.25. proses transisi yang diinginkan.

Dari grafik yang ditunjukkan pada Gambar. maka sebagian besar waktu mesin harus berjalan dengan kekuatan penuh untuk memastikan kecepatan maksimum, dan ketika mendekati nilai yang diinginkan, itu harus melambat dengan lancar. Dipandu oleh pertimbangan sederhana ini, kami akan mengambil contoh nilai berikut sebagai pelatihan, disajikan di bawah ini dalam bentuk tabel:

Tabel 4


Nilai kesalahan

Nilai manajemen

Nilai kesalahan

Nilai manajemen

Nilai kesalahan

Nilai manajemen


Gambar 26. Jenis set pelatihan.

Pelatihan akan dilakukan pada 100 langkah. Ini lebih dari cukup untuk konvergensi metode yang digunakan.

Gambar 27. Proses mempelajari jaringan saraf.

Dalam proses pembelajaran, parameter fungsi keanggotaan dibentuk sedemikian rupa sehingga, dengan nilai kesalahan yang diberikan, pengontrol membuat kontrol yang diperlukan. Di bagian antara titik nodal, ketergantungan kontrol pada kesalahan adalah interpolasi data tabel. Metode interpolasi tergantung pada bagaimana jaringan saraf dilatih. Bahkan, setelah pelatihan, model kontroler fuzzy dapat direpresentasikan sebagai fungsi non-linier dari satu variabel, grafiknya disajikan di bawah ini.

Gbr.28. Plot ketergantungan kontrol dari kesalahan ke posisi di dalam regulator.

Setelah menyimpan parameter yang ditemukan dari fungsi keanggotaan, kami mensimulasikan sistem dengan pengontrol fuzzy yang dioptimalkan.


Beras. 29. Proses transien di bawah input harmonik untuk model dengan pengontrol fuzzy yang dioptimalkan yang berisi satu variabel linguistik input.

Gambar 30. Sinyal kesalahan di bawah input harmonik untuk model dengan pengontrol fuzzy yang berisi dua variabel linguistik input.


Ini mengikuti dari grafik bahwa optimasi pengontrol fuzzy dengan melatih jaringan saraf berhasil. Secara signifikan menurun fluktuasi dan besarnya kesalahan. Oleh karena itu, penggunaan jaringan syaraf tiruan cukup masuk akal untuk mengoptimalkan pengontrol, yang prinsipnya didasarkan pada logika fuzzy. Namun, bahkan pengontrol yang dioptimalkan tidak dapat memenuhi persyaratan untuk akurasi, sehingga disarankan untuk mempertimbangkan metode kontrol lain, ketika pengontrol fuzzy tidak mengontrol objek secara langsung, tetapi menggabungkan beberapa hukum kontrol tergantung pada situasinya.

Minggu, 29 Mar 2015

Saat ini, ada banyak tugas di mana diperlukan untuk membuat beberapa keputusan tergantung pada keberadaan objek dalam gambar atau untuk mengklasifikasikannya. Kemampuan untuk "mengenali" dianggap sebagai properti utama makhluk biologis, sementara sistem komputer tidak sepenuhnya memiliki properti ini.

Pertimbangkan elemen umum dari model klasifikasi.

Kelas- satu set objek yang memiliki sifat umum. Untuk objek dari kelas yang sama, kehadiran "kesamaan" diasumsikan. Untuk tugas pengenalan, jumlah kelas yang sewenang-wenang dapat ditentukan, lebih dari 1. Jumlah kelas dilambangkan dengan angka S. Setiap kelas memiliki label pengidentifikasi kelasnya sendiri.

Klasifikasi- proses pemberian label kelas ke objek, menurut beberapa deskripsi properti objek ini. Classifier adalah perangkat yang menerima sekumpulan fitur dari suatu objek sebagai input dan menghasilkan label kelas sebagai hasilnya.

Verifikasi- proses mencocokkan instance objek dengan model objek tunggal atau deskripsi kelas.

Di bawah jalan kita akan memahami nama area di ruang atribut, di mana banyak objek atau fenomena dunia material ditampilkan. tanda- deskripsi kuantitatif dari properti tertentu dari objek atau fenomena yang diteliti.

ruang fitur ini adalah ruang dimensi-N yang ditentukan untuk tugas pengenalan yang diberikan, di mana N adalah sejumlah fitur terukur yang tetap untuk objek apa pun. Vektor dari ruang fitur x yang sesuai dengan objek masalah pengenalan adalah vektor berdimensi-N dengan komponen (x_1,x_2,…,x_N), yang merupakan nilai fitur untuk objek yang diberikan.

Dengan kata lain, pengenalan pola dapat didefinisikan sebagai penugasan data awal ke kelas tertentu dengan mengekstraksi fitur atau properti penting yang mencirikan data ini dari massa umum detail yang tidak relevan.

Contoh masalah klasifikasi adalah:

  • pengenalan karakter;
  • pengenalan suara;
  • menegakkan diagnosis medis;
  • Prakiraan Cuaca;
  • pengenalan wajah
  • klasifikasi dokumen, dll.

Paling sering, bahan sumbernya adalah gambar yang diterima dari kamera. Tugas dapat dirumuskan sebagai mendapatkan vektor fitur untuk setiap kelas dalam gambar yang dipertimbangkan. Proses tersebut dapat dilihat sebagai proses pengkodean, yang terdiri dari pemberian nilai untuk setiap fitur dari ruang fitur untuk setiap kelas.

Jika kita mempertimbangkan 2 kelas objek: dewasa dan anak-anak. Sebagai fitur, Anda dapat memilih tinggi dan berat badan. Sebagai berikut dari gambar, kedua kelas ini membentuk dua set yang tidak berpotongan, yang dapat dijelaskan oleh fitur yang dipilih. Namun, tidak selalu mungkin untuk memilih parameter terukur yang benar sebagai fitur kelas. Misalnya, parameter yang dipilih tidak cocok untuk membuat kelas pemain sepak bola dan pemain bola basket yang tidak tumpang tindih.

Tugas pengenalan kedua adalah pemilihan fitur atau properti karakteristik dari gambar asli. Tugas ini dapat dikaitkan dengan preprocessing. Jika kita mempertimbangkan tugas pengenalan suara, kita dapat membedakan fitur-fitur seperti vokal dan konsonan. Atribut harus menjadi properti karakteristik dari kelas tertentu, sementara menjadi umum untuk kelas ini. Tanda yang menjadi ciri perbedaan antara – tanda antar kelas. Fitur umum untuk semua kelas tidak membawa informasi yang berguna dan tidak dianggap sebagai fitur dalam masalah pengenalan. Pilihan fitur adalah salah satu tugas penting yang terkait dengan pembangunan sistem pengenalan.

Setelah fitur ditentukan, maka perlu ditentukan prosedur keputusan yang optimal untuk klasifikasi. Pertimbangkan sistem pengenalan pola yang dirancang untuk mengenali berbagai kelas M, dilambangkan sebagai m_1,m_2,…,m 3. Kemudian kita dapat mengasumsikan bahwa ruang gambar terdiri dari M daerah, masing-masing berisi titik-titik yang sesuai dengan gambar dari satu kelas. Kemudian masalah pengenalan dapat dianggap sebagai konstruksi batas yang memisahkan kelas M berdasarkan vektor pengukuran yang diterima.

Penyelesaian masalah preprocessing citra, ekstraksi ciri dan masalah mendapatkan solusi dan klasifikasi yang optimal biasanya dikaitkan dengan kebutuhan untuk mengevaluasi sejumlah parameter. Hal ini menyebabkan masalah estimasi parameter. Selain itu, jelas bahwa ekstraksi fitur dapat menggunakan informasi tambahan berdasarkan sifat kelas.

Perbandingan objek dapat dilakukan atas dasar representasi mereka dalam bentuk vektor pengukuran. Lebih mudah untuk mewakili data pengukuran sebagai bilangan real. Kemudian persamaan vektor ciri dari dua objek dapat digambarkan dengan menggunakan jarak Euclidean.

di mana d adalah dimensi dari vektor fitur.

Ada 3 kelompok metode pengenalan pola:

  • Perbandingan sampel. Golongan ini meliputi klasifikasi menurut mean terdekat, klasifikasi menurut jarak ke tetangga terdekat. Metode pengenalan struktural juga dapat dimasukkan dalam kelompok pembanding sampel.
  • Metode Statistik. Sesuai dengan namanya, metode statistik menggunakan beberapa informasi statistik ketika memecahkan masalah pengenalan. Metode menentukan milik suatu objek ke kelas tertentu berdasarkan probabilitas.Dalam beberapa kasus, ini turun untuk menentukan probabilitas a posteriori suatu objek milik kelas tertentu, asalkan fitur dari objek ini telah mengambil yang sesuai nilai-nilai. Contohnya adalah metode aturan keputusan Bayesian.
  • Jaringan saraf. Kelas terpisah dari metode pengenalan. Ciri khas dari orang lain adalah kemampuan untuk belajar.

Klasifikasi menurut cara terdekat

Dalam pendekatan klasik pengenalan pola, di mana objek yang tidak diketahui untuk klasifikasi direpresentasikan sebagai vektor fitur dasar. Sistem pengenalan berbasis fitur dapat dikembangkan dengan berbagai cara. Vektor-vektor ini dapat diketahui sistem terlebih dahulu sebagai hasil pelatihan atau diprediksi secara real time berdasarkan beberapa model.

Algoritma klasifikasi sederhana terdiri dari pengelompokan data referensi kelas menggunakan vektor harapan kelas (mean).

di mana x(i,j) adalah fitur referensi ke-j dari kelas i, n_j adalah jumlah vektor referensi dari kelas i.

Kemudian objek yang tidak diketahui akan menjadi milik kelas i jika lebih dekat dengan vektor harapan kelas i daripada dengan vektor harapan kelas lain. Metode ini cocok untuk masalah di mana titik-titik setiap kelas terletak secara kompak dan jauh dari titik-titik kelas lainnya.

Kesulitan akan muncul jika kelas memiliki struktur yang sedikit lebih kompleks, misalnya seperti pada gambar. Dalam hal ini, kelas 2 dibagi menjadi dua bagian yang tidak tumpang tindih, yang digambarkan dengan buruk oleh nilai rata-rata tunggal. Selain itu, kelas 3 terlalu memanjang, sampel kelas 3 dengan nilai koordinat x_2 yang besar lebih dekat dengan nilai rata-rata kelas 1 daripada kelas 3.

Masalah yang dijelaskan dalam beberapa kasus dapat diselesaikan dengan mengubah perhitungan jarak.

Kami akan mempertimbangkan karakteristik "hamburan" nilai kelas - _i, di sepanjang setiap arah koordinat i. Standar deviasi sama dengan akar kuadrat dari varians. Jarak Euclidean berskala antara vektor x dan vektor harapan x_c adalah

Rumus jarak ini akan mengurangi jumlah kesalahan klasifikasi, tetapi pada kenyataannya, sebagian besar masalah tidak dapat diwakili oleh kelas yang begitu sederhana.

Klasifikasi berdasarkan jarak ke tetangga terdekat

Pendekatan lain untuk klasifikasi adalah dengan menetapkan vektor fitur x yang tidak diketahui ke kelas yang vektor ini paling dekat dengan sampel terpisah. Aturan ini disebut aturan tetangga terdekat. Klasifikasi tetangga terdekat bisa lebih efisien bahkan ketika kelasnya kompleks atau ketika kelas tumpang tindih.

Pendekatan ini tidak memerlukan asumsi tentang model distribusi vektor fitur dalam ruang. Algoritme hanya menggunakan informasi tentang sampel referensi yang diketahui. Metode solusi didasarkan pada penghitungan jarak x ke setiap sampel dalam database dan mencari jarak minimum. Keuntungan dari pendekatan ini jelas:

  • kapan saja Anda dapat menambahkan sampel baru ke database;
  • struktur data pohon dan kisi mengurangi jumlah jarak yang dihitung.

Selain itu, solusinya akan lebih baik jika Anda mencari di database bukan untuk satu tetangga terdekat, tetapi untuk k. Kemudian, untuk k > 1, ini memberikan sampel terbaik dari distribusi vektor dalam ruang d-dimensi. Namun, efisiensi penggunaan nilai k tergantung pada apakah ada cukup di setiap wilayah ruang. Jika ada lebih dari dua kelas, maka lebih sulit untuk membuat keputusan yang tepat.

literatur

  • M.Castrilon, . O. Deniz, . D. Hernández dan J. Lorenzo, “Perbandingan detektor fitur wajah dan wajah berdasarkan kerangka kerja deteksi objek umum Viola-Jones,” International Journal of Computer Vision, no.22, pp. 481-494, 2011.
  • Y.-Q. Wang, "Analisis Algoritma Deteksi Wajah Viola-Jones," Jurnal IPOL, 2013.
  • L. Shapiro dan D. Stockman, Visi komputer, Binom. Lab Pengetahuan, 2006.
  • Z.N.G., Metode pengenalan dan penerapannya, radio Soviet, 1972.
  • J. Tu, R. Gonzalez, Prinsip Matematika Pengenalan Pola, Moskow: "Mir" Moskow, 1974.
  • Khan, H. Abdullah dan M. Shamian Bin Zainal, "Algoritme deteksi mata dan mulut yang efisien menggunakan kombinasi viola jones dan deteksi piksel warna kulit" International Journal of Engineering and Applied Sciences, no. Vol. 3 tidak 4, 2013.
  • V. Gaede dan O. Gunther, "Metode Akses Multidimensi," Survei Komputasi ACM, hal. 170-231, 1998.

Ikhtisar metode pengenalan pola yang ada

L.P. Popova , DAN TENTANG. datiev

Kemampuan untuk "mengenali" dianggap sebagai milik utama manusia, seperti halnya organisme hidup lainnya. Pengenalan pola adalah cabang sibernetika yang mengembangkan prinsip dan metode untuk mengklasifikasikan dan mengidentifikasi objek, fenomena, proses, sinyal, situasi - semua objek yang dapat dijelaskan oleh serangkaian fitur atau properti terbatas yang menjadi ciri suatu objek.

Citra adalah gambaran dari suatu objek. Gambar memiliki sifat khas, yang memanifestasikan dirinya dalam kenyataan bahwa kenalan dengan sejumlah fenomena terbatas dari himpunan yang sama memungkinkan untuk mengenali sejumlah besar perwakilannya secara sewenang-wenang.

Ada dua arah utama dalam teori pengenalan pola:

    studi tentang kekuatan pengenalan yang dimiliki oleh manusia dan organisme hidup lainnya;

    pengembangan teori dan metode untuk membangun perangkat yang dirancang untuk memecahkan masalah individu pengenalan pola di area aplikasi tertentu.

Selanjutnya, artikel menjelaskan masalah, prinsip dan metode penerapan sistem pengenalan pola yang terkait dengan pengembangan arah kedua. Bagian kedua dari artikel membahas metode jaringan saraf pengenalan pola, yang dapat dikaitkan dengan arah pertama teori pengenalan pola.

Masalah membangun sistem pengenalan gambar

Tugas yang muncul dalam pembangunan sistem pengenalan pola otomatis biasanya dapat diklasifikasikan ke dalam beberapa bidang utama. Yang pertama berkaitan dengan penyajian data awal yang diperoleh sebagai hasil pengukuran agar objek dapat dikenali masalah sensitivitas. Setiap nilai yang diukur adalah beberapa "karakteristik gambar atau objek. Misalkan, misalnya, gambar adalah karakter alfanumerik. Dalam hal ini, retina pengukur, mirip dengan yang ditunjukkan pada Gambar 1 (a), dapat berhasil digunakan di sensor Jika retina terdiri dari n-elemen, maka hasil pengukuran dapat direpresentasikan sebagai vektor pengukuran atau vektor gambar ,

di mana setiap elemen xi mengambil, misalnya, nilai 1 jika gambar simbol melewati sel ke-i retina, dan nilai 0 sebaliknya.

Pertimbangkan Gambar. 2 (b). Dalam hal ini, gambar adalah fungsi kontinu (dari jenis sinyal suara) dari variabel t. Jika nilai fungsi diukur pada titik-titik diskrit t1,t2, ..., tn, maka vektor bayangan dapat dibentuk dengan mengambil x1= f(t1),x2=f(t2),... , xn = f(tn).

Gambar 1. Mengukur retina

Masalah pengenalan pola yang kedua berkaitan dengan pemilihan ciri atau sifat karakteristik dari data awal yang diperoleh dan pengurangan dimensi vektor pola. Masalah ini sering didefinisikan sebagai masalah prapemrosesan dan pemilihan fitur.

Fitur dari kelas gambar adalah properti karakteristik yang umum untuk semua gambar dari kelas tertentu. Fitur-fitur yang menjadi ciri perbedaan antar kelas individu dapat diartikan sebagai fitur antar kelas. Fitur intraclass yang umum untuk semua kelas yang dipertimbangkan tidak membawa informasi yang berguna dari sudut pandang pengenalan dan mungkin tidak diperhitungkan. Pilihan fitur dianggap sebagai salah satu tugas penting yang terkait dengan konstruksi sistem pengenalan. Jika hasil pengukuran memungkinkan untuk memperoleh satu set lengkap fitur pembeda untuk semua kelas, pengenalan dan klasifikasi pola yang sebenarnya tidak akan menyebabkan kesulitan tertentu. Pengenalan otomatis kemudian akan direduksi menjadi proses atau prosedur pencocokan sederhana seperti pencarian tabel. Dalam kebanyakan masalah pengenalan praktis, bagaimanapun, menentukan satu set lengkap fitur pembeda sangat sulit, jika bukan tidak mungkin. Dari data asli, biasanya dimungkinkan untuk mengekstrak beberapa fitur pembeda dan menggunakannya untuk menyederhanakan proses pengenalan pola otomatis. Secara khusus, dimensi vektor pengukuran dapat dikurangi dengan menggunakan transformasi yang meminimalkan hilangnya informasi.

Masalah ketiga yang terkait dengan konstruksi sistem pengenalan pola adalah menemukan prosedur keputusan optimal yang diperlukan untuk identifikasi dan klasifikasi. Setelah data yang dikumpulkan tentang pola yang akan dikenali diwakili oleh titik atau vektor pengukuran dalam ruang pola, biarkan mesin mencari tahu kelas pola mana yang sesuai dengan data ini. Biarkan mesin dirancang untuk membedakan antara kelas M, dilambangkan dengan w1, w2, ... ..., wm. Dalam hal ini, ruang gambar dapat dianggap terdiri dari M daerah, yang masing-masing berisi titik-titik yang sesuai dengan gambar dari kelas yang sama. Dalam hal ini, masalah pengenalan dapat dianggap sebagai konstruksi batas wilayah keputusan yang memisahkan kelas M berdasarkan vektor pengukuran yang terdaftar. Biarkan batas-batas ini didefinisikan, misalnya, dengan fungsi keputusan d1(х),d2(x),..., dm(х). Fungsi-fungsi ini, juga disebut fungsi diskriminan, adalah fungsi skalar dan bernilai tunggal dari gambar x. Jika di (x) > dj (x), maka bayangan x termasuk kelas w1. Dengan kata lain, jika fungsi keputusan ke-i di(x) memiliki nilai tertinggi, maka ilustrasi yang berarti dari skema klasifikasi otomatis berdasarkan implementasi proses pengambilan keputusan ditunjukkan pada Gambar. 2 (pada skema "GR" - generator fungsi yang menentukan).

Gambar 2. Skema klasifikasi otomatis.

Fungsi keputusan dapat diperoleh dengan beberapa cara. Dalam kasus di mana informasi apriori lengkap tersedia tentang pola yang dapat dikenali, fungsi keputusan dapat ditentukan dengan tepat berdasarkan informasi ini. Jika hanya informasi kualitatif yang tersedia tentang pola, asumsi yang masuk akal dapat dibuat tentang bentuk fungsi keputusan. Dalam kasus terakhir, batas-batas wilayah keputusan dapat menyimpang secara signifikan dari yang sebenarnya, dan oleh karena itu perlu untuk membuat sistem yang mampu mencapai hasil yang memuaskan melalui serangkaian penyesuaian yang berurutan.

Objek (gambar) yang akan dikenali dan diklasifikasikan menggunakan sistem pengenalan pola otomatis harus memiliki seperangkat karakteristik yang terukur. Bila untuk seluruh kelompok gambar hasil pengukuran yang sesuai serupa, dianggap bahwa benda-benda tersebut termasuk dalam kelas yang sama. Tujuan dari sistem pengenalan pola adalah untuk menentukan, berdasarkan informasi yang dikumpulkan, kelas objek dengan karakteristik yang serupa dengan yang diukur untuk objek yang dapat dikenali. Kebenaran pengenalan tergantung pada jumlah informasi pembeda yang terkandung dalam karakteristik yang diukur, dan efisiensi penggunaan informasi ini.

      Metode Dasar untuk Menerapkan Sistem Pengenalan Pola

Pengenalan pola adalah tugas membangun dan menerapkan operasi formal pada representasi numerik atau simbolis dari objek dunia nyata atau ideal, yang hasilnya, solusi yang mencerminkan hubungan ekivalensi antara objek-objek ini. Relasi ekuivalensi mengekspresikan kepemilikan objek yang dievaluasi ke beberapa kelas, yang dianggap sebagai unit semantik independen.

Ketika membangun algoritma pengenalan, kelas kesetaraan dapat ditetapkan oleh seorang peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang kesamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian seseorang berbicara tentang "berbeda dengan guru." Jika tidak, yaitu ketika sistem otomatis memecahkan masalah klasifikasi tanpa melibatkan informasi pelatihan eksternal, seseorang berbicara tentang klasifikasi otomatis atau "pengenalan tanpa pengawasan". Sebagian besar algoritma pengenalan pola memerlukan keterlibatan daya komputasi yang sangat signifikan, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V.I., J. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin dan lain-lain) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, non-parametrik dan heuristik, sementara yang lain memilih kelompok metode berdasarkan aliran sejarah dan tren di bidang ini.

Pada saat yang sama, tipologi terkenal tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara pengetahuan tentang bidang subjek diwakili menggunakan algoritma pengenalan pola formal apa pun. D.A. Pospelov mengidentifikasi dua cara utama untuk merepresentasikan pengetahuan:

    Representasi intensional - dalam bentuk diagram hubungan antara atribut (fitur).

    Representasi ekstensional - dengan bantuan fakta konkret (objek, contoh).

Perlu dicatat bahwa keberadaan dua kelompok metode pengenalan ini: yang beroperasi dengan fitur dan yang beroperasi dengan objek, sangat alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan untuk membentuk refleksi yang memadai dari area subjek. Antara metode ini ada hubungan saling melengkapi dalam arti N. Bohr, oleh karena itu, sistem pengenalan yang menjanjikan harus menyediakan implementasi kedua metode ini, dan bukan hanya salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang diusulkan oleh D.A. Pospelov didasarkan pada hukum-hukum dasar yang mendasari cara kognisi manusia pada umumnya, yang menempatkannya pada posisi yang sangat istimewa (istimewa) dibandingkan dengan klasifikasi lain, yang, dengan latar belakang ini, terlihat lebih ringan dan buatan.

Metode Intensional

Sebuah fitur khas dari metode intensional adalah bahwa mereka menggunakan karakteristik yang berbeda dari fitur dan hubungan mereka sebagai elemen operasi dalam konstruksi dan penerapan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitik atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola intensional sangat luas, dan pembagiannya menjadi subclass agak sewenang-wenang:

– metode berdasarkan perkiraan kepadatan distribusi nilai fitur

– metode berdasarkan asumsi tentang kelas fungsi keputusan

– metode logis

– metode linguistik (struktural).

Metode berdasarkan estimasi densitas distribusi nilai fitur. Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek studi dianggap sebagai realisasi dari variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut beberapa hukum. Mereka didasarkan pada skema pengambilan keputusan Bayesian, yang mengacu pada probabilitas apriori objek milik satu atau lain kelas yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini direduksi untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Pengelompokan metode berdasarkan estimasi densitas distribusi nilai ciri berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian untuk pengambilan keputusan adalah salah satu yang paling berkembang dalam statistik modern, yang disebut metode parametrik, di mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sebagian kecil jumlah parameter (vektor rata-rata dan matriks kovarians) perlu diestimasi.

Grup ini juga mencakup metode untuk menghitung rasio kemungkinan untuk fitur independen. Metode ini, dengan pengecualian asumsi independensi fitur (yang praktis tidak pernah terpenuhi dalam kenyataan), tidak menyiratkan pengetahuan tentang bentuk fungsional dari hukum distribusi. Ini dapat dikaitkan dengan metode non-parametrik.

Metode non-parametrik lainnya, yang digunakan ketika bentuk kurva densitas distribusi tidak diketahui dan tidak ada asumsi yang dapat dibuat tentang sifatnya sama sekali, menempati posisi khusus. Ini termasuk metode histogram multidimensi yang terkenal, metode "k-nearest tetangga", metode jarak Euclidean, metode fungsi potensial, dll., generalisasinya adalah metode yang disebut "perkiraan Parzen". Metode ini secara formal beroperasi dengan objek sebagai struktur integral, tetapi tergantung pada jenis tugas pengenalan, mereka dapat bertindak baik dalam hipostasis intensional dan ekstensional.

Metode nonparametrik menganalisis jumlah relatif objek yang termasuk dalam volume multidimensi yang diberikan dan menggunakan berbagai fungsi jarak antara objek sampel pelatihan dan objek yang dikenali. Untuk fitur kuantitatif, ketika jumlahnya jauh lebih sedikit daripada ukuran sampel, operasi dengan objek memainkan peran perantara dalam memperkirakan kepadatan distribusi lokal dari probabilitas bersyarat, dan objek tidak membawa beban semantik unit informasi independen. Pada saat yang sama, ketika jumlah fitur sepadan atau lebih besar dari jumlah objek yang diteliti, dan fitur bersifat kualitatif atau dikotomis, maka tidak ada pembicaraan tentang perkiraan lokal dari kepadatan distribusi probabilitas. Dalam hal ini, objek-objek dalam metode nonparametrik ini dianggap sebagai unit informasi yang berdiri sendiri (fakta empiris holistik) dan metode ini memperoleh makna penilaian atas persamaan dan perbedaan objek yang diteliti.

Dengan demikian, operasi teknologi yang sama dari metode non-parametrik, tergantung pada kondisi masalah, masuk akal baik perkiraan lokal dari kepadatan distribusi probabilitas nilai fitur, atau perkiraan kesamaan dan perbedaan objek.

Dalam konteks representasi intensional pengetahuan, sisi pertama dari metode non-parametrik dipertimbangkan di sini, sebagai perkiraan kepadatan distribusi probabilitas. Banyak penulis mencatat bahwa metode nonparametrik seperti perkiraan Parzen bekerja dengan baik dalam praktiknya. Kesulitan utama dalam menerapkan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap ketidakterwakilan sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan. Dalam kelompok metode ini, bentuk umum dari fungsi keputusan dianggap diketahui dan kualitas fungsionalnya diberikan. Berdasarkan fungsional ini, pendekatan terbaik dari fungsi keputusan dicari untuk urutan pelatihan. Yang paling umum adalah representasi dari fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Kualitas fungsional aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama dari metode berdasarkan asumsi tentang kelas fungsi keputusan adalah kejelasan rumusan matematika dari masalah pengenalan sebagai masalah menemukan ekstrem. Solusi untuk masalah ini sering dicapai dengan menggunakan beberapa jenis algoritma gradien. Keragaman metode kelompok ini dijelaskan oleh berbagai fungsi kualitas aturan keputusan yang digunakan dan algoritma pencarian ekstrem. Generalisasi dari algoritma yang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik. Tidak seperti metode pengenalan parametrik, keberhasilan kelompok metode ini tidak terlalu bergantung pada ketidaksesuaian gagasan teoretis tentang hukum distribusi objek dalam ruang fitur dengan realitas empiris. Semua operasi tunduk pada satu tujuan utama - menemukan ekstrem dari kualitas fungsional dari aturan keputusan. Pada saat yang sama, hasil parametrik dan metode yang dipertimbangkan mungkin serupa. Seperti yang ditunjukkan di atas, metode parametrik untuk kasus distribusi normal objek di kelas yang berbeda dengan matriks kovarians yang sama mengarah ke fungsi keputusan linier. Kami juga mencatat bahwa algoritme untuk memilih fitur informatif dalam model diagnostik linier dapat ditafsirkan sebagai varian tertentu dari algoritme gradien untuk mencari ekstrem.

Kemungkinan algoritma gradien untuk menemukan ekstrem, terutama dalam kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kasus ketika kelas objek yang dapat dikenali ditampilkan dalam ruang fitur oleh struktur geometris yang kompak. Namun, keinginan untuk mencapai kualitas yang cukup dari aturan keputusan sering dapat dipenuhi dengan bantuan algoritma yang tidak memiliki bukti matematis yang ketat dari konvergensi solusi ke ekstrem global.

Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusioner. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna dari objek kompleks dengan pemodelan fenomenologis evolusinya.

Perwakilan terkenal dari pemodelan evolusioner dalam pengenalan pola adalah metode akuntansi kelompok argumen (MGUA). GMDH didasarkan pada prinsip pengaturan diri, dan algoritma GMDH mereproduksi skema seleksi massal. Dalam algoritma GMDH, anggota polinomial umum disintesis dan dipilih dengan cara khusus, yang sering disebut polinomial Kolmogorov-Gabor. Sintesis dan seleksi ini dilakukan dengan semakin kompleksnya, dan tidak mungkin untuk memprediksi sebelumnya bentuk akhir dari polinomial yang digeneralisasikan. Pertama, kombinasi berpasangan sederhana dari fitur awal biasanya dipertimbangkan, dari mana persamaan fungsi yang menentukan disusun, sebagai suatu peraturan, tidak lebih tinggi dari orde kedua. Setiap persamaan dianalisis sebagai fungsi keputusan independen, dan nilai parameter persamaan yang disusun ditemukan dalam satu atau lain cara dari sampel pelatihan. Kemudian, dari kumpulan fungsi keputusan yang dihasilkan, bagian dari yang terbaik dalam beberapa hal dipilih. Kualitas fungsi keputusan individu diperiksa pada sampel kontrol (pengujian), yang kadang-kadang disebut prinsip penjumlahan eksternal. Fungsi keputusan parsial yang dipilih dianggap di bawah ini sebagai variabel perantara yang berfungsi sebagai argumen awal untuk sintesis serupa dari fungsi keputusan baru, dll. Proses sintesis hierarkis semacam itu berlanjut hingga ekstrem dari kriteria kualitas fungsi keputusan tercapai, yang dalam praktiknya memanifestasikan dirinya dalam penurunan kualitas ini ketika mencoba untuk lebih meningkatkan urutan anggota polinomial relatif terhadap fitur aslinya.

Prinsip pengorganisasian diri yang mendasari GMDH disebut pengorganisasian diri heuristik, karena seluruh proses didasarkan pada pengenalan tambahan eksternal yang dipilih secara heuristik. Hasil keputusan dapat secara signifikan bergantung pada heuristik ini. Model diagnostik yang dihasilkan tergantung pada bagaimana objek dibagi menjadi sampel pelatihan dan pengujian, bagaimana kriteria kualitas pengenalan ditentukan, berapa banyak variabel yang dilewati pada baris pemilihan berikutnya, dll.

Fitur-fitur algoritma GMDH ini juga merupakan karakteristik dari pendekatan lain untuk pemodelan evolusi. Tetapi kami mencatat di sini satu aspek lagi dari metode yang sedang dipertimbangkan. Ini adalah esensi konten mereka. Menggunakan metode berdasarkan asumsi tentang kelas fungsi keputusan (evolusioner dan gradien), dimungkinkan untuk membangun model diagnostik dengan kompleksitas tinggi dan memperoleh hasil yang dapat diterima secara praktis. Pada saat yang sama, pencapaian tujuan praktis dalam hal ini tidak disertai dengan ekstraksi pengetahuan baru tentang sifat objek yang dapat dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), pada dasarnya dibatasi di sini oleh struktur tertentu dari interaksi tersebut, yang ditetapkan dalam bentuk fungsi yang menentukan yang dipilih. Oleh karena itu, maksimum yang dapat dikatakan setelah membangun model diagnostik tertentu adalah membuat daftar kombinasi fitur dan fitur itu sendiri yang termasuk dalam model yang dihasilkan. Tetapi makna kombinasi yang mencerminkan sifat dan struktur distribusi objek yang diteliti sering kali masih belum ditemukan dalam kerangka pendekatan ini.

Metode Boolean. Metode logika pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuk yang paling umum, metode logis dapat dicirikan sebagai semacam pencarian pola logis dalam sampel pelatihan dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang memiliki bobot sendiri. Kelompok metode logis beragam dan mencakup metode berbagai kompleksitas dan kedalaman analisis. Untuk fitur dikotomis (boolean), yang disebut pengklasifikasi seperti pohon, metode tes buntu, algoritma Kora, dan lainnya populer. Metode yang lebih kompleks didasarkan pada formalisasi metode induktif D.S. Mill. Formalisasi dilakukan dengan membangun teori kuasi-aksiomatik dan didasarkan pada logika multi-nilai multi-urutan dengan quantifiers atas tupel panjang variabel.

Algoritme Kora, seperti metode logis lainnya untuk pengenalan pola, cukup melelahkan, karena penghitungan lengkap diperlukan saat memilih konjungsi. Oleh karena itu, ketika menerapkan metode logis, persyaratan tinggi ditempatkan pada organisasi yang efisien dari proses komputasi, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Linguistik (sintaksis atau struktural) metode. Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa, yang dengannya seperangkat properti objek yang dapat dikenali dapat dijelaskan. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jika deskripsi gambar dibuat dengan bantuan elemen non-turunan (sub-gambar) dan hubungannya, maka pendekatan linguistik atau sintaksis digunakan untuk membangun sistem pengenalan otomatis menggunakan prinsip kesamaan sifat. Sebuah gambar dapat dideskripsikan menggunakan struktur hierarki subgambar yang mirip dengan struktur sintaksis suatu bahasa. Keadaan ini memungkinkan untuk menerapkan teori bahasa formal dalam memecahkan masalah pengenalan pola. Diasumsikan bahwa tata bahasa gambar berisi kumpulan elemen hingga yang disebut variabel, elemen non-turunan, dan aturan substitusi. Sifat aturan substitusi menentukan jenis tata bahasa. Di antara tata bahasa yang paling banyak dipelajari adalah tata bahasa reguler, bebas konteks, dan tata bahasa konstituen langsung. Poin kunci dari pendekatan ini adalah pilihan elemen non-turunan dari gambar, penyatuan elemen-elemen ini dan hubungan yang menghubungkannya ke dalam tata bahasa gambar, dan, akhirnya, implementasi proses analisis dan pengenalan dalam bahasa yang sesuai. . Pendekatan ini sangat berguna ketika bekerja dengan gambar yang tidak dapat dijelaskan dengan pengukuran numerik, atau sangat kompleks sehingga fitur lokalnya tidak dapat diidentifikasi dan seseorang harus mengacu pada properti global objek.

Misalnya, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev mengusulkan struktur sistem berikut untuk pemrosesan gambar (Gbr. 3), menggunakan pendekatan linguistik, di mana masing-masing blok fungsional adalah kompleks perangkat lunak (mikroprogram) (modul) yang mengimplementasikan fungsi yang sesuai.

Gambar 3. Diagram struktural dari pengenal

Upaya untuk menerapkan metode linguistik matematika untuk masalah analisis gambar mengarah pada kebutuhan untuk memecahkan sejumlah masalah yang berkaitan dengan pemetaan struktur gambar dua dimensi ke rantai satu dimensi dari bahasa formal.

Metode Ekstensi

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang dipelajari diberikan nilai diagnostik independen pada tingkat yang lebih besar atau lebih kecil. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap orang bukan sebagai rantai objek yang diberi peringkat menurut satu atau lain indikator, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek studi tidak memungkinkan seseorang untuk mengecualikan atau kehilangan informasi tentang setiap objek individu, yang terjadi ketika menerapkan metode arah yang disengaja, menggunakan objek hanya untuk mendeteksi dan memperbaiki pola perilaku atributnya.

Operasi utama dalam pengenalan pola menggunakan metode yang dibahas adalah operasi menentukan kesamaan dan perbedaan objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Pada saat yang sama, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas terluas: dari partisipasi utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk solusi yang berhasil: dari satu di setiap kelas yang dapat dikenali hingga seluruh ukuran sampel, serta cara yang berbeda untuk menghitung ukuran kesamaan dan perbedaan objek. Persyaratan ini menjelaskan pembagian lebih lanjut dari metode ekstensional ke dalam subkelas:

    metode perbandingan prototipe;

    metode k-nearest neighbor;

    tim aturan keputusan.

Metode perbandingan prototipe. Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, ketika kelas yang dikenali ditampilkan di ruang fitur dalam pengelompokan geometris yang kompak. Dalam hal ini, pusat pengelompokan geometris kelas (atau objek yang paling dekat dengan pusat) biasanya dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, prototipe yang paling dekat dengannya ditemukan, dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelas, tidak ada gambar kelas umum yang terbentuk dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi indikatif informasi tentang struktur data. Menggunakan representasi di atas, misalnya, setiap skala pengukuran tradisional, yang merupakan fungsi linier dari nilai-nilai fitur dikotomis, dapat dianggap sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas yang dikenali memungkinkan kita untuk menyimpulkan bahwa mereka kompak secara geometris, maka cukup untuk mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dari contoh ideal yang dijelaskan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan prototipe kelas diagnostik menghadapi masalah yang sulit. Ini adalah, pertama-tama, pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial dari distribusi objek. Dan, kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang khas untuk masalah nyata.

Metode k-nearest tetangga. Metode k-nearest neighbor untuk memecahkan masalah analisis diskriminan pertama kali diusulkan pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) objek lain yang secara geometris paling dekat dengannya di ruang fitur (tetangga terdekat) dengan kelas yang dapat dikenali yang sudah diketahui. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang keanggotaan yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k-nearest neighbor dianggap sebagai metode non-parametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, estimasi teoritis efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Terbukti bahwa peluang kesalahan asimtotik untuk metode k-nearest neighbor melebihi kesalahan aturan Bayes tidak lebih dari dua kali.

Seperti disebutkan di atas, dalam masalah nyata seringkali perlu untuk beroperasi dengan objek yang dijelaskan oleh sejumlah besar fitur kualitatif (dikotomis). Pada saat yang sama, dimensi ruang fitur sepadan dengan atau melebihi volume sampel yang diteliti. Dalam kondisi seperti itu, akan lebih mudah untuk menginterpretasikan setiap objek dari sampel pelatihan sebagai pengklasifikasi linier yang terpisah. Kemudian kelas diagnostik ini atau itu tidak diwakili oleh satu prototipe, tetapi oleh satu set pengklasifikasi linier. Interaksi gabungan dari pengklasifikasi linier menghasilkan permukaan linier sepotong-sepotong yang memisahkan kelas yang dapat dikenali dalam ruang fitur. Jenis permukaan pembagi, terdiri dari potongan-potongan hyperplanes, dapat bervariasi dan tergantung pada posisi relatif dari agregat yang diklasifikasikan.

Interpretasi lain dari mekanisme klasifikasi k-nearest neighbor juga dapat digunakan. Ini didasarkan pada gagasan keberadaan beberapa variabel laten, abstrak atau terkait dengan beberapa transformasi dengan ruang fitur asli. Jika jarak berpasangan antara objek di ruang variabel laten sama dengan di ruang fitur awal, dan jumlah variabel ini jauh lebih sedikit daripada jumlah objek, maka interpretasi metode k-nearest neighbor dapat dipertimbangkan. dari sudut pandang membandingkan estimasi nonparametrik kepadatan distribusi probabilitas bersyarat. Konsep variabel laten yang disajikan di sini mirip dengan konsep dimensi sebenarnya dan representasi lain yang digunakan dalam berbagai metode pengurangan dimensi.

Saat menggunakan metode k-nearest neighbor untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam kondisi ruang fitur berdimensi tinggi sangat diperparah karena cukup melelahkannya metode ini, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, serta dalam metode perbandingan prototipe, perlu untuk memecahkan masalah kreatif dalam menganalisis struktur multidimensi data eksperimen untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Algoritma untuk menghitung nilai (voting). Prinsip operasi algoritma untuk menghitung skor (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan "kedekatan" dari objek yang dikenali dan referensi menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari suatu kumpulan fitur.

Tidak seperti semua metode yang dipertimbangkan sebelumnya, algoritme untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritma ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO membawa ide penggunaan fitur ke kesimpulan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, di ABO tingkat kesamaan objek dihitung dengan membandingkan semua kemungkinan atau kombinasi fitur tertentu. termasuk dalam deskripsi objek.

Tim aturan keputusan. Aturan keputusan menggunakan skema pengenalan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi bekerja, yang hasilnya digabungkan pada tingkat kedua di blok sintesis. Metode yang paling umum dari kombinasi semacam itu didasarkan pada alokasi area kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan area kompetensi adalah dengan apriori membagi ruang fitur berdasarkan pertimbangan profesional dari ilmu tertentu (misalnya, stratifikasi sampel menurut beberapa fitur). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan dari objek yang dapat dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis menganggap indikator yang dihasilkan dari algoritma parsial sebagai fitur awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah membuat seperangkat aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan penelitian dan deskripsi konstruktif tentang algoritma pengenalan, di mana semua jenis algoritma yang ada cocok.

Metode jaringan saraf

Metode neural network adalah metode yang didasarkan pada penggunaan berbagai jenis neural network (NN). Area utama penerapan berbagai NN untuk pengenalan pola dan gambar:

    aplikasi untuk mengekstraksi karakteristik atau fitur utama dari gambar yang diberikan,

    klasifikasi gambar itu sendiri atau karakteristik yang sudah diekstraksi darinya (dalam kasus pertama, ekstraksi karakteristik utama terjadi secara implisit di dalam jaringan),

    solusi dari masalah optimasi.

Jaringan saraf multilayer. Arsitektur jaringan saraf multilayer (MNN) terdiri dari lapisan yang terhubung secara berurutan, di mana neuron dari setiap lapisan terhubung dengan semua neuron dari lapisan sebelumnya dengan inputnya, dan dengan output dari lapisan berikutnya.

Aplikasi paling sederhana dari NN lapisan tunggal (disebut memori asosiatif otomatis) adalah melatih jaringan untuk merekonstruksi gambar umpan. Dengan memasukkan gambar uji ke input dan menghitung kualitas gambar yang direkonstruksi, seseorang dapat memperkirakan seberapa baik jaringan mengenali gambar input. Sifat positif dari metode ini adalah bahwa jaringan dapat memulihkan gambar yang terdistorsi dan bising, tetapi tidak cocok untuk tujuan yang lebih serius.

MNN juga digunakan untuk klasifikasi langsung gambar - inputnya adalah gambar itu sendiri dalam beberapa bentuk, atau satu set karakteristik kunci yang diekstraksi sebelumnya dari gambar, pada output, neuron dengan aktivitas maksimum menunjukkan milik kelas yang dikenali (Gbr. .4). Jika aktivitas ini berada di bawah ambang batas tertentu, maka dianggap bahwa gambar yang dikirimkan bukan milik salah satu kelas yang diketahui. Proses pembelajaran menetapkan korespondensi gambar input dengan milik kelas tertentu. Ini disebut pembelajaran terawasi. Pendekatan ini bagus untuk tugas kontrol akses untuk sekelompok kecil orang. Pendekatan ini memberikan perbandingan langsung dari gambar itu sendiri oleh jaringan, tetapi dengan peningkatan jumlah kelas, waktu pelatihan dan operasi jaringan meningkat secara eksponensial. Oleh karena itu, untuk tugas-tugas seperti mencari orang yang serupa dalam database yang besar, diperlukan penggalian sekumpulan fitur kunci yang ringkas untuk mencari.

Pendekatan klasifikasi menggunakan karakteristik frekuensi dari seluruh gambar dijelaskan dalam . Sebuah NS lapisan tunggal berdasarkan neuron multinilai digunakan.

B menunjukkan penggunaan NN untuk klasifikasi citra, ketika input jaringan menerima hasil dekomposisi citra dengan metode komponen utama.

Dalam MNS klasik, koneksi saraf interlayer terhubung sepenuhnya, dan gambar direpresentasikan sebagai vektor satu dimensi, meskipun dua dimensi. Arsitektur convolutional neural network bertujuan untuk mengatasi kekurangan tersebut. Ini menggunakan bidang reseptor lokal (menyediakan konektivitas dua dimensi lokal neuron), bobot umum (menyediakan deteksi beberapa fitur di mana saja dalam gambar), dan organisasi hierarkis dengan subsampling spasial (subsampling spasial). Convolutional NN (CNN) memberikan resistensi parsial terhadap perubahan skala, perpindahan, rotasi, distorsi.

MNS juga digunakan untuk mendeteksi objek dari tipe tertentu. Selain fakta bahwa setiap MNS terlatih dapat sampai batas tertentu menentukan apakah gambar milik kelas "sendiri", itu dapat dilatih secara khusus untuk mendeteksi kelas tertentu dengan andal. Dalam hal ini, kelas keluaran akan menjadi kelas yang termasuk dan tidak termasuk dalam tipe gambar yang diberikan. Detektor jaringan saraf digunakan untuk mendeteksi citra wajah pada citra masukan. Gambar dipindai dengan jendela 20x20 piksel, yang diumpankan ke input jaringan, yang memutuskan apakah area yang diberikan termasuk dalam kelas wajah. Pelatihan dilakukan dengan menggunakan contoh positif (gambar berbagai wajah) dan contoh negatif (gambar bukan wajah). Untuk meningkatkan keandalan deteksi, tim NN yang dilatih dengan bobot awal yang berbeda digunakan, akibatnya NN membuat kesalahan dengan cara yang berbeda, dan keputusan akhir dibuat dengan pemungutan suara dari seluruh tim.

Gambar 5. Komponen utama (eigenfaces) dan dekomposisi gambar menjadi komponen utama

NN juga digunakan untuk mengekstrak karakteristik kunci dari citra, yang kemudian digunakan untuk klasifikasi selanjutnya. Dalam , metode untuk implementasi jaringan saraf dari metode analisis komponen utama ditampilkan. Inti dari metode analisis komponen utama adalah untuk mendapatkan koefisien dekorelasi maksimal yang mencirikan pola input. Koefisien ini disebut komponen utama dan digunakan untuk kompresi citra statistik, di mana sejumlah kecil koefisien digunakan untuk mewakili keseluruhan citra. Sebuah NN dengan satu lapisan tersembunyi yang mengandung N neuron (yang jauh lebih kecil dari dimensi gambar), dilatih dengan metode kesalahan backpropagation untuk mengembalikan gambar input pada output, membentuk koefisien komponen utama N pertama pada output dari neuron tersembunyi, yang digunakan untuk perbandingan. Biasanya, 10 hingga 200 komponen utama digunakan. Dengan bertambahnya jumlah komponen, keterwakilannya sangat berkurang, dan tidak masuk akal untuk menggunakan komponen dengan jumlah besar. Saat menggunakan fungsi aktivasi nonlinier elemen saraf, dekomposisi nonlinier menjadi komponen utama dimungkinkan. Nonlinier memungkinkan Anda untuk lebih akurat mencerminkan variasi dalam data input. Menerapkan analisis komponen utama untuk dekomposisi gambar wajah, kami memperoleh komponen utama, yang disebut wajah yang tepat, yang juga memiliki properti yang berguna - ada komponen yang terutama mencerminkan karakteristik wajah penting seperti jenis kelamin, ras, emosi. Saat direstorasi, komponen memiliki tampilan seperti wajah, dengan yang pertama mencerminkan bentuk wajah yang paling umum, yang terakhir mewakili berbagai perbedaan kecil di antara wajah (Gbr. 5). Metode ini dapat diterapkan dengan baik untuk mencari gambar wajah yang mirip dalam database besar. Kemungkinan pengurangan lebih lanjut dari dimensi komponen utama dengan bantuan NS juga ditunjukkan. Dengan mengevaluasi kualitas rekonstruksi gambar input, seseorang dapat dengan sangat akurat menentukan apakah itu termasuk dalam kelas wajah.

Jaringan saraf tingkat tinggi. Jaringan saraf tingkat tinggi (HNN) berbeda dari MNN karena hanya memiliki satu lapisan, tetapi input neuron juga menerima suku tingkat tinggi yang merupakan produk dari dua atau lebih komponen vektor input. Jaringan semacam itu juga dapat membentuk permukaan pemisah yang kompleks.

Jaringan saraf Hopfield. Hopfield NN (HSH) adalah lapisan tunggal dan terhubung penuh (tidak ada koneksi neuron ke dirinya sendiri), outputnya terhubung dengan input. Berbeda dengan MNS, NSH bersifat relaksasi, yaitu diatur ke keadaan awal, ia berfungsi hingga mencapai keadaan stabil, yang akan menjadi nilai outputnya. Untuk mencari minimum global dalam kaitannya dengan masalah optimasi, digunakan modifikasi stokastik dari NSH.

Penggunaan NSH sebagai memori asosiatif memungkinkan Anda untuk secara akurat mengembalikan gambar yang telah dilatih jaringan ketika gambar yang terdistorsi dimasukkan ke input. Dalam hal ini, jaringan akan "mengingat" gambar terdekat (dalam arti energi minimum lokal), dan dengan demikian mengenalinya. Fungsi tersebut juga dapat dianggap sebagai aplikasi berurutan dari memori auto-asosiatif yang dijelaskan di atas. Tidak seperti memori auto-associative, NSH akan mengembalikan gambar secara akurat dengan sempurna. Untuk menghindari gangguan minimal dan meningkatkan kapasitas jaringan, berbagai metode digunakan.

Jaringan saraf yang mengatur diri sendiri Kohonen. Kohonen self-organizing neural networks (SNNCs) menyediakan urutan topologi dari ruang gambar input. Mereka memungkinkan pemetaan kontinu topologi dari ruang n-dimensi input ke dalam output m-dimensi, m<

kognitron. Cognitron dalam arsitekturnya mirip dengan struktur korteks visual, ia memiliki organisasi multilayer hierarkis, di mana neuron antar lapisan hanya terhubung secara lokal. Dilatih dengan pembelajaran kompetitif (tanpa guru). Setiap lapisan otak menerapkan tingkat generalisasi yang berbeda; lapisan input peka terhadap pola sederhana, seperti garis, dan orientasinya di area tertentu dari area visual, sedangkan respons lapisan lain lebih kompleks, abstrak, dan tidak bergantung pada posisi pola. Fungsi serupa diimplementasikan dalam kognitron dengan memodelkan organisasi korteks visual.

Neocognitron adalah pengembangan lebih lanjut dari ide cognitron dan lebih akurat mencerminkan struktur sistem visual, memungkinkan Anda mengenali gambar terlepas dari transformasi, rotasi, distorsi, dan perubahan skalanya.

Cognitron adalah alat pengenalan gambar yang kuat, namun membutuhkan biaya komputasi yang tinggi, yang saat ini tidak dapat dicapai.

Metode jaringan saraf yang dipertimbangkan memberikan pengenalan gambar yang cepat dan andal, tetapi ketika menggunakan metode ini, masalah muncul dalam pengenalan objek tiga dimensi. Namun, pendekatan ini memiliki banyak keuntungan.

      Kesimpulan

Saat ini terdapat cukup banyak sistem pengenalan pola otomatis untuk berbagai masalah yang diterapkan.

Pengenalan pola dengan metode formal sebagai arahan ilmiah mendasar tidak ada habisnya.

Metode matematika pemrosesan gambar memiliki berbagai aplikasi: sains, teknologi, kedokteran, lingkungan sosial. Di masa depan, peran pengenalan pola dalam kehidupan manusia akan semakin meningkat.

Metode jaringan saraf memberikan pengenalan gambar yang cepat dan andal. Pendekatan ini memiliki banyak keuntungan dan merupakan salah satu yang paling menjanjikan.

literatur

    D.V. Brilyuk, V.V. Starovoitov. Metode jaringan saraf untuk pengenalan gambar // /

    Kuzin L.T. Dasar-dasar Sibernetika: Dasar-dasar Model Sibernetik. T.2. - M.: Energi, 1979. - 584 hal.

    Peregudov F.I., Tarasenko F.P. Pengantar Analisis Sistem: Buku Ajar. - M.: Sekolah Tinggi, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Landasan teoretis teknologi informasi. - M.: Energi, 1979. - 511s.

    Tu J., Gonzalez R. Prinsip Pengenalan Pola. / Per. dari bahasa Inggris. - M.: Mir, 1978. - 410-an.

    Winston P. Kecerdasan buatan. / Per. dari bahasa Inggris. - M.: Mir, 1980. - 520-an.

    Fu K. Metode struktural dalam pengenalan pola: Diterjemahkan dari bahasa Inggris. - M.: Mir, 1977. - 320-an.

    Tsypkin Ya.Z. Dasar-dasar Teori Informasi Identifikasi. - M.: Nauka, 1984. - 520-an.

    Pospelov G.S. Kecerdasan buatan adalah dasar dari teknologi informasi baru. - M.: Nauka, 1988. - 280-an.

    Yu Lifshits, Metode statistik pengenalan pola ///modern/07modernnote.pdf

    Bohr N. Fisika atom dan pengetahuan manusia. / Terjemahan dari bahasa Inggris. - M.: Mir, 1961. - 151 detik.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Pemrosesan gambar pada komputer. 1987.-236s.

    Duda R., Hart P. Pengenalan pola dan analisis adegan. / Terjemahan dari bahasa Inggris. - M.: Mir, 1978. - 510-an.

    Duke V.A. Psikodiagnostik komputer. - St. Petersburg: Persaudaraan, 1994. - 365 hal.

    Aizenberg I.N., Aizenberg N.N. dan Krivosheev G.A. Neuron Biner Multi-nilai dan Universal: Algoritma Pembelajaran, Aplikasi untuk Pemrosesan dan Pengenalan Gambar. Catatan Kuliah dalam Kecerdasan Buatan - Pembelajaran Mesin dan Penambangan Data dalam Pengenalan Pola, 1999, hlm. 21-35.

    Ranganath S. dan Arun K. Pengenalan wajah menggunakan fitur transformasi dan jaringan saraf. Pengenalan Pola 1997, Vol. 30, hal. 1615-1622.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 1. Organisasi dan pelatihan jaringan saraf dengan langsung dan umpan balik - Brest: BPI, 1999, - 260-an.

    Vetter T. dan Poggio T. Kelas Objek Linier dan Sintesis Gambar Dari Gambar Contoh Tunggal. Transaksi IEEE pada Analisis Pola dan Intelijen Mesin 1997, Vol. 19, hal. 733-742.

    Golovko V.A. Neurointelligence: Teori dan Aplikasi. Buku 2. Self-organisasi, toleransi kesalahan dan penggunaan jaringan saraf - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. dan Back A. D. Pengenalan Wajah: Pendekatan Jaringan Saraf Konvolusi. Transaksi IEEE pada Neural Networks, Edisi Khusus Neural Networks and Pattern Recognition, hlm. 1-24.

    Wasserman F. Teknologi neurokomputer: Teori dan praktik, 1992 - 184p.

    Rowley H. A., Baluja S. dan Kanade T. Deteksi Wajah Berbasis Neural Network. Transaksi IEEE pada Analisis Pola dan Intelijen Mesin 1998, Vol. 20, hal. 23-37.

    Valentin D., Abdi H., O "Toole A. J. dan Cottrell G. W. Model Connectionist pemrosesan wajah: survei. DI: Pengenalan Pola 1994, Vol. 27, hlm. 1209-1230.

    Dokumen

    Mereka membuat algoritma pengakuangambar-gambar. Metodepengakuangambar-gambar Seperti disebutkan di atas ... kenyataannya tidak ada"ekosistem secara umum" dan ada hanya beberapa ... kesimpulan dari detail ini tinjauanmetodepengakuan kami hadirkan di...

  1. Ikhtisar metode untuk mengidentifikasi orang berdasarkan gambar wajah, dengan mempertimbangkan fitur pengenalan visual

    Tinjauan

    ... pengakuan oleh seseorang dari objek kontras rendah, termasuk. orang. Telah membawa tinjauan umum metode ... Ada seluruh baris metode ... jalan, sebagai hasil dari penelitian, sebuah platform untuk pengembangan metodepengakuan ...

  2. Imeni Glazkova Valentina Vladimirovna PENELITIAN DAN PENGEMBANGAN METODE KONSTRUKSI ALAT PERANGKAT LUNAK UNTUK KLASIFIKASI DOKUMEN HIPERTEKS MULTI TOPIK Spesialisasi 05

    Abstrak disertasi

    dokumen hiperteks. Bab ini berisi tinjauanadametode solusi dari masalah yang sedang dipertimbangkan, deskripsi ... dengan memotong kelas yang paling tidak relevan // Mathematical metodepengakuangambar-gambar: Konferensi Seluruh Rusia ke-13. wilayah Leningrad...

  3. Slide 0 Ikhtisar tugas bioinformatika terkait analisis dan pengolahan teks genetik

    Kuliah

    sekuens DNA dan protein. Tinjauan tugas bioinformatika sebagai tugas ... sinyal memerlukan penggunaan modern metodepengakuangambar-gambar, pendekatan statistik dan ... dengan kepadatan gen rendah. Ada program prediksi gen tidak...

Bab 3: Tinjauan Analitis Pengenalan Pola dan Metode Pengambilan Keputusan

Teori pengenalan pola dan otomatisasi kontrol

Tugas utama pengenalan pola adaptif

Recognition adalah proses informasi yang diimplementasikan oleh beberapa information converter (intelligent information channel, recognition system) yang memiliki input dan output. Masukan dari sistem adalah informasi tentang fitur apa saja yang dimiliki objek yang disajikan. Output dari sistem menampilkan informasi tentang kelas mana (gambar umum) yang ditugaskan untuk objek yang dapat dikenali.

Saat membuat dan mengoperasikan sistem pengenalan pola otomatis, sejumlah tugas diselesaikan. Mari kita secara singkat dan sederhana mempertimbangkan tugas-tugas ini. Perlu dicatat bahwa rumusan masalah ini, dan himpunan itu sendiri, tidak sesuai dengan penulis yang berbeda, karena sampai batas tertentu tergantung pada model matematika tertentu yang menjadi dasar sistem pengenalan ini atau itu. Selain itu, beberapa tugas dalam model pengenalan tertentu tidak memiliki solusi dan, karenanya, tidak diajukan.

Tugas memformalkan area subjek

Padahal, tugas ini adalah tugas coding. Daftar kelas umum dikompilasi, yang mungkin mencakup implementasi objek tertentu, serta daftar fitur yang pada prinsipnya dapat dimiliki oleh objek ini.

Tugas membentuk sampel pelatihan

Sampel pelatihan adalah database yang berisi deskripsi implementasi objek tertentu dalam bahasa fitur, dilengkapi dengan informasi tentang kepemilikan objek ini ke kelas pengenalan tertentu.

Tugas melatih sistem pengenalan

Sampel pelatihan digunakan untuk membentuk gambar umum dari kelas pengenalan berdasarkan generalisasi informasi tentang fitur apa yang dimiliki objek sampel pelatihan yang termasuk dalam kelas ini dan kelas lainnya.

Masalah pengurangan dimensi ruang fitur

Setelah melatih sistem pengenalan (memperoleh statistik tentang distribusi frekuensi fitur berdasarkan kelas), menjadi mungkin untuk menentukan setiap fitur nilainya untuk memecahkan masalah pengenalan. Setelah itu, fitur yang paling tidak berharga dapat dihapus dari sistem fitur. Kemudian sistem pengenalan harus dilatih kembali, karena sebagai akibat dari penghapusan beberapa fitur, statistik distribusi fitur yang tersisa berdasarkan kelas berubah. Proses ini dapat diulang, mis. menjadi iteratif.

tugas pengakuan

Objek sampel dikenali diakui, yang, khususnya, dapat terdiri dari satu objek. Sampel yang dapat dikenali dibentuk mirip dengan sampel pelatihan, tetapi tidak mengandung informasi tentang kepemilikan objek ke kelas, karena inilah yang ditentukan dalam proses pengenalan. Hasil dari pengenalan setiap objek adalah distribusi atau daftar semua kelas pengenalan dalam urutan derajat kesamaan objek yang dikenali dengan mereka.

Tugas kontrol kualitas pengakuan

Setelah pengakuan, kecukupannya dapat ditetapkan. Untuk objek sampel pelatihan, ini dapat dilakukan segera, karena bagi mereka hanya diketahui dari kelas mana mereka berada. Untuk objek lain, informasi ini dapat diperoleh nanti. Bagaimanapun, probabilitas kesalahan rata-rata aktual untuk semua kelas pengenalan dapat ditentukan, serta probabilitas kesalahan saat menetapkan objek yang dikenali ke kelas tertentu.

Hasil pengenalan harus ditafsirkan dengan mempertimbangkan informasi yang tersedia tentang kualitas pengenalan.

Tugas adaptasi

Jika, sebagai hasil dari prosedur pengendalian kualitas, ditemukan bahwa itu tidak memuaskan, maka deskripsi objek yang salah dikenali dapat disalin dari sampel yang dapat dikenali ke sampel pelatihan, dilengkapi dengan informasi klasifikasi yang memadai, dan digunakan untuk membentuk kembali keputusan. aturan, yaitu diperhitungkan. Selain itu, jika objek-objek ini tidak termasuk dalam kelas pengenalan yang sudah ada, yang dapat menjadi alasan untuk pengenalan yang salah, maka daftar ini dapat diperluas. Akibatnya, sistem pengenalan beradaptasi dan mulai mengklasifikasikan objek-objek ini secara memadai.

Masalah pengenalan terbalik

Tugas pengenalan adalah bahwa untuk objek tertentu, menurut fitur yang diketahui, sistem menetapkan miliknya ke beberapa kelas yang sebelumnya tidak diketahui. Dalam masalah pengenalan terbalik, sebaliknya, untuk kelas pengenalan yang diberikan, sistem menentukan fitur mana yang paling khas dari objek kelas ini dan mana yang bukan (atau objek sampel pelatihan mana yang termasuk dalam kelas ini).

Tugas cluster dan analisis konstruktif

Cluster adalah sekelompok objek, kelas atau fitur yang di dalam setiap cluster mereka semirip mungkin, dan di antara cluster yang berbeda mereka sedapat mungkin berbeda.

Sebuah konstruk (dalam konteks yang dipertimbangkan dalam bagian ini) adalah sistem dari cluster yang berlawanan. Jadi, dalam arti tertentu, konstruksi adalah hasil dari analisis klaster dari klaster.

Dalam analisis cluster, tingkat kesamaan dan perbedaan objek (kelas, fitur) diukur secara kuantitatif, dan informasi ini digunakan untuk klasifikasi. Hasil dari analisis klaster adalah pengklasifikasian objek berdasarkan klaster. Klasifikasi ini dapat direpresentasikan dalam bentuk jaringan semantik.

Tugas analisis kognitif

Dalam analisis kognitif, informasi tentang persamaan dan perbedaan kelas atau fitur menarik bagi peneliti itu sendiri, dan bukan untuk menggunakannya untuk klasifikasi, seperti dalam analisis klaster dan konstruktif.

Jika dua kelas pengenalan dicirikan oleh fitur yang sama, maka ini berkontribusi pada kesamaan kedua kelas ini. Jika untuk salah satu kelas fitur ini tidak seperti biasanya, maka ini berkontribusi pada perbedaan.

Jika dua tanda berkorelasi satu sama lain, maka dalam arti tertentu mereka dapat dianggap sebagai satu tanda, dan jika mereka antikorelasi, maka berbeda. Mempertimbangkan keadaan ini, kehadiran fitur yang berbeda di kelas yang berbeda juga memberikan kontribusi tertentu pada kesamaan dan perbedaannya.

Hasil analisis kognitif dapat disajikan dalam bentuk diagram kognitif.

Metode pengenalan pola dan karakteristiknya

Prinsip klasifikasi metode pengenalan pola

Pengenalan pola adalah tugas membangun dan menerapkan operasi formal pada representasi numerik atau simbolik dari objek dunia nyata atau ideal, yang hasil penyelesaiannya mencerminkan hubungan ekivalensi antara objek-objek ini. Relasi ekuivalensi mengekspresikan kepemilikan objek yang dievaluasi ke beberapa kelas, yang dianggap sebagai unit semantik independen.

Ketika membangun algoritma pengenalan, kelas kesetaraan dapat ditetapkan oleh seorang peneliti yang menggunakan ide-ide bermaknanya sendiri atau menggunakan informasi tambahan eksternal tentang kesamaan dan perbedaan objek dalam konteks masalah yang sedang dipecahkan. Kemudian seseorang berbicara tentang "pengakuan dengan guru". Jika tidak, yaitu ketika sistem otomatis memecahkan masalah klasifikasi tanpa melibatkan informasi pelatihan eksternal, seseorang berbicara tentang klasifikasi otomatis atau "pengenalan tanpa pengawasan". Sebagian besar algoritma pengenalan pola memerlukan keterlibatan daya komputasi yang sangat signifikan, yang hanya dapat disediakan oleh teknologi komputer berkinerja tinggi.

Berbagai penulis (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin dan lain-lain) memberikan tipologi metode pengenalan pola yang berbeda. Beberapa penulis membedakan antara metode parametrik, nonparametrik, dan heuristik, sementara yang lain memilih kelompok metode berdasarkan aliran sejarah dan tren di lapangan. Misalnya, dalam karya yang memberikan gambaran akademis tentang metode pengenalan, tipologi metode pengenalan pola berikut digunakan:

  • metode berdasarkan prinsip pemisahan;
  • metode statistik;
  • metode yang dibangun berdasarkan "fungsi potensial";
  • metode untuk menghitung nilai (voting);
  • metode berdasarkan kalkulus proposisional, khususnya pada peralatan aljabar logika.

Klasifikasi ini didasarkan pada perbedaan dalam metode formal pengenalan pola, dan oleh karena itu pertimbangan pendekatan heuristik untuk pengenalan, yang telah menerima pengembangan penuh dan memadai dalam sistem pakar, dihilangkan. Pendekatan heuristik didasarkan pada pengetahuan dan intuisi peneliti yang sulit diformalkan. Pada saat yang sama, peneliti sendiri menentukan informasi apa dan bagaimana sistem harus digunakan untuk mencapai efek pengenalan yang diinginkan.

Tipologi metode pengenalan yang serupa dengan berbagai tingkat detail ditemukan di banyak karya tentang pengenalan. Pada saat yang sama, tipologi terkenal tidak memperhitungkan satu karakteristik yang sangat signifikan, yang mencerminkan kekhususan cara pengetahuan tentang bidang subjek diwakili menggunakan beberapa algoritma pengenalan pola formal.

D.A. Pospelov (1990) mengidentifikasi dua cara utama untuk merepresentasikan pengetahuan:

  • intensional, berupa skema hubungan antar atribut (fitur).
  • ekstensional, dengan bantuan fakta spesifik (objek, contoh).

Representasi intensional menangkap pola dan hubungan yang menjelaskan struktur data. Berkenaan dengan tugas diagnostik, fiksasi tersebut terdiri dalam menentukan operasi pada atribut (fitur) objek yang mengarah pada hasil diagnostik yang diperlukan. Representasi intensional diimplementasikan melalui operasi pada nilai atribut dan tidak menyiratkan operasi pada fakta informasi tertentu (objek).

Pada gilirannya, representasi pengetahuan ekstensional dikaitkan dengan deskripsi dan fiksasi objek tertentu dari area subjek dan diimplementasikan dalam operasi, yang elemen-elemennya adalah objek sebagai sistem integral.

Adalah mungkin untuk menarik analogi antara representasi pengetahuan yang intensional dan ekstensional dan mekanisme yang mendasari aktivitas belahan kiri dan kanan otak manusia. Jika belahan kanan dicirikan oleh representasi prototipikal holistik dari dunia sekitarnya, maka belahan kiri beroperasi dengan pola yang mencerminkan hubungan atribut dunia ini.

Dua cara mendasar dari representasi pengetahuan yang dijelaskan di atas memungkinkan kami untuk mengusulkan klasifikasi metode pengenalan pola berikut:

  • metode intensional berdasarkan operasi dengan atribut.
  • metode ekstensional berdasarkan operasi dengan objek.

Perlu ditekankan bahwa keberadaan dua (dan hanya dua) kelompok metode pengenalan ini: yang beroperasi dengan fitur dan yang beroperasi dengan objek, sangat alami. Dari sudut pandang ini, tidak satu pun dari metode ini, yang diambil secara terpisah dari yang lain, memungkinkan untuk membentuk refleksi yang memadai dari area subjek. Menurut penulis, antara metode ini ada hubungan saling melengkapi dalam arti N. Bohr, oleh karena itu, sistem pengenalan yang menjanjikan harus memastikan penerapan kedua metode ini, dan bukan hanya salah satunya.

Dengan demikian, klasifikasi metode pengenalan yang diusulkan oleh D. A. Pospelov didasarkan pada hukum dasar yang mendasari cara kognisi manusia secara umum, yang menempatkannya pada posisi yang sangat istimewa (istimewa) dibandingkan dengan klasifikasi lain, yang, dengan latar belakang ini, terlihat lebih ringan dan buatan.

Metode Intensional

Sebuah fitur khas dari metode intensional adalah bahwa mereka menggunakan karakteristik yang berbeda dari fitur dan hubungan mereka sebagai elemen operasi dalam konstruksi dan penerapan algoritma pengenalan pola. Elemen tersebut dapat berupa nilai individual atau interval nilai fitur, nilai rata-rata dan varians, matriks hubungan fitur, dll., di mana tindakan dilakukan, dinyatakan dalam bentuk analitik atau konstruktif. Pada saat yang sama, objek dalam metode ini tidak dianggap sebagai unit informasi integral, tetapi bertindak sebagai indikator untuk menilai interaksi dan perilaku atributnya.

Kelompok metode pengenalan pola intensional sangat luas, dan pembagiannya menjadi subclass agak sewenang-wenang.

Metode berdasarkan perkiraan kepadatan distribusi nilai fitur

Metode pengenalan pola ini dipinjam dari teori klasik keputusan statistik, di mana objek studi dianggap sebagai realisasi dari variabel acak multidimensi yang didistribusikan dalam ruang fitur menurut beberapa hukum. Mereka didasarkan pada skema pengambilan keputusan Bayesian, yang mengacu pada probabilitas apriori objek milik satu atau lain kelas yang dapat dikenali dan kepadatan distribusi bersyarat dari nilai vektor fitur. Metode-metode ini direduksi untuk menentukan rasio kemungkinan di berbagai area ruang fitur multidimensi.

Pengelompokan metode berdasarkan estimasi densitas distribusi nilai ciri berhubungan langsung dengan metode analisis diskriminan. Pendekatan Bayesian untuk pengambilan keputusan adalah salah satu yang paling berkembang dalam statistik modern, yang disebut metode parametrik, di mana ekspresi analitis dari hukum distribusi (dalam hal ini, hukum normal) dianggap diketahui dan hanya sebagian kecil jumlah parameter (vektor rata-rata dan matriks kovarians) perlu diestimasi.

Kesulitan utama dalam menerapkan metode ini adalah kebutuhan untuk mengingat seluruh sampel pelatihan untuk menghitung perkiraan kepadatan distribusi probabilitas lokal dan sensitivitas yang tinggi terhadap ketidakterwakilan sampel pelatihan.

Metode berdasarkan asumsi tentang kelas fungsi keputusan

Dalam kelompok metode ini, bentuk umum dari fungsi keputusan dianggap diketahui dan kualitas fungsionalnya diberikan. Berdasarkan fungsional ini, pendekatan terbaik dari fungsi keputusan ditemukan dari urutan pelatihan. Yang paling umum adalah representasi dari fungsi keputusan dalam bentuk polinomial nonlinier linier dan umum. Kualitas fungsional aturan keputusan biasanya dikaitkan dengan kesalahan klasifikasi.

Keuntungan utama dari metode berdasarkan asumsi tentang kelas fungsi keputusan adalah kejelasan rumusan matematika dari masalah pengenalan sebagai masalah menemukan ekstrem. Keragaman metode kelompok ini dijelaskan oleh berbagai fungsi kualitas aturan keputusan yang digunakan dan algoritma pencarian ekstrem. Generalisasi dari algoritma yang dipertimbangkan, yang meliputi, khususnya, algoritma Newton, algoritma tipe perceptron, dll., adalah metode pendekatan stokastik.

Kemungkinan algoritma gradien untuk menemukan ekstrem, terutama dalam kelompok aturan keputusan linier, telah dipelajari dengan cukup baik. Konvergensi algoritma ini telah dibuktikan hanya untuk kasus ketika kelas objek yang dapat dikenali ditampilkan dalam ruang fitur oleh struktur geometris yang kompak.

Kualitas aturan keputusan yang cukup tinggi dapat dicapai dengan menggunakan algoritme yang tidak memiliki bukti matematis yang ketat tentang konvergensi solusi ke ekstrem global. Algoritma tersebut mencakup sekelompok besar prosedur pemrograman heuristik yang mewakili arah pemodelan evolusioner. Pemodelan evolusioner adalah metode bionik yang dipinjam dari alam. Ini didasarkan pada penggunaan mekanisme evolusi yang diketahui untuk menggantikan proses pemodelan bermakna dari objek kompleks dengan pemodelan fenomenologis evolusinya. Perwakilan terkenal dari pemodelan evolusioner dalam pengenalan pola adalah metode akuntansi kelompok argumen (MGUA). GMDH didasarkan pada prinsip pengaturan diri, dan algoritma GMDH mereproduksi skema seleksi massal.

Namun, pencapaian tujuan praktis dalam hal ini tidak disertai dengan ekstraksi pengetahuan baru tentang sifat objek yang dapat dikenali. Kemungkinan mengekstraksi pengetahuan ini, khususnya pengetahuan tentang mekanisme interaksi atribut (fitur), pada dasarnya dibatasi di sini oleh struktur tertentu dari interaksi tersebut, yang ditetapkan dalam bentuk fungsi yang menentukan yang dipilih.

Metode Boolean

Metode logika pengenalan pola didasarkan pada peralatan aljabar logis dan memungkinkan untuk beroperasi dengan informasi yang terkandung tidak hanya dalam fitur individu, tetapi juga dalam kombinasi nilai fitur. Dalam metode ini, nilai atribut apa pun dianggap sebagai peristiwa dasar.

Dalam bentuk yang paling umum, metode logis dapat dicirikan sebagai semacam pencarian pola logis dalam sampel pelatihan dan pembentukan sistem aturan keputusan logis tertentu (misalnya, dalam bentuk konjungsi peristiwa dasar), masing-masing dari yang memiliki bobot sendiri. Kelompok metode logis beragam dan mencakup metode berbagai kompleksitas dan kedalaman analisis. Untuk fitur dikotomis (boolean), yang disebut pengklasifikasi seperti pohon, metode pengujian buntu, algoritma Bark, dll. sangat populer.

Algoritma Kora, seperti metode logis lainnya dari pengenalan pola, cukup melelahkan dalam hal perhitungan, karena enumerasi lengkap diperlukan saat memilih konjungsi. Oleh karena itu, ketika menerapkan metode logis, persyaratan tinggi ditempatkan pada organisasi yang efisien dari proses komputasi, dan metode ini bekerja dengan baik dengan dimensi ruang fitur yang relatif kecil dan hanya pada komputer yang kuat.

Metode linguistik (struktural)

Metode linguistik pengenalan pola didasarkan pada penggunaan tata bahasa khusus yang menghasilkan bahasa yang dapat digunakan untuk menggambarkan seperangkat properti objek yang dapat dikenali.

Untuk kelas objek yang berbeda, elemen non-turunan (atom) (subgambar, tanda) dan kemungkinan hubungan di antara mereka dibedakan. Tata bahasa mengacu pada aturan untuk membangun objek dari elemen non-turunan ini.

Jadi, setiap objek adalah kumpulan elemen non-turunan, "terhubung" satu sama lain dalam satu atau lain cara, atau, dengan kata lain, oleh "kalimat" dari beberapa "bahasa". Saya ingin menekankan nilai ideologis yang sangat signifikan dari pemikiran ini.

Dengan mem-parsing (mengurai) sebuah "kalimat", "kebenaran" sintaksisnya ditentukan, atau, secara setara, apakah beberapa tata bahasa tetap yang menggambarkan suatu kelas dapat menghasilkan deskripsi objek yang ada.

Namun, tugas memulihkan (mendefinisikan) tata bahasa dari serangkaian pernyataan (kalimat - deskripsi objek) tertentu yang menghasilkan bahasa tertentu sulit untuk diformalkan.

Metode Ekstensi

Dalam metode kelompok ini, berbeda dengan arah intensional, setiap objek yang dipelajari diberikan nilai diagnostik independen pada tingkat yang lebih besar atau lebih kecil. Pada intinya, metode ini dekat dengan pendekatan klinis, yang menganggap orang bukan sebagai rantai objek yang diberi peringkat menurut satu atau lain indikator, tetapi sebagai sistem integral, yang masing-masing bersifat individual dan memiliki nilai diagnostik khusus. Sikap hati-hati terhadap objek studi tidak memungkinkan seseorang untuk mengecualikan atau kehilangan informasi tentang setiap objek individu, yang terjadi ketika menerapkan metode arah yang disengaja, menggunakan objek hanya untuk mendeteksi dan memperbaiki pola perilaku atributnya.

Operasi utama dalam pengenalan pola menggunakan metode yang dibahas adalah operasi menentukan kesamaan dan perbedaan objek. Objek dalam kelompok metode tertentu memainkan peran preseden diagnostik. Pada saat yang sama, tergantung pada kondisi tugas tertentu, peran preseden individu dapat bervariasi dalam batas terluas: dari partisipasi utama dan menentukan hingga partisipasi yang sangat tidak langsung dalam proses pengakuan. Pada gilirannya, kondisi masalah mungkin memerlukan partisipasi sejumlah preseden diagnostik yang berbeda untuk solusi yang berhasil: dari satu di setiap kelas yang dapat dikenali hingga seluruh ukuran sampel, serta cara yang berbeda untuk menghitung ukuran kesamaan dan perbedaan objek. Persyaratan ini menjelaskan pembagian lebih lanjut dari metode ekstensional ke dalam subkelas.

Metode perbandingan prototipe

Ini adalah metode pengenalan ekstensional yang paling sederhana. Ini digunakan, misalnya, dalam kasus ketika kelas yang dikenali ditampilkan di ruang fitur dengan pengelompokan geometris yang kompak. Dalam hal ini, pusat pengelompokan geometris kelas (atau objek yang paling dekat dengan pusat) biasanya dipilih sebagai titik prototipe.

Untuk mengklasifikasikan objek yang tidak diketahui, prototipe yang paling dekat dengannya ditemukan, dan objek tersebut termasuk dalam kelas yang sama dengan prototipe ini. Jelas, tidak ada gambar kelas umum yang terbentuk dalam metode ini.

Berbagai jenis jarak dapat digunakan sebagai ukuran kedekatan. Seringkali untuk fitur dikotomis, jarak Hamming digunakan, yang dalam hal ini sama dengan kuadrat jarak Euclidean. Dalam hal ini, aturan keputusan untuk mengklasifikasikan objek setara dengan fungsi keputusan linier.

Fakta ini harus diperhatikan secara khusus. Ini dengan jelas menunjukkan hubungan antara prototipe dan representasi indikatif informasi tentang struktur data. Menggunakan representasi di atas, misalnya, setiap skala pengukuran tradisional, yang merupakan fungsi linier dari nilai-nilai fitur dikotomis, dapat dianggap sebagai prototipe diagnostik hipotetis. Pada gilirannya, jika analisis struktur spasial kelas yang dikenali memungkinkan kita untuk menyimpulkan bahwa mereka kompak secara geometris, maka cukup untuk mengganti masing-masing kelas ini dengan satu prototipe, yang sebenarnya setara dengan model diagnostik linier.

Dalam praktiknya, tentu saja, situasinya seringkali berbeda dari contoh ideal yang digambarkan. Seorang peneliti yang bermaksud menerapkan metode pengenalan berdasarkan perbandingan dengan prototipe kelas diagnostik menghadapi masalah yang sulit.

Pertama, itu adalah pilihan ukuran kedekatan (metrik), yang secara signifikan dapat mengubah konfigurasi spasial dari distribusi objek. Kedua, masalah independen adalah analisis struktur multidimensi data eksperimen. Kedua masalah ini sangat akut bagi peneliti dalam kondisi ruang fitur berdimensi tinggi, yang khas untuk masalah nyata.

k metode tetangga terdekat

Metode k tetangga terdekat untuk memecahkan masalah analisis diskriminan pertama kali diusulkan kembali pada tahun 1952. Ini adalah sebagai berikut.

Saat mengklasifikasikan objek yang tidak diketahui, ditemukan sejumlah (k) objek lain yang secara geometris paling dekat dengannya di ruang fitur (tetangga terdekat) dengan kelas yang dapat dikenali yang sudah diketahui. Keputusan untuk menetapkan objek yang tidak diketahui ke kelas diagnostik tertentu dibuat dengan menganalisis informasi tentang keanggotaan yang diketahui dari tetangga terdekatnya, misalnya, menggunakan penghitungan suara sederhana.

Awalnya, metode k tetangga terdekat dianggap sebagai metode nonparametrik untuk memperkirakan rasio kemungkinan. Untuk metode ini, estimasi teoritis efektivitasnya diperoleh dibandingkan dengan pengklasifikasi Bayesian yang optimal. Terbukti bahwa peluang kesalahan asimtotik untuk metode k tetangga terdekat melebihi kesalahan aturan Bayes tidak lebih dari dua kali.

Saat menggunakan metode k tetangga terdekat untuk pengenalan pola, peneliti harus memecahkan masalah sulit dalam memilih metrik untuk menentukan kedekatan objek yang didiagnosis. Masalah ini dalam kondisi ruang fitur berdimensi tinggi sangat diperparah karena cukup melelahkannya metode ini, yang menjadi signifikan bahkan untuk komputer berperforma tinggi. Oleh karena itu, di sini, serta dalam metode perbandingan prototipe, perlu untuk memecahkan masalah kreatif dalam menganalisis struktur multidimensi data eksperimen untuk meminimalkan jumlah objek yang mewakili kelas diagnostik.

Kebutuhan untuk mengurangi jumlah objek dalam sampel pelatihan (preseden diagnostik) adalah kerugian dari metode ini, karena mengurangi keterwakilan sampel pelatihan.

Algoritma untuk menghitung nilai ("voting")

Prinsip pengoperasian algoritma evaluasi (ABO) adalah menghitung prioritas (skor kesamaan) yang mencirikan "kedekatan" dari objek yang dikenali dan referensi menurut sistem ansambel fitur, yang merupakan sistem himpunan bagian dari serangkaian fitur yang diberikan. .

Tidak seperti semua metode yang dipertimbangkan sebelumnya, algoritme untuk menghitung perkiraan beroperasi dengan deskripsi objek dengan cara yang secara fundamental baru. Untuk algoritma ini, objek ada secara bersamaan di subruang yang sangat berbeda dari ruang fitur. Kelas ABO membawa ide penggunaan fitur ke kesimpulan logisnya: karena tidak selalu diketahui kombinasi fitur mana yang paling informatif, di ABO tingkat kesamaan objek dihitung dengan membandingkan semua kemungkinan atau kombinasi fitur tertentu. termasuk dalam deskripsi objek.

Kombinasi atribut (subruang) yang digunakan disebut set pendukung atau set deskripsi parsial objek. Konsep kedekatan umum antara objek yang dikenali dan objek sampel pelatihan (dengan klasifikasi yang diketahui), yang disebut objek referensi, diperkenalkan. Kedekatan ini diwakili oleh kombinasi kedekatan objek yang dikenali dengan objek referensi yang dihitung pada kumpulan deskripsi parsial. Dengan demikian, ABO adalah perluasan dari metode k tetangga terdekat, di mana kedekatan objek dianggap hanya dalam satu ruang fitur yang diberikan.

Perpanjangan lain dari ABO adalah bahwa dalam algoritma ini masalah penentuan kesamaan dan perbedaan objek dirumuskan sebagai satu parametrik dan tahap pengaturan ABO sesuai dengan sampel pelatihan dipilih, di mana nilai optimal dari ABO dipilih. parameter yang dimasukkan dipilih. Kriteria kualitas adalah kesalahan pengenalan, dan secara harfiah semuanya diparameterisasi:

  • aturan untuk menghitung kedekatan objek dengan fitur individu;
  • aturan untuk menghitung kedekatan objek di subruang fitur;
  • tingkat kepentingan objek referensi tertentu sebagai preseden diagnostik;
  • signifikansi kontribusi setiap set fitur referensi untuk penilaian akhir kesamaan objek yang dikenali dengan kelas diagnostik apa pun.

Parameter pendingin udara ditetapkan dalam bentuk nilai ambang batas dan (atau) sebagai bobot komponen yang ditunjukkan.

Kemungkinan teoritis ABO setidaknya tidak lebih rendah daripada algoritma pengenalan pola lainnya, karena dengan bantuan ABO semua operasi yang dapat dibayangkan dengan objek yang diteliti dapat diimplementasikan.

Tetapi, seperti yang biasanya terjadi, perluasan potensi menghadapi kesulitan besar dalam implementasi praktisnya, terutama pada tahap konstruksi (penyetelan) algoritma jenis ini.

Kesulitan terpisah dicatat sebelumnya ketika membahas metode k tetangga terdekat, yang dapat ditafsirkan sebagai versi ABO yang terpotong. Ini juga dapat dipertimbangkan dalam bentuk parametrik dan mengurangi masalah untuk menemukan metrik berbobot dari jenis yang dipilih. Pada saat yang sama, sudah di sini untuk masalah dimensi tinggi, pertanyaan teoretis kompleks dan masalah yang terkait dengan organisasi proses komputasi yang efisien muncul.

Untuk ABO, jika Anda mencoba menggunakan kemampuan algoritma ini secara penuh, kesulitan ini meningkat berkali-kali lipat.

Masalah yang dicatat menjelaskan fakta bahwa dalam praktik penggunaan ABO untuk memecahkan masalah berdimensi tinggi disertai dengan pengenalan batasan dan asumsi heuristik. Secara khusus, ada contoh penggunaan ABO dalam psikodiagnostik, di mana versi ABO diuji, yang sebenarnya setara dengan metode k tetangga terdekat.

Kolektif Aturan yang Menentukan

Di akhir tinjauan metode pengenalan pola, mari kita membahas satu pendekatan lagi. Ini adalah apa yang disebut tim aturan keputusan (CRC).

Karena algoritma pengenalan yang berbeda berperilaku berbeda pada sampel objek yang sama, pertanyaan secara alami muncul dari aturan keputusan sintetis yang secara adaptif menggunakan kekuatan algoritma ini. Aturan keputusan sintetik menggunakan skema pengenalan dua tingkat. Pada tingkat pertama, algoritma pengenalan pribadi bekerja, yang hasilnya digabungkan pada tingkat kedua di blok sintesis. Metode yang paling umum dari kombinasi semacam itu didasarkan pada alokasi area kompetensi algoritma tertentu. Cara paling sederhana untuk menemukan bidang kompetensi adalah dengan apriori membagi ruang atribut berdasarkan pertimbangan profesional ilmu tertentu (misalnya, stratifikasi sampel menurut beberapa atribut). Kemudian, untuk setiap area yang dipilih, algoritma pengenalannya sendiri dibangun. Metode lain didasarkan pada penggunaan analisis formal untuk menentukan area lokal dari ruang fitur sebagai lingkungan dari objek yang dapat dikenali dimana keberhasilan algoritma pengenalan tertentu telah terbukti.

Pendekatan paling umum untuk membangun blok sintesis menganggap indikator yang dihasilkan dari algoritma parsial sebagai fitur awal untuk membangun aturan keputusan umum yang baru. Dalam hal ini, semua metode arah intensional dan ekstensional di atas dalam pengenalan pola dapat digunakan. Efektif untuk memecahkan masalah membuat seperangkat aturan keputusan adalah algoritma logis dari tipe "Kora" dan algoritma untuk menghitung perkiraan (ABO), yang membentuk dasar dari apa yang disebut pendekatan aljabar, yang menyediakan penelitian dan deskripsi konstruktif dari algoritma pengenalan, di mana semua jenis algoritma yang ada cocok.

Analisis komparatif metode pengenalan pola

Mari kita bandingkan metode pengenalan pola yang dijelaskan di atas dan mengevaluasi tingkat kecukupannya dengan persyaratan yang dirumuskan dalam Bagian 3.3.3 untuk model SDA untuk sistem kontrol otomatis adaptif untuk sistem yang kompleks.

Untuk memecahkan masalah nyata dari kelompok metode arah intensional, metode parametrik dan metode berdasarkan proposal dalam bentuk fungsi yang menentukan memiliki nilai praktis. Metode parametrik membentuk dasar metodologi tradisional untuk membangun indikator. Penerapan metode ini dalam masalah nyata dikaitkan dengan pengenaan pembatasan kuat pada struktur data, yang mengarah pada model diagnostik linier dengan perkiraan parameter yang sangat mendekati. Saat menggunakan metode berdasarkan asumsi tentang bentuk fungsi keputusan, peneliti juga terpaksa beralih ke model linier. Hal ini disebabkan oleh dimensi tinggi dari ruang fitur, yang khas untuk masalah nyata, yang, dengan peningkatan derajat fungsi keputusan polinomial, memberikan peningkatan besar dalam jumlah anggotanya dengan peningkatan bermasalah seiring dalam kualitas pengakuan. Dengan demikian, memproyeksikan area penerapan potensial metode pengenalan intensional ke masalah nyata, kami mendapatkan gambaran yang sesuai dengan metodologi tradisional model diagnostik linier yang mapan.

Sifat-sifat model diagnostik linier, di mana indikator diagnostik diwakili oleh jumlah bobot fitur awal, dipelajari dengan baik. Hasil dari model ini (dengan normalisasi yang sesuai) diinterpretasikan sebagai jarak dari objek yang diteliti ke beberapa hyperplane di ruang fitur atau, secara ekuivalen, sebagai proyeksi objek ke beberapa garis lurus dalam ruang yang diberikan. Oleh karena itu, model linier hanya memadai untuk konfigurasi geometris sederhana dari wilayah ruang fitur di mana objek dari kelas diagnostik yang berbeda dipetakan. Dengan distribusi yang lebih kompleks, model-model ini pada dasarnya tidak dapat mencerminkan banyak fitur dari struktur data eksperimental. Pada saat yang sama, fitur tersebut dapat memberikan informasi diagnostik yang berharga.

Pada saat yang sama, penampilan dalam setiap masalah nyata dari struktur multidimensi sederhana (khususnya, distribusi normal multidimensi) harus dianggap sebagai pengecualian daripada sebagai aturan. Seringkali, kelas diagnostik dibentuk berdasarkan kriteria eksternal yang kompleks, yang secara otomatis memerlukan heterogenitas geometris kelas-kelas ini dalam ruang fitur. Hal ini terutama berlaku untuk kriteria "kehidupan" yang paling sering ditemui dalam praktik. Dalam kondisi seperti itu, penggunaan model linier hanya menangkap pola informasi eksperimental yang paling "kasar".

Penggunaan metode ekstensional tidak dikaitkan dengan asumsi tentang struktur informasi eksperimental, kecuali bahwa dalam kelas yang diakui harus ada satu atau lebih kelompok objek yang agak mirip, dan objek dari kelas yang berbeda harus berbeda satu sama lain dalam beberapa hal. jalan. Jelas bahwa untuk setiap dimensi terbatas dari sampel pelatihan (dan tidak boleh berbeda), persyaratan ini selalu dipenuhi hanya karena ada perbedaan acak antara objek. Berbagai ukuran kedekatan (distance) objek dalam ruang fitur digunakan sebagai ukuran kesamaan. Oleh karena itu, penggunaan efektif metode pengenalan pola ekstensional tergantung pada seberapa baik ukuran kedekatan ini didefinisikan, serta objek sampel pelatihan mana (objek dengan klasifikasi yang diketahui) memainkan peran preseden diagnostik. Solusi yang berhasil dari masalah ini memberikan hasil yang mendekati batas efisiensi pengenalan yang dapat dicapai secara teoritis.

Keuntungan dari metode ekstensional pengenalan pola ditentang, pertama-tama, oleh kompleksitas teknis yang tinggi dari implementasi praktisnya. Untuk ruang fitur berdimensi tinggi, tugas yang tampaknya sederhana untuk menemukan pasangan titik terdekat berubah menjadi masalah serius. Juga, banyak penulis mencatat sebagai masalah kebutuhan untuk mengingat sejumlah besar objek yang mewakili kelas yang dapat dikenali.

Dalam dirinya sendiri, ini bukan masalah, tetapi dianggap sebagai masalah (misalnya, dalam metode k tetangga terdekat) dengan alasan bahwa ketika mengenali setiap objek, enumerasi lengkap semua objek dalam sampel pelatihan terjadi.

Oleh karena itu, disarankan untuk menerapkan model sistem pengenalan, di mana masalah penghitungan lengkap objek sampel pelatihan selama pengenalan dihilangkan, karena itu dilakukan hanya sekali ketika membentuk gambar umum dari kelas pengenalan. Dalam pengenalan itu sendiri, objek yang diidentifikasi hanya dibandingkan dengan gambar umum dari kelas pengenalan, yang jumlahnya tetap dan tidak bergantung sama sekali pada dimensi sampel pelatihan. Pendekatan ini memungkinkan Anda untuk meningkatkan dimensi sampel pelatihan hingga kualitas gambar umum yang disyaratkan tercapai, tanpa rasa takut bahwa hal ini dapat menyebabkan peningkatan waktu pengenalan yang tidak dapat diterima (karena waktu pengenalan dalam model ini tidak bergantung pada dimensi pelatihan sama sekali).

Masalah teoritis penerapan metode pengenalan ekstensional terkait dengan masalah pencarian kelompok fitur yang informatif, menemukan metrik yang optimal untuk mengukur kesamaan dan perbedaan objek, dan menganalisis struktur informasi eksperimental. Pada saat yang sama, solusi sukses dari masalah ini memungkinkan tidak hanya merancang algoritma pengenalan yang efektif, tetapi juga membuat transisi dari pengetahuan ekstensional tentang fakta empiris ke pengetahuan intensional tentang pola strukturnya.

Transisi dari pengetahuan ekstensional ke pengetahuan intensional terjadi pada tahap ketika algoritma pengenalan formal telah dibangun dan efektivitasnya telah ditunjukkan. Kemudian studi tentang mekanisme yang digunakan untuk mencapai efisiensi yang diperoleh. Studi semacam itu, terkait dengan analisis struktur geometris data, dapat, misalnya, mengarah pada kesimpulan bahwa cukup untuk mengganti objek yang mewakili kelas diagnostik tertentu dengan satu perwakilan tipikal (prototipe). Ini setara, seperti disebutkan di atas, untuk menetapkan skala diagnostik linier tradisional. Mungkin juga cukup untuk mengganti setiap kelas diagnostik dengan beberapa objek yang bermakna sebagai perwakilan khas dari beberapa subkelas, yang setara dengan membangun kipas skala linier. Ada opsi lain, yang akan dibahas di bawah.

Dengan demikian, tinjauan metode pengenalan menunjukkan bahwa sejumlah metode pengenalan pola yang berbeda telah dikembangkan secara teoritis saat ini. Literatur memberikan klasifikasi rinci dari mereka. Namun, untuk sebagian besar metode ini, implementasi perangkat lunak mereka tidak ada, dan ini sangat alami, bahkan dapat dikatakan "ditentukan sebelumnya" oleh karakteristik metode pengenalan itu sendiri. Hal ini dapat dinilai dari fakta bahwa sistem seperti itu sedikit disebutkan dalam literatur khusus dan sumber informasi lainnya.

Akibatnya, pertanyaan tentang penerapan praktis dari metode pengenalan teoretis tertentu untuk memecahkan masalah praktis dengan dimensi data nyata (yaitu, cukup signifikan) dan pada komputer modern nyata masih kurang berkembang.

Keadaan di atas dapat dipahami jika kita mengingat kembali bahwa kompleksitas model matematika secara eksponensial meningkatkan kompleksitas implementasi perangkat lunak dari sistem dan pada tingkat yang sama mengurangi kemungkinan bahwa sistem ini akan bekerja dalam praktik. Ini berarti bahwa hanya sistem perangkat lunak berdasarkan model matematika yang cukup sederhana dan "transparan" yang dapat diimplementasikan di pasar. Oleh karena itu, pengembang yang tertarik untuk mereplikasi produk perangkat lunaknya mendekati masalah pemilihan model matematika bukan dari sudut pandang ilmiah semata, tetapi sebagai seorang pragmatis, dengan mempertimbangkan kemungkinan implementasi perangkat lunak. Ia percaya bahwa model harus sesederhana mungkin, yang berarti harus dilaksanakan dengan biaya lebih rendah dan dengan kualitas yang lebih baik, dan juga harus bekerja (secara praktis efektif).

Dalam hal ini, tugas menerapkan dalam sistem pengenalan mekanisme untuk menggeneralisasi deskripsi objek yang termasuk dalam kelas yang sama, mis. mekanisme untuk pembentukan gambar umum yang kompak. Jelas bahwa mekanisme generalisasi seperti itu akan memungkinkan "mengompresi" sampel pelatihan apa pun dalam hal dimensi ke dasar gambar umum yang diketahui sebelumnya dalam hal dimensi. Ini juga akan memungkinkan kita untuk mengatur dan memecahkan sejumlah masalah yang bahkan tidak dapat dirumuskan dalam metode pengenalan seperti perbandingan dengan metode prototipe, metode k tetangga terdekat, dan ABO.

Ini adalah tugas-tugasnya:

  • menentukan kontribusi informasi fitur ke potret informasi dari gambar umum;
  • analisis klaster-konstruktif dari gambar umum;
  • penentuan beban semantik fitur;
  • analisis semantik cluster-konstruktif fitur;
  • perbandingan yang bermakna dari gambar kelas umum satu sama lain dan fitur satu sama lain (diagram kognitif, termasuk diagram Merlin).

Metode yang memungkinkan untuk mencapai solusi dari masalah ini juga membedakan sistem perspektif berdasarkan itu dari sistem lain, sama seperti compiler berbeda dari interpreter, karena karena pembentukan gambar umum dalam sistem perspektif ini, waktu pengenalan tidak tergantung pada ukuran sampel pelatihan. Diketahui bahwa keberadaan ketergantungan inilah yang menyebabkan waktu komputer yang secara praktis tidak dapat diterima dihabiskan untuk pengenalan dalam metode seperti metode k tetangga terdekat, ABO, dan CLD pada dimensi sampel pelatihan seperti itu, ketika kita dapat berbicara tentang statistik yang cukup. .

Sebagai kesimpulan dari tinjauan singkat tentang metode pengenalan, kami menyajikan esensi di atas dalam tabel ringkasan (Tabel 3.1), yang berisi deskripsi singkat tentang berbagai metode pengenalan pola dalam parameter berikut:

  • klasifikasi metode pengenalan;
  • bidang penerapan metode pengenalan;
  • klasifikasi keterbatasan metode pengenalan.
Klasifikasi metode pengenalan Area aplikasi Keterbatasan (kekurangan)
Metode pengenalan intensif Metode berdasarkan perkiraan kepadatan distribusi nilai fitur (atau persamaan dan perbedaan antara objek) Masalah dengan distribusi yang diketahui, biasanya normal, kebutuhan untuk mengumpulkan statistik yang besar Kebutuhan untuk menghitung seluruh set pelatihan selama pengenalan, sensitivitas tinggi terhadap non-representatif dari set pelatihan dan artefak
Metode berdasarkan asumsi tentang kelas fungsi keputusan Kelas harus dapat dipisahkan dengan baik, sistem fitur harus ortonormal Bentuk fungsi keputusan harus diketahui terlebih dahulu. Ketidakmungkinan untuk mempertimbangkan pengetahuan baru tentang korelasi antar fitur
Metode Boolean Ketika memilih aturan keputusan logis (konjungsi), enumerasi lengkap diperlukan. Kompleksitas komputasi yang tinggi
Metode linguistik (struktural) Masalah dimensi kecil ruang fitur Tugas memulihkan (mendefinisikan) tata bahasa dari serangkaian pernyataan (deskripsi objek) tertentu sulit untuk diformalkan. Masalah teoretis yang belum terselesaikan
Metode pengenalan ekstensional Metode perbandingan prototipe Masalah dimensi kecil ruang fitur Ketergantungan yang tinggi dari hasil klasifikasi pada ukuran jarak (metrik). Metrik optimal tidak diketahui
k metode tetangga terdekat Ketergantungan yang tinggi dari hasil klasifikasi pada ukuran jarak (metrik). Kebutuhan untuk enumerasi lengkap dari sampel pelatihan selama pengakuan. Kompleksitas komputasi
Algoritma untuk menghitung nilai (voting) AVO Masalah dimensi kecil dalam hal jumlah kelas dan fitur Ketergantungan hasil klasifikasi pada ukuran jarak (metrik). Kebutuhan untuk enumerasi lengkap dari sampel pelatihan selama pengakuan. Kompleksitas teknis yang tinggi dari metode ini
Kolektif Aturan Tegas (CRC) Masalah dimensi kecil dalam hal jumlah kelas dan fitur Kompleksitas teknis metode yang sangat tinggi, sejumlah masalah teoretis yang belum terselesaikan, baik dalam menentukan bidang kompetensi metode tertentu, maupun dalam metode tertentu itu sendiri.

Tabel 3.1 - Tabel ringkasan klasifikasi metode pengenalan, perbandingan area aplikasi dan batasannya

Peran dan tempat pengenalan pola dalam otomatisasi manajemen sistem yang kompleks

Sistem kontrol otomatis terdiri dari dua bagian utama: objek kontrol dan sistem kontrol.

Sistem kontrol melakukan fungsi-fungsi berikut:

  • identifikasi keadaan objek kontrol;
  • pengembangan tindakan kontrol berdasarkan tujuan manajemen, dengan mempertimbangkan keadaan objek kontrol dan lingkungan;
  • memberikan efek kontrol pada objek kontrol.

Pengenalan pola tidak lebih dari identifikasi keadaan beberapa objek.

Oleh karena itu, kemungkinan penggunaan sistem pengenalan pola pada tahap mengidentifikasi keadaan objek kontrol tampaknya cukup jelas dan alami. Namun, ini mungkin tidak diperlukan. Oleh karena itu, muncul pertanyaan dalam kasus mana disarankan untuk menggunakan sistem pengenalan dalam sistem kontrol otomatis, dan di mana tidak.

Menurut data literatur, dalam banyak sistem kontrol otomatis yang dikembangkan sebelumnya dan modern dalam subsistem untuk mengidentifikasi keadaan objek kontrol dan menghasilkan tindakan kontrol, model matematika deterministik "penghitungan langsung" digunakan, yang secara jelas dan sederhana menentukan apa yang harus dilakukan. lakukan dengan objek kontrol jika memiliki parameter eksternal tertentu.

Pada saat yang sama, pertanyaan tentang bagaimana parameter ini terkait dengan keadaan tertentu dari objek kontrol tidak diangkat atau diselesaikan. Posisi ini sesuai dengan sudut pandang, yang terdiri dari fakta bahwa hubungan satu-ke-satu mereka diterima "secara default". Oleh karena itu, istilah: "parameter objek kontrol" dan "keadaan objek kontrol" dianggap sebagai sinonim, dan konsep "keadaan objek kontrol" tidak diperkenalkan secara eksplisit sama sekali. Namun, jelas bahwa, dalam kasus umum, hubungan antara parameter yang diamati dari objek kontrol dan keadaannya adalah dinamis dan probabilistik.

Dengan demikian, sistem kontrol otomatis tradisional pada dasarnya adalah sistem kontrol parametrik, yaitu sistem yang mengelola bukan status objek kontrol, tetapi hanya parameter yang dapat diamati. Keputusan tentang tindakan kontrol diambil dalam sistem seperti itu seolah-olah "secara membabi buta", yaitu. tanpa membentuk gambaran holistik dari objek kontrol dan lingkungan dalam keadaan mereka saat ini, serta tanpa memprediksi perkembangan lingkungan dan reaksi objek kontrol terhadap tindakan kontrol tertentu di atasnya, bertindak secara bersamaan dengan pengaruh lingkungan yang diprediksi. .

Dari posisi yang dikembangkan dalam makalah ini, istilah "pengambilan keputusan" dalam pengertian modern hampir tidak dapat diterapkan pada sistem kontrol otomatis tradisional. Faktanya adalah bahwa "pengambilan keputusan", setidaknya, melibatkan visi holistik dari suatu objek di lingkungan, dan tidak hanya dalam keadaan mereka saat ini, tetapi juga dalam dinamika, dan dalam interaksi baik satu sama lain maupun dengan sistem kontrol, melibatkan pertimbangan berbagai pilihan alternatif untuk pengembangan keseluruhan sistem ini, serta penyempitan keragaman (pengurangan) alternatif-alternatif tersebut berdasarkan kriteria sasaran tertentu. Tidak satu pun dari ini, jelas, tidak dalam ACS tradisional, atau memang demikian, tetapi dalam bentuk yang disederhanakan.

Tentu saja, metode tradisional memadai dan penerapannya cukup tepat dan dibenarkan dalam kasus di mana objek kontrol memang merupakan sistem yang stabil dan ditentukan secara kaku, dan pengaruh lingkungan terhadapnya dapat diabaikan.

Namun, dalam kasus lain, metode ini tidak efektif.

Jika objek kontrol bersifat dinamis, maka model yang mendasari algoritme kontrolnya dengan cepat menjadi tidak memadai, karena hubungan antara parameter input dan output berubah, serta kumpulan parameter penting itu sendiri. Intinya, ini berarti bahwa sistem kontrol otomatis tradisional dapat mengontrol keadaan objek kontrol hanya di dekat titik keseimbangan melalui tindakan kontrol yang lemah di atasnya, yaitu. dengan metode gangguan kecil. Jauh dari keadaan ekuilibrium, dari sudut pandang tradisional, perilaku objek kontrol terlihat tak terduga dan tak terkendali.

Jika tidak ada hubungan yang jelas antara parameter input dan output dari objek kontrol (yaitu, antara parameter input dan keadaan objek), dengan kata lain, jika hubungan ini memiliki sifat probabilistik yang nyata, maka model deterministik, dalam yang diasumsikan bahwa hasil pengukuran parameter tertentu hanyalah angka, awalnya tidak berlaku. Selain itu, bentuk hubungan ini mungkin tidak diketahui, dan kemudian perlu untuk melanjutkan dari asumsi yang paling umum: bahwa itu adalah probabilistik, atau tidak terdefinisi sama sekali.

Sistem kontrol otomatis yang dibangun di atas prinsip-prinsip tradisional hanya dapat bekerja berdasarkan parameter, pola hubungan yang sudah diketahui, dipelajari, dan tercermin dalam model matematika, dalam penelitian ini tugas ditetapkan untuk mengembangkan metode seperti itu untuk merancang kontrol otomatis. sistem yang memungkinkan pembuatan sistem yang dapat mengidentifikasi dan menetapkan parameter paling signifikan, dan menentukan sifat hubungan antara parameter tersebut dan status objek kontrol.

Dalam hal ini, perlu untuk menerapkan metode pengukuran yang lebih berkembang dan memadai untuk situasi nyata:

  • klasifikasi atau pengenalan pola (pembelajaran berdasarkan sampel pelatihan, kemampuan beradaptasi dari algoritma pengenalan, kemampuan beradaptasi set kelas dan parameter yang dipelajari, pemilihan parameter yang paling signifikan dan pengurangan dimensi deskripsi sambil mempertahankan redundansi yang diberikan, dll.);
  • pengukuran statistik, ketika hasil pengukuran parameter tertentu bukan angka tunggal, tetapi distribusi probabilitas: perubahan variabel statistik tidak berarti perubahan nilainya itu sendiri, tetapi perubahan karakteristik distribusi probabilitas dari nilai-nilainya.

Akibatnya, sistem kontrol otomatis berdasarkan pendekatan deterministik tradisional praktis tidak bekerja dengan objek kontrol multi-parameter dinamis kompleks yang ditentukan dengan lemah, seperti, misalnya, sistem makro dan mikro-sosial-ekonomi dalam ekonomi dinamis " masa transisi”, hierarki kelompok elit dan etnis, masyarakat dan pemilih, fisiologi dan jiwa manusia, ekosistem alam dan buatan, dan banyak lainnya.

Cukup signifikan bahwa pada pertengahan 80-an, sekolah I.Prigozhin mengembangkan pendekatan, yang menurutnya dalam pengembangan sistem apa pun (termasuk seseorang), periode bergantian di mana sistem berperilaku baik sebagai "kebanyakan deterministik", atau sebagai " kebanyakan acak." Secara alami, sistem kontrol nyata harus secara stabil mengelola objek kontrol tidak hanya pada bagian "deterministik" dari sejarahnya, tetapi juga pada titik-titik ketika perilaku selanjutnya menjadi sangat tidak pasti. Ini saja berarti bahwa perlu untuk mengembangkan pendekatan untuk pengelolaan sistem dalam perilaku yang ada elemen besar keacakan (atau apa yang saat ini secara matematis digambarkan sebagai "keacakan").

Oleh karena itu, komposisi sistem kontrol otomatis yang menjanjikan yang menyediakan kontrol sistem deterministik lemah multi-parameter dinamis yang kompleks, sebagai tautan fungsional penting, tampaknya akan mencakup subsistem untuk mengidentifikasi dan memprediksi keadaan lingkungan dan objek kontrol, berdasarkan metode kecerdasan buatan. (terutama pengenalan pola), metode pendukung pengambilan keputusan dan teori informasi.

Mari kita pertimbangkan secara singkat masalah penggunaan sistem pengenalan gambar untuk membuat keputusan tentang tindakan kontrol (masalah ini akan dibahas secara lebih rinci nanti, karena ini adalah kunci untuk pekerjaan ini). Jika kita mengambil target dan keadaan lain dari objek kontrol sebagai kelas pengenalan, dan faktor-faktor yang mempengaruhinya sebagai fitur, maka ukuran hubungan antara faktor dan keadaan dapat dibentuk dalam model pengenalan pola. Ini memungkinkan memperoleh informasi tentang faktor-faktor yang berkontribusi atau menghalangi transisinya ke keadaan ini, berdasarkan keadaan tertentu dari objek kontrol, dan, atas dasar ini, mengembangkan keputusan tentang tindakan kontrol.

Faktor dapat dibagi menjadi beberapa kelompok berikut:

  • mengkarakterisasi prasejarah objek kontrol;
  • mengkarakterisasi keadaan objek kontrol saat ini;
  • faktor lingkungan;
  • faktor teknologi (dikelola).

Dengan demikian, sistem pengenalan gambar dapat digunakan sebagai bagian dari sistem kontrol otomatis: dalam subsistem untuk mengidentifikasi keadaan objek kontrol dan menghasilkan tindakan kontrol.

Ini berguna ketika objek kontrol adalah sistem yang kompleks.

Membuat keputusan tentang tindakan kontrol dalam sistem kontrol otomatis

Solusi dari masalah sintesis sistem kontrol otomatis adaptif oleh sistem yang kompleks dibahas dalam makalah ini, dengan mempertimbangkan banyak analogi yang mendalam antara metode pengenalan pola dan pengambilan keputusan.

Di satu sisi, tugas pengenalan pola adalah keputusan tentang kepemilikan objek yang dapat dikenali ke kelas pengenalan tertentu.

Di sisi lain, penulis mengusulkan untuk mempertimbangkan masalah pengambilan keputusan sebagai masalah kebalikan dari decoding atau masalah kebalikan dari pengenalan pola (lihat Bagian 2.2.2).

Kesamaan ide-ide dasar yang mendasari metode pengenalan pola dan pengambilan keputusan menjadi sangat jelas ketika mempertimbangkannya dari sudut pandang teori informasi.

Berbagai tugas pengambilan keputusan

Pengambilan keputusan sebagai realisasi dari sebuah tujuan

Definisi: membuat keputusan ("pilihan") adalah tindakan pada serangkaian alternatif, sebagai akibatnya rangkaian alternatif awal menyempit, mis. itu berkurang.

Pilihan adalah tindakan yang memberikan tujuan pada semua aktivitas. Melalui tindakan pilihan bahwa subordinasi dari semua aktivitas untuk tujuan tertentu atau satu set tujuan yang saling terkait diwujudkan.

Jadi, agar tindakan pilihan menjadi mungkin, berikut ini diperlukan:

  • generasi atau penemuan satu set alternatif untuk membuat pilihan;
  • penentuan tujuan untuk pencapaian pilihan yang dibuat;
  • pengembangan dan penerapan metode untuk membandingkan alternatif satu sama lain, yaitu penentuan peringkat preferensi untuk setiap alternatif menurut kriteria tertentu, memungkinkan penilaian secara tidak langsung bagaimana setiap alternatif memenuhi tujuan.

Pekerjaan modern di bidang pendukung keputusan telah mengungkapkan situasi karakteristik, yang terdiri dari fakta bahwa formalisasi lengkap untuk menemukan solusi terbaik (dalam arti tertentu) hanya mungkin untuk masalah yang dipelajari dengan baik dan relatif sederhana, sedangkan dalam praktiknya, masalah terstruktur lemah lebih umum, yang algoritma yang sepenuhnya diformalkan belum dikembangkan (kecuali untuk enumerasi lengkap dan coba-coba). Namun, para profesional yang berpengalaman, kompeten, dan cakap seringkali membuat pilihan yang ternyata cukup bagus. Oleh karena itu, tren saat ini dalam praktik pengambilan keputusan dalam situasi alami adalah menggabungkan kemampuan seseorang untuk memecahkan masalah yang tidak formal dengan kemampuan metode formal dan pemodelan komputer: sistem pendukung keputusan interaktif, sistem pakar, adaptif manusia-mesin otomatis. sistem kontrol, jaringan saraf, dan sistem kognitif.

Pengambilan keputusan sebagai penghilangan ketidakpastian (pendekatan informasi)

Proses memperoleh informasi dapat dianggap sebagai penurunan ketidakpastian sebagai akibat dari penerimaan sinyal, dan jumlah informasi - sebagai ukuran kuantitatif dari tingkat penghapusan ketidakpastian.

Tetapi sebagai hasil dari memilih beberapa subset alternatif dari set, yaitu sebagai akibat dari pengambilan keputusan, hal yang sama terjadi (penurunan ketidakpastian). Ini berarti bahwa setiap pilihan, setiap keputusan menghasilkan sejumlah informasi, dan oleh karena itu dapat dijelaskan dalam istilah teori informasi.

Klasifikasi masalah pengambilan keputusan

Banyaknya tugas pengambilan keputusan disebabkan oleh fakta bahwa setiap komponen situasi di mana pengambilan keputusan dilakukan dapat diimplementasikan dalam pilihan yang berbeda secara kualitatif.

Berikut adalah beberapa dari opsi ini:

  • himpunan alternatif, di satu sisi, bisa terbatas, dapat dihitung atau terus-menerus, dan di sisi lain, itu bisa tertutup (yaitu, diketahui sepenuhnya) atau terbuka (termasuk elemen yang tidak diketahui);
  • alternatif dapat dievaluasi menurut satu atau lebih kriteria, yang, pada gilirannya, bisa kuantitatif atau kualitatif;
  • mode pemilihan dapat tunggal (satu kali), atau ganda, berulang, termasuk umpan balik pada hasil seleksi, yaitu. memungkinkan pembelajaran algoritma pengambilan keputusan, dengan mempertimbangkan konsekuensi dari pemilihan sebelumnya;
  • konsekuensi dari memilih setiap alternatif dapat diketahui secara tepat sebelumnya (choice under Certainty), memiliki sifat probabilistik ketika probabilitas hasil yang mungkin diketahui setelah pilihan dibuat (choice under risk) atau memiliki hasil yang ambigu dengan probabilitas yang tidak diketahui (choice under risk) di bawah ketidakpastian);
  • tanggung jawab untuk pilihan mungkin tidak ada, menjadi individu atau kelompok;
  • tingkat konsistensi tujuan dalam pilihan kelompok dapat bervariasi dari kepentingan pihak-pihak yang kebetulan sepenuhnya (pilihan kooperatif) hingga kebalikannya (pilihan dalam situasi konflik). Pilihan menengah juga dimungkinkan: kompromi, koalisi, konflik yang berkembang atau memudar.

Berbagai kombinasi dari pilihan-pilihan ini menyebabkan banyak masalah pengambilan keputusan yang telah dipelajari pada tingkat yang berbeda-beda.

Bahasa untuk menggambarkan metode pengambilan keputusan

Satu dan fenomena yang sama dapat dibicarakan dalam bahasa yang berbeda dengan berbagai tingkat keumuman dan kecukupan. Sampai saat ini, ada tiga bahasa utama untuk menggambarkan pilihan.

Yang paling sederhana, paling berkembang dan paling populer adalah bahasa kriteria.

Bahasa kriteria

Nama bahasa ini dikaitkan dengan asumsi dasar bahwa setiap alternatif individu dapat dievaluasi oleh beberapa (satu) nomor tertentu, setelah itu perbandingan alternatif direduksi menjadi perbandingan nomor yang sesuai.

Misalkan, (X) adalah himpunan alternatif, dan x adalah beberapa alternatif pasti yang termasuk dalam himpunan ini: x∈X. Kemudian dianggap bahwa untuk semua x suatu fungsi q(x) dapat diberikan, yang disebut kriteria (kriteria kualitas, fungsi tujuan, fungsi preferensi, fungsi utilitas, dll.), yang memiliki sifat bahwa jika alternatif x 1 adalah lebih disukai daripada x 2 (dilambangkan: x 1 > x 2), lalu q (x 1) > q (x 2).

Dalam hal ini, pilihan direduksi menjadi mencari alternatif dengan nilai tertinggi dari fungsi kriteria.

Namun, dalam praktiknya, penggunaan hanya satu kriteria untuk membandingkan tingkat preferensi alternatif ternyata merupakan penyederhanaan yang tidak dapat dibenarkan, karena pertimbangan alternatif yang lebih rinci mengarah pada kebutuhan untuk mengevaluasinya tidak berdasarkan satu, tetapi menurut banyak alternatif. kriteria yang dapat bersifat berbeda dan secara kualitatif berbeda satu sama lain.

Misalnya, ketika memilih jenis pesawat yang paling dapat diterima untuk penumpang dan organisasi operasi pada jenis rute tertentu, perbandingan dilakukan secara bersamaan sesuai dengan banyak kelompok kriteria: teknis, teknologi, ekonomi, sosial, ergonomis, dll.

Masalah multikriteria tidak memiliki solusi umum yang unik. Oleh karena itu, banyak cara yang diusulkan untuk memberikan masalah multikriteria bentuk tertentu yang memungkinkan solusi umum tunggal. Secara alami, solusi ini umumnya berbeda untuk metode yang berbeda. Oleh karena itu, mungkin hal utama dalam memecahkan masalah multi-kriteria adalah pembenaran jenis perumusannya.

Berbagai pilihan untuk menyederhanakan masalah pemilihan multikriteria digunakan. Mari kita daftar beberapa dari mereka.

  1. Maksimisasi bersyarat (bukan ekstrem global dari kriteria integral yang ditemukan, tetapi ekstrem lokal dari kriteria utama).
  2. Cari alternatif dengan properti yang diberikan.
  3. Menemukan himpunan Pareto.
  4. Pengurangan masalah multikriteria menjadi satu kriteria dengan memperkenalkan kriteria integral.

Mari kita pertimbangkan secara lebih rinci formulasi formal metode pengurangan masalah multi-kriteria menjadi satu kriteria.

Kami memperkenalkan kriteria integral q 0 (x) sebagai fungsi skalar dari argumen vektor:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Kriteria integral memungkinkan seseorang untuk mengurutkan alternatif dengan q 0 , dengan demikian menyoroti yang terbaik (dalam pengertian kriteria ini). Bentuk fungsi q 0 ditentukan oleh seberapa spesifik kita membayangkan kontribusi setiap kriteria terhadap kriteria integral. Biasanya fungsi aditif dan perkalian digunakan:

q 0 = a i q i /s i

1 - q 0 = (1 - b i q i /s i)

Koefisien yang saya berikan:

  1. Tanpa dimensi atau satu dimensi dari bilangan a i q i /s i (kriteria tertentu yang berbeda mungkin memiliki dimensi yang berbeda, dan kemudian tidak mungkin untuk melakukan operasi aritmatika pada mereka dan mereduksinya menjadi kriteria integral).
  2. Normalisasi, mis. ketentuan kondisi: b i q i /s i<1.

Koefisien a i dan b i mencerminkan kontribusi relatif kriteria privat q i terhadap kriteria integral.

Jadi, dalam pengaturan multi-kriteria, masalah pengambilan keputusan untuk memilih salah satu alternatif direduksi menjadi memaksimalkan kriteria integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Masalah utama dalam perumusan multikriteria dari masalah pengambilan keputusan adalah bahwa perlu untuk menemukan bentuk analitik dari koefisien a i dan b i , yang akan memberikan sifat-sifat model berikut:

  • tingkat kecukupan yang tinggi dari bidang studi dan sudut pandang para ahli;
  • kesulitan komputasi minimal dalam memaksimalkan kriteria integral, yaitu perhitungannya untuk alternatif yang berbeda;
  • stabilitas hasil memaksimalkan kriteria integral dari gangguan kecil dari data awal.
  • Stabilitas solusi berarti bahwa perubahan kecil pada data awal harus menyebabkan perubahan kecil dalam nilai kriteria integral, dan, dengan demikian, perubahan kecil dalam keputusan yang dibuat. Jadi, jika data awal praktis sama, maka keputusan harus dibuat sama atau sangat dekat.

Bahasa Seleksi Biner Sekuensial

Bahasa hubungan biner adalah generalisasi dari bahasa multikriteria dan didasarkan pada kenyataan bahwa ketika kita mengevaluasi beberapa alternatif, penilaian ini selalu relatif, yaitu. secara eksplisit atau lebih sering secara implisit, alternatif lain dari himpunan yang diteliti atau dari populasi umum digunakan sebagai dasar atau kerangka acuan untuk perbandingan. Pemikiran manusia didasarkan pada pencarian dan analisis yang berlawanan (konstruk), sehingga selalu lebih mudah bagi kita untuk memilih salah satu dari dua opsi yang berlawanan daripada satu opsi dari himpunan yang besar dan sama sekali tidak teratur.

Dengan demikian, asumsi utama bahasa ini bermuara pada hal berikut:

  • satu alternatif tidak dievaluasi, mis. fungsi kriteria tidak diperkenalkan;
  • untuk setiap pasangan alternatif, dapat ditentukan dengan cara tertentu bahwa salah satunya lebih disukai daripada yang lain, atau bahwa mereka setara atau tidak dapat dibandingkan;
  • hubungan preferensi dalam setiap pasangan alternatif tidak bergantung pada alternatif lain yang disajikan untuk pilihan.

Ada berbagai cara untuk menentukan hubungan biner: langsung, matriks, menggunakan grafik preferensi, metode bagian, dll.

Hubungan antara alternatif satu pasangan diekspresikan melalui konsep ekivalensi, keteraturan, dan dominasi.

Fungsi bahasa pilihan yang digeneralisasi

Bahasa fungsi pilihan didasarkan pada teori himpunan dan memungkinkan seseorang untuk beroperasi dengan pemetaan himpunan ke himpunan bagiannya yang sesuai dengan pilihan yang berbeda tanpa perlu menghitung elemen. Bahasa ini sangat umum dan berpotensi memungkinkan pilihan apa pun untuk dijelaskan. Namun, perangkat matematika fungsi pilihan umum saat ini hanya dikembangkan dan diuji terutama pada masalah yang telah diselesaikan dengan menggunakan pendekatan kriteria atau biner.

pilihan kelompok

Biarlah ada sekelompok orang yang memiliki hak untuk mengambil bagian dalam pengambilan keputusan kolektif. Misalkan kelompok ini sedang mempertimbangkan beberapa set alternatif, dan setiap anggota kelompok membuat pilihannya sendiri. Tugasnya adalah mengembangkan solusi yang dengan cara tertentu mengoordinasikan pilihan individu dan dalam arti tertentu mengungkapkan "pendapat umum" kelompok, yaitu. diambil sebagai pilihan kelompok.

Secara alami, keputusan kelompok yang berbeda akan sesuai dengan prinsip yang berbeda untuk mengoordinasikan keputusan individu.

Aturan untuk mengoordinasikan keputusan individu dalam pilihan kelompok disebut aturan pemungutan suara. Yang paling umum adalah "aturan mayoritas", di mana keputusan kelompok diambil oleh alternatif yang menerima suara terbanyak.

Harus dipahami bahwa keputusan seperti itu hanya mencerminkan prevalensi sudut pandang yang berbeda dalam kelompok, dan bukan pilihan yang benar-benar optimal, yang tidak boleh dipilih sama sekali oleh siapa pun. "Kebenaran tidak ditentukan oleh pemungutan suara."

Selain itu, ada yang disebut "paradoks pemungutan suara", yang paling terkenal adalah paradoks Arrow.

Paradoks-paradoks ini dapat menyebabkan, dan kadang-kadang memang mengarah, ke fitur yang sangat tidak menyenangkan dari prosedur pemungutan suara: misalnya, ada kasus ketika kelompok tidak dapat membuat keputusan sama sekali (tidak ada kuorum atau semua orang memberikan suara untuk opsi unik mereka sendiri, dll. .), dan terkadang ( dalam pemungutan suara bertingkat) minoritas dapat memaksakan kehendaknya pada mayoritas.

Pilihan di bawah Ketidakpastian

Kepastian adalah kasus khusus dari ketidakpastian, yaitu: ketidakpastian mendekati nol.

Dalam teori pilihan modern, diyakini bahwa ada tiga jenis ketidakpastian utama dalam masalah pengambilan keputusan:

  1. Ketidakpastian informasional (statistik) dari data awal untuk pengambilan keputusan.
  2. Ketidakpastian konsekuensi dari pengambilan keputusan (pilihan).
  3. Ketidakjelasan dalam deskripsi komponen proses pengambilan keputusan.

Mari kita pertimbangkan mereka secara berurutan.

Ketidakpastian informasi (statistik) dalam data awal

Data yang diperoleh tentang area subjek tidak dapat dianggap benar-benar akurat. Selain itu, jelas bahwa data ini tidak menarik bagi kita, tetapi hanya sebagai sinyal yang, mungkin, membawa informasi tertentu tentang apa yang benar-benar kita minati. Jadi, lebih realistis untuk mempertimbangkan bahwa kita berurusan dengan data yang tidak hanya berisik dan tidak akurat, tetapi juga tidak langsung, dan mungkin tidak lengkap. Selain itu, data ini tidak menyangkut seluruh populasi (umum) yang dipelajari, tetapi hanya sebagian tertentu darinya, yang sebenarnya dapat kami kumpulkan datanya, tetapi pada saat yang sama kami ingin menarik kesimpulan tentang seluruh populasi, dan kami juga ingin mengetahui tingkat keandalan kesimpulan ini.

Dalam kondisi ini, teori keputusan statistik digunakan.

Ada dua sumber utama ketidakpastian dalam teori ini. Pertama, tidak diketahui distribusi apa yang dipatuhi oleh data asli. Kedua, tidak diketahui distribusi apa yang memiliki himpunan (populasi umum) yang ingin kita tarik kesimpulan dari himpunan bagiannya yang membentuk data awal.

Prosedur statistik adalah prosedur pengambilan keputusan yang menghilangkan kedua jenis ketidakpastian ini.

Perlu dicatat bahwa ada sejumlah alasan yang menyebabkan penerapan metode statistik yang salah:

  • kesimpulan statistik, seperti yang lainnya, selalu memiliki keandalan atau kepastian yang pasti. Namun, tidak seperti banyak kasus lainnya, keandalan temuan statistik diketahui dan ditentukan dalam penelitian statistik;
  • kualitas solusi yang diperoleh sebagai hasil penerapan prosedur statistik tergantung pada kualitas data awal;
  • data yang tidak bersifat statistik tidak boleh diproses secara statistik;
  • perlu menggunakan prosedur statistik yang sesuai dengan tingkat informasi apriori tentang populasi yang diteliti (misalnya, Anda tidak boleh menerapkan metode analisis varians pada data non-Gaussian). Jika distribusi data asli tidak diketahui, maka seseorang harus menetapkannya, atau menggunakan beberapa metode berbeda dan membandingkan hasilnya. Jika mereka sangat berbeda, ini menunjukkan tidak dapat diterapkannya beberapa prosedur yang digunakan.

Ketidakpastian Konsekuensi

Ketika konsekuensi dari memilih alternatif secara unik ditentukan oleh alternatif itu sendiri, maka kita tidak dapat membedakan antara alternatif dan konsekuensinya, menerima begitu saja bahwa memilih alternatif, kita benar-benar memilih konsekuensinya.

Namun, dalam praktik nyata, seseorang sering kali harus menghadapi situasi yang lebih kompleks, ketika pilihan satu atau alternatif lain secara ambigu menentukan konsekuensi dari pilihan yang dibuat.

Dalam kasus satu set diskrit alternatif dan hasil pilihan mereka, asalkan himpunan hasil yang mungkin adalah umum untuk semua alternatif, kita dapat mengasumsikan bahwa alternatif yang berbeda berbeda satu sama lain dalam distribusi probabilitas hasil. Distribusi probabilitas ini, dalam kasus umum, mungkin bergantung pada hasil pilihan alternatif dan hasil yang sebenarnya terjadi sebagai akibat dari ini. Dalam kasus yang paling sederhana, hasilnya sama-sama mungkin. Hasil itu sendiri biasanya memiliki arti keuntungan atau kerugian dan diukur.

Jika hasilnya sama untuk semua alternatif, maka tidak ada yang bisa dipilih. Jika mereka berbeda, maka alternatif dapat dibandingkan dengan memperkenalkan perkiraan kuantitatif tertentu untuk mereka. Keragaman masalah dalam teori permainan dikaitkan dengan pilihan karakteristik numerik yang berbeda dari kerugian dan keuntungan sebagai akibat dari pilihan alternatif, tingkat konflik yang berbeda antara pihak yang memilih alternatif, dll.

Pertimbangkan jenis ketidakpastian ini sebagai ketidakpastian yang tidak jelas

Setiap masalah pilihan adalah penyempitan tujuan dari kumpulan alternatif. Baik deskripsi formal alternatif (daftarnya sendiri, daftar atribut atau parameternya) dan deskripsi aturan untuk perbandingannya (kriteria, hubungan) selalu diberikan dalam satu atau lain skala pengukuran (bahkan ketika orang yang apakah ini tidak tahu tentang ini).

Diketahui bahwa semua skala kabur, tetapi pada tingkat yang berbeda-beda. Istilah "kabur" mengacu pada properti timbangan, yang terdiri dari kenyataan bahwa selalu mungkin untuk menyajikan dua alternatif yang dapat dibedakan, yaitu. berbeda dalam satu skala dan tidak dapat dibedakan, yaitu identik, di sisi lain - lebih kabur. Semakin sedikit gradasi dalam skala tertentu, semakin kabur.

Dengan demikian, kita dapat dengan jelas melihat alternatif dan pada saat yang sama mengklasifikasikannya secara samar, yaitu. menjadi ambigu untuk kelas mana mereka berasal.

Sudah dalam karya pertama mereka tentang pengambilan keputusan dalam situasi kabur, Bellman dan Zadeh mengajukan gagasan bahwa tujuan dan kendala harus direpresentasikan sebagai himpunan kabur (kabur) pada serangkaian alternatif.

Pada beberapa keterbatasan pendekatan optimasi

Dalam semua masalah pemilihan dan metode pengambilan keputusan yang dipertimbangkan di atas, masalahnya adalah menemukan yang terbaik di set awal dalam kondisi tertentu, yaitu. alternatif yang optimal dalam arti tertentu.

Ide optimalitas adalah ide sentral dari sibernetika dan telah dengan kuat memasuki praktik merancang dan mengoperasikan sistem teknis. Pada saat yang sama, gagasan ini membutuhkan sikap hati-hati ketika kita mencoba mentransfernya ke bidang pengelolaan sistem yang kompleks, besar, dan ditentukan secara lemah, seperti misalnya, sistem sosial-ekonomi.

Ada alasan bagus untuk kesimpulan ini. Mari kita pertimbangkan beberapa di antaranya:

  1. Solusi optimal seringkali ternyata tidak stabil, mis. perubahan kecil dalam kondisi masalah, input data atau kendala dapat menyebabkan pemilihan alternatif yang berbeda secara signifikan.
  2. Model optimasi dikembangkan hanya untuk kelas sempit dari tugas yang cukup sederhana yang tidak selalu secara memadai dan sistematis mencerminkan objek kontrol nyata. Paling sering, metode optimasi memungkinkan untuk mengoptimalkan hanya subsistem yang cukup sederhana dan dijelaskan secara formal dari beberapa sistem besar dan kompleks, mis. memungkinkan hanya optimasi lokal. Namun, jika setiap subsistem dari beberapa sistem besar bekerja secara optimal, ini tidak berarti bahwa sistem secara keseluruhan juga akan bekerja secara optimal. Oleh karena itu, optimasi subsistem tidak selalu mengarah pada perilakunya, yang diperlukan ketika mengoptimalkan sistem secara keseluruhan. Selain itu, terkadang optimasi lokal dapat menyebabkan konsekuensi negatif bagi sistem secara keseluruhan. Oleh karena itu, ketika mengoptimalkan subsistem dan sistem secara keseluruhan, perlu untuk menentukan pohon tujuan dan subtujuan serta prioritasnya.
  3. Seringkali, memaksimalkan kriteria optimasi menurut beberapa model matematika dianggap sebagai tujuan optimasi, tetapi pada kenyataannya tujuannya adalah untuk mengoptimalkan objek kontrol. Kriteria optimasi dan model matematika selalu berhubungan dengan tujuan hanya secara tidak langsung, yaitu kurang lebih memadai, tetapi selalu mendekati.

Dengan demikian, gagasan optimalitas, yang sangat bermanfaat untuk sistem yang memungkinkan formalisasi matematis yang memadai, harus ditransfer ke sistem yang kompleks dengan hati-hati. Tentu saja, model matematika yang terkadang dapat diusulkan untuk sistem seperti itu dapat dioptimalkan. Namun, kita harus selalu mempertimbangkan penyederhanaan yang kuat dari model-model ini, yang dalam kasus sistem yang kompleks tidak dapat lagi diabaikan, serta fakta bahwa tingkat kecukupan model ini dalam kasus sistem yang kompleks sebenarnya tidak diketahui. . Oleh karena itu, tidak diketahui apa arti praktis dari pengoptimalan ini. Kepraktisan tinggi optimasi dalam sistem teknis seharusnya tidak menimbulkan ilusi bahwa itu akan sama efektifnya dalam mengoptimalkan sistem yang kompleks. Pemodelan matematika yang berarti dari sistem yang kompleks sangat sulit, perkiraan dan tidak akurat. Semakin kompleks sistemnya, semakin berhati-hati tentang ide pengoptimalannya.

Oleh karena itu, ketika mengembangkan metode kontrol untuk sistem yang kompleks, besar, dan ditentukan dengan lemah, penulis mempertimbangkan hal utama tidak hanya optimalitas pendekatan yang dipilih dari sudut pandang matematika formal, tetapi juga kecukupannya untuk tujuan dan sifat alami dari objek kontrol.

Metode Seleksi Ahli

Dalam studi sistem yang kompleks, masalah sering muncul yang, karena berbagai alasan, tidak dapat diajukan dan diselesaikan secara ketat menggunakan peralatan matematika yang dikembangkan saat ini. Dalam kasus ini, layanan pakar (analis sistem) digunakan, yang pengalaman dan intuisinya membantu mengurangi kompleksitas masalah.

Namun, harus diperhitungkan bahwa para ahli itu sendiri adalah sistem yang sangat kompleks, dan aktivitas mereka juga bergantung pada banyak kondisi eksternal dan internal. Oleh karena itu, dalam metode pengorganisasian penilaian ahli, banyak perhatian diberikan untuk menciptakan kondisi eksternal dan psikologis yang menguntungkan bagi pekerjaan para ahli.

Faktor-faktor berikut mempengaruhi pekerjaan seorang ahli:

  • tanggung jawab atas penggunaan hasil pemeriksaan;
  • mengetahui bahwa ahli lain terlibat;
  • ketersediaan informasi kontak antar ahli;
  • hubungan interpersonal para ahli (jika ada kontak informasi di antara mereka);
  • kepentingan pribadi ahli dalam hasil penilaian;
  • kualitas pribadi para ahli (harga diri, konformitas, kemauan, dll.)

Interaksi antara para ahli dapat merangsang atau menghambat aktivitas mereka. Oleh karena itu, dalam kasus yang berbeda, metode pemeriksaan yang berbeda digunakan, yang berbeda dalam sifat interaksi para ahli satu sama lain: survei dan kuesioner anonim dan terbuka, rapat, diskusi, permainan bisnis, curah pendapat, dll.

Ada berbagai metode pengolahan matematis pendapat ahli. Para ahli diminta untuk mengevaluasi berbagai alternatif baik dengan satu atau dengan sistem indikator. Selain itu, mereka diminta untuk mengevaluasi tingkat kepentingan setiap indikator ("bobot" atau "kontribusinya"). Para ahli itu sendiri juga diberi tingkat kompetensi yang sesuai dengan kontribusi mereka masing-masing terhadap pendapat kelompok yang dihasilkan.

Metode yang dikembangkan untuk bekerja dengan para ahli adalah metode "Delphi". Ide utama dari metode ini adalah bahwa kritik dan argumentasi memiliki efek menguntungkan pada ahli, jika harga dirinya tidak terpengaruh dan kondisi disediakan yang mengecualikan konfrontasi pribadi.

Harus ditekankan bahwa ada perbedaan mendasar dalam sifat penggunaan metode pakar dalam sistem pakar dan dalam pendukung keputusan. Jika dalam kasus pertama, para ahli diminta untuk memformalkan metode pengambilan keputusan, maka dalam kasus kedua - hanya keputusan itu sendiri, seperti itu.

Karena para ahli terlibat dalam implementasi fungsi-fungsi yang saat ini tidak disediakan oleh sistem otomatis sama sekali, atau dilakukan lebih buruk daripada oleh manusia, arah yang menjanjikan dalam pengembangan sistem otomatis adalah otomatisasi maksimum dari fungsi-fungsi ini.

Sistem pendukung keputusan otomatis

Seseorang selalu menggunakan asisten dalam membuat keputusan: mereka hanyalah penyedia informasi tentang objek kontrol, dan konsultan (penasihat) yang menawarkan opsi untuk keputusan dan menganalisis konsekuensinya. Orang yang membuat keputusan selalu membuatnya dalam lingkungan informasi tertentu: untuk komandan militer, ini adalah markas, untuk rektor, dewan akademik, untuk menteri, untuk kolegium.

Saat ini, infrastruktur informasi pengambilan keputusan tidak terpikirkan tanpa sistem otomatis untuk evaluasi keputusan berulang, dan terutama sistem pendukung keputusan (DDS - Sistem Pendukung Keputusan), yaitu. sistem otomatis yang dirancang khusus untuk menyiapkan informasi yang dibutuhkan seseorang untuk membuat keputusan. Pengembangan sistem pendukung keputusan dilakukan, khususnya, dalam kerangka proyek internasional yang dilakukan di bawah naungan Institut Internasional untuk Analisis Sistem Terapan di Laxenburg (Austria).

Pilihan dalam situasi nyata membutuhkan kinerja sejumlah operasi, beberapa di antaranya dilakukan lebih efisien oleh seseorang, dan lainnya oleh mesin. Kombinasi yang efektif dari keuntungan mereka dengan kompensasi kekurangan simultan diwujudkan dalam sistem pendukung keputusan otomatis.

Seseorang membuat keputusan lebih baik daripada mesin di bawah kondisi ketidakpastian, tetapi untuk membuat keputusan yang tepat, ia juga membutuhkan informasi yang memadai (lengkap dan andal) yang menjadi ciri area subjek. Namun, diketahui bahwa seseorang tidak dapat mengatasi dengan baik sejumlah besar informasi "mentah" yang belum diproses. Oleh karena itu, peran mesin dalam pendukung keputusan mungkin untuk melakukan persiapan awal informasi tentang objek kontrol dan faktor-faktor yang tidak dapat dikendalikan (lingkungan), untuk membantu melihat konsekuensi dari pengambilan keputusan tertentu, dan juga untuk menyajikan semua informasi ini secara visual. dan cara yang nyaman untuk membuat keputusan.

Dengan demikian, sistem pendukung keputusan otomatis mengkompensasi kelemahan seseorang, membebaskannya dari pemrosesan awal informasi yang rutin, dan memberinya lingkungan informasi yang nyaman di mana ia dapat menunjukkan kekuatannya dengan lebih baik. Sistem ini difokuskan tidak pada otomatisasi fungsi pembuat keputusan (dan, sebagai akibatnya, mengasingkan fungsi-fungsi ini darinya, dan karenanya tanggung jawab atas keputusan yang dibuat, yang sering kali umumnya tidak dapat diterima), tetapi pada penyediaan bantuan untuk menemukan solusi. solusi yang baik.