Definirea recunoașterii modelelor. Clasificare după cea mai apropiată medie

Sistemele vii, inclusiv oamenii, s-au confruntat în mod constant cu sarcina de a recunoaște modelele încă de la începuturile lor. În special, informațiile care provin de la organele de simț sunt procesate de creier, care, la rândul său, sortează informațiile, asigură luarea deciziilor și apoi, folosind impulsuri electrochimice, transmite semnalul necesar în continuare, de exemplu, către organele de mișcare. , care implementează acțiunile necesare. Apoi are loc o schimbare a mediului, iar fenomenele de mai sus apar din nou. Și dacă te uiți, atunci fiecare etapă este însoțită de recunoaștere.

Odată cu dezvoltarea tehnologiei informatice, a devenit posibil să se rezolve o serie de probleme care apar în procesul vieții, pentru a facilita, accelera, îmbunătăți calitatea rezultatului. De exemplu, funcționarea diferitelor sisteme de susținere a vieții, interacțiunea om-calculator, apariția sistemelor robotizate etc. Cu toate acestea, observăm că în prezent nu este posibil să se ofere un rezultat satisfăcător în unele sarcini (recunoașterea obiectelor similare cu mișcare rapidă). , text scris de mână).

Scopul lucrării: studierea istoriei sistemelor de recunoaștere a modelelor.

Indicați modificările calitative intervenite în domeniul recunoașterii modelelor, atât teoretice, cât și tehnice, indicând motivele;

Discutați despre metodele și principiile utilizate în calcul;

Dați exemple de perspective care sunt așteptate în viitorul apropiat.

1. Ce este recunoașterea modelelor?

Primele studii cu tehnologia calculatoarelor au urmat practic schema clasica de modelare matematica - model matematic, algoritm si calcul. Acestea au fost sarcinile de modelare a proceselor care au loc în timpul exploziilor bombelor atomice, de calculare a traiectoriilor balistice, de aplicații economice și de altă natură. Cu toate acestea, pe lângă ideile clasice ale acestei serii, au existat și metode bazate pe o cu totul altă natură și, așa cum a arătat practica rezolvării unor probleme, acestea au dat adesea rezultate mai bune decât soluțiile bazate pe modele matematice prea complicate. Ideea lor a fost să renunțe la dorința de a crea un model matematic exhaustiv al obiectului studiat (mai mult, adesea era practic imposibil să se construiască modele adecvate), și în schimb să se mulțumească cu răspunsul doar la întrebări specifice care ne interesează și aceste răspunsuri ar trebui căutate din considerente comune unei clase largi de probleme. Cercetările de acest fel au inclus recunoașterea imaginilor vizuale, prognozarea randamentelor, nivelurile râurilor, problema distingerii dintre acvifere și petrol, folosind date geofizice indirecte etc. Un răspuns specific la aceste sarcini era necesar într-o formă destul de simplă, cum ar fi: de exemplu, dacă un obiect aparține uneia dintre clasele prefixate. Și datele inițiale ale acestor sarcini, de regulă, au fost date sub formă de informații fragmentare despre obiectele studiate, de exemplu, sub forma unui set de obiecte preclasificate. Din punct de vedere matematic, aceasta înseamnă că recunoașterea modelelor (și această clasă de probleme a fost numită în țara noastră) este o generalizare de anvergură a ideii de extrapolare a funcției.

Importanța unei astfel de formulări pentru științele tehnice este fără îndoială, iar acest lucru în sine justifică numeroase studii în acest domeniu. Cu toate acestea, problema recunoașterii modelelor are și un aspect mai larg pentru știința naturii (cu toate acestea, ar fi ciudat dacă ceva atât de important pentru sistemele cibernetice artificiale nu ar fi important pentru cele naturale). Contextul acestei științe a inclus în mod organic întrebările puse de filozofii antici despre natura cunoștințelor noastre, capacitatea noastră de a recunoaște imagini, tipare, situații ale lumii din jurul nostru. De fapt, practic nu există nicio îndoială că mecanismele de recunoaștere a celor mai simple imagini, cum ar fi imaginile unui prădător periculos sau hrană care se apropie, s-au format mult mai devreme decât a apărut limbajul elementar și aparatul logic formal. Și nu există nicio îndoială că astfel de mecanisme sunt suficient de dezvoltate și la animalele superioare, care, în activitatea lor vitală, au nevoie urgentă și de capacitatea de a distinge un sistem destul de complex de semne ale naturii. Astfel, în natură, vedem că fenomenul gândirii și conștiinței se bazează în mod clar pe capacitatea de a recunoaște tipare, iar progresul ulterioar al științei inteligenței este direct legat de profunzimea înțelegerii legilor fundamentale ale recunoașterii. Înțelegând faptul că întrebările de mai sus depășesc cu mult definiția standard a recunoașterii modelelor (în literatura engleză, termenul de învățare supervizată este mai frecvent), este de asemenea necesar să înțelegem că au legături profunde cu acest lucru relativ îngust (dar încă departe). din epuizat) direcţie.

Chiar și acum, recunoașterea modelelor a intrat ferm în viața de zi cu zi și este una dintre cele mai vitale cunoștințe ale unui inginer modern. În medicină, recunoașterea modelelor îi ajută pe medici să facă diagnostice mai precise; în fabrici, este folosită pentru a prezice defectele în loturile de mărfuri. Sistemele biometrice de identificare personală ca nucleu algoritmic se bazează, de asemenea, pe rezultatele acestei discipline. Dezvoltarea ulterioară a inteligenței artificiale, în special proiectarea computerelor de generația a cincea capabile să comunice mai direct cu o persoană în limbi naturale pentru oameni și prin vorbire, este de neconceput fără recunoaștere. Aici, robotica, sistemele de control artificial care conțin sisteme de recunoaștere ca subsisteme vitale, sunt la îndemână.

De aceea, s-a acordat multă atenție dezvoltării recunoașterii modelelor încă de la început de către specialiști de diverse profiluri - cibernetică, neurofiziologi, psihologi, matematicieni, economiști etc. În mare parte din acest motiv, recunoașterea modernă a modelelor în sine se hrănește cu ideile acestor discipline. Fără a pretinde că este complet (și este imposibil să o pretindem într-un scurt eseu), vom descrie istoria recunoașterii modelelor, idei cheie.

Definiții

Înainte de a trece la principalele metode de recunoaștere a modelelor, dăm câteva definiții necesare.

Recunoașterea imaginilor (obiecte, semnale, situații, fenomene sau procese) este sarcina de a identifica un obiect sau de a determina oricare dintre proprietățile acestuia prin imagine (recunoaștere optică) sau înregistrare audio (recunoaștere acustică) și alte caracteristici.

Una dintre cele de bază este conceptul de set care nu are o formulare specifică. Într-un computer, o mulțime este reprezentată de un set de elemente nerepetate de același tip. Cuvântul „nerepetă” înseamnă că un element din set fie este acolo, fie nu este acolo. Multimea universala cuprinde toate elementele posibile pentru problema rezolvata, multimea goala nu contine niciuna.

O imagine este o grupare de clasificare în sistemul de clasificare care unește (separează) un anumit grup de obiecte în funcție de un anumit atribut. Imaginile au o proprietate caracteristică, care se manifestă prin faptul că cunoașterea unui număr finit de fenomene din același set face posibilă recunoașterea unui număr arbitrar de mare a reprezentanților săi. Imaginile au proprietăți obiective caracteristice, în sensul că diferiți oameni care învață din material de observație diferit, în cea mai mare parte, clasifică aceleași obiecte în același mod și independent unul de celălalt. În formularea clasică a problemei recunoașterii, mulțimea universală este împărțită în părți-imagini. Fiecare mapare a oricărui obiect la organele de percepție ale sistemului de recunoaștere, indiferent de poziția sa față de aceste organe, este de obicei numită o imagine a obiectului, iar seturile de astfel de imagini, unite prin unele proprietăți comune, sunt imagini.

Metoda de atribuire a unui element oricărei imagini se numește regulă de decizie. Un alt concept important este metrica, o modalitate de a determina distanța dintre elementele unui set universal. Cu cât această distanță este mai mică, cu atât sunt mai asemănătoare obiectele (simboluri, sunete etc.) pe care le recunoaștem. De obicei, elementele sunt specificate ca un set de numere, iar metrica este specificată ca o funcție. Eficiența programului depinde de alegerea reprezentării imaginilor și de implementarea metricii, un algoritm de recunoaștere cu metrici diferite va face greșeli cu frecvențe diferite.

Învățarea este de obicei numită proces de dezvoltare într-un sistem a unei anumite reacții la grupuri de semnale externe identice prin influențarea în mod repetat a sistemului de corecție extern. O astfel de ajustare externă în antrenament este de obicei numită „încurajare” și „pedeapsă”. Mecanismul de generare a acestei ajustări determină aproape complet algoritmul de învățare. Auto-învățarea diferă de învățare prin aceea că aici nu sunt raportate informații suplimentare despre corectitudinea reacției la sistem.

Adaptarea este un proces de modificare a parametrilor și structurii sistemului, eventual și a acțiunilor de control, pe baza informațiilor curente, pentru a atinge o anumită stare a sistemului cu incertitudine inițială și condiții de funcționare în schimbare.

Învățarea este un proces, în urma căruia sistemul dobândește treptat capacitatea de a răspunde cu reacțiile necesare la anumite seturi de influențe externe, iar adaptarea este ajustarea parametrilor și structurii sistemului pentru a atinge calitatea necesară a controlul în condiţii de schimbări continue ale condiţiilor externe.

Exemple de sarcini de recunoaștere a modelelor: - Recunoașterea literelor;

Cursul numărul 17.METODE DE RECUNOAȘTERE A MODELULUI

Există următoarele grupuri de metode de recunoaștere:

Metode ale funcției de proximitate

Metode cu funcții discriminante

Metode statistice de recunoaștere.

Metode lingvistice

metode euristice.

Primele trei grupe de metode sunt axate pe analiza caracteristicilor exprimate prin numere sau vectori cu componente numerice.

Grupul de metode lingvistice oferă recunoaștere a modelelor pe baza analizei structurii lor, care este descrisă de caracteristicile structurale corespunzătoare și relațiile dintre ele.

Grupul de metode euristice combină tehnicile caracteristice și procedurile logice utilizate de oameni în recunoașterea modelelor.

Metode ale funcției de proximitate

Metodele acestui grup se bazează pe utilizarea funcțiilor care evaluează măsura proximității dintre imaginea recognoscibilă cu vectorul X * = (X * 1 ,….,x*n), și imagini de referință ale diferitelor clase, reprezentate prin vectori x i = (x i 1 ,…, x i n), i= 1,…,N, Unde eu- numărul clasei de imagine.

Procedura de recunoaștere conform acestei metode constă în calcularea distanței dintre punctul imaginii recunoscute și fiecare dintre punctele reprezentând imaginea de referință, i.e. în calculul tuturor valorilor d i , i= 1,…,N. Imaginea aparține clasei pentru care valoarea d i are cea mai mică valoare dintre toate i= 1,…,N .

O funcție care mapează fiecare pereche de vectori x i, X * un număr real ca măsură a apropierii lor, i.e. determinarea distanței dintre ele poate fi destul de arbitrară. În matematică, o astfel de funcție se numește metrica spațiului. Trebuie să satisfacă următoarele axiome:

r(X y)=r(y,x);

r(X y) > 0 dacă X nu este egal yși r(X y)=0 dacă x=y;

r(X y) <=r(x,z)+r(z,y)

Aceste axiome sunt îndeplinite, în special, de următoarele funcții

un i= 1/2 , j=1,2,…n.

b i= suma, j=1,2,…n.

c i=abdominali max( x ix j *), j=1,2,…n.

Prima dintre acestea se numește norma euclidiană a unui spațiu vectorial. În consecință, spațiile în care funcția specificată este utilizată ca metrică se numesc spațiu euclidian.

Adesea, diferența pătratică medie a coordonatelor imaginii recunoscute este aleasă ca funcție de proximitate X *și standard x i, adică funcţie

d i = (1/n) suma( x i jx j *) 2 , j=1,2,…n.

Valoare d i interpretat geometric ca pătratul distanței dintre punctele din spațiul caracteristic, raportat la dimensiunea spațiului.

Se dovedește adesea că diferitele caracteristici nu sunt la fel de importante în recunoaștere. Pentru a ține cont de această împrejurare la calcularea funcțiilor de proximitate ale diferenței de coordonate, caracteristicile corespunzătoare mai importante sunt înmulțite cu coeficienți mari, iar cele mai puțin importante cu coeficienți mai mici.

În acest caz d i = (1/n) suma wj (x i jx j *) 2 , j=1,2,…n,

Unde wj- coeficienți de greutate.

Introducerea coeficienților de greutate este echivalentă cu scalarea axelor spațiului caracteristic și, în consecință, întinderea sau comprimarea spațiului în direcții separate.

Aceste deformații ale spațiului caracteristic urmăresc scopul unei astfel de plasări a punctelor de imagini de referință, care corespunde recunoașterii celei mai fiabile în condițiile unei împrăștieri semnificative de imagini din fiecare clasă în vecinătatea punctului imaginii de referință.

Grupurile de puncte de imagine apropiate unele de altele (clustere de imagini) în spațiul caracteristic sunt numite clustere, iar problema identificării unor astfel de grupuri se numește problema grupării.

Sarcina de identificare a clusterelor este denumită sarcini de recunoaștere a modelelor nesupravegheate, de exemplu. la probleme de recunoaştere în lipsa unui exemplu de recunoaştere corectă.

Metode cu funcții discriminante

Ideea metodelor acestui grup este de a construi funcții care definesc limite în spațiul imaginilor, împărțind spațiul în regiuni corespunzătoare claselor de imagini. Cele mai simple și mai frecvent utilizate funcții de acest fel sunt funcțiile care depind liniar de valorile caracteristicilor. În spațiul caracteristic, ele corespund suprafețelor de separare sub formă de hiperplane. În cazul unui spațiu caracteristic bidimensional, o linie dreaptă acționează ca o funcție de separare.

Forma generală a funcției de decizie liniară este dată de formula

d(X)=w 1 X 1 + w 2 X 2 +…+w n x n +w n +1 = Wx+w n

Unde X- vector imagine, w=(w 1 , w 2 ,…w n) este vectorul coeficienților de greutate.

Când este împărțit în două clase X 1 și X 2 funcție discriminantă d(x) permite recunoașterea conform regulii:

X aparține X 1 dacă d(X)>0;

X aparține X 2 dacă d(X)<0.

În cazul în care un d(X)=0, atunci are loc cazul incertitudinii.

În cazul împărțirii în mai multe clase se introduc mai multe funcții. În acest caz, fiecare clasă de imagini este asociată cu o anumită combinație de semne de funcții de discriminare.

De exemplu, dacă sunt introduse trei funcții discriminante, este posibilă următoarea variantă de selectare a claselor de imagini:

X aparține X 1 dacă d 1 (X)>0,d 2 (X)<0,d 3 (X)<0;

X aparține X 2 dacă d(X)<0,d 2 (X)>0,d 3 (X)<0;

X aparține X 3 dacă d(X)<0,d 2 (X)<0,d 3 (X)>0.

Se presupune că pentru alte combinaţii de valori d 1 (X),d 2 (X),d 3 (X) există un caz de incertitudine.

O variație a metodei funcțiilor discriminante este metoda funcțiilor decisive. În el, dacă este disponibil m se presupune că există clase m funcții d i(X), numit decisiv, astfel încât dacă X aparține X i, apoi d i(X) > d j(X) pentru toți j nu este egal i,acestea. funcţie decisivă d i(X) are valoarea maximă dintre toate funcțiile d j(X), j=1,...,n..

O ilustrare a unei astfel de metode poate fi un clasificator bazat pe o estimare a minimului distanței euclidiene în spațiul caracteristic dintre punctul de imagine și standard. Să o arătăm.

Distanța euclidiană dintre vectorul caracteristic al imaginii recognoscibile X iar vectorul imaginii de referință este determinat de formula || x iX|| = 1/2 , j=1,2,…n.

Vector X vor fi repartizate clasei i, pentru care valoarea || x iX *|| minim.

În loc de distanță, puteți compara pătratul distanței, adică

||x iX|| 2 = (x iX)(x iX) t = X X- 2X x i +x i x i

Din moment ce valoarea X X la fel pentru toată lumea i, minimul funcției || x iX|| 2 va coincide cu maximul funcţiei de decizie

d i(X) = 2X x i -x i x i.

adică X aparține X i, dacă d i(X) > d j(X) pentru toți j nu este egal i.

Acea. mașina de clasificare a distanței minime se bazează pe funcții de decizie liniare. Structura generală a unei astfel de mașini folosește funcții de decizie ale formei

d i (X)=w i 1 X 1 + w i 2 X 2 +…+w în x n +victorie +1

Poate fi reprezentat vizual prin diagrama bloc corespunzătoare.

Pentru o mașină care realizează clasificarea în funcție de distanța minimă, au loc egalitățile: w ij = -2x i j , victorie +1 = x i x i.

Recunoașterea echivalentă prin metoda funcțiilor discriminante poate fi efectuată dacă funcțiile discriminante sunt definite ca diferențe dij (X)=d i (X)‑d j (X).

Avantajul metodei funcțiilor discriminante este structura simplă a mașinii de recunoaștere, precum și posibilitatea implementării acesteia în principal prin blocuri de decizie predominant liniare.

Un alt avantaj important al metodei funcțiilor discriminante este posibilitatea antrenării automate a mașinii pentru recunoașterea corectă a unui eșantion dat (de antrenament) de imagini.

În același timp, algoritmul de învățare automată se dovedește a fi foarte simplu în comparație cu alte metode de recunoaștere.

Din aceste motive, metoda funcțiilor discriminante a câștigat o mare popularitate și este adesea folosită în practică.

Proceduri de auto-învățare de recunoaștere a modelelor

Luați în considerare metodele de construire a unei funcții discriminante dintr-un eșantion dat (de antrenament) așa cum sunt aplicate problemei împărțirii imaginilor în două clase. Dacă sunt date două seturi de imagini care aparțin claselor A și respectiv B, atunci se caută soluția problemei construirii unei funcții discriminante liniare sub forma unui vector de coeficienți de greutate. W=(w 1 ,w 2 ,...,w n,w n+1), care are proprietatea ca pentru orice imagine sunt conditiile

X aparține clasei A dacă >0, j=1,2,…n.

X aparține clasei B dacă<0, j=1,2,…n.

Dacă eșantionul de antrenament este N imagini ale ambelor clase, problema se reduce la găsirea unui vector w care să asigure validitatea sistemului de inegalități.Dacă eșantionul de antrenament este format din N imagini ale ambelor clase, problema se reduce la găsirea vectorului w, care asigură valabilitatea sistemului de inegalităţi

X 1 1 w i+X 21 w 2 +...+x n 1 w n+w n +1 >0;

X 1 2 w i+X 22 w 2 +...+x n 2 w n+w n +1 <0;

X 1 iw i+X 2i w 2 +...+x ni w n+w n +1 >0;

................................................

X 1 Nw i +x 2N w 2 +...+x nN w n +w n + 1>0;

Aici x i=(x i 1 ,x i 2 ,...,x i n ,x i n+ 1 ) - vectorul valorilor caracteristicilor imaginii din proba de antrenament, semnul > corespunde vectorilor imaginilor X aparținând clasei A, și semnul< - векторам X aparținând clasei B.

Vectorul dorit w există dacă clasele A și B sunt separabile și nu există altfel. Valorile componentelor vectoriale w poate fi găsit fie în prealabil, în etapa premergătoare implementării hardware a SRO, fie direct de către SRO însuși în cursul funcționării acestuia. Ultima dintre aceste abordări oferă o mai mare flexibilitate și autonomie SRO. Luați în considerare exemplul unui dispozitiv numit percentron. inventat în 1957 de omul de știință american Rosenblatt. O reprezentare schematică a percentronului, care asigură că imaginea este atribuită uneia dintre cele două clase, este prezentată în figura următoare.

Retină S Retină A Retină R

oh oh X 1

oh oh X 2

oh oh X 3

o(suma)-------> R(reacţie)

oh oh x i

oh oh x n

oh oh x n +1

Dispozitivul este format din elemente senzoriale retiniene S, care sunt conectate aleatoriu la elementele asociative ale retinei A. Fiecare element al celei de-a doua retine produce un semnal de ieșire numai dacă un număr suficient de elemente senzoriale conectate la intrarea sa se află într-o stare excitată. Răspunsul întregului sistem R este proporţională cu suma reacţiilor elementelor retinei asociative luate cu anumite greutăţi.

Indicând prin x i reacţie i al-lea element asociativ și prin w i- coeficientul greutăţii de reacţie i elementul asociativ, reacția sistemului poate fi scrisă ca R=sumă( w j x j), j=1,..,n. În cazul în care un R>0, atunci imaginea prezentată sistemului aparține clasei A, iar dacă R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений X 1 , X 2 ,...,x n corespunde unui anumit algoritm pentru formarea caracteristicilor pe baza semnalelor senzorilor primari.

În general, pot exista mai multe elemente R, care formează reacția perceptronului. În acest caz, se vorbește despre prezența retinei în perceptron R elemente de reacție.

Schema percentron poate fi extinsă și în cazul în care numărul de clase este mai mare de două, prin creșterea numărului de elemente retiniene R până la numărul de clase distincte și introducerea unui bloc pentru determinarea reacției maxime în conformitate cu schema prezentată în figura de mai sus. În acest caz, imaginea este atribuită clasei cu numărul i, dacă R i>Rj, pentru toți j.

Procesul de învățare a percentronului constă în selectarea valorilor coeficienților de greutate wj astfel încât semnalul de ieșire să corespundă clasei căreia îi aparține imaginea recunoscută.

Să luăm în considerare algoritmul de acțiune percentron folosind exemplul de recunoaștere a obiectelor din două clase: A și B. Obiectele clasei A trebuie să corespundă valorii R= +1, iar clasa B - valoarea R= -1.

Algoritmul de învățare este următorul.

Dacă altă imagine X aparține clasei A, dar R<0 (имеет место ошибка распознавания), тогда коэффициенты wj cu indici corespunzători valorilor x j>0, crește cu o anumită sumă dw, și restul coeficienților wj scade cu dw. În acest caz, valoarea reacției R primește o creștere către valorile sale pozitive corespunzătoare clasificării corecte.

În cazul în care un X aparține clasei B, dar R>0 (există o eroare de recunoaștere), apoi coeficienții wj cu indici corespunzători x j<0, увеличивают на dw, și restul coeficienților wj redus cu aceeași sumă. În acest caz, valoarea reacției R este incrementat către valori negative corespunzătoare clasificării corecte.

Algoritmul introduce astfel o modificare a vectorului de greutate w dacă și numai dacă imaginea prezentată la k-al-lea pas de antrenament, a fost clasificat incorect în timpul acestui pas și părăsește vectorul greutate w nicio modificare în cazul clasificării corecte. Dovada convergenței acestui algoritm este prezentată în [Too, Gonzalez]. Un astfel de antrenament va fi în cele din urmă (cu alegerea corectă dwși separabilitatea liniară a claselor de imagini) conduce la un vector w pentru o clasificare corectă.

Metode statistice de recunoaștere.

Metodele statistice se bazează pe minimizarea probabilității unei erori de clasificare. Probabilitatea P de clasificare incorectă a imaginii primite pentru recunoaștere, descrisă de vectorul caracteristic X, este determinat de formula

P = suma[ p(i)prob( D(X)+i | X clasă i)]

Unde m- numărul de clase,

p(i) = sonda ( X aparține clasei i) - probabilitate a priori de apartenență la o imagine arbitrară X la i-a clasa (frecvența de apariție a imaginilor i clasa a-a),

D(X) este o funcție care ia o decizie de clasificare (vectorul caracteristic X se potrivește cu numărul clasei i din set (1,2,..., m}),

prob( D(X) nu este egal i| X aparține clasei i) este probabilitatea evenimentului" D(X) nu este egal i„ când condiția de membru este îndeplinită X clasă i, adică probabilitatea de a lua o decizie eronată de către funcţie D(X) pentru o valoare dată X detinut de i- clasa a-a.

Se poate arăta că probabilitatea de clasificare greșită atinge un minim dacă D(X)=i dacă și numai dacă p(X|ip(i)>p(x|jp(j), pentru toți i+j, Unde p(x|i) - densitatea de distribuție a imaginilor i clasa a-a în spațiul de caracteristici.

Conform regulii de mai sus, punctul X aparține clasei care corespunde valorii maxime p(i) p(x|i), adică produsul probabilității (frecvenței) a priori de apariție a imaginilor i-a clasa și densitatea distribuției modelului i clasa a-a în spațiul de caracteristici. Regula de clasificare prezentată se numește bayesian, deoarece rezultă din binecunoscuta formulă Bayes în teoria probabilităţilor.

Exemplu. Să fie necesară recunoașterea semnalelor discrete la ieșirea unui canal de informații afectat de zgomot.

Fiecare semnal de intrare este 0 sau 1. Ca rezultat al transmiterii semnalului, la ieșirea canalului apare valoarea X, care este suprapus cu zgomotul gaussian cu medie zero și varianță b.

Pentru sinteza unui clasificator care realizează recunoașterea semnalului, vom folosi regula de clasificare bayesiană.

În clasa nr. 1 combinăm semnalele reprezentând unități, în clasa nr. 2 - semnale reprezentând zerouri. Să se știe dinainte că, în medie, din 1000 de semnale A semnalele sunt unităţi şi b semnale - zerouri. Apoi, valorile probabilităților a priori de apariție a semnalelor din clasa I și a II-a (unuri și, respectiv, zerouri), pot fi luate egale cu

p(1)=a/1000, p(2)=b/1000.

pentru că zgomotul este gaussian, i.e. respectă legea distribuției normale (Gauss), apoi densitatea distribuției imaginilor din prima clasă, în funcție de valoarea X, sau, care este aceeași, probabilitatea de a obține valoarea de ieșire X când semnalul 1 este aplicat la intrare, acesta este determinat de expresie

p(X¦1) =(2pib) -1/2 exp(-( X-1) 2 /(2b 2)),

iar densitatea distribuţiei în funcţie de valoare X imagini din clasa a doua, i.e. probabilitatea obţinerii valorii de ieşire X când se aplică un semnal 0 la intrare, acesta este determinat de expresie

p(X¦2)= (2pib) -1/2 exp(- X 2 /(2b 2)),

Aplicarea regulii de decizie bayesiană duce la concluzia că se transmite un semnal de clasa 2, adică. a trecut de zero dacă

p(2) p(X¦2) > p(1) p(X¦1)

sau, mai precis, dacă

b exp(- X 2 /(2b 2)) > A exp(-( X-1) 2 /(2b 2)),

Împărțind partea stângă a inegalității la partea dreaptă, obținem

(b/A)exp((1-2 X)/(2b 2)) >1,

de unde, după ce luăm logaritmul, aflăm

1-2X> 2b 2 ln(a/b)

X< 0.5 - б 2 ln(a/b)

Din inegalitatea rezultată rezultă că a=b, adică cu aceleași probabilități a priori de apariție a semnalelor 0 și 1, imaginii i se atribuie valoarea 0 atunci când X<0.5, а значение 1, когда X>0.5.

Dacă se știe dinainte că unul dintre semnale apare mai des, iar celălalt mai rar, adică. în cazul unor valori diferite Ași b, pragul de răspuns al clasificatorului este deplasat într-o parte sau cealaltă.

Deci la a/b=2,71 (corespunzător unei transmisii de 2,71 ori mai frecvente a celor) și b 2 =0,1, imaginii i se atribuie valoarea 0 dacă X<0.4, и значение 1, если X>0,4. Dacă nu există informații despre probabilitățile de distribuție a priori, atunci pot fi utilizate metode de recunoaștere statistică, care se bazează pe alte reguli de clasificare decât Bayesian.

Cu toate acestea, în practică, metodele bazate pe regulile lui Bayes sunt cele mai frecvente datorită eficienței lor mai mari și, de asemenea, datorită faptului că în majoritatea problemelor de recunoaștere a modelelor este posibil să se stabilească probabilități a priori pentru apariția imaginilor fiecărei clase.

Metode lingvistice de recunoaștere a modelelor.

Metodele lingvistice de recunoaștere a modelelor se bazează pe analiza descrierii unei imagini idealizate, reprezentată ca un grafic sau un șir de simboluri, care este o frază sau o propoziție dintr-o anumită limbă.

Luați în considerare imaginile idealizate ale literelor obținute ca urmare a primei etape de recunoaștere lingvistică descrisă mai sus. Aceste imagini idealizate pot fi definite prin descrieri ale graficelor, reprezentate, de exemplu, sub formă de matrice de conexiune, așa cum sa făcut în exemplul de mai sus. Aceeași descriere poate fi reprezentată printr-o frază (expresie) de limbă formală.

Exemplu. Să fie date trei imagini ale literei A obţinute ca rezultat al prelucrării preliminare a imaginii. Să desemnăm aceste imagini cu identificatorii A1, A2 și A3.

Pentru descrierea lingvistică a imaginilor prezentate, folosim PDL (Picture Description Language). Dicționarul de limbă PDL include următoarele caractere:

1. Numele celor mai simple imagini (primitive). După cum se aplică în cazul în cauză, primitivele și denumirile lor corespunzătoare sunt după cum urmează.

Imagini sub formă de linie direcționată:

sus și stânga (le F t), la nord (nord)), sus și la dreapta (dreapta), la est (est)).

Nume: L, N, R, E.

2. Simboluri ale operaţiilor binare. (+,*,-) Sensul lor corespunde conexiunii secvenţiale a primitivelor (+), conexiunii începuturilor şi terminaţiilor primitivelor (*), conexiunii numai a terminaţiilor primitivelor (-).

3. Paranteze dreapta și stânga. ((,)) Parantezele vă permit să specificați ordinea în care operațiile vor fi efectuate într-o expresie.

Imaginile considerate A1, A2 și A3 sunt descrise în limbajul PDL, respectiv, prin următoarele expresii.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

După ce s-a construit descrierea lingvistică a imaginii, este necesar să analizăm, folosind o anumită procedură de recunoaștere, dacă imaginea dată aparține clasei care ne interesează (clasa literelor A), adică. indiferent dacă această imagine are sau nu o structură. Pentru a face acest lucru, în primul rând, este necesar să descriem clasa de imagini care au structura de interes pentru noi.

Evident, litera A conține întotdeauna următoarele elemente structurale: „piciorul” stâng, „piciorul” drept și capul. Să numim aceste elemente respectiv STL, STR, TR.

Apoi, în limbajul PDL, clasa de simbol A - SIMB A este descrisă prin expresie

SIMB A = STL + TR - STR

„Piciorul” stâng al STL este întotdeauna un lanț de elemente R și N, care pot fi scrise ca

STL ‑> R ¦ N ¦ (STL + R) ¦ (STL + N)

(STL este caracterul R sau N, sau un șir obținut prin adăugarea de caractere R sau N la șirul STL sursă)

„Piciorul” drept al STR este întotdeauna un lanț de elemente L și N, care poate fi scris după cum urmează, i.e.

STR ‑> L¦N¦ (STR + L)¦(STR + N)

Partea de cap a literei - TR este un contur închis, compus din elementul E și lanțuri precum STL și STR.

În limbajul PDL, structura TR este descrisă de expresie

TR ‑> (STL - STR) * E

În cele din urmă, obținem următoarea descriere a clasei de litere A:

SIMB A ‑> (STL + TR - STR),

STL ‑> R¦N¦ (STL + R)¦(STL + N)

STR ‑> L¦N¦ (STR + L)¦(STR + N)

TR ‑> (STL - STR) * E

Procedura de recunoaștere în acest caz poate fi implementată după cum urmează.

1. Se compară expresia corespunzătoare imaginii cu structura de referință STL + TR - STR.

2. Fiecare element al structurii STL, TR, STR, dacă este posibil, i.e. dacă descrierea imaginii este comparabilă cu standardul, se potrivește o subexpresie din expresia T(A). De exemplu,

pentru A1: STL=R, STR=L, TR=(R-(L+N))*E

pentru A2: STL = R + N, STR = L, TR = ((N + R) - L) * E

pentru A3: STL = N + R, STR = L + N, TR = (R - L) * E 3.

Expresiile STL, STR, TR sunt comparate cu structurile de referință corespunzătoare.

4. Dacă structura fiecărei expresii STL, STR, TR corespunde celei de referință, se ajunge la concluzia că imaginea aparține clasei de litere A. Dacă la oricare dintre etapele 2, 3, 4 există o discrepanță între structura din expresia analizată și referința, se ajunge la concluzia că imaginea nu aparține clasei SIMB A. Potrivirea structurii expresiei se poate face folosind limbajele algoritmice LISP, PLANER, PROLOG și alte limbaje similare de inteligență artificială.

În exemplul luat în considerare, toate șirurile STL sunt formate din N și R caractere, iar șirurile STR sunt formate din L și N caractere, ceea ce corespunde structurii date a acestor șiruri. Structura TR din imaginile luate în considerare corespunde și celei de referință, întrucât constă în „diferență” de șiruri de tip STL, STR, „înmulțite” cu simbolul E.

Astfel, ajungem la concluzia că imaginile luate în considerare aparțin clasei SIMB A.


Sinteza controlerului de acţionare electrică DC fuzzyîn mediul „MatLab”.

Sinteza unui controler fuzzy cu o singură intrare și o ieșire.

Problema este ca unitatea să urmărească cu acuratețe diferitele intrări. Dezvoltarea acțiunii de control este realizată de un controler fuzzy, în care se pot distinge structural următoarele blocuri funcționale: fuzzifier, rule block și defuzzifier.

Fig.4 Diagrama funcțională generalizată a unui sistem cu două variabile lingvistice.

Fig.5 Diagrama schematică a unui controler fuzzy cu două variabile lingvistice.

Algoritmul de control fuzzy în cazul general este o transformare a variabilelor de intrare ale controlerului fuzzy în variabilele sale de ieșire folosind următoarele proceduri interconectate:

1. transformarea variabilelor fizice de intrare primite de la senzorii de măsurare de la obiectul de control în variabile lingvistice de intrare ale unui controler fuzzy;

2. prelucrarea enunţurilor logice, numite reguli lingvistice, privind variabilele lingvistice de intrare şi de ieşire ale controlorului;

3. transformarea variabilelor lingvistice de ieșire ale controlerului fuzzy în variabile de control fizic.

Să luăm mai întâi în considerare cel mai simplu caz, când sunt introduse doar două variabile lingvistice pentru a controla servomotor:

„unghi” - variabilă de intrare;

„acțiune de control” - variabilă de ieșire.

Vom sintetiza controlerul în mediul MatLab folosind caseta de instrumente Fuzzy Logic. Vă permite să creați sisteme fuzzy de inferență și clasificare în mediul MatLab, cu posibilitatea de a le integra în Simulink. Conceptul de bază al casetei de instrumente Fuzzy Logic este structura FIS - Fuzzy Inference System. Structura FIS conține toate datele necesare pentru implementarea mapării funcționale „input-outputs” bazată pe inferență logică fuzzy conform schemei prezentate în fig. 6.


Figura 6. Inferență neclară.

X - vector clar de intrare; - vector de mulţimi fuzzy corespunzător vectorului de intrare X;
- rezultatul inferenței logice sub forma unui vector de mulțimi fuzzy; Y - vector crisp de ieșire.

Modulul fuzzy vă permite să construiți sisteme fuzzy de două tipuri - Mamdani și Sugeno. În sistemele de tip Mamdani, baza de cunoștințe este formată din reguli de formă „Dacă x 1 = scăzut și x 2 = mediu, atunci y = ridicat”. În sistemele de tip Sugeno, baza de cunoștințe constă din reguli de formă „Dacă x 1 = scăzut și x 2 = mediu, atunci y = a 0 + a 1 x 1 + a 2 x 2 ". Astfel, principala diferență dintre sistemele Mamdani și Sugeno constă în diferitele moduri de setare a valorilor variabilei de ieșire în regulile care formează baza de cunoștințe. În sistemele de tip Mamdani, valorile variabilei de ieșire sunt date prin termeni fuzzy, în sistemele de tip Sugeno - ca o combinație liniară de variabile de intrare. În cazul nostru, vom folosi sistemul Sugeno, deoarece se pretează mai bine la optimizare.

Pentru controlul servomotorului sunt introduse două variabile lingvistice: „eroare” (prin poziție) și „acțiune de control”. Primul dintre ele este intrarea, al doilea este ieșirea. Să definim un set de termeni pentru variabilele specificate.

Componentele principale ale inferenței fuzzy. Fuzzifier.

Pentru fiecare variabilă lingvistică, definim un set de termeni de bază al formei, care include seturi fuzzy care pot fi desemnate: negativ mare, negativ scăzut, zero, pozitiv scăzut, pozitiv ridicat.

În primul rând, să definim subiectiv ce se înțelege prin termenii „eroare mare”, „eroare mică”, etc., definind funcțiile de membru pentru mulțimile fuzzy corespunzătoare. Aici, deocamdată, cineva poate fi ghidat doar de precizia necesară, de parametri cunoscuți pentru clasa de semnale de intrare și de bunul simț. Până acum, nimeni nu a putut oferi vreun algoritm rigid pentru alegerea parametrilor funcțiilor de membru. În cazul nostru, variabila lingvistică „eroare” va arăta astfel.

Fig.7. Variabila lingvistică „eroare”.

Este mai convenabil să reprezentați variabila lingvistică „management” sub forma unui tabel:

tabelul 1

Blocarea regulilor.

Luați în considerare succesiunea definirii mai multor reguli care descriu unele situații:

Să presupunem, de exemplu, că unghiul de ieșire este egal cu semnalul de intrare (adică, eroarea este zero). Evident, aceasta este situația dorită și, prin urmare, nu trebuie să facem nimic (acțiunea de control este zero).

Acum luați în considerare un alt caz: eroarea de poziție este mult mai mare decât zero. Desigur, trebuie să o compensăm prin generarea unui semnal mare de control pozitiv.

Acea. au fost elaborate două reguli, care pot fi definite formal după cum urmează:

dacă eroare = nul, apoi actiune de control = zero.

dacă eroare = mare pozitiv, apoi actiune de control = mare pozitiv.

Fig.8. Formarea controlului cu o mică eroare pozitivă în poziție.

Fig.9. Formarea controlului la eroare zero după poziție.

Tabelul de mai jos prezintă toate regulile corespunzătoare tuturor situațiilor pentru acest caz simplu.

masa 2

În total, pentru un controler fuzzy cu n intrări și 1 ieșire, pot fi determinate reguli de control, unde este numărul de seturi fuzzy pentru intrarea i-a, dar pentru funcționarea normală a controlerului nu este necesar să se utilizeze toate posibilele reguli, dar te poți descurca cu un număr mai mic dintre ele. În cazul nostru, toate cele 5 reguli posibile sunt folosite pentru a forma un semnal de control neclar.

Defuzzifier.

Astfel, impactul rezultat U va fi determinat în funcție de implementarea oricărei reguli. Dacă apare o situație când sunt executate mai multe reguli simultan, atunci acțiunea rezultată U se găsește conform următoarei relații:

, unde n este numărul de reguli declanșate (defuzzificare prin metoda centrului zonei), u n este valoarea fizică a semnalului de control corespunzător fiecăruia dintre seturile fuzzy UBO, UMo, UZ, UMp, UBP. mUn(u) este gradul de apartenență a semnalului de control u la mulțimea fuzzy corespunzătoare Un=( UBO, UMo, UZ, UMp, UBP). Există și alte metode de defuzzificare când variabila lingvistică de ieșire este proporțională cu regula „puternică” sau „slabă” în sine.

Să simulăm procesul de control al acționării electrice folosind controlerul fuzzy descris mai sus.

Fig.10. Schema bloc a sistemului din mediumatlab.

Fig.11. Diagrama structurală a unui controler fuzzy în mediumatlab.

Fig.12. Proces tranzitoriu într-un singur pas.

Orez. 13. Proces tranzitoriu sub intrare armonică pentru un model cu un controler fuzzy care conține o variabilă lingvistică de intrare.

O analiză a caracteristicilor unui drive cu un algoritm de control sintetizat arată că acestea sunt departe de a fi optime și mai proaste decât în ​​cazul sintezei controlului prin alte metode (prea mult timp de control cu ​​un efect de un singur pas și o eroare cu unul armonic) . Acest lucru se explică prin faptul că parametrii funcțiilor de membru au fost aleși destul de arbitrar și doar amploarea erorii de poziție a fost folosită ca intrări ale controlerului. Desigur, nu se poate vorbi de vreo optimitate a controlerului obținut. Prin urmare, sarcina de optimizare a controlerului fuzzy devine relevantă pentru a obține cei mai înalți indicatori posibili ai calității controlului. Acestea. sarcina este de a optimiza funcția obiectiv f(a 1 ,a 2 …a n), unde a 1 ,a 2 …a n sunt coeficienții care determină tipul și caracteristicile controlerului fuzzy. Pentru a optimiza controlerul fuzzy, folosim blocul ANFIS din mediul Matlab. De asemenea, una dintre modalitățile de îmbunătățire a caracteristicilor controlerului poate fi creșterea numărului de intrări ale acestuia. Acest lucru va face regulatorul mai flexibil și va îmbunătăți performanța acestuia. Să mai adăugăm o variabilă lingvistică de intrare - rata de modificare a semnalului de intrare (derivata sa). În consecință, și numărul de reguli va crește. Apoi schema de circuit a regulatorului va lua forma:

Fig.14 Diagrama schematică a unui controler fuzzy cu trei variabile lingvistice.

Fie valoarea vitezei semnalului de intrare. Setul de termeni de bază Tn este definit ca:

Тn=(„negativ (VO)”, „zero (Z)”, „pozitiv (VR)”).

Locația funcțiilor de apartenență pentru toate variabilele lingvistice este prezentată în figură.

Fig.15. Funcțiile de apartenență ale variabilei lingvistice „eroare”.

Fig.16. Funcții de apartenență ale variabilei lingvistice „viteza semnalului de intrare”.

Datorită adăugării unei variabile lingvistice, numărul de reguli va crește la 3x5=15. Principiul compilarii lor este complet similar cu cel discutat mai sus. Toate acestea sunt prezentate în următorul tabel:

Tabelul 3

semnal neclar

management

Eroare de poziție

Viteză

De exemplu, dacă dacă eroare = zero și derivată a semnalului de intrare = pozitiv mare, apoi actiune de control = mic negativ.

Fig.17. Formarea controlului sub trei variabile lingvistice.

Datorită creșterii numărului de intrări și, în consecință, a regulilor în sine, structura controlerului fuzzy va deveni, de asemenea, mai complicată.

Fig.18. Diagrama structurală a unui controler fuzzy cu două intrări.

Adăugați desen

Fig.20. Proces tranzitoriu sub intrare armonică pentru un model cu un controler fuzzy care conține două variabile lingvistice de intrare.

Orez. 21. Semnal de eroare la intrarea armonică pentru un model cu un controler fuzzy care conține două variabile lingvistice de intrare.

Să simulăm funcționarea unui controler fuzzy cu două intrări în mediul Matlab. Diagrama bloc a modelului va fi exact aceeași ca în Fig. 19. Din graficul procesului tranzitoriu pentru intrarea armonică, se poate observa că precizia sistemului a crescut semnificativ, dar în același timp oscilația acestuia a crescut, mai ales în locurile în care derivata coordonatei de ieșire tinde să zero. Este evident că motivul pentru aceasta, așa cum sa menționat mai sus, este alegerea neoptimală a parametrilor funcțiilor de apartenență, atât pentru variabilele lingvistice de intrare cât și de ieșire. Prin urmare, optimizăm controlerul fuzzy folosind blocul ANFISedit în mediul Matlab.

Optimizarea controlerului fuzzy.

Luați în considerare utilizarea algoritmilor genetici pentru optimizarea controlerului fuzzy. Algoritmii genetici sunt metode de căutare adaptive care sunt adesea folosite în ultimii ani pentru a rezolva problemele de optimizare funcțională. Ele se bazează pe asemănarea cu procesele genetice ale organismelor biologice: populațiile biologice se dezvoltă pe parcursul mai multor generații, respectând legile selecției naturale și conform principiului „supraviețuirii celui mai potrivit”, descoperit de Charles Darwin. Imitând acest proces, algoritmii genetici sunt capabili să „evolueze” soluții la problemele din lumea reală dacă sunt codificați corespunzător.

Algoritmii genetici lucrează cu un set de „indivizi” - o populație, fiecare dintre acestea reprezentând o posibilă soluție la o problemă dată. Fiecare individ este evaluat prin măsura „aptitudinii” sale în funcție de cât de „bună” este soluția problemei care îi corespunde. Cei mai apți indivizi sunt capabili să „reproducă” descendenți prin „încrucișare” cu alți indivizi din populație. Aceasta duce la apariția unor noi indivizi care combină unele dintre caracteristicile moștenite de la părinți. Indivizii cel mai puțin apți sunt mai puțin probabil să se reproducă, astfel încât trăsăturile pe care le posedă vor dispărea treptat din populație.

Așa se reproduce toată noua populație de soluții fezabile, alegând cei mai buni reprezentanți ai generației precedente, încrucișându-i și obținând o mulțime de indivizi noi. Această nouă generație conține un raport mai mare de caracteristici pe care le posedă membrii buni ai generației precedente. Astfel, din generație în generație, caracteristicile bune sunt distribuite în întreaga populație. În cele din urmă, populația va converge către soluția optimă a problemei.

Există multe modalități de implementare a ideii de evoluție biologică în cadrul algoritmilor genetici. Tradițional, poate fi reprezentat sub forma următoarei diagrame bloc prezentată în Figura 22, unde:

1. Initializarea populatiei initiale - generarea unui numar dat de solutii la problema, de la care incepe procesul de optimizare;

2. Aplicarea operatorilor de încrucișare și mutație;

3. Condiții de oprire - de obicei, procesul de optimizare este continuat până când se găsește o soluție a problemei cu o precizie dată sau până când se dezvăluie că procesul a convergit (adică nu a existat nicio îmbunătățire a soluționării problemei în ultima perioadă). N generații).

În mediul Matlab, algoritmii genetici sunt reprezentați de o cutie de instrumente separată, precum și de pachetul ANFIS. ANFIS este o abreviere pentru Adaptive-Network-Based Fuzzy Inference System - Adaptive Fuzzy Inference Network. ANFIS este una dintre primele variante de rețele hibride neuro-fuzzy - o rețea neuronală de tip special de propagare directă a semnalului. Arhitectura unei rețele neuro-fuzzy este izomorfă cu o bază de cunoștințe neclară. Implementările diferențiabile ale normelor triunghiulare (înmulțirea și OR probabilistic), precum și funcțiile de membru netedă sunt utilizate în rețelele neuro-fuzzy. Acest lucru face posibilă utilizarea algoritmilor rapidi și genetici pentru antrenarea rețelelor neuronale bazate pe metoda de backpropagation pentru a configura rețele neuro-fuzzy. Arhitectura și regulile de funcționare a fiecărui nivel al rețelei ANFIS sunt descrise mai jos.

ANFIS implementează sistemul de inferență fuzzy al lui Sugeno ca o rețea neuronală feed-forward cu cinci straturi. Scopul straturilor este următorul: primul strat reprezintă termenii variabilelor de intrare; al doilea strat - antecedente (parcele) de reguli fuzzy; al treilea strat este normalizarea gradului de îndeplinire a regulilor; al patrulea strat este concluziile regulilor; al cincilea strat este agregarea rezultatului obţinut după diferite reguli.

Intrările de rețea nu sunt alocate unui nivel separat. Figura 23 prezintă o rețea ANFIS cu o variabilă de intrare („eroare”) și cinci reguli neclare. Pentru evaluarea lingvistică a variabilei de intrare „eroare” se folosesc 5 termeni.


Fig.23. StructuraANFIS-rețele.

Să introducem următoarea notație, necesară pentru prezentarea ulterioară:

Fie intrările rețelei;

y - ieșire în rețea;

Regula fuzzy cu număr ordinal r;

m - numărul de reguli;

Termen neclar cu funcție de apartenență , folosit pentru evaluarea lingvistică a unei variabile din regula r-a (,);

Numerele reale în concluzia regulii a r-a (,).

Rețeaua ANFIS funcționează după cum urmează.

Stratul 1 Fiecare nod al primului strat reprezintă un termen cu o funcție de apartenență în formă de clopot. Intrările rețelei sunt conectate numai la termenii lor. Numărul de noduri din primul strat este egal cu suma cardinalităților seturilor de termeni de variabile de intrare. Ieșirea nodului este gradul de apartenență al valorii variabilei de intrare la termenul fuzzy corespunzător:

,

unde a, b și c sunt parametri configurabili pentru funcția de membru.

Stratul 2 Numărul de noduri din al doilea strat este m. Fiecare nod al acestui strat corespunde unei reguli fuzzy. Nodul celui de-al doilea strat este conectat la acele noduri ale primului strat care formează antecedentele regulii corespunzătoare. Prin urmare, fiecare nod al celui de-al doilea strat poate primi de la 1 la n semnale de intrare. Ieșirea nodului este gradul de execuție al regulii, care este calculat ca produsul semnalelor de intrare. Notați ieșirile nodurilor acestui strat prin , .

Stratul 3 Numărul de noduri din al treilea strat este de asemenea m. Fiecare nod al acestui strat calculează gradul relativ de îndeplinire a regulii fuzzy:

Stratul 4 Numărul de noduri din al patrulea strat este de asemenea m. Fiecare nod este conectat la un nod al celui de-al treilea strat, precum și la toate intrările rețelei (conexiunile la intrări nu sunt prezentate în Fig. 18). Nodul celui de-al patrulea strat calculează contribuția unei reguli fuzzy la ieșirea rețelei:

Stratul 5 Singurul nod al acestui strat rezumă contribuțiile tuturor regulilor:

.

Procedurile tipice de antrenament ale rețelei neuronale pot fi aplicate pentru a regla rețeaua ANFIS, deoarece utilizează numai funcții diferențiabile. În mod obișnuit, se utilizează o combinație de coborâre a gradientului sub formă de retropropagare și cele mai mici pătrate. Algoritmul de backpropagation ajustează parametrii antecedentelor de regulă, adică funcții de membru. Coeficienții de concluzie ale regulii sunt estimați prin metoda celor mai mici pătrate, deoarece sunt legați liniar de ieșirea rețelei. Fiecare iterație a procedurii de reglare este efectuată în doi pași. În prima etapă, un eșantion de antrenament este alimentat la intrări, iar parametrii optimi ai nodurilor celui de-al patrulea strat se găsesc din discrepanța dintre comportamentul dorit și cel real al rețelei folosind metoda iterativă a celor mai mici pătrate. În a doua etapă, discrepanța reziduală este transferată de la ieșirea rețelei la intrări, iar parametrii nodurilor primului strat sunt modificați prin metoda de retropropagare a erorii. În același timp, coeficienții de concluzie a regulii găsiți în prima etapă nu se modifică. Procedura de reglare iterativă continuă până când reziduul depășește o valoare predeterminată. Pentru a regla funcțiile de membru, pe lângă metoda de propagare inversă a erorilor, pot fi utilizați și alți algoritmi de optimizare, de exemplu, metoda Levenberg-Marquardt.

Fig.24. ANFISedit spațiu de lucru.

Să încercăm acum să optimizăm controlerul fuzzy pentru o acțiune cu un singur pas. Procesul tranzitoriu dorit este aproximativ următorul:

Fig.25. procesul de tranziție dorit.

Din graficul prezentat în Fig. rezultă că de cele mai multe ori motorul ar trebui să funcționeze la putere maximă pentru a asigura viteza maximă, iar când se apropie de valoarea dorită să încetinească lin. Ghidați de aceste considerații simple, vom lua următorul eșantion de valori ca unul de antrenament, prezentat mai jos sub forma unui tabel:

Tabelul 4


Valoarea erorii

Valoarea managementului

Valoarea erorii

Valoarea managementului

Valoarea erorii

Valoarea managementului


Fig.26. Tipul eșantionului de antrenament.

Antrenamentul se va desfășura în 100 de pași. Acest lucru este mai mult decât suficient pentru convergența metodei utilizate.

Fig.27. Procesul de învățare a unei rețele neuronale.

În procesul de învățare, parametrii funcțiilor de membru sunt formați în așa fel încât, cu o valoare de eroare dată, controlerul să creeze controlul necesar. În secțiunea dintre punctele nodale, dependența controlului de eroare este o interpolare a datelor din tabel. Metoda de interpolare depinde de modul în care este antrenată rețeaua neuronală. De fapt, după antrenament, modelul controlerului fuzzy poate fi reprezentat ca o funcție neliniară a unei variabile, al cărei grafic este prezentat mai jos.

Fig.28. Graficul dependenței controlului de la eroare la poziția în interiorul regulatorului.

După ce au salvat parametrii găsiți ai funcțiilor de membru, simulăm sistemul cu un controler fuzzy optimizat.


Orez. 29. Proces tranzitoriu sub intrare armonică pentru un model cu un controler fuzzy optimizat care conține o variabilă lingvistică de intrare.

Fig.30. Semnal de eroare la intrarea armonică pentru un model cu un controler fuzzy care conține două variabile lingvistice de intrare.


Din grafice rezultă că optimizarea controlerului fuzzy prin antrenarea rețelei neuronale a avut succes. Scăderea semnificativă a fluctuației și a mărimii erorii. Prin urmare, utilizarea unei rețele neuronale este destul de rezonabilă pentru optimizarea controlerelor, al căror principiu se bazează pe logica fuzzy. Cu toate acestea, nici un controler optimizat nu poate satisface cerințele de acuratețe, așa că este indicat să se ia în considerare o altă metodă de control, atunci când controlerul fuzzy nu controlează în mod direct obiectul, ci combină mai multe legi de control în funcție de situație.

Duminica, 29 martie 2015

În prezent, există multe sarcini în care se cere să se ia o decizie în funcție de prezența unui obiect în imagine sau să-l clasifice. Abilitatea de a „recunoaște” este considerată principala proprietate a ființelor biologice, în timp ce sistemele informatice nu posedă pe deplin această proprietate.

Luați în considerare elementele generale ale modelului de clasificare.

Clasă- un set de obiecte care au proprietăți comune. Pentru obiectele din aceeași clasă, se presupune prezența „asemănării”. Pentru sarcina de recunoaștere poate fi definit un număr arbitrar de clase, mai mult de 1. Numărul de clase este notat cu numărul S. Fiecare clasă are propria etichetă de identificare a clasei.

Clasificare- procesul de atribuire a etichetelor de clasă obiectelor, conform unei descrieri a proprietăților acestor obiecte. Un clasificator este un dispozitiv care primește un set de caracteristici ale unui obiect ca intrare și ca rezultat produce o etichetă de clasă.

Verificare- procesul de potrivire a unei instanțe de obiect cu un singur model de obiect sau descriere de clasă.

Sub cale vom înțelege denumirea zonei în spațiul atributelor, în care sunt afișate multe obiecte sau fenomene ale lumii materiale. semn- o descriere cantitativă a unei anumite proprietăți a obiectului sau fenomenului studiat.

caracteristică spațiu acesta este un spațiu N-dimensional definit pentru o anumită sarcină de recunoaștere, unde N este un număr fix de caracteristici măsurate pentru orice obiect. Vectorul din spațiul caracteristic x corespunzător obiectului problemei de recunoaștere este un vector N-dimensional cu componente (x_1,x_2,…,x_N), care sunt valorile caracteristicilor pentru obiectul dat.

Cu alte cuvinte, recunoașterea modelelor poate fi definită ca atribuirea datelor inițiale unei anumite clase prin extragerea trăsăturilor sau proprietăților esențiale care caracterizează aceste date din masa generală de detalii irelevante.

Exemple de probleme de clasificare sunt:

  • recunoașterea caracterelor;
  • recunoaștere a vorbirii;
  • stabilirea unui diagnostic medical;
  • Prognoza meteo;
  • recunoaștere facială
  • clasificarea documentelor etc.

Cel mai adesea, materialul sursă este imaginea primită de la cameră. Sarcina poate fi formulată ca obținerea de vectori caracteristici pentru fiecare clasă din imaginea considerată. Procesul poate fi privit ca un proces de codare, care constă în atribuirea unei valori fiecărei caracteristici din spațiul de caracteristici pentru fiecare clasă.

Dacă luăm în considerare 2 clase de obiecte: adulți și copii. Ca caracteristici, puteți alege înălțimea și greutatea. După cum reiese din figură, aceste două clase formează două mulțimi care nu se intersectează, care pot fi explicate prin caracteristicile alese. Cu toate acestea, nu este întotdeauna posibil să alegeți parametrii măsurați corecti ca caracteristici ale claselor. De exemplu, parametrii selectați nu sunt potriviți pentru crearea unor clase care nu se suprapun de jucători de fotbal și baschetbalist.

A doua sarcină de recunoaștere este selectarea trăsăturilor caracteristice sau a proprietăților din imaginile originale. Această sarcină poate fi atribuită preprocesării. Dacă luăm în considerare sarcina recunoașterii vorbirii, putem distinge trăsături precum vocalele și consoanele. Atributul trebuie să fie o proprietate caracteristică a unei anumite clase, fiind în același timp comun acestei clase. Semne care caracterizează diferențele dintre - semne interclase. Caracteristicile comune tuturor claselor nu conțin informații utile și nu sunt considerate caracteristici în problema recunoașterii. Alegerea caracteristicilor este una dintre sarcinile importante asociate cu construirea unui sistem de recunoaștere.

După ce caracteristicile sunt determinate, este necesar să se determine procedura optimă de decizie pentru clasificare. Luați în considerare un sistem de recunoaștere a modelelor conceput pentru a recunoaște diferite clase M, notate ca m_1,m_2,...,m 3. Apoi putem presupune că spațiul imaginii este format din M regiuni, fiecare conținând puncte corespunzătoare unei imagini dintr-o clasă. Atunci problema recunoașterii poate fi considerată ca construcția granițelor care separă M clase pe baza vectorilor de măsurare acceptați.

Rezolvarea problemei preprocesării imaginii, extragerea caracteristicilor și problema obținerii soluției și clasificării optime este de obicei asociată cu necesitatea evaluării unui număr de parametri. Aceasta duce la problema estimării parametrilor. În plus, este evident că extragerea caracteristicilor poate folosi informații suplimentare bazate pe natura claselor.

Compararea obiectelor se poate face pe baza reprezentării lor sub formă de vectori de măsură. Este convenabil să reprezentați datele de măsurare ca numere reale. Apoi, asemănarea vectorilor caracteristici a două obiecte poate fi descrisă folosind distanța euclidiană.

unde d este dimensiunea vectorului caracteristic.

Există 3 grupuri de metode de recunoaștere a modelelor:

  • Comparație de probă. Acest grup include clasificarea după cea mai apropiată medie, clasificarea după distanța până la cel mai apropiat vecin. Metodele de recunoaștere structurală pot fi, de asemenea, incluse în grupul de comparație al eșantionului.
  • Metode statistice. După cum sugerează și numele, metodele statistice folosesc unele informații statistice atunci când rezolvă o problemă de recunoaștere. Metoda determină apartenența unui obiect la o anumită clasă pe baza probabilității.În unele cazuri, aceasta se rezumă la determinarea probabilității a posteriori ca un obiect să aparțină unei anumite clase, cu condiția ca trăsăturile acestui obiect să fi luat valorile. Un exemplu este metoda Bayesiană a regulilor de decizie.
  • Rețele neuronale. O clasă separată de metode de recunoaștere. O trăsătură distinctivă față de ceilalți este capacitatea de a învăța.

Clasificare după cea mai apropiată medie

În abordarea clasică a recunoașterii modelelor, în care un obiect necunoscut pentru clasificare este reprezentat ca un vector de trăsături elementare. Un sistem de recunoaștere bazat pe caracteristici poate fi dezvoltat în diferite moduri. Acești vectori pot fi cunoscuți de sistem în prealabil ca urmare a antrenamentului sau prevăzuți în timp real pe baza unor modele.

Un algoritm simplu de clasificare constă în gruparea datelor de referință de clasă folosind vectorul așteptării clasei (media).

unde x(i,j) este j-a caracteristică de referință a clasei i, n_j este numărul de vectori de referință ai clasei i.

Atunci obiectul necunoscut va aparține clasei i dacă este mult mai aproape de vectorul de așteptare al clasei i decât de vectorii de așteptare ai altor clase. Această metodă este potrivită pentru problemele în care punctele fiecărei clase sunt situate compact și departe de punctele altor clase.

Dificultăți vor apărea dacă clasele au o structură puțin mai complexă, de exemplu, ca în figură. În acest caz, clasa 2 este împărțită în două secțiuni care nu se suprapun, care sunt descrise slab de o singură valoare medie. De asemenea, clasa 3 este prea alungită, eșantioanele din clasa a 3-a cu valori mari ale coordonatelor x_2 sunt mai aproape de valoarea medie a clasei 1 decât a clasei a 3-a.

Problema descrisă în unele cazuri poate fi rezolvată prin modificarea calculului distanței.

Vom lua în considerare caracteristica „împrăștierii” valorilor clasei - σ_i, de-a lungul fiecărei direcții de coordonate i. Abaterea standard este egală cu rădăcina pătrată a varianței. Distanța euclidiană la scară dintre vectorul x și vectorul de așteptare x_c este

Această formulă de distanță va reduce numărul erorilor de clasificare, dar, în realitate, majoritatea problemelor nu pot fi reprezentate de o clasă atât de simplă.

Clasificare după distanță până la cel mai apropiat vecin

O altă abordare a clasificării este de a atribui un vector caracteristic necunoscut x clasei de care acest vector este cel mai apropiat de un eșantion separat. Această regulă se numește regula vecinului cel mai apropiat. Clasificarea celui mai apropiat vecin poate fi mai eficientă chiar și atunci când clasele sunt complexe sau când clasele se suprapun.

Această abordare nu necesită ipoteze despre modelele de distribuție a vectorilor caracteristici în spațiu. Algoritmul folosește doar informații despre mostrele de referință cunoscute. Metoda soluției se bazează pe calcularea distanței x până la fiecare probă din baza de date și găsirea distanței minime. Avantajele acestei abordări sunt evidente:

  • oricând puteți adăuga noi mostre în baza de date;
  • structurile de date arbore și grilă reduc numărul de distanțe calculate.

În plus, soluția va fi mai bună dacă căutați în baza de date nu un vecin cel mai apropiat, ci k. Apoi, pentru k > 1, oferă cea mai bună probă de distribuție a vectorilor în spațiul d-dimensional. Cu toate acestea, utilizarea eficientă a valorilor k depinde de faptul dacă există suficient în fiecare regiune a spațiului. Dacă există mai mult de două clase, atunci este mai dificil să iei decizia corectă.

Literatură

  • M. Castrillon, . O. Deniz, . D. Hernández și J. Lorenzo, „A comparison of face and facial feature detectors based on the Viola-Jones general object detection framework”, International Journal of Computer Vision, nr.22, pp. 481-494, 2011.
  • Y.-Q. Wang, „O analiză a algoritmului de detectare a feței Viola-Jones”, Jurnalul IPOL, 2013.
  • L. Shapiro și D. Stockman, Computer vision, Binom. Laboratorul de cunoștințe, 2006.
  • Z. N. G., Metode de recunoaștere și aplicarea lor, Radio sovietică, 1972.
  • J. Tu, R. Gonzalez, Principii matematice ale recunoașterii modelelor, Moscova: „Mir” Moscova, 1974.
  • Khan, H. Abdullah și M. Shamian Bin Zainal, „Algoritm eficient de detecție a ochilor și a gurii folosind combinația de viola jones și detectarea pixelilor culorii pielii” Jurnalul Internațional de Inginerie și Științe Aplicate, nr. 3 nr 4, 2013.
  • V. Gaede și O. Gunther, „Multidimensional Access Methods”, ACM Computing Surveys, pp. 170-231, 1998.

Prezentare generală a metodelor existente de recunoaștere a modelelor

L.P. Popova , ȘI DESPRE. Datiev

Abilitatea de a „recunoaște” este considerată principala proprietate a ființelor umane, ca, într-adevăr, a altor organisme vii. Recunoașterea modelelor este o ramură a ciberneticii care dezvoltă principii și metode de clasificare și identificare a obiectelor, fenomenelor, proceselor, semnalelor, situațiilor - toate acele obiecte care pot fi descrise printr-un set finit de trăsături sau proprietăți care caracterizează un obiect.

O imagine este o descriere a unui obiect. Imaginile au o proprietate caracteristică, care se manifestă prin faptul că cunoașterea unui număr finit de fenomene din același set face posibilă recunoașterea unui număr arbitrar de mare a reprezentanților săi.

Există două direcții principale în teoria recunoașterii modelelor:

    studiul puterilor de recunoaștere deținute de ființele umane și de alte organisme vii;

    dezvoltarea teoriei și metodelor de construire a dispozitivelor destinate rezolvării problemelor individuale de recunoaștere a modelelor în anumite domenii de aplicare.

În continuare, articolul descrie problemele, principiile și metodele de implementare a sistemelor de recunoaștere a modelelor legate de dezvoltarea celei de-a doua direcții. A doua parte a articolului discută metodele rețelelor neuronale de recunoaștere a modelelor, care pot fi atribuite primei direcții a teoriei recunoașterii modelelor.

Probleme de construire a sistemelor de recunoaștere a imaginilor

Sarcinile care apar în construcția sistemelor automate de recunoaștere a modelelor pot fi de obicei clasificate în mai multe domenii principale. Prima dintre ele este legată de reprezentarea datelor inițiale obținute ca rezultate ale măsurătorilor pentru obiectul de recunoscut. problema de sensibilitate. Fiecare valoare măsurată este o „caracteristică a unei imagini sau a unui obiect. Să presupunem, de exemplu, că imaginile sunt caractere alfanumerice. În acest caz, o retină de măsurare, similară cu cea prezentată în Fig. 1 (a), poate fi utilizată cu succes. în senzor.Dacă retina este formată din n-elemente, atunci rezultatele măsurătorii pot fi reprezentate ca un vector de măsurare sau un vector de imagine ,

unde fiecare element xi ia, de exemplu, valoarea 1 dacă imaginea simbolului trece prin celula i-a a retinei, iar valoarea 0 în caz contrar.

Luați în considerare fig. 2(b). În acest caz, imaginile sunt funcții continue (de tipul semnalelor sonore) ale variabilei t. Dacă valorile funcției sunt măsurate în puncte discrete t1,t2, ..., tn, atunci vectorul imagine poate fi format luând x1= f(t1),x2=f(t2),... , xn = f(tn).

Figura 1. Măsurarea retinei

A doua problemă a recunoașterii modelului este legată de selecția caracteristicilor sau proprietăților din datele inițiale obținute și de reducerea dimensiunii vectorilor de model. Această problemă este adesea definită ca o problemă preprocesare și selecție de caracteristici.

Caracteristicile unei clase de imagini sunt proprietăți caracteristice comune tuturor imaginilor unei clase date. Trăsăturile care caracterizează diferențele dintre clasele individuale pot fi interpretate ca trăsături interclase. Caracteristicile intraclase comune tuturor claselor luate în considerare nu conțin informații utile din punct de vedere al recunoașterii și pot să nu fie luate în considerare. Alegerea caracteristicilor este considerată una dintre sarcinile importante asociate cu construcția sistemelor de recunoaștere. Dacă rezultatele măsurătorilor fac posibilă obținerea unui set complet de caracteristici distinctive pentru toate clasele, recunoașterea și clasificarea efectivă a modelelor nu va cauza dificultăți deosebite. Recunoașterea automată ar fi apoi redusă la un simplu proces de potrivire sau proceduri precum căutări în tabel. În majoritatea problemelor practice de recunoaștere, totuși, determinarea unui set complet de caracteristici distinctive este extrem de dificilă, dacă nu imposibilă. Din datele originale, de obicei, este posibil să extragem unele dintre caracteristicile distinctive și să le folosiți pentru a simplifica procesul de recunoaștere automată a modelelor. În special, dimensiunea vectorilor de măsurare poate fi redusă folosind transformări care minimizează pierderea de informații.

A treia problemă asociată cu construcția sistemelor de recunoaștere a modelelor este găsirea procedurilor de decizie optime necesare identificării și clasificării. După ce datele colectate despre modelele care trebuie recunoscute sunt reprezentate prin puncte sau vectori de măsurători în spațiul modelului, lăsați mașina să descopere cărei clase de modele îi corespund aceste date. Fie ca mașina să fie proiectată pentru a distinge între clasele M, notate cu w1, w2, ... ..., wm. În acest caz, spațiul imaginii poate fi considerat a fi format din M regiuni, fiecare dintre acestea conținând puncte corespunzătoare imaginilor din aceeași clasă. În acest caz, problema recunoașterii poate fi considerată ca construirea limitelor regiunilor de decizie care separă M clase pe baza vectorilor de măsurare înregistrați. Fie definite aceste limite, de exemplu, prin funcțiile de decizie d1(х),d2(x),..., dm(х). Aceste funcții, numite și funcții discriminante, sunt funcții scalare și cu o singură valoare ale imaginii lui x. Dacă di (x) > dj (x), atunci imaginea lui x aparține clasei w1. Cu alte cuvinte, dacă funcția i-a de decizie di(x) are cea mai mare valoare, atunci în Fig. 2 (pe schema „GR” - generatorul de funcții decisive).

Figura 2. Schema de clasificare automată.

Funcțiile de decizie pot fi obținute în mai multe moduri. În acele cazuri în care sunt disponibile informații complete a priori despre tiparele recunoscute, funcțiile de decizie pot fi determinate exact pe baza acestor informații. Dacă sunt disponibile doar informații calitative despre tipare, se pot face ipoteze rezonabile cu privire la forma funcțiilor de decizie. În acest din urmă caz, granițele regiunilor de decizie se pot abate semnificativ de la cele adevărate și, prin urmare, este necesar să se creeze un sistem capabil să ajungă la un rezultat satisfăcător printr-o serie de ajustări succesive.

Obiectele (imaginile) care urmează să fie recunoscute și clasificate folosind un sistem automat de recunoaștere a modelelor trebuie să aibă un set de caracteristici măsurabile. Când pentru un întreg grup de imagini rezultatele măsurătorilor corespunzătoare sunt similare, se consideră că aceste obiecte aparțin aceleiași clase. Scopul sistemului de recunoaștere a modelelor este de a determina, pe baza informațiilor colectate, o clasă de obiecte cu caracteristici similare cu cele măsurate pentru obiectele recognoscibile. Corectitudinea recunoașterii depinde de cantitatea de informații distinctive conținute în caracteristicile măsurate și de eficiența utilizării acestor informații.

      Metode de bază pentru implementarea sistemelor de recunoaștere a modelelor

Recunoașterea modelelor este sarcina de a construi și aplica operații formale asupra reprezentărilor numerice sau simbolice ale obiectelor din lumea reală sau ideală, rezultatele ale căror soluții reflectă relațiile de echivalență dintre aceste obiecte. Relaţiile de echivalenţă exprimă apartenenţa obiectelor evaluate la unele clase, considerate ca unităţi semantice independente.

La construirea algoritmilor de recunoaștere, clasele de echivalență pot fi stabilite de un cercetător care își folosește propriile idei semnificative sau folosește informații suplimentare externe despre asemănarea și diferența dintre obiecte în contextul problemei care se rezolvă. Apoi se vorbește despre „discernirea cu profesorul”. Altfel, i.e. atunci când un sistem automatizat rezolvă o problemă de clasificare fără a implica informații externe de instruire, se vorbește de clasificare automată sau „recunoaștere nesupravegheată”. Majoritatea algoritmilor de recunoaștere a modelelor necesită implicarea unei puteri de calcul foarte semnificative, care poate fi asigurată doar de tehnologia computerizată de înaltă performanță.

Diverși autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V., Tu R., J. V. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin și alții) oferă o tipologie diferită a metodelor de recunoaștere a modelelor. Unii autori fac distincție între metodele parametrice, neparametrice și euristice, în timp ce alții evidențiază grupuri de metode bazate pe școli istorice și tendințe în acest domeniu.

În același timp, tipologiile cunoscute nu țin cont de o caracteristică foarte semnificativă, care reflectă specificul modului în care sunt reprezentate cunoștințele despre domeniul subiectului folosind orice algoritm formal de recunoaștere a modelelor. D.A. Pospelov identifică două modalități principale de reprezentare a cunoștințelor:

    Reprezentare intensională – sub forma unei diagrame a relațiilor dintre atribute (trăsături).

    Reprezentarea extensivă – cu ajutorul unor fapte specifice (obiecte, exemple).

De remarcat că existența acestor două grupe de metode de recunoaștere: cele care operează cu caracteristici și cele care operează cu obiecte, este profund firească. Din acest punct de vedere, niciuna dintre aceste metode, luate separat de cealaltă, nu face posibilă formarea unei reflectări adecvate a domeniului subiectului. Între aceste metode există o relație de complementaritate în sensul lui N. Bohr, prin urmare, sistemele de recunoaștere promițătoare ar trebui să asigure implementarea ambelor metode, și nu a oricăreia dintre ele.

Astfel, clasificarea metodelor de recunoaștere propusă de D.A.Pospelov se bazează pe legile fundamentale care stau la baza modului uman de cunoaștere în general, ceea ce îl plasează într-o poziție (privilegiată) cu totul aparte față de alte clasificări, care, pe acest fond, arată mai ușor și mai artificial.

Metode Intensionale

O trăsătură distinctivă a metodelor intensionale este aceea că ele folosesc diferite caracteristici ale caracteristicilor și relațiile lor ca elemente ale operațiunilor în construcția și aplicarea algoritmilor de recunoaștere a modelelor. Astfel de elemente pot fi valori individuale sau intervale de valori ale caracteristicilor, valori medii și variații, matrice de relații de caracteristici etc., asupra cărora sunt efectuate acțiuni, exprimate într-o formă analitică sau constructivă. În același timp, obiectele din aceste metode nu sunt considerate unități informaționale integrale, ci acționează ca indicatori pentru evaluarea interacțiunii și comportamentului atributelor lor.

Grupul de metode intensionale de recunoaștere a modelelor este extins, iar împărțirea sa în subclase este oarecum arbitrară:

– metode bazate pe estimări ale densităților de distribuție a valorilor caracteristicilor

– metode bazate pe ipoteze despre clasa funcţiilor de decizie

– metode logice

– metode lingvistice (structurale).

Metode bazate pe estimări ale densităților de distribuție a valorilor caracteristicilor. Aceste metode de recunoaștere a modelelor sunt împrumutate din teoria clasică a deciziilor statistice, în care obiectele de studiu sunt considerate ca realizări ale unei variabile aleatoare multidimensionale distribuite în spațiul caracteristic conform unor legi. Ele se bazează pe o schemă bayesiană de luare a deciziilor care face apel la probabilitățile a priori ale obiectelor aparținând unei anumite clase de recunoscut și la densitățile de distribuție condiționată a valorilor vectorului caracteristic. Aceste metode sunt reduse la determinarea raportului de probabilitate în diferite zone ale spațiului caracteristic multidimensional.

Grupul de metode bazat pe estimarea densităților de distribuție a valorilor caracteristicilor este direct legat de metodele de analiză discriminantă. Abordarea bayesiană a luării deciziilor este una dintre cele mai dezvoltate în statistica modernă, așa-numitele metode parametrice, pentru care expresia analitică a legii distribuției (în acest caz, legea normală) este considerată cunoscută și doar o mică parte. numărul de parametri (vectori medii și matrice de covarianță) trebuie estimat.

Acest grup include, de asemenea, o metodă pentru calcularea raportului de probabilitate pentru caracteristicile independente. Această metodă, cu excepția asumării independenței trăsăturilor (care nu este, practic, niciodată îndeplinită în realitate), nu implică cunoașterea formei funcționale a legii distribuției. Poate fi atribuită metodelor neparametrice.

Alte metode neparametrice, utilizate atunci când forma curbei densității distribuției este necunoscută și nu se pot face deloc presupuneri cu privire la natura acesteia, ocupă o poziție specială. Printre acestea se numără binecunoscuta metodă a histogramelor multidimensionale, metoda „k-nearest neighbors”, metoda euclidiană a distanței, metoda funcțiilor potențiale etc., a căror generalizare este metoda numită „Estimări Parzen”. Aceste metode operează în mod formal cu obiectele ca structuri integrale, dar în funcție de tipul sarcinii de recunoaștere, ele pot acționa atât în ​​ipostaze intensionale, cât și extensionale.

Metodele neparametrice analizează numărul relativ de obiecte care se încadrează în volumele multidimensionale date și utilizează diferite funcții de distanță între obiectele eșantionului de antrenament și obiectele recunoscute. Pentru caracteristicile cantitative, când numărul lor este mult mai mic decât dimensiunea eșantionului, operațiunile cu obiecte joacă un rol intermediar în estimarea densităților de distribuție locală a probabilităților condiționate, iar obiectele nu poartă încărcătura semantică a unităților informaționale independente. În același timp, atunci când numărul de trăsături este proporțional sau mai mare decât numărul de obiecte studiate, iar trăsăturile sunt de natură calitativă sau dihotomică, atunci nu se poate vorbi despre estimări locale ale densităților distribuției probabilității. În acest caz, obiectele din aceste metode neparametrice sunt considerate unități informaționale independente (fapte empirice holistice) și aceste metode dobândesc semnificația unor aprecieri ale asemănării și deosebirii obiectelor studiate.

Astfel, aceleași operații tehnologice ale metodelor neparametrice, în funcție de condițiile problemei, au sens fie estimări locale ale densităților distribuției de probabilitate ale valorilor caracteristicilor, fie estimări ale asemănării și diferenței obiectelor.

În contextul reprezentării intenționale a cunoștințelor, prima latură a metodelor neparametrice este considerată aici, ca estimări ale densităților distribuției probabilităților. Mulți autori observă că metodele neparametrice, cum ar fi estimările Parzen, funcționează bine în practică. Principalele dificultăți în aplicarea acestor metode sunt necesitatea de a reține întregul eșantion de antrenament pentru a calcula estimări ale densităților locale de distribuție a probabilității și sensibilitatea ridicată la nereprezentativitatea eșantionului de antrenament.

Metode bazate pe ipoteze despre clasa funcțiilor de decizie.În acest grup de metode se consideră cunoscută forma generală a funcției de decizie și se dă calitatea funcțională a acesteia. Pe baza acestei funcționale, se caută cea mai bună aproximare a funcției de decizie pentru secvența de antrenament. Cele mai comune sunt reprezentările funcțiilor de decizie sub formă de polinoame liniare și neliniare generalizate. Calitatea funcțională a regulii de decizie este de obicei asociată cu eroarea de clasificare.

Principalul avantaj al metodelor bazate pe ipoteze despre clasa funcțiilor de decizie este claritatea formulării matematice a problemei de recunoaștere ca problemă de găsire a unui extremum. Soluția la această problemă este adesea obținută folosind un fel de algoritmi de gradient. Varietatea metodelor acestui grup este explicată prin gama largă de funcționale de calitate a regulilor de decizie și algoritmi de căutare extremum. O generalizare a algoritmilor considerați, care includ, în special, algoritmul lui Newton, algoritmii de tip perceptron etc., este metoda de aproximare stocastică. Spre deosebire de metodele de recunoaștere parametrică, succesul acestui grup de metode nu depinde atât de mult de nepotrivirea ideilor teoretice despre legile de distribuție a obiectelor în spațiul caracteristic cu realitatea empirică. Toate operațiunile sunt subordonate unui singur scop principal - găsirea extremumului calității funcționale a regulii de decizie. În același timp, rezultatele metodelor parametrice și luate în considerare pot fi similare. După cum se arată mai sus, metodele parametrice pentru cazul distribuțiilor normale ale obiectelor din diferite clase cu matrice de covarianță egală conduc la funcții de decizie liniare. De asemenea, observăm că algoritmii pentru selectarea caracteristicilor informative în modelele de diagnostic liniare pot fi interpretați ca variante particulare ale algoritmilor de gradient pentru căutarea unui extrem.

Posibilitățile algoritmilor de gradient pentru găsirea unui extremum, în special în grupul regulilor de decizie liniare, au fost studiate destul de bine. Convergența acestor algoritmi a fost dovedită doar pentru cazul în care clasele de obiecte recunoscute sunt afișate în spațiul caracteristic prin structuri geometrice compacte. Totuși, dorința de a obține o calitate suficientă a regulii de decizie poate fi adesea satisfăcută cu ajutorul algoritmilor care nu au o demonstrație matematică riguroasă a convergenței soluției la extremul global.

Astfel de algoritmi includ un grup mare de proceduri de programare euristică reprezentând direcția modelării evolutive. Modelarea evolutivă este o metodă bionică împrumutată din natură. Se bazează pe utilizarea unor mecanisme cunoscute de evoluție pentru a înlocui procesul de modelare semnificativă a unui obiect complex cu modelarea fenomenologică a evoluției acestuia.

Un reprezentant binecunoscut al modelării evolutive în recunoașterea modelelor este metoda de contabilizare de grup a argumentelor (MGUA). GMDH se bazează pe principiul auto-organizării, iar algoritmii GMDH reproduc schema selecției în masă. În algoritmii GMDH, membrii unui polinom generalizat sunt sintetizați și selectați într-un mod special, care este adesea numit polinomul Kolmogorov-Gabor. Această sinteză și selecție se realizează cu o complexitate crescândă și este imposibil de prezis în prealabil ce formă finală va avea polinomul generalizat. În primul rând, sunt de obicei considerate combinații simple perechi de trăsături inițiale, din care ecuațiile funcțiilor decisive sunt compuse, de regulă, nu mai mari decât ordinul doi. Fiecare ecuație este analizată ca o funcție de decizie independentă, iar valorile parametrilor ecuațiilor compuse se găsesc într-un fel sau altul din eșantionul de antrenament. Apoi, din setul rezultat de funcții de decizie, o parte din cele mai bune într-un anumit sens este selectată. Calitatea funcțiilor individuale de decizie este verificată pe un eșantion de control (test), care este uneori numit principiul adăugării externe. Funcțiile de decizie parțiale selectate sunt considerate mai jos ca variabile intermediare care servesc drept argumente inițiale pentru o sinteză similară a unor noi funcții de decizie etc. Procesul unei astfel de sinteze ierarhice continuă până la atingerea extremului criteriului de calitate a funcției de decizie, care în practică. se manifestă prin deteriorarea acestei calități atunci când se încearcă creșterea în continuare a ordinii membrilor polinomului în raport cu trăsăturile originale.

Principiul de auto-organizare care stă la baza GMDH se numește auto-organizare euristică, deoarece întregul proces se bazează pe introducerea de completări externe alese euristic. Rezultatul deciziei poate depinde în mod semnificativ de aceste euristici. Modelul de diagnostic rezultat depinde de modul în care obiectele sunt împărțite în eșantioane de antrenament și de testare, de modul în care este determinat criteriul de calitate a recunoașterii, de câte variabile sunt sărite în următorul rând de selecție etc.

Aceste caracteristici ale algoritmilor GMDH sunt, de asemenea, caracteristice altor abordări ale modelării evolutive. Dar remarcăm aici încă un aspect al metodelor luate în considerare. Aceasta este esența conținutului lor. Folosind metode bazate pe ipoteze despre clasa funcțiilor de decizie (evolutive și gradiente), este posibilă construirea unor modele de diagnosticare de mare complexitate și obținerea unor rezultate practic acceptabile. În același timp, atingerea scopurilor practice în acest caz nu este însoțită de extragerea de noi cunoștințe despre natura obiectelor recognoscibile. Posibilitatea extragerii acestor cunoștințe, în special cunoștințe despre mecanismele de interacțiune a atributelor (trăsăturilor), este limitată aici fundamental de structura dată a unei astfel de interacțiuni, fixată în forma aleasă a funcțiilor decisive. Prin urmare, maximul care se poate spune după construirea unui anumit model de diagnosticare este de a enumera combinațiile de caracteristici și caracteristicile în sine care sunt incluse în modelul rezultat. Dar sensul combinațiilor care reflectă natura și structura distribuțiilor obiectelor studiate rămâne adesea nedescoperit în cadrul acestei abordări.

Metode booleene. Metodele logice de recunoaștere a modelelor se bazează pe aparatul algebrei logice și permit operarea cu informații conținute nu numai în caracteristicile individuale, ci și în combinații de valori ale caracteristicilor. În aceste metode, valorile oricărui atribut sunt considerate evenimente elementare.

În cea mai generală formă, metodele logice pot fi caracterizate ca un fel de căutare a modelelor logice în eșantionul de instruire și formarea unui anumit sistem de reguli de decizie logică (de exemplu, sub forma conjuncțiilor de evenimente elementare), fiecare dintre care are propria sa greutate. Grupul de metode logice este divers și include metode de complexitate și profunzime diferite de analiză. Pentru caracteristicile dihotomice (booleene), sunt populare așa-numitele clasificatoare de tip arbore, metoda de testare fără margini, algoritmul Kora și altele. Metodele mai complexe se bazează pe formalizarea metodelor inductive ale lui D.S. Mill. Formalizarea se realizează prin construirea unei teorii cvasi-axiomatice și se bazează pe logica multi-sortată cu valori multiple cu cuantificatori pe tupluri de lungime variabilă.

Algoritmul Kora, ca și alte metode logice de recunoaștere a modelelor, este destul de laborios, deoarece este necesară o enumerare completă la selectarea conjuncțiilor. Prin urmare, atunci când se aplică metode logice, se impun cerințe ridicate privind organizarea eficientă a procesului de calcul, iar aceste metode funcționează bine cu dimensiuni relativ mici ale spațiului de caracteristici și numai pe computere puternice.

Metode lingvistice (sintactice sau structurale). Metodele lingvistice de recunoaștere a modelelor se bazează pe utilizarea unor gramatici speciale care generează limbaje, cu ajutorul cărora poate fi descris un set de proprietăți ale obiectelor recognoscibile. Gramatica se referă la regulile de construire a obiectelor din aceste elemente nederivate.

Dacă descrierea imaginilor se face cu ajutorul elementelor nederivate (subimagini) și a relațiilor lor, atunci se folosește o abordare lingvistică sau sintactică pentru a construi sisteme de recunoaștere automată folosind principiul comunității proprietăților. O imagine poate fi descrisă folosind o structură ierarhică de subimagini similară cu structura sintactică a unui limbaj. Această împrejurare face posibilă aplicarea teoriei limbajelor formale în rezolvarea problemelor de recunoaștere a modelelor. Se presupune că gramatica imaginilor conține seturi finite de elemente numite variabile, elemente nederivate și reguli de substituție. Natura regulilor de substituție determină tipul de gramatică. Printre cele mai studiate gramatici se numără gramaticile obișnuite, fără context și ale constituenților direcți. Punctele cheie ale acestei abordări sunt alegerea elementelor nederivate ale imaginii, unirea acestor elemente și relațiile care le unesc în gramatici ale imaginilor și, în final, implementarea proceselor de analiză și recunoaștere în limbajul corespunzător. . Această abordare este utilă în special atunci când lucrați cu imagini care fie nu pot fi descrise prin măsurători numerice, fie sunt atât de complexe încât caracteristicile lor locale nu pot fi identificate și trebuie să faceți referire la proprietățile globale ale obiectelor.

De exemplu, E.A. Butakov, V.I. Ostrovsky, I.L. Fadeev propune următoarea structură de sistem pentru procesarea imaginilor (Fig. 3), utilizând o abordare lingvistică, în care fiecare dintre blocurile funcționale este un complex software (microprogram) (modul) care implementează funcțiile corespunzătoare.

Figura 3. Diagrama structurală a recunoașterii

Încercările de aplicare a metodelor lingvisticii matematice la problema analizei imaginii duc la necesitatea rezolvării unui număr de probleme legate de maparea unei structuri de imagine bidimensionale pe lanțuri unidimensionale ale unui limbaj formal.

Metode de extensie

În metodele acestui grup, spre deosebire de direcția intensională, fiecărui obiect studiat i se acordă o valoare diagnostică independentă într-o măsură mai mare sau mai mică. La baza lor, aceste metode sunt apropiate de abordarea clinică, care consideră oamenii nu ca un lanț de obiecte clasificate în funcție de unul sau altul indicator, ci ca sisteme integrale, fiecare dintre ele fiind individual și având o valoare diagnostică specială. O astfel de atitudine atentă față de obiectele de studiu nu permite excluderea sau pierderea informațiilor despre fiecare obiect individual, ceea ce apare atunci când se aplică metodele de direcție intențională, folosind obiecte doar pentru a detecta și fixa modelele de comportament ale atributelor lor.

Principalele operații în recunoașterea modelelor folosind metodele discutate sunt operațiunile de determinare a asemănării și diferenței obiectelor. Obiectele din grupul specificat de metode joacă rolul de precedente de diagnosticare. În același timp, în funcție de condițiile unei anumite sarcini, rolul unui precedent individual poate varia în limitele cele mai largi: de la participarea principală și definitorie la participarea foarte indirectă la procesul de recunoaștere. La rândul lor, condițiile problemei pot necesita participarea unui număr diferit de precedente de diagnosticare pentru o soluție de succes: de la unul din fiecare clasă recunoscută la întreaga dimensiune a eșantionului, precum și diferite moduri de a calcula măsurile de similitudine și diferență de obiecte. Aceste cerințe explică împărțirea ulterioară a metodelor extensiale în subclase:

    metoda de comparare a prototipurilor;

    metoda k-cel mai apropiat vecin;

    echipe de reguli de decizie.

Metoda de comparare a prototipurilor. Aceasta este cea mai simplă metodă de recunoaștere extensivă. Este folosit, de exemplu, atunci când clasele recunoscute sunt afișate în spațiul de caracteristici în grupări geometrice compacte. În acest caz, centrul grupării geometrice a clasei (sau obiectul cel mai apropiat de centru) este de obicei ales ca punct prototip.

Pentru a clasifica un obiect necunoscut, se găsește prototipul cel mai apropiat de acesta, iar obiectul aparține aceleiași clase cu acest prototip. Evident, nu se formează imagini de clasă generalizate în această metodă.

Diferite tipuri de distanțe pot fi utilizate ca măsură a proximității. Adesea pentru caracteristicile dihotomice se folosește distanța Hamming, care în acest caz este egală cu pătratul distanței euclidiene. În acest caz, regula de decizie pentru clasificarea obiectelor este echivalentă cu o funcție de decizie liniară.

Acest fapt trebuie remarcat în mod deosebit. Demonstrează clar legătura dintre prototip și reprezentarea indicativă a informațiilor despre structura datelor. Folosind reprezentarea de mai sus, de exemplu, orice scară de măsurare tradițională, care este o funcție liniară a valorilor caracteristicilor dihotomice, poate fi considerată un prototip de diagnostic ipotetic. La rândul său, dacă analiza structurii spațiale a claselor recunoscute ne permite să concluzionam că acestea sunt compacte din punct de vedere geometric, atunci este suficient să înlocuim fiecare dintre aceste clase cu un prototip, care este de fapt echivalent cu un model de diagnostic liniar.

În practică, desigur, situația este adesea diferită de exemplul idealizat descris. Un cercetător care intenționează să aplice o metodă de recunoaștere bazată pe comparație cu prototipurile claselor de diagnostic se confruntă cu probleme dificile. Aceasta este, în primul rând, alegerea unei măsuri de proximitate (metrică), care poate schimba semnificativ configurația spațială a distribuției obiectelor. Și, în al doilea rând, o problemă independentă este analiza structurilor multidimensionale ale datelor experimentale. Ambele probleme sunt deosebit de acute pentru cercetător în condiții de dimensiune mare a spațiului caracteristic, ceea ce este tipic pentru problemele reale.

Metoda k-cei mai apropiati vecini. Metoda k-cel mai apropiat vecin pentru rezolvarea problemelor de analiză discriminantă a fost propusă pentru prima dată în 1952. Este după cum urmează.

Când se clasifică un obiect necunoscut, se găsește un număr dat (k) de alte obiecte care sunt cele mai apropiate din punct de vedere geometric de el în spațiul caracteristic (cei mai apropiati vecini) cu aparținând deja cunoscute la clase de recunoscut. Decizia de a atribui un obiect necunoscut unei anumite clase de diagnostic este luată prin analizarea informațiilor despre această apartenență cunoscută a vecinilor săi cei mai apropiați, de exemplu, folosind o simplă numărare a voturilor.

Inițial, metoda k-cel mai apropiat vecin a fost considerată o metodă neparametrică pentru estimarea raportului de probabilitate. Pentru această metodă se obțin estimări teoretice ale eficacității sale în comparație cu clasificatorul bayesian optim. Se dovedește că probabilitățile de eroare asimptotică pentru metoda k-cel mai apropiat vecin depășesc erorile regulii Bayes de cel mult două ori.

După cum sa menționat mai sus, în problemele reale este adesea necesar să se opereze cu obiecte care sunt descrise de un număr mare de caracteristici calitative (dihotomice). În același timp, dimensiunea spațiului caracteristic este proporțională cu sau depășește volumul eșantionului studiat. În astfel de condiții, este convenabil să se interpreteze fiecare obiect al eșantionului de antrenament ca un clasificator liniar separat. Atunci, aceasta sau acea clasă de diagnosticare este reprezentată nu de un prototip, ci de un set de clasificatoare liniare. Interacțiunea combinată a clasificatorilor liniari are ca rezultat o suprafață liniară pe bucăți care separă clasele recunoscute în spațiul caracteristicilor. Tipul suprafeței divizoare, constând din bucăți de hiperplane, poate fi variat și depinde de poziția relativă a agregatelor clasificate.

O altă interpretare a mecanismelor de clasificare a k-cel mai apropiat vecin poate fi, de asemenea, utilizată. Se bazează pe ideea existenței unor variabile latente, abstracte sau asociate printr-o transformare cu spațiul caracteristic original. Dacă distanțele perechi dintre obiecte în spațiul variabilelor latente sunt aceleași ca în spațiul caracteristicilor inițiale, iar numărul acestor variabile este mult mai mic decât numărul de obiecte, atunci se poate lua în considerare interpretarea metodei k-nearest neighbors. din punctul de vedere al comparării estimărilor neparametrice ale densităților de distribuție de probabilitate condiționată. Conceptul de variabile latente prezentat aici este apropiat de conceptul de dimensionalitate adevărată și alte reprezentări utilizate în diferite metode de reducere a dimensionalității.

Când se utilizează metoda k-nearest neighbors pentru recunoașterea modelelor, cercetătorul trebuie să rezolve problema dificilă a alegerii unei metrici pentru a determina proximitatea obiectelor diagnosticate. Această problemă în condițiile dimensiunii mari a spațiului caracteristic este extrem de agravată din cauza laboriozității suficiente a acestei metode, care devine semnificativă chiar și pentru calculatoarele performante. Prin urmare, aici, ca și în metoda de comparare a prototipurilor, este necesar să se rezolve problema creativă a analizei structurii multidimensionale a datelor experimentale pentru a minimiza numărul de obiecte reprezentând clase de diagnostic.

Algoritmi de calcul a notelor (votare). Principiul de funcționare al algoritmilor pentru calcularea scorurilor (ABO) este acela de a calcula prioritatea (scorurile de similaritate) care caracterizează „proximitatea” obiectelor recunoscute și de referință conform sistemului de ansambluri de caracteristici, care este un sistem de submulțimi ale unui dat. set de caracteristici.

Spre deosebire de toate metodele considerate anterior, algoritmii pentru calcularea estimărilor operează cu descrieri de obiecte într-un mod fundamental nou. Pentru acești algoritmi, obiectele există simultan în subspații foarte diferite ale spațiului caracteristic. Clasa ABO aduce ideea utilizării caracteristicilor la finalul său logic: deoarece nu se știe întotdeauna care combinații de caracteristici sunt cele mai informative, în ABO gradul de similitudine al obiectelor se calculează comparând toate combinațiile posibile sau anumite combinații de caracteristici. incluse în descrierile obiectelor.

Echipe de reguli de decizie. Regula de decizie folosește o schemă de recunoaștere pe două niveluri. La primul nivel funcționează algoritmii de recunoaștere privat, ale căror rezultate sunt combinate la al doilea nivel în blocul de sinteză. Cele mai comune metode ale unei astfel de combinații se bazează pe alocarea domeniilor de competență ale unui anumit algoritm. Cea mai simplă modalitate de a găsi domenii de competență este de a împărți a priori spațiul caracteristicilor pe baza considerentelor profesionale ale unei anumite științe (de exemplu, stratificarea eșantionului în funcție de anumite caracteristici). Apoi, pentru fiecare dintre zonele selectate, se construiește propriul algoritm de recunoaștere. O altă metodă se bazează pe utilizarea analizei formale pentru a determina zonele locale ale spațiului caracteristic ca vecinătăți de obiecte recunoscute pentru care a fost dovedit succesul unui anumit algoritm de recunoaștere.

Cea mai generală abordare a construirii unui bloc de sinteză consideră indicatorii rezultați ai algoritmilor parțiali ca caracteristici inițiale pentru construirea unei noi reguli de decizie generalizate. În acest caz, pot fi utilizate toate metodele de mai sus de direcții intensionale și extensiale în recunoașterea modelelor. Eficienți pentru rezolvarea problemei creării unui set de reguli de decizie sunt algoritmii logici de tip „Kora” și algoritmii pentru calcularea estimărilor (ABO), care stau la baza așa-numitei abordări algebrice, care oferă cercetare și o descriere constructivă a algoritmi de recunoaștere, în cadrul cărora se încadrează toate tipurile existente de algoritmi.

Metode de rețea neuronală

Metodele rețelelor neuronale sunt metode bazate pe utilizarea diferitelor tipuri de rețele neuronale (NN). Principalele domenii de aplicare a diferitelor NN-uri pentru recunoașterea modelelor și a imaginii:

    aplicație pentru extragerea caracteristicilor sau caracteristicilor cheie ale imaginilor date,

    clasificarea imaginilor în sine sau a caracteristicilor deja extrase din acestea (în primul caz, extragerea caracteristicilor cheie are loc implicit în cadrul rețelei),

    rezolvarea problemelor de optimizare.

Rețele neuronale multistrat. Arhitectura unei rețele neuronale multistrat (MNN) constă din straturi conectate secvențial, unde neuronul fiecărui strat este conectat cu toți neuronii stratului anterior cu intrările sale și cu ieșirile celui următor.

Cea mai simplă aplicație a unui NN cu un singur strat (numită memorie auto-asociativă) este antrenarea rețelei pentru a reconstrui imaginile de alimentare. Prin introducerea unei imagini de testare la intrare și calculând calitatea imaginii reconstruite, se poate estima cât de bine a recunoscut rețeaua imaginea de intrare. Proprietățile pozitive ale acestei metode sunt că rețeaua poate recupera imagini distorsionate și zgomotoase, dar nu este potrivită pentru scopuri mai serioase.

MNN este, de asemenea, utilizat pentru clasificarea directă a imaginilor - intrarea este fie imaginea însăși într-o anumită formă, fie un set de caracteristici cheie extrase anterior ale imaginii, la ieșire, neuronul cu activitate maximă indică apartenența la clasa recunoscută (Fig. . 4). Dacă această activitate este sub un anumit prag, atunci se consideră că imaginea transmisă nu aparține niciunei dintre clasele cunoscute. Procesul de învățare stabilește corespondența imaginilor de intrare cu apartenența la o anumită clasă. Aceasta se numește învățare supravegheată. Această abordare este bună pentru sarcinile de control al accesului pentru un grup mic de oameni. Această abordare oferă o comparație directă a imaginilor în sine de către rețea, dar odată cu creșterea numărului de cursuri, timpul de instruire și funcționarea în rețea crește exponențial. Prin urmare, sarcini precum căutarea unei persoane similare într-o bază de date mare necesită extragerea unui set compact de caracteristici cheie din care să căutați.

O abordare de clasificare folosind caracteristicile de frecvență ale întregii imagini este descrisă în . A fost folosit un NS cu un singur strat bazat pe neuroni multivalori.

B arată utilizarea NN pentru clasificarea imaginilor, atunci când intrarea în rețea primește rezultatele descompunerii imaginii prin metoda componentelor principale.

În MNS clasic, conexiunile neuronale interstrat sunt complet conectate, iar imaginea este reprezentată ca un vector unidimensional, deși este bidimensional. Arhitectura rețelei neuronale convoluționale își propune să depășească aceste neajunsuri. A folosit câmpuri locale de receptor (care oferă conectivitate bidimensională locală a neuronilor), ponderi generale (oferind detectarea unor caracteristici oriunde în imagine) și organizare ierarhică cu subeșantionare spațială (subeșantionare spațială). NN convoluțional (CNN) oferă rezistență parțială la schimbările de scară, deplasări, rotații, distorsiuni.

MNS sunt, de asemenea, folosite pentru a detecta obiecte de un anumit tip. Pe lângă faptul că orice MNS instruit poate determina într-o oarecare măsură dacă imaginile aparțin claselor „proprii”, poate fi antrenat special pentru a detecta în mod fiabil anumite clase. În acest caz, clasele de ieșire vor fi clase care aparțin și nu aparțin tipului de imagine dat. A fost folosit un detector de rețea neuronală pentru a detecta imaginea feței din imaginea de intrare. Imaginea a fost scanată cu o fereastră de 20x20 pixeli, care a fost alimentată la intrarea rețelei, care decide dacă zona dată aparține clasei de fețe. Antrenamentul s-a făcut folosind atât exemple pozitive (diverse imagini cu fețe), cât și exemple negative (imagini care nu sunt fețe). Pentru a crește fiabilitatea detectării, a fost folosită o echipă de NN-uri antrenate cu greutăți inițiale diferite, în urma căreia NN-urile au greșit în diferite moduri, iar decizia finală s-a luat prin votul întregii echipe.

Figura 5. Componentele principale (fețe proprii) și descompunerea imaginii în componente principale

NN este, de asemenea, utilizat pentru a extrage caracteristicile cheie ale imaginii, care sunt apoi utilizate pentru clasificarea ulterioară. În , este prezentată o metodă pentru implementarea rețelei neuronale a metodei de analiză a componentelor principale. Esența metodei de analiză a componentelor principale constă în obținerea coeficienților decorelleați maxim care caracterizează modelele de intrare. Acești coeficienți sunt numiți componente principale și sunt utilizați pentru compresia statistică a imaginii, în care un număr mic de coeficienți sunt utilizați pentru a reprezenta întreaga imagine. Un NN cu un strat ascuns care conține N neuroni (care este mult mai mic decât dimensiunea imaginii), antrenat prin metoda de retropropagare a erorii pentru a restabili imaginea de intrare la ieșire, formează coeficienții primelor N componente principale la ieșirea neuroni ascunși, care sunt utilizați pentru comparație. De obicei, se folosesc 10 până la 200 de componente principale. Pe măsură ce numărul componentelor crește, reprezentativitatea acestuia scade foarte mult și nu are sens să folosiți componente cu numere mari. Când se utilizează funcții de activare neliniară ale elementelor neuronale, este posibilă o descompunere neliniară în componente principale. Neliniaritatea vă permite să reflectați cu mai multă acuratețe variațiile datelor de intrare. Aplicând analiza componentelor principale la descompunerea imaginilor feței, obținem componentele principale, numite fețe proprii, care au și o proprietate utilă - există componente care reflectă în principal caracteristici esențiale ale feței precum genul, rasa, emoțiile. La restaurare, componentele au un aspect asemănător feței, primele reflectând cea mai generală formă a feței, cea din urmă reprezentând diverse diferențe minore între fețe (Fig. 5). Această metodă este bine aplicabilă pentru căutarea imaginilor cu fețe similare în baze de date mari. Se arată și posibilitatea reducerii în continuare a dimensiunii componentelor principale cu ajutorul NS. Evaluând calitatea reconstrucției imaginii de intrare, se poate determina foarte precis dacă aceasta aparține clasei de fețe.

Rețele neuronale de ordin înalt. Rețelele neuronale de ordin înalt (HNN) diferă de MNN prin faptul că au un singur strat, dar intrările neuronilor primesc și termeni de ordin înalt care sunt produsul a două sau mai multe componente ale vectorului de intrare. Astfel de rețele pot forma, de asemenea, suprafețe de separare complexe.

Rețele neuronale Hopfield. Hopfield NN (HSH) este cu un singur strat și complet conectat (nu există conexiuni ale neuronilor la ei înșiși), ieșirile sale sunt conectate cu intrări. Spre deosebire de MNS, NSH este relaxant, adică. fiind setat la starea inițială, funcționează până când ajunge într-o stare stabilă, care va fi valoarea sa de ieșire. Pentru a căuta un minim global în legătură cu problemele de optimizare, se folosesc modificări stocastice ale NSH.

Utilizarea NSH ca memorie asociativă vă permite să restaurați cu acuratețe imaginile la care a fost antrenată rețeaua atunci când o imagine distorsionată este alimentată la intrare. În acest caz, rețeaua își va „aminti” imaginea cea mai apropiată (în sensul minimului local de energie) și, astfel, o va recunoaște. O astfel de funcționare poate fi gândită și ca o aplicare secvențială a memoriei auto-asociative descrise mai sus. Spre deosebire de memoria auto-asociativă, NSH va restaura imaginea perfect exact. Pentru a evita minimele de interferență și pentru a crește capacitatea rețelei, sunt utilizate diferite metode.

Rețele neuronale auto-organizate Kohonen. Rețelele neuronale auto-organizate (SNNC) Kohonen asigură ordonarea topologică a spațiului imaginii de intrare. Ele permit maparea continuă topologic a spațiului n-dimensional de intrare în m-dimensională de ieșire, m<

Cognitron. Cognitronul în arhitectura sa este similar cu structura cortexului vizual, are o organizare ierarhică multistrat, în care neuronii dintre straturi sunt conectați doar local. Antrenat prin învățare competitivă (fără profesor). Fiecare strat al creierului implementează diferite niveluri de generalizare; stratul de intrare este sensibil la modele simple, cum ar fi liniile, și orientarea lor în anumite zone ale zonei vizuale, în timp ce răspunsul altor straturi este mai complex, abstract și independent de poziția modelului. Funcții similare sunt implementate în cognitron prin modelarea organizării cortexului vizual.

Neocognitron este o dezvoltare ulterioară a ideii de cognitron și reflectă mai precis structura sistemului vizual, vă permite să recunoașteți imaginile indiferent de transformările, rotațiile, distorsiunile și schimbările de scară ale acestora.

Cognitron este un instrument puternic de recunoaștere a imaginii, cu toate acestea, necesită costuri de calcul mari, care sunt în prezent de neatins.

Metodele rețelelor neuronale considerate oferă recunoaștere rapidă și fiabilă a imaginii, dar atunci când se folosesc aceste metode, apar probleme în recunoașterea obiectelor tridimensionale. Cu toate acestea, această abordare are multe avantaje.

      Concluzie

În prezent, există un număr destul de mare de sisteme de recunoaștere automată a modelelor pentru diferite probleme aplicate.

Recunoașterea modelelor prin metode formale ca direcție științifică fundamentală este inepuizabilă.

Metodele matematice de prelucrare a imaginii au o mare varietate de aplicații: știință, tehnologie, medicină, sfera socială. În viitor, rolul recunoașterii modelelor în viața umană va crește și mai mult.

Metodele rețelelor neuronale oferă recunoaștere rapidă și fiabilă a imaginii. Această abordare are multe avantaje și este una dintre cele mai promițătoare.

Literatură

    D.V. Brilyuk, V.V. Starovoitov. Metode ale rețelelor neuronale de recunoaștere a imaginilor // /

    Kuzin L.T. Fundamentele ciberneticii: Fundamentele modelelor cibernetice. T.2. - M.: Energie, 1979. - 584 p.

    Peregudov F.I., Tarasenko F.P. Introducere în analiza de sistem: manual. - M .: Liceu, 1997. - 389s.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Bazele teoretice ale tehnologiei informației. - M.: Energie, 1979. - 511s.

    Tu J., Gonzalez R. Principiile recunoașterii modelelor. / Per. din engleza. - M.: Mir, 1978. - 410s.

    Winston P. Inteligența artificială. / Per. din engleza. - M.: Mir, 1980. - 520s.

    Fu K. Metode structurale în recunoașterea modelelor: Tradus din engleză. - M.: Mir, 1977. - 320s.

    Tsypkin Ya.Z. Fundamentele teoriei informaționale a identificării. - M.: Nauka, 1984. - 520s.

    Pospelov G.S. Inteligența artificială stă la baza noii tehnologii informaționale. - M.: Nauka, 1988. - 280s.

    Yu. Lifshits, Metode statistice de recunoaștere a modelelor ///modern/07modernnote.pdf

    Bohr N. Fizica atomică și cunoașterea umană. / Traducere din engleză. - M.: Mir, 1961. - 151s.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Procesarea imaginilor pe un computer.1987.-236s.

    Duda R., Hart P. Recunoașterea modelelor și analiza scenei. / Traducere din engleză. - M.: Mir, 1978. - 510s.

    Ducele V.A. Psihodiagnostic computerizat. - Sankt Petersburg: Frăție, 1994. - 365 p.

    Aizenberg I. N., Aizenberg N. N. și Krivosheev G. A. Neuroni binari universali și multivalori: algoritmi de învățare, aplicații pentru procesarea și recunoașterea imaginilor. Note de curs în Inteligența artificială - Învățare automată și extragerea datelor în recunoașterea modelelor, 1999, pp. 21-35.

    Ranganath S. și Arun K. Recunoașterea feței folosind caracteristici de transformare și rețele neuronale. Pattern Recognition 1997, Vol. 30, pp. 1615-1622.

    Golovko V.A. Neurointeligență: teorie și aplicații. Cartea 1. Organizarea și antrenamentul rețelelor neuronale cu direct și feedback - Brest: BPI, 1999, - 260s.

    Vetter T. și Poggio T. Clasele de obiecte liniare și sinteza imaginii dintr-un singur exemplu de imagine. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, voi. 19, pp. 733-742.

    Golovko V.A. Neurointeligență: teorie și aplicații. Cartea 2. Autoorganizarea, toleranța la erori și utilizarea rețelelor neuronale - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. și Back A. D. Recunoașterea feței: O abordare a rețelei neuronale convoluționale. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

    Wasserman F. Tehnologia neurocalculatoarelor: Teorie și practică, 1992 - 184p.

    Rowley H. A., Baluja S. și Kanade T. Neural Network-Based Face Detection. Tranzacții IEEE privind analiza modelelor și inteligența mașinilor 1998, voi. 20, pp. 23-37.

    Valentin D., Abdi H., O „Toole A. J. și Cottrell G. W. Modele conecționiste de procesare a feței: un sondaj. ÎN: Pattern Recognition 1994, Vol. 27, pp. 1209-1230.

    Document

    Ei alcătuiesc algoritmi recunoaştereimagini. Metoderecunoaştereimagini După cum sa menționat mai sus... realitatea nu este exista„ecosisteme în general” și exista doar câteva... concluzii din acest detaliat revizuiremetoderecunoaştere am prezentat in...

  1. Prezentare generală a metodelor de identificare a persoanelor pe baza imaginilor feței, ținând cont de caracteristicile recunoașterii vizuale

    Revizuire

    ... recunoaştere de către o persoană de obiecte cu contrast redus, incl. persoane. Adus revizuire uzual metode ... Existaîntreaga linie metode ... cale, ca urmare a studiului, o platformă pentru dezvoltarea de metodărecunoaştere ...

  2. Imeni Glazkova Valentina Vladimirovna CERCETAREA SI DEZVOLTAREA METODELOR DE CONSTRUCȚIE DE INSTRUMENTE SOFTWARE PENTRU CLASIFICAREA DOCUMENTELOR DE HIPERTEXT MULTI-TEME Specialitatea 05

    Rezumat disertație

    documente hipertext. Capitolul contine revizuireexistentmetode rezolvarea problemei luate în considerare, descrierea... prin tăierea celor mai puțin relevante clase // Matematică metoderecunoaştereimagini: a 13-a Conferință panrusă. Regiunea Leningrad...

  3. Slide 0 Prezentare generală a sarcinilor bioinformaticii legate de analiza și prelucrarea textelor genetice

    Lectura

    ADN și secvențe de proteine. Revizuire sarcinile bioinformaticii ca sarcini ... semnalele necesită utilizarea de moderne metoderecunoaştereimagini, abordări statistice și ... cu densitate scăzută a genelor. Existent programele de predicție genetică nu...

Capitolul 3: Analiza analitică a recunoașterii modelelor și a metodelor de luare a deciziilor

Teoria recunoașterii modelelor și automatizarea controlului

Principalele sarcini ale recunoașterii modelelor adaptive

Recunoașterea este un proces de informare implementat de un convertor de informații (canal de informare inteligent, sistem de recunoaștere) care are o intrare și o ieșire. Intrarea sistemului este informație despre ce caracteristici au obiectele prezentate. Ieșirea sistemului afișează informații despre clasele (imagini generalizate) cărora sunt alocate obiectele recunoscute.

Atunci când se creează și se operează un sistem automat de recunoaștere a modelelor, o serie de sarcini sunt rezolvate. Să luăm în considerare pe scurt și simplu aceste sarcini. Rețineți că formulările acestor sarcini, și setul în sine, nu coincid cu diferiți autori, deoarece într-o anumită măsură depinde de modelul matematic specific pe care se bazează acest sau acel sistem de recunoaștere. În plus, unele sarcini din anumite modele de recunoaștere nu au o soluție și, în consecință, nu sunt puse.

Sarcina oficializării domeniului subiectului

De fapt, această sarcină este o sarcină de codificare. Este compilată o listă de clase generalizate, care poate include implementări specifice ale obiectelor, precum și o listă de caracteristici pe care aceste obiecte, în principiu, le pot avea.

Sarcina de a forma un eșantion de antrenament

Eșantionul de instruire este o bază de date care conține descrieri ale implementărilor specifice ale obiectelor în limbajul caracteristic, completate cu informații despre apartenența acestor obiecte la anumite clase de recunoaștere.

Sarcina instruirii sistemului de recunoaștere

Eșantionul de antrenament este utilizat pentru a forma imagini generalizate ale claselor de recunoaștere pe baza generalizării informațiilor despre ce caracteristici au obiectele eșantionului de antrenament care aparțin acestei clase și altor clase.

Problema reducerii dimensiunii spațiului caracteristic

După antrenamentul sistemului de recunoaștere (obținerea statisticilor privind distribuția frecvențelor caracteristicilor pe clasă), devine posibil să se determine pentru fiecare caracteristică valoarea acesteia pentru rezolvarea problemei de recunoaștere. După aceea, caracteristicile mai puțin valoroase pot fi eliminate din sistemul de caracteristici. Apoi sistemul de recunoaștere trebuie reantrenat, deoarece, ca urmare a înlăturării unor caracteristici, statisticile de distribuție a caracteristicilor rămase pe clasă se modifică. Acest proces poate fi repetat, adică fi iterativ.

Sarcina de recunoaștere

Sunt recunoscute obiectele unui eșantion de recunoscut, care, în special, pot consta dintr-un singur obiect. Eșantionul de recunoaștere este format în mod similar cu cel de antrenament, dar nu conține informații despre apartenența obiectelor la clase, deoarece tocmai aceasta este determinată în procesul de recunoaștere. Rezultatul recunoașterii fiecărui obiect este o distribuție sau o listă a tuturor claselor de recunoaștere în ordinea descrescătoare a gradului de similitudine a obiectului recunoscut cu acestea.

Sarcina de control al calității de recunoaștere

După recunoaștere, adecvarea acestuia poate fi stabilită. Pentru obiectele din eșantionul de antrenament, acest lucru se poate face imediat, deoarece pentru ele se știe pur și simplu cărei clase aparțin. Pentru alte obiecte, aceste informații pot fi obținute ulterior. În orice caz, probabilitatea medie reală de eroare pentru toate clasele de recunoaștere poate fi determinată, precum și probabilitatea de eroare la atribuirea unui obiect recunoscut unei anumite clase.

Rezultatele recunoașterii trebuie interpretate ținând cont de informațiile disponibile despre calitatea recunoașterii.

Sarcina de adaptare

Dacă, în urma procedurii de control al calității, se constată că aceasta este nesatisfăcătoare, atunci descrierile obiectelor recunoscute incorect pot fi copiate din eșantionul de recunoscut în cel de instruire, completate cu informații de clasificare adecvate și utilizate pentru remodelarea deciziei. reguli, adică luat in considerare. Mai mult, dacă aceste obiecte nu aparțin claselor de recunoaștere existente, ceea ce ar putea fi motivul recunoașterii lor incorecte, atunci această listă poate fi extinsă. Ca urmare, sistemul de recunoaștere se adaptează și începe să clasifice adecvat aceste obiecte.

Problemă de recunoaștere inversă

Sarcina recunoașterii este ca pentru un obiect dat, în funcție de caracteristicile sale cunoscute, sistemul să-și stabilească apartenența la o clasă necunoscută anterior. În problema recunoașterii inverse, dimpotrivă, pentru o anumită clasă de recunoaștere, sistemul determină care trăsături sunt cele mai caracteristice obiectelor acestei clase și care nu sunt (sau care obiecte din eșantionul de antrenament aparțin acestei clase).

Sarcini de cluster și analiză constructivă

Clusterele sunt astfel de grupuri de obiecte, clase sau caracteristici care în cadrul fiecărui cluster sunt cât mai asemănătoare, iar între diferite clustere sunt cât mai diferite.

Un construct (în contextul considerat în această secțiune) este un sistem de clustere opuse. Astfel, într-un anumit sens, constructele sunt rezultatul unei analize de cluster a clusterelor.

În analiza clusterelor, gradul de similitudine și diferență a obiectelor (clase, caracteristici) este măsurat cantitativ, iar această informație este folosită pentru clasificare. Rezultatul analizei cluster este însăși clasificarea obiectelor pe clustere. Această clasificare poate fi reprezentată sub formă de rețele semantice.

Sarcina analizei cognitive

În analiza cognitivă, informațiile despre asemănarea și diferența dintre clase sau trăsături sunt de interes pentru cercetător în sine, și nu pentru a le folosi pentru clasificare, ca în analiza cluster și constructivă.

Dacă două clase de recunoaștere sunt caracterizate de aceeași trăsătură, atunci aceasta contribuie la asemănarea acestor două clase. Dacă pentru una dintre clase această caracteristică este necaracteristică, atunci aceasta contribuie la diferență.

Dacă două semne se corelează între ele, atunci într-un anumit sens pot fi considerate ca un singur semn, iar dacă sunt anticorelate, atunci ca fiind diferite. Ținând cont de această circumstanță, prezența diferitelor trăsături în diferite clase aduce, de asemenea, o anumită contribuție la asemănarea și diferența lor.

Rezultatele analizei cognitive pot fi prezentate sub forma unor diagrame cognitive.

Metode de recunoaștere a modelelor și caracteristicile acestora

Principii de clasificare a metodelor de recunoaștere a modelelor

Recunoașterea modelelor este sarcina de a construi și aplica operații formale asupra reprezentărilor numerice sau simbolice ale obiectelor din lumea reală sau ideală, ale căror rezultate reflectă relațiile de echivalență dintre aceste obiecte. Relaţiile de echivalenţă exprimă apartenenţa obiectelor evaluate la unele clase, considerate ca unităţi semantice independente.

La construirea algoritmilor de recunoaștere, clasele de echivalență pot fi stabilite de un cercetător care își folosește propriile idei semnificative sau folosește informații suplimentare externe despre asemănarea și diferența dintre obiecte în contextul problemei care se rezolvă. Apoi se vorbește de „recunoaștere cu profesorul”. Altfel, i.e. atunci când un sistem automatizat rezolvă o problemă de clasificare fără a implica informații externe de instruire, se vorbește de clasificare automată sau „recunoaștere nesupravegheată”. Majoritatea algoritmilor de recunoaștere a modelelor necesită implicarea unei puteri de calcul foarte semnificative, care poate fi asigurată doar de tehnologia computerizată de înaltă performanță.

Diverși autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin și alții) oferă o tipologie diferită a metodelor de recunoaștere a modelelor. Unii autori fac distincție între metodele parametrice, neparametrice și euristice, în timp ce alții evidențiază grupuri de metode bazate pe școlile istorice și tendințele din domeniu. De exemplu, în lucrarea, care oferă o imagine de ansamblu academică a metodelor de recunoaștere, este utilizată următoarea tipologie de metode de recunoaștere a modelelor:

  • metode bazate pe principiul separării;
  • metode statistice;
  • metode construite pe baza „funcțiilor potențiale”;
  • metode de calcul a notelor (votare);
  • metode bazate pe calculul propozițional, în special pe aparatul algebrei logicii.

Această clasificare se bazează pe diferența dintre metodele formale de recunoaștere a modelelor și, prin urmare, luarea în considerare a abordării euristice a recunoașterii, care a primit o dezvoltare completă și adecvată în sistemele expert, este omisă. Abordarea euristică se bazează pe cunoștințe greu de formalizat și pe intuiția cercetătorului. În același timp, cercetătorul însuși determină ce informații și cum ar trebui să folosească sistemul pentru a obține efectul de recunoaștere dorit.

O tipologie similară a metodelor de recunoaștere cu grade diferite de detaliu se găsește în multe lucrări despre recunoaștere. În același timp, tipologiile cunoscute nu țin cont de o caracteristică foarte semnificativă, care reflectă specificul modului în care sunt reprezentate cunoștințele despre domeniul subiectului folosind un algoritm formal de recunoaștere a modelelor.

D.A. Pospelov (1990) identifică două modalități principale de reprezentare a cunoștințelor:

  • intensional, sub forma unei scheme de conexiuni între atribute (trăsături).
  • extensională, cu ajutorul unor fapte specifice (obiecte, exemple).

Reprezentarea intensională surprinde tiparele și relațiile care explică structura datelor. În ceea ce privește sarcinile de diagnosticare, o astfel de fixare constă în determinarea operațiunilor asupra atributelor (trăsăturilor) obiectelor care conduc la rezultatul diagnosticului necesar. Reprezentările intenționale sunt implementate prin operații asupra valorilor atributelor și nu implică operații asupra faptelor informaționale specifice (obiectelor).

La rândul lor, reprezentările extensive ale cunoștințelor sunt asociate cu descrierea și fixarea unor obiecte specifice din aria subiectului și sunt implementate în operațiuni, ale căror elemente sunt obiecte ca sisteme integrale.

Este posibil să facem o analogie între reprezentările intensionale și extensive ale cunoașterii și mecanismele care stau la baza activității emisferelor stângă și dreaptă ale creierului uman. Dacă emisfera dreaptă este caracterizată de o reprezentare prototipică holistică a lumii înconjurătoare, atunci emisfera stângă operează cu modele care reflectă conexiunile atributelor acestei lumi.

Cele două moduri fundamentale de reprezentare a cunoștințelor descrise mai sus ne permit să propunem următoarea clasificare a metodelor de recunoaștere a modelelor:

  • metode intensionale bazate pe operatii cu atribute.
  • metode extensive bazate pe operații cu obiecte.

Este necesar să subliniem că existența acestor două (și doar două) grupuri de metode de recunoaștere: cele care operează cu trăsături și cele care operează cu obiecte, este profund firească. Din acest punct de vedere, niciuna dintre aceste metode, luate separat de cealaltă, nu face posibilă formarea unei reflectări adecvate a domeniului subiectului. Potrivit autorilor, între aceste metode există o relație de complementaritate în sensul lui N. Bohr, prin urmare, sistemele de recunoaștere promițătoare ar trebui să asigure implementarea ambelor metode, și nu a oricăreia dintre ele.

Astfel, clasificarea metodelor de recunoaștere propusă de D. A. Pospelov se bazează pe legile fundamentale care stau la baza modului uman de cunoaștere în general, ceea ce îl plasează într-o poziție (privilegiată) cu totul aparte față de alte clasificări, care, pe acest fond, arată mai ușor și mai artificial.

Metode Intensionale

O trăsătură distinctivă a metodelor intensionale este aceea că ele folosesc diferite caracteristici ale caracteristicilor și relațiile lor ca elemente ale operațiunilor în construcția și aplicarea algoritmilor de recunoaștere a modelelor. Astfel de elemente pot fi valori individuale sau intervale de valori ale caracteristicilor, valori medii și variații, matrice de relații de caracteristici etc., asupra cărora sunt efectuate acțiuni, exprimate într-o formă analitică sau constructivă. În același timp, obiectele din aceste metode nu sunt considerate unități informaționale integrale, ci acționează ca indicatori pentru evaluarea interacțiunii și comportamentului atributelor lor.

Grupul de metode intensionale de recunoaștere a modelelor este extins, iar împărțirea sa în subclase este oarecum arbitrară.

Metode bazate pe estimări ale densităților de distribuție a valorilor caracteristicilor

Aceste metode de recunoaștere a modelelor sunt împrumutate din teoria clasică a deciziilor statistice, în care obiectele de studiu sunt considerate ca realizări ale unei variabile aleatoare multidimensionale distribuite în spațiul caracteristic conform unor legi. Ele se bazează pe o schemă bayesiană de luare a deciziilor care face apel la probabilitățile a priori ale obiectelor aparținând unei anumite clase de recunoscut și la densitățile de distribuție condiționată a valorilor vectorului caracteristic. Aceste metode sunt reduse la determinarea raportului de probabilitate în diferite zone ale spațiului caracteristic multidimensional.

Grupul de metode bazat pe estimarea densităților de distribuție a valorilor caracteristicilor este direct legat de metodele de analiză discriminantă. Abordarea bayesiană a luării deciziilor este una dintre cele mai dezvoltate în statistica modernă, așa-numitele metode parametrice, pentru care expresia analitică a legii distribuției (în acest caz, legea normală) este considerată cunoscută și doar o mică parte. numărul de parametri (vectori medii și matrice de covarianță) trebuie estimat.

Principalele dificultăți în aplicarea acestor metode sunt necesitatea de a reține întregul eșantion de antrenament pentru a calcula estimări ale densităților locale de distribuție a probabilității și sensibilitatea ridicată la nereprezentativitatea eșantionului de antrenament.

Metode bazate pe ipoteze despre clasa funcțiilor de decizie

În acest grup de metode se consideră cunoscută forma generală a funcției de decizie și se dă calitatea funcțională a acesteia. Pe baza acestei funcționale, cea mai bună aproximare a funcției de decizie se găsește din secvența de antrenament. Cele mai comune sunt reprezentările funcțiilor de decizie sub formă de polinoame liniare și neliniare generalizate. Calitatea funcțională a regulii de decizie este de obicei asociată cu eroarea de clasificare.

Principalul avantaj al metodelor bazate pe ipoteze despre clasa funcțiilor de decizie este claritatea formulării matematice a problemei de recunoaștere ca problemă de găsire a unui extremum. Varietatea metodelor acestui grup este explicată prin gama largă de funcționale de calitate a regulilor de decizie și algoritmi de căutare extremum. O generalizare a algoritmilor considerați, care includ, în special, algoritmul lui Newton, algoritmii de tip perceptron etc., este metoda de aproximare stocastică.

Posibilitățile algoritmilor de gradient pentru găsirea unui extremum, în special în grupul regulilor de decizie liniare, au fost studiate destul de bine. Convergența acestor algoritmi a fost dovedită doar pentru cazul în care clasele de obiecte recunoscute sunt afișate în spațiul caracteristic prin structuri geometrice compacte.

Calitatea suficient de ridicată a regulii de decizie poate fi obținută folosind algoritmi care nu au o demonstrație matematică riguroasă a convergenței soluției la extremul global. Astfel de algoritmi includ un grup mare de proceduri de programare euristică reprezentând direcția modelării evolutive. Modelarea evolutivă este o metodă bionică împrumutată din natură. Se bazează pe utilizarea unor mecanisme cunoscute de evoluție pentru a înlocui procesul de modelare semnificativă a unui obiect complex cu modelarea fenomenologică a evoluției acestuia. Un reprezentant binecunoscut al modelării evolutive în recunoașterea modelelor este metoda de contabilizare de grup a argumentelor (MGUA). GMDH se bazează pe principiul auto-organizării, iar algoritmii GMDH reproduc schema selecției în masă.

Cu toate acestea, atingerea scopurilor practice în acest caz nu este însoțită de extragerea de noi cunoștințe despre natura obiectelor recognoscibile. Posibilitatea extragerii acestor cunoștințe, în special cunoștințe despre mecanismele de interacțiune a atributelor (trăsăturilor), este limitată aici fundamental de structura dată a unei astfel de interacțiuni, fixată în forma aleasă a funcțiilor decisive.

Metode booleene

Metodele logice de recunoaștere a modelelor se bazează pe aparatul algebrei logice și permit operarea cu informații conținute nu numai în caracteristicile individuale, ci și în combinații de valori ale caracteristicilor. În aceste metode, valorile oricărui atribut sunt considerate evenimente elementare.

În cea mai generală formă, metodele logice pot fi caracterizate ca un fel de căutare a modelelor logice în eșantionul de instruire și formarea unui anumit sistem de reguli de decizie logică (de exemplu, sub forma conjuncțiilor de evenimente elementare), fiecare dintre care are propria sa greutate. Grupul de metode logice este divers și include metode de complexitate și profunzime diferite de analiză. Pentru caracteristicile dihotomice (booleene), sunt populare așa-numitele clasificatoare de tip arbore, metoda de testare fără margini, algoritmul Bark etc.

Algoritmul Kora, ca și alte metode logice de recunoaștere a modelelor, este destul de laborios în ceea ce privește calculul, deoarece este necesară o enumerare completă la selectarea conjuncțiilor. Prin urmare, atunci când se aplică metode logice, se impun cerințe ridicate privind organizarea eficientă a procesului de calcul, iar aceste metode funcționează bine cu dimensiuni relativ mici ale spațiului de caracteristici și numai pe computere puternice.

Metode lingvistice (structurale).

Metodele lingvistice de recunoaștere a modelelor se bazează pe utilizarea unor gramatici speciale care generează limbaje care pot fi folosite pentru a descrie un set de proprietăți ale obiectelor recunoscute.

Pentru diferite clase de obiecte se disting elemente nederivate (atomice) (subimagini, semne) și posibile relații între ele. Gramatica se referă la regulile de construire a obiectelor din aceste elemente nederivate.

Astfel, fiecare obiect este o colecție de elemente nederivate, „legate” între ele într-un fel sau altul, sau, cu alte cuvinte, printr-o „propoziție” a unui „limbaj”. Aș dori să subliniez valoarea ideologică foarte semnificativă a acestui gând.

Prin analizarea (parsarea) unei „propoziții”, se determină „corectitudinea” sintactică a acesteia sau, echivalent, dacă o gramatică fixă ​​care descrie o clasă poate genera o descriere existentă a unui obiect.

Totuși, sarcina de a recupera (defini) gramatici dintr-un anumit set de enunțuri (propoziții – descrieri de obiecte) care generează un anumit limbaj este greu de formalizat.

Metode de extensie

În metodele acestui grup, spre deosebire de direcția intensională, fiecărui obiect studiat i se acordă o valoare diagnostică independentă într-o măsură mai mare sau mai mică. La baza lor, aceste metode sunt apropiate de abordarea clinică, care consideră oamenii nu ca un lanț de obiecte clasificate în funcție de unul sau altul indicator, ci ca sisteme integrale, fiecare dintre ele fiind individual și având o valoare diagnostică specială. O astfel de atitudine atentă față de obiectele de studiu nu permite excluderea sau pierderea informațiilor despre fiecare obiect individual, ceea ce apare atunci când se aplică metodele de direcție intențională, folosind obiecte doar pentru a detecta și fixa modelele de comportament ale atributelor lor.

Principalele operații în recunoașterea modelelor folosind metodele discutate sunt operațiunile de determinare a asemănării și diferenței obiectelor. Obiectele din grupul specificat de metode joacă rolul de precedente de diagnosticare. În același timp, în funcție de condițiile unei anumite sarcini, rolul unui precedent individual poate varia în limitele cele mai largi: de la participarea principală și definitorie la participarea foarte indirectă la procesul de recunoaștere. La rândul lor, condițiile problemei pot necesita participarea unui număr diferit de precedente de diagnosticare pentru o soluție de succes: de la unul din fiecare clasă recunoscută la întreaga dimensiune a eșantionului, precum și diferite moduri de a calcula măsurile de similitudine și diferență de obiecte. Aceste cerințe explică împărțirea în continuare a metodelor extensiale în subclase.

Metoda de comparare a prototipurilor

Aceasta este cea mai simplă metodă de recunoaștere extensivă. Este folosit, de exemplu, în cazul în care clasele recunoscute sunt afișate în spațiul caracteristicilor prin grupări geometrice compacte. În acest caz, centrul grupării geometrice a clasei (sau obiectul cel mai apropiat de centru) este de obicei ales ca punct prototip.

Pentru a clasifica un obiect necunoscut, se găsește prototipul cel mai apropiat de acesta, iar obiectul aparține aceleiași clase cu acest prototip. Evident, nu se formează imagini de clasă generalizate în această metodă.

Diferite tipuri de distanțe pot fi utilizate ca măsură a proximității. Adesea pentru caracteristicile dihotomice se folosește distanța Hamming, care în acest caz este egală cu pătratul distanței euclidiene. În acest caz, regula de decizie pentru clasificarea obiectelor este echivalentă cu o funcție de decizie liniară.

Acest fapt trebuie remarcat în mod deosebit. Demonstrează clar legătura dintre prototip și reprezentarea indicativă a informațiilor despre structura datelor. Folosind reprezentarea de mai sus, de exemplu, orice scară de măsurare tradițională, care este o funcție liniară a valorilor caracteristicilor dihotomice, poate fi considerată un prototip de diagnostic ipotetic. La rândul său, dacă analiza structurii spațiale a claselor recunoscute ne permite să concluzionam că acestea sunt compacte din punct de vedere geometric, atunci este suficient să înlocuim fiecare dintre aceste clase cu un prototip, care este de fapt echivalent cu un model de diagnostic liniar.

În practică, desigur, situația este adesea diferită de exemplul idealizat descris. Un cercetător care intenționează să aplice o metodă de recunoaștere bazată pe comparație cu prototipurile claselor de diagnostic se confruntă cu probleme dificile.

În primul rând, este alegerea unei măsuri de proximitate (metrică), care poate schimba semnificativ configurația spațială a distribuției obiectelor. În al doilea rând, o problemă independentă este analiza structurilor multidimensionale ale datelor experimentale. Ambele probleme sunt deosebit de acute pentru cercetător în condiții de dimensiune mare a spațiului caracteristic, ceea ce este tipic pentru problemele reale.

k metoda vecinului apropiat

Metoda k cei mai apropiati vecini pentru rezolvarea problemelor de analiză discriminantă a fost propusă pentru prima dată în 1952. Este după cum urmează.

Când se clasifică un obiect necunoscut, se găsește un număr dat (k) de alte obiecte care sunt cele mai apropiate din punct de vedere geometric de el în spațiul caracteristic (cei mai apropiati vecini) cu aparținând deja cunoscute la clase de recunoscut. Decizia de a atribui un obiect necunoscut unei anumite clase de diagnostic este luată prin analizarea informațiilor despre această apartenență cunoscută a vecinilor săi cei mai apropiați, de exemplu, folosind o simplă numărare a voturilor.

Inițial, metoda k cei mai apropiați vecini a fost considerată o metodă neparametrică pentru estimarea raportului de probabilitate. Pentru această metodă se obțin estimări teoretice ale eficacității sale în comparație cu clasificatorul bayesian optim. Se dovedește că probabilitățile de eroare asimptotică pentru metoda k cel mai apropiat vecin depășesc erorile regulii Bayes de cel mult două ori.

Când se folosește metoda k cei mai apropiati vecini pentru recunoașterea modelelor, cercetătorul trebuie să rezolve problema dificilă a alegerii unei metrici pentru a determina proximitatea obiectelor diagnosticate. Această problemă în condițiile dimensiunii mari a spațiului caracteristic este extrem de agravată din cauza laboriozității suficiente a acestei metode, care devine semnificativă chiar și pentru calculatoarele performante. Prin urmare, aici, ca și în metoda de comparare a prototipurilor, este necesar să se rezolve problema creativă a analizei structurii multidimensionale a datelor experimentale pentru a minimiza numărul de obiecte reprezentând clase de diagnostic.

Necesitatea reducerii numărului de obiecte din eșantionul de antrenament (precedentele de diagnostic) este un dezavantaj al acestei metode, deoarece reduce reprezentativitatea eșantionului de antrenament.

Algoritmi pentru calcularea notelor („vot”)

Principiul de funcționare al algoritmilor de evaluare (ABO) este acela de a calcula priorități (scoruri de similaritate) care caracterizează „proximitatea” obiectelor recunoscute și de referință conform sistemului de ansambluri de caracteristici, care este un sistem de subseturi ale unui set dat de caracteristici. .

Spre deosebire de toate metodele considerate anterior, algoritmii pentru calcularea estimărilor operează cu descrieri de obiecte într-un mod fundamental nou. Pentru acești algoritmi, obiectele există simultan în subspații foarte diferite ale spațiului caracteristic. Clasa ABO aduce ideea utilizării caracteristicilor la finalul său logic: deoarece nu se știe întotdeauna care combinații de caracteristici sunt cele mai informative, în ABO gradul de similitudine al obiectelor se calculează comparând toate combinațiile posibile sau anumite combinații de caracteristici. incluse în descrierile obiectelor.

Combinațiile utilizate de atribute (subspații) se numesc seturi suport sau seturi de descrieri parțiale ale obiectelor. Este introdus conceptul de proximitate generalizată între obiectul recunoscut și obiectele eșantionului de antrenament (cu o clasificare cunoscută), care se numesc obiecte de referință. Această proximitate este reprezentată de o combinație a proximității obiectului recognoscibil cu obiectele de referință calculate pe seturi de descrieri parțiale. Astfel, ABO este o extensie a metodei k vecini cei mai apropiati, în care proximitatea obiectelor este luată în considerare doar într-un spațiu de caracteristici dat.

O altă extensie a ABO este aceea că în acești algoritmi se formulează problema determinării asemănării și diferenței obiectelor ca una parametrică și se selectează etapa de stabilire a ABO în funcție de eșantionul de antrenament, la care valorile optime ale sunt selectați parametrii introduși. Criteriul de calitate este eroarea de recunoaștere și literalmente totul este parametrizat:

  • reguli pentru calcularea proximității obiectelor după caracteristici individuale;
  • reguli pentru calcularea proximității obiectelor în subspații caracteristice;
  • gradul de importanță a unui anumit obiect de referință ca precedent de diagnostic;
  • semnificația contribuției fiecărui set de referință de caracteristici la evaluarea finală a similitudinii obiectului recunoscut cu orice clasă de diagnostic.

Parametrii răcitorului de aer sunt stabiliți sub formă de valori de prag și (sau) ca greutăți ale componentelor indicate.

Posibilitățile teoretice ale ABO sunt cel puțin nu mai mici decât cele ale oricărui alt algoritm de recunoaștere a modelelor, deoarece cu ajutorul ABO pot fi implementate toate operațiunile imaginabile cu obiectele studiate.

Dar, așa cum se întâmplă de obicei, extinderea potențialităților întâmpină mari dificultăți în implementarea lor practică, mai ales în etapa de construire (tuning) algoritmi de acest tip.

Au fost observate dificultăți separate mai devreme când s-a discutat despre metoda k vecini cei mai apropiați, care ar putea fi interpretată ca o versiune trunchiată a ABO. Poate fi considerat și într-o formă parametrică și reduce problema la găsirea unei metrici ponderate de tipul selectat. În același timp, deja aici pentru probleme cu dimensiuni mari, apar întrebări teoretice complexe și probleme asociate cu organizarea unui proces de calcul eficient.

Pentru ABO, dacă încercați să utilizați complet capacitățile acestor algoritmi, aceste dificultăți cresc de multe ori.

Problemele notate explică faptul că, în practică, utilizarea ABO pentru rezolvarea problemelor cu dimensiuni mari este însoțită de introducerea oricăror restricții și presupuneri euristice. În special, există un exemplu de utilizare a ABO în psihodiagnostic, în care a fost testat un tip de ABO, care este de fapt echivalent cu metoda k vecini cei mai apropiați.

Colectivuri cu reguli decisive

La sfârșitul revizuirii metodelor de recunoaștere a modelelor, să ne oprim asupra unei alte abordări. Acestea sunt așa-numitele reguli ale echipelor de decizie (CRC).

Deoarece diferiți algoritmi de recunoaștere se comportă diferit pe același eșantion de obiecte, se pune în mod firesc întrebarea cu privire la o regulă de decizie sintetică care folosește în mod adaptiv punctele forte ale acestor algoritmi. Regula de decizie sintetică folosește o schemă de recunoaștere pe două niveluri. La primul nivel funcționează algoritmii de recunoaștere privat, ale căror rezultate sunt combinate la al doilea nivel în blocul de sinteză. Cele mai comune metode ale unei astfel de combinații se bazează pe alocarea domeniilor de competență ale unui anumit algoritm. Cea mai simplă modalitate de a găsi domenii de competență este împărțirea a priori a spațiului de atribute pe baza considerentelor profesionale ale unei anumite științe (de exemplu, stratificarea eșantionului în funcție de un anumit atribut). Apoi, pentru fiecare dintre zonele selectate, se construiește propriul algoritm de recunoaștere. O altă metodă se bazează pe utilizarea analizei formale pentru a determina zonele locale ale spațiului caracteristic ca vecinătăți de obiecte recunoscute pentru care a fost dovedit succesul unui anumit algoritm de recunoaștere.

Cea mai generală abordare a construirii unui bloc de sinteză consideră indicatorii rezultați ai algoritmilor parțiali ca caracteristici inițiale pentru construirea unei noi reguli de decizie generalizate. În acest caz, pot fi utilizate toate metodele de mai sus de direcții intensionale și extensiale în recunoașterea modelelor. Eficienți pentru rezolvarea problemei creării unui set de reguli de decizie sunt algoritmii logici de tip „Kora” și algoritmii de calcul al estimărilor (ABO), care stau la baza așa-numitei abordări algebrice, care oferă cercetare și o descriere constructivă a algoritmi de recunoaștere, în cadrul cărora se încadrează toate tipurile existente de algoritmi.

Analiza comparativă a metodelor de recunoaștere a modelelor

Să comparăm metodele de recunoaștere a modelelor descrise mai sus și să evaluăm gradul de adecvare a acestora la cerințele formulate în Secțiunea 3.3.3 pentru modelele SDA pentru sisteme de control automate adaptive pentru sisteme complexe.

Pentru rezolvarea problemelor reale din grupul de metode ale direcţiei intensionale au valoare practică metodele parametrice şi metodele bazate pe propuneri pe forma funcţiilor decisive. Metodele parametrice stau la baza metodologiei tradiționale de construire a indicatorilor. Aplicarea acestor metode în probleme reale este asociată cu impunerea unor restricții puternice asupra structurii datelor, care conduc la modele de diagnostic liniare cu estimări foarte aproximative ale parametrilor acestora. Atunci când utilizează metode bazate pe ipoteze despre forma funcțiilor de decizie, cercetătorul este, de asemenea, forțat să apeleze la modele liniare. Acest lucru se datorează dimensiunii mari a spațiului caracteristic, care este tipică pentru problemele reale, care, odată cu creșterea gradului funcției de decizie polinomială, dă o creștere uriașă a numărului de membri ai săi cu o creștere concomitentă problematică a calitatea recunoașterii. Astfel, proiectând aria de aplicare potențială a metodelor de recunoaștere intențională la probleme reale, obținem o imagine care corespunde metodologiei tradiționale bine stabilite a modelelor de diagnostic liniare.

Proprietățile modelelor de diagnostic liniare, în care indicatorul de diagnostic este reprezentat de o sumă ponderată a caracteristicilor inițiale, sunt bine studiate. Rezultatele acestor modele (cu normalizare corespunzătoare) sunt interpretate ca distanțe de la obiectele studiate până la un hiperplan din spațiul caracteristic sau, echivalent, ca proiecții ale obiectelor pe o linie dreaptă din spațiul dat. Prin urmare, modelele liniare sunt adecvate doar pentru configurații geometrice simple ale regiunilor de spațiu caracteristic în care sunt mapate obiecte din diferite clase de diagnosticare. Cu distribuții mai complexe, aceste modele nu pot reflecta în mod fundamental multe caracteristici ale structurii de date experimentale. În același timp, astfel de caracteristici pot oferi informații de diagnosticare valoroase.

În același timp, apariția în orice problemă reală a structurilor multidimensionale simple (în special, distribuțiile normale multidimensionale) ar trebui privită mai degrabă ca o excepție decât ca o regulă. Adesea, clasele de diagnostic se formează pe baza unor criterii externe complexe, ceea ce implică automat eterogenitatea geometrică a acestor clase în spațiul caracteristicilor. Acest lucru este valabil mai ales pentru criteriile de „viață” care sunt cel mai frecvent întâlnite în practică. În astfel de condiții, utilizarea modelelor liniare fixează doar cele mai „aspre” modele de informații experimentale.

Utilizarea metodelor extensive nu este asociată cu nicio presupunere cu privire la structura informațiilor experimentale, cu excepția faptului că în cadrul claselor recunoscute trebuie să existe unul sau mai multe grupuri de obiecte care sunt oarecum similare, iar obiectele din clase diferite trebuie să difere unele de altele în unele cazuri. cale. Este evident că pentru orice dimensiune finită a eșantionului de antrenament (și nu poate fi diferită), această cerință este întotdeauna îndeplinită pur și simplu pentru că există diferențe aleatorii între obiecte. Diferite măsuri de proximitate (distanță) a obiectelor din spațiul caracteristic sunt utilizate ca măsuri de similitudine. Prin urmare, utilizarea eficientă a metodelor de recunoaștere a modelelor extensive depinde de cât de bine sunt determinate aceste măsuri de proximitate, precum și de ce obiecte din eșantionul de antrenament (obiecte cu o clasificare cunoscută) joacă rolul de precedente de diagnostic. Rezolvarea cu succes a acestor probleme dă un rezultat care se apropie de limitele teoretic realizabile ale eficienței recunoașterii.

Avantajele metodelor extensive de recunoaștere a modelelor se opun, în primul rând, complexitatea tehnică ridicată a implementării lor practice. Pentru spațiile caracteristice cu dimensiuni mari, sarcina aparent simplă de a găsi perechi de puncte cele mai apropiate se transformă într-o problemă serioasă. De asemenea, mulți autori notează ca o problemă necesitatea amintirii unui număr suficient de mare de obiecte reprezentând clase recognoscibile.

În sine, aceasta nu este o problemă, dar este percepută ca o problemă (de exemplu, în metoda k cei mai apropiati vecini) pentru că, la recunoașterea fiecărui obiect, are loc o enumerare completă a tuturor obiectelor din eșantionul de antrenament.

Prin urmare, este recomandabil să se aplice modelul sistemului de recunoaștere, în care problema unei enumerări complete a obiectelor eșantionului de antrenament în timpul recunoașterii este eliminată, deoarece se efectuează o singură dată când se formează imagini generalizate ale claselor de recunoaștere. În recunoașterea în sine, obiectul identificat este comparat numai cu imagini generalizate ale claselor de recunoaștere, al căror număr este fix și nu depinde deloc de dimensiunea eșantionului de antrenament. Această abordare vă permite să măriți dimensiunea eșantionului de antrenament până la obținerea calității înalte necesare a imaginilor generalizate, fără teama că aceasta ar putea duce la o creștere inacceptabilă a timpului de recunoaștere (deoarece timpul de recunoaștere în acest model nu depinde de dimensiunea antrenamentului la toate). mostre).

Problemele teoretice ale aplicării metodelor de recunoaștere extensivă sunt legate de problemele de căutare a grupurilor informative de trăsături, găsirea unor metrici optime pentru măsurarea asemănării și diferențelor obiectelor și analiza structurii informațiilor experimentale. În același timp, soluționarea cu succes a acestor probleme permite nu numai proiectarea unor algoritmi de recunoaștere eficienți, ci și realizarea tranziției de la cunoașterea extensivă a faptelor empirice la cunoașterea intensională a tiparelor structurii lor.

Tranziția de la cunoașterea extensivă la cunoașterea intensională are loc în stadiul în care a fost deja construit un algoritm de recunoaștere formală și a fost demonstrată eficacitatea acestuia. Apoi se efectuează studiul mecanismelor prin care se realizează eficiența obținută. Un astfel de studiu, asociat cu analiza structurii geometrice a datelor, poate duce, de exemplu, la concluzia că este suficient să înlocuim obiectele care reprezintă o anumită clasă de diagnostic cu un reprezentant tipic (prototip). Acest lucru este echivalent, după cum sa menționat mai sus, cu scara tradițională de diagnostic liniară. De asemenea, este posibil să fie suficient să înlocuiți fiecare clasă de diagnosticare cu mai multe obiecte care au sens ca reprezentanți tipici ai unor subclase, ceea ce este echivalent cu construirea unui evantai de scale liniare. Există și alte opțiuni, care vor fi discutate mai jos.

Astfel, o trecere în revistă a metodelor de recunoaștere arată că în prezent au fost dezvoltate teoretic o serie de metode diferite de recunoaștere a modelelor. Literatura de specialitate oferă o clasificare detaliată a acestora. Cu toate acestea, pentru majoritatea acestor metode, implementarea lor software este absentă, iar acest lucru este profund natural, s-ar putea spune chiar „predeterminat” de caracteristicile metodelor de recunoaștere în sine. Acest lucru poate fi judecat după faptul că astfel de sisteme sunt puțin menționate în literatura de specialitate și în alte surse de informare.

În consecință, problema aplicabilității practice a anumitor metode de recunoaștere teoretică pentru rezolvarea problemelor practice cu dimensiuni de date reale (adică destul de semnificative) și pe computere moderne reale rămâne insuficient dezvoltată.

Împrejurarea de mai sus poate fi înțeleasă dacă ne amintim că complexitatea modelului matematic crește exponențial complexitatea implementării software a sistemului și în aceeași măsură reduce șansele ca acest sistem să funcționeze în practică. Aceasta înseamnă că numai sisteme software bazate pe modele matematice destul de simple și „transparente” pot fi implementate pe piață. Prin urmare, un dezvoltator interesat de replicarea produsului său software abordează problema alegerii unui model matematic nu din punct de vedere pur științific, ci ca pragmatist, ținând cont de posibilitățile de implementare a software-ului. El consideră că modelul ar trebui să fie cât mai simplu posibil, ceea ce înseamnă că ar trebui implementat la costuri mai mici și cu o calitate mai bună, și ar trebui să funcționeze (să fie practic eficient).

În acest sens, sarcina implementării în sistemele de recunoaștere a unui mecanism de generalizare a descrierilor obiectelor aparținând aceleiași clase, i.e. mecanism de formare a imaginilor compacte generalizate. Este evident că un astfel de mecanism de generalizare va permite „comprimarea” oricărui eșantion de antrenament din punct de vedere al dimensiunii la o bază de imagini generalizate cunoscute dinainte din punct de vedere al dimensiunii. Acest lucru ne va permite, de asemenea, să stabilim și să rezolvăm o serie de probleme care nici măcar nu pot fi formulate în astfel de metode de recunoaștere, cum ar fi comparația cu metoda prototipului, metoda k vecini cei mai apropiați și ABO.

Acestea sunt sarcinile:

  • determinarea contribuției informaționale a caracteristicilor la portretul informațional al unei imagini generalizate;
  • analiza cluster-constructivă a imaginilor generalizate;
  • determinarea încărcării semantice a caracteristicii;
  • analiza cluster-constructivă semantică a caracteristicilor;
  • o comparație semnificativă a imaginilor de clasă generalizate între ele și a caracteristicilor între ele (diagrame cognitive, inclusiv diagrame Merlin).

Metoda care a făcut posibilă rezolvarea acestor probleme distinge și sistemul de perspectivă bazat pe acesta de alte sisteme, la fel cum compilatorii diferă de interpreți, deoarece datorită formării imaginilor generalizate în acest sistem de perspectivă, timpul de recunoaștere este independent de dimensiunea eșantionului de antrenament. Se știe că existența acestei dependențe conduce la un timp practic inacceptabil al computerului petrecut pentru recunoaștere în metode precum metoda k vecinilor cei mai apropiați, ABO și CLD la astfel de dimensiuni ale eșantionului de antrenament, când putem vorbi despre suficiente statistici. .

În încheierea unei scurte treceri în revistă a metodelor de recunoaștere, prezentăm esența celor de mai sus într-un tabel rezumativ (Tabelul 3.1), care conține o scurtă descriere a diferitelor metode de recunoaștere a modelelor în următorii parametri:

  • clasificarea metodelor de recunoaștere;
  • domenii de aplicare a metodelor de recunoaștere;
  • clasificarea limitărilor metodelor de recunoaştere.
Clasificarea metodelor de recunoaștere Zona de aplicare Limitări (dezavantaje)
Metode intensive de recunoaștere Metode bazate pe estimări ale densităților de distribuție a valorilor caracteristicilor (sau asemănări și diferențe între obiecte) Probleme cu o distribuție cunoscută, de obicei normală, necesitatea de a colecta statistici mari Necesitatea de a enumera întregul set de antrenament în timpul recunoașterii, sensibilitate ridicată la nereprezentativitatea setului de antrenament și artefacte
Metode bazate pe ipoteze despre clasa funcțiilor de decizie Clasele ar trebui să fie bine separabile, sistemul de caracteristici ar trebui să fie ortonormal Forma funcției de decizie trebuie cunoscută în prealabil. Imposibilitatea luării în considerare a noilor cunoștințe despre corelațiile dintre trăsături
Metode booleene La selectarea regulilor de decizie logică (conjuncții), este necesară o enumerare completă. Complexitate de calcul ridicată
Metode lingvistice (structurale). Probleme de dimensiuni reduse ale spațiului caracteristic Sarcina de a restabili (defini) gramatica dintr-un anumit set de enunțuri (descrieri ale obiectelor) este dificil de formalizat. Probleme teoretice nerezolvate
Metode extensive de recunoaștere Metoda de comparare a prototipurilor Probleme de dimensiuni reduse ale spațiului caracteristic Dependență ridicată a rezultatelor clasificării de măsurile de distanță (metrice). Valoare optimă necunoscută
k metoda vecinului apropiat Dependență ridicată a rezultatelor clasificării de măsurile de distanță (metrice). Necesitatea unei enumerări complete a eșantionului de formare în timpul recunoașterii. Complexitatea computațională
Algoritmi de calcul a notelor (votare) AVO Probleme de mică dimensiune în ceea ce privește numărul de clase și caracteristici Dependența rezultatelor clasificării de măsura distanței (metrică). Necesitatea unei enumerări complete a eșantionului de formare în timpul recunoașterii. Complexitatea tehnică ridicată a metodei
Colectivuri cu reguli decisive (CRC) Probleme de mică dimensiune în ceea ce privește numărul de clase și caracteristici Complexitatea tehnică foarte mare a metodei, numărul nerezolvat de probleme teoretice, atât în ​​determinarea domeniilor de competență ale anumitor metode, cât și în anumite metode în sine.

Tabelul 3.1 - Tabel rezumativ de clasificare a metodelor de recunoaștere, compararea domeniilor lor de aplicare și limitări

Rolul și locul recunoașterii modelelor în automatizarea managementului sistemelor complexe

Sistemul de control automat este format din două părți principale: obiectul de control și sistemul de control.

Sistemul de control îndeplinește următoarele funcții:

  • identificarea stării obiectului de control;
  • desfasurarea unei actiuni de control bazata pe scopurile managementului, tinand cont de starea obiectului de control si a mediului;
  • oferind un efect de control asupra obiectului de control.

Recunoașterea modelelor nu este altceva decât identificarea stării unui obiect.

Prin urmare, posibilitatea utilizării sistemului de recunoaștere a modelelor în etapa identificării stării obiectului de control pare destul de evidentă și firească. Cu toate acestea, acest lucru poate să nu fie necesar. Prin urmare, se pune întrebarea în ce cazuri este recomandabil să se folosească sistemul de recunoaștere în sistemul de control automat și în care nu este.

Conform datelor din literatură, în multe sisteme de control automat dezvoltate anterior și moderne în subsistemele pentru identificarea stării obiectului de control și generarea de acțiuni de control, sunt utilizate modele matematice deterministe de „numărare directă”, care determină fără ambiguitate și pur și simplu ce să fie face cu obiectul de control dacă are anumiți parametri externi.

În același timp, întrebarea cu privire la modul în care acești parametri sunt relaționați cu anumite stări ale obiectului de control nu este ridicată sau rezolvată. Această poziție corespunde punctului de vedere, care constă în faptul că relația lor unu-la-unu este acceptată „în mod implicit”. Prin urmare, termenii: „parametrii obiectului de control” și „starea obiectului de control” sunt considerați sinonimi, iar conceptul de „stare a obiectului de control” nu este deloc introdus în mod explicit. Cu toate acestea, este evident că, în cazul general, relația dintre parametrii observați ai obiectului de control și starea acestuia este dinamică și probabilistică.

Astfel, sistemele tradiționale de control automatizate sunt în esență sisteme de control parametrice, adică. sisteme care gestionează nu stările obiectului de control, ci doar parametrii observabili ai acestuia. Decizia asupra acțiunii de control este luată în astfel de sisteme ca și cum ar fi „orb”, adică. fără a forma o imagine holistică a obiectului de control și a mediului în starea lor actuală, precum și fără a prezice dezvoltarea mediului și reacția obiectului de control la anumite acțiuni de control asupra acestuia, acționând concomitent cu influența prevăzută a mediului. .

Din pozițiile dezvoltate în această lucrare, termenul de „luare a deciziilor” în sensul modern este cu greu aplicabil sistemelor tradiționale de control automatizat. Cert este că „luarea deciziilor”, cel puțin, implică o viziune holistică a unui obiect din mediu, și nu numai în starea lor actuală, ci și în dinamică și în interacțiune atât între ele, cât și cu sistemul de control, presupune luarea în considerare a diferitelor opțiuni alternative pentru dezvoltarea acestui întreg sistem, precum și îngustarea diversității (reducerea) acestor alternative pe baza anumitor criterii țintă. Nimic din toate acestea, evident, nu este în ACS tradițional, sau este, ci într-o formă simplificată.

Desigur, metoda tradițională este adecvată și aplicarea ei este destul de corectă și justificată în cazurile în care obiectul de control este într-adevăr un sistem stabil și rigid determinat, iar influența mediului asupra acestuia poate fi neglijată.

Cu toate acestea, în alte cazuri, această metodă este ineficientă.

Dacă obiectul de control este dinamic, atunci modelele care stau la baza algoritmilor săi de control devin rapid inadecvate, deoarece relația dintre parametrii de intrare și de ieșire se modifică, precum și setul de parametri esențiali în sine. De fapt, aceasta înseamnă că sistemele tradiționale de control automatizate sunt capabile să controleze starea obiectului de control numai în apropierea punctului de echilibru prin intermediul unor acțiuni slabe de control asupra acestuia, de exemplu. prin metoda micilor perturbaţii. Departe de starea de echilibru, din punct de vedere tradițional, comportamentul obiectului de control pare imprevizibil și incontrolabil.

Dacă nu există o relație neechivocă între parametrii de intrare și de ieșire ai obiectului de control (adică între parametrii de intrare și starea obiectului), cu alte cuvinte, dacă această relație are o natură probabilistică pronunțată, atunci modelele deterministe, în despre care se presupune că rezultatul măsurării unui anumit parametru este pur și simplu număr, inițial neaplicabil. În plus, forma acestei conexiuni poate fi pur și simplu necunoscută și atunci este necesar să pornim de la ipoteza cea mai generală: că este probabilistică sau nu este deloc definită.

Un sistem de control automat construit pe principii tradiționale poate funcționa numai pe baza unor parametri, ale căror modele de relații sunt deja cunoscute, studiate și reflectate în modelul matematic, în acest studiu a fost stabilită sarcina de a dezvolta astfel de metode pentru proiectarea controlului automatizat. sisteme care vor permite crearea de sisteme care să identifice și să stabilească cei mai importanți parametri și să determine natura legăturilor dintre aceștia și stările obiectului de control.

În acest caz, este necesar să se aplice metode de măsurare mai dezvoltate și adecvate situației reale:

  • clasificare sau recunoaștere a modelelor (învățare pe baza unui eșantion de antrenament, adaptabilitatea algoritmilor de recunoaștere, adaptabilitatea seturilor de clase și a parametrilor studiați, selectarea parametrilor cei mai semnificativi și reducerea dimensiunii descrierii cu menținerea unei redundanțe date etc.);
  • măsurători statistice, atunci când rezultatul măsurării unui anumit parametru nu este un singur număr, ci o distribuție de probabilitate: o modificare a unei variabile statistice nu înseamnă o modificare a valorii acesteia în sine, ci o modificare a caracteristicilor distribuției de probabilitate a valorile sale.

Ca urmare, sistemele de control automatizate bazate pe abordarea deterministă tradițională practic nu funcționează cu obiecte de control dinamice complexe, multi-parametrice slab determinate, cum ar fi, de exemplu, sistemele macro și micro-socio-economice într-o economie dinamică a „ perioada de tranziție”, elita ierarhică și grupurile etnice, societatea și electoratul, fiziologia și psihicul uman, ecosistemele naturale și artificiale și multe altele.

Este foarte semnificativ faptul că, la mijlocul anilor 80, școala lui I.Prigozhin a dezvoltat o abordare, conform căreia, în dezvoltarea oricărui sistem (inclusiv a unei persoane), alternează perioade în care sistemul se comportă fie ca „în mare parte determinist”, sau ca „în mare parte aleatorie”. Desigur, un sistem de control real trebuie să gestioneze stabil obiectul de control nu numai în secțiunile „deterministe” ale istoriei sale, ci și în punctele în care comportamentul său ulterior devine extrem de incert. Numai acest lucru înseamnă că este necesar să se dezvolte abordări ale managementului sistemelor în comportamentul cărora există un element mare de aleatorie (sau ceea ce în prezent este descris matematic drept „aleatorie”).

Prin urmare, compoziția sistemelor de control automate promițătoare care asigură controlul sistemelor complexe dinamice multiparametrice slab deterministe, ca verigi funcționale esențiale, va include aparent subsisteme pentru identificarea și prezicerea stărilor mediului și a obiectului de control, bazate pe metode de inteligență artificială. (în primul rând recunoașterea modelelor), metode de sprijinire a luării deciziilor și teoria informației.

Să luăm în considerare pe scurt problema utilizării sistemelor de recunoaștere a imaginii pentru a lua o decizie cu privire la o acțiune de control (această problemă va fi discutată mai detaliat mai târziu, deoarece este cea cheie pentru această lucrare). Dacă luăm ținta și alte stări ale obiectului de control ca clase de recunoaștere, iar factorii care îl influențează ca trăsături, atunci se poate forma o măsură a relației dintre factori și stări în modelul de recunoaștere a modelelor. Aceasta permite obținerea de informații despre factorii care contribuie sau împiedică trecerea acestuia în această stare, pe baza unei stări date a obiectului de control și, pe această bază, elaborarea unei decizii asupra acțiunii de control.

Factorii pot fi împărțiți în următoarele grupe:

  • caracterizarea preistoriei obiectului de control;
  • caracterizarea stării curente a obiectului de control;
  • factori de mediu;
  • factori tehnologici (gestionați).

Astfel, sistemele de recunoaștere a imaginilor pot fi utilizate ca parte a unui sistem de control automat: în subsisteme de identificare a stării unui obiect de control și generare de acțiuni de control.

Acest lucru este util atunci când obiectul de control este un sistem complex.

Luarea unei decizii asupra acțiunii de control în sistemul de control automatizat

Soluția problemei sintezei sistemelor de control automate adaptive prin sisteme complexe este luată în considerare în această lucrare, ținând cont de numeroase și profunde analogii între metodele de recunoaștere a modelelor și luarea deciziilor.

Pe de o parte, sarcina recunoașterii modelelor este o decizie privind apartenența unui obiect de recunoscut la o anumită clasă de recunoaștere.

Pe de altă parte, problema luării deciziilor este considerată de autori ca o problemă de decodare inversă sau o problemă de recunoaștere a modelelor inverse (vezi secțiunea 2.2.2).

Comunitatea ideilor de bază care stau la baza metodelor de recunoaștere a modelelor și de luare a deciziilor devine deosebit de evidentă atunci când le analizăm din punctul de vedere al teoriei informației.

Varietate de sarcini de luare a deciziilor

Luarea deciziilor ca realizare a unui scop

Definiție: luarea unei decizii („alegerea”) este o acțiune asupra unui set de alternative, în urma căreia setul inițial de alternative se restrânge, de exemplu. este redusă.

Alegerea este o acțiune care dă scop oricărei activități. Prin acte de alegere se realizează subordonarea tuturor activităților unui anumit scop sau unui set de scopuri interconectate.

Astfel, pentru ca actul de alegere să devină posibil, sunt necesare următoarele:

  • generarea sau descoperirea unui set de alternative pentru a face o alegere;
  • determinarea scopurilor pentru atingerea cărora se face alegerea;
  • dezvoltarea și aplicarea unei metode de comparare a alternativelor între ele, de ex. determinarea unui rating de preferință pentru fiecare alternativă în funcție de anumite criterii, permițând evaluarea indirectă a modului în care fiecare alternativă îndeplinește obiectivul.

Lucrările moderne în domeniul suportului decizional au relevat o situație caracteristică, care constă în faptul că formalizarea completă a găsirii celei mai bune (într-un anumit sens) soluție este posibilă numai pentru probleme bine studiate, relativ simple, în timp ce în practică, Problemele slab structurate sunt mai frecvente, pentru care nu au fost dezvoltați algoritmi complet formalizați (cu excepția enumerarii exhaustive și încercări și erori). Cu toate acestea, profesioniștii cu experiență, competenți și capabili fac adesea alegeri care se dovedesc a fi destul de bune. Prin urmare, tendința actuală în practica de luare a deciziilor în situații naturale este aceea de a combina capacitatea unei persoane de a rezolva probleme neformalizate cu capacitățile metodelor formale și modelării computerizate: sisteme interactive de sprijinire a deciziei, sisteme expert, adaptativ om-mașină automatizat. sisteme de control, rețele neuronale și sisteme cognitive.

Luarea deciziilor ca eliminare a incertitudinii (abordarea informațională)

Procesul de obținere a informațiilor poate fi considerat ca o scădere a incertitudinii ca urmare a primirii unui semnal, iar cantitatea de informații - ca o măsură cantitativă a gradului de eliminare a incertitudinii.

Dar ca urmare a alegerii unui subset de alternative din set, i.e. ca urmare a luării unei decizii se întâmplă același lucru (scăderea incertitudinii). Aceasta înseamnă că fiecare alegere, fiecare decizie generează o anumită cantitate de informație și, prin urmare, poate fi descrisă în termeni de teoria informației.

Clasificarea problemelor de luare a deciziilor

Multiplicitatea sarcinilor de luare a deciziilor se datorează faptului că fiecare componentă a situației în care se realizează luarea deciziilor poate fi implementată în moduri calitativ diferite.

Iată doar câteva dintre aceste opțiuni:

  • setul de alternative, pe de o parte, poate fi finit, numărabil sau continuu, iar pe de altă parte, poate fi închis (adică complet cunoscut) sau deschis (inclusiv elemente necunoscute);
  • evaluarea alternativelor poate fi efectuată după unul sau mai multe criterii, care, la rândul lor, pot fi cantitative sau calitative;
  • modul de selecție poate fi unic (o singură dată), sau multiplu, repetitiv, incluzând feedback cu privire la rezultatele selecției, de ex. permițând învățarea algoritmilor de luare a deciziilor, ținând cont de consecințele alegerilor anterioare;
  • consecințele alegerii fiecărei alternative pot fi cunoscute exact dinainte (alegerea sub certitudine), au o natură probabilistică atunci când sunt făcute probabilitățile de rezultate posibile după alegere (alegerea sub risc) sau au un rezultat ambiguu cu probabilități necunoscute (alegerea sub incertitudine). );
  • responsabilitatea pentru alegere poate fi absentă, individuală sau de grup;
  • gradul de consecvență al obiectivelor într-o alegere de grup poate varia de la coincidența completă a intereselor părților (alegere cooperativă) până la opusul acestora (alegerea într-o situație conflictuală). Sunt posibile și opțiuni intermediare: un compromis, o coaliție, un conflict în creștere sau stingere.

Diverse combinații ale acestor opțiuni duc la numeroase probleme de luare a deciziilor care au fost studiate în grade diferite.

Limbi pentru descrierea metodelor de luare a deciziilor

Unul și același fenomen poate fi vorbit în diferite limbi, cu diferite grade de generalitate și adecvare. Până în prezent, au existat trei limbi principale pentru descrierea alegerii.

Cel mai simplu, mai dezvoltat și mai popular este limbajul de criterii.

Limbajul criteriilor

Numele acestui limbaj este asociat cu ipoteza de bază că fiecare alternativă individuală poate fi evaluată printr-un anumit număr (un singur), după care compararea alternativelor se reduce la o comparație a numerelor lor corespunzătoare.

Fie, de exemplu, (X) o mulțime de alternative și x o alternativă definită aparținând acestei mulțimi: x∈X. Atunci se consideră că pentru tot x poate fi dată o funcție q(x), care se numește criteriu (criteriu de calitate, funcție obiectiv, funcție de preferință, funcție de utilitate etc.), care are proprietatea că dacă alternativa x 1 este preferabil x 2 (notat: x 1 > x 2), apoi q (x 1) > q (x 2).

În acest caz, alegerea se reduce la găsirea unei alternative cu cea mai mare valoare a funcției de criteriu.

Cu toate acestea, în practică, utilizarea unui singur criteriu pentru compararea gradului de preferință al alternativelor se dovedește a fi o simplificare nejustificată, deoarece o luare în considerare mai detaliată a alternativelor duce la necesitatea evaluării acestora nu în funcție de una, ci în funcție de multe. criterii care pot fi de altă natură și calitativ diferite unele de altele.

De exemplu, la alegerea celui mai acceptabil tip de aeronavă pentru pasageri și organizația de operare pe anumite tipuri de rute, comparația se realizează simultan după mai multe grupe de criterii: tehnice, tehnologice, economice, sociale, ergonomice etc.

Problemele multicriteriale nu au o soluție generală unică. Prin urmare, sunt propuse multe modalități de a da unei probleme multicriteriale o formă particulară care să permită o singură soluție generală. Desigur, aceste soluții sunt în general diferite pentru diferite metode. Prin urmare, poate că principalul lucru în rezolvarea unei probleme cu mai multe criterii este justificarea acestui tip de formulare.

Sunt utilizate diverse opțiuni pentru simplificarea problemei de selecție multicriterială. Să enumerăm câteva dintre ele.

  1. Maximizarea condiționată (nu se găsește extremul global al criteriului integral, ci extremul local al criteriului principal).
  2. Căutați o alternativă cu proprietăți date.
  3. Găsirea mulțimii Pareto.
  4. Reducerea unei probleme cu mai multe criterii la una cu un singur criteriu prin introducerea unui criteriu integral.

Să luăm în considerare mai detaliat formularea formală a metodei de reducere a unei probleme multicriteriale la una cu un singur criteriu.

Introducem criteriul integral q 0 (x) ca functie scalara a argumentului vectorial:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

Criteriul integral permite ordonarea alternativelor după q 0 , evidențiind astfel pe cea mai bună (în sensul acestui criteriu). Forma funcției q 0 este determinată de cât de specific ne imaginăm contribuția fiecărui criteriu la criteriul integral. De obicei se folosesc funcții aditive și multiplicative:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Coeficienții s i oferă:

  1. Adimensionalitate sau o singură dimensiune a numărului a i ⋅q i /s i (diferite criterii particulare pot avea dimensiuni diferite, iar atunci este imposibil să se efectueze operații aritmetice asupra lor și să le reducă la un criteriu integral).
  2. Normalizarea, adică prevederea condiției: b i ⋅q i /s i<1.

Coeficienții a i și b i reflectă contribuția relativă a anumitor criterii q i la criteriul integral.

Deci, într-un cadru multicriterial, problema luării unei decizii privind alegerea uneia dintre alternative se reduce la maximizarea criteriului integral:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Principala problemă în formularea multicriterială a problemei decizionale este că este necesară găsirea unei astfel de forme analitice a coeficienților a i și b i , care să ofere următoarele proprietăți ale modelului:

  • un grad ridicat de adecvare a domeniului subiectului și a punctului de vedere al experților;
  • dificultăți de calcul minime în maximizarea criteriului integral, i.e. calculul acestuia pentru diferite alternative;
  • stabilitatea rezultatelor maximizării criteriului integral de la mici perturbări ale datelor inițiale.
  • Stabilitatea soluției înseamnă că o mică modificare a datelor inițiale ar trebui să conducă la o mică modificare a valorii criteriului integral și, în consecință, la o mică modificare a deciziei luate. Astfel, dacă datele inițiale sunt practic aceleași, atunci decizia ar trebui luată fie la fel, fie foarte aproape.

Limbajul de selecție binară secvențială

Limbajul relațiilor binare este o generalizare a limbajului multicriterial și se bazează pe faptul că atunci când evaluăm o alternativă, această evaluare este întotdeauna relativă, i.e. explicit sau mai adesea implicit, alte alternative din setul studiat sau din populația generală sunt folosite ca bază sau cadru de referință pentru comparație. Gândirea umană se bazează pe căutarea și analiza contrariilor (constructelor), așa că ne este întotdeauna mai ușor să alegem una dintre cele două opțiuni opuse decât o opțiune dintr-un set mare și deloc dezordonat.

Astfel, principalele ipoteze ale acestui limbaj se rezumă la următoarele:

  • o singură alternativă nu este evaluată, adică nu este introdusă funcția de criteriu;
  • pentru fiecare pereche de alternative, se poate stabili într-un fel că una dintre ele este preferabilă celeilalte, sau că sunt echivalente sau incomparabile;
  • relația de preferință în orice pereche de alternative nu depinde de celelalte alternative prezentate pentru alegere.

Există diferite moduri de a specifica relații binare: directă, matriceală, folosind grafice de preferințe, metoda secțiunilor etc.

Relațiile dintre alternativele unei perechi sunt exprimate prin conceptele de echivalență, ordine și dominanță.

Funcții generalizate ale limbajului de alegere

Limbajul funcțiilor de alegere se bazează pe teoria mulțimilor și permite operarea cu mapări ale mulțimilor la submulțimile lor corespunzătoare diferitelor alegeri fără a fi nevoie de a enumera elemente. Acest limbaj este foarte general și poate permite descrierea oricărei opțiuni. Cu toate acestea, aparatul matematic al funcțiilor de alegere generalizată este în prezent dezvoltat și testat în principal pe probleme care au fost deja rezolvate folosind abordările criteriale sau binare.

alegerea grupului

Să existe un grup de oameni care au dreptul de a lua parte la luarea deciziilor colective. Să presupunem că acest grup ia în considerare un set de alternative și fiecare membru al grupului își face alegerea. Sarcina este de a dezvolta o soluție care într-un anumit fel coordonează alegerile individuale și într-un anumit sens exprimă „opinia generală” a grupului, adică. luată ca o alegere de grup.

Desigur, deciziile de grup diferite vor corespunde unor principii diferite de coordonare a deciziilor individuale.

Regulile de coordonare a deciziilor individuale într-o alegere de grup se numesc reguli de vot. Cea mai frecventă este „regula majorității”, în care decizia de grup este luată de alternativa care primește cele mai multe voturi.

Trebuie înțeles că o astfel de decizie reflectă doar prevalența diferitelor puncte de vedere în grup și nu o opțiune cu adevărat optimă, pentru care nimeni nu poate vota deloc. „Adevărul nu se stabilește prin vot”.

În plus, există așa-numitele „paradoxuri ale votului”, dintre care cel mai faimos este paradoxul lui Arrow.

Aceste paradoxuri pot duce, și uneori duc, la caracteristici foarte neplăcute ale procedurii de vot: de exemplu, există cazuri în care grupul nu poate lua deloc o singură decizie (nu există cvorum sau fiecare votează pentru propria opțiune unică etc.) .), iar uneori (în cazul votului în mai multe etape) minoritatea își poate impune voința majorității.

Alegerea sub Incertitudine

Certitudinea este un caz special de incertitudine și anume: este o incertitudine aproape de zero.

În teoria modernă a alegerii, se crede că există trei tipuri principale de incertitudine în problemele de luare a deciziilor:

  1. Incertitudinea informațională (statistică) a datelor inițiale pentru luarea deciziilor.
  2. Incertitudinea consecințelor luării deciziilor (alegerea).
  3. Vagitatea în descrierea componentelor procesului decizional.

Să le considerăm în ordine.

Incertitudine informațională (statistică) în datele inițiale

Datele obținute despre domeniul subiectului nu pot fi considerate ca fiind absolut exacte. În plus, este evident că aceste date nu ne interesează în sine, ci doar ca semnale care, poate, poartă anumite informații despre ceea ce ne interesează cu adevărat. Astfel, este mai realist să considerăm că avem de-a face cu date nu doar zgomotoase și inexacte, ci și indirecte și, eventual, incomplete. În plus, aceste date nu privesc întreaga populație (generală) studiată, ci doar un anumit subset al acesteia, despre care am putut de fapt să colectăm date, dar în același timp dorim să tragem concluzii despre întreaga populație, și vrem să cunoaștem și gradul de fiabilitate al acestor concluzii.

În aceste condiţii se foloseşte teoria deciziilor statistice.

Există două surse principale de incertitudine în această teorie. În primul rând, nu se știe ce distribuție respectă datele originale. În al doilea rând, nu se știe ce distribuție are mulțimea (populația generală) despre care dorim să tragem concluzii din submulțimea acesteia care formează datele inițiale.

Procedurile statistice sunt procedurile de luare a deciziilor care înlătură ambele tipuri de incertitudine.

Trebuie remarcat faptul că există o serie de motive care duc la aplicarea incorectă a metodelor statistice:

  • inferențe statistice, ca oricare altele, au întotdeauna o anumită fiabilitate sau certitudine. Dar, spre deosebire de multe alte cazuri, fiabilitatea constatărilor statistice este cunoscută și determinată în cursul cercetării statistice;
  • calitatea solutiei obtinute in urma aplicarii procedurii statistice depinde de calitatea datelor initiale;
  • datele care nu au caracter statistic nu ar trebui să fie supuse prelucrării statistice;
  • este necesar să se utilizeze proceduri statistice corespunzătoare nivelului de informații a priori despre populația studiată (de exemplu, nu ar trebui să aplicați metode de analiză a varianței datelor non-Gauss). Dacă distribuția datelor originale este necunoscută, atunci trebuie fie să o stabilească, fie să folosească mai multe metode diferite și să compare rezultatele. Dacă sunt foarte diferite, aceasta indică inaplicabilitatea unora dintre procedurile utilizate.

Incertitudinea consecințelor

Atunci când consecințele alegerii unei alternative sunt determinate în mod unic de alternativa în sine, atunci nu putem distinge între o alternativă și consecințele ei, luând de la sine înțeles că alegerea unei alternative, noi de fapt alegem consecințele acesteia.

Cu toate acestea, în practica reală, de multe ori se confruntă cu o situație mai complexă, când alegerea uneia sau alteia alternative determină în mod ambiguu consecințele alegerii făcute.

În cazul unui set discret de alternative și rezultate la alegere, cu condiția ca setul de rezultate posibile să fie comun tuturor alternativelor, putem presupune că diferitele alternative diferă unele de altele în distribuția probabilităților de rezultat. Aceste distribuții de probabilitate, în cazul general, pot depinde de rezultatele alegerii alternativelor și de rezultatele care rezultă efectiv din aceasta. În cel mai simplu caz, rezultatele sunt la fel de probabile. Rezultatele în sine au de obicei semnificația de câștiguri sau pierderi și sunt cuantificate.

Dacă rezultatele sunt egale pentru toate alternativele, atunci nu există nimic de ales. Dacă sunt diferite, atunci alternativele pot fi comparate prin introducerea unor estimări cantitative pentru ele. Varietatea problemelor din teoria jocurilor este asociată cu o alegere diferită a caracteristicilor numerice ale pierderilor și câștigurilor ca urmare a alegerii alternativelor, diferitelor grade de conflict între părțile care aleg alternative etc.

Considerați acest tip de incertitudine ca incertitudine vagă

Orice problemă de alegere este un scop de restrângere a setului de alternative. Atât o descriere formală a alternativelor (lista lor în sine, o listă a atributelor sau parametrilor lor), cât și o descriere a regulilor de comparare a acestora (criterii, relații) sunt întotdeauna date în termeni de una sau alta scară de măsurare (chiar și atunci când cel care asta nu știe despre asta).

Se știe că toate scalele sunt neclare, dar în grade diferite. Termenul de „blur” se referă la proprietatea scalelor, care constă în faptul că întotdeauna este posibil să se prezinte două alternative care se pot distinge, i.e. diferită într-o singură scară și imposibil de distins, adică sunt identice, în celălalt - mai neclare. Cu cât sunt mai puține gradații într-o anumită scară, cu atât este mai neclară.

Astfel, putem vedea clar alternativele și, în același timp, le putem clasifica vag, i.e. să fie ambigue cu privire la clasele cărora le aparțin.

Deja în prima lor lucrare privind luarea deciziilor într-o situație neclară, Bellman și Zadeh au prezentat ideea că atât obiectivele, cât și constrângerile ar trebui reprezentate ca seturi fuzzy (fuzzy) pe un set de alternative.

Despre unele limitări ale abordării optimizării

În toate problemele de selecție și metodele de luare a deciziilor luate în considerare mai sus, problema a fost găsirea celor mai bune în setul inițial în condiții date, adică. alternative optime într-un anumit sens.

Ideea de optimitate este ideea centrală a ciberneticii și a intrat ferm în practica de proiectare și operare a sistemelor tehnice. În același timp, această idee necesită o atitudine prudentă atunci când încercăm să o transferăm în domeniul managementului unor sisteme complexe, mari și slab determinate, precum, de exemplu, sistemele socio-economice.

Există motive întemeiate pentru această concluzie. Să luăm în considerare câteva dintre ele:

  1. Soluția optimă se dovedește adesea a fi instabilă, adică. modificări minore în condițiile problemei, datele de intrare sau constrângerile pot duce la selectarea unor alternative semnificativ diferite.
  2. Modelele de optimizare au fost dezvoltate numai pentru clase restrânse de sarcini destul de simple, care nu reflectă întotdeauna în mod adecvat și sistematic obiectele de control reale. Cel mai adesea, metodele de optimizare fac posibilă optimizarea doar a subsistemelor destul de simple și bine descrise formal ale unor sisteme mari și complexe, de ex. permite doar optimizarea locală. Cu toate acestea, dacă fiecare subsistem al unui sistem mare funcționează optim, aceasta nu înseamnă deloc că sistemul în ansamblu va funcționa și el optim. Prin urmare, optimizarea unui subsistem nu duce neapărat la comportamentul acestuia, care este cerut de acesta atunci când optimizează sistemul în ansamblu. Mai mult, uneori optimizarea locală poate duce la consecințe negative pentru întregul sistem. Prin urmare, la optimizarea subsistemelor și a sistemului în ansamblu, este necesar să se determine arborele obiectivelor și subscopurilor și prioritatea acestora.
  3. Adesea, maximizarea criteriului de optimizare conform unui model matematic este considerată a fi scopul optimizării, dar în realitate scopul este optimizarea obiectului de control. Criteriile de optimizare și modelele matematice sunt întotdeauna legate de obiectiv doar indirect, adică. mai mult sau mai puțin adecvat, dar întotdeauna aproximativ.

Astfel, ideea de optimitate, care este extrem de fructuoasă pentru sistemele care se pretează la o formalizare matematică adecvată, trebuie transferată cu prudență în sistemele complexe. Desigur, modelele matematice care pot fi propuse uneori pentru astfel de sisteme pot fi optimizate. Totuși, trebuie să se țină cont întotdeauna de simplificarea puternică a acestor modele, care în cazul sistemelor complexe nu mai poate fi neglijată, precum și de faptul că gradul de adecvare al acestor modele în cazul sistemelor complexe este de fapt necunoscut. . Prin urmare, nu se știe ce semnificație pur practică are această optimizare. Practicitatea ridicată a optimizării în sistemele tehnice nu ar trebui să dea naștere iluziei că va fi la fel de eficientă în optimizarea sistemelor complexe. Modelarea matematică semnificativă a sistemelor complexe este foarte dificilă, aproximativă și inexactă. Cu cât sistemul este mai complex, cu atât ar trebui să fie mai atent ideea de optimizare a acestuia.

Prin urmare, atunci când dezvoltă metode de control pentru sisteme complexe, mari, slab determinate, autorii iau în considerare principalul lucru nu numai optimitatea abordării alese din punct de vedere matematic formal, ci și adecvarea acesteia la scopul și natura însăși a obiect de control.

Metode de selecție experți

În studiul sistemelor complexe apar adesea probleme care, din diverse motive, nu pot fi puse și rezolvate riguros folosind aparatul matematic dezvoltat în prezent. În aceste cazuri se apelează la serviciile experților (analiști de sistem), a căror experiență și intuiție ajută la reducerea complexității problemei.

Cu toate acestea, trebuie luat în considerare faptul că experții înșiși sunt sisteme extrem de complexe, iar activitățile lor depind și de multe condiții externe și interne. Prin urmare, în metodele de organizare a evaluărilor experților, se acordă multă atenție creării de condiții externe și psihologice favorabile pentru munca experților.

Următorii factori influențează munca unui expert:

  • responsabilitatea pentru utilizarea rezultatelor examinării;
  • știind că sunt implicați alți experți;
  • disponibilitatea informațiilor de contact între experți;
  • relațiile interpersonale ale experților (dacă există un contact de informații între aceștia);
  • interesul personal al expertului în rezultatele evaluării;
  • calitățile personale ale experților (stima de sine, conformitate, voință etc.)

Interacțiunea dintre experți le poate stimula sau inhiba activitatea. Prin urmare, în diferite cazuri, sunt utilizate diferite metode de examinare, care diferă prin natura interacțiunii experților între ei: sondaje și chestionare anonime și deschise, întâlniri, discuții, jocuri de afaceri, brainstorming etc.

Există diverse metode de prelucrare matematică a opiniilor experților. Experții sunt rugați să evalueze diferite alternative fie printr-un singur indicator, fie printr-un sistem de indicatori. În plus, li se cere să evalueze gradul de importanță al fiecărui indicator („greutatea” sau „contribuția” acestuia). Experților înșiși li se atribuie și un nivel de competență corespunzător contribuției fiecăruia dintre ei la opinia rezultată a grupului.

O metodă dezvoltată de lucru cu experți este metoda „Delphi”. Ideea principală a acestei metode este că critica și argumentarea au un efect benefic asupra expertului, dacă stima de sine nu este afectată și sunt prevăzute condiții care exclud confruntarea personală.

Trebuie subliniat că există o diferență fundamentală în natura utilizării metodelor experte în sistemele expert și în suportul decizional. Dacă în primul caz, experții sunt obligați să oficializeze metodele de luare a deciziilor, atunci în al doilea - doar decizia în sine, ca atare.

Deoarece experții sunt implicați în implementarea tocmai a acelor funcții care în prezent fie nu sunt furnizate deloc de sistemele automate, fie sunt realizate mai rău decât de oameni, o direcție promițătoare în dezvoltarea sistemelor automate este automatizarea maximă a acestor funcții.

Sisteme automate de sprijinire a deciziilor

O persoană a folosit întotdeauna asistenți în luarea deciziilor: ei au fost pur și simplu furnizori de informații despre obiectul de control și consultanți (consilieri) care oferă opțiuni pentru decizii și analizează consecințele acestora. O persoană care ia decizii le lua întotdeauna într-un anumit mediu informațional: pentru un comandant militar, acesta este un cartier general, pentru un rector, un consiliu academic, pentru un ministru, un colegiu.

În vremea noastră, infrastructura informațională de luare a deciziilor este de neconceput fără sisteme automate de evaluare iterativă a deciziilor, și mai ales sisteme de sprijinire a deciziilor (DDS - Decision Support Systems), adică. sisteme automate care sunt special concepute pentru a pregăti informațiile de care o persoană are nevoie pentru a lua o decizie. Dezvoltarea sistemelor de sprijinire a deciziilor se realizează, în special, în cadrul unui proiect internațional derulat sub auspiciile Institutului Internațional de Analiză a Sistemelor Aplicate din Laxenburg (Austria).

Alegerea în situații reale necesită efectuarea unui număr de operații, dintre care unele sunt efectuate mai eficient de către o persoană, iar altele de către o mașină. Combinația eficientă a avantajelor lor cu compensarea simultană a deficiențelor este întruchipată în sistemele automate de sprijinire a deciziilor.

O persoană ia decizii mai bine decât o mașină în condiții de incertitudine, dar pentru a lua decizia corectă, are nevoie și de informații adecvate (complete și de încredere) care să caracterizeze domeniul subiectului. Cu toate acestea, se știe că o persoană nu face față bine unor volume mari de informații „brute” neprocesate. Prin urmare, rolul mașinii în suportul decizional poate fi acela de a efectua pregătirea preliminară a informațiilor despre obiectul de control și factorii necontrolabili (mediu), pentru a ajuta la vizualizarea consecințelor luării anumitor decizii și, de asemenea, să prezinte toate aceste informații într-un mod vizual. şi mod convenabil.pentru luarea deciziilor formular.

Astfel, sistemele automate de sprijinire a deciziilor compensează punctele slabe ale unei persoane, eliberându-l de procesarea preliminară de rutină a informațiilor și îi oferă acestuia un mediu informațional confortabil în care își poate arăta mai bine punctele forte. Aceste sisteme sunt concentrate nu pe automatizarea funcțiilor decidentului (și, prin urmare, înstrăinarea acestor funcții de el și, prin urmare, responsabilitatea pentru deciziile luate, ceea ce este adesea inacceptabil), ci pe acordarea de asistență în găsirea unui solutie buna.