Definícia rozpoznávania vzoru. Klasifikácia podľa najbližšieho priemeru

Živé systémy, vrátane ľudí, sa od svojho vzniku neustále stretávajú s úlohou rozpoznávania vzorov. Predovšetkým informácie prichádzajúce zo zmyslových orgánov spracováva mozog, ktorý informácie triedi, zabezpečuje rozhodovanie a následne pomocou elektrochemických impulzov prenáša potrebný signál ďalej, napríklad do pohybových orgánov. , ktoré vykonávajú potrebné úkony. Potom dôjde k zmene prostredia a opäť nastanú vyššie uvedené javy. A ak sa pozriete, každá fáza je sprevádzaná uznaním.

S rozvojom výpočtovej techniky bolo možné vyriešiť množstvo problémov, ktoré vznikajú v procese života, uľahčiť, urýchliť a zlepšiť kvalitu výsledku. Napríklad fungovanie rôznych systémov na podporu života, interakcia človeka s počítačom, vznik robotických systémov atď. Poznamenávame však, že v súčasnosti nie je možné poskytnúť uspokojivý výsledok pri niektorých úlohách (rozpoznanie rýchlo sa pohybujúcich podobných objektov , ručne písaný text).

Účel práce: študovať históriu systémov rozpoznávania vzorov.

Uveďte kvalitatívne zmeny, ktoré sa vyskytli v oblasti rozpoznávania vzorov, teoretické aj technické, s uvedením dôvodov;

Diskutujte o metódach a princípoch používaných vo výpočtovej technike;

Uveďte príklady perspektív, ktoré sa očakávajú v blízkej budúcnosti.

1. Čo je rozpoznávanie vzorov?

Prvý výskum s výpočtovou technikou vychádzal v podstate z klasickej schémy matematického modelovania - matematický model, algoritmus a výpočet. Boli to úlohy modelovania procesov vyskytujúcich sa pri výbuchoch atómových bômb, výpočtu balistických trajektórií, ekonomických a iných aplikácií. Okrem klasických myšlienok tohto radu však existovali aj metódy založené na úplne inom charaktere a ako prax riešenia niektorých problémov ukázala, často dávali lepšie výsledky ako riešenia založené na príliš komplikovaných matematických modeloch. Ich myšlienkou bolo opustiť túžbu vytvoriť vyčerpávajúci matematický model skúmaného objektu (navyše často bolo prakticky nemožné skonštruovať adekvátne modely) a uspokojiť sa s odpoveďou len na konkrétne otázky, ktoré nás zaujímajú a tieto odpovede by sa mali hľadať v úvahách spoločných pre širokú triedu problémov. Výskum tohto druhu zahŕňal rozpoznávanie vizuálnych obrazov, predpovedanie výnosov, hladiny riek, problém rozlíšenia medzi ropou a zvodnenými vrstvami pomocou nepriamych geofyzikálnych údajov atď. V týchto úlohách bola potrebná konkrétna odpoveď v pomerne jednoduchej forme, ako napr. napríklad, či objekt patrí do jednej z vopred určených tried. A počiatočné údaje o týchto úlohách boli spravidla uvedené vo forme fragmentárnych informácií o skúmaných objektoch, napríklad vo forme súboru vopred klasifikovaných objektov. Z matematického hľadiska to znamená, že rozpoznávanie vzorov (a táto trieda problémov bola v našej krajine pomenovaná) je ďalekosiahlym zovšeobecnením myšlienky extrapolácie funkcií.

Význam takejto formulácie pre technické vedy je nepochybný a to samo osebe odôvodňuje početné štúdie v tejto oblasti. Problém rozpoznávania vzorov má však pre prírodné vedy aj širší aspekt (bolo by však zvláštne, keby niečo také dôležité pre umelé kybernetické systémy nebolo dôležité pre prírodné). Kontext tejto vedy organicky zahŕňal otázky starovekých filozofov o povahe nášho poznania, našej schopnosti rozpoznávať obrazy, vzory, situácie sveta okolo nás. V skutočnosti prakticky niet pochýb o tom, že mechanizmy na rozpoznávanie tých najjednoduchších obrazov, akými sú obrazy blížiaceho sa nebezpečného predátora alebo potravy, sa sformovali oveľa skôr, ako vznikol elementárny jazyk a formálny logický aparát. A niet pochýb o tom, že takéto mechanizmy sú dostatočne vyvinuté aj u vyšších zvierat, ktoré vo svojej životnej činnosti tiež naliehavo potrebujú schopnosť rozlíšiť pomerne zložitý systém znakov prírody. V prírode teda vidíme, že fenomén myslenia a vedomia je jednoznačne založený na schopnosti rozpoznávať vzorce a ďalší pokrok vedy o inteligencii priamo súvisí s hĺbkou pochopenia základných zákonov rozpoznávania. Pochopenie skutočnosti, že vyššie uvedené otázky ďaleko presahujú štandardnú definíciu rozpoznávania vzorov (v anglickej literatúre je bežnejší termín supervised learning), je tiež potrebné pochopiť, že majú hlboké súvislosti s týmto relatívne úzkym (ale stále ďaleko). z vyčerpaného) smeru.

Aj teraz sa rozpoznávanie vzorov pevne zapísalo do každodenného života a je jednou z najdôležitejších znalostí moderného inžiniera. V medicíne rozpoznávanie vzorov pomáha lekárom robiť presnejšie diagnózy, v továrňach sa používa na predpovedanie chýb v sériách tovaru. Z výsledkov tejto disciplíny vychádzajú aj biometrické osobné identifikačné systémy ako ich algoritmické jadro. Ďalší rozvoj umelej inteligencie, najmä návrh počítačov piatej generácie schopných priamejšej komunikácie s človekom v prirodzených jazykoch pre ľudí a prostredníctvom reči, je nemysliteľný bez uznania. Tu je robotika, umelé riadiace systémy obsahujúce rozpoznávacie systémy ako životne dôležité podsystémy, na dosah.

Preto rozvoju rozpoznávania vzorov už od začiatku venovali veľkú pozornosť odborníci rôznych profilov – kybernetici, neurofyziológovia, psychológovia, matematici, ekonómovia atď. Z veľkej časti z tohto dôvodu sa samotné moderné rozpoznávanie vzorov pripája k myšlienkam týchto disciplín. Bez nároku na úplnosť (a nie je možné to tvrdiť v krátkej eseji), popíšeme históriu rozpoznávania vzorov, kľúčové myšlienky.

Definície

Predtým, ako prejdeme k hlavným metódam rozpoznávania vzorov, uvádzame niekoľko potrebných definícií.

Rozpoznávanie obrazov (predmetov, signálov, situácií, javov alebo procesov) je úlohou identifikovať predmet alebo určiť niektorú z jeho vlastností podľa jeho obrazu (optické rozpoznávanie) alebo zvukového záznamu (akustické rozpoznávanie) a iných charakteristík.

Jedným zo základných je koncept súboru, ktorý nemá konkrétnu formuláciu. V počítači je množina reprezentovaná množinou neopakujúcich sa prvkov rovnakého typu. Slovo "neopakujúce sa" znamená, že nejaký prvok v množine buď je alebo tam nie je. Univerzálna sada obsahuje všetky možné prvky pre riešený problém, prázdna sada neobsahuje žiadne.

Obrázok je klasifikačné zoskupenie v klasifikačnom systéme, ktoré zjednocuje (vyčleňuje) určitú skupinu objektov podľa nejakého atribútu. Obrazy majú charakteristickú vlastnosť, ktorá sa prejavuje v tom, že oboznámenie sa s konečným počtom javov z tej istej množiny umožňuje rozpoznať ľubovoľne veľký počet jej predstaviteľov. Obrázky majú charakteristické objektívne vlastnosti v tom zmysle, že rôzni ľudia, ktorí sa učia z rôznych pozorovacích materiálov, väčšinou klasifikujú rovnaké predmety rovnakým spôsobom a nezávisle od seba. Pri klasickej formulácii rozpoznávacieho problému je univerzálna množina rozdelená na časti-obrazy. Každé mapovanie akéhokoľvek objektu na vnímajúce orgány rozpoznávacieho systému, bez ohľadu na jeho polohu vzhľadom na tieto orgány, sa zvyčajne nazýva obrazom objektu a súbory takýchto obrazov, spojené niektorými spoločnými vlastnosťami, sú obrazy.

Spôsob priradenia prvku k ľubovoľnému obrázku sa nazýva rozhodovacie pravidlo. Ďalším dôležitým pojmom je metrika, spôsob určenia vzdialenosti medzi prvkami univerzálneho súboru. Čím je táto vzdialenosť menšia, tým sú si predmety (symboly, zvuky atď.), ktoré rozpoznávame, podobnejšie. Prvky sú zvyčajne špecifikované ako množina čísel a metrika je špecifikovaná ako funkcia. Účinnosť programu závisí od výberu reprezentácie obrázkov a implementácie metriky, jeden rozpoznávací algoritmus s rôznymi metrikami bude robiť chyby s rôznymi frekvenciami.

Učenie sa zvyčajne nazýva proces vývoja v nejakom systéme konkrétnej reakcie na skupiny vonkajších identických signálov opakovaným ovplyvňovaním vonkajšieho korekčného systému. Takáto vonkajšia úprava v tréningu sa zvyčajne nazýva „povzbudenie“ a „trest“. Mechanizmus na generovanie tejto úpravy takmer úplne určuje algoritmus učenia. Samoučenie sa od učenia líši tým, že sa tu neuvádzajú dodatočné informácie o správnosti reakcie na systém.

Adaptácia je proces zmeny parametrov a štruktúry systému, prípadne aj kontrolných akcií, na základe aktuálnych informácií s cieľom dosiahnuť určitý stav systému s počiatočnou neistotou a meniacimi sa prevádzkovými podmienkami.

Učenie je proces, v dôsledku ktorého systém postupne získava schopnosť reagovať potrebnými reakciami na určité súbory vonkajších vplyvov a adaptácia je úprava parametrov a štruktúry systému za účelom dosiahnutia požadovanej kvality kontrola v podmienkach nepretržitých zmien vonkajších podmienok.

Príklady úloh rozpoznávania vzorov: - Rozpoznávanie písmen;

Prednáška číslo 17.METÓDY ROZPOZNÁVANIA VZORU

Existujú nasledujúce skupiny metód rozpoznávania:

Metódy funkcie priblíženia

Metódy diskriminačnej funkcie

Štatistické metódy rozpoznávania.

Lingvistické metódy

heuristické metódy.

Prvé tri skupiny metód sú zamerané na analýzu znakov vyjadrených číslami alebo vektormi s číselnými zložkami.

Skupina lingvistických metód poskytuje rozpoznávanie vzorov na základe analýzy ich štruktúry, ktorá je popísaná zodpovedajúcimi štruktúrnymi znakmi a vzťahmi medzi nimi.

Skupina heuristických metód spája charakteristické techniky a logické postupy používané ľuďmi pri rozpoznávaní vzorov.

Metódy funkcie priblíženia

Metódy tejto skupiny sú založené na použití funkcií, ktoré vyhodnocujú mieru blízkosti medzi rozpoznateľným obrázkom s vektorom X * = (X * 1 ,….,x*n) a referenčné obrázky rôznych tried reprezentované vektormi x i = (x i 1 ,…, x i n), i= 1,…,N, kde ja-číslo triedy obrázku.

Postup rozpoznávania podľa tejto metódy spočíva vo výpočte vzdialenosti medzi bodom rozpoznaného obrazu a každým z bodov reprezentujúcich referenčný obraz, t.j. pri výpočte všetkých hodnôt d i , i= 1,…,N. Obrázok patrí do triedy, pre ktorú má hodnotu d i má zo všetkých najmenšiu hodnotu i= 1,…,N .

Funkcia, ktorá mapuje každý pár vektorov x i, X * reálne číslo ako miera ich blízkosti, t.j. určenie vzdialenosti medzi nimi môže byť celkom ľubovoľné. V matematike sa takáto funkcia nazýva priestorová metrika. Musí spĺňať nasledujúce axiómy:

r(x, y)=r(y,x);

r(x, y) > 0 ak X nerovná sa r a r(x, y)=0 ak x=y;

r(x, y) <=r(x,z)+r(z,y)

Tieto axiómy spĺňajú najmä nasledujúce funkcie

a i= 1/2 , j=1,2,…n.

b i=suma, j=1,2,…n.

c i=max abs ( x ix j *), j=1,2,…n.

Prvá z nich sa nazýva euklidovská norma vektorového priestoru. Podľa toho sa priestory, v ktorých sa špecifikovaná funkcia používa ako metrika, nazývajú euklidovský priestor.

Často sa ako funkcia priblíženia vyberie odmocnina z rozdielu súradníc rozpoznaného obrázku X * a štandardné x i, t.j. funkciu

d i = (1/n) súčet( x i jx j *) 2 , j=1,2,…n.

Hodnota d i geometricky interpretovaný ako druhá mocnina vzdialenosti medzi bodmi v priestore prvkov vo vzťahu k rozmeru priestoru.

Často sa ukazuje, že rôzne vlastnosti nie sú pri rozpoznávaní rovnako dôležité. Aby sa táto okolnosť zohľadnila pri výpočte funkcií priblíženia rozdielu súradníc, zodpovedajúce dôležitejšie vlastnosti sa vynásobia veľkými koeficientmi a menej dôležité menšími.

V tomto prípade d i = (1/n) súčet wj (x i jx j *) 2 , j=1,2,…n,

kde wj- hmotnostné koeficienty.

Zavedenie váhových koeficientov je ekvivalentné zmenšovaniu osí priestoru prvkov, a teda rozťahovaniu alebo stláčaniu priestoru v samostatných smeroch.

Tieto deformácie priestorového znaku sledujú cieľ takého umiestnenia bodov referenčných obrazov, ktoré zodpovedá najspoľahlivejšiemu rozpoznaniu za podmienok výrazného rozptylu obrazov každej triedy v blízkosti bodu referenčného obrazu.

Skupiny obrazových bodov blízko seba (zhluky obrazov) v priestore prvkov sa nazývajú zhluky a problém identifikácie takýchto skupín sa nazýva problém zhlukovania.

Úloha identifikácie zhlukov sa označuje ako úlohy rozpoznávania vzorov bez dozoru, t.j. problémy s rozpoznávaním pri absencii príkladu správneho rozpoznávania.

Metódy diskriminačnej funkcie

Myšlienkou metód tejto skupiny je skonštruovať funkcie, ktoré definujú hranice v priestore obrázkov a rozdeľujú priestor na oblasti zodpovedajúce triedam obrázkov. Najjednoduchšie a najčastejšie používané funkcie tohto druhu sú funkcie, ktoré lineárne závisia od hodnôt vlastností. V priestore prvkov zodpovedajú oddeľujúcim plochám vo forme nadrovín. V prípade dvojrozmerného priestoru prvkov funguje priama čiara ako oddeľovacia funkcia.

Všeobecný tvar lineárnej rozhodovacej funkcie je daný vzorcom

d(X)=w 1 X 1 + w 2 X 2 +…+w n x n +w n +1 = Wx+w n

kde X- vektorový obrázok, w=(w 1 , w 2 ,…w n) je vektor váhových koeficientov.

Pri rozdelení do dvoch tried X 1 a X 2 diskriminačná funkcia d(x) umožňuje uznanie podľa pravidla:

X patrí X 1 ak d(X)>0;

X patrí X 2 ak d(X)<0.

Ak d(X)=0, potom nastáva prípad neistoty.

V prípade rozdelenia do viacerých tried sa zavádza niekoľko funkcií. V tomto prípade je každá trieda obrázkov spojená s určitou kombináciou znakov rozlišujúcich funkcií.

Napríklad, ak sú zavedené tri diskriminačné funkcie, potom je možný nasledujúci variant výberu tried obrázkov:

X patrí X 1 ak d 1 (X)>0,d 2 (X)<0,d 3 (X)<0;

X patrí X 2 ak d(X)<0,d 2 (X)>0,d 3 (X)<0;

X patrí X 3 ak d(X)<0,d 2 (X)<0,d 3 (X)>0.

Predpokladá sa, že pre iné kombinácie hodnôt d 1 (X),d 2 (X),d 3 (X) existuje prípad neistoty.

Obmenou metódy diskriminačných funkcií je metóda rozhodujúcich funkcií. V ňom, ak je k dispozícii m triedy sa predpokladá, že existujú m funkcie d i(X), nazývaný rozhodujúci, taký, že ak X patrí X i, potom d i(X) > dj(X) pre všetkých j nerovná sa i,tie. rozhodujúca funkcia d i(X) má maximálnu hodnotu spomedzi všetkých funkcií dj(X), j=1,...,n..

Ilustráciou takejto metódy môže byť klasifikátor založený na odhade minima euklidovskej vzdialenosti v priestore prvku medzi bodom obrazu a štandardom. Ukážme to.

Euklidovská vzdialenosť medzi typickým vektorom rozpoznateľného obrazu X a vektor referenčného obrázku je určený vzorcom || x iX|| = 1/2 , j=1,2,…n.

Vektor X bude pridelený do triedy i, pre ktoré je hodnota || x iX *|| minimálne.

Namiesto vzdialenosti môžete porovnávať druhú mocninu vzdialenosti, t.j.

||x iX|| 2 = (x iX)(x iX) t = X X- 2X x i +x i x i

Od hodnoty X X rovnako pre všetkých i, minimum funkcie || x iX|| 2 sa bude zhodovať s maximom rozhodovacej funkcie

d i(X) = 2X x i -x i x i.

t.j X patrí X i, ak d i(X) > dj(X) pre všetkých j nerovná sa i.

To. stroj na klasifikáciu minimálnej vzdialenosti je založený na lineárnych rozhodovacích funkciách. Všeobecná štruktúra takéhoto stroja využíva rozhodovacie funkcie formulára

d i (X)=w i 1 X 1 + w i 2 X 2 +…+w v x n +vyhrať +1

Dá sa vizuálne znázorniť príslušnou blokovou schémou.

Pre stroj, ktorý vykonáva klasifikáciu podľa minimálnej vzdialenosti, platia rovnosti: w ij = -2x i j , vyhrať +1 = x i x i.

Ekvivalentné rozpoznávanie metódou diskriminačných funkcií sa môže uskutočniť, ak sú diskriminačné funkcie definované ako rozdiely dij (X)=d i (X)‑dj (X).

Výhodou metódy diskriminačných funkcií je jednoduchá štruktúra rozpoznávacieho stroja, ako aj možnosť jeho implementácie najmä prostredníctvom prevažne lineárnych rozhodovacích blokov.

Ďalšou dôležitou výhodou metódy diskriminačných funkcií je možnosť automatického trénovania stroja na správne rozpoznanie danej (tréningovej) vzorky obrázkov.

Algoritmus automatického učenia sa zároveň ukazuje ako veľmi jednoduchý v porovnaní s inými metódami rozpoznávania.

Z týchto dôvodov si metóda diskriminačných funkcií získala veľkú obľubu a v praxi sa často používa.

Samoučiace sa postupy rozpoznávania vzorov

Zvážte metódy konštrukcie diskriminačnej funkcie z danej (tréningovej) vzorky aplikovanej na problém rozdelenia obrázkov do dvoch tried. Ak sú dané dve sady obrázkov, ktoré patria do tried A a B, potom sa riešenie problému konštrukcie lineárnej diskriminačnej funkcie hľadá vo forme vektora váhových koeficientov. W=(w 1 ,w 2 ,...,w n,w n+1), ktorý má tú vlastnosť, že pre akýkoľvek obrázok podmienky

X patrí do triedy A, ak >0, j=1,2,…n.

X patrí do triedy B, ak<0, j=1,2,…n.

Ak je tréningová vzorka N obrázkov oboch tried, problém sa redukuje na nájdenie vektora w, ktorý zabezpečí platnosť systému nerovností. N obrázkov oboch tried, problém sa redukuje na nájdenie vektora w, ktorý zabezpečuje platnosť systému nerovností

X 1 1 w i+X 21 w 2 +...+x n 1 w n+w n +1 >0;

X 1 2 w i+X 22 w 2 +...+x n 2 w n+w n +1 <0;

X 1 iw i+X 2i w 2 +...+x ni w n+w n +1 >0;

................................................

X 1 Nw i +x 2N w 2 +...+x nN w n +w n + 1>0;

tu x i=(x i 1 ,x i 2 ,...,x i n ,x i n+ 1 ) - vektor hodnôt vlastností obrázka z tréningovej vzorky, znak > zodpovedá vektorom obrázkov X patriace do triedy A, a znak< - векторам X patriace do triedy B.

Požadovaný vektor w existuje, ak sú triedy A a B oddeliteľné a inak neexistuje. Hodnoty vektorového komponentu w možno nájsť buď predbežne, v štádiu predchádzajúcej hardvérovej implementácii FRO, alebo priamo samotným FRO v priebehu svojej prevádzky. Posledný z týchto prístupov poskytuje väčšiu flexibilitu a autonómiu SRO. Zvážte to na príklade zariadenia s názvom percentron. vynašiel v roku 1957 americký vedec Rosenblatt. Schematické znázornenie percentrónu, ktoré zabezpečuje priradenie obrázku do jednej z dvoch tried, je znázornené na nasledujúcom obrázku.

Retina S Retina A Retina R

oh oh X 1

oh oh X 2

oh oh X 3

o (súčet)--------> R(reakcia)

oh oh x i

oh oh x n

oh oh x n +1

Zariadenie pozostáva zo senzorických prvkov sietnice S, ktoré sú náhodne spojené s asociatívnymi prvkami sietnice A. Každý prvok druhej sietnice produkuje výstupný signál len vtedy, ak je dostatočný počet senzorických prvkov pripojených na jeho vstup v excitovanom stave. Odozva celého systému R je úmerná súčtu reakcií prvkov asociatívnej sietnice braných s určitými váhami.

Označenie cez x i reakciu i asociatívny prvok a cez w i- koeficient reakčnej hmotnosti i asociatívny prvok, reakciu systému možno zapísať ako R=sum( w j x j), j=1,..,n. Ak R>0, potom obraz prezentovaný systému patrí do triedy A, a ak R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений X 1 , X 2 ,...,x n zodpovedá určitému algoritmu na vytváranie znakov na základe signálov primárnych snímačov.

Vo všeobecnosti môže existovať niekoľko prvkov R, ktoré tvoria reakciu perceptrónu. V tomto prípade sa hovorí o prítomnosti sietnice v perceptróne R reagujúce prvky.

Schéma percentrónu môže byť rozšírená na prípad, keď je počet tried viac ako dve, zvýšením počtu prvkov sietnice R až po počet rozlíšiteľných tried a zavedenie bloku na určenie maximálnej reakcie v súlade so schémou uvedenou na vyššie uvedenom obrázku. V tomto prípade je obrázok priradený triede s číslom i, ak RI>Rj, pre všetkých j.

Proces učenia percentrónu spočíva vo výbere hodnôt váhových koeficientov wj aby výstupný signál zodpovedal triede, do ktorej rozpoznaný obraz patrí.

Uvažujme o akčnom algoritme percentrón na príklade rozpoznávania objektov dvoch tried: A a B. Objekty triedy A musia zodpovedať hodnote R= +1 a trieda B - hodnota R= -1.

Algoritmus učenia je nasledujúci.

Ak iný obrázok X patrí do triedy A, ale R<0 (имеет место ошибка распознавания), тогда коэффициенты wj s indexmi zodpovedajúcimi hodnotám x j>0, zvýšiť o určitú čiastku dw a zvyšok koeficientov wj znížiť o dw. V tomto prípade hodnota reakcie R dostane prírastok k svojim kladným hodnotám zodpovedajúcim správnej klasifikácii.

Ak X patrí do triedy B, ale R>0 (vyskytla sa chyba rozpoznávania), potom koeficienty wj s indexmi zodpovedajúcimi x j<0, увеличивают на dw a zvyšok koeficientov wj znížená o rovnakú sumu. V tomto prípade hodnota reakcie R sa zvyšuje smerom k záporným hodnotám zodpovedajúcim správnej klasifikácii.

Algoritmus teda zavádza zmenu vo vektore hmotnosti w vtedy a len vtedy, ak je obraz prezentovaný k-th tréningový krok, bol počas tohto kroku nesprávne klasifikovaný a opúšťa vektor hmotnosti wžiadna zmena v prípade správnej klasifikácie. Dôkaz konvergencie tohto algoritmu je uvedený v [Too, Gonzalez]. Takéto školenie nakoniec bude (pri správnom výbere dw a lineárna oddeliteľnosť tried obrázkov) vedie k vektoru w pre správnu klasifikáciu.

Štatistické metódy rozpoznávania.

Štatistické metódy sú založené na minimalizácii pravdepodobnosti klasifikačnej chyby. Pravdepodobnosť P nesprávnej klasifikácie obrazu prijatého na rozpoznanie, opísaná znakovým vektorom X, sa určuje podľa vzorca

P = súčet[ p(i)prob( D(X)+i | X trieda i)]

kde m- počet tried,

p(i) = sonda ( X patrí do triedy i) - a priori pravdepodobnosť príslušnosti k ľubovoľnému obrázku X do i-th class (frekvencia výskytu obrázkov i trieda),

D(X) je funkcia, ktorá rozhoduje o klasifikácii (vektor vlastností X zodpovedá číslu triedy i zo sady (1,2,..., m}),

problém ( D(X) nerovná sa i| X patrí do triedy i) je pravdepodobnosť udalosti " D(X) nerovná sa i“ keď je splnená podmienka členstva X trieda i, t.j. pravdepodobnosť, že funkcia urobí chybné rozhodnutie D(X) pre danú hodnotu X vo vlastníctve i- trieda.

Dá sa ukázať, že pravdepodobnosť nesprávneho zaradenia dosahuje minimum, ak D(X)=i ak a len vtedy p(X|ip(i)>p(x|jp(j), pre všetkých i+j, kde p(x|i) - hustota distribúcie obrázkov i triedy v priestore funkcií.

Podľa vyššie uvedeného pravidla bod X patrí do triedy, ktorá zodpovedá maximálnej hodnote p(i) p(x|i), t.j. súčin apriórnej pravdepodobnosti (frekvencie) výskytu obrazov i-tej triedy a hustoty rozloženia vzoru i triedy v priestore funkcií. Prezentované klasifikačné pravidlo sa nazýva Bayesovské, pretože vyplýva to zo známeho Bayesovho vzorca v teórii pravdepodobnosti.

Príklad. Nech je potrebné rozpoznať diskrétne signály na výstupe informačného kanála ovplyvneného šumom.

Každý vstupný signál je 0 alebo 1. V dôsledku prenosu signálu sa na výstupe kanála zobrazí hodnota X, ktorý je superponovaný s Gaussovým šumom s nulovým priemerom a rozptylom b.

Na syntézu klasifikátora, ktorý vykonáva rozpoznávanie signálu, použijeme Bayesovské klasifikačné pravidlo.

V triede č. 1 kombinujeme signály predstavujúce jednotky, v triede č. 2 - signály predstavujúce nuly. Vopred nech je známe, že v priemere z každých 1000 signálov a signály sú jednotky a b signály - nuly. Potom sa hodnoty a priori pravdepodobnosti výskytu signálov 1. a 2. triedy (jednotky a nuly), v tomto poradí, môžu rovnať

p(1)=a/1000, p(2)=b/1000.

Pretože šum je Gaussovský, t.j. dodržiava zákon normálneho (Gaussovho) rozdelenia, potom hustotu rozloženia obrázkov prvej triedy v závislosti od hodnoty X, alebo, ktorá je rovnaká, pravdepodobnosť získania výstupnej hodnoty X keď je na vstup privedený signál 1, je určený výrazom

p(X¦1) =(2pib) -1/2 exp(-( X-1) 2 /(2b 2)),

a hustota distribúcie v závislosti od hodnoty X obrazy druhej triedy, t.j. pravdepodobnosť získania výstupnej hodnoty X keď je na vstup privedený signál 0, je určený výrazom

p(X¦2)= (2pib) -1/2 exp(- X 2 /(2b 2)),

Aplikácia Bayesovho rozhodovacieho pravidla vedie k záveru, že sa prenáša signál triedy 2, t.j. prešiel nulou, ak

p(2) p(X¦2) > p(1) p(X¦1)

alebo konkrétnejšie, ak

b exp(- X 2 /(2b 2)) > a exp(-( X-1) 2 /(2b 2)),

Vydelením ľavej strany nerovnosti pravou stranou dostaneme

(b/a)exp((1-2 X)/(2b 2)) >1,

odkiaľ po logaritmovaní zistíme

1-2X> 2b 2 ln(a/b)

X< 0.5 - б 2 ln(a/b)

Z výslednej nerovnosti vyplýva, že a=b, t.j. pri rovnakej apriórnej pravdepodobnosti výskytu signálov 0 a 1 je obrázku priradená hodnota 0, keď X<0.5, а значение 1, когда X>0.5.

Ak je vopred známe, že jeden zo signálov sa objavuje častejšie, a druhý menej často, t.j. v prípade rozdielnych hodnôt a a b prah odozvy klasifikátora sa posunie na jednu alebo druhú stranu.

Takže pri a/b=2,71 (zodpovedá 2,71-krát častejšiemu prenosu jednotiek) a b 2 =0,1, obrázku sa priradí hodnota 0, ak X<0.4, и значение 1, если X>0,4. Ak neexistujú žiadne informácie o pravdepodobnostiach apriórneho rozdelenia, možno použiť metódy štatistického rozpoznávania, ktoré sú založené na iných ako Bayesovských pravidlách klasifikácie.

V praxi sú však metódy založené na Bayesových pravidlách najbežnejšie kvôli ich väčšej účinnosti a tiež kvôli tomu, že pri väčšine problémov s rozpoznávaním vzorov je možné nastaviť apriórne pravdepodobnosti vzhľadu obrázkov každej triedy.

Lingvistické metódy rozpoznávania vzorov.

Lingvistické metódy rozpoznávania vzorov sú založené na analýze popisu idealizovaného obrazu, reprezentovaného ako graf alebo reťazec symbolov, čo je fráza alebo veta určitého jazyka.

Zvážte idealizované obrázky písmen získané ako výsledok prvej fázy jazykového rozpoznávania opísaného vyššie. Tieto idealizované obrazy možno definovať popismi grafov, reprezentovaných napríklad vo forme matíc spojov, ako to bolo urobené vo vyššie uvedenom príklade. Rovnaký opis môže byť reprezentovaný formálnou jazykovou frázou (výrazom).

Príklad. Uveďme tri obrázky písmena A získané ako výsledok predbežného spracovania obrázkov. Označme tieto obrázky identifikátormi A1, A2 a A3.

Na lingvistický popis prezentovaných obrázkov používame PDL (Picture Description Language). Slovník jazyka PDL obsahuje nasledujúce znaky:

1. Názvy najjednoduchších obrázkov (primitív). Primitívy a ich zodpovedajúce názvy sú v tomto prípade uvedené nižšie.

Obrázky vo forme smerovanej čiary:

hore a doľava (le F t), na sever (sever)), hore a doprava (vpravo), na východ (východ)).

Mená: L, N, R, E.

2. Symboly binárnych operácií. (+,*,-) Ich význam zodpovedá postupnému spájaniu primitív (+), spájaniu začiatkov a koncov primitív (*), spájaniu iba koncoviek primitív (-).

3. Pravá a ľavá zátvorka. ((,)) Zátvorky umožňujú určiť poradie, v ktorom sa majú operácie vykonávať vo výraze.

Uvažované obrázky A1, A2 a A3 sú v jazyku PDL popísané nasledujúcimi výrazmi.

T(1)=R+((R-(L+N))*E-L

T(2)=(R+N)+((N+R)-L)*E-L

T(3)=(N+R)+(R-L)*E-(L+N)

Po vybudovaní lingvistického popisu obrazu je potrebné nejakým rozpoznávacím postupom analyzovať, či daný obraz patrí do pre nás zaujímavej triedy (trieda písmen A), t.j. či tento obrázok má alebo nemá nejakú štruktúru. Na to je potrebné najskôr opísať triedu obrázkov, ktoré majú štruktúru, ktorá nás zaujíma.

Je zrejmé, že písmeno A vždy obsahuje nasledujúce konštrukčné prvky: ľavú "nohu", pravú "nohu" a hlavu. Nazvime tieto prvky STL, STR, TR.

Potom je v jazyku PDL trieda symbolov A - SIMB A opísaná výrazom

SIMB A = STL + TR - STR

Ľavá „noha“ STL je vždy reťazec prvkov R a N, ktoré možno písať ako

STL ‑> R ¦ N ¦ (STL + R) ¦ (STL + N)

(STL je znak R alebo N alebo reťazec získaný pridaním znakov R alebo N do zdrojového reťazca STL)

Pravou „nohou“ STR je vždy reťazec prvkov L a N, ktorý možno zapísať nasledovne, t.j.

STR ‑> L¦N¦ (STR + L)¦ (STR + N)

Hlavová časť písmena - TR je uzavretý obrys, zložený z prvku E a reťazí ako STL a STR.

V jazyku PDL je štruktúra TR opísaná výrazom

TR -> (STL - STR) * E

Nakoniec dostaneme nasledujúci popis triedy písmen A:

SIMB A -> (STL + TR - STR),

STL ‑> R¦N¦ (STL + R)¦ (STL + N)

STR ‑> L¦N¦ (STR + L)¦ (STR + N)

TR -> (STL - STR) * E

Postup uznávania sa v tomto prípade môže uskutočniť nasledovne.

1. Výraz zodpovedajúci obrázku sa porovná s referenčnou štruktúrou STL + TR - STR.

2. Každý prvok štruktúry STL, TR, STR, pokiaľ je to možné, t.j. ak je popis obrázka porovnateľný so štandardom, zhoduje sa nejaký podvýraz z výrazu T(A). Napríklad,

pre A1: STL=R, STR=L, TR=(R-(L+N))*E

pre A2: STL = R + N, STR = L, TR = ((N + R) - L) * E

pre A3: STL = N + R, STR = L + N, TR = (R - L) * E 3.

Výrazy STL, STR, TR sa porovnávajú s ich zodpovedajúcimi referenčnými štruktúrami.

4. Ak štruktúra každého výrazu STL, STR, TR zodpovedá referenčnému výrazu, usudzuje sa, že obrázok patrí do triedy písmen A. Ak v niektorom zo štádií 2, 3, 4 existuje nesúlad medzi štruktúrou z analyzovaného výrazu a odkazu sa dospelo k záveru, že obrázok nepatrí do SIMB triedy A. Porovnanie štruktúry výrazov je možné vykonať pomocou algoritmických jazykov LISP, PLANER, PROLOG a iných podobných jazykov umelej inteligencie.

V uvažovanom príklade sú všetky reťazce STL tvorené znakmi N a R a reťazce STR sú tvorené znakmi L a N, čo zodpovedá danej štruktúre týchto reťazcov. Štruktúra TR na uvažovaných obrázkoch tiež zodpovedá referenčnej, keďže pozostáva z „rozdielu“ reťazcov typu STL, STR, „vynásobeného“ symbolom E.

Dostávame sa teda k záveru, že uvažované obrázky patria do triedy SIMB A.


Syntéza fuzzy jednosmerného regulátora elektrického pohonuv prostredí „MatLab“.

Syntéza fuzzy regulátora s jedným vstupom a výstupom.

Problém je prinútiť disk, aby presne sledoval rôzne vstupy. Vývoj riadiacej akcie je realizovaný fuzzy regulátorom, v ktorom možno štrukturálne rozlíšiť nasledovné funkčné bloky: fuzzifier, rule block a defuzzifier.

Obr.4 Zovšeobecnený funkčný diagram systému s dvoma jazykovými premennými.

Obr.5 Schematický diagram fuzzy regulátora s dvoma lingvistickými premennými.

Algoritmus fuzzy riadenia je vo všeobecnom prípade transformáciou vstupných premenných fuzzy regulátora na jeho výstupné premenné pomocou nasledujúcich vzájomne súvisiacich postupov:

1. transformácia vstupných fyzikálnych veličín získaných z meracích senzorov z riadiaceho objektu na vstupné lingvistické premenné fuzzy regulátora;

2. spracovanie logických príkazov, nazývaných lingvistické pravidlá, týkajúce sa vstupných a výstupných jazykových premenných kontrolóra;

3. transformácia výstupných lingvistických premenných fuzzy regulátora na fyzikálne riadiace premenné.

Uvažujme najskôr o najjednoduchšom prípade, keď sú na ovládanie servopohonu zavedené iba dve jazykové premenné:

"uhol" - vstupná premenná;

"riadiaca akcia" - výstupná premenná.

Ovládač syntetizujeme v prostredí MatLab pomocou toolboxu Fuzzy Logic. Umožňuje vytvárať fuzzy inferencie a fuzzy klasifikačné systémy v prostredí MatLab s možnosťou ich integrácie do Simulinku. Základným konceptom Fuzzy Logic Toolbox je štruktúra FIS – Fuzzy Inference System. Štruktúra FIS obsahuje všetky potrebné údaje na implementáciu funkčného mapovania "vstupy-výstupy" na základe fuzzy logickej inferencie podľa schémy znázornenej na obr. 6.


Obrázok 6. Fuzzy inferencia.

X - vstupný ostrý vektor; - vektor fuzzy množín zodpovedajúci vstupnému vektoru X;
- výsledok logickej inferencie vo forme vektora fuzzy množín Y - výstupný ostrý vektor.

Fuzzy modul umožňuje zostaviť fuzzy systémy dvoch typov – Mamdani a Sugeno. V systémoch typu Mamdani pozostáva báza znalostí z pravidiel formy „Ak x 1 = nízke a x 2 = stredné, potom y = vysoké“. V systémoch typu Sugeno pozostáva znalostná báza z pravidiel formy "Ak x 1 = nízke a x 2 = stredné, potom y = a 0 + a 1 x 1 + a 2 x 2 ". Hlavný rozdiel medzi systémami Mamdani a Sugeno teda spočíva v rôznych spôsoboch nastavenia hodnôt výstupnej premennej v pravidlách, ktoré tvoria vedomostnú základňu. V systémoch typu Mamdani sú hodnoty výstupnej premennej dané fuzzy pojmami, v systémoch typu Sugeno - ako lineárna kombinácia vstupných premenných. V našom prípade použijeme systém Sugeno, pretože hodí sa lepšie na optimalizáciu.

Na riadenie servopohonu sú zavedené dve jazykové premenné: "chyba" (podľa polohy) a "riadiaca činnosť". Prvý z nich je vstup, druhý je výstup. Definujme množinu termínov pre špecifikované premenné.

Hlavné zložky fuzzy inferencie. Fuzzifier.

Pre každú lingvistickú premennú definujeme základnú množinu pojmov formulára, ktorá zahŕňa fuzzy množiny, ktoré možno označiť: záporná vysoká, záporná nízka, nula, kladná nízka, kladná vysoká.

Najprv si subjektívne definujme, čo sa rozumie pod pojmami „veľká chyba“, „malá chyba“ atď., pričom definujme funkcie príslušnosti pre zodpovedajúce fuzzy množiny. Tu sa zatiaľ možno riadiť len požadovanou presnosťou, známymi parametrami pre triedu vstupných signálov a zdravým rozumom. Zatiaľ nikto nedokázal ponúknuť žiadny rigidný algoritmus na výber parametrov funkcií členstva. V našom prípade bude jazyková premenná „chyba“ vyzerať takto.

Obr.7. Jazyková premenná „chyba“.

Je vhodnejšie reprezentovať jazykovú premennú „manažment“ vo forme tabuľky:

stôl 1

Blok pravidiel.

Zvážte postupnosť definovania niekoľkých pravidiel, ktoré popisujú niektoré situácie:

Predpokladajme napríklad, že výstupný uhol sa rovná vstupnému signálu (t.j. chyba je nulová). Je zrejmé, že ide o želanú situáciu, a preto nemusíme robiť nič (kontrolná akcia je nulová).

Teraz zvážte iný prípad: chyba polohy je oveľa väčšia ako nula. Prirodzene, musíme to kompenzovať generovaním veľkého pozitívneho riadiaceho signálu.

To. boli vypracované dve pravidlá, ktoré možno formálne definovať takto:

ak chyba = null, potom kontrolná činnosť = nula.

ak chyba = veľké pozitívum, potom kontrolná akcia = veľká pozitívna.

Obr.8. Vytvorenie kontroly s malou kladnou chybou v polohe.

Obr.9. Tvorba kontroly pri nulovej chybe polohy.

V tabuľke nižšie sú uvedené všetky pravidlá zodpovedajúce všetkým situáciám pre tento jednoduchý prípad.

tabuľka 2

Celkovo možno pre fuzzy regulátor s n vstupmi a 1 výstupom určiť pravidlá riadenia, kde je počet fuzzy množín pre i-tý vstup, ale pre normálnu funkciu regulátora nie je potrebné použiť všetky možné pravidlá, ale vystačíte si s menším počtom z nich. V našom prípade sa na vytvorenie fuzzy riadiaceho signálu používa všetkých 5 možných pravidiel.

Defuzzifier.

Výsledný vplyv U bude teda určený podľa implementácie akéhokoľvek pravidla. Ak nastane situácia, keď sa vykoná niekoľko pravidiel naraz, potom sa výsledná akcia U nájde podľa nasledujúcej závislosti:

, kde n je počet spustených pravidiel (defuzzifikácia metódou centra oblasti), u n je fyzikálna hodnota riadiaceho signálu zodpovedajúceho každej z fuzzy množín UBO, UMo, UZ, UMp, UBP. mUn(u) je miera príslušnosti riadiaceho signálu u k zodpovedajúcej fuzzy množine Un=( UBO, UMo, UZ, UMp, UBP). Existujú aj iné metódy defuzzifikácie, kedy je výstupná lingvistická premenná úmerná samotnému „silnému“ alebo „slabému“ pravidlu.

Simulujme proces riadenia elektrického pohonu pomocou vyššie opísaného fuzzy regulátora.

Obr.10. Bloková schéma systému v prostredímatlab.

Obr.11. Štrukturálny diagram fuzzy regulátora v prostredímatlab.

Obr.12. Prechodný proces v jednom kroku.

Ryža. 13. Prechodný proces pod harmonickým vstupom pre model s fuzzy regulátorom obsahujúcim jednu vstupnú lingvistickú premennú.

Analýza charakteristík pohonu so syntetizovaným riadiacim algoritmom ukazuje, že nie sú ani zďaleka optimálne a horšie ako v prípade syntézy riadenia inými metódami (príliš dlhý čas riadenia s jednokrokovým efektom a chyba s harmonickým) . Vysvetľuje to skutočnosť, že parametre funkcií členstva boli zvolené celkom svojvoľne a ako vstupy regulátora bola použitá iba veľkosť chyby polohy. Prirodzene, o nejakej optimalite získaného regulátora nemôže byť ani reči. Preto sa úloha optimalizácie fuzzy regulátora stáva aktuálnou, aby sa dosiahli čo najvyššie ukazovatele kvality riadenia. Tie. úlohou je optimalizovať účelovú funkciu f(a 1 ,a 2 …a n), kde a 1 ,a 2 …a n sú koeficienty určujúce typ a charakteristiky fuzzy regulátora. Na optimalizáciu fuzzy regulátora používame blok ANFIS z prostredia Matlab. Jedným zo spôsobov, ako zlepšiť vlastnosti regulátora, môže byť aj zvýšenie počtu jeho vstupov. Regulátor tak bude flexibilnejší a zlepší sa jeho výkon. Pridajme ešte jednu vstupnú lingvistickú premennú – rýchlosť zmeny vstupného signálu (jeho derivácie). V súlade s tým sa zvýši aj počet pravidiel. Potom bude schéma zapojenia regulátora vyzerať takto:

Obr.14 Schematický diagram fuzzy regulátora s tromi lingvistickými premennými.

Nech je hodnota rýchlosti vstupného signálu. Základná množina termínov Tn je definovaná ako:

Тn=("negatívny (VO)", "nula (Z)", "pozitívny (VR)").

Umiestnenie funkcií príslušnosti pre všetky jazykové premenné je znázornené na obrázku.

Obr.15. Členské funkcie jazykovej premennej „chyba“.

Obr.16. Členské funkcie lingvistickej premennej "rýchlosť vstupného signálu".

Vďaka pridaniu ďalšej lingvistickej premennej sa počet pravidiel zvýši na 3x5=15. Princíp ich zostavovania je úplne podobný tomu, ktorý je uvedený vyššie. Všetky sú uvedené v nasledujúcej tabuľke:

Tabuľka 3

fuzzy signál

zvládanie

Chyba polohy

Rýchlosť

Napríklad, ak ak chyba = nula a derivácia vstupného signálu = veľká kladná, potom kontrolná akcia = malý negatívny.

Obr.17. Formovanie kontroly pod tromi jazykovými premennými.

V dôsledku nárastu počtu vstupov a tým aj samotných pravidiel sa skomplikuje aj štruktúra fuzzy regulátora.

Obr.18. Štrukturálny diagram fuzzy regulátora s dvoma vstupmi.

Pridajte kresbu

Obr.20. Prechodný proces pod harmonickým vstupom pre model s fuzzy regulátorom obsahujúcim dve vstupné lingvistické premenné.

Ryža. 21. Chybový signál pod harmonickým vstupom pre model s fuzzy regulátorom obsahujúcim dve vstupné lingvistické premenné.

Simulujme činnosť fuzzy regulátora s dvoma vstupmi v prostredí Matlab. Bloková schéma modelu bude úplne rovnaká ako na obr. 19. Z grafu prechodového procesu pre harmonický vstup je vidieť, že presnosť sústavy sa výrazne zvýšila, ale zároveň sa zvýšila jej oscilácia, najmä v miestach, kde má derivácia výstupnej súradnice tendenciu nula. Je zrejmé, že dôvodom je, ako už bolo spomenuté vyššie, neoptimálny výber parametrov funkcií príslušnosti pre vstupné aj výstupné lingvistické premenné. Preto optimalizujeme fuzzy regulátor pomocou bloku ANFISedit v prostredí Matlab.

Fuzzy optimalizácia ovládača.

Zvážte použitie genetických algoritmov na optimalizáciu fuzzy regulátorov. Genetické algoritmy sú adaptívne metódy vyhľadávania, ktoré sa v posledných rokoch často používajú na riešenie problémov funkčnej optimalizácie. Sú založené na podobnosti s genetickými procesmi biologických organizmov: biologické populácie sa vyvíjajú počas niekoľkých generácií, v súlade so zákonmi prirodzeného výberu a podľa princípu „prežitia najschopnejších“, ktorý objavil Charles Darwin. Napodobňovaním tohto procesu sú genetické algoritmy schopné „vyvíjať“ riešenia skutočných problémov, ak sú vhodne zakódované.

Genetické algoritmy pracujú s množinou „jednotlivcov“ – populáciou, z ktorých každý predstavuje možné riešenie daného problému. Každý jedinec je hodnotený mierou jeho „fitness“ podľa toho, ako „dobré“ je riešenie jemu zodpovedajúceho problému. Najzdatnejšie jedince sú schopné „rozmnožiť“ potomstvo „krížením“ s inými jedincami v populácii. To vedie k vzniku nových jedincov, ktorí kombinujú niektoré vlastnosti zdedené od svojich rodičov. Najmenej zdatní jedinci majú menšiu pravdepodobnosť, že sa rozmnožia, takže vlastnosti, ktoré majú, postupne z populácie miznú.

Takto sa reprodukuje celá nová populácia realizovateľných riešení, pričom sa vyberajú tí najlepší predstavitelia predchádzajúcej generácie, krížia sa a získavajú sa množstvo nových jedincov. Táto nová generácia obsahuje vyšší pomer vlastností, ktoré majú dobrí členovia predchádzajúcej generácie. Z generácie na generáciu sú teda dobré vlastnosti distribuované v celej populácii. V konečnom dôsledku sa populácia priblíži k optimálnemu riešeniu problému.

Existuje mnoho spôsobov, ako implementovať myšlienku biologickej evolúcie v rámci genetických algoritmov. Tradičný môže byť znázornený vo forme nasledujúceho blokového diagramu znázorneného na obrázku 22, kde:

1. Inicializácia počiatočnej populácie - generovanie daného počtu riešení problému, od ktorého sa začína proces optimalizácie;

2. Aplikácia operátorov kríženia a mutácie;

3. Podmienky zastavenia - proces optimalizácie zvyčajne pokračuje, kým sa nenájde riešenie problému s danou presnosťou, alebo kým sa nezistí, že proces konvergoval (t. j. nedošlo k žiadnemu zlepšeniu riešenia problému za posledné obdobie). N generácií).

V prostredí Matlab sú genetické algoritmy reprezentované samostatným súborom nástrojov, ako aj balíkom ANFIS. ANFIS je skratka pre Adaptive-Network-Based Fuzzy Inference System - Adaptive Fuzzy Inference Network. ANFIS je jedným z prvých variantov hybridných neuro-fuzzy sietí - neurónová sieť špeciálneho typu priameho šírenia signálu. Architektúra neuro-fuzzy siete je izomorfná s fuzzy bázou znalostí. V neurofuzzy sieťach sa používajú diferencovateľné implementácie trojuholníkových noriem (násobenie a pravdepodobnostné OR), ako aj funkcie hladkého členstva. To umožňuje použiť rýchle a genetické algoritmy na trénovanie neurónových sietí založených na metóde spätného šírenia na ladenie neuro-fuzzy sietí. Architektúra a pravidlá prevádzky každej vrstvy siete ANFIS sú popísané nižšie.

ANFIS implementuje Sugenov fuzzy inferenčný systém ako päťvrstvovú doprednú neurónovú sieť. Účel vrstiev je nasledovný: prvá vrstva sú členy vstupných premenných; druhá vrstva - predchodcovia (parcely) fuzzy pravidiel; treťou vrstvou je normalizácia stupňa plnenia pravidiel; štvrtou vrstvou sú závery pravidiel; piata vrstva je agregácia výsledku získaného podľa rôznych pravidiel.

Sieťové vstupy nie sú pridelené samostatnej vrstve. Obrázok 23 zobrazuje sieť ANFIS s jednou vstupnou premennou („chyba“) a piatimi fuzzy pravidlami. Na lingvistické vyhodnotenie vstupnej premennej "chyba" sa používa 5 pojmov.


Obr.23. ŠtruktúraANFIS- siete.

Uveďme si nasledujúci zápis potrebný pre ďalšiu prezentáciu:

Dovoliť sú vstupy siete;

y - sieťový výstup;

Fuzzy pravidlo s radovou číslovkou r;

m - počet pravidiel;

Fuzzy term s funkciou príslušnosti , používaný na lingvistické vyhodnotenie premennej v r-tom pravidle (,);

Reálne čísla v závere r-tého pravidla (,).

Sieť ANFIS funguje nasledovne.

Vrstva 1 Každý uzol prvej vrstvy predstavuje jeden člen s funkciou členstva v tvare zvona. Vstupy siete sú pripojené len na ich podmienky. Počet uzlov v prvej vrstve sa rovná súčtu mohutností množín termínov vstupných premenných. Výstupom uzla je miera príslušnosti hodnoty vstupnej premennej k zodpovedajúcemu fuzzy členu:

,

kde a, b a c sú parametre konfigurovateľné funkciou členstva.

Vrstva 2 Počet uzlov v druhej vrstve je m. Každý uzol tejto vrstvy zodpovedá jednému fuzzy pravidlu. Uzol druhej vrstvy je spojený s tými uzlami prvej vrstvy, ktoré tvoria predchodcovia zodpovedajúceho pravidla. Preto každý uzol druhej vrstvy môže prijímať od 1 do n vstupných signálov. Výstupom uzla je stupeň vykonania pravidla, ktorý sa vypočíta ako súčin vstupných signálov. Označte výstupy uzlov tejto vrstvy , .

Vrstva 3 Počet uzlov v tretej vrstve je tiež m. Každý uzol tejto vrstvy vypočítava relatívny stupeň splnenia fuzzy pravidla:

Vrstva 4 Počet uzlov vo štvrtej vrstve je tiež m. Každý uzol je pripojený k jednému uzlu tretej vrstvy ako aj všetkým vstupom siete (prepojenia na vstupy nie sú na obr. 18). Uzol štvrtej vrstvy vypočítava príspevok jedného fuzzy pravidla k výstupu siete:

Vrstva 5 Jediný uzol tejto vrstvy sumarizuje príspevky všetkých pravidiel:

.

Na vyladenie siete ANFIS je možné použiť typické tréningové postupy neurónovej siete, pretože používa iba diferencovateľné funkcie. Typicky sa používa kombinácia zostupu gradientu vo forme spätného šírenia a najmenších štvorcov. Algoritmus spätného šírenia upravuje parametre predchodcov pravidiel, t.j. členské funkcie. Záverové koeficienty pravidiel sa odhadujú metódou najmenších štvorcov, pretože sú lineárne spojené s výstupom siete. Každá iterácia postupu ladenia sa vykonáva v dvoch krokoch. V prvej fáze sa na vstupy privedie trénovacia vzorka a z nezrovnalosti medzi požadovaným a skutočným správaním siete sa pomocou iteračnej metódy najmenších štvorcov zistia optimálne parametre uzlov štvrtej vrstvy. V druhej fáze sa zvyškový nesúlad prenesie z výstupu siete na vstupy a parametre uzlov prvej vrstvy sa upravia metódou spätného šírenia chýb. Koeficienty záverov pravidiel zistené v prvej fáze sa zároveň nemenia. Postup iteratívneho ladenia pokračuje, kým zvyšková hodnota neprekročí vopred stanovenú hodnotu. Na vyladenie funkcií členstva možno okrem metódy spätného šírenia chýb použiť aj iné optimalizačné algoritmy, napríklad metódu Levenberg-Marquardt.

Obr.24. Pracovný priestor ANFISedit.

Skúsme teraz optimalizovať fuzzy regulátor pre jednokrokovú akciu. Požadovaný prechodný proces je približne nasledujúci:

Obr.25. požadovaný proces prechodu.

Z grafu znázorneného na obr. z toho vyplýva, že väčšinu času by mal motor bežať na plný výkon, aby si zabezpečil maximálne otáčky a pri priblížení sa k požadovanej hodnote by mal plynulo spomaľovať. Na základe týchto jednoduchých úvah vezmeme nasledujúcu vzorku hodnôt ako cvičnú, ktorá je uvedená nižšie vo forme tabuľky:

Tabuľka 4


Chybová hodnota

Hodnota manažmentu

Chybová hodnota

Hodnota manažmentu

Chybová hodnota

Hodnota manažmentu


Obr.26. Typ tréningovej súpravy.

Školenie bude prebiehať v 100 krokoch. Na konvergenciu použitej metódy je to viac než dosť.

Obr.27. Proces učenia sa neurónovej siete.

V procese učenia sa parametre funkcií členstva tvoria tak, že pri danej chybovej hodnote regulátor vytvorí potrebnú kontrolu. V úseku medzi uzlovými bodmi je závislosť kontroly od chyby interpoláciou údajov tabuľky. Interpolačná metóda závisí od toho, ako je trénovaná neurónová sieť. V skutočnosti, po tréningu, model fuzzy regulátora môže byť reprezentovaný ako nelineárna funkcia jednej premennej, ktorej graf je uvedený nižšie.

Obr.28. Graf závislosti riadenia od chyby k polohe vo vnútri regulátora.

Po uložení zistených parametrov funkcií príslušnosti simulujeme systém s optimalizovaným fuzzy regulátorom.


Ryža. 29. Prechodný proces pod harmonickým vstupom pre model s optimalizovaným fuzzy regulátorom obsahujúcim jednu vstupnú lingvistickú premennú.

Obr.30. Chybový signál pod harmonickým vstupom pre model s fuzzy regulátorom obsahujúcim dve vstupné lingvistické premenné.


Z grafov vyplýva, že optimalizácia fuzzy regulátora trénovaním neurónovej siete bola úspešná. Výrazne sa znížila fluktuácia a veľkosť chyby. Preto je použitie neurónovej siete celkom rozumné na optimalizáciu regulátorov, ktorých princíp je založený na fuzzy logike. Ani optimalizovaný regulátor však nedokáže uspokojiť požiadavky na presnosť, preto je vhodné uvažovať o inom spôsobe riadenia, kedy fuzzy regulátor neriadi objekt priamo, ale kombinuje viaceré zákonitosti riadenia v závislosti od situácie.

Nedeľa, 29. marec 2015

V súčasnosti existuje veľa úloh, pri ktorých je potrebné urobiť nejaké rozhodnutie v závislosti od prítomnosti objektu na obrázku alebo ho klasifikovať. Schopnosť „rozpoznať“ sa považuje za hlavnú vlastnosť biologických bytostí, zatiaľ čo počítačové systémy túto vlastnosť úplne nevlastnia.

Zvážte všeobecné prvky klasifikačného modelu.

Trieda- súbor predmetov, ktoré majú spoločné vlastnosti. Pre objekty rovnakej triedy sa predpokladá prítomnosť „podobnosti“. Pre úlohu rozpoznávania je možné definovať ľubovoľný počet tried, viac ako 1. Počet tried je označený číslom S. Každá trieda má svoj vlastný identifikačný štítok triedy.

Klasifikácia- proces priraďovania označení tried k objektom, podľa nejakého popisu vlastností týchto objektov. Klasifikátor je zariadenie, ktoré prijíma množinu vlastností objektu ako vstup a ako výsledok vytvára označenie triedy.

Overenie- proces porovnávania inštancie objektu s jedným objektovým modelom alebo popisom triedy.

Pod spôsobom názov oblasti budeme chápať v priestore atribútov, v ktorom sú zobrazené mnohé predmety či javy hmotného sveta. znamenie- kvantitatívny popis konkrétnej vlastnosti skúmaného objektu alebo javu.

priestor funkcií toto je N-rozmerný priestor definovaný pre danú úlohu rozpoznávania, kde N je pevný počet meraných prvkov pre ľubovoľné objekty. Vektor z priestoru znakov x zodpovedajúci objektu rozpoznávacieho problému je N-rozmerný vektor so zložkami (x_1,x_2,…,x_N), čo sú hodnoty znakov pre daný objekt.

Inými slovami, rozpoznávanie vzorov možno definovať ako priradenie počiatočných údajov k určitej triede extrahovaním základných znakov alebo vlastností, ktoré charakterizujú tieto údaje, zo všeobecného množstva irelevantných detailov.

Príklady klasifikačných problémov sú:

  • rozpoznávanie znakov;
  • rozpoznávanie reči;
  • stanovenie lekárskej diagnózy;
  • predpoveď počasia;
  • rozpoznávanie tváre
  • triedenie dokumentov a pod.

Zdrojovým materiálom je najčastejšie obraz prijatý z fotoaparátu. Úlohu možno formulovať ako získanie vektorov znakov pre každú triedu v uvažovanom obrázku. Proces možno považovať za proces kódovania, ktorý spočíva v priradení hodnoty každému prvku z priestoru prvkov pre každú triedu.

Ak vezmeme do úvahy 2 triedy objektov: dospelých a detí. Ako vlastnosti si môžete vybrať výšku a hmotnosť. Ako vyplýva z obrázku, tieto dve triedy tvoria dve nepretínajúce sa množiny, čo možno vysvetliť zvolenými znakmi. Nie vždy je však možné zvoliť správne namerané parametre ako znaky tried. Zvolené parametre napríklad nie sú vhodné na vytváranie neprekrývajúcich sa tried futbalistov a basketbalistov.

Druhou úlohou rozpoznávania je výber charakteristických znakov alebo vlastností z pôvodných obrázkov. Túto úlohu možno pripísať predbežnému spracovaniu. Ak vezmeme do úvahy úlohu rozpoznávania reči, môžeme rozlíšiť také znaky, ako sú samohlásky a spoluhlásky. Atribút musí byť charakteristickou vlastnosťou konkrétnej triedy, pričom musí byť pre túto triedu spoločný. Znaky, ktoré charakterizujú rozdiely medzi - medzitriednymi znakmi. Funkcie spoločné pre všetky triedy nenesú užitočné informácie a nepovažujú sa za vlastnosti v probléme rozpoznávania. Výber vlastností je jednou z dôležitých úloh spojených s konštrukciou rozpoznávacieho systému.

Po určení znakov je potrebné určiť optimálny rozhodovací postup pre klasifikáciu. Zvážte systém rozpoznávania vzorov navrhnutý tak, aby rozpoznával rôzne triedy M, označované ako m_1,m_2,…,m 3. Potom môžeme predpokladať, že priestor obrazu pozostáva z M oblastí, z ktorých každá obsahuje body zodpovedajúce obrázku z jednej triedy. Potom možno problém rozpoznávania považovať za konštrukciu hraníc oddeľujúcich M triedy na základe akceptovaných meracích vektorov.

Riešenie problému predspracovania obrazu, extrakcie znakov a problém získania optimálneho riešenia a klasifikácie je zvyčajne spojený s potrebou vyhodnocovania množstva parametrov. To vedie k problému odhadu parametrov. Okrem toho je zrejmé, že extrakcia funkcií môže využívať ďalšie informácie založené na povahe tried.

Porovnanie objektov je možné vykonať na základe ich reprezentácie vo forme meracích vektorov. Je vhodné reprezentovať namerané údaje ako reálne čísla. Potom možno podobnosť príznakových vektorov dvoch objektov opísať pomocou euklidovskej vzdialenosti.

kde d je rozmer charakteristického vektora.

Existujú 3 skupiny metód rozpoznávania vzorov:

  • Ukážkové porovnanie. Táto skupina zahŕňa klasifikáciu podľa najbližšieho priemeru, klasifikáciu podľa vzdialenosti k najbližšiemu susedovi. Do porovnávacej skupiny vzoriek možno zahrnúť aj metódy štrukturálneho rozpoznávania.
  • Štatistické metódy. Ako už názov napovedá, štatistické metódy využívajú niektoré štatistické informácie pri riešení problému rozpoznávania. Metóda určuje príslušnosť objektu ku konkrétnej triede na základe pravdepodobnosti. V niektorých prípadoch ide o určenie aposteriórnej pravdepodobnosti objektu patriaceho do určitej triedy za predpokladu, že vlastnosti tohto objektu nadobudli primeranú hodnotu. hodnoty. Príkladom je metóda Bayesovho rozhodovacieho pravidla.
  • Neurálne siete. Samostatná trieda metód rozpoznávania. Charakteristickým znakom od ostatných je schopnosť učiť sa.

Klasifikácia podľa najbližšieho priemeru

V klasickom prístupe rozpoznávania vzorov, v ktorom je neznámy objekt na klasifikáciu reprezentovaný ako vektor elementárnych znakov. Systém rozpoznávania založený na vlastnostiach možno vyvinúť rôznymi spôsobmi. Tieto vektory môžu byť systému známe vopred ako výsledok školenia alebo predpovedané v reálnom čase na základe niektorých modelov.

Jednoduchý klasifikačný algoritmus pozostáva zo zoskupenia referenčných údajov triedy pomocou vektora očakávania triedy (priemer).

kde x(i,j) je j-tý referenčný znak triedy i, n_j je počet referenčných vektorov triedy i.

Potom bude neznámy objekt patriť do triedy i, ak je oveľa bližšie k očakávanému vektoru triedy i ako k očakávaným vektorom iných tried. Táto metóda je vhodná pre problémy, v ktorých sú body každej triedy umiestnené kompaktne a ďaleko od bodov iných tried.

Ťažkosti nastanú, ak majú triedy trochu zložitejšiu štruktúru, napríklad ako na obrázku. V tomto prípade je trieda 2 rozdelená na dve neprekrývajúce sa časti, ktoré sú zle opísané jednou priemernou hodnotou. Trieda 3 je tiež príliš pretiahnutá, vzorky 3. triedy s veľkými hodnotami súradníc x_2 sú bližšie k priemernej hodnote 1. triedy ako 3. triedy.

Opísaný problém možno v niektorých prípadoch vyriešiť zmenou výpočtu vzdialenosti.

Zohľadníme charakteristiku „rozptylu“ hodnôt triedy - σ_i pozdĺž každého smeru súradníc i. Smerodajná odchýlka sa rovná druhej odmocnine rozptylu. Škálovaná euklidovská vzdialenosť medzi vektorom x a vektorom očakávania x_c je

Tento vzorec vzdialenosti zníži počet klasifikačných chýb, ale v skutočnosti väčšina problémov nemôže byť reprezentovaná takouto jednoduchou triedou.

Klasifikácia podľa vzdialenosti k najbližšiemu susedovi

Iný prístup ku klasifikácii je priradiť neznámy znakový vektor x triede, ktorej je tento vektor najbližšie k samostatnej vzorke. Toto pravidlo sa nazýva pravidlo najbližšieho suseda. Klasifikácia najbližšieho suseda môže byť efektívnejšia, aj keď sú triedy zložité alebo keď sa triedy prekrývajú.

Tento prístup nevyžaduje predpoklady o distribučných modeloch charakteristických vektorov v priestore. Algoritmus používa iba informácie o známych referenčných vzorkách. Metóda riešenia je založená na výpočte vzdialenosti x ku každej vzorke v databáze a nájdení minimálnej vzdialenosti. Výhody tohto prístupu sú zrejmé:

  • do databázy môžete kedykoľvek pridať nové vzorky;
  • stromové a mriežkové dátové štruktúry znižujú počet vypočítaných vzdialeností.

Navyše, riešenie bude lepšie, ak si v databáze pozriete nie jedného najbližšieho suseda, ale k. Potom pre k > 1 poskytuje najlepšiu vzorku rozloženia vektorov v d-rozmernom priestore. Efektívne využitie hodnôt k však závisí od toho, či je v každej oblasti priestoru dostatok. Ak existuje viac ako dve triedy, potom je ťažšie urobiť správne rozhodnutie.

Literatúra

  • M. Castrillon, . O. Deniz, . D. Hernández a J. Lorenzo, „Porovnanie detektorov tváre a tvárových prvkov na základe všeobecného rámca detekcie objektov Viola-Jones“, International Journal of Computer Vision, č.22, str. 481-494, 2011.
  • Y.-Q. Wang, "Analýza algoritmu detekcie tváre Viola-Jones", IPOL Journal, 2013.
  • L. Shapiro a D. Stockman, Počítačové videnie, Binom. Knowledge Lab, 2006.
  • Z. N. G., Metódy rozpoznávania a ich aplikácia, Sovietsky rozhlas, 1972.
  • J. Tu, R. Gonzalez, Matematické princípy rozpoznávania vzorov, Moskva: „Mir“ Moskva, 1974.
  • Khan, H. Abdullah a M. Shamian Bin Zainal, "Efektívny algoritmus detekcie očí a úst pomocou kombinácie detekcie pixelov violy Jonesovej a farby pleti" International Journal of Engineering and Applied Sciences, č. 3 č. 4, 2013.
  • V. Gaede a O. Gunther, "Multidimenzionální prístupové metódy," ACM Computing Surveys, str. 170-231, 1998.

Prehľad existujúcich metód rozpoznávania vzorov

L.P. Popova , A O. Datiev

Schopnosť „rozpoznať“ sa považuje za hlavnú vlastnosť ľudí, ako aj iných živých organizmov. Rozpoznávanie vzorov je odvetvie kybernetiky, ktoré rozvíja princípy a metódy na klasifikáciu a identifikáciu objektov, javov, procesov, signálov, situácií – všetkých tých objektov, ktoré možno opísať konečnou množinou niektorých znakov alebo vlastností, ktoré charakterizujú objekt.

Obrázok je popis objektu. Obrazy majú charakteristickú vlastnosť, ktorá sa prejavuje v tom, že oboznámenie sa s konečným počtom javov z tej istej množiny umožňuje rozpoznať ľubovoľne veľký počet jej predstaviteľov.

V teórii rozpoznávania vzorov existujú dva hlavné smery:

    štúdium rozpoznávacích schopností ľudí a iných živých organizmov;

    vývoj teórie a metód konštrukcie zariadení určených na riešenie individuálnych problémov rozpoznávania vzorov v určitých aplikačných oblastiach.

Ďalej článok popisuje problémy, princípy a metódy implementácie systémov rozpoznávania vzorov súvisiace s vývojom druhého smeru. Druhá časť článku pojednáva o metódach neurónových sietí rozpoznávania vzorov, ktoré možno pripísať prvému smeru teórie rozpoznávania vzorov.

Problémy budovania systémov rozpoznávania obrazu

Úlohy, ktoré vznikajú pri konštrukcii systémov automatického rozpoznávania vzorov, možno zvyčajne rozdeliť do niekoľkých hlavných oblastí. Prvý z nich súvisí s prezentáciou počiatočných údajov získaných ako výsledky meraní pre objekt, ktorý sa má rozpoznať. problém citlivosti. Každá nameraná hodnota je nejaká "charakteristika obrázku alebo objektu. Predpokladajme napríklad, že obrázky sú alfanumerické znaky. V tomto prípade možno úspešne použiť meraciu sietnicu, ktorá je podobná tej na obr. 1 (a). v senzore. Ak sa sietnica skladá z n-prvkov, potom výsledky merania môžu byť reprezentované ako vektor merania alebo obrazový vektor ,

kde každý prvok xi má napríklad hodnotu 1, ak obraz symbolu prechádza i-tou bunkou sietnice, a hodnotu 0 inak.

Zvážte Obr. 2(b). V tomto prípade sú obrazy spojitými funkciami (typu zvukových signálov) premennej t. Ak sú funkčné hodnoty merané v diskrétnych bodoch t1,t2, ..., tn, potom obrazový vektor možno vytvoriť tak, že vezmeme x1= f(t1),x2=f(t2),... , xn = f(tn).

Obrázok 1. Meranie sietnice

Druhý problém rozpoznávania vzorov súvisí s výberom charakteristických znakov alebo vlastností zo získaných počiatočných údajov a zmenšením rozmeru vektorov vzorov. Tento problém je často definovaný ako problém predspracovanie a výber funkcií.

Vlastnosti triedy obrázkov sú charakteristické vlastnosti spoločné pre všetky obrázky danej triedy. Znaky, ktoré charakterizujú rozdiely medzi jednotlivými triedami, možno interpretovať ako medzitriedne znaky. Vnútrotriedne znaky, ktoré sú spoločné pre všetky uvažované triedy, nenesú užitočné informácie z hľadiska rozpoznávania a nemusia sa brať do úvahy. Výber vlastností sa považuje za jednu z dôležitých úloh spojených s konštrukciou rozpoznávacích systémov. Ak výsledky merania umožňujú získať úplný súbor rozlišovacích znakov pre všetky triedy, skutočné rozpoznanie a klasifikácia vzorov nespôsobí žiadne zvláštne ťažkosti. Automatické rozpoznávanie by sa potom zredukovalo na jednoduchý proces párovania alebo procedúry, ako je vyhľadávanie v tabuľke. Vo väčšine praktických problémov s rozpoznávaním je však určenie úplného súboru rozlišovacích znakov mimoriadne ťažké, ak nie nemožné. Z pôvodných údajov je zvyčajne možné extrahovať niektoré rozlišovacie znaky a použiť ich na zjednodušenie procesu automatického rozpoznávania vzorov. Najmä rozmer meracích vektorov možno zmenšiť pomocou transformácií, ktoré minimalizujú stratu informácií.

Tretím problémom spojeným s konštrukciou systémov rozpoznávania vzorov je nájsť optimálne rozhodovacie postupy potrebné na identifikáciu a klasifikáciu. Potom, čo sú zhromaždené údaje o vzoroch, ktoré sa majú rozpoznať, reprezentované bodmi alebo meracími vektormi v priestore vzorov, nechajte stroj zistiť, ktorej triede vzorov tieto údaje zodpovedajú. Nech je stroj navrhnutý tak, aby rozlišoval medzi triedami M, označenými w1, w2, ... ..., wm. V tomto prípade sa priestor obrazu môže považovať za pozostávajúci z M oblastí, z ktorých každá obsahuje body zodpovedajúce obrazom z rovnakej triedy. V tomto prípade možno problém rozpoznávania považovať za konštrukciu hraníc rozhodovacích oblastí oddeľujúcich M triedy na základe registrovaných meracích vektorov. Nech sú tieto hranice definované napríklad rozhodovacími funkciami d1(х),d2(x),..., dm(х). Tieto funkcie, nazývané aj diskriminačné funkcie, sú skalárne a jednohodnotové funkcie obrazu x. Ak di (x) > dj (x), potom obrázok x patrí do triedy w1. Inými slovami, ak má i-tá rozhodovacia funkcia di(x) najvyššiu hodnotu, potom zmysluplná ilustrácia takejto automatickej klasifikačnej schémy na základe implementácie rozhodovacieho procesu je znázornená na obr. 2 (na schéme "GR" - generátor rozhodujúcich funkcií).

Obrázok 2. Schéma automatickej klasifikácie.

Rozhodovacie funkcie možno získať rôznymi spôsobmi. V tých prípadoch, kde sú k dispozícii úplné a priori informácie o rozpoznateľných vzorcoch, možno rozhodovacie funkcie určiť presne na základe týchto informácií. Ak sú o vzoroch dostupné iba kvalitatívne informácie, možno urobiť rozumné predpoklady o forme rozhodovacích funkcií. V druhom prípade sa hranice rozhodovacích regiónov môžu výrazne odchyľovať od skutočných, a preto je potrebné vytvoriť systém schopný dospieť k uspokojivému výsledku prostredníctvom série postupných úprav.

Objekty (obrázky), ktoré sa majú rozpoznať a klasifikovať pomocou systému automatického rozpoznávania vzorov, musia mať súbor merateľných charakteristík. Ak sú pre celú skupinu obrázkov výsledky zodpovedajúcich meraní podobné, predpokladá sa, že tieto objekty patria do rovnakej triedy. Účelom systému rozpoznávania vzorov je určiť na základe zozbieraných informácií triedu objektov s vlastnosťami podobnými tým, ktoré sa namerali pre rozpoznateľné objekty. Správnosť rozpoznávania závisí od množstva rozlišovacích informácií obsiahnutých v meraných charakteristikách a efektívnosti využitia týchto informácií.

      Základné metódy implementácie systémov rozpoznávania vzorov

Rozpoznávanie vzorov je úlohou konštrukcie a aplikácie formálnych operácií na numerických alebo symbolických reprezentáciách objektov reálneho alebo ideálneho sveta, ktorých výsledky odrážajú ekvivalenčné vzťahy medzi týmito objektmi. Vzťahy ekvivalencie vyjadrujú príslušnosť hodnotených objektov k niektorým triedam, ktoré sa považujú za samostatné sémantické jednotky.

Pri konštrukcii rozpoznávacích algoritmov môže ekvivalenčné triedy nastaviť výskumník, ktorý používa vlastné zmysluplné nápady alebo používa externé dodatočné informácie o podobnosti a odlišnosti objektov v kontexte riešeného problému. Potom sa hovorí o „rozlišovaní s učiteľom“. V opačnom prípade, t.j. keď automatizovaný systém rieši problém klasifikácie bez toho, aby zahŕňal externé školiace informácie, hovorí sa o automatickej klasifikácii alebo „rozpoznaní bez dozoru“. Väčšina algoritmov rozpoznávania vzorov vyžaduje veľmi významný výpočtový výkon, ktorý môže poskytnúť iba vysokovýkonná počítačová technológia.

Rôzni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, Temnikov F.E., Afonin V.A., Dmitriev V.I., Dmitriev V.I., Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin a ďalší) uvádzajú inú typológiu metód rozpoznávania vzorov. Niektorí autori rozlišujú parametrické, neparametrické a heuristické metódy, iní vyčleňujú skupiny metód vychádzajúce z historických škôl a trendov v tejto oblasti.

Známe typológie zároveň nezohľadňujú jednu veľmi významnú charakteristiku, ktorá odráža špecifiká spôsobu reprezentácie vedomostí o predmetnej oblasti pomocou akéhokoľvek formálneho algoritmu rozpoznávania vzorov. D.A. Pospelov identifikuje dva hlavné spôsoby reprezentácie vedomostí:

    Intenzionálna reprezentácia – vo forme diagramu vzťahov medzi atribútmi (vlastnosťami).

    Extenzionálna reprezentácia – pomocou konkrétnych faktov (predmetov, príkladov).

Treba poznamenať, že existencia týchto dvoch skupín metód rozpoznávania: metód pracujúcich s vlastnosťami a tých, ktoré pracujú s objektmi, je hlboko prirodzená. Z tohto hľadiska žiadna z týchto metód, braná oddelene od druhej, neumožňuje vytvoriť adekvátnu reflexiu predmetnej oblasti. Medzi týmito metódami existuje vzťah komplementarity v zmysle N. Bohra, preto by perspektívne rozpoznávacie systémy mali poskytovať implementáciu oboch týchto metód, a nie len jednej z nich.

Klasifikácia metód rozpoznávania navrhnutá D.A. Pospelovom je teda založená na základných zákonoch, ktoré sú základom ľudského spôsobu poznávania vo všeobecnosti, čo ho stavia do veľmi zvláštneho (privilegovaného) postavenia v porovnaní s inými klasifikáciami, ktoré na tomto pozadí vyzerajú ľahšie a umelejšie.

Intenzionálne metódy

Charakteristickým rysom intenzionálnych metód je, že používajú rôzne charakteristiky vlastností a ich vzťahov ako prvky operácií pri konštrukcii a aplikácii algoritmov rozpoznávania vzorov. Takýmito prvkami môžu byť jednotlivé hodnoty alebo intervaly hodnôt vlastností, priemerné hodnoty a odchýlky, matice vzťahov medzi vlastnosťami atď., na ktorých sa vykonávajú akcie, vyjadrené v analytickej alebo konštruktívnej forme. Zároveň sa objekty v týchto metódach nepovažujú za integrálne informačné jednotky, ale fungujú ako indikátory na hodnotenie interakcie a správania sa ich atribútov.

Skupina metód intenzionálneho rozpoznávania vzorov je rozsiahla a jej rozdelenie do podtried je trochu ľubovoľné:

– metódy založené na odhadoch distribučných hustôt hodnôt znakov

– metódy založené na predpokladoch o triede rozhodovacích funkcií

– logické metódy

– lingvistické (štrukturálne) metódy.

Metódy založené na odhadoch distribučných hustôt hodnôt znakov. Tieto metódy rozpoznávania vzorov sú prevzaté z klasickej teórie štatistických rozhodnutí, v ktorej sa predmety štúdia považujú za realizácie viacrozmernej náhodnej premennej distribuovanej v priestore znakov podľa nejakého zákona. Sú založené na Bayesovskej schéme rozhodovania, ktorá sa odvoláva na a priori pravdepodobnosti objektov patriacich do konkrétnej rozpoznateľnej triedy a podmienené hustoty rozloženia hodnôt vektora znakov. Tieto metódy sú redukované na určenie pravdepodobnostného pomeru v rôznych oblastiach viacrozmerného priestoru prvkov.

Skupina metód založených na odhade distribučných hustôt hodnôt znakov priamo súvisí s metódami diskriminačnej analýzy. Bayesovský prístup k rozhodovaniu je jedným z najrozvinutejších v modernej štatistike, takzvané parametrické metódy, pre ktoré sa analytické vyjadrenie distribučného zákona (v tomto prípade normálneho zákona) považuje za známe a len málo je potrebné odhadnúť počet parametrov (stredné vektory a kovariančné matice).

Táto skupina zahŕňa aj metódu na výpočet pravdepodobnostného pomeru pre nezávislé znaky. Táto metóda, s výnimkou predpokladu nezávislosti znakov (ktorá sa v skutočnosti prakticky nikdy nenapĺňa), neznamená znalosť funkčnej podoby distribučného zákona. Možno to pripísať neparametrickým metódam.

Iné neparametrické metódy, ktoré sa používajú, keď nie je známy tvar krivky hustoty distribúcie a nemožno o jej povahe vôbec predpokladať, zaujímajú osobitné postavenie. Patrí medzi ne známa metóda viacrozmerných histogramov, metóda „k-nearest suseds“, metóda euklidovskej vzdialenosti, metóda potenciálnych funkcií atď., ktorých zovšeobecnením je metóda nazývaná „Parzenove odhady“. Tieto metódy formálne fungujú s objektmi ako integrálnymi štruktúrami, ale v závislosti od typu rozpoznávacej úlohy môžu pôsobiť v intenzionálnych aj extenzných hypostázach.

Neparametrické metódy analyzujú relatívne počty objektov spadajúcich do daných viacrozmerných objemov a využívajú rôzne funkcie vzdialenosti medzi objektmi trénovacej vzorky a rozpoznanými objektmi. Pri kvantitatívnych znakoch, keď je ich počet oveľa menší ako veľkosť vzorky, hrajú operácie s objektmi prostrednú úlohu pri odhadovaní lokálnych distribučných hustôt podmienených pravdepodobností a objekty nenesú sémantickú záťaž nezávislých informačných jednotiek. Zároveň, keď je počet znakov úmerný alebo väčší ako počet skúmaných objektov a znaky sú kvalitatívneho alebo dichotomického charakteru, potom nemôže byť reč o žiadnych lokálnych odhadoch hustoty rozdelenia pravdepodobnosti. V tomto prípade sa objekty v týchto neparametrických metódach považujú za nezávislé informačné jednotky (holistické empirické fakty) a tieto metódy nadobúdajú význam hodnotenia podobnosti a odlišnosti skúmaných objektov.

Rovnaké technologické operácie neparametrických metód majú teda v závislosti od podmienok problému zmysel buď lokálne odhady hustôt rozdelenia pravdepodobnosti hodnôt znakov, alebo odhady podobnosti a rozdielnosti objektov.

V kontexte intenzionálnej reprezentácie vedomostí sa tu uvažuje o prvej strane neparametrických metód, ako o odhadoch hustôt rozdelenia pravdepodobnosti. Mnohí autori poznamenávajú, že neparametrické metódy, ako sú Parzenove odhady, fungujú v praxi dobre. Hlavnými ťažkosťami pri aplikácii týchto metód je potreba zapamätať si celú trénovaciu vzorku na výpočet odhadov miestnych hustôt rozdelenia pravdepodobnosti a vysoká citlivosť na nereprezentatívnosť trénovacej vzorky.

Metódy založené na predpokladoch o triede rozhodovacích funkcií. V tejto skupine metód sa všeobecná forma rozhodovacej funkcie považuje za známu a je daná jej kvalitatívna funkcionalita. Na základe tohto funkcionálu sa hľadá najlepšia aproximácia rozhodovacej funkcie pre trénovaciu postupnosť. Najbežnejšie sú reprezentácie rozhodovacích funkcií vo forme lineárnych a zovšeobecnených nelineárnych polynómov. Funkčná kvalita rozhodovacieho pravidla je zvyčajne spojená s chybou klasifikácie.

Hlavnou výhodou metód založených na predpokladoch o triede rozhodovacích funkcií je jasnosť matematickej formulácie problému rozpoznávania ako problému hľadania extrému. Riešenie tohto problému sa často dosahuje pomocou nejakého druhu gradientových algoritmov. Rozmanitosť metód tejto skupiny je vysvetlená širokým rozsahom používaných funkcionalít kvality rozhodovacích pravidiel a extrémnych vyhľadávacích algoritmov. Zovšeobecnením uvažovaných algoritmov, medzi ktoré patrí najmä Newtonov algoritmus, algoritmy perceptrónového typu a pod., je metóda stochastickej aproximácie. Na rozdiel od metód parametrického rozpoznávania úspech tejto skupiny metód nezávisí až tak od nesúladu teoretických predstáv o zákonitostiach rozmiestnenia objektov v priestore znakov s empirickou realitou. Všetky operácie sú podriadené jednému hlavnému cieľu - nájdeniu extrému kvalitatívneho funkcionálu rozhodovacieho pravidla. Zároveň môžu byť výsledky parametrických a uvažovaných metód podobné. Ako je uvedené vyššie, parametrické metódy pre prípad normálneho rozdelenia objektov v rôznych triedach s rovnakými kovariančnými maticami vedú k lineárnym rozhodovacím funkciám. Poznamenávame tiež, že algoritmy na výber informatívnych prvkov v lineárnych diagnostických modeloch možno interpretovať ako konkrétne varianty gradientových algoritmov na hľadanie extrému.

Pomerne dobre sú preštudované možnosti gradientových algoritmov na hľadanie extrému, najmä v skupine lineárnych rozhodovacích pravidiel. Konvergencia týchto algoritmov bola preukázaná len pre prípad, keď sú rozpoznateľné triedy objektov zobrazené v priestore prvkov kompaktnými geometrickými štruktúrami. Túžbu po dosiahnutí dostatočnej kvality rozhodovacieho pravidla však možno často uspokojiť pomocou algoritmov, ktoré nemajú rigorózny matematický dôkaz konvergencie riešenia ku globálnemu extrému.

Takéto algoritmy zahŕňajú veľkú skupinu heuristických programovacích procedúr reprezentujúcich smer evolučného modelovania. Evolučné modelovanie je bionická metóda vypožičaná z prírody. Je založená na využití známych mechanizmov evolúcie s cieľom nahradiť proces zmysluplného modelovania komplexného objektu fenomenologickým modelovaním jeho evolúcie.

Známym predstaviteľom evolučného modelovania v rozpoznávaní vzorov je metóda skupinového účtovania argumentov (MGUA). GMDH je založený na princípe samoorganizácie a GMDH algoritmy reprodukujú schému hromadného výberu. V algoritmoch GMDH sa členovia zovšeobecneného polynómu syntetizujú a vyberajú špeciálnym spôsobom, ktorý sa často nazýva Kolmogorov-Gaborov polynóm. Táto syntéza a selekcia sa uskutočňuje so zvyšujúcou sa zložitosťou a nie je možné vopred predpovedať, akú konečnú podobu bude mať zovšeobecnený polynóm. Najprv sa zvyčajne uvažujú jednoduché párové kombinácie počiatočných znakov, z ktorých sa skladajú rovnice rozhodujúcich funkcií spravidla nie vyšších ako druhého rádu. Každá rovnica sa analyzuje ako nezávislá rozhodovacia funkcia a hodnoty parametrov zložených rovníc sa tak či onak nachádzajú z tréningovej vzorky. Potom sa z výslednej množiny rozhodovacích funkcií vyberie časť v istom zmysle najlepších. Kvalita jednotlivých rozhodovacích funkcií sa kontroluje na kontrolnej (testovacej) vzorke, čo sa niekedy nazýva princíp externého sčítania. Vybrané čiastkové rozhodovacie funkcie sú ďalej považované za intermediárne premenné, ktoré slúžia ako počiatočné argumenty pre podobnú syntézu nových rozhodovacích funkcií atď. Proces takejto hierarchickej syntézy pokračuje, kým sa nedosiahne extrém kritéria kvality rozhodovacej funkcie, ktorý v praxi sa prejavuje zhoršením tejto kvality pri pokuse o ďalšie zvýšenie poradia členov polynómu vzhľadom na pôvodné znaky.

Princíp samoorganizácie, ktorý je základom GMDH, sa nazýva heuristická samoorganizácia, pretože celý proces je založený na zavedení externých doplnkov vybraných heuristicky. Výsledok rozhodnutia môže výrazne závisieť od týchto heuristiek. Výsledný diagnostický model závisí od toho, ako sú objekty rozdelené na trénovacie a testovacie vzorky, ako sa určuje kritérium kvality rozpoznávania, koľko premenných sa preskočí v nasledujúcom riadku výberu atď.

Tieto vlastnosti algoritmov GMDH sú charakteristické aj pre iné prístupy k evolučnému modelovaniu. Všimnime si však ešte jeden aspekt posudzovaných metód. To je ich obsahová podstata. Pomocou metód založených na predpokladoch o triede rozhodovacích funkcií (evolučných a gradientných) je možné zostaviť diagnostické modely vysokej zložitosti a získať prakticky prijateľné výsledky. Zároveň dosiahnutie praktických cieľov v tomto prípade nesprevádza získavanie nových poznatkov o povahe rozpoznateľných predmetov. Možnosť extrakcie týchto poznatkov, najmä poznatkov o mechanizmoch interakcie atribútov (vlastností), je tu zásadne obmedzená danou štruktúrou takejto interakcie, fixovanou vo zvolenej forme rozhodujúcich funkcií. Preto maximum, čo možno povedať po zostrojení konkrétneho diagnostického modelu, je uviesť zoznam kombinácií vlastností a samotných vlastností, ktoré sú zahrnuté vo výslednom modeli. Ale význam kombinácií, ktoré odrážajú povahu a štruktúru distribúcie skúmaných objektov, zostáva v rámci tohto prístupu často neobjavený.

Booleovské metódy. Logické metódy rozpoznávania vzorov sú založené na aparáte logickej algebry a umožňujú pracovať s informáciami obsiahnutými nielen v jednotlivých znakoch, ale aj v kombináciách hodnôt znakov. V týchto metódach sa hodnoty ľubovoľného atribútu považujú za elementárne udalosti.

V najvšeobecnejšej podobe možno logické metódy charakterizovať ako akési hľadanie logických vzorcov v trénovacej vzorke a formovanie určitého systému logických rozhodovacích pravidiel (napríklad vo forme konjunkcií elementárnych dejov), pričom každý z nich ktorý má svoju váhu. Skupina logických metód je rôznorodá a zahŕňa metódy rôznej zložitosti a hĺbky analýzy. Pre dichotomické (booleovské) funkcie sú obľúbené takzvané stromové klasifikátory, metóda slepého testu, algoritmus Kora a iné. Zložitejšie metódy sú založené na formalizácii induktívnych metód D. S. Milla. Formalizácia sa vykonáva konštrukciou kvázi-axiomatickej teórie a je založená na viactriedenej viachodnotovej logike s kvantifikátormi na niciach s premenlivou dĺžkou.

Algoritmus Kora, podobne ako iné logické metódy rozpoznávania vzorov, je dosť pracný, pretože pri výbere konjunkcií je potrebný úplný zoznam. Pri aplikácii logických metód sú preto kladené vysoké požiadavky na efektívnu organizáciu výpočtového procesu a tieto metódy dobre fungujú aj pri relatívne malých rozmeroch priestoru funkcií a len na výkonných počítačoch.

Lingvistické (syntaktické alebo štrukturálne) metódy. Lingvistické metódy rozpoznávania vzorov sú založené na použití špeciálnych gramatík, ktoré generujú jazyky, pomocou ktorých možno popísať súbor vlastností rozpoznateľných objektov. Gramatika sa vzťahuje na pravidlá na vytváranie objektov z týchto neodvodených prvkov.

Ak sa popis obrázkov robí pomocou neodvodených prvkov (podobrazov) a ich vzťahov, potom sa na budovanie systémov automatického rozpoznávania využíva lingvistický alebo syntaktický prístup využívajúci princíp zhody vlastností. Obraz možno opísať pomocou hierarchickej štruktúry podobrazov podobnej syntaktickej štruktúre jazyka. Táto okolnosť umožňuje aplikovať teóriu formálnych jazykov pri riešení problémov rozpoznávania vzorov. Predpokladá sa, že gramatika obrázkov obsahuje konečné množiny prvkov nazývané premenné, neodvodené prvky a substitučné pravidlá. Povaha pravidiel suplovania určuje typ gramatiky. Medzi najštudovanejšie gramatiky patria regulárne, bezkontextové a gramatiky priamych prvkov. Kľúčovými bodmi tohto prístupu je výber neodvodených prvkov obrazu, spojenie týchto prvkov a vzťahov, ktoré ich spájajú do gramatiky obrazov, a napokon implementácia procesov analýzy a rozpoznávania v príslušných Jazyk. Tento prístup je užitočný najmä pri práci s obrázkami, ktoré sa buď nedajú opísať numerickými meraniami, alebo sú také zložité, že ich lokálne vlastnosti nemožno identifikovať a je potrebné sa odvolávať na globálne vlastnosti objektov.

Napríklad E.A. Butakov, V.I. Ostrovský, I.L. Fadeev navrhuje nasledujúcu systémovú štruktúru na spracovanie obrazu (obr. 3) pomocou lingvistického prístupu, kde každý z funkčných blokov je softvérový (mikroprogramový) komplex (modul), ktorý implementuje zodpovedajúce funkcie.

Obrázok 3. Schéma štruktúry rozpoznávača

Pokusy aplikovať metódy matematickej lingvistiky na problém analýzy obrazu vedú k potrebe riešiť množstvo problémov súvisiacich s mapovaním štruktúry dvojrozmerného obrazu na jednorozmerné reťazce formálneho jazyka.

Rozširujúce metódy

V metódach tejto skupiny, na rozdiel od intenzionálneho smeru, sa každému študovanému objektu vo väčšej či menšej miere pripisuje nezávislá diagnostická hodnota. Vo svojom jadre sú tieto metódy blízke klinickému prístupu, ktorý ľudí nepovažuje za reťazec objektov zoradených podľa jedného alebo druhého ukazovateľa, ale za ucelené systémy, z ktorých každý je individuálny a má osobitnú diagnostickú hodnotu. Takýto opatrný prístup k predmetom štúdia neumožňuje vylúčiť alebo stratiť informácie o každom jednotlivom objekte, ku ktorému dochádza pri použití metód intenzionálneho smerovania, pričom objekty sa používajú iba na detekciu a opravu vzorcov správania ich atribútov.

Hlavnými operáciami pri rozpoznávaní vzorov pomocou diskutovaných metód sú operácie určovania podobnosti a rozdielu objektov. Objekty v špecifikovanej skupine metód zohrávajú úlohu diagnostických precedensov. Zároveň, v závislosti od podmienok konkrétnej úlohy, sa rola jednotlivého precedensu môže meniť v najširších medziach: od hlavnej a definujúcej až po veľmi nepriamu účasť v procese uznávania. Na druhej strane, podmienky problému môžu vyžadovať účasť rôzneho počtu diagnostických precedensov pre úspešné riešenie: od jedného v každej rozpoznateľnej triede po celú veľkosť vzorky, ako aj rôzne spôsoby výpočtu mier podobnosti a rozdielu. predmety. Tieto požiadavky vysvetľujú ďalšie rozdelenie rozšírených metód do podtried:

    metóda porovnávania prototypov;

    metóda k-najbližšieho suseda;

    tímy rozhodovacích pravidiel.

Metóda porovnávania prototypov. Toto je najjednoduchšia metóda rozšíreného rozpoznávania. Používa sa napríklad vtedy, keď sú rozpoznané triedy zobrazené v priestore prvkov v kompaktných geometrických zoskupeniach. V tomto prípade sa ako prototypový bod zvyčajne volí stred geometrického zoskupenia triedy (alebo objekt najbližšie k stredu).

Na klasifikáciu neznámeho objektu sa nájde prototyp, ktorý je mu najbližšie, a objekt patrí do rovnakej triedy ako tento prototyp. Je zrejmé, že touto metódou sa nevytvárajú žiadne zovšeobecnené obrazy tried.

Ako meradlo blízkosti možno použiť rôzne typy vzdialeností. Pre dichotomické znaky sa často používa Hammingova vzdialenosť, ktorá sa v tomto prípade rovná druhej mocnine euklidovskej vzdialenosti. V tomto prípade je rozhodovacie pravidlo pre klasifikáciu objektov ekvivalentné lineárnej rozhodovacej funkcii.

Túto skutočnosť je potrebné osobitne upozorniť. Jasne demonštruje prepojenie medzi prototypom a indikatívnou reprezentáciou informácií o dátovej štruktúre. Pomocou vyššie uvedeného znázornenia možno napríklad akúkoľvek tradičnú meraciu stupnicu, ktorá je lineárnou funkciou hodnôt dichotomických znakov, považovať za hypotetický diagnostický prototyp. Na druhej strane, ak nám analýza priestorovej štruktúry rozpoznaných tried umožňuje dospieť k záveru, že sú geometricky kompaktné, potom stačí nahradiť každú z týchto tried jedným prototypom, ktorý je vlastne ekvivalentom lineárneho diagnostického modelu.

V praxi je samozrejme situácia často odlišná od opísaného idealizovaného príkladu. Výskumník, ktorý má v úmysle aplikovať metódu rozpoznávania založenú na porovnávaní s prototypmi diagnostických tried, čelí zložitým problémom. Ide v prvom rade o výber miery priblíženia (metriky), ktorá môže výrazne zmeniť priestorovú konfiguráciu rozmiestnenia objektov. A po druhé, nezávislým problémom je analýza viacrozmerných štruktúr experimentálnych údajov. Oba tieto problémy sú pre výskumníka obzvlášť akútne v podmienkach vysokej dimenzie priestoru prvkov, ktorá je typická pre skutočné problémy.

Metóda k-najbližších susedov. Metóda k-najbližšieho suseda na riešenie problémov diskriminačnej analýzy bola prvýkrát navrhnutá už v roku 1952. Je to nasledovné.

Pri klasifikácii neznámeho objektu sa nájde daný počet (k) ďalších objektov, ktoré sú k nemu geometricky najbližšie v priestore prvkov (najbližší susedia) s už známou príslušnosťou k rozpoznateľným triedam. Rozhodnutie o priradení neznámeho objektu konkrétnej diagnostickej triede sa robí analýzou informácií o tomto známom členstve jeho najbližších susedov, napríklad pomocou jednoduchého sčítania hlasov.

Spočiatku sa metóda k-najbližšieho suseda považovala za neparametrickú metódu na odhad pravdepodobnostného pomeru. Pre túto metódu sa získavajú teoretické odhady jej účinnosti v porovnaní s optimálnym bayesovským klasifikátorom. Je dokázané, že pravdepodobnosti asymptotických chýb pre metódu k-najbližšieho suseda prevyšujú chyby Bayesovho pravidla maximálne dvakrát.

Ako bolo uvedené vyššie, v reálnych problémoch je často potrebné operovať s objektmi, ktoré sú popísané veľkým počtom kvalitatívnych (dichotomických) znakov. Zároveň je rozmer priestoru znakov úmerný alebo väčší ako objem skúmanej vzorky. Za takýchto podmienok je vhodné interpretovať každý objekt trénovacej vzorky ako samostatný lineárny klasifikátor. Potom jednu alebo druhú diagnostickú triedu nepredstavuje jeden prototyp, ale súbor lineárnych klasifikátorov. Výsledkom kombinovanej interakcie lineárnych klasifikátorov je po častiach lineárny povrch, ktorý oddeľuje rozpoznateľné triedy v priestore prvkov. Typ deliacej plochy, pozostávajúcej z kusov nadrovín, môže byť rôzny a závisí od relatívnej polohy klasifikovaných agregátov.

Môže sa použiť aj iná interpretácia mechanizmov klasifikácie k-najbližšieho suseda. Je založený na myšlienke existencie niektorých latentných premenných, abstraktných alebo spojených nejakou transformáciou s pôvodným priestorom funkcií. Ak sú párové vzdialenosti medzi objektmi v priestore latentných premenných rovnaké ako v priestore počiatočných znakov a počet týchto premenných je oveľa menší ako počet objektov, potom možno uvažovať o interpretácii metódy k-najbližších susedov. z pohľadu porovnávania neparametrických odhadov podmienených hustôt rozdelenia pravdepodobnosti. Tu prezentovaný koncept latentných premenných je svojou povahou blízky konceptu skutočnej dimenzionality a iným reprezentáciám používaným v rôznych metódach redukcie dimenzií.

Pri použití metódy k-najbližších susedov na rozpoznávanie vzorov musí výskumník vyriešiť zložitý problém výberu metriky na určenie blízkosti diagnostikovaných objektov. Tento problém v podmienkach vysokej dimenzie priestorového znaku je mimoriadne sťažený dostatočnou pracnosťou tejto metódy, ktorá nadobúda význam aj pre výkonné počítače. Preto je tu, ako aj pri metóde porovnávania prototypov, potrebné vyriešiť kreatívny problém analýzy viacrozmernej štruktúry experimentálnych dát, aby sa minimalizoval počet objektov reprezentujúcich diagnostické triedy.

Algoritmy na výpočet známok (hlasovanie). Princípom fungovania algoritmov na výpočet skóre (ABO) je vypočítať prioritu (skóre podobnosti), ktoré charakterizujú „blízkosť“ rozpoznaných a referenčných objektov podľa systému súborov vlastností, čo je systém podmnožín daného objektu. súbor funkcií.

Na rozdiel od všetkých predtým uvažovaných metód, algoritmy na výpočet odhadov pracujú s popismi objektov zásadne novým spôsobom. Pre tieto algoritmy existujú objekty súčasne vo veľmi odlišných podpriestoroch priestoru prvkov. Trieda ABO prináša myšlienku používania funkcií k svojmu logickému záveru: keďže nie je vždy známe, ktoré kombinácie vlastností sú najinformatívnejšie, v ABO sa miera podobnosti objektov vypočíta porovnaním všetkých možných alebo určitých kombinácií vlastností. zahrnuté v popisoch objektov.

Tímy pravidiel rozhodovania. Rozhodovacie pravidlo používa dvojúrovňovú schému uznávania. Na prvej úrovni fungujú súkromné ​​rozpoznávacie algoritmy, ktorých výsledky sa kombinujú na druhej úrovni v bloku syntézy. Najbežnejšie metódy takejto kombinácie sú založené na pridelení oblastí kompetencie konkrétneho algoritmu. Najjednoduchší spôsob, ako nájsť oblasti kompetencie, je a priori rozdeliť priestor funkcií na základe odborných úvah konkrétnej vedy (napríklad stratifikácia vzorky podľa nejakého znaku). Potom sa pre každú z vybraných oblastí vytvorí vlastný rozpoznávací algoritmus. Iná metóda je založená na použití formálnej analýzy na určenie miestnych oblastí priestoru prvkov ako susedstiev rozpoznateľných objektov, pre ktoré bola preukázaná úspešnosť akéhokoľvek konkrétneho algoritmu rozpoznávania.

Najvšeobecnejší prístup ku konštrukcii bloku syntézy považuje výsledné indikátory parciálnych algoritmov za počiatočné znaky pre konštrukciu nového zovšeobecneného rozhodovacieho pravidla. V tomto prípade je možné použiť všetky vyššie uvedené spôsoby intenzionálnych a predlžovacích smerov pri rozpoznávaní vzorov. Na riešenie problému tvorby množiny rozhodovacích pravidiel sú efektívne logické algoritmy typu „Kora“ a algoritmy na výpočet odhadov (ABO), ktoré tvoria základ tzv. algebraického prístupu, ktorý poskytuje výskum a konštruktívny popis rozpoznávacie algoritmy, do ktorých zapadajú všetky existujúce typy algoritmov.

Metódy neurónových sietí

Metódy neurónových sietí sú metódy založené na použití rôznych typov neurónových sietí (NN). Hlavné oblasti použitia rôznych NN na rozpoznávanie vzorov a obrázkov:

    aplikácia na extrahovanie kľúčových charakteristík alebo vlastností daných obrázkov,

    klasifikácia samotných obrázkov alebo charakteristík z nich už extrahovaných (v prvom prípade k extrakcii kľúčových charakteristík dochádza implicitne v rámci siete),

    riešenie optimalizačných problémov.

Viacvrstvové neurónové siete. Architektúra viacvrstvovej neurónovej siete (MNN) pozostáva zo sekvenčne spojených vrstiev, kde neurón každej vrstvy je svojimi vstupmi prepojený so všetkými neurónmi predchádzajúcej vrstvy a výstupmi ďalšej vrstvy.

Najjednoduchšou aplikáciou jednovrstvovej NN (nazývanej autoasociatívna pamäť) je trénovať sieť na rekonštrukciu obrázkov kanálov. Privedením testovacieho obrazu na vstup a výpočtom kvality rekonštruovaného obrazu je možné odhadnúť, ako dobre sieť rozpoznala vstupný obraz. Pozitívne vlastnosti tejto metódy spočívajú v tom, že sieť dokáže obnoviť skreslené a zašumené obrázky, ale nie je vhodná na vážnejšie účely.

MNN sa používa aj na priamu klasifikáciu obrázkov – vstupom je buď samotný obrázok v nejakej forme, alebo súbor predtým extrahovaných kľúčových charakteristík obrázku, na výstupe neurón s maximálnou aktivitou indikuje príslušnosť k rozpoznanej triede (obr. 4). Ak je táto aktivita pod určitou hranicou, potom sa má za to, že predložený obrázok nepatrí do žiadnej zo známych tried. Proces učenia stanovuje súlad vstupných obrázkov s príslušnosťou k určitej triede. Toto sa nazýva učenie pod dohľadom. Tento prístup je vhodný pre úlohy riadenia prístupu pre malú skupinu ľudí. Tento prístup poskytuje priame porovnanie samotných obrázkov sieťou, ale s nárastom počtu tried exponenciálne narastá čas školenia a prevádzky siete. Preto pri úlohách, ako je vyhľadávanie podobnej osoby vo veľkej databáze, je potrebné extrahovať kompaktný súbor kľúčových funkcií, z ktorých možno hľadať.

Klasifikačný prístup využívajúci frekvenčné charakteristiky celého obrazu je opísaný v . Použil sa jednovrstvový NS založený na viachodnotových neurónoch.

B ukazuje použitie NN na klasifikáciu obrazu, keď sieťový vstup prijíma výsledky rozkladu obrazu metódou hlavných komponentov.

V klasickom MNS sú medzivrstvové neurónové spojenia plne prepojené a obraz je reprezentovaný ako jednorozmerný vektor, hoci je dvojrozmerný. Architektúra konvolučnej neurónovej siete má za cieľ tieto nedostatky prekonať. Využíval lokálne receptorové polia (poskytujúce lokálnu dvojrozmernú konektivitu neurónov), všeobecné váhy (poskytujúce detekciu niektorých znakov kdekoľvek na obrázku) a hierarchickú organizáciu s priestorovým podvzorkovaním (priestorové podvzorkovanie). Konvolučný NN (CNN) poskytuje čiastočnú odolnosť voči zmenám mierky, posunom, rotáciám, deformáciám.

MNS sa používajú aj na detekciu objektov určitého typu. Okrem toho, že každý trénovaný MNS dokáže do určitej miery určiť, či snímky patria do „jeho vlastných“ tried, môže byť špeciálne trénovaný na spoľahlivé zistenie určitých tried. V tomto prípade budú výstupnými triedami triedy, ktoré patria a nepatria do daného typu obrázka. Na detekciu obrazu tváre na vstupnom obrázku bol použitý detektor neurónovej siete. Obraz bol naskenovaný oknom 20x20 pixelov, ktoré bolo privedené na vstup siete, ktorá rozhoduje o tom, či daná oblasť patrí do triedy tvárí. Školenie sa uskutočnilo s použitím pozitívnych príkladov (rôzne obrázky tvárí) aj negatívnych príkladov (obrázky, ktoré nie sú tvárami). Na zvýšenie spoľahlivosti detekcie bol použitý tím NN trénovaný s rôznymi počiatočnými váhami, v dôsledku čoho sa NN rôzne mýlili a konečné rozhodnutie padlo hlasovaním celého tímu.

Obrázok 5. Hlavné komponenty (vlastné tváre) a rozklad obrazu na hlavné komponenty

NN sa tiež používa na extrakciu kľúčových charakteristík obrazu, ktoré sa potom používajú na následnú klasifikáciu. V , je znázornený spôsob implementácie metódy analýzy hlavných komponentov neurónovej siete. Podstatou metódy analýzy hlavných komponentov je získanie maximálne dekorovaných koeficientov, ktoré charakterizujú vstupné vzory. Tieto koeficienty sa nazývajú hlavné komponenty a používajú sa na štatistickú kompresiu obrazu, pri ktorej sa na reprezentáciu celého obrazu používa malý počet koeficientov. NN s jednou skrytou vrstvou obsahujúcou N neurónov (ktorá je oveľa menšia ako rozmer obrazu), natrénovaná metódou spätného šírenia chýb na obnovenie vstupného obrazu na výstupe, tvorí koeficienty prvých N hlavných komponentov na výstupe skryté neuróny, ktoré slúžia na porovnanie. Typicky sa používa 10 až 200 hlavných komponentov. So zvyšujúcim sa počtom komponentov sa jeho reprezentatívnosť výrazne znižuje a nemá zmysel používať komponenty s veľkým počtom. Pri použití nelineárnych aktivačných funkcií neurónových prvkov je možný nelineárny rozklad na hlavné zložky. Nelinearita vám umožňuje presnejšie odrážať variácie vo vstupných údajoch. Aplikovaním analýzy hlavných komponentov na dekompozíciu obrazov tvárí získame hlavné komponenty, nazývané vlastné tváre, ktoré majú tiež užitočnú vlastnosť - sú to komponenty, ktoré odrážajú najmä také základné charakteristiky tváre, ako je pohlavie, rasa, emócie. Po obnove majú komponenty vzhľad podobný tvári, pričom prvý odráža najvšeobecnejší tvar tváre, druhý predstavuje rôzne menšie rozdiely medzi tvárami (obr. 5). Táto metóda je dobre použiteľná na vyhľadávanie podobných obrázkov tvárí vo veľkých databázach. Ukazuje sa aj možnosť ďalšieho zmenšovania rozmeru hlavných komponentov pomocou NS. Vyhodnotením kvality rekonštrukcie vstupného obrazu môžete veľmi presne určiť, či patrí do triedy tvárí.

Neurónové siete vysokého rádu. Neurónové siete vysokého rádu (HNN) sa líšia od MNN tým, že majú iba jednu vrstvu, ale vstupy neurónov dostávajú aj výrazy vysokého rádu, ktoré sú produktom dvoch alebo viacerých komponentov vstupného vektora . Takéto siete môžu tiež tvoriť zložité deliace plochy.

Hopfieldove neurónové siete. Hopfield NN (HSH) je jednovrstvový a plne prepojený (neexistujú žiadne spojenia neurónov na seba), jeho výstupy sú prepojené so vstupmi. Na rozdiel od MNS je NSH relaxačný, t.j. po nastavení do počiatočného stavu funguje, kým nedosiahne stabilný stav, ktorý bude jeho výstupnou hodnotou. Na hľadanie globálneho minima vo vzťahu k problémom optimalizácie sa používajú stochastické modifikácie NSH.

Použitie NSH ako asociatívnej pamäte vám umožňuje presne obnoviť obrazy, na ktoré bola sieť natrénovaná, keď sa na vstup privedie skreslený obraz. V tomto prípade si sieť „zapamätá“ najbližší (v zmysle lokálneho minima energie) obraz, a tak ho rozpozná. Takéto fungovanie možno tiež považovať za sekvenčnú aplikáciu auto-asociatívnej pamäte opísanej vyššie. Na rozdiel od auto-asociatívnej pamäte, NSH obnoví obraz úplne presne. Aby sa predišlo minimám rušenia a zvýšila sa kapacita siete, používajú sa rôzne metódy.

Kohonen samoorganizujúce sa neurónové siete. Kohonenove samoorganizujúce sa neurónové siete (SNNC) poskytujú topologické usporiadanie priestoru vstupného obrazu. Umožňujú topologicky spojité mapovanie vstupného n-rozmerného priestoru do výstupného m-rozmerného, ​​m<

Cognitron. Kognitrón je svojou architektúrou podobný štruktúre zrakovej kôry, má hierarchickú viacvrstvovú organizáciu, v ktorej sú neuróny medzi vrstvami spojené iba lokálne. Trénované súťažným učením (bez učiteľa). Každá vrstva mozgu implementuje rôzne úrovne zovšeobecnenia; vstupná vrstva je citlivá na jednoduché vzory, ako sú čiary, a ich orientáciu v určitých oblastiach vizuálnej oblasti, zatiaľ čo odozva ostatných vrstiev je zložitejšia, abstraktnejšia a nezávislá od polohy vzoru. Podobné funkcie sú implementované v kognitróne modelovaním organizácie zrakovej kôry.

Neocognitron je ďalším vývojom myšlienky kognitrónu a presnejšie odráža štruktúru vizuálneho systému, umožňuje rozpoznávať obrázky bez ohľadu na ich transformácie, rotácie, deformácie a zmeny mierky.

Cognitron je výkonný nástroj na rozpoznávanie obrázkov, vyžaduje si však vysoké výpočtové náklady, ktoré sú v súčasnosti nedosiahnuteľné.

Uvažované metódy neurónovej siete poskytujú rýchle a spoľahlivé rozpoznávanie obrazu, pri použití týchto metód však vznikajú problémy pri rozpoznávaní trojrozmerných objektov. Tento prístup má však mnoho výhod.

      Záver

V súčasnosti existuje pomerne veľké množstvo systémov automatického rozpoznávania vzorov pre rôzne aplikované problémy.

Rozpoznávanie vzorov formálnymi metódami ako základný vedecký smer je nevyčerpateľné.

Matematické metódy spracovania obrazu majú široké uplatnenie: veda, technika, medicína, sociálna sféra. V budúcnosti sa úloha rozpoznávania vzorov v ľudskom živote ešte zvýši.

Metódy neurónovej siete poskytujú rýchle a spoľahlivé rozpoznanie obrazu. Tento prístup má mnoho výhod a je jedným z najsľubnejších.

Literatúra

    D.V. Brilyuk, V.V. Starovoitov. Metódy neurónovej siete na rozpoznávanie obrazu // /

    Kuzin L.T. Základy kybernetiky: Základy kybernetických modelov. T.2. - M.: Energia, 1979. - 584 s.

    Peregudov F.I., Tarasenko F.P. Úvod do systémovej analýzy: učebnica. - M .: Vyššia škola, 1997. - 389. roky.

    Temnikov F.E., Afonin V.A., Dmitriev V.I. Teoretické základy informačných technológií. - M.: Energia, 1979. - 511s.

    Tu J., Gonzalez R. Princípy rozpoznávania vzorov. / Za. z angličtiny. - M.: Mir, 1978. - 410. roky.

    Winston P. Umelá inteligencia. / Za. z angličtiny. - M.: Mir, 1980. - 520. roky.

    Fu K. Štrukturálne metódy v rozpoznávaní vzorov: Preložené z angličtiny. - M.: Mir, 1977. - 320. roky.

    Tsypkin Ya.Z. Základy informačnej teórie identifikácie. - M.: Nauka, 1984. - 520. roky.

    Pospelov G.S. Umelá inteligencia je základom nových informačných technológií. - M.: Nauka, 1988. - 280. roky.

    Yu Lifshits, Štatistické metódy rozpoznávania vzorov ///modern/07modernnote.pdf

    Bohr N. Atómová fyzika a ľudské poznanie. / Preklad z angličtiny. - M.: Mir, 1961. - 151. roky.

    Butakov E.A., Ostrovsky V.I., Fadeev I.L. Spracovanie obrazu na počítači.1987.-236.

    Duda R., Hart P. Rozpoznávanie vzorov a analýza scény. / Preklad z angličtiny. - M.: Mir, 1978. - 510. roky.

    Vojvoda V.A. Počítačová psychodiagnostika. - Petrohrad: Bratstvo, 1994. - 365 s.

    Aizenberg I. N., Aizenberg N. N. a Krivosheev G. A. Viachodnotové a univerzálne binárne neuróny: Algoritmy učenia, aplikácie na spracovanie a rozpoznávanie obrazu. Poznámky z prednášky v umelej inteligencii – strojové učenie a dolovanie údajov v rozpoznávaní vzorov, 1999, s. 21-35.

    Ranganath S. a Arun K. Rozpoznanie tváre pomocou transformačných funkcií a neurónových sietí. Rozpoznanie vzoru 1997, roč. 30, str. 1615-1622.

    Golovko V.A. Neurointeligencia: teória a aplikácie. Kniha 1. Organizácia a tréning neurónových sietí s priamou a spätnou väzbou - Brest: BPI, 1999, - 260. roky.

    Vetter T. a Poggio T. Triedy lineárnych objektov a syntéza obrazu z jedného príkladu obrazu. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, str. 733-742.

    Golovko V.A. Neurointeligencia: teória a aplikácie. Kniha 2. Samoorganizácia, odolnosť voči chybám a využitie neurónových sietí - Brest: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. and Back A. D. Face Recognition: A Convolutional Neural Network Approach. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

    Wasserman F. Neuropočítačová technika: Teória a prax, 1992 - 184s.

    Rowley H. A., Baluja S. a Kanade T. Neurónová sieťová detekcia tváre. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, Vol. 20, str. 23-37.

    Valentin D., Abdi H., O "Toole A. J. a Cottrell G. W. Connectionistické modely spracovania tváre: prieskum. IN: Pattern Recognition 1994, Vol. 27, s. 1209-1230.

    dokument

    Tvoria algoritmy uznaniesnímky. Metódyuznaniesnímky Ako je uvedené vyššie ... realita nie je existujú„ekosystémy vo všeobecnosti“ a existujú len pár ... záverov z tohto podrobného preskúmaniemetódyuznanie predstavili sme v...

  1. Prehľad metód identifikácie osôb na základe obrázkov tvárí s prihliadnutím na vlastnosti vizuálneho rozpoznávania

    Preskúmanie

    ... uznanie osobou málo kontrastných predmetov, vr. osôb. Priniesla preskúmanie bežné metódy ... Existovať celý riadok metódy ... spôsobom, ako výsledok štúdie, platforma pre rozvoj metódauznanie ...

  2. Imeni Glazková Valentina Vladimirovna VÝSKUM A VÝVOJ METÓD NA KONŠTRUKCIU SOFTVÉROVÝCH NÁSTROJOV NA KLASIFIKÁCIU HYPERTEXTOVÝCH DOKUMENTOV S MNOHO TÉMAMI Špecialita 05

    Abstrakt dizertačnej práce

    hypertextové dokumenty. Kapitola obsahuje preskúmanieexistujúcemetódy riešenie uvažovaného problému, popis ... odrezaním najmenej relevantných tried // Matematické metódyuznaniesnímky: 13. celoruská konferencia. Leningradská oblasť...

  3. Snímka 0 Prehľad úloh bioinformatiky súvisiacich s analýzou a spracovaním genetických textov

    Prednáška

    DNA a proteínové sekvencie. Preskúmanieúlohy bioinformatiky ako úlohy ... signály vyžadujú použitie moderných metódyuznaniesnímky, štatistické prístupy a ... s nízkou hustotou génov. Existujúce Programy na predpovedanie génov nie...

Kapitola 3: Analytický prehľad metód rozpoznávania vzorov a rozhodovania

Teória rozpoznávania vzorov a automatizácia riadenia

Hlavné úlohy adaptívneho rozpoznávania vzorov

Rozpoznávanie je informačný proces implementovaný nejakým konvertorom informácií (inteligentný informačný kanál, rozpoznávací systém), ktorý má vstup a výstup. Vstupom systému je informácia o tom, aké vlastnosti majú prezentované objekty. Výstup systému zobrazuje informácie o tom, ku ktorým triedam (generalizovaným obrázkom) sú priradené rozpoznateľné objekty.

Pri vytváraní a prevádzke automatizovaného systému rozpoznávania vzorov sa rieši množstvo úloh. Pozrime sa stručne a jednoducho na tieto úlohy. Všimnite si, že formulácie týchto úloh a samotná množina sa nezhodujú s rôznymi autormi, pretože do určitej miery závisí od konkrétneho matematického modelu, na ktorom je ten či onen rozpoznávací systém založený. Okrem toho niektoré úlohy v určitých modeloch rozpoznávania nemajú riešenie, a preto nie sú kladené.

Úlohou formalizácie predmetnej oblasti

V skutočnosti je táto úloha úlohou kódovania. Zostaví sa zoznam zovšeobecnených tried, ktorý môže obsahovať špecifické implementácie objektov, ako aj zoznam vlastností, ktoré tieto objekty v zásade môžu mať.

Úloha vytvoriť tréningovú vzorku

Tréningová vzorka je databáza obsahujúca popisy konkrétnych implementácií objektov v jazyku funkcií, doplnená o informácie o príslušnosti týchto objektov k určitým triedam rozpoznávania.

Úloha trénovať rozpoznávací systém

Tréningová vzorka sa používa na vytvorenie zovšeobecnených obrazov tried rozpoznávania na základe zovšeobecnenia informácií o tom, aké vlastnosti majú objekty trénovacej vzorky, ktoré patria do tejto triedy a iných tried.

Problém zmenšenia rozmerov priestoru funkcie

Po trénovaní rozpoznávacieho systému (získanie štatistík o rozdelení frekvencií znakov podľa tried) je možné určiť pre každý znak jeho hodnotu pre riešenie problému rozpoznávania. Potom môžu byť zo systému funkcií odstránené najmenej hodnotné funkcie. Potom musí byť systém rozpoznávania preškolený, pretože v dôsledku odstránenia niektorých prvkov sa zmení štatistika distribúcie zostávajúcich prvkov podľa tried. Tento proces je možné opakovať, t.j. byť iteračný.

Úloha rozpoznávania

Rozpoznávajú sa predmety rozpoznateľnej vzorky, ktoré môžu pozostávať najmä z jedného predmetu. Rozpoznateľná vzorka je vytvorená podobne ako cvičná, ale neobsahuje informácie o príslušnosti objektov k triedam, pretože práve tá sa určuje v procese rozpoznávania. Výsledkom rozpoznania každého objektu je rozdelenie alebo zoznam všetkých tried rozpoznávania v zostupnom poradí podľa stupňa podobnosti rozpoznaného objektu s nimi.

Úloha kontroly kvality rozpoznávania

Po uznaní je možné stanoviť jeho primeranosť. Pre objekty trénovacej vzorky to možno urobiť okamžite, pretože pre nich je jednoducho známe, do ktorých tried patria. Pre ostatné objekty je možné tieto informácie získať neskôr. V každom prípade je možné určiť skutočnú priemernú pravdepodobnosť chyby pre všetky triedy rozpoznávania, ako aj pravdepodobnosť chyby pri priraďovaní rozpoznaného objektu ku konkrétnej triede.

Výsledky rozpoznávania by sa mali interpretovať s prihliadnutím na dostupné informácie o kvalite rozpoznávania.

Adaptačná úloha

Ak sa v dôsledku postupu kontroly kvality zistí, že je nevyhovujúci, potom je možné skopírovať popisy nesprávne rozpoznaných predmetov z rozoznateľnej vzorky do cvičnej, doplniť adekvátnymi klasifikačnými informáciami a použiť na prepracovanie rozhodnutia. pravidlá, t.j. vziať do úvahy. Navyše, ak tieto objekty nepatria do už existujúcich tried rozpoznávania, čo by mohlo byť dôvodom ich nesprávneho rozpoznania, potom je možné tento zoznam rozšíriť. V dôsledku toho sa rozpoznávací systém prispôsobí a začne tieto objekty adekvátne klasifikovať.

Problém inverzného rozpoznávania

Úlohou rozpoznávania je, že pre daný objekt, podľa jeho známych vlastností, systém určí jeho príslušnosť k nejakej predtým neznámej triede. Naopak, v probléme inverzného rozpoznávania pre danú triedu rozpoznávania systém určuje, ktoré vlastnosti sú pre objekty tejto triedy najcharakteristickejšie a ktoré nie (resp. ktoré objekty trénovacej vzorky patria do tejto triedy).

Úlohy klastrovej a konštruktívnej analýzy

Zhluky sú také skupiny objektov, tried alebo prvkov, ktoré v rámci každého zhluku sú si čo najviac podobné a medzi rôznymi zhlukami sa čo najviac líšia.

Konštrukt (v kontexte uvažovanom v tejto časti) je systém opačných zhlukov. V určitom zmysle sú teda konštrukty výsledkom zhlukovej analýzy zhlukov.

Pri zhlukovej analýze sa kvantitatívne meria miera podobnosti a odlišnosti objektov (tried, znakov) a tieto informácie sa používajú na klasifikáciu. Výsledkom zhlukovej analýzy je samotná klasifikácia objektov podľa zhlukov. Táto klasifikácia môže byť reprezentovaná vo forme sémantických sietí.

Úloha kognitívnej analýzy

V kognitívnej analýze sú informácie o podobnosti a rozdieloch tried alebo znakov zaujímavé pre výskumníka samého osebe, a nie preto, aby ich mohol použiť na klasifikáciu, ako je to pri klastrovej a konštruktívnej analýze.

Ak sa dve triedy rozpoznávania vyznačujú rovnakým znakom, prispieva to k podobnosti týchto dvoch tried. Ak je táto vlastnosť pre jednu z tried netypická, prispieva to k rozdielu.

Ak dva znaky navzájom korelujú, potom ich v určitom zmysle možno považovať za jeden znak, a ak sú antikorelované, tak za rozdielne. Ak vezmeme do úvahy túto okolnosť, prítomnosť rôznych znakov v rôznych triedach tiež určitým spôsobom prispieva k ich podobnosti a odlišnosti.

Výsledky kognitívnej analýzy možno prezentovať vo forme kognitívnych diagramov.

Metódy rozpoznávania vzorov a ich charakteristiky

Princípy klasifikácie metód rozpoznávania vzorov

Rozpoznávanie vzorov je úlohou konštrukcie a aplikácie formálnych operácií na numerických alebo symbolických reprezentáciách objektov reálneho alebo ideálneho sveta, ktorých výsledky riešenia odrážajú ekvivalenčné vzťahy medzi týmito objektmi. Vzťahy ekvivalencie vyjadrujú príslušnosť hodnotených objektov k niektorým triedam, ktoré sa považujú za samostatné sémantické jednotky.

Pri konštrukcii rozpoznávacích algoritmov môže ekvivalenčné triedy nastaviť výskumník, ktorý používa vlastné zmysluplné nápady alebo používa externé dodatočné informácie o podobnosti a odlišnosti objektov v kontexte riešeného problému. Potom sa hovorí o „uznávaní s učiteľom“. V opačnom prípade, t.j. keď automatizovaný systém rieši problém klasifikácie bez toho, aby zahŕňal externé školiace informácie, hovorí sa o automatickej klasifikácii alebo „rozpoznaní bez dozoru“. Väčšina algoritmov rozpoznávania vzorov vyžaduje veľmi významný výpočtový výkon, ktorý môže poskytnúť iba vysokovýkonná počítačová technológia.

Rôzni autori (Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F. E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya. Z. Tsypkin a ďalší) uvádzajú inú typológiu metód rozpoznávania vzorov. Niektorí autori rozlišujú parametrické, neparametrické a heuristické metódy, iní vyčleňujú skupiny metód na základe historických škôl a trendov v odbore. Napríklad v práci, ktorá podáva akademický prehľad metód rozpoznávania, je použitá nasledujúca typológia metód rozpoznávania vzorov:

  • metódy založené na princípe separácie;
  • štatistické metódy;
  • metódy postavené na základe „potenciálnych funkcií“;
  • metódy výpočtu známok (hlasovanie);
  • metódy založené na výrokovom počte, najmä na aparáte algebry logiky.

Táto klasifikácia je založená na rozdieloch vo formálnych metódach rozpoznávania vzorov, a preto sa vynecháva úvaha o heuristickom prístupe k rozpoznávaniu, ktorý sa plne a primerane rozvinul v expertných systémoch. Heuristický prístup je založený na ťažko formalizovateľných znalostiach a intuícii výskumníka. Výskumník zároveň sám určuje, aké informácie a akým spôsobom má systém použiť na dosiahnutie požadovaného rozpoznávacieho efektu.

Podobná typológia metód rozpoznávania s rôznym stupňom detailov sa nachádza v mnohých prácach o rozpoznávaní. Známe typológie zároveň nezohľadňujú jednu veľmi významnú charakteristiku, ktorá odráža špecifiká spôsobu reprezentácie vedomostí o predmetnej oblasti pomocou akéhokoľvek formálneho algoritmu rozpoznávania vzorov.

D.A. Pospelov (1990) identifikuje dva hlavné spôsoby reprezentácie vedomostí:

  • intenzionálne, vo forme schémy väzieb medzi atribútmi (vlastnosťami).
  • extenzívne, pomocou konkrétnych faktov (predmetov, príkladov).

Intenzionálna reprezentácia zachytáva vzory a vzťahy, ktoré vysvetľujú štruktúru údajov. Pokiaľ ide o diagnostické úlohy, takáto fixácia spočíva v určovaní operácií s atribútmi (vlastnosťami) objektov, ktoré vedú k požadovanému diagnostickému výsledku. Intenzionálne reprezentácie sú implementované prostredníctvom operácií s hodnotami atribútov a neimplikujú operácie s konkrétnymi informačnými faktami (objektmi).

Extenzívne reprezentácie vedomostí sú zasa spojené s popisom a fixáciou konkrétnych predmetov z predmetnej oblasti a realizujú sa v operáciách, ktorých prvkami sú objekty ako integrálne systémy.

Je možné načrtnúť analógiu medzi intenzionálnymi a extenzívnymi reprezentáciami vedomostí a mechanizmami, ktoré sú základom aktivity ľavej a pravej hemisféry ľudského mozgu. Ak sa pravá hemisféra vyznačuje holistickým prototypovým zobrazením okolitého sveta, potom ľavá hemisféra operuje so vzormi, ktoré odrážajú súvislosti atribútov tohto sveta.

Dva základné spôsoby reprezentácie znalostí opísané vyššie nám umožňujú navrhnúť nasledujúcu klasifikáciu metód rozpoznávania vzorov:

  • intenzionálne metódy založené na operáciách s atribútmi.
  • extenzívne metódy založené na operáciách s objektmi.

Je potrebné zdôrazniť, že existencia týchto dvoch (a iba dvoch) skupín metód rozpoznávania: metód pracujúcich s vlastnosťami a tých, ktoré pracujú s objektmi, je hlboko prirodzená. Z tohto hľadiska žiadna z týchto metód, braná oddelene od druhej, neumožňuje vytvoriť adekvátnu reflexiu predmetnej oblasti. Podľa autorov existuje medzi týmito metódami vzťah komplementarity v zmysle N. Bohra, preto by perspektívne rozpoznávacie systémy mali zabezpečiť implementáciu oboch týchto metód, a nie hociktorej z nich.

Klasifikácia metód rozpoznávania navrhovaná D. A. Pospelovom je teda založená na základných zákonoch, ktoré sú základom ľudského spôsobu poznávania vo všeobecnosti, čo ho stavia do veľmi zvláštneho (privilegovaného) postavenia v porovnaní s inými klasifikáciami, ktoré na tomto pozadí vyzerajú ľahšie a umelejšie.

Intenzionálne metódy

Charakteristickým rysom intenzionálnych metód je, že používajú rôzne charakteristiky vlastností a ich vzťahov ako prvky operácií pri konštrukcii a aplikácii algoritmov rozpoznávania vzorov. Takýmito prvkami môžu byť jednotlivé hodnoty alebo intervaly hodnôt vlastností, priemerné hodnoty a odchýlky, matice vzťahov medzi vlastnosťami atď., na ktorých sa vykonávajú akcie, vyjadrené v analytickej alebo konštruktívnej forme. Zároveň sa objekty v týchto metódach nepovažujú za integrálne informačné jednotky, ale fungujú ako indikátory na hodnotenie interakcie a správania sa ich atribútov.

Skupina metód intenzionálneho rozpoznávania vzorov je rozsiahla a jej rozdelenie do podtried je do istej miery ľubovoľné.

Metódy založené na odhadoch distribučných hustôt hodnôt znakov

Tieto metódy rozpoznávania vzorov sú prevzaté z klasickej teórie štatistických rozhodnutí, v ktorej sa predmety štúdia považujú za realizácie viacrozmernej náhodnej premennej distribuovanej v priestore znakov podľa nejakého zákona. Sú založené na Bayesovskej schéme rozhodovania, ktorá sa odvoláva na a priori pravdepodobnosti objektov patriacich do konkrétnej rozpoznateľnej triedy a podmienené hustoty rozloženia hodnôt vektora znakov. Tieto metódy sú redukované na určenie pravdepodobnostného pomeru v rôznych oblastiach viacrozmerného priestoru prvkov.

Skupina metód založených na odhade distribučných hustôt hodnôt znakov priamo súvisí s metódami diskriminačnej analýzy. Bayesovský prístup k rozhodovaniu je jedným z najrozvinutejších v modernej štatistike, takzvané parametrické metódy, pre ktoré sa analytické vyjadrenie distribučného zákona (v tomto prípade normálneho zákona) považuje za známe a len málo je potrebné odhadnúť počet parametrov (stredné vektory a kovariančné matice).

Hlavnými ťažkosťami pri aplikácii týchto metód je potreba zapamätať si celú trénovaciu vzorku na výpočet odhadov miestnych hustôt rozdelenia pravdepodobnosti a vysoká citlivosť na nereprezentatívnosť trénovacej vzorky.

Metódy založené na predpokladoch o triede rozhodovacích funkcií

V tejto skupine metód sa všeobecná forma rozhodovacej funkcie považuje za známu a je daná jej kvalitatívna funkcionalita. Na základe tohto funkcionálu sa z trénovacej sekvencie zistí najlepšia aproximácia rozhodovacej funkcie. Najbežnejšie sú reprezentácie rozhodovacích funkcií vo forme lineárnych a zovšeobecnených nelineárnych polynómov. Funkčná kvalita rozhodovacieho pravidla je zvyčajne spojená s chybou klasifikácie.

Hlavnou výhodou metód založených na predpokladoch o triede rozhodovacích funkcií je jasnosť matematickej formulácie problému rozpoznávania ako problému hľadania extrému. Rozmanitosť metód tejto skupiny je vysvetlená širokým rozsahom používaných funkcionalít kvality rozhodovacích pravidiel a extrémnych vyhľadávacích algoritmov. Zovšeobecnením uvažovaných algoritmov, medzi ktoré patrí najmä Newtonov algoritmus, algoritmy perceptrónového typu a pod., je metóda stochastickej aproximácie.

Pomerne dobre sú preštudované možnosti gradientových algoritmov na hľadanie extrému, najmä v skupine lineárnych rozhodovacích pravidiel. Konvergencia týchto algoritmov bola preukázaná len pre prípad, keď sú rozpoznateľné triedy objektov zobrazené v priestore prvkov kompaktnými geometrickými štruktúrami.

Dostatočne vysokú kvalitu rozhodovacieho pravidla je možné dosiahnuť pomocou algoritmov, ktoré nemajú rigorózny matematický dôkaz konvergencie riešenia ku globálnemu extrému. Takéto algoritmy zahŕňajú veľkú skupinu heuristických programovacích procedúr reprezentujúcich smer evolučného modelovania. Evolučné modelovanie je bionická metóda vypožičaná z prírody. Je založená na využití známych mechanizmov evolúcie s cieľom nahradiť proces zmysluplného modelovania komplexného objektu fenomenologickým modelovaním jeho evolúcie. Známym predstaviteľom evolučného modelovania v rozpoznávaní vzorov je metóda skupinového účtovania argumentov (MGUA). GMDH je založený na princípe samoorganizácie a GMDH algoritmy reprodukujú schému hromadného výberu.

Dosiahnutie praktických cieľov však v tomto prípade nesprevádza získavanie nových poznatkov o povahe rozpoznateľných predmetov. Možnosť extrakcie týchto poznatkov, najmä poznatkov o mechanizmoch interakcie atribútov (vlastností), je tu zásadne obmedzená danou štruktúrou takejto interakcie, fixovanou vo zvolenej forme rozhodujúcich funkcií.

Booleovské metódy

Logické metódy rozpoznávania vzorov sú založené na aparáte logickej algebry a umožňujú pracovať s informáciami obsiahnutými nielen v jednotlivých znakoch, ale aj v kombináciách hodnôt znakov. V týchto metódach sa hodnoty ľubovoľného atribútu považujú za elementárne udalosti.

V najvšeobecnejšej podobe možno logické metódy charakterizovať ako akési hľadanie logických vzorcov v trénovacej vzorke a formovanie určitého systému logických rozhodovacích pravidiel (napríklad vo forme konjunkcií elementárnych dejov), pričom každý z nich ktorý má svoju váhu. Skupina logických metód je rôznorodá a zahŕňa metódy rôznej zložitosti a hĺbky analýzy. Pre dichotomické (booleovské) vlastnosti sú obľúbené takzvané stromové klasifikátory, metóda slepého testu, Barkov algoritmus atď.

Algoritmus Kora, podobne ako iné logické metódy rozpoznávania vzorov, je z hľadiska výpočtu dosť pracný, pretože pri výbere konjunkcií je potrebný úplný zoznam. Pri aplikácii logických metód sú preto kladené vysoké požiadavky na efektívnu organizáciu výpočtového procesu a tieto metódy dobre fungujú aj pri relatívne malých rozmeroch priestoru funkcií a len na výkonných počítačoch.

Lingvistické (štrukturálne) metódy

Lingvistické metódy rozpoznávania vzorov sú založené na použití špeciálnych gramatík, ktoré generujú jazyky, ktoré možno použiť na opis súboru vlastností rozpoznateľných objektov.

Pre rôzne triedy objektov sa rozlišujú nederivatívne (atómové) prvky (podobrazy, znaky) a možné vzťahy medzi nimi. Gramatika sa vzťahuje na pravidlá na vytváranie objektov z týchto neodvodených prvkov.

Každý objekt je teda súborom neodvodených prvkov, ktoré sú navzájom „spojené“ tak či onak, alebo, inými slovami, „vetou“ nejakého „jazyka“. Chcel by som zdôrazniť veľmi významnú ideologickú hodnotu tejto myšlienky.

Parsovaním (parsovaním) „vety“ sa určuje jej syntaktická „správnosť“ alebo ekvivalentne, či nejaká pevná gramatika popisujúca triedu môže generovať existujúci popis objektu.

Úloha obnoviť (definovať) gramatiky z určitého súboru výrokov (viet - popisov objektov), ​​ktoré generujú daný jazyk, je však ťažko formalizovateľná.

Rozširujúce metódy

V metódach tejto skupiny, na rozdiel od intenzionálneho smeru, sa každému študovanému objektu vo väčšej či menšej miere pripisuje nezávislá diagnostická hodnota. Vo svojom jadre sú tieto metódy blízke klinickému prístupu, ktorý ľudí nepovažuje za reťazec objektov zoradených podľa jedného alebo druhého ukazovateľa, ale za ucelené systémy, z ktorých každý je individuálny a má osobitnú diagnostickú hodnotu. Takýto opatrný prístup k predmetom štúdia neumožňuje vylúčiť alebo stratiť informácie o každom jednotlivom objekte, ku ktorému dochádza pri použití metód intenzionálneho smerovania, pričom objekty sa používajú iba na detekciu a opravu vzorcov správania ich atribútov.

Hlavnými operáciami pri rozpoznávaní vzorov pomocou diskutovaných metód sú operácie určovania podobnosti a rozdielu objektov. Objekty v špecifikovanej skupine metód zohrávajú úlohu diagnostických precedensov. Zároveň, v závislosti od podmienok konkrétnej úlohy, sa rola jednotlivého precedensu môže meniť v najširších medziach: od hlavnej a definujúcej až po veľmi nepriamu účasť v procese uznávania. Na druhej strane, podmienky problému môžu vyžadovať účasť rôzneho počtu diagnostických precedensov pre úspešné riešenie: od jedného v každej rozpoznateľnej triede po celú veľkosť vzorky, ako aj rôzne spôsoby výpočtu mier podobnosti a rozdielu. predmety. Tieto požiadavky vysvetľujú ďalšie rozdelenie extenzívnych metód do podtried.

Metóda porovnávania prototypov

Toto je najjednoduchšia metóda rozšíreného rozpoznávania. Používa sa napríklad v prípade, keď sú rozpoznané triedy zobrazené v priestore prvkov kompaktnými geometrickými zoskupeniami. V tomto prípade sa ako prototypový bod zvyčajne volí stred geometrického zoskupenia triedy (alebo objekt najbližšie k stredu).

Na klasifikáciu neznámeho objektu sa nájde prototyp, ktorý je mu najbližšie, a objekt patrí do rovnakej triedy ako tento prototyp. Je zrejmé, že touto metódou sa nevytvárajú žiadne zovšeobecnené obrazy tried.

Ako meradlo blízkosti možno použiť rôzne typy vzdialeností. Pre dichotomické znaky sa často používa Hammingova vzdialenosť, ktorá sa v tomto prípade rovná druhej mocnine euklidovskej vzdialenosti. V tomto prípade je rozhodovacie pravidlo pre klasifikáciu objektov ekvivalentné lineárnej rozhodovacej funkcii.

Túto skutočnosť je potrebné osobitne upozorniť. Jasne demonštruje prepojenie medzi prototypom a indikatívnou reprezentáciou informácií o dátovej štruktúre. Pomocou vyššie uvedeného znázornenia možno napríklad akúkoľvek tradičnú meraciu stupnicu, ktorá je lineárnou funkciou hodnôt dichotomických znakov, považovať za hypotetický diagnostický prototyp. Na druhej strane, ak nám analýza priestorovej štruktúry rozpoznaných tried umožňuje dospieť k záveru, že sú geometricky kompaktné, potom stačí nahradiť každú z týchto tried jedným prototypom, ktorý je vlastne ekvivalentom lineárneho diagnostického modelu.

V praxi je samozrejme situácia často odlišná od opísaného idealizovaného príkladu. Výskumník, ktorý má v úmysle aplikovať metódu rozpoznávania založenú na porovnávaní s prototypmi diagnostických tried, čelí zložitým problémom.

Po prvé, ide o výber miery priblíženia (metriky), ktorá môže výrazne zmeniť priestorovú konfiguráciu rozmiestnenia objektov. Po druhé, nezávislým problémom je analýza viacrozmerných štruktúr experimentálnych údajov. Oba tieto problémy sú pre výskumníka obzvlášť akútne v podmienkach vysokej dimenzie priestoru prvkov, ktorá je typická pre skutočné problémy.

k metóda najbližšieho suseda

Metóda k najbližších susedov na riešenie problémov diskriminačnej analýzy bola prvýkrát navrhnutá už v roku 1952. Je to nasledovné.

Pri klasifikácii neznámeho objektu sa nájde daný počet (k) ďalších objektov, ktoré sú k nemu geometricky najbližšie v priestore prvkov (najbližší susedia) s už známou príslušnosťou k rozpoznateľným triedam. Rozhodnutie o priradení neznámeho objektu konkrétnej diagnostickej triede sa robí analýzou informácií o tomto známom členstve jeho najbližších susedov, napríklad pomocou jednoduchého sčítania hlasov.

Spočiatku bola metóda k najbližších susedov považovaná za neparametrickú metódu na odhadovanie pravdepodobnostného pomeru. Pre túto metódu sa získavajú teoretické odhady jej účinnosti v porovnaní s optimálnym bayesovským klasifikátorom. Je dokázané, že pravdepodobnosti asymptotických chýb pre metódu k najbližšieho suseda prevyšujú chyby Bayesovho pravidla maximálne dvakrát.

Pri použití metódy k najbližších susedov na rozpoznávanie vzorov musí výskumník vyriešiť zložitý problém výberu metriky na určenie blízkosti diagnostikovaných objektov. Tento problém v podmienkach vysokej dimenzie priestorového znaku je mimoriadne sťažený dostatočnou pracnosťou tejto metódy, ktorá nadobúda význam aj pre výkonné počítače. Preto je tu, ako aj pri metóde porovnávania prototypov, potrebné vyriešiť kreatívny problém analýzy viacrozmernej štruktúry experimentálnych dát, aby sa minimalizoval počet objektov reprezentujúcich diagnostické triedy.

Potreba znížiť počet objektov v trénovacej vzorke (diagnostické precedensy) je nevýhodou tejto metódy, pretože znižuje reprezentatívnosť trénovacej vzorky.

Algoritmy na výpočet známok ("hlasovanie")

Princípom fungovania hodnotiacich algoritmov (ABO) je vypočítať priority (skóre podobnosti), ktoré charakterizujú „blízkosť“ rozpoznaných a referenčných objektov podľa systému súborov vlastností, čo je systém podmnožín daného súboru vlastností. .

Na rozdiel od všetkých predtým uvažovaných metód, algoritmy na výpočet odhadov pracujú s popismi objektov zásadne novým spôsobom. Pre tieto algoritmy existujú objekty súčasne vo veľmi odlišných podpriestoroch priestoru prvkov. Trieda ABO prináša myšlienku používania funkcií k svojmu logickému záveru: keďže nie je vždy známe, ktoré kombinácie vlastností sú najinformatívnejšie, v ABO sa miera podobnosti objektov vypočíta porovnaním všetkých možných alebo určitých kombinácií vlastností. zahrnuté v popisoch objektov.

Používané kombinácie atribútov (podpriestorov) sa nazývajú podporné množiny alebo množiny čiastkových popisov objektov. Zavádza sa koncept zovšeobecnenej blízkosti medzi rozpoznaným objektom a objektmi trénovacej vzorky (so známou klasifikáciou), ktoré sa nazývajú referenčné objekty. Táto blízkosť je reprezentovaná kombináciou blízkosti rozpoznaného objektu s referenčnými objektmi vypočítanými na súboroch čiastkových popisov. ABO je teda rozšírením metódy k najbližších susedov, v ktorej sa blízkosť objektov zvažuje iba v jednom danom priestore znakov.

Ďalším rozšírením ABO je, že v týchto algoritmoch je problém určovania podobnosti a rozdielnosti objektov formulovaný ako parametrický a je zvolená fáza nastavenia ABO podľa trénovacej vzorky, pri ktorej sú optimálne hodnoty vyberú sa zadané parametre. Kritériom kvality je chyba rozpoznávania a doslova všetko je parametrizované:

  • pravidlá pre výpočet blízkosti objektov podľa jednotlivých znakov;
  • pravidlá na výpočet blízkosti objektov v podpriestoroch prvkov;
  • stupeň dôležitosti konkrétneho referenčného objektu ako diagnostického precedensu;
  • význam príspevku každého referenčného súboru znakov ku konečnému posúdeniu podobnosti rozpoznaného objektu s akoukoľvek diagnostickou triedou.

Parametre vzduchového chladiča sa nastavujú vo forme prahových hodnôt a (alebo) ako hmotnosti špecifikovaných komponentov.

Teoretické možnosti ABO nie sú prinajmenšom nižšie ako možnosti akéhokoľvek iného algoritmu rozpoznávania vzorov, keďže pomocou ABO je možné realizovať všetky mysliteľné operácie so skúmanými objektmi.

Ako to už ale býva, rozširovanie možností naráža pri ich praktickej implementácii na veľké ťažkosti, najmä v štádiu konštrukcie (ladenia) algoritmov tohto typu.

Samostatné ťažkosti boli zaznamenané skôr pri diskusii o metóde k najbližších susedov, ktorá by sa dala interpretovať ako skrátená verzia ABO. Dá sa uvažovať aj v parametrickej podobe a problém sa dá zredukovať na nájdenie váženej metriky zvoleného typu. Zároveň už tu pre vysokorozmerné problémy vznikajú zložité teoretické otázky a problémy spojené s organizáciou efektívneho výpočtového procesu.

Pre ABO, ak sa pokúsite využiť možnosti týchto algoritmov naplno, tieto ťažkosti sa mnohonásobne zvýšia.

Uvedené problémy vysvetľujú skutočnosť, že v praxi je použitie ABO na riešenie vysokorozmerných problémov sprevádzané zavedením akýchkoľvek heuristických obmedzení a predpokladov. Ide najmä o príklad využitia ABO v psychodiagnostike, pri ktorom sa testoval typ ABO, čo je vlastne ekvivalent metódy k najbližších susedov.

Kolektívy rozhodujúcich pravidiel

Na záver prehľadu metód rozpoznávania vzorov sa zastavme ešte pri jednom prístupe. Ide o takzvané tímy rozhodovacích pravidiel (CRC).

Keďže sa rôzne rozpoznávacie algoritmy správajú odlišne na tej istej vzorke objektov, prirodzene vyvstáva otázka syntetického rozhodovacieho pravidla, ktoré adaptívne využíva silné stránky týchto algoritmov. Syntetické rozhodovacie pravidlo používa dvojúrovňovú schému rozpoznávania. Na prvej úrovni fungujú súkromné ​​rozpoznávacie algoritmy, ktorých výsledky sa kombinujú na druhej úrovni v bloku syntézy. Najbežnejšie metódy takejto kombinácie sú založené na pridelení oblastí kompetencie konkrétneho algoritmu. Najjednoduchší spôsob, ako nájsť oblasti kompetencie, je a priori rozdeliť priestor atribútov na základe odborných úvah konkrétnej vedy (napríklad stratifikácia vzorky podľa nejakého atribútu). Potom sa pre každú z vybraných oblastí vytvorí vlastný rozpoznávací algoritmus. Iná metóda je založená na použití formálnej analýzy na určenie miestnych oblastí priestoru prvkov ako susedstiev rozpoznateľných objektov, pre ktoré bola preukázaná úspešnosť akéhokoľvek konkrétneho algoritmu rozpoznávania.

Najvšeobecnejší prístup ku konštrukcii bloku syntézy považuje výsledné indikátory parciálnych algoritmov za počiatočné znaky pre konštrukciu nového zovšeobecneného rozhodovacieho pravidla. V tomto prípade je možné použiť všetky vyššie uvedené spôsoby intenzionálnych a predlžovacích smerov pri rozpoznávaní vzorov. Efektívne na riešenie problému tvorby množiny rozhodovacích pravidiel sú logické algoritmy typu „Kora“ a algoritmy na výpočet odhadov (ABO), ktoré tvoria základ tzv. algebraického prístupu, ktorý poskytuje výskum a konštruktívny popis rozpoznávacie algoritmy, do ktorých zapadajú všetky existujúce typy algoritmov.

Porovnávacia analýza metód rozpoznávania vzorov

Porovnajme vyššie opísané metódy rozpoznávania vzorov a zhodnoťme mieru ich primeranosti požiadavkám formulovaným v časti 3.3.3 pre modely SDA pre adaptívne automatizované riadiace systémy pre komplexné systémy.

Pre riešenie reálnych problémov zo skupiny metód intenzionálneho smeru majú praktickú hodnotu parametrické metódy a metódy založené na návrhoch tvaru rozhodujúcich funkcií. Parametrické metódy tvoria základ tradičnej metodológie konštrukcie ukazovateľov. Aplikácia týchto metód v reálnych problémoch je spojená s uvalením silných obmedzení na dátovú štruktúru, ktoré vedú k lineárnym diagnostickým modelom s veľmi približnými odhadmi ich parametrov. Pri použití metód založených na predpokladoch o forme rozhodovacích funkcií je výskumník nútený prejsť aj k lineárnym modelom. Je to spôsobené vysokou dimenziou priestoru znakov, ktorá je typická pre reálne problémy, ktorá so zvýšením stupňa polynomickej rozhodovacej funkcie dáva obrovský nárast počtu jej členov s problematickým sprievodným nárastom kvalita uznania. Premietnutím oblasti potenciálnej aplikácie metód intenzionálneho rozpoznávania na reálne problémy tak získame obraz, ktorý zodpovedá zaužívanej tradičnej metodológii lineárnych diagnostických modelov.

Vlastnosti lineárnych diagnostických modelov, v ktorých je diagnostický indikátor reprezentovaný váženým súčtom počiatočných znakov, sú dobre študované. Výsledky týchto modelov (s príslušnou normalizáciou) sú interpretované ako vzdialenosti od skúmaných objektov k nejakej nadrovine v priestore prvkov alebo ekvivalentne ako projekcie objektov na nejakú priamku v danom priestore. Preto sú lineárne modely vhodné len pre jednoduché geometrické konfigurácie oblastí priestoru prvkov, do ktorých sú mapované objekty rôznych diagnostických tried. Pri zložitejších distribúciách tieto modely v zásade nemôžu odrážať mnohé vlastnosti experimentálnej dátovej štruktúry. Zároveň môžu takéto funkcie poskytnúť cenné diagnostické informácie.

Zároveň by sa výskyt jednoduchých viacrozmerných štruktúr (najmä viacrozmerných normálnych rozdelení) v akomkoľvek skutočnom probléme mal považovať skôr za výnimku než za pravidlo. Diagnostické triedy sa často vytvárajú na základe komplexných externých kritérií, čo automaticky znamená geometrickú heterogenitu týchto tried v priestore znakov. To platí najmä pre „životné“ kritériá, s ktorými sa v praxi najčastejšie stretávame. Za takýchto podmienok použitie lineárnych modelov zachytáva len tie „najhrubšie“ vzorce experimentálnych informácií.

Použitie extenzívnych metód nie je spojené so žiadnymi predpokladmi o štruktúre experimentálnych informácií, okrem toho, že v rámci rozpoznaných tried musí existovať jedna alebo viac skupín objektov, ktoré sú si do istej miery podobné, a objekty rôznych tried sa musia navzájom v niektorých líšiť. spôsobom. Je zrejmé, že pre akúkoľvek konečnú dimenziu trénovacej vzorky (a nemôže byť iná) je táto požiadavka vždy splnená jednoducho preto, že medzi objektmi existujú náhodné rozdiely. Ako miery podobnosti sa používajú rôzne miery blízkosti (vzdialenosti) objektov v priestore prvkov. Efektívne využitie metód extenzívneho rozpoznávania vzorov preto závisí od toho, ako dobre sú tieto miery blízkosti určené, ako aj od toho, ktoré objekty trénovacej vzorky (objekty so známou klasifikáciou) zohrávajú úlohu diagnostických precedensov. Úspešné riešenie týchto problémov dáva výsledok blížiaci sa teoreticky dosiahnuteľným hraniciam efektívnosti rozpoznávania.

Proti výhodám extenzívnych metód rozpoznávania vzorov stojí predovšetkým vysoká technická náročnosť ich praktickej implementácie. Pre vysokorozmerné priestory prvkov sa zdanlivo jednoduchá úloha nájsť páry najbližších bodov mení na vážny problém. Tiež mnohí autori uvádzajú ako problém potrebu zapamätať si dostatočne veľký počet objektov reprezentujúcich rozpoznateľné triedy.

Samo o sebe to nie je problém, ale je to vnímané ako problém (napríklad v metóde k najbližších susedov) z toho dôvodu, že pri rozpoznávaní každého objektu dochádza k úplnému vymenovaniu všetkých objektov v trénovacej vzorke.

Preto je vhodné použiť model rozpoznávacieho systému, v ktorom je odstránený problém úplného vymenovania objektov trénovacej vzorky počas rozpoznávania, pretože sa vykonáva iba raz pri vytváraní zovšeobecnených obrazov tried rozpoznávania. Pri samotnom rozpoznávaní sa identifikovaný objekt porovnáva len so zovšeobecnenými obrázkami tried rozpoznávania, ktorých počet je fixný a vôbec nezávisí od rozmeru trénovacej vzorky. Tento prístup vám umožňuje zväčšovať rozmer trénovacej vzorky, kým sa nedosiahne požadovaná vysoká kvalita zovšeobecnených obrázkov, bez obáv, že by to mohlo viesť k neprijateľnému predĺženiu času rozpoznávania (keďže čas rozpoznávania v tomto modeli nezávisí od rozmer školenia vôbec).vzorky).

Teoretické problémy aplikácie metód extenzívneho rozpoznávania súvisia s problémami hľadania informatívnych skupín znakov, hľadania optimálnych metrík na meranie podobnosti a rozdielnosti objektov a analýzy štruktúry experimentálnych informácií. Úspešné riešenie týchto problémov zároveň umožňuje nielen navrhnúť efektívne rozpoznávacie algoritmy, ale aj uskutočniť prechod od extenzívneho poznania empirických faktov k intenzionálnemu poznaniu zákonitostí ich štruktúry.

Prechod od extenzívnych znalostí k intenzionálnym znalostiam nastáva v štádiu, keď už bol skonštruovaný formálny algoritmus rozpoznávania a bola preukázaná jeho účinnosť. Potom sa uskutoční štúdium mechanizmov, ktorými sa dosiahne dosiahnutá účinnosť. Takáto štúdia spojená s analýzou geometrickej štruktúry dát môže viesť napríklad k záveru, že stačí nahradiť objekty reprezentujúce určitú diagnostickú triedu jedným typickým zástupcom (prototypom). To je ekvivalentné, ako je uvedené vyššie, s nastavením tradičnej lineárnej diagnostickej stupnice. Je tiež možné, že stačí nahradiť každú diagnostickú triedu niekoľkými objektmi, ktoré sú zmysluplné ako typickí predstavitelia niektorých podtried, čo je ekvivalentné zostrojeniu vejára lineárnych škál. Existujú aj ďalšie možnosti, o ktorých sa bude diskutovať nižšie.

Prehľad metód rozpoznávania teda ukazuje, že v súčasnosti sa teoreticky vyvinulo množstvo rôznych metód rozpoznávania vzorov. Literatúra uvádza ich podrobnú klasifikáciu. Pri väčšine týchto metód však absentuje ich softvérová implementácia, čo je hlboko prirodzené, možno dokonca povedať „predurčené“ vlastnosťami samotných metód rozpoznávania. Dá sa to posúdiť podľa toho, že takéto systémy sú v odbornej literatúre a iných zdrojoch informácií málo spomínané.

V dôsledku toho zostáva nedostatočne rozvinutá otázka praktickej použiteľnosti niektorých metód teoretického rozpoznávania pri riešení praktických problémov s reálnymi (t. j. dosť významnými) dátovými dimenziami a na reálnych moderných počítačoch.

Uvedenú okolnosť možno pochopiť, ak si pripomenieme, že zložitosť matematického modelu exponenciálne zvyšuje náročnosť softvérovej implementácie systému a v rovnakej miere znižuje šance, že tento systém bude v praxi fungovať. To znamená, že na trhu je možné implementovať iba softvérové ​​systémy založené na pomerne jednoduchých a „transparentných“ matematických modeloch. Preto vývojár so záujmom o replikáciu svojho softvérového produktu pristupuje k problematike výberu matematického modelu nie z čisto vedeckého hľadiska, ale ako pragmatik, berúc do úvahy možnosti implementácie softvéru. Domnieva sa, že model by mal byť čo najjednoduchší, čo znamená, že by mal byť implementovaný s nižšími nákladmi a lepšou kvalitou a mal by tiež fungovať (v praxi efektívne).

V tomto smere je úlohou implementovať do rozpoznávacích systémov mechanizmus na zovšeobecňovanie opisov objektov patriacich do rovnakej triedy, t.j. mechanizmus tvorby kompaktných zovšeobecnených obrazov. Je zrejmé, že takýto mechanizmus zovšeobecňovania umožní „komprimovať“ akúkoľvek trénovaciu vzorku z hľadiska dimenzie na základňu zovšeobecnených obrázkov vopred známych z hľadiska dimenzie. To nám tiež umožní nastaviť a vyriešiť množstvo problémov, ktoré sa v takých rozpoznávacích metódach ani nedajú sformulovať, ako je porovnanie s prototypovou metódou, metódou k najbližších susedov a ABO.

Ide o tieto úlohy:

  • určenie informačného príspevku vlastností k informačnému portrétu zovšeobecneného obrazu;
  • klastrovo-konštruktívna analýza zovšeobecnených obrazov;
  • určenie sémantického zaťaženia znaku;
  • sémantická klastrovo-konštruktívna analýza vlastností;
  • zmysluplné porovnanie zovšeobecnených obrazov tried medzi sebou navzájom a vlastností navzájom (kognitívne diagramy vrátane Merlinových diagramov).

Metóda, ktorá umožnila dosiahnuť riešenie týchto problémov, tiež odlišuje perspektívny systém, ktorý je na ňom založený, od iných systémov, rovnako ako sa kompilátory líšia od interpretov, pretože v dôsledku vytvárania zovšeobecnených obrázkov v tomto perspektívnom systéme je čas rozpoznávania nezávislý od veľkosť tréningovej vzorky. Je známe, že práve existencia tejto závislosti vedie k prakticky neakceptovateľnému času strávenému počítačom na rozpoznávanie v takých metódach, ako je metóda k najbližších susedov, ABO a CLD pri takých rozmeroch trénovacej vzorky, keď môžeme hovoriť o dostatočnej štatistike .

Na záver stručného prehľadu metód rozpoznávania uvádzame podstatu vyššie uvedeného v súhrnnej tabuľke (tabuľka 3.1), ktorá obsahuje stručný popis rôznych metód rozpoznávania vzorov v nasledujúcich parametroch:

  • klasifikácia metód rozpoznávania;
  • oblasti použitia metód rozpoznávania;
  • klasifikácia obmedzení metód rozpoznávania.
Klasifikácia metód rozpoznávania Oblasť použitia Obmedzenia (nevýhody)
Intenzívne metódy rozpoznávania Metódy založené na odhadoch distribučných hustôt hodnôt prvkov (alebo podobností a rozdielov medzi objektmi) Problémy so známym rozdelením, zvyčajne normálne, potreba zhromažďovať veľké štatistiky Potreba vyčísliť celý tréningový súbor pri rozpoznávaní, vysoká citlivosť na nereprezentatívnosť tréningového súboru a artefaktov
Metódy založené na predpokladoch o triede rozhodovacích funkcií Triedy by mali byť dobre oddeliteľné, systém prvkov by mal byť ortonormálny Forma rozhodovacej funkcie musí byť známa vopred. Nemožnosť brať do úvahy nové poznatky o koreláciách medzi znakmi
Booleovské metódy Pri výbere logických rozhodovacích pravidiel (konjunkcií) je potrebný úplný zoznam. Vysoká výpočtová náročnosť
Lingvistické (štrukturálne) metódy Problémy malého rozmeru priestoru prvkov Úloha obnovenia (definovania) gramatiky z určitého súboru príkazov (popisov objektov) je ťažko formalizovateľná. Nevyriešené teoretické problémy
Rozširujúce metódy rozpoznávania Metóda porovnávania prototypov Problémy malého rozmeru priestoru prvkov Vysoká závislosť výsledkov klasifikácie od meraní vzdialenosti (metriky). Neznáma optimálna metrika
k metóda najbližšieho suseda Vysoká závislosť výsledkov klasifikácie od meraní vzdialenosti (metriky). Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Výpočtová zložitosť
Algoritmy na výpočet známok (hlasovanie) AVO Problémy malého rozmeru z hľadiska počtu tried a vlastností Závislosť výsledkov klasifikácie na meraní vzdialenosti (metrike). Potreba úplného vyčíslenia tréningovej vzorky počas rozpoznávania. Vysoká technická náročnosť metódy
Kolektívy rozhodujúcich pravidiel (CRC) Problémy malého rozmeru z hľadiska počtu tried a vlastností Veľmi vysoká technická náročnosť metódy, nevyriešené množstvo teoretických problémov ako pri určovaní oblastí kompetencie jednotlivých metód, tak aj v samotných metódach.

Tabuľka 3.1 - Súhrnná tabuľka klasifikácie metód rozpoznávania, porovnanie oblastí ich použitia a obmedzení

Úloha a miesto rozpoznávania vzorov v automatizácii riadenia zložitých systémov

Automatizovaný riadiaci systém pozostáva z dvoch hlavných častí: riadiaceho objektu a riadiaceho systému.

Riadiaci systém vykonáva nasledujúce funkcie:

  • identifikácia stavu riadiaceho objektu;
  • vypracovanie kontrolnej akcie na základe cieľov manažmentu s prihliadnutím na stav objektu kontroly a prostredia;
  • poskytujúci riadiaci účinok na riadiaci objekt.

Rozpoznávanie vzorov nie je nič iné ako identifikácia stavu nejakého objektu.

Preto sa možnosť využitia systému rozpoznávania vzorov v štádiu identifikácie stavu riadiaceho objektu javí ako celkom zrejmá a prirodzená. To však nemusí byť potrebné. Preto vzniká otázka, v ktorých prípadoch je vhodné použiť rozpoznávací systém v automatizovanom systéme riadenia a v ktorých nie.

Podľa údajov z literatúry sa v mnohých už skôr vyvinutých a moderných automatizovaných riadiacich systémoch v podsystémoch na identifikáciu stavu riadiaceho objektu a generovanie riadiacich akcií používajú deterministické matematické modely „priameho počítania“, ktoré jednoznačne a jednoducho určujú, čo sa má robiť s ovládacím objektom, ak má určité externé parametre.

Zároveň nie je nastolená ani vyriešená otázka, ako tieto parametre súvisia s určitými stavmi riadiaceho objektu. Táto pozícia korešponduje s uhlom pohľadu, ktorý spočíva v tom, že ich vzťah jedna k jednej je akceptovaný „štandardne“. Preto sa pojmy: "parametre riadiaceho objektu" a "stav riadiaceho objektu" považujú za synonymá a pojem "stav riadiaceho objektu" nie je výslovne zavedený. Je však zrejmé, že vo všeobecnom prípade je vzťah medzi sledovanými parametrami riadiaceho objektu a jeho stavom dynamický a pravdepodobný.

Tradičné automatizované riadiace systémy sú teda v podstate parametrické riadiace systémy, t.j. systémy, ktoré riadia nie stavy riadiaceho objektu, ale iba jeho pozorovateľné parametre. O kontrolnej akcii sa rozhoduje v takýchto systémoch akoby „naslepo“, t.j. bez vytvárania holistického obrazu riadiaceho objektu a prostredia v ich aktuálnom stave, ako aj bez predpovedania vývoja prostredia a reakcie riadiaceho objektu na určité riadiace akcie na ňom pôsobiace súčasne s predpokladaným vplyvom prostredia .

Z pozícií rozvinutých v tomto dokumente je termín „rozhodovanie“ v modernom zmysle len ťažko aplikovateľný na tradičné automatizované riadiace systémy. Faktom je, že prinajmenšom „rozhodovanie“ zahŕňa holistickú víziu objektu v prostredí, a to nielen v jeho aktuálnom stave, ale aj v dynamike a vo vzájomnej interakcii a interakcii s riadiacim systémom, zahŕňa zváženie rôznych alternatívnych možností rozvoja celého tohto systému, ako aj zúženie diverzity (zníženie) týchto alternatív na základe určitých cieľových kritérií. Nič z toho samozrejme nie je v tradičnom ACS, alebo je, ale v zjednodušenej forme.

Tradičná metóda je samozrejme adekvátna a jej aplikácia je celkom správna a opodstatnená v prípadoch, keď je objekt riadenia skutočne stabilný a pevne určený systém a vplyv prostredia naň možno zanedbať.

V iných prípadoch je však táto metóda neúčinná.

Ak je riadiaci objekt dynamický, potom sa modely, na ktorých sú založené jeho riadiace algoritmy, rýchlo stanú neadekvátnymi, pretože sa mení vzťah medzi vstupnými a výstupnými parametrami, ako aj samotný súbor základných parametrov. V skutočnosti to znamená, že tradičné automatizované riadiace systémy sú schopné kontrolovať stav riadiaceho objektu len v blízkosti bodu rovnováhy pomocou slabých riadiacich akcií na ňom, t.j. metódou malých porúch. Ďaleko od rovnovážneho stavu, z tradičného hľadiska, správanie riadiaceho objektu vyzerá nepredvídateľne a nekontrolovateľne.

Ak neexistuje jednoznačný vzťah medzi vstupnými a výstupnými parametrami riadiaceho objektu (teda medzi vstupnými parametrami a stavom objektu), inými slovami, ak má tento vzťah vyslovene pravdepodobnostný charakter, potom deterministické modely, v o ktorom sa predpokladá, že výsledkom merania určitého parametra je jednoducho číslo, spočiatku nepoužiteľné. Okrem toho, forma tohto spojenia môže byť jednoducho neznáma, a potom je potrebné vychádzať z najvšeobecnejšieho predpokladu: že je pravdepodobný, alebo nie je definovaný vôbec.

Automatizovaný riadiaci systém vybudovaný na tradičných princípoch môže fungovať len na základe parametrov, ktorých vzorce vzťahov sú už známe, študované a premietnuté do matematického modelu, v tejto štúdii bola zadaná úloha vyvinúť také metódy pre návrh automatizovaného riadenia. systémy, ktoré umožnia vytvárať systémy, ktoré dokážu identifikovať a nastaviť najvýznamnejšie parametre a určiť povahu väzieb medzi nimi a stavmi riadiaceho objektu.

V tomto prípade je potrebné aplikovať rozvinutejšie a adekvátnejšie metódy merania na reálnu situáciu:

  • klasifikácia alebo rozpoznávanie vzorov (učenie na základe trénovacej vzorky, adaptabilita rozpoznávacích algoritmov, adaptabilita množín tried a študovaných parametrov, výber najvýznamnejších parametrov a redukcia dimenzie popisu pri zachovaní danej redundancie atď.);
  • štatistické merania, kedy výsledkom merania určitého parametra nie je jedno číslo, ale rozdelenie pravdepodobnosti: zmena štatistickej premennej neznamená zmenu jej hodnoty ako takej, ale zmenu charakteristík rozdelenia pravdepodobnosti tzv. jeho hodnoty.

Výsledkom je, že automatizované riadiace systémy založené na tradičnom deterministickom prístupe prakticky nepracujú so zložitými dynamickými viacparametrovými slabo určenými objektmi riadenia, akými sú napríklad makro- a mikro-socio-ekonomické systémy v dynamickej ekonomike tzv. prechodné obdobie“, hierarchické elity a etnické skupiny, spoločnosť a voličstvo, fyziológia a psychika človeka, prírodné a umelé ekosystémy a mnohé ďalšie.

Pomerne príznačné je, že v polovici 80. rokov sa v škole I. Prigozhina vyvinul prístup, podľa ktorého sa vo vývoji akéhokoľvek systému (vrátane človeka) striedajú obdobia, počas ktorých sa systém správa buď „prevažne deterministický“, alebo ako „väčšinou náhodné“. Prirodzene, skutočný riadiaci systém musí stabilne riadiť objekt riadenia nielen v „deterministických“ úsekoch svojej histórie, ale aj v bodoch, keď sa jeho ďalšie správanie stáva značne neistým. To samo o sebe znamená, že je potrebné vyvinúť prístupy k riadeniu systémov, v ktorých správaní je veľký prvok náhodnosti (alebo toho, čo sa v súčasnosti matematicky označuje ako „náhodnosť“).

Preto skladba perspektívnych automatizovaných riadiacich systémov, ktoré zabezpečujú riadenie zložitých dynamických viacparametrových slabo deterministických systémov, ako zásadných funkčných väzieb, bude zrejme zahŕňať podsystémy na identifikáciu a predikciu stavov prostredia a riadiaceho objektu, založené na metódach umelej inteligencie. (predovšetkým rozpoznávanie vzorov), metódy podpory rozhodovania a teória informácie.

Pozrime sa stručne na otázku použitia systémov rozpoznávania obrazu na rozhodovanie o riadiacej akcii (táto problematika bude diskutovaná podrobnejšie neskôr, pretože je kľúčovou pre túto prácu). Ak vezmeme cieľ a ostatné stavy riadiaceho objektu ako rozpoznávacie triedy a faktory, ktoré ho ovplyvňujú, ako vlastnosti, potom možno v modeli rozpoznávania vzorov vytvoriť mieru vzťahu medzi faktormi a stavmi. To umožňuje získať informácie o faktoroch, ktoré prispievajú alebo bránia jeho prechodu do tohto stavu, na základe daného stavu objektu riadenia a na základe toho vypracovať rozhodnutie o opatrení kontroly.

Faktory možno rozdeliť do nasledujúcich skupín:

  • charakterizujúce prehistóriu riadiaceho objektu;
  • charakterizujúci aktuálny stav riadiaceho objektu;
  • enviromentálne faktory;
  • technologické (riadené) faktory.

Systémy rozpoznávania obrazu teda môžu byť použité ako súčasť automatizovaného riadiaceho systému: v podsystémoch na identifikáciu stavu riadiaceho objektu a generovanie riadiacich akcií.

To je užitočné, keď je objektom riadenia zložitý systém.

Rozhodovanie o riadiacej činnosti v automatizovanom riadiacom systéme

V tomto príspevku sa uvažuje o riešení problému syntézy adaptívnych automatizovaných riadiacich systémov komplexnými systémami, berúc do úvahy početné a hlboké analógie medzi metódami rozpoznávania vzorov a rozhodovania.

Na jednej strane je úlohou rozpoznávania vzorov rozhodnutie o príslušnosti rozpoznateľného objektu k určitej triede rozpoznávania.

Na druhej strane, autori považujú problém rozhodovania za problém inverzného dekódovania alebo problém s inverzným rozpoznávaním vzorov (pozri časť 2.2.2).

Spoločnosť základných myšlienok, ktoré sú základom metód rozpoznávania vzorov a rozhodovania, sa stáva obzvlášť zrejmou, keď ich zvažujeme z hľadiska teórie informácie.

Rozmanitosť rozhodovacích úloh

Rozhodovanie ako realizácia cieľa

Definícia: rozhodovanie („výber“) je pôsobenie na množinu alternatív, v dôsledku čoho sa pôvodný súbor alternatív zužuje, t.j. je znížená.

Voľba je činnosť, ktorá dáva účelnosť každej činnosti. Prostredníctvom aktov voľby sa realizuje podriadenie všetkej činnosti konkrétnemu cieľu alebo súboru vzájomne súvisiacich cieľov.

Na to, aby sa akt voľby stal možným, je teda potrebné:

  • generovanie alebo objavovanie súboru alternatív, na základe ktorých sa môže rozhodnúť;
  • určenie cieľov, na dosiahnutie ktorých sa výber uskutočňuje;
  • vývoj a aplikácia metódy na vzájomné porovnávanie alternatív, t.j. určenie preferenčného ratingu pre každú alternatívu podľa určitých kritérií, čo umožňuje nepriamo posúdiť, ako každá alternatíva spĺňa cieľ.

Moderná práca v oblasti podpory rozhodovania odhalila charakteristickú situáciu, ktorá spočíva v tom, že úplná formalizácia hľadania najlepšieho (v istom zmysle) riešenia je možná len pri dobre preštudovaných, relatívne jednoduchých problémoch, pričom v praxi bežnejšie sú slabo štruktúrované problémy, pre ktoré neboli vyvinuté úplne formalizované algoritmy (okrem vyčerpávajúceho vymenovania a pokusov a omylov). Skúsení, kompetentní a schopní odborníci však často robia rozhodnutia, ktoré sa ukážu ako celkom dobré. Preto je súčasným trendom v rozhodovacej praxi v prirodzených situáciách spájať schopnosť človeka riešiť neformalizované problémy so schopnosťami formálnych metód a počítačového modelovania: interaktívne systémy na podporu rozhodovania, expertné systémy, adaptívne automatizované človek-stroj riadiace systémy, neurónové siete a kognitívne systémy.

Rozhodovanie ako odstránenie neistoty (informačný prístup)

Proces získavania informácií možno považovať za zníženie neistoty v dôsledku prijatia signálu a množstvo informácií - za kvantitatívne meranie stupňa odstránenia neistoty.

Ale v dôsledku výberu nejakej podmnožiny alternatív z množiny, t.j. v dôsledku rozhodovania sa deje to isté (zníženie neistoty). To znamená, že každá voľba, každé rozhodnutie generuje určité množstvo informácií, a preto ich možno opísať z hľadiska teórie informácie.

Klasifikácia problémov rozhodovania

Rôznorodosť rozhodovacích úloh je spôsobená tým, že každá zložka situácie, v ktorej sa rozhodovanie uskutočňuje, môže byť realizovaná kvalitatívne odlišnými spôsobmi.

Tu je len niekoľko z týchto možností:

  • množina alternatív môže byť na jednej strane konečná, spočítateľná alebo kontinuálna a na druhej strane môže byť uzavretá (to znamená úplne známa) alebo otvorená (vrátane neznámych prvkov);
  • alternatívy možno hodnotiť podľa jedného alebo viacerých kritérií, ktoré môžu byť naopak kvantitatívne alebo kvalitatívne;
  • režim voľby môže byť jednorazový (jednorazový), alebo viacnásobný, opakovaný, vrátane spätnej väzby o výsledkoch voľby, t.j. umožnenie osvojenia si rozhodovacích algoritmov s prihliadnutím na dôsledky predchádzajúcich volieb;
  • dôsledky voľby každej alternatívy môžu byť vopred presne známe (výber s istotou), majú pravdepodobnostný charakter, keď sú po vykonaní voľby známe pravdepodobnosti možných výsledkov (výber pod rizikom) alebo majú nejednoznačný výsledok s neznámou pravdepodobnosťou (výber v neistote);
  • zodpovednosť za výber môže chýbať, môže byť individuálna alebo skupinová;
  • miera konzistentnosti cieľov pri skupinovej voľbe sa môže meniť od úplnej zhody záujmov strán (kooperatívna voľba) až po ich opak (výber v konfliktnej situácii). Možné sú aj prechodné možnosti: kompromis, koalícia, rastúci alebo doznievajúci konflikt.

Rôzne kombinácie týchto možností vedú k mnohým problémom pri rozhodovaní, ktoré boli v rôznej miere študované.

Jazyky na popis metód rozhodovania

O jednom a tom istom fenoméne možno hovoriť v rôznych jazykoch rôzneho stupňa všeobecnosti a primeranosti. K dnešnému dňu existujú tri hlavné jazyky na opis výberu.

Najjednoduchší, najrozvinutejší a najpopulárnejší je jazyk kritéria.

Jazyk kritérií

S názvom tohto jazyka sa spája základný predpoklad, že každú jednotlivú alternatívu možno ohodnotiť nejakým konkrétnym (jedným) číslom, po ktorom sa porovnávanie alternatív zredukuje na porovnanie im zodpovedajúcich čísel.

Nech je napríklad (X) množina alternatív a x je nejaká určitá alternatíva patriaca do tejto množiny: x∈X. Potom sa uvažuje, že pre všetky x môže byť daná funkcia q(x), ktorá sa nazýva kritérium (kritérium kvality, účelová funkcia, preferenčná funkcia, funkcia užitočnosti atď.), ktoré má tú vlastnosť, že ak alternatíva x 1 je výhodnejšie ako x 2 (označené: x 1 > x 2), potom q (x 1) > q (x 2).

V tomto prípade sa výber obmedzuje na nájdenie alternatívy s najvyššou hodnotou funkcie kritéria.

V praxi sa však použitie len jedného kritéria na porovnávanie miery preferencie alternatív ukazuje ako neopodstatnené zjednodušenie, pretože detailnejšie zvažovanie alternatív vedie k potrebe hodnotiť ich nie podľa jedného, ​​ale podľa mnohých. kritériá, ktoré môžu mať rôznu povahu a môžu sa navzájom kvalitatívne líšiť.

Napríklad pri výbere najprijateľnejšieho typu lietadla pre cestujúcich a prevádzkovú organizáciu na určitých typoch trás sa porovnanie vykonáva súčasne podľa mnohých skupín kritérií: technické, technologické, ekonomické, sociálne, ergonomické atď.

Multikriteriálne problémy nemajú jedinečné všeobecné riešenie. Preto sa navrhuje mnoho spôsobov, ako dať viackriteriálnemu problému konkrétnu formu, ktorá umožňuje jediné všeobecné riešenie. Prirodzene, tieto riešenia sa vo všeobecnosti líšia pre rôzne metódy. Preto možno hlavnou vecou pri riešení multikriteriálneho problému je opodstatnenosť tohto typu jeho formulácie.

Používajú sa rôzne možnosti na zjednodušenie problému viackriteriálneho výberu. Uveďme si niektoré z nich.

  1. Podmienená maximalizácia (nie je nájdený globálny extrém integrálneho kritéria, ale lokálny extrém hlavného kritéria).
  2. Hľadajte alternatívu s danými vlastnosťami.
  3. Nájdenie Paretovej sady.
  4. Redukcia viackriteriálneho problému na jednokriteriálny zavedením integrálneho kritéria.

Pozrime sa podrobnejšie na formálnu formuláciu spôsobu redukcie viackriteriálneho problému na jednokriteriálny.

Zavedieme integrálne kritérium q 0 (x) ako skalárnu funkciu vektorového argumentu:

qo (x) = qo ((qi (x), q2 (x), ..., qn (x)).

Integrálne kritérium umožňuje zoradiť alternatívy podľa q 0 , čím sa zvýrazní tá najlepšia (v zmysle tohto kritéria). Tvar funkcie q 0 je určený tým, ako konkrétne si predstavujeme príspevok každého kritéria k integrálnemu kritériu. Zvyčajne sa používajú aditívne a multiplikatívne funkcie:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

Koeficienty, ktoré poskytujem:

  1. Bezrozmernosť alebo jeden rozmer čísla a i ⋅q i /s i (rôzne konkrétne kritériá môžu mať rôzne rozmery a potom nie je možné s nimi robiť aritmetické operácie a redukovať ich na celočíselné kritérium).
  2. Normalizácia, t.j. ustanovenie podmienky: b i ⋅q i /s i<1.

Koeficienty a i a b i odrážajú relatívny príspevok jednotlivých kritérií q i k integrálnemu kritériu.

Takže v multikriteriálnom prostredí sa problém rozhodovania o výbere jednej z alternatív redukuje na maximalizáciu integrálneho kritéria:

x * = arg max (q 0 (q 1 (x), q 2 (x), ..., q n (x)))

Hlavným problémom pri multikriteriálnej formulácii rozhodovacieho problému je, že je potrebné nájsť takú analytickú formu koeficientov a i a b i , ktorá by poskytovala nasledujúce vlastnosti modelu:

  • vysoká miera primeranosti predmetnej oblasti a pohľadu odborníkov;
  • minimálne výpočtové ťažkosti pri maximalizácii integrálneho kritéria, t.j. jeho výpočet pre rôzne alternatívy;
  • stabilita výsledkov maximalizácie integrálneho kritéria z malých odchýlok počiatočných údajov.
  • Stabilita riešenia znamená, že malá zmena počiatočných údajov by mala viesť k malej zmene hodnoty integrálneho kritéria, a teda k malej zmene v prijímanom rozhodnutí. Ak sú teda počiatočné údaje prakticky rovnaké, rozhodnutie by malo byť urobené buď rovnako, alebo veľmi blízko.

Jazyk sekvenčného binárneho výberu

Jazyk binárnych vzťahov je zovšeobecnením multikriteriálneho jazyka a vychádza z toho, že keď hodnotíme nejakú alternatívu, toto hodnotenie je vždy relatívne, t.j. explicitne alebo častejšie implicitne sa ako základ alebo referenčný rámec na porovnanie používajú iné alternatívy zo skúmaného súboru alebo zo všeobecnej populácie. Ľudské myslenie je založené na hľadaní a analýze protikladov (konštruktov), ​​preto je pre nás vždy jednoduchšie vybrať si jednu z dvoch protikladných možností ako jednu z veľkej a nijako neusporiadanej množiny.

Hlavné predpoklady tohto jazyka sa teda zmenšujú na nasledovné:

  • nehodnotí sa jediná alternatíva, t.j. nie je zavedená funkcia kritéria;
  • pre každú dvojicu alternatív možno nejakým spôsobom stanoviť, že jedna z nich je výhodnejšia ako druhá, alebo že sú ekvivalentné alebo neporovnateľné;
  • preferenčný vzťah v žiadnej dvojici alternatív nezávisí od iných alternatív prezentovaných na výber.

Existujú rôzne spôsoby, ako špecifikovať binárne vzťahy: priame, maticové, pomocou preferenčných grafov, metóda sekcií atď.

Vzťahy medzi alternatívami jedného páru sú vyjadrené prostredníctvom pojmov ekvivalencie, poradia a dominancie.

Funkcie zovšeobecneného jazyka výberu

Funkcia jazyka výberu je založená na teórii množín a umožňuje pracovať s mapovaním množín do ich podmnožín zodpovedajúcich rôznym výberom bez potreby vymenovať prvky. Tento jazyk je veľmi všeobecný a potenciálne umožňuje popísať akúkoľvek voľbu. Matematický aparát funkcií zovšeobecneného výberu sa však v súčasnosti iba vyvíja a testuje najmä na problémoch, ktoré už boli riešené pomocou kriteriálnych alebo binárnych prístupov.

skupinový výber

Nech existuje skupina ľudí, ktorí majú právo podieľať sa na kolektívnom rozhodovaní. Predpokladajme, že táto skupina zvažuje nejaký súbor alternatív a každý člen skupiny si vyberie. Úlohou je vypracovať riešenie, ktoré určitým spôsobom koordinuje jednotlivé voľby a v istom zmysle vyjadruje „všeobecný názor“ skupiny, t.j. braný ako skupinová voľba.

Prirodzene, rôzne skupinové rozhodnutia budú zodpovedať rôznym princípom koordinácie individuálnych rozhodnutí.

Pravidlá pre koordináciu individuálnych rozhodnutí pri skupinovom výbere sa nazývajú pravidlá hlasovania. Najbežnejšie je „pravidlo väčšiny“, v ktorom o skupinovom rozhodovaní rozhoduje alternatíva, ktorá získa najviac hlasov.

Treba chápať, že takéto rozhodnutie iba odráža prevahu rôznych uhlov pohľadu v skupine, a nie skutočne optimálnu možnosť, za ktorú nemôže hlasovať vôbec nikto. "Pravda sa neurčuje hlasovaním."

Okrem toho existujú takzvané „hlasovacie paradoxy“, z ktorých najznámejší je Arrowov paradox.

Tieto paradoxy môžu viesť a niekedy vedú k veľmi nepríjemným črtám postupu hlasovania: napríklad existujú prípady, keď skupina nemôže urobiť jediné rozhodnutie (nie je kvórum alebo každý hlasuje za svoju jedinečnú možnosť atď.). .) a niekedy (pri viacstupňovom hlasovaní) môže menšina vnútiť svoju vôľu väčšine.

Voľba pod neistotou

Istota je špeciálny prípad neistoty, a to: je to neistota blízka nule.

V modernej teórii výberu sa verí, že existujú tri hlavné typy neistoty v problémoch rozhodovania:

  1. Informačná (štatistická) neistota počiatočných údajov pre rozhodovanie.
  2. Neistota dôsledkov rozhodovania (voľby).
  3. Nejasnosť v popise zložiek rozhodovacieho procesu.

Uvažujme ich v poradí.

Informačná (štatistická) neistota v počiatočných údajoch

Údaje získané o predmetnej oblasti nemožno považovať za absolútne presné. Navyše je zrejmé, že tieto údaje nás nezaujímajú samy o sebe, ale len ako signály, ktoré možno nesú určité informácie o tom, čo nás skutočne zaujíma. Je teda reálnejšie uvažovať o tom, že máme do činenia s údajmi, ktoré sú nielen zašumené a nepresné, ale aj nepriame, prípadne neúplné. Navyše tieto údaje sa netýkajú celej skúmanej (všeobecnej) populácie, ale len jej určitej podmnožiny, o ktorej sa nám skutočne podarilo zozbierať dáta, no zároveň chceme vyvodiť závery o celej populácii, a tiež chceme poznať mieru spoľahlivosti týchto záverov.

Za týchto podmienok sa využíva teória štatistického rozhodovania.

V tejto teórii existujú dva hlavné zdroje neistoty. Po prvé, nie je známe, akej distribúcii sa riadia pôvodné údaje. Po druhé, nie je známe, aké rozdelenie má množina (všeobecná populácia), o ktorej chceme vyvodiť závery z jej podmnožiny, ktorá tvorí počiatočné údaje.

Štatistické postupy sú postupy rozhodovania, ktoré odstraňujú oba tieto typy neistoty.

Je potrebné poznamenať, že existuje niekoľko dôvodov, ktoré vedú k nesprávnemu použitiu štatistických metód:

  • štatistické závery, ako každé iné, majú vždy určitú spoľahlivosť alebo istotu. Ale na rozdiel od mnohých iných prípadov je spoľahlivosť štatistických zistení známa a určená v priebehu štatistického výskumu;
  • kvalita riešenia získaného použitím štatistického postupu závisí od kvality počiatočných údajov;
  • údaje, ktoré nemajú štatistický charakter, by nemali byť predmetom štatistického spracovania;
  • je potrebné použiť štatistické postupy zodpovedajúce úrovni apriórnych informácií o skúmanej populácii (napríklad by ste nemali aplikovať metódy analýzy rozptylu na negaussovské údaje). Ak je distribúcia pôvodných údajov neznáma, je potrebné ju buď zistiť, alebo použiť niekoľko rôznych metód a porovnať výsledky. Ak sú veľmi rozdielne, svedčí to o nepoužiteľnosti niektorých použitých postupov.

Neistota dôsledkov

Keď sú dôsledky výberu alternatívy jednoznačne určené samotnou alternatívou, potom nemôžeme rozlišovať medzi alternatívou a jej dôsledkami, pričom považujeme za samozrejmé, že výber alternatívy si v skutočnosti vyberáme jej dôsledky.

V reálnej praxi sa však často musíme vysporiadať so zložitejšou situáciou, keď výber tej či onej alternatívy nejednoznačne určuje dôsledky vykonanej voľby.

V prípade diskrétneho súboru alternatív a výsledkov podľa vlastného výberu, za predpokladu, že súbor možných výsledkov je spoločný pre všetky alternatívy, môžeme predpokladať, že rôzne alternatívy sa navzájom líšia v rozložení pravdepodobnosti výsledku. Tieto rozdelenia pravdepodobnosti môžu vo všeobecnom prípade závisieť od výsledkov výberu alternatív a výsledkov, ktoré sa v dôsledku toho skutočne vyskytli. V najjednoduchšom prípade sú výsledky rovnako pravdepodobné. Samotné výsledky majú zvyčajne význam ziskov alebo strát a sú kvantifikované.

Ak sú výsledky pre všetky alternatívy rovnaké, potom nie je z čoho vyberať. Ak sú odlišné, potom je možné porovnať alternatívy zavedením určitých kvantitatívnych odhadov pre ne. Rôznorodosť problémov v teórii hier je spojená s odlišným výberom číselných charakteristík strát a ziskov v dôsledku výberu alternatív, rôznymi stupňami konfliktu medzi stranami, ktoré si vyberajú alternatívy atď.

Považujte tento typ neistoty za vágnu neistotu

Akýkoľvek problém výberu je cieľovým zúžením množiny alternatív. Formálny popis alternatív (samotný ich zoznam, zoznam ich atribútov či parametrov), ako aj popis pravidiel ich porovnávania (kritériá, vzťahy) sú vždy uvedené na tej či onej meracej škále (aj keď ten, kto toto o tom nevie).

Je známe, že všetky stupnice sú rozmazané, ale v rôznej miere. Pod pojmom „rozostrenie“ sa rozumie vlastnosť stupníc, ktorá spočíva v tom, že vždy je možné predložiť dve alternatívy, ktoré sú rozlíšiteľné, t.j. rozdielne v jednej mierke a nerozoznateľné, t.j. sú rovnaké, v druhom - viac rozmazané. Čím menej gradácií v určitej škále, tým je rozmazanejšia.

Alternatívy teda jasne vidíme a zároveň ich nejasne zaraďujeme, t.j. byť nejednoznačné, do ktorých tried patria.

Už vo svojej prvej práci o rozhodovaní vo fuzzy situácii Bellman a Zadeh predložili myšlienku, že ciele aj obmedzenia by mali byť reprezentované ako fuzzy (fuzzy) množiny na množine alternatív.

O niektorých obmedzeniach optimalizačného prístupu

Vo všetkých vyššie uvažovaných výberových problémoch a metódach rozhodovania bol problém nájsť tie najlepšie v počiatočnom súbore za daných podmienok, t.j. optimálne alternatívy v určitom zmysle.

Myšlienka optimálnosti je ústrednou myšlienkou kybernetiky a pevne vstúpila do praxe navrhovania a prevádzky technických systémov. Zároveň si táto myšlienka vyžaduje opatrný postoj, keď sa ju pokúšame preniesť do oblasti riadenia zložitých, veľkých a slabo determinovaných systémov, akými sú napríklad sociálno-ekonomické systémy.

Na tento záver existujú dobré dôvody. Uvažujme o niektorých z nich:

  1. Optimálne riešenie sa často ukazuje ako nestabilné, t.j. menšie zmeny v podmienkach problému, vstupných údajoch alebo obmedzeniach môžu viesť k výberu výrazne odlišných alternatív.
  2. Optimalizačné modely sú vyvinuté len pre úzke triedy pomerne jednoduchých úloh, ktoré nie vždy dostatočne a systematicky odrážajú skutočné objekty riadenia. Najčastejšie optimalizačné metódy umožňujú optimalizovať len dosť jednoduché a dobre formálne popísané podsystémy niektorých veľkých a zložitých systémov, t.j. povoliť iba lokálnu optimalizáciu. Ak však každý podsystém nejakého veľkého systému funguje optimálne, vôbec to neznamená, že optimálne bude fungovať aj systém ako celok. Optimalizácia podsystému teda nemusí nevyhnutne viesť k jeho správaniu, ktoré sa od neho vyžaduje pri optimalizácii systému ako celku. Navyše niekedy môže lokálna optimalizácia viesť k negatívnym dôsledkom pre systém ako celok. Preto pri optimalizácii podsystémov a systému ako celku je potrebné určiť strom cieľov a podcieľov a ich prioritu.
  3. Často sa za cieľ optimalizácie považuje maximalizácia optimalizačného kritéria podľa nejakého matematického modelu, ale v skutočnosti je cieľom optimalizovať objekt riadenia. Kritériá optimalizácie a matematické modely súvisia s cieľom vždy len nepriamo, t.j. viac-menej primerané, ale vždy približné.

Ideu optimality, ktorá je mimoriadne plodná pre systémy, ktoré sa hodia na primeranú matematickú formalizáciu, je teda potrebné preniesť do zložitých systémov opatrne. Samozrejme, matematické modely, ktoré možno niekedy navrhnúť pre takéto systémy, možno optimalizovať. Vždy však treba brať do úvahy výrazné zjednodušenie týchto modelov, ktoré v prípade zložitých systémov už nemožno zanedbávať, ako aj skutočnosť, že miera primeranosti týchto modelov v prípade zložitých systémov je vlastne neznáma. . Preto nie je známe, aký čisto praktický význam má táto optimalizácia. Vysoká praktickosť optimalizácie v technických systémoch by nemala vyvolávať ilúziu, že bude rovnako účinná aj pri optimalizácii zložitých systémov. Zmysluplné matematické modelovanie zložitých systémov je veľmi ťažké, približné a nepresné. Čím je systém zložitejší, tým opatrnejší by mal byť nápad s jeho optimalizáciou.

Pri vývoji metód riadenia pre zložité, veľké, slabo determinované systémy preto autori považujú za hlavnú vec nielen optimálnosť zvoleného prístupu z formálneho matematického hľadiska, ale aj jeho primeranosť cieľu a samotnú povahu riadiaci objekt.

Metódy odborného výberu

Pri štúdiu zložitých systémov často vznikajú problémy, ktoré z rôznych dôvodov nie je možné rigorózne položiť a vyriešiť pomocou v súčasnosti vyvinutého matematického aparátu. V týchto prípadoch sa využívajú služby odborníkov (systémových analytikov), ktorých skúsenosti a intuícia pomáhajú znižovať zložitosť problému.

Treba však brať do úvahy, že samotní experti sú vysoko komplexné systémy a ich činnosť závisí aj od mnohých vonkajších a vnútorných podmienok. Preto sa v metódach organizácie znaleckých posudkov veľká pozornosť venuje vytváraniu priaznivých vonkajších a psychologických podmienok pre prácu znalcov.

Nasledujúce faktory ovplyvňujú prácu odborníka:

  • zodpovednosť za použitie výsledkov vyšetrenia;
  • s vedomím, že sú zapojení ďalší odborníci;
  • dostupnosť informačného kontaktu medzi odborníkmi;
  • medziľudské vzťahy odborníkov (ak medzi nimi existuje informačný kontakt);
  • osobný záujem znalca o výsledky posúdenia;
  • osobné kvality odborníkov (sebaúcta, konformita, vôľa atď.)

Interakcia medzi odborníkmi môže buď stimulovať, alebo brzdiť ich aktivitu. Preto sa v rôznych prípadoch používajú rôzne metódy vyšetrovania, ktoré sa líšia charakterom interakcie odborníkov medzi sebou: anonymné a otvorené prieskumy a dotazníky, stretnutia, diskusie, obchodné hry, brainstorming atď.

Existujú rôzne metódy matematického spracovania znaleckých posudkov. Odborníci sú požiadaní, aby zhodnotili rôzne alternatívy buď jedným alebo systémom ukazovateľov. Okrem toho sú požiadaní, aby zhodnotili stupeň dôležitosti každého ukazovateľa (jeho „váhu“ alebo „príspevok“). Samotní experti majú tiež pridelenú úroveň kompetencií zodpovedajúcu príspevku každého z nich k výslednému názoru skupiny.

Rozvinutou metódou práce s odborníkmi je metóda „Delphi“. Hlavnou myšlienkou tejto metódy je, že kritika a argumentácia majú priaznivý vplyv na odborníka, ak nie je ovplyvnená jeho sebaúcta a sú poskytnuté podmienky, ktoré vylučujú osobnú konfrontáciu.

Treba zdôrazniť, že zásadný rozdiel je v charaktere použitia expertných metód v expertných systémoch a v podpore rozhodovania. Ak v prvom prípade sú odborníci povinní formalizovať metódy rozhodovania, potom v druhom prípade iba samotné rozhodnutie ako také.

Keďže odborníci sa podieľajú na implementácii práve tých funkcií, ktoré v súčasnosti automatizované systémy buď vôbec nezabezpečujú, alebo ich vykonávajú horšie ako ľudia, sľubným smerom vo vývoji automatizovaných systémov je maximálna automatizácia týchto funkcií.

Automatizované systémy na podporu rozhodovania

Osoba vždy využívala pri rozhodovaní asistentov: boli to jednoducho poskytovatelia informácií o objekte kontroly a konzultanti (poradcovia), ktorí ponúkajú možnosti rozhodnutí a analyzujú ich dôsledky. Rozhodujúci človek ich vždy robil v určitom informačnom prostredí: pre vojenského veliteľa je to veliteľstvo, pre rektora akademická rada, pre ministra kolégium.

Informačná infraštruktúra rozhodovania je v našej dobe nemysliteľná bez automatizovaných systémov pre iteratívne vyhodnocovanie rozhodovania a najmä systémov na podporu rozhodovania (DDS - Decision Support Systems), t.j. automatizované systémy, ktoré sú špeciálne navrhnuté na prípravu informácií, ktoré osoba potrebuje na to, aby sa rozhodla. Vývoj systémov na podporu rozhodovania sa realizuje najmä v rámci medzinárodného projektu realizovaného pod záštitou Medzinárodného inštitútu pre analýzu aplikovaných systémov v Laxenburgu (Rakúsko).

Výber v reálnych situáciách si vyžaduje vykonanie množstva operácií, z ktorých niektoré sú vykonávané efektívnejšie človekom a iné strojom. Efektívna kombinácia ich výhod so súčasnou kompenzáciou nedostatkov je stelesnená v automatizovaných systémoch na podporu rozhodovania.

Človek sa v podmienkach neistoty rozhoduje lepšie ako stroj, no na správne rozhodnutie potrebuje aj adekvátne (úplné a spoľahlivé) informácie charakterizujúce predmetnú oblasť. Je však známe, že človek nezvláda dobre veľké množstvo „surových“ nespracovaných informácií. Úlohou stroja pri podpore rozhodovania preto môže byť predbežná príprava informácií o riadiacom objekte a nekontrolovateľných faktoroch (prostredí), pomôcť pri pohľade na dôsledky prijímania určitých rozhodnutí a tiež prezentovať všetky tieto informácie vo vizuálnej podobe. a pohodlný spôsob rozhodovania.

Automatizované systémy na podporu rozhodovania teda kompenzujú slabé stránky človeka, oslobodzujú ho od rutinného predbežného spracovania informácií a poskytujú mu komfortné informačné prostredie, v ktorom môže lepšie ukázať svoje silné stránky. Tieto systémy nie sú zamerané na automatizáciu funkcií osoby s rozhodovacou právomocou (a v dôsledku toho na odcudzenie týchto funkcií od neho, a tým aj na zodpovednosť za prijaté rozhodnutia, čo je často všeobecne neprijateľné), ale na poskytovanie pomoci pri hľadaní dobré riešenie.