სურათების ამოცნობა ხდება პროცესების საფუძველზე. ამოცნობის ხარისხის კონტროლის ამოცანა

და ნიშნები. ასეთი ამოცანები საკმაოდ ხშირად წყდება, მაგალითად, შუქნიშანზე ქუჩის გადაკვეთისას ან მოძრაობისას. ანთებული შუქნიშნის ფერის ამოცნობა და გზის წესების ცოდნა საშუალებას გაძლევთ მიიღოთ სწორი გადაწყვეტილება, გადაკვეთთ თუ არა ქუჩას ამ მომენტში.

ბიოლოგიური ევოლუციის პროცესში ბევრი ცხოველი წყვეტდა პრობლემებს ვიზუალური და სმენის აპარატის დახმარებით. ნიმუშის ამოცნობასაკმარისად კარგი. ხელოვნური სისტემების შექმნა ნიმუშის ამოცნობარჩება რთულ თეორიულ და ტექნიკურ პრობლემად. ასეთი აღიარების საჭიროება ჩნდება სხვადასხვა სფეროში - სამხედრო საქმეებიდან და უსაფრთხოების სისტემებიდან ყველა სახის ანალოგური სიგნალის დიგიტალიზაციამდე.

ტრადიციულად, გამოსახულების ამოცნობის ამოცანები შედის ხელოვნური ინტელექტის ამოცანების ფარგლებში.

მიმართულებები ნიმუშის ამოცნობაში

არსებობს ორი ძირითადი მიმართულება:

  • ცოცხალი არსებების ამოცნობის უნარის შესწავლა, მათი ახსნა და მოდელირება;
  • გამოყენებითი პრობლემების ინდივიდუალური პრობლემების გადასაჭრელად შექმნილი მოწყობილობების აგების თეორიისა და მეთოდების შემუშავება.

პრობლემის ფორმალური განცხადება

ნიმუშის ამოცნობა არის საწყისი მონაცემების მინიჭება გარკვეულ კლასზე არსებითი მახასიათებლების ხაზგასმით, რომლებიც ახასიათებს ამ მონაცემებს არაარსებითი მონაცემების მთლიანი მასიდან.

ამოცნობის პრობლემების დაყენებისას ისინი ცდილობენ გამოიყენონ მათემატიკური ენა, ცდილობენ, ხელოვნური ნერვული ქსელების თეორიისგან განსხვავებით, სადაც საფუძველია ექსპერიმენტით შედეგის მიღება, ექსპერიმენტი ჩაანაცვლონ ლოგიკური მსჯელობითა და მათემატიკური მტკიცებულებებით.

ყველაზე ხშირად, მონოქრომული გამოსახულებები განიხილება ნიმუშის ამოცნობის პრობლემებში, რაც შესაძლებელს ხდის გამოსახულების განხილვას, როგორც ფუნქციას თვითმფრინავზე. თუ განვიხილავთ სიბრტყეზე დაყენებულ წერტილს , სადაც ფუნქცია x(x,) გამოხატავს გამოსახულების თითოეულ წერტილში თავის მახასიათებელს - სიკაშკაშეს, გამჭვირვალობას, ოპტიკურ სიმკვრივეს, მაშინ ასეთი ფუნქცია გამოსახულების ფორმალური ჩანაწერია.

ყველა შესაძლო ფუნქციის ნაკრები x(x,) ზედაპირზე - არის ყველა სურათის ნაკრების მოდელი X. კონცეფციის გაცნობა მსგავსებასურათებს შორის შეგიძლიათ დააყენოთ ამოცნობის ამოცანა. ასეთი პარამეტრის სპეციფიკური ფორმა ძლიერ არის დამოკიდებული აღიარების შემდგომ ეტაპებზე ამა თუ იმ მიდგომის შესაბამისად.

ნიმუშის ამოცნობის მეთოდები

გამოსახულების ოპტიკური ამოცნობისთვის შეგიძლიათ გამოიყენოთ ობიექტის ტიპზე გამეორების მეთოდი სხვადასხვა კუთხით, მასშტაბებით, ოფსეტებით და ა.შ. ასოებისთვის, თქვენ უნდა გაიმეოროთ შრიფტი, შრიფტის თვისებები და ა.

მეორე მიდგომა არის ობიექტის კონტურის პოვნა და მისი თვისებების შემოწმება (დაკავშირება, კუთხეების არსებობა და ა.შ.)

კიდევ ერთი მიდგომაა ხელოვნური ნერვული ქსელების გამოყენება. ეს მეთოდი მოითხოვს ან ამოცნობის ამოცანის მაგალითების დიდ რაოდენობას (სწორი პასუხებით), ან სპეციალური ნერვული ქსელის სტრუქტურას, რომელიც ითვალისწინებს ამ ამოცანის სპეციფიკას.

პერცეპტრონი, როგორც ნიმუშის ამოცნობის მეთოდი

F. Rosenblatt, შემოგვთავაზეს ტვინის მოდელის კონცეფცია, რომლის ამოცანაა აჩვენოს, თუ როგორ შეიძლება წარმოიშვას ფსიქოლოგიური ფენომენი ზოგიერთ ფიზიკურ სისტემაში, რომლის სტრუქტურა და ფუნქციური თვისებები ცნობილია - აღწერილია უმარტივესი. დისკრიმინაციის ექსპერიმენტები. ეს ექსპერიმენტები მთლიანად დაკავშირებულია ნიმუშის ამოცნობის მეთოდებთან, მაგრამ განსხვავდება იმით, რომ ამოხსნის ალგორითმი არ არის დეტერმინისტული.

უმარტივესი ექსპერიმენტი, რომლის საფუძველზეც შესაძლებელია გარკვეული სისტემის შესახებ ფსიქოლოგიურად მნიშვნელოვანი ინფორმაციის მიღება, ემყარება იმ ფაქტს, რომ მოდელი წარმოდგენილია ორი განსხვავებული სტიმულით და მოეთხოვება მათზე რეაგირება სხვადასხვა გზით. ასეთი ექსპერიმენტის მიზანი შეიძლება იყოს სისტემის მიერ მათი სპონტანური დისკრიმინაციის შესაძლებლობის შესწავლა ექსპერიმენტატორის ჩარევის არარსებობის შემთხვევაში, ან, პირიქით, იძულებითი დისკრიმინაციის შესწავლა, რომელშიც ექსპერიმენტატორი ცდილობს ასწავლოს სისტემას განახორციელოს საჭირო კლასიფიკაცია.

სასწავლო ექსპერიმენტში პერცეპტრონი ჩვეულებრივ წარმოდგენილია გამოსახულების გარკვეული თანმიმდევრობით, რომელიც მოიცავს თითოეული კლასის წარმომადგენლებს, რომლებიც უნდა გამოირჩეოდნენ. მეხსიერების მოდიფიკაციის ზოგიერთი წესის მიხედვით, რეაქციის სწორი არჩევანი გამყარებულია. შემდეგ საკონტროლო სტიმული წარედგინება პერცეპტრონს და განისაზღვრება ამ კლასის სტიმულებზე სწორი პასუხის მიღების ალბათობა. დამოკიდებულია თუ არა შერჩეული საკონტროლო სტიმული ემთხვევა თუ არ ემთხვევა ერთ-ერთ სურათს, რომელიც გამოიყენებოდა სავარჯიშო თანმიმდევრობაში, მიიღება სხვადასხვა შედეგი:

  • 1. თუ საკონტროლო სტიმული არ ემთხვევა არცერთ სასწავლო სტიმულს, მაშინ ექსპერიმენტი ასოცირდება არა მხოლოდ სუფთა დისკრიმინაცია, მაგრამ ასევე მოიცავს ელემენტებს განზოგადებები.
  • 2. თუ საკონტროლო სტიმული აღაგზნებს სენსორული ელემენტების გარკვეულ კომპლექტს, რომლებიც სრულიად განსხვავდებიან იმ ელემენტებისაგან, რომლებიც გააქტიურდნენ იმავე კლასის ადრე წარმოდგენილი სტიმულის გავლენით, მაშინ ექსპერიმენტი არის კვლევა. სუფთა განზოგადება .

პერცეპტრონებს არ აქვთ სუფთა განზოგადების უნარი, მაგრამ ისინი საკმაოდ დამაკმაყოფილებლად ფუნქციონირებენ დისკრიმინაციის ექსპერიმენტებში, განსაკუთრებით იმ შემთხვევაში, თუ საკონტროლო სტიმული საკმარისად ემთხვევა ერთ-ერთ შაბლონს, რომლის შესახებაც პერცეპრონმა უკვე დაგროვდა გარკვეული გამოცდილება.

ნიმუშის ამოცნობის პრობლემების მაგალითები

  • ასოების ამოცნობა.
  • შტრიხკოდის ამოცნობა.
  • სანომრე ნიშნების ამოცნობა.
  • Სახის ამოცნობა.
  • Სიტყვის აღიარება.
  • გამოსახულების ამოცნობა.
  • დედამიწის ქერქის ადგილობრივი უბნების ამოცნობა, რომლებშიც მინერალური საბადოებია განთავსებული.

შაბლონების ამოცნობის პროგრამები

იხილეთ ასევე

შენიშვნები

ბმულები

  • იური ლიფშიცი. კურსი "თეორიული ინფორმატიკის თანამედროვე პრობლემები" - ლექციები ნიმუშის ამოცნობის სტატისტიკურ მეთოდებზე, სახის ამოცნობა, ტექსტის კლასიფიკაცია.
  • ჟურნალი ნიმუშის ამოცნობის კვლევის ჟურნალი (Journal of Pattern Recognition Research)

ლიტერატურა

  • დევიდ ა. ფორსიტი, ჟან პონსიკომპიუტერული ხედვა. თანამედროვე მიდგომა = კომპიუტერული ხედვა: თანამედროვე მიდგომა. - მ.: "უილიამსი", 2004. - S. 928. - ISBN 0-13-085198-1
  • ჯორჯ სტოკმანი, ლინდა შაპიროკომპიუტერული ხედვა = Computer Vision. - მ.: ბინომი. ცოდნის ლაბორატორია, 2006. - S. 752. - ISBN 5947743841
  • A.L. გორელიკი, V.A. სკრიპკინი, ამოცნობის მეთოდები, მ .: უმაღლესი სკოლა, 1989 წ.
  • შ.-კ. ჩენგივიზუალური საინფორმაციო სისტემების დიზაინის პრინციპები, მ.: მირი, 1994 წ.

ფონდი ვიკიმედია. 2010 წ.

- ტექნოლოგიაში, სამეცნიერო და ტექნიკური მიმართულება, რომელიც დაკავშირებულია მეთოდების შემუშავებასთან და სისტემების აგებასთან (მათ შორის კომპიუტერის ბაზაზე), რათა დადგინდეს ობიექტის (სუბიექტი, პროცესი, ფენომენი, სიტუაცია, სიგნალი) კუთვნილება ერთ-ერთზე. წინასწარი...... დიდი ენციკლოპედიური ლექსიკონი

ერთ-ერთი ახალი რეგიონი კიბერნეტიკა. რ-ის თეორიის შინაარსის შესახებ. არის რამდენიმე კლასს მიკუთვნებული ობიექტების (გამოსახულებების) თვისებების ექსტრაპოლაცია იმ ობიექტებზე, რომლებიც გარკვეული თვალსაზრისით ახლოს არიან მათთან. ჩვეულებრივ, როდესაც ასწავლის ავტომატს რ. იქ არის ... ... გეოლოგიური ენციკლოპედია

ინგლისური ამოცნობა, გამოსახულება; გერმანული გეშტალტ ალტერკენუნგ. მათემატიკური კიბერნეტიკის ფილიალი, რომელიც ავითარებს პრინციპებს და მეთოდებს ობიექტების კლასიფიკაციისა და იდენტიფიკაციისთვის, აღწერილი მახასიათებლების სასრული ნაკრებით, რომლებიც მათ ახასიათებს. ანტინაზი. ენციკლოპედია...... სოციოლოგიის ენციკლოპედია

ნიმუშის ამოცნობა- რთული ობიექტების შესწავლის მეთოდი კომპიუტერის დახმარებით; მოიცავს ფუნქციების შერჩევას და ალგორითმებისა და პროგრამების შემუშავებას, რაც კომპიუტერებს საშუალებას აძლევს ავტომატურად მოახდინოს ობიექტების კლასიფიკაცია ამ მახასიათებლების მიხედვით. მაგალითად, იმის დასადგენად, რომელი ... ... ეკონომიკური და მათემატიკური ლექსიკონი

- (ტექნიკური), მეცნიერული და ტექნიკური მიმართულება, რომელიც დაკავშირებულია მეთოდების შემუშავებასთან და სისტემების (მათ შორის კომპიუტერზე დაფუძნებული) მშენებლობასთან, რათა დადგინდეს ობიექტის (სუბიექტი, პროცესი, ფენომენი, სიტუაცია, სიგნალი) კუთვნილება ერთ-ერთზე. წინასწარ...... ენციკლოპედიური ლექსიკონი

ნიმუშის ამოცნობა- მათემატიკური კიბერნეტიკის განყოფილება, რომელიც ავითარებს მეთოდებს კლასიფიკაციისთვის, აგრეთვე ობიექტების, ფენომენების, პროცესების, სიგნალების, ყველა იმ ობიექტის სიტუაციების იდენტიფიცირებისთვის, რომლებიც შეიძლება აღწერილი იყოს გარკვეული მახასიათებლების ან თვისებების სასრული ნაკრებით, ... ... რუსული სოციოლოგიური ენციკლოპედია

ნიმუშის ამოცნობა- 160 შაბლონის ამოცნობა: ფორმის წარმოდგენებისა და კონფიგურაციების იდენტიფიცირება ავტომატური საშუალებების გამოყენებით

ამ სტატიაში მე შევეცადე ხაზი გავუსვა მანქანათმცოდნეობის თეორიის ზოგიერთ ფუნდამენტურ შედეგებს ისე, რომ ცნებები გასაგები გახადოს მკითხველებისთვის, რომლებიც გარკვეულწილად იცნობენ კლასიფიკაციისა და რეგრესიის პრობლემებს. ასეთი სტატიის დაწერის იდეა სულ უფრო და უფრო მკაფიოდ იჩენდა თავს ჩემს გონებაში ყოველ წაკითხულ წიგნთან ერთად, რომელშიც მანქანების ამოცნობის სწავლების იდეები ისე იყო გადმოცემული, თითქოს შუაში იყო და საერთოდ არ იყო გასაგები, რა ავტორები იყვნენ ამის შესახებ. ან ის მეთოდი, რომელსაც ეყრდნობოდა მისი შემუშავებისას. მეორეს მხრივ, არსებობს მრავალი წიგნი, რომელიც ეძღვნება მანქანური სწავლების ძირითად კონცეფციებს, მაგრამ მათში მასალის პრეზენტაცია შეიძლება ძალიან რთული ჩანდეს პირველი წაკითხვისთვის.

Მოტივაცია

განვიხილოთ ასეთი ამოცანა. გვაქვს ორი კლასის ვაშლი - გემრიელი და არა გემრიელი, 1 და 0. ვაშლებს აქვთ თვისებები - ფერი და ზომა. ფერი მუდმივად შეიცვლება 0-დან 1-მდე, ე.ი. 0 - მთლიანად მწვანე ვაშლი, 1 - მთლიანად წითელი. ზომა შეიძლება შეიცვალოს ანალოგიურად, 0 - პატარა ვაშლი, 1 - დიდი. ჩვენ გვსურს შევიმუშაოთ ალგორითმი, რომელიც შეყვანის სახით მიიღებს ფერს და ზომას და გამოსავალს მისცემს ვაშლის კლასს - გემრიელია თუ არა. ძალიან სასურველია, რომ შეცდომების რაოდენობა ამ შემთხვევაში იყოს რაც უფრო მცირე, მით უკეთესი. ამავდროულად, გვაქვს საბოლოო სია, რომელიც შეიცავს ისტორიულ მონაცემებს ვაშლის ფერის, ზომისა და კლასის შესახებ. როგორ მოვაგვარებდით ასეთ პრობლემას?

ლოგიკური მიდგომა

ჩვენი პრობლემის გადასაჭრელად, პირველი მეთოდი, რომელიც შეიძლება მოვიდეს გონებაში, შეიძლება იყოს ეს: მოდით, ხელით შევადგინოთ if-else ტიპის წესები და ფერისა და ზომის მნიშვნელობებიდან გამომდინარე, ვაშლს მივანიჭებთ გარკვეულ კლასს. იმათ. ჩვენ გვაქვს წინაპირობები - ეს არის ფერი და ზომა და არის შედეგი - ვაშლის გემო. სავსებით გონივრულია, როცა ნიშნები ცოტაა და შედარების ზღურბლები თვალით შეაფასო. მაგრამ შეიძლება მოხდეს ისე, რომ შეუძლებელი იყოს მკაფიო პირობების გამომუშავება და მონაცემებიდან არ ჩანს, რომელი ზღურბლები ავიღოთ და ფუნქციების რაოდენობა შეიძლება გაიზარდოს მომავალში. მაგრამ რა მოხდება, თუ ჩვენს სიაში ისტორიული მონაცემებით, აღმოვაჩინეთ ორი ერთი და იგივე ფერის და ზომის ვაშლი, მაგრამ ერთი მონიშნულია როგორც გემრიელი, ხოლო მეორე არა? ამრიგად, ჩვენი პირველი მეთოდი არ არის ისეთი მოქნილი და მასშტაბური, როგორც ჩვენ გვსურს.

აღნიშვნა

შემოვიღოთ შემდეგი აღნიშვნა. მე-ე ვაშლს აღვნიშნავთ როგორც . თავის მხრივ, თითოეული შედგება ორი ნომრისგან - ფერი და ზომა. ამ ფაქტს აღვნიშნავთ რიცხვების წყვილით: . ყოველი ვაშლის კლასს აღვნიშნავთ როგორც . სია ისტორიული მონაცემებით აღინიშნა ასოთი , ამ სიის სიგრძე უდრის . ამ სიის th ელემენტია ვაშლის და მისი კლასის ატრიბუტის მნიშვნელობა. იმათ. . ნიმუშსაც დავარქმევთ. დიდი ასოებით და ჩვენ აღვნიშნავთ ცვლადებს, რომლებსაც შეუძლიათ მიიღონ კონკრეტული მახასიათებლისა და კლასის მნიშვნელობები. ჩვენ შემოგთავაზებთ ახალ კონცეფციას - გადაწყვეტილების წესი არის ფუნქცია, რომელიც იღებს ფერისა და ზომის მნიშვნელობას შეყვანის სახით და აბრუნებს კლასის ეტიკეტს, როგორც გამომავალს:

სავარაუდო მიდგომა

ლოგიკური მეთოდის იდეის შემუშავებისას საფუძვლებითა და შედეგებით, დავუსვათ საკუთარ თავს კითხვა - რა არის ალბათობა იმისა, რომ მე-ე ვაშლი, რომელიც არ ეკუთვნის ჩვენს ნიმუშს, გემრიელი იყოს გაზომილი მნიშვნელობების გათვალისწინებით. ფერის და ზომის? ალბათობის თეორიის აღნიშვნაში ეს კითხვა შეიძლება დაიწეროს შემდეგნაირად:

ამ გამოთქმაში ის შეიძლება განიმარტოს როგორც წინაპირობა, როგორც შედეგი, მაგრამ წინაპირობიდან შედეგზე გადასვლა დაემორჩილება ალბათურ კანონებს და არა ლოგიკურს. იმათ. კლასისთვის 0 და 1 ლოგიკური მნიშვნელობებით ჭეშმარიტების ცხრილის ნაცვლად, იქნება ალბათობის მნიშვნელობები, რომლებიც იღებენ მნიშვნელობებს 0-დან 1-მდე. გამოიყენეთ Bayes-ის ფორმულა და მიიღეთ შემდეგი გამოხატულება:

მოდით განვიხილოთ ამ გამოთქმის მარჯვენა მხარე უფრო დეტალურად. მულტიპლიკატორს წინასწარი ალბათობა ეწოდება და ნიშნავს ყველა შესაძლო ვაშლს შორის გემრიელი ვაშლის პოვნის ალბათობას. უგემოვნო ვაშლთან შეხვედრის აპრიორი ალბათობაა. ეს ალბათობა შეიძლება ასახავდეს ჩვენს პირად ცოდნას იმის შესახებ, თუ როგორ არის განაწილებული კარგი და ცუდი ვაშლები ბუნებაში. მაგალითად, ჩვენი წარსული გამოცდილებიდან ვიცით, რომ ყველა ვაშლის 80% გემრიელია. ან ჩვენ შეგვიძლია შევაფასოთ ეს მნიშვნელობა უბრალოდ ჩვენს სიაში გემრიელი ვაშლების წილის დათვლით ისტორიული მონაცემებით S. შემდეგი მულტიპლიკატორი გვიჩვენებს, რამდენად სავარაუდოა 1 კლასის ვაშლისთვის კონკრეტული ფერისა და ზომის მნიშვნელობის მიღება. ამ გამოთქმას ასევე უწოდებენ ალბათობის ფუნქცია და შეიძლება იყოს რაიმე კონკრეტული განაწილების სახით, მაგალითად, ნორმალური. ჩვენ ვიყენებთ მნიშვნელს ნორმალიზაციის მუდმივად ისე, რომ სასურველი ალბათობა მერყეობს 0-დან 1-მდე. ჩვენი საბოლოო მიზანია არა ალბათობების პოვნა, არამედ გადაწყვეტილების წესის პოვნა, რომელიც დაუყოვნებლივ მოგვცემს კლასს. გადაწყვეტილების წესის საბოლოო ფორმა დამოკიდებულია იმაზე, თუ რა მნიშვნელობები და პარამეტრები ვიცით. მაგალითად, ჩვენ შეგვიძლია ვიცოდეთ მხოლოდ წინასწარი ალბათობის მნიშვნელობები, ხოლო დანარჩენი მნიშვნელობების შეფასება შეუძლებელია. მაშინ გადამწყვეტი წესი იქნება ასეთი - ყველა ვაშლს მივანიჭებთ იმ კლასის მნიშვნელობას, რომლისთვისაც აპრიორი ალბათობა უდიდესია. იმათ. თუ ვიცით, რომ ბუნებაში არსებული ვაშლების 80% გემრიელია, მაშინ თითოეულ ვაშლს ვაძლევთ 1 კლასს. მაშინ ჩვენი შეცდომა იქნება 20%. თუ ჩვენ შეგვიძლია ასევე შევაფასოთ ალბათობის ფუნქციის მნიშვნელობები $p(X=x_m | Y=1)$, მაშინ ჩვენ შეგვიძლია ვიპოვოთ სასურველი ალბათობის მნიშვნელობა ბეიზის ფორმულის გამოყენებით, როგორც ზემოთ დაწერილია. აქ გადაწყვეტილების წესი იქნება შემდეგი: დააყენეთ კლასის ეტიკეტი, რომლის ალბათობაც მაქსიმალურია:

ჩვენ ამ წესს დავარქმევთ ბაიესის კლასიფიკატორს. ვინაიდან საქმე გვაქვს ალბათობებთან, ალბათობის დიდი მნიშვნელობაც კი არ იძლევა გარანტიას, რომ ვაშლი არ მიეკუთვნება 0 კლასს. მოდით შევაფასოთ ვაშლის შეცდომის ალბათობა შემდეგნაირად: თუ გადაწყვეტილების წესი დააბრუნებს კლასის მნიშვნელობას 1-ის ტოლი, მაშინ შეცდომის ალბათობა იქნება და პირიქით:

ჩვენ გვაინტერესებს კლასიფიკატორის შეცდომის ალბათობა არა მხოლოდ ამ კონკრეტულ მაგალითში, არამედ ზოგადად ყველა შესაძლო ვაშლისთვის:

ეს გამოთქმა არის შეცდომის მათემატიკური მოლოდინი. ასე რომ, თავდაპირველი პრობლემის გადაჭრით, მივედით ბაიესის კლასიფიკატორამდე, მაგრამ რა არის მისი უარყოფითი მხარეები? მთავარი პრობლემა არის პირობითი ალბათობის შეფასება მონაცემებიდან. ჩვენს შემთხვევაში, ჩვენ წარმოვადგენთ ობიექტს, როგორც რიცხვების წყვილს - ფერს და ზომას, მაგრამ უფრო რთულ ამოცანებში, მახასიათებლების განზომილება შეიძლება ბევრჯერ მეტი იყოს და ჩვენი სიიდან ისტორიული მონაცემებით დაკვირვებების რაოდენობა შეიძლება არ იყოს საკმარისი. შეაფასეთ მრავალგანზომილებიანი შემთხვევითი ცვლადის ალბათობა. შემდეგი, ჩვენ შევეცდებით განვაზოგადოთ ჩვენი კონცეფცია კლასიფიკატორის შეცდომის შესახებ და ასევე ვნახოთ შესაძლებელია თუ არა რაიმე სხვა კლასიფიკატორის არჩევა პრობლემის გადასაჭრელად.

დანაკარგები კლასიფიკატორის შეცდომების გამო

დავუშვათ, ჩვენ უკვე გვაქვს გადაწყვეტილების გარკვეული წესი. შემდეგ მას შეუძლია დაუშვას ორი ტიპის შეცდომა - პირველი არის ობიექტის მინიჭება კლასში 0, რომელსაც აქვს რეალური კლასი 1, და პირიქით, ობიექტის მინიჭება 1 კლასს, რომელსაც აქვს რეალური კლასი 0. ზოგიერთში. ამოცანები, შეიძლება მნიშვნელოვანი იყოს ამ შემთხვევების განსხვავება. მაგალითად, ჩვენ უფრო მეტად ვიტანჯებით იმით, რომ გემრიელი ვაშლი უგემური აღმოჩნდა და პირიქით. ჩვენ ფორმალურად ვაფორმებთ ჩვენი დისკომფორტის ხარისხს მოტყუებული მოლოდინების კონცეფციაში.უფრო ზოგადად, გვაქვს დაკარგვის ფუნქცია, რომელიც აბრუნებს რიცხვს თითოეული კლასიფიკატორის შეცდომისთვის. მოდით იყოს ნამდვილი კლასის იარლიყი. დანაკარგის ფუნქცია შემდეგ აბრუნებს ზარალის მნიშვნელობას რეალური კლასის ეტიკეტისთვის და ჩვენი გადაწყვეტილების წესის მნიშვნელობას. ამ ფუნქციის გამოყენების მაგალითი - ვიღებთ ვაშლიდან ცნობილი კლასით, ვაშლს გადავცემთ ჩვენი გადაწყვეტილების წესის შეყვანას, კლასის შეფასებას ვიღებთ გადაწყვეტილების წესიდან, თუ მნიშვნელობები და ემთხვევა , მაშინ მიგვაჩნია, რომ კლასიფიკატორი არ შეცდა და არ არის დანაკარგები, თუ მნიშვნელობები არ ემთხვევა, მაშინ დანაკარგების რაოდენობას იტყვის ჩვენი ფუნქცია

პირობითი და ბაიესის რისკი

ახლა, როცა გვაქვს დაკარგვის ფუნქცია და ვიცით რამდენს ვკარგავთ ობიექტების არასწორი კლასიფიკაციის შედეგად, კარგი იქნება გავიგოთ რამდენს ვკარგავთ საშუალოდ ბევრ ობიექტზე. თუ ჩვენ ვიცით მნიშვნელობა - ალბათობა იმისა, რომ მე-ე ვაშლი გემრიელი იქნება, თუ გავითვალისწინებთ ფერისა და ზომის გაზომილი მნიშვნელობებს, ასევე კლასის რეალურ მნიშვნელობას (მაგალითად, აიღეთ ვაშლი S ნიმუშიდან, იხილეთ სტატიის დასაწყისში), შემდეგ შეგვიძლია შემოგთავაზოთ პირობითი რისკის კონცეფცია. პირობითი რისკი არის დანაკარგების საშუალო მნიშვნელობა დაწესებულებაში გადაწყვეტილების წესისთვის:

ჩვენს ორობითი კლასიფიკაციის შემთხვევაში, როდესაც გამოდის:

ზემოთ, ჩვენ აღვწერეთ გადაწყვეტილების წესი, რომელიც ანიჭებს ობიექტს იმ კლასს, რომელსაც აქვს ყველაზე მაღალი ალბათობის მნიშვნელობა. ასეთი წესი აწვდის მინიმუმს ჩვენს საშუალო დანაკარგებს (ბაიესის რისკი), ასე რომ, ბაიესის კლასიფიკატორი ოპტიმალურია რისკის ფუნქციონალური ჩვენ მიერ შემოღებული. . ეს ნიშნავს, რომ ბაიესის კლასიფიკატორს აქვს ყველაზე მცირე შესაძლო კლასიფიკაციის შეცდომა.

ზოგიერთი ტიპიური დაკარგვის ფუნქცია

დაკარგვის ერთ-ერთი ყველაზე გავრცელებული ფუნქციაა სიმეტრიული ფუნქცია, როდესაც პირველი და მეორე ტიპის შეცდომების დანაკარგები ექვივალენტურია. მაგალითად, 1-0 დანაკარგის ფუნქცია (ნულ-ერთი დანაკარგი) განისაზღვრება შემდეგნაირად:

მაშინ პირობითი რისკი a(x) = 1-ისთვის უბრალოდ იქნება ობიექტზე 0 კლასის მიღების ალბათობის მნიშვნელობა:

ანალოგიურად a(x) = 0-ისთვის:

1-0 დაკარგვის ფუნქცია იღებს 1 მნიშვნელობას, თუ კლასიფიკატორი უშვებს შეცდომას ობიექტზე და 0-ს, თუ არა. ახლა მოდით გავაკეთოთ ისე, რომ შეცდომის მნიშვნელობა იყოს არა 1, არამედ სხვა ფუნქცია Q, რაც დამოკიდებულია გადაწყვეტილების წესზე და რეალური კლასის ეტიკეტზე:

მაშინ პირობითი რისკი შეიძლება ჩაიწეროს შემდეგნაირად:

შენიშვნები ნოტაციის შესახებ

წინა ტექსტი დაიწერა დუდასა და ჰარტის მიერ წიგნში მიღებული აღნიშვნის მიხედვით. ორიგინალურ წიგნში V.N. ვაპნიკმა განიხილა ასეთი პროცესი: ბუნება ირჩევს ობიექტს $p(x)$ განაწილების მიხედვით, შემდეგ კი მას ანიჭებს კლასის ეტიკეტს $p(y|x)$-ის პირობითი განაწილების მიხედვით. მაშინ რისკი (ზარალის მოლოდინი) განისაზღვრება, როგორც

სად არის ფუნქცია, რომლითაც ჩვენ ვცდილობთ უცნობი დამოკიდებულების მიახლოებას, არის ზარალის ფუნქცია რეალური მნიშვნელობისთვის და ჩვენი ფუნქციის მნიშვნელობა. ეს აღნიშვნა უფრო აღწერითია, რათა შემოვიტანოთ შემდეგი კონცეფცია - ემპირიული რისკი.

ემპირიული რისკი

ამ ეტაპზე ჩვენ უკვე გავარკვიეთ, რომ ლოგიკური მეთოდი ჩვენთვის არ არის შესაფერისი, რადგან ის არ არის საკმარისად მოქნილი და ჩვენ არ შეგვიძლია გამოვიყენოთ ბაიესის კლასიფიკატორი, როდესაც ბევრი მახასიათებელია და არის შეზღუდული რაოდენობის მონაცემები ვარჯიშისთვის. და ჩვენ ვერ აღვადგენთ ალბათობას. ჩვენ ასევე ვიცით, რომ ბაიესის კლასიფიკატორს აქვს ყველაზე მცირე შესაძლო კლასიფიკაციის შეცდომა. ვინაიდან ჩვენ არ შეგვიძლია გამოვიყენოთ ბაიესის კლასიფიკატორი, ავიღოთ უფრო მარტივი. დავაფიქსიროთ H ფუნქციების რამდენიმე პარამეტრული ოჯახი და ავირჩიოთ კლასიფიკატორი ამ ოჯახიდან.

მაგალითი: დაუშვით ფორმის ყველა ფუნქციის სიმრავლე

ამ კომპლექტის ყველა ფუნქცია ერთმანეთისგან განსხვავდება მხოლოდ კოეფიციენტებით.როდესაც ჩვენ ავირჩევდით ასეთ ოჯახს, ვივარაუდეთ, რომ ფერის ზომის კოორდინატებში 1 კლასისა და 0 კლასის წერტილებს შორის შეგვიძლია გავავლოთ სწორი ხაზი კოეფიციენტებით ასეთ სხვადასხვა კლასის წერტილები განლაგებულია სწორი ხაზის მოპირდაპირე მხარეს. ცნობილია, რომ ამ ტიპის სწორი ხაზისთვის, კოეფიციენტების ვექტორი არის ნორმალური სწორი ხაზისთვის. ახლა ასე ვაკეთებთ - ვიღებთ ჩვენს ვაშლს, გავზომავთ მის ფერს და ზომას და მიღებული კოორდინატებით გამოვსახავთ წერტილს გრაფიკზე ფერის ზომის ღერძებში. შემდეგი, ჩვენ გავზომავთ კუთხეს ამ წერტილსა და ვექტორს $w$ შორის. ჩვენ აღვნიშნავთ, რომ ჩვენი წერტილი შეიძლება იყოს ხაზის ერთ მხარეს ან მეორე მხარეს. მაშინ კუთხე და წერტილს შორის იქნება მკვეთრი ან ბლაგვი, ხოლო სკალარული პროდუქტი არის დადებითი ან უარყოფითი. აქ მოდის გადაწყვეტილების წესი:

მას შემდეგ რაც დავაფიქსირეთ $H$ ფუნქციების კლასი, ჩნდება კითხვა - როგორ ავირჩიოთ მისგან ფუნქცია საჭირო კოეფიციენტებით? პასუხი არის - მოდით ავირჩიოთ ფუნქცია, რომელიც აწვდის მინიმუმს ჩვენს ბაიესიან რისკს $R()$. ისევ და ისევ, პრობლემა ის არის, რომ ბაიესის რისკის მნიშვნელობების გამოსათვლელად, თქვენ უნდა იცოდეთ $p(x,y)$ განაწილება, მაგრამ ის არ გვეძლევა და ყოველთვის არ არის შესაძლებელი მისი აღდგენა. ის. კიდევ ერთი იდეაა რისკის მინიმუმამდე შემცირება არა ყველა შესაძლო ობიექტზე, არამედ მხოლოდ ნიმუშზე. იმათ. ფუნქციის მინიმუმამდე შემცირება:

ამ ფუნქციას ემპირიული რისკი ეწოდება. შემდეგი კითხვა არის რატომ გადავწყვიტეთ, რომ ემპირიული რისკის მინიმიზაციის გზით, ჩვენ ასევე მინიმუმამდე დავაყენებთ ბაიესის რისკს? შეგახსენებთ, რომ ჩვენი პრაქტიკული ამოცანაა რაც შეიძლება ნაკლები კლასიფიკაციის შეცდომები დავუშვათ. რაც ნაკლებია შეცდომა, მით უფრო დაბალია ბაიესის რისკი. ბაიესიანთან ემპირიული რისკის კონვერგენციის დასაბუთება მონაცემთა მოცულობის მატებასთან ერთად მიიღო 70-იან წლებში ორმა მეცნიერმა - V.N. Vapnik და A. Ya.Chervonenkis.

კონვერგენციის გარანტიები. უმარტივესი შემთხვევა

ასე რომ, მივედით დასკვნამდე, რომ ბაიესის კლასიფიკატორი იძლევა უმცირეს შესაძლო შეცდომას, მაგრამ უმეტეს შემთხვევაში მას ვერ ვავარჯიშებთ და ვერც ცდომილებას (რისკს) გამოვთვლით. თუმცა, ჩვენ შეგვიძლია გამოვთვალოთ მიახლოება ბაიესის რისკთან, რომელსაც ემპირიულ რისკს უწოდებენ და ემპირიული რისკის ცოდნით, ავირჩიოთ მიახლოებითი ფუნქცია, რომელიც მინიმუმამდე დააყენებს ემპირიულ რისკს. მოდით განვიხილოთ უმარტივესი სიტუაცია, როდესაც ემპირიული რისკის მინიმიზაცია იძლევა კლასიფიკატორს, რომელიც ასევე ამცირებს ბაიესის რისკს. უმარტივესი შემთხვევისთვის მოგვიწევს ვარაუდის გაკეთება, რომელიც პრაქტიკაში იშვიათად სრულდება, მაგრამ მოგვიანებით შეიძლება შესუსტდეს. ჩვენ ვაფიქსირებთ ფუნქციების სასრულ კლასს, საიდანაც ავირჩევთ ჩვენს კლასიფიკატორს და ვივარაუდებთ, რომ რეალური ფუნქცია, რომელსაც ბუნება იყენებს ჩვენი ვაშლების გემოვნების აღსანიშნავად, არის ჰიპოთეზების ამ სასრულ კომპლექტში: . ჩვენ ასევე გვაქვს ობიექტებზე განაწილების შედეგად მიღებული ნიმუში. ყველა ნიმუშის ობიექტი განიხილება თანაბრად დამოუკიდებლად განაწილებულად (iid). მაშინ შემდეგი იქნება სიმართლე

თეორემა

კლასიდან ფუნქციის არჩევით ემპირიული რისკის მინიმიზაციის გამოყენებით, ჩვენ გარანტირებულად ვიპოვით ისეთს, რომელსაც აქვს ბაიესის რისკის მცირე მნიშვნელობა, თუ ნიმუში, რომელზედაც ვამცირებთ, არის საკმარისი ზომის.

"მცირე ღირებულებისა" და "საკმარისი ზომის" მნიშვნელობისთვის იხილეთ ლიტერატურა ქვემოთ.

მტკიცების იდეა

თეორემის პირობით ვიღებთ ნიმუშს განაწილებიდან, ე.ი. ბუნებიდან ობიექტების შერჩევის პროცესი შემთხვევითია. ყოველ ჯერზე, როდესაც ჩვენ ვაგროვებთ ნიმუშს, ის იქნება ერთი და იგივე განაწილებიდან, მაგრამ თავად ობიექტები მასში შეიძლება განსხვავდებოდეს. მტკიცებულების მთავარი იდეა არის ის, რომ ჩვენ შეგვიძლია მივიღოთ ისეთი სამწუხარო ნიმუში, რომ ალგორითმი, რომელსაც ჩვენ ვირჩევთ მოცემულ ნიმუშზე ემპირიული რისკის მინიმიზაციის გზით, ცუდი იქნება ბაიესის რისკის მინიმუმამდე შემცირებაში, მაგრამ ამავე დროს კარგი იქნება. ემპირიული რისკის შესამცირებლად, მაგრამ ასეთი ნიმუშის მიღების ალბათობა მცირეა და ნიმუშის ზომის გაზრდა, ეს ალბათობა მცირდება. მსგავსი თეორემები არსებობს უფრო რეალისტური ვარაუდებისთვის, მაგრამ ჩვენ მათ აქ არ განვიხილავთ.

პრაქტიკული შედეგები

იმის მტკიცებულება, რომ ემპირიული რისკის შემცირებით აღმოჩენილ ფუნქციას არ ექნება დიდი შეცდომა ადრე დაუკვირვებელ მონაცემებზე სავარჯიშო ნიმუშის საკმარისი ზომით, ჩვენ შეგვიძლია გამოვიყენოთ ეს პრინციპი პრაქტიკაში, მაგალითად, შემდეგნაირად - ვიღებთ გამოთქმას:

და ჩვენ ვცვლით დაკარგვის სხვადასხვა ფუნქციებს, მოგვარებული პრობლემის მიხედვით. წრფივი რეგრესიისთვის:

ლოგისტიკური რეგრესიისთვის:

მიუხედავად იმისა, რომ დამხმარე ვექტორული მანქანები ძირითადად მოტივირებულია გეომეტრიით, ისინი ასევე შეიძლება ჩაითვალოს რისკის მინიმიზაციის ემპირიულ პრობლემებად.

დასკვნა

მეთვალყურეობის ქვეშ მყოფი სწავლების მრავალი მეთოდი შეიძლება ჩაითვალოს, სხვა საკითხებთან ერთად, როგორც V. N. Vapnik-ისა და A. Ya. Chervonenkis-ის მიერ შემუშავებული თეორიის განსაკუთრებული შემთხვევები. ეს თეორია იძლევა გარანტიებს ტესტის კომპლექტში შეცდომის შესახებ, იმ პირობით, რომ არსებობს სავარჯიშო ნაკრების საკმარისი ზომა და გარკვეული მოთხოვნები ჰიპოთეზის სივრცისთვის, რომელშიც ჩვენ ვეძებთ ჩვენს ალგორითმს.

მეორადი წიგნები

  • სტატისტიკური სწავლის თეორიის ბუნება, ვლადიმერ ნ. ვაპნიკი
  • შაბლონების კლასიფიკაცია, მე-2 გამოცემა, რიჩარდ ო. დუდა, პიტერ ე. ჰარტი, დევიდ გ. სტორკი
  • მანქანური სწავლის გაგება: თეორიიდან ალგორითმებამდე, შაი შალევ-შვარცი, შაი ბენ-დავიდი
P.S. გთხოვთ დაწეროთ პირადში ყველა უზუსტობისა და შეცდომაზე

ტეგები: ტეგების დამატება

თავი 3: ნიმუშის ამოცნობისა და გადაწყვეტილების მიღების მეთოდების ანალიტიკური მიმოხილვა

ნიმუშის ამოცნობის თეორია და კონტროლის ავტომატიზაცია

ადაპტური ნიმუშის ამოცნობის ძირითადი ამოცანები

ამოცნობა არის ინფორმაციის პროცესი, რომელსაც ახორციელებს ზოგიერთი ინფორმაციის გადამყვანი (ინტელექტუალური საინფორმაციო არხი, ამოცნობის სისტემა), რომელსაც აქვს შემავალი და გამომავალი. სისტემის შეყვანა არის ინფორმაცია იმის შესახებ, თუ რა მახასიათებლები აქვთ წარმოდგენილი ობიექტებს. სისტემის გამომავალი აჩვენებს ინფორმაციას, თუ რომელ კლასებს (განზოგადებულ სურათებს) ენიჭება ცნობადი ობიექტები.

ავტომატური ნიმუშის ამოცნობის სისტემის შექმნისა და მუშაობისას, წყდება მთელი რიგი ამოცანები. მოდით მოკლედ და მარტივად განვიხილოთ ეს ამოცანები. გაითვალისწინეთ, რომ ამ ამოცანების ფორმულირებები და თავად ნაკრები არ ემთხვევა სხვადასხვა ავტორს, რადგან გარკვეულწილად ეს დამოკიდებულია კონკრეტულ მათემატიკურ მოდელზე, რომელზედაც დაფუძნებულია ამა თუ იმ ამოცნობის სისტემა. გარდა ამისა, ამოცნობის გარკვეულ მოდელებში ზოგიერთ ამოცანას არ აქვს გამოსავალი და, შესაბამისად, არ არის დასმული.

საგნის არეალის ფორმალიზების ამოცანა

სინამდვილეში, ეს ამოცანა კოდირების ამოცანაა. შედგენილია განზოგადებული კლასების სია, რომელიც შეიძლება მოიცავდეს ობიექტების სპეციფიკურ იმპლემენტაციას, ასევე იმ მახასიათებლების ჩამონათვალს, რომლებიც ამ ობიექტებს, პრინციპში, შეიძლება ჰქონდეთ.

სასწავლო ნიმუშის ფორმირების ამოცანა

ტრენინგის ნიმუში არის მონაცემთა ბაზა, რომელიც შეიცავს ობიექტების სპეციფიკური განხორციელების აღწერილობებს მხატვრული ენაზე და დამატებულია ინფორმაცია ამ ობიექტების კუთვნილების შესახებ გარკვეული ამოცნობის კლასებში.

ამოცნობის სისტემის მომზადების ამოცანა

სასწავლო ნიმუში გამოიყენება ამომცნობი კლასების განზოგადებული გამოსახულებების შესაქმნელად, ინფორმაციის განზოგადების საფუძველზე იმის შესახებ, თუ რა თვისებები აქვთ სასწავლო ნიმუშის ობიექტებს, რომლებიც მიეკუთვნება ამ კლასს და სხვა კლასებს.

ფუნქციური სივრცის განზომილების შემცირების პრობლემა

ამოცნობის სისტემის სწავლების შემდეგ (კლასების მიხედვით მახასიათებლების სიხშირეების განაწილების სტატისტიკის მოპოვება) შესაძლებელი ხდება თითოეული მახასიათებლისთვის მისი მნიშვნელობის დადგენა ამოცნობის პრობლემის გადასაჭრელად. ამის შემდეგ, ყველაზე ნაკლებად ღირებული ფუნქციების ამოღება შესაძლებელია ფუნქციური სისტემიდან. შემდეგ ამოცნობის სისტემა უნდა გადაიხედოს, რადგან ზოგიერთი მახასიათებლის მოხსნის შედეგად იცვლება დარჩენილი მახასიათებლების განაწილების სტატისტიკა კლასების მიხედვით. ეს პროცესი შეიძლება განმეორდეს, ე.ი. იყოს განმეორებადი.

ამოცნობის დავალება

აღიარებულია ცნობადი ნიმუშის ობიექტები, რომლებიც, კერძოდ, შეიძლება შედგებოდეს ერთი ობიექტისგან. ცნობადი ნიმუში იქმნება ტრენინგის მსგავსად, მაგრამ არ შეიცავს ინფორმაციას კლასების ობიექტების კუთვნილების შესახებ, რადგან ეს არის ზუსტად ის, რაც განისაზღვრება ამოცნობის პროცესში. თითოეული ობიექტის ამოცნობის შედეგი არის ყველა ამომცნობი კლასის განაწილება ან სია მათთან აღიარებული ობიექტის მსგავსების ხარისხის კლებადობით.

ამოცნობის ხარისხის კონტროლის ამოცანა

აღიარების შემდეგ შეიძლება დადგინდეს მისი ადეკვატურობა. სასწავლო ნიმუშის ობიექტებისთვის ეს შეიძლება გაკეთდეს დაუყოვნებლივ, რადგან მათთვის უბრალოდ ცნობილია, რომელ კლასებს მიეკუთვნებიან. სხვა ობიექტებისთვის, ეს ინფორმაცია შეიძლება მოგვიანებით მიიღოთ. ნებისმიერ შემთხვევაში, შეიძლება განისაზღვროს ფაქტობრივი საშუალო შეცდომის ალბათობა ყველა ამოცნობის კლასისთვის, ისევე როგორც შეცდომის ალბათობა, როდესაც აღიარებული ობიექტის მინიჭება ხდება კონკრეტულ კლასზე.

აღიარების შედეგების ინტერპრეტაცია უნდა მოხდეს აღიარების ხარისხის შესახებ არსებული ინფორმაციის გათვალისწინებით.

ადაპტაციის დავალება

თუ ხარისხის კონტროლის პროცედურის შედეგად დადგინდა, რომ ის არადამაკმაყოფილებელია, მაშინ არასწორად აღიარებული ობიექტების აღწერილობები შეიძლება გადაიწეროს ცნობადი ნიმუშიდან სასწავლო ნიმუშზე, დაემატოს ადეკვატური კლასიფიკაციის ინფორმაცია და გამოიყენოს გადაწყვეტილების შესაცვლელად. წესები, ე.ი. გათვალისწინებულია. უფრო მეტიც, თუ ეს ობიექტები არ მიეკუთვნება უკვე არსებულ ამოცნობის კლასებს, რაც შეიძლება იყოს მათი არასწორი ამოცნობის მიზეზი, მაშინ ეს სია შეიძლება გაფართოვდეს. შედეგად, ამოცნობის სისტემა ადაპტირდება და იწყებს ამ ობიექტების ადექვატურ კლასიფიკაციას.

ინვერსიული ამოცნობის პრობლემა

ამოცნობის ამოცანაა, რომ მოცემული ობიექტისთვის, მისი ცნობილი მახასიათებლების მიხედვით, სისტემა ადგენს მის კუთვნილებას რაიმე ადრე უცნობ კლასს. საპირისპირო ამოცნობის პრობლემაში, პირიქით, ამოცნობის მოცემული კლასისთვის, სისტემა ადგენს, რომელი მახასიათებლებია ყველაზე დამახასიათებელი ამ კლასის ობიექტებისთვის და რომელი არა (ან სასწავლო ნიმუშის რომელი ობიექტები ეკუთვნის ამ კლასს).

კლასტერული და კონსტრუქციული ანალიზის ამოცანები

კლასტერები არის ობიექტების, კლასების ან მახასიათებლების ისეთი ჯგუფები, რომ თითოეულ კლასტერში ისინი მაქსიმალურად მსგავსია, ხოლო სხვადასხვა კლასტერებს შორის ისინი მაქსიმალურად განსხვავდებიან.

კონსტრუქცია (ამ განყოფილებაში განხილულ კონტექსტში) არის საპირისპირო კლასტერების სისტემა. ამრიგად, გარკვეული გაგებით, კონსტრუქტები არის კლასტერების კლასტერული ანალიზის შედეგი.

კლასტერული ანალიზის დროს რაოდენობრივად იზომება ობიექტების (კლასები, მახასიათებლები) მსგავსებისა და განსხვავების ხარისხი და ეს ინფორმაცია გამოიყენება კლასიფიკაციისთვის. კასეტური ანალიზის შედეგი არის ობიექტების კლასიფიკაცია კლასტერების მიხედვით. ეს კლასიფიკაცია შეიძლება წარმოდგენილი იყოს სემანტიკური ქსელების სახით.

კოგნიტური ანალიზის ამოცანა

კოგნიტურ ანალიზში ინფორმაცია კლასების ან მახასიათებლების მსგავსებისა და განსხვავების შესახებ მკვლევარისთვის თავისთავად საინტერესოა და არა იმისთვის, რომ გამოიყენოს იგი კლასიფიკაციისთვის, როგორც კლასტერულ და კონსტრუქციულ ანალიზში.

თუ ორი კლასის აღიარება ხასიათდება ერთი და იგივე თვისებით, მაშინ ეს ხელს უწყობს ამ ორი კლასის მსგავსებას. თუ რომელიმე კლასისთვის ეს მახასიათებელი არ არის დამახასიათებელი, მაშინ ეს ხელს უწყობს განსხვავებას.

თუ ორი ნიშანი ერთმანეთთან კორელაციაშია, მაშინ გარკვეული გაგებით ისინი შეიძლება ჩაითვალოს ერთ ნიშად, ხოლო თუ ანტიკორელაციურია, მაშინ განსხვავებულად. ამ გარემოების გათვალისწინებით, მათ მსგავსებასა და განსხვავებაში გარკვეული წვლილი შეაქვს სხვადასხვა კლასში სხვადასხვა მახასიათებლის არსებობასაც.

კოგნიტური ანალიზის შედეგები შეიძლება წარმოდგენილი იყოს კოგნიტური დიაგრამების სახით.

ნიმუშის ამოცნობის მეთოდები და მათი მახასიათებლები

ნიმუშების ამოცნობის მეთოდების კლასიფიკაციის პრინციპები

ნიმუშის ამოცნობა არის ფორმალური ოპერაციების აგება და გამოყენება რეალური ან იდეალური სამყაროს ობიექტების რიცხვით ან სიმბოლურ წარმოდგენაზე, რომლის ამოხსნის შედეგები ასახავს ამ ობიექტებს შორის ეკვივალენტურ ურთიერთობებს. ეკვივალენტურობის მიმართებები გამოხატავს შეფასებული ობიექტების კუთვნილებას ზოგიერთ კლასს, განიხილება როგორც დამოუკიდებელი სემანტიკური ერთეულები.

ამოცნობის ალგორითმების აგებისას, ეკვივალენტურობის კლასები შეიძლება დააწესოს მკვლევარმა, რომელიც იყენებს საკუთარ აზრობრივ იდეებს ან იყენებს გარე დამატებით ინფორმაციას ობიექტების მსგავსებისა და განსხვავებების შესახებ მოგვარებული პრობლემის კონტექსტში. მერე საუბარია „მასწავლებელთან აღიარებაზე“. წინააღმდეგ შემთხვევაში, ე.ი. როდესაც ავტომატური სისტემა აგვარებს კლასიფიკაციის პრობლემას გარე სასწავლო ინფორმაციის ჩართვის გარეშე, საუბარია ავტომატურ კლასიფიკაციაზე ან „უკონტროლო აღიარებაზე“. შაბლონების ამოცნობის ალგორითმების უმეტესობა მოითხოვს ძალიან მნიშვნელოვან გამოთვლით ძალას, რაც შეიძლება უზრუნველყოფილი იყოს მხოლოდ მაღალი ხარისხის კომპიუტერული ტექნოლოგიით.

სხვადასხვა ავტორები (იუ.ლ. ბარაბაში, ვ.ი. ვასილიევი, ა. K. Fu, Ya. Z. Tsypkin და სხვები) იძლევა ნიმუშის ამოცნობის მეთოდების განსხვავებულ ტიპოლოგიას. ზოგიერთი ავტორი განასხვავებს პარამეტრულ, არაპარამეტრულ და ევრისტიკულ მეთოდებს, ზოგი კი ისტორიულ სკოლებსა და დარგის ტენდენციებზე დაფუძნებულ მეთოდთა ჯგუფებს გამოყოფს. მაგალითად, ნაშრომში, რომელშიც მოცემულია ამოცნობის მეთოდების აკადემიური მიმოხილვა, გამოყენებულია ნიმუშის ამოცნობის მეთოდების შემდეგი ტიპოლოგია:

  • გამოყოფის პრინციპზე დაფუძნებული მეთოდები;
  • სტატისტიკური მეთოდები;
  • „პოტენციური ფუნქციების“ საფუძველზე აგებული მეთოდები;
  • ქულების გამოთვლის ხერხები (კენჭისყრა);
  • წინადადებების გამოთვლაზე დაფუძნებული მეთოდები, კერძოდ, ლოგიკის ალგებრის აპარატზე.

ეს კლასიფიკაცია დაფუძნებულია ნიმუშის ამოცნობის ფორმალურ მეთოდებში განსხვავებაზე და, შესაბამისად, ამოღებულია ამოცნობის ევრისტიკული მიდგომის გათვალისწინება, რომელმაც მიიღო სრული და ადეკვატური განვითარება საექსპერტო სისტემებში. ევრისტიკული მიდგომა დაფუძნებულია მკვლევარის რთულად ფორმალიზებად ცოდნასა და ინტუიციაზე. ამავდროულად, მკვლევარი თავად ადგენს, რა ინფორმაცია და როგორ უნდა გამოიყენოს სისტემამ სასურველი ამოცნობის ეფექტის მისაღწევად.

ამოცნობის მეთოდების მსგავსი ტიპოლოგია სხვადასხვა ხარისხის დეტალებით გვხვდება ამოცნობის შესახებ ბევრ ნაშრომში. ამავდროულად, ცნობილი ტიპოლოგიები არ ითვალისწინებენ ერთ ძალიან მნიშვნელოვან მახასიათებელს, რომელიც ასახავს საგნის სფეროს შესახებ ცოდნის წარმოდგენის სპეციფიკას ნებისმიერი ფორმალური ნიმუშის ამოცნობის ალგორითმის გამოყენებით.

D.A. Pospelov (1990) გამოყოფს ცოდნის წარმოდგენის ორ ძირითად გზას:

  • ინტენსიური, ატრიბუტებს (მახასიათებლებს) შორის კავშირების სქემის სახით.
  • გაფართოებული, კონკრეტული ფაქტების (ობიექტების, მაგალითების) დახმარებით.

ინტენსიური წარმოდგენა ასახავს შაბლონებს და ურთიერთობებს, რომლებიც ხსნის მონაცემთა სტრუქტურას. სადიაგნოსტიკო ამოცანებთან დაკავშირებით, ასეთი ფიქსაცია მოიცავს ობიექტების ატრიბუტებზე (მახასიათებლებზე) ოპერაციების განსაზღვრას, რაც იწვევს საჭირო დიაგნოსტიკურ შედეგს. ინტენსიური წარმოდგენები ხორციელდება ატრიბუტების მნიშვნელობებზე ოპერაციების საშუალებით და არ გულისხმობს ოპერაციებს კონკრეტულ საინფორმაციო ფაქტებზე (ობიექტებზე).

თავის მხრივ, ცოდნის გაფართოებული წარმოდგენები ასოცირდება საგნის არეალიდან კონკრეტული ობიექტების აღწერასა და ფიქსაციასთან და ხორციელდება ოპერაციებში, რომელთა ელემენტებია ობიექტები, როგორც ინტეგრალური სისტემები.

შესაძლებელია ანალოგიის დახატვა ცოდნის ინტენსიურ და გაფართოებულ წარმოდგენებსა და ადამიანის ტვინის მარცხენა და მარჯვენა ნახევარსფეროს აქტივობის საფუძველში არსებულ მექანიზმებს შორის. თუ მარჯვენა ნახევარსფერო ხასიათდება მიმდებარე სამყაროს ჰოლისტიკური პროტოტიპური წარმოდგენით, მაშინ მარცხენა ნახევარსფერო მუშაობს შაბლონებით, რომლებიც ასახავს ამ სამყაროს ატრიბუტების კავშირებს.

ზემოთ აღწერილი ცოდნის წარმოდგენის ორი ფუნდამენტური გზა საშუალებას გვაძლევს შემოგთავაზოთ ნიმუშის ამოცნობის მეთოდების შემდეგი კლასიფიკაცია:

  • ატრიბუტების მქონე ოპერაციებზე დაფუძნებული ინტენსიური მეთოდები.
  • გაფართოების მეთოდები, რომლებიც დაფუძნებულია ობიექტებთან ოპერაციებზე.

აუცილებელია ხაზგასმით აღვნიშნოთ, რომ ამოცნობის მეთოდების ამ ორი (და მხოლოდ ორი) ჯგუფის არსებობა: თვისებებით მოქმედი და ობიექტებთან მოქმედი, ღრმად ბუნებრივია. ამ თვალსაზრისით, არცერთი ეს მეთოდი, მეორისგან განცალკევებით აღებული, არ იძლევა შესაძლებლობას შექმნას საგნობრივი არეალის ადეკვატური ასახვა. ავტორების აზრით, ამ მეთოდებს შორის არის ურთიერთკომპლიმენტურობის მიმართება N. Bohr-ის გაგებით, შესაბამისად, პერსპექტიულმა აღიარების სისტემებმა უნდა უზრუნველყონ ორივე ამ მეთოდის და არა რომელიმე მათგანის განხორციელება.

ამრიგად, დ.ა. პოსპელოვის მიერ შემოთავაზებული ამოცნობის მეთოდების კლასიფიკაცია ეფუძნება ფუნდამენტურ კანონებს, რომლებიც საფუძვლად უდევს ადამიანის შემეცნების გზას ზოგადად, რაც მას განსაკუთრებულ (პრივილეგირებულ) მდგომარეობაში აყენებს სხვა კლასიფიკაციებთან შედარებით, რომლებიც, ამ ფონზე, გამოიყურება. უფრო მსუბუქი და ხელოვნური.

ინტენსიური მეთოდები

ინტენსიური მეთოდების გამორჩეული თვისებაა ის, რომ ისინი იყენებენ მახასიათებლების სხვადასხვა მახასიათებლებს და მათ ურთიერთობებს, როგორც ოპერაციების ელემენტებს შაბლონის ამოცნობის ალგორითმების კონსტრუქციასა და გამოყენებაში. ასეთი ელემენტები შეიძლება იყოს ინდივიდუალური მნიშვნელობები ან მახასიათებლის მნიშვნელობების ინტერვალები, საშუალო მნიშვნელობები და განსხვავებები, მახასიათებლების ურთიერთობის მატრიცები და ა. ამავდროულად, ამ მეთოდებში ობიექტები არ განიხილება როგორც ინტეგრალური ინფორმაციის ერთეულები, არამედ მოქმედებენ როგორც ინდიკატორები მათი ატრიბუტების ურთიერთქმედების და ქცევის შესაფასებლად.

ნიმუშის ამოცნობის ინტენსიური მეთოდების ჯგუფი ვრცელია და მისი დაყოფა ქვეკლასებად გარკვეულწილად თვითნებურია.

მახასიათებლის მნიშვნელობების განაწილების სიმკვრივის შეფასებებზე დაფუძნებული მეთოდები

ნიმუშის ამოცნობის ეს მეთოდები ნასესხებია სტატისტიკური გადაწყვეტილებების კლასიკური თეორიიდან, რომელშიც კვლევის ობიექტები განიხილება, როგორც მრავალგანზომილებიანი შემთხვევითი ცვლადის რეალიზაცია, რომელიც განაწილებულია ფუნქციების სივრცეში გარკვეული კანონის მიხედვით. ისინი ეფუძნება ბაიესის გადაწყვეტილების მიღების სქემას, რომელიც მიმართავს ამა თუ იმ ცნობად კლასს მიეკუთვნება ობიექტების აპრიორულ ალბათობას და მახასიათებლის ვექტორის მნიშვნელობების პირობითი განაწილების სიმკვრივეს. ეს მეთოდები მცირდება ალბათობის თანაფარდობის განსაზღვრამდე მრავალგანზომილებიანი მახასიათებლების სივრცის სხვადასხვა ზონაში.

მახასიათებლების მნიშვნელობების განაწილების სიმკვრივის შეფასებაზე დაფუძნებული მეთოდების ჯგუფი პირდაპირ კავშირშია დისკრიმინაციული ანალიზის მეთოდებთან. გადაწყვეტილების მიღებისადმი ბაიესის მიდგომა არის ერთ-ერთი ყველაზე განვითარებული თანამედროვე სტატისტიკაში, ეგრეთ წოდებული პარამეტრული მეთოდი, რომლისთვისაც ცნობილია განაწილების კანონის ანალიტიკური გამოხატულება (ამ შემთხვევაში ნორმალური კანონი) და მხოლოდ მცირედ ითვლება. პარამეტრების რაოდენობა (საშუალო ვექტორები და კოვარიანტების მატრიცები) უნდა შეფასდეს.

ძირითადი სირთულეები ამ მეთოდების გამოყენებისას არის მთელი სასწავლო ნიმუშის დამახსოვრების აუცილებლობა, რათა გამოვთვალოთ ლოკალური ალბათობის განაწილების სიმკვრივეები და მაღალი მგრძნობელობა სასწავლო ნიმუშის არაწარმომადგენლობით.

გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდები

მეთოდთა ამ ჯგუფში ცნობილია გადაწყვეტილების ფუნქციის ზოგადი ფორმა და მოცემულია მისი ხარისხი ფუნქციონალურად. ამ ფუნქციიდან გამომდინარე, გადაწყვეტილების ფუნქციის საუკეთესო მიახლოება გვხვდება ტრენინგის თანმიმდევრობიდან. ყველაზე გავრცელებულია გადაწყვეტილების ფუნქციების წარმოდგენები წრფივი და განზოგადებული არაწრფივი მრავალწევრების სახით. გადაწყვეტილების წესის ხარისხის ფუნქციონირება ჩვეულებრივ ასოცირდება კლასიფიკაციის შეცდომასთან.

გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდების მთავარი უპირატესობა არის ამოცნობის პრობლემის მათემატიკური ფორმულირების სიცხადე, როგორც ექსტრემის პოვნის პრობლემა. ამ ჯგუფის მეთოდების მრავალფეროვნება აიხსნება გამოყენებული გადაწყვეტილების წესის ხარისხის ფუნქციებითა და ექსტრემალური ძიების ალგორითმებით. განხილული ალგორითმების განზოგადება, რომელიც მოიცავს, კერძოდ, ნიუტონის ალგორითმს, პერცეპტრონის ტიპის ალგორითმებს და ა.შ., არის სტოქასტური დაახლოების მეთოდი.

საკმაოდ კარგად არის შესწავლილი გრადიენტული ალგორითმების შესაძლებლობები ექსტრემის საპოვნელად, განსაკუთრებით ხაზოვანი გადაწყვეტილების წესების ჯგუფში. ამ ალგორითმების კონვერგენცია დადასტურდა მხოლოდ იმ შემთხვევისთვის, როდესაც ობიექტების ცნობადი კლასები გამოსახულია ფუნქციურ სივრცეში კომპაქტური გეომეტრიული სტრუქტურებით.

გადაწყვეტილების წესის საკმარისად მაღალი ხარისხის მიღწევა შესაძლებელია ალგორითმების გამოყენებით, რომლებსაც არ გააჩნიათ მკაცრი მათემატიკური მტკიცებულება გლობალური ექსტრემის ამოხსნის კონვერგენციის შესახებ. ასეთი ალგორითმები მოიცავს ევრისტიკული პროგრამირების პროცედურების დიდ ჯგუფს, რომლებიც წარმოადგენს ევოლუციური მოდელირების მიმართულებას. ევოლუციური მოდელირება არის ბუნებისგან ნასესხები ბიონიკური მეთოდი. იგი ეფუძნება ევოლუციის ცნობილი მექანიზმების გამოყენებას, რათა ჩაანაცვლოს რთული ობიექტის აზრიანი მოდელირების პროცესი მისი ევოლუციის ფენომენოლოგიური მოდელირებით. ევოლუციური მოდელირების ცნობილი წარმომადგენელი ნიმუშის ამოცნობაში არის არგუმენტების ჯგუფური აღრიცხვის მეთოდი (MGUA). GMDH ეფუძნება თვითორგანიზაციის პრინციპს, ხოლო GMDH ალგორითმები ამრავლებენ მასობრივი შერჩევის სქემას.

თუმცა პრაქტიკული მიზნების მიღწევას ამ შემთხვევაში არ ახლავს ახალი ცოდნის მოპოვება ცნობადი ობიექტების ბუნების შესახებ. ამ ცოდნის მოპოვების შესაძლებლობა, კერძოდ, ცოდნის ატრიბუტების (მახასიათებლების) ურთიერთქმედების მექანიზმების შესახებ, ფუნდამენტურად შეზღუდულია ასეთი ურთიერთქმედების მოცემული სტრუქტურით, რომელიც ფიქსირდება გადამწყვეტი ფუნქციების არჩეულ ფორმაში.

ლოგიკური მეთოდები

ნიმუშის ამოცნობის ლოგიკური მეთოდები დაფუძნებულია ლოგიკური ალგებრის აპარატზე და საშუალებას იძლევა იმუშაოს ინფორმაციასთან, რომელიც შეიცავს არა მხოლოდ ცალკეულ მახასიათებლებს, არამედ მახასიათებლების მნიშვნელობების კომბინაციებს. ამ მეთოდებში ნებისმიერი ატრიბუტის მნიშვნელობები განიხილება, როგორც ელემენტარული მოვლენები.

ყველაზე ზოგადი ფორმით, ლოგიკური მეთოდები შეიძლება დახასიათდეს, როგორც სასწავლო ნიმუშში ლოგიკური შაბლონების ძიება და ლოგიკური გადაწყვეტილების წესების გარკვეული სისტემის ფორმირება (მაგალითად, ელემენტარული მოვლენების შეერთების სახით), თითოეული რომელსაც თავისი წონა აქვს. ლოგიკური მეთოდების ჯგუფი მრავალფეროვანია და მოიცავს სხვადასხვა სირთულისა და სიღრმის ანალიზის მეთოდებს. დიქოტომიური (ლოგიკური) მახასიათებლებისთვის პოპულარულია ეგრეთ წოდებული ხის მსგავსი კლასიფიკატორები, ჩიხური ტესტის მეთოდი, ბარკის ალგორითმი და ა.შ.

კორას ალგორითმი, ისევე როგორც ნიმუშის ამოცნობის სხვა ლოგიკური მეთოდები, საკმაოდ შრომატევადია გამოთვლის თვალსაზრისით, ვინაიდან კავშირების არჩევისას საჭიროა სრული ჩამოთვლა. ამიტომ, ლოგიკური მეთოდების გამოყენებისას მაღალი მოთხოვნები დგება გამოთვლითი პროცესის ეფექტურ ორგანიზაციაზე და ეს მეთოდები კარგად მუშაობს ფუნქციების სივრცის შედარებით მცირე ზომებთან და მხოლოდ ძლიერ კომპიუტერებზე.

ლინგვისტური (სტრუქტურული) მეთოდები

ნიმუშის ამოცნობის ენობრივი მეთოდები ემყარება სპეციალური გრამატიკების გამოყენებას, რომლებიც წარმოქმნიან ენებს, რომლებიც შეიძლება გამოყენებულ იქნას ცნობადი ობიექტების თვისებების აღწერისთვის.

ობიექტების სხვადასხვა კლასისთვის გამოიყოფა არაწარმოებული (ატომური) ელემენტები (ქვესახეობები, ნიშნები) და მათ შორის შესაძლო მიმართებები. გრამატიკა ეხება ამ არაწარმოებული ელემენტებიდან ობიექტების აგების წესებს.

ამრიგად, თითოეული ობიექტი არის არაწარმოებული ელემენტების ერთობლიობა, რომლებიც ამა თუ იმ გზით „დაკავშირებულია“ ერთმანეთთან, ან სხვა სიტყვებით რომ ვთქვათ, რომელიმე „ენის“ „წინადადებით“. მინდა ხაზი გავუსვა ამ აზრის ძალიან მნიშვნელოვან იდეოლოგიურ ღირებულებას.

„წინადადების“ გარჩევით (პარსირებით) განისაზღვრება მისი სინტაქსური „სისწორე“, ან, ექვივალენტურად, შეუძლია თუ არა რომელიმე ფიქსირებულ გრამატიკას, რომელიც აღწერს კლასს, წარმოქმნის ობიექტის არსებულ აღწერას.

თუმცა, გრამატიკების აღდგენის (განსაზღვრების) ამოცანა დებულებათა გარკვეული ნაკრებიდან (წინადადებები - ობიექტების აღწერილობები), რომლებიც წარმოქმნიან მოცემულ ენას, რთულია ფორმალიზება.

გაფართოების მეთოდები

ამ ჯგუფის მეთოდებში, ინტენსიური მიმართულებისგან განსხვავებით, თითოეულ შესწავლილ ობიექტს მეტ-ნაკლებად ენიჭება დამოუკიდებელი დიაგნოსტიკური მნიშვნელობა. თავის არსში, ეს მეთოდები ახლოსაა კლინიკურ მიდგომასთან, რომელიც განიხილავს ადამიანებს არა ამა თუ იმ ინდიკატორის მიხედვით შეფასებული ობიექტების ჯაჭვად, არამედ როგორც ინტეგრალურ სისტემებს, რომელთაგან თითოეული ინდივიდუალურია და აქვს განსაკუთრებული დიაგნოსტიკური მნიშვნელობა. კვლევის ობიექტებისადმი ასეთი ფრთხილი დამოკიდებულება არ იძლევა საშუალებას გამორიცხოს ან დაკარგოს ინფორმაცია თითოეული ცალკეული ობიექტის შესახებ, რაც ხდება ინტენსიური მიმართულების მეთოდების გამოყენებისას, ობიექტების გამოყენებით მხოლოდ მათი ატრიბუტების ქცევის ნიმუშების აღმოსაჩენად და დასაფიქსირებლად.

განხილული მეთოდების გამოყენებით ნიმუშის ამოცნობის ძირითადი ოპერაციებია ობიექტების მსგავსებისა და განსხვავების განსაზღვრის ოპერაციები. მეთოდების მითითებულ ჯგუფში შემავალი ობიექტები დიაგნოსტიკური პრეცედენტების როლს ასრულებენ. ამავდროულად, კონკრეტული ამოცანის პირობებიდან გამომდინარე, ინდივიდუალური პრეცედენტის როლი შეიძლება განსხვავდებოდეს ყველაზე ფართო საზღვრებში: ძირითადი და განმსაზღვრელიდან ძალიან ირიბ მონაწილეობამდე აღიარების პროცესში. თავის მხრივ, პრობლემის პირობებმა შეიძლება მოითხოვოს სხვადასხვა რაოდენობის დიაგნოსტიკური პრეცედენტების მონაწილეობა წარმატებული გადაწყვეტისთვის: თითოეული ცნობადი კლასიდან ერთიდან ნიმუშის მთლიან ზომამდე, აგრეთვე მსგავსებისა და განსხვავების ზომების გამოთვლის სხვადასხვა ხერხს. ობიექტები. ეს მოთხოვნები ხსნის გაფართოებული მეთოდების შემდგომ დაყოფას ქვეკლასებად.

პროტოტიპის შედარების მეთოდი

ეს არის გაფართოებული ამოცნობის უმარტივესი მეთოდი. იგი გამოიყენება, მაგალითად, იმ შემთხვევაში, როდესაც აღიარებული კლასები ნაჩვენებია ფუნქციების სივრცეში კომპაქტური გეომეტრიული დაჯგუფებით. ამ შემთხვევაში პროტოტიპად ირჩევა კლასის გეომეტრიული დაჯგუფების ცენტრი (ან ცენტრთან ყველაზე ახლოს მდებარე ობიექტი).

უცნობი ობიექტის კლასიფიკაციისთვის, ნაპოვნია მასთან ყველაზე ახლოს მდებარე პროტოტიპი და ობიექტი ეკუთვნის იმავე კლასს, როგორც ეს პროტოტიპი. ცხადია, ამ მეთოდით არ იქმნება განზოგადებული კლასის სურათები.

სიახლოვის საზომად შეიძლება გამოყენებულ იქნას სხვადასხვა ტიპის მანძილი. ხშირად დიქოტომიური მახასიათებლებისთვის გამოიყენება ჰემინგის მანძილი, რომელიც ამ შემთხვევაში უდრის ევკლიდეს მანძილის კვადრატს. ამ შემთხვევაში, ობიექტების კლასიფიკაციის გადაწყვეტილების წესი ტოლია წრფივი გადაწყვეტილების ფუნქციის.

ეს ფაქტი განსაკუთრებით უნდა აღინიშნოს. იგი ნათლად აჩვენებს კავშირს პროტოტიპსა და მონაცემთა სტრუქტურის შესახებ ინფორმაციის ინდიკატორულ წარმოდგენას შორის. ზემოაღნიშნული წარმოდგენის გამოყენებით, მაგალითად, ნებისმიერი ტრადიციული საზომი მასშტაბი, რომელიც წარმოადგენს დიქოტომიური მახასიათებლების მნიშვნელობების წრფივ ფუნქციას, შეიძლება ჩაითვალოს ჰიპოთეტურ დიაგნოსტიკური პროტოტიპად. თავის მხრივ, თუ აღიარებული კლასების სივრცითი სტრუქტურის ანალიზი საშუალებას გვაძლევს დავასკვნათ, რომ ისინი გეომეტრიულად კომპაქტურია, მაშინ საკმარისია თითოეული ამ კლასის ჩანაცვლება ერთი პროტოტიპით, რომელიც რეალურად ექვივალენტურია ხაზოვანი დიაგნოსტიკური მოდელის.

პრაქტიკაში, რა თქმა უნდა, სიტუაცია ხშირად განსხვავდება აღწერილი იდეალიზებული მაგალითისგან. მკვლევარი, რომელიც აპირებს გამოიყენოს ამოცნობის მეთოდი, რომელიც დაფუძნებულია დიაგნოსტიკური კლასების პროტოტიპებთან შედარებით, რთული პრობლემების წინაშე დგას.

უპირველეს ყოვლისა, ეს არის სიახლოვის საზომის არჩევანი (მეტრული), რომელსაც შეუძლია მნიშვნელოვნად შეცვალოს ობიექტების განაწილების სივრცითი კონფიგურაცია. მეორე, დამოუკიდებელი პრობლემაა ექსპერიმენტული მონაცემების მრავალგანზომილებიანი სტრუქტურების ანალიზი. ორივე ეს პრობლემა განსაკუთრებით მწვავეა მკვლევარისთვის მხატვრული სივრცის მაღალი განზომილების პირობებში, რაც დამახასიათებელია რეალური პრობლემებისთვის.

k უახლოესი მეზობლის მეთოდი

K უახლოესი მეზობლების მეთოდი დისკრიმინაციული ანალიზის ამოცანების გადასაჭრელად პირველად იქნა შემოთავაზებული ჯერ კიდევ 1952 წელს. ეს არის შემდეგი.

უცნობი ობიექტის კლასიფიკაციისას, ნაპოვნია მისთვის გეომეტრიულად ყველაზე ახლოს სხვა ობიექტების მოცემული რიცხვი (k) ფუნქციების სივრცეში (უახლოესი მეზობლები), რომლებსაც უკვე ცნობილია ცნობადი კლასების კუთვნილება. უცნობი ობიექტის კონკრეტულ სადიაგნოსტიკო კლასზე მინიჭების გადაწყვეტილება მიიღება მისი უახლოესი მეზობლების ამ ცნობილი წევრობის შესახებ ინფორმაციის გაანალიზებით, მაგალითად, მარტივი ხმების დათვლის გამოყენებით.

თავდაპირველად, k უახლოესი მეზობლების მეთოდი განიხილებოდა, როგორც არაპარამეტრული მეთოდი ალბათობის კოეფიციენტის შესაფასებლად. ამ მეთოდისთვის მიიღება მისი ეფექტურობის თეორიული შეფასებები ბაიესის ოპტიმალურ კლასიფიკატორთან შედარებით. დადასტურებულია, რომ k უახლოესი მეზობლის მეთოდის ასიმპტოტური შეცდომის ალბათობა აღემატება ბეიესის წესის შეცდომებს არაუმეტეს ორჯერ.

შაბლონის ამოცნობისთვის k უახლოესი მეზობლების მეთოდის გამოყენებისას მკვლევარმა უნდა გადაჭრას მეტრიკის არჩევის რთული პრობლემა, რათა დადგინდეს დიაგნოზირებული ობიექტების სიახლოვე. ეს პრობლემა ფუნქციური სივრცის მაღალი განზომილების პირობებში უკიდურესად მწვავდება ამ მეთოდის საკმარისად შრომატევადობის გამო, რაც მნიშვნელოვანი ხდება მაღალი ხარისხის კომპიუტერებისთვისაც კი. აქედან გამომდინარე, აქ, ისევე როგორც პროტოტიპის შედარების მეთოდში, აუცილებელია ექსპერიმენტული მონაცემების მრავალგანზომილებიანი სტრუქტურის ანალიზის შემოქმედებითი პრობლემის გადაჭრა, რათა მინიმუმამდე დავიყვანოთ სადიაგნოსტიკო კლასების წარმომადგენლობითი ობიექტების რაოდენობა.

სასწავლო ნიმუშში ობიექტების რაოდენობის შემცირების აუცილებლობა (დიაგნოსტიკური პრეცედენტები) ამ მეთოდის მინუსია, რადგან ის ამცირებს სასწავლო ნიმუშის წარმომადგენლობას.

ქულების გამოთვლის ალგორითმები ("ხმის მიცემა")

შეფასების ალგორითმების (ABO) მოქმედების პრინციპია პრიორიტეტების (მსგავსების ქულების) გამოთვლა, რომლებიც ახასიათებენ აღიარებული და საცნობარო ობიექტების „სიახლოვეს“ ფუნქციების ანსამბლების სისტემის მიხედვით, რაც წარმოადგენს მახასიათებლების მოცემული ნაკრების ქვეჯგუფების სისტემას. .

ყველა ადრე განხილული მეთოდისგან განსხვავებით, შეფასებების გამოთვლის ალგორითმები ფუნქციონირებს ობიექტების აღწერილობით ფუნდამენტურად ახალი გზით. ამ ალგორითმებისთვის ობიექტები ერთდროულად არსებობენ ფუნქციების სივრცის ძალიან განსხვავებულ ქვესივრცეში. ABO კლასს თავის ლოგიკურ დასკვნამდე მიჰყავს მახასიათებლების გამოყენების იდეა: რადგან ყოველთვის არ არის ცნობილი მახასიათებლების რომელი კომბინაციებია ყველაზე ინფორმატიული, ABO-ში ობიექტების მსგავსების ხარისხი გამოითვლება მახასიათებლების ყველა შესაძლო ან გარკვეული კომბინაციის შედარებით. შედის ობიექტების აღწერილობაში.

ატრიბუტების (ქვესივრცეების) გამოყენებულ კომბინაციებს ეწოდება დამხმარე კომპლექტები ან ობიექტების ნაწილობრივი აღწერის კომპლექტები. შემოღებულია განზოგადებული სიახლოვის კონცეფცია აღიარებულ ობიექტსა და სასწავლო ნიმუშის ობიექტებს შორის (ცნობილი კლასიფიკაციით), რომლებსაც საცნობარო ობიექტებს უწოდებენ. ეს სიახლოვე წარმოდგენილია აღიარებული ობიექტის სიახლოვის კომბინაციით საცნობარო ობიექტებთან, რომლებიც გამოითვლება ნაწილობრივი აღწერილობების ნაკრებებზე. ამრიგად, ABO არის k უახლოესი მეზობლების მეთოდის გაფართოება, რომელშიც ობიექტების სიახლოვე განიხილება მხოლოდ ერთ მოცემულ ფუნქციურ სივრცეში.

ABO-ს კიდევ ერთი გაფართოება არის ის, რომ ამ ალგორითმებში ობიექტების მსგავსებისა და განსხვავების განსაზღვრის პრობლემა ჩამოყალიბებულია პარამეტრულად და შეირჩევა სასწავლო ნიმუშის მიხედვით ABO-ს დაყენების ეტაპი, რომელზედაც არის ოპტიმალური მნიშვნელობები. არჩეულია შეყვანილი პარამეტრები. ხარისხის კრიტერიუმი არის ამოცნობის შეცდომა და ფაქტიურად ყველაფერი პარამეტრიზებულია:

  • ინდივიდუალური მახასიათებლების მიხედვით ობიექტების სიახლოვის გამოთვლის წესები;
  • ნიშნების ქვესივრცეში ობიექტების სიახლოვის გამოთვლის წესები;
  • კონკრეტული საცნობარო ობიექტის, როგორც დიაგნოსტიკური პრეცედენტის მნიშვნელობის ხარისხი;
  • მახასიათებლების თითოეული საცნობარო ნაკრების წვლილის მნიშვნელობა აღიარებული ობიექტის ნებისმიერ დიაგნოსტიკურ კლასთან მსგავსების საბოლოო შეფასებაში.

ჰაერის გამაგრილებლის პარამეტრები დაყენებულია ზღვრული მნიშვნელობების სახით და (ან) მითითებული კომპონენტების წონებად.

ABO-ს თეორიული შესაძლებლობები სულ მცირე არ არის დაბალი, ვიდრე ნებისმიერი სხვა ნიმუშის ამოცნობის ალგორითმი, ვინაიდან ABO-ს დახმარებით შესაძლებელია განხორციელდეს ყველა შესაძლო ოპერაცია შესწავლილ ობიექტებთან.

მაგრამ, როგორც ეს ჩვეულებრივ ხდება, პოტენციალების გაფართოება დიდ სირთულეებს აწყდება მათ პრაქტიკულ განხორციელებაში, განსაკუთრებით ამ ტიპის ალგორითმების აგების (თუნინგის) ეტაპზე.

ცალკეული სირთულეები ადრე აღინიშნა k უახლოეს მეზობლების მეთოდის განხილვისას, რომელიც შეიძლება განიმარტოს, როგორც ABO-ს შეკვეცილი ვერსია. ის ასევე შეიძლება ჩაითვალოს პარამეტრულ ფორმაში და პრობლემა შემცირდეს შერჩეული ტიპის შეწონილი მეტრიკის პოვნამდე. ამავდროულად, რთული თეორიული კითხვები და პრობლემები, რომლებიც დაკავშირებულია ეფექტური გამოთვლითი პროცესის ორგანიზებასთან, აქ უკვე ჩნდება მაღალგანზომილებიანი პრობლემებისთვის.

ABO-სთვის, თუ თქვენ ცდილობთ ამ ალგორითმების შესაძლებლობების სრულად გამოყენებას, ეს სირთულეები ბევრჯერ იზრდება.

აღნიშნული პრობლემები ხსნის იმ ფაქტს, რომ პრაქტიკაში ABO-ს გამოყენებას მაღალგანზომილებიანი ამოცანების გადასაჭრელად თან ახლავს ნებისმიერი ევრისტიკული შეზღუდვისა და დაშვების დანერგვა. კერძოდ, არსებობს ფსიქოდიაგნოსტიკაში ABO-ს გამოყენების მაგალითი, რომელშიც შემოწმებულია ABO-ს ვერსია, რომელიც რეალურად უტოლდება k უახლოეს მეზობლების მეთოდს.

გადამწყვეტი წესი კოლექტივები

ნიმუშის ამოცნობის მეთოდების მიმოხილვის დასასრულს, მოდით ვისაუბროთ კიდევ ერთ მიდგომაზე. ეს არის გადაწყვეტილების წესების ე.წ. გუნდები (CRC).

ვინაიდან ამოცნობის სხვადასხვა ალგორითმები განსხვავებულად იქცევიან ობიექტების ერთსა და იმავე ნიმუშზე, ბუნებრივად ჩნდება კითხვა სინთეზური გადაწყვეტილების წესის შესახებ, რომელიც ადაპტირებულად იყენებს ამ ალგორითმების ძლიერ მხარეებს. სინთეზური გადაწყვეტილების წესი იყენებს ორ დონის ამოცნობის სქემას. პირველ დონეზე მუშაობს კერძო ამოცნობის ალგორითმები, რომელთა შედეგები გაერთიანებულია მეორე დონეზე სინთეზის ბლოკში. ასეთი კომბინაციის ყველაზე გავრცელებული მეთოდები ეფუძნება კონკრეტული ალგორითმის კომპეტენციის სფეროების განაწილებას. კომპეტენციის სფეროების პოვნის უმარტივესი გზაა ატრიბუტების სივრცის აპრიორი გაყოფა კონკრეტული მეცნიერების პროფესიულ მოსაზრებებზე დაყრდნობით (მაგალითად, ნიმუშის სტრატიფიკაცია რომელიმე ატრიბუტის მიხედვით). შემდეგ, თითოეული შერჩეული სფეროსთვის, აგებულია საკუთარი ამოცნობის ალგორითმი. სხვა მეთოდი ემყარება ფორმალური ანალიზის გამოყენებას, რათა განისაზღვროს ფუნქციური სივრცის ლოკალური არეები, როგორც ცნობადი ობიექტების უბნები, რისთვისაც დადასტურებულია ნებისმიერი კონკრეტული ამოცნობის ალგორითმის წარმატება.

სინთეზური ბლოკის აგების ყველაზე ზოგადი მიდგომა განიხილავს ნაწილობრივი ალგორითმების მიღებულ ინდიკატორებს, როგორც საწყის მახასიათებლებს ახალი განზოგადებული გადაწყვეტილების წესის ასაგებად. ამ შემთხვევაში, შაბლონის ამოცნობაში ინტენსიური და გაფართოებული მიმართულებების ყველა ზემოაღნიშნული მეთოდის გამოყენება შეიძლება. გადაწყვეტილების წესების შექმნის პრობლემის გადასაჭრელად ეფექტურია „კორას“ ტიპის ლოგიკური ალგორითმები და შეფასებების გამოთვლის ალგორითმები (ABO), რომლებიც ქმნიან ე.წ. ალგებრული მიდგომის საფუძველს, რომელიც უზრუნველყოფს კვლევას და ამოცნობის ალგორითმები, რომლებშიც ჯდება ყველა არსებული ტიპის ალგორითმები.

ნიმუშის ამოცნობის მეთოდების შედარებითი ანალიზი

მოდით შევადაროთ ზემოთ აღწერილი ნიმუშის ამოცნობის მეთოდები და შევაფასოთ მათი ადეკვატურობის ხარისხი 3.3.3 ნაწილში ჩამოყალიბებულ მოთხოვნებთან SDA მოდელებისთვის რთული სისტემების ადაპტური ავტომატური მართვის სისტემებისთვის.

ინტენსიური მიმართულების მეთოდების ჯგუფიდან რეალური პრობლემების გადასაჭრელად პრაქტიკული მნიშვნელობა აქვს პარამეტრულ მეთოდებს და მეთოდებს, რომლებიც დაფუძნებულია წინადადებებზე გადამწყვეტი ფუნქციების ფორმაზე. პარამეტრული მეთოდები ემყარება ინდიკატორების აგების ტრადიციულ მეთოდოლოგიას. ამ მეთოდების გამოყენება რეალურ პრობლემებში დაკავშირებულია მონაცემთა სტრუქტურაზე ძლიერი შეზღუდვების დაწესებასთან, რაც იწვევს ხაზოვანი დიაგნოსტიკური მოდელების შექმნას მათი პარამეტრების ძალიან სავარაუდო შეფასებით. გადაწყვეტილების ფუნქციების ფორმის შესახებ ვარაუდებზე დაფუძნებული მეთოდების გამოყენებისას მკვლევარი ასევე იძულებულია მიმართოს ხაზოვან მოდელებს. ეს განპირობებულია ფუნქციების სივრცის მაღალი განზომილებით, რაც დამახასიათებელია რეალური პრობლემებისთვის, რაც, პოლინომიური გადაწყვეტილების ფუნქციის ხარისხის გაზრდით, იძლევა უზარმაზარ ზრდას მისი წევრების რაოდენობაში პრობლემური თანმხლები ზრდით. აღიარების ხარისხი. ამრიგად, რეალურ პრობლემებზე ინტენსიური ამოცნობის მეთოდების პოტენციური გამოყენების არეალის დაპროექტებით, ჩვენ ვიღებთ სურათს, რომელიც შეესაბამება ხაზოვანი დიაგნოსტიკური მოდელების კარგად დამკვიდრებულ ტრადიციულ მეთოდოლოგიას.

კარგად არის შესწავლილი ხაზოვანი დიაგნოსტიკური მოდელების თვისებები, რომლებშიც დიაგნოსტიკური მაჩვენებელი წარმოდგენილია საწყისი მახასიათებლების შეწონილი ჯამით. ამ მოდელების შედეგები (ადეკვატური ნორმალიზებით) ინტერპრეტირებულია, როგორც მანძილი შესასწავლი ობიექტებიდან ზოგიერთ ჰიპერპლანტამდე ფუნქციების სივრცეში ან, ექვივალენტურად, როგორც ობიექტების პროექცია მოცემულ სივრცეში რაიმე სწორ ხაზზე. აქედან გამომდინარე, ხაზოვანი მოდელები ადეკვატურია მხოლოდ ფუნქციური სივრცის რეგიონების მარტივი გეომეტრიული კონფიგურაციისთვის, რომლებშიც სხვადასხვა დიაგნოსტიკური კლასის ობიექტებია გამოსახული. უფრო რთული განაწილებით, ეს მოდელები ფუნდამენტურად ვერ ასახავს ექსპერიმენტული მონაცემთა სტრუქტურის ბევრ მახასიათებელს. ამავდროულად, ასეთ მახასიათებლებს შეუძლიათ ღირებული დიაგნოსტიკური ინფორმაციის მიწოდება.

ამავდროულად, მარტივი მრავალგანზომილებიანი სტრუქტურების ნებისმიერ რეალურ პრობლემაში გამოჩენა (კერძოდ, მრავალგანზომილებიანი ნორმალური განაწილება) უნდა განიხილებოდეს როგორც გამონაკლისი და არა როგორც წესი. ხშირად, დიაგნოსტიკური კლასები ყალიბდება რთული გარე კრიტერიუმების საფუძველზე, რაც ავტომატურად იწვევს ამ კლასების გეომეტრიულ ჰეტეროგენულობას ფუნქციურ სივრცეში. ეს განსაკუთრებით ეხება „სიცოცხლის“ კრიტერიუმებს, რომლებიც ყველაზე ხშირად გვხვდება პრაქტიკაში. ასეთ პირობებში, ხაზოვანი მოდელების გამოყენება ასახავს ექსპერიმენტული ინფორმაციის მხოლოდ ყველაზე „უხეში“ ნიმუშებს.

გაფართოებული მეთოდების გამოყენება არ უკავშირდება რაიმე ვარაუდს ექსპერიმენტული ინფორმაციის სტრუქტურის შესახებ, გარდა იმისა, რომ აღიარებულ კლასებში უნდა არსებობდეს ობიექტების ერთი ან მეტი ჯგუფი, რომლებიც გარკვეულწილად მსგავსია და სხვადასხვა კლასის ობიექტები უნდა განსხვავდებოდეს ერთმანეთისგან ზოგიერთში. გზა. აშკარაა, რომ სასწავლო ნიმუშის ნებისმიერი სასრული განზომილებისთვის (და ის არ შეიძლება იყოს განსხვავებული), ეს მოთხოვნა ყოველთვის სრულდება მხოლოდ იმიტომ, რომ ობიექტებს შორის არის შემთხვევითი განსხვავებები. მსგავსების საზომად გამოიყენება ობიექტების სიახლოვის (მანძილის) სხვადასხვა საზომი ფუნქციურ სივრცეში. მაშასადამე, გაფართოებული ნიმუშის ამოცნობის მეთოდების ეფექტური გამოყენება დამოკიდებულია იმაზე, თუ რამდენად კარგად არის განსაზღვრული სიახლოვის ეს ზომები, ასევე იმაზე, თუ რომელი სასწავლო ნიმუშის ობიექტები (ობიექტები ცნობილი კლასიფიკაციით) ასრულებენ დიაგნოსტიკური პრეცედენტების როლს. ამ პრობლემების წარმატებული გადაწყვეტა იძლევა შედეგს, რომელიც უახლოვდება აღიარების ეფექტურობის თეორიულად მისაღწევ საზღვრებს.

ნიმუშის ამოცნობის გაფართოებული მეთოდების უპირატესობებს უპირისპირდება, პირველ რიგში, მათი პრაქტიკული განხორციელების მაღალი ტექნიკური სირთულე. მაღალგანზომილებიანი ფუნქციური სივრცეებისთვის, ერთი შეხედვით მარტივი ამოცანა, რომ იპოვოთ უახლოესი წერტილების წყვილი, სერიოზულ პრობლემად იქცევა. ასევე, ბევრი ავტორი პრობლემად აღნიშნავს საკმარისად დიდი რაოდენობის ობიექტების დამახსოვრების აუცილებლობას, რომლებიც წარმოადგენენ ცნობადი კლასებს.

თავისთავად, ეს არ არის პრობლემა, მაგრამ ის აღიქმება როგორც პრობლემა (მაგალითად, k უახლოეს მეზობლების მეთოდით) იმ მიზეზით, რომ თითოეული ობიექტის ამოცნობისას ხდება სასწავლო ნიმუშში არსებული ყველა ობიექტის სრული ჩამოთვლა.

აქედან გამომდინარე, მიზანშეწონილია გამოვიყენოთ აღიარების სისტემის მოდელი, რომელშიც ამოღებულია სასწავლო ნიმუშის ობიექტების სრული ჩამოთვლის პრობლემა ამოცნობის დროს, რადგან ის ხორციელდება მხოლოდ ერთხელ ამოცნობის კლასების განზოგადებული სურათების ფორმირებისას. თავად ამოცნობაში, იდენტიფიცირებული ობიექტი შედარებულია მხოლოდ ამოცნობის კლასების განზოგადებულ სურათებთან, რომელთა რაოდენობა ფიქსირდება და საერთოდ არ არის დამოკიდებული სასწავლო ნიმუშის განზომილებაზე. ეს მიდგომა საშუალებას გაძლევთ გაზარდოთ სასწავლო ნიმუშის განზომილება მანამ, სანამ არ მიიღწევა განზოგადებული სურათების საჭირო მაღალი ხარისხი, ყოველგვარი შიშის გარეშე, რომ ამან შეიძლება გამოიწვიოს ამოცნობის დროის მიუღებელი ზრდა (რადგან ამ მოდელში ამოცნობის დრო არ არის დამოკიდებული ტრენინგის განზომილება საერთოდ).ნიმუშები).

გაფართოებული ამოცნობის მეთოდების გამოყენების თეორიული პრობლემები დაკავშირებულია მახასიათებლების საინფორმაციო ჯგუფების ძიების, ობიექტების მსგავსებისა და განსხვავების გაზომვის ოპტიმალური მეტრიკის და ექსპერიმენტული ინფორმაციის სტრუქტურის ანალიზთან. ამავდროულად, ამ პრობლემების წარმატებული გადაწყვეტა საშუალებას იძლევა არა მხოლოდ ეფექტური ამოცნობის ალგორითმების შემუშავება, არამედ ემპირიული ფაქტების გაფართოებული ცოდნიდან გადასვლა მათი სტრუქტურის ნიმუშების შესახებ ინტენსიურ ცოდნაზე.

გაფართოებული ცოდნიდან ინტენსიურ ცოდნაზე გადასვლა ხდება იმ ეტაპზე, როდესაც უკვე შექმნილია ფორმალური აღიარების ალგორითმი და დემონსტრირებულია მისი ეფექტურობა. შემდეგ ტარდება იმ მექანიზმების შესწავლა, რომლითაც მიიღწევა მიღებული ეფექტურობა. ასეთი კვლევა, რომელიც დაკავშირებულია მონაცემთა გეომეტრიული სტრუქტურის ანალიზთან, შეიძლება, მაგალითად, მიგვიყვანოს დასკვნამდე, რომ საკმარისია კონკრეტული დიაგნოსტიკური კლასის წარმომადგენლის ობიექტების შეცვლა ერთი ტიპიური წარმომადგენლით (პროტოტიპი). ეს ექვივალენტურია, როგორც ზემოთ აღინიშნა, ტრადიციული ხაზოვანი დიაგნოსტიკური მასშტაბის დაყენებას. ასევე შესაძლებელია, რომ საკმარისია თითოეული სადიაგნოსტიკო კლასის ჩანაცვლება რამდენიმე ობიექტით, რომლებიც მნიშვნელოვანია, როგორც ზოგიერთი ქვეკლასების ტიპიური წარმომადგენლები, რაც ექვივალენტურია წრფივი მასშტაბის გულშემატკივართა აგების. არის სხვა ვარიანტებიც, რომლებიც ქვემოთ იქნება განხილული.

ამრიგად, ამოცნობის მეთოდების მიმოხილვა აჩვენებს, რომ ამჟამად თეორიულად შემუშავებულია ნიმუშის ამოცნობის მრავალი განსხვავებული მეთოდი. ლიტერატურაში მოცემულია მათი დეტალური კლასიფიკაცია. თუმცა, ამ მეთოდების უმეტესობისთვის, მათი პროგრამული უზრუნველყოფის დანერგვა არ არის და ეს ღრმად ბუნებრივია, შეიძლება ითქვას, „წინასწარ განსაზღვრულია“ თავად ამოცნობის მეთოდების მახასიათებლებით. ეს შეიძლება ვიმსჯელოთ იმით, რომ ასეთი სისტემები ნაკლებად არის ნახსენები სპეციალიზებულ ლიტერატურაში და ინფორმაციის სხვა წყაროებში.

შესაბამისად, არასაკმარისად არის განვითარებული გარკვეული თეორიული ამოცნობის მეთოდების პრაქტიკული გამოყენების საკითხი რეალური (ანუ საკმაოდ მნიშვნელოვანი) მონაცემთა ზომებით და რეალურ თანამედროვე კომპიუტერებზე პრაქტიკული პრობლემების გადასაჭრელად.

ზემოაღნიშნული გარემოება შეიძლება გავიგოთ, თუ გავიხსენებთ, რომ მათემატიკური მოდელის სირთულე ექსპონენტურად ზრდის სისტემის პროგრამული უზრუნველყოფის დანერგვის სირთულეს და იმავე ზომით ამცირებს ამ სისტემის რეალურად მუშაობის შანსებს. ეს ნიშნავს, რომ ბაზარზე შეიძლება დანერგილი იყოს მხოლოდ პროგრამული სისტემები, რომლებიც დაფუძნებულია საკმაოდ მარტივ და „გამჭვირვალე“ მათემატიკურ მოდელებზე. ამიტომ, დეველოპერი, რომელიც დაინტერესებულია თავისი პროგრამული პროდუქტის გამეორებით, მათემატიკური მოდელის არჩევის საკითხს უახლოვდება არა წმინდა მეცნიერული თვალსაზრისით, არამედ როგორც პრაგმატისტი, პროგრამული უზრუნველყოფის დანერგვის შესაძლებლობების გათვალისწინებით. მას მიაჩნია, რომ მოდელი მაქსიმალურად მარტივი უნდა იყოს, რაც იმას ნიშნავს, რომ დაბალ ფასად და ხარისხიანად უნდა განხორციელდეს და ასევე იმუშაოს (იყოს პრაქტიკულად ეფექტური).

ამასთან დაკავშირებით, ამოცნობის სისტემებში დანერგვის ამოცანაა იმავე კლასს მიეკუთვნება ობიექტების აღწერილობების განზოგადება, ე.ი. კომპაქტური განზოგადებული სურათების ფორმირების მექანიზმი. აშკარაა, რომ ასეთი განზოგადების მექანიზმი საშუალებას მისცემს ნებისმიერი სასწავლო ნიმუშის „შეკუმშვას“ განზომილების თვალსაზრისით წინასწარ ცნობილი განზოგადებული სურათების ბაზაზე. ეს ასევე საშუალებას მოგვცემს დავაყენოთ და გადავჭრათ მთელი რიგი პრობლემები, რომელთა ფორმულირებაც კი შეუძლებელია ამოცნობის ისეთ მეთოდებში, როგორიცაა შედარება პროტოტიპის მეთოდთან, k უახლოეს მეზობლების მეთოდთან და ABO.

ეს არის დავალებები:

  • განზოგადებული სურათის საინფორმაციო პორტრეტში მახასიათებლების ინფორმაციული წვლილის განსაზღვრა;
  • განზოგადებული სურათების კლასტერულ-კონსტრუქციული ანალიზი;
  • მახასიათებლის სემანტიკური დატვირთვის განსაზღვრა;
  • მახასიათებლების სემანტიკური კლასტერულ-კონსტრუქციული ანალიზი;
  • განზოგადებული კლასის გამოსახულებების ერთმანეთთან და მახასიათებლების მნიშვნელოვანი შედარება (კოგნიტური დიაგრამები, მერლინის დიაგრამების ჩათვლით).

მეთოდი, რომელმაც შესაძლებელი გახადა ამ პრობლემების გადაწყვეტის მიღწევა, ასევე განასხვავებს მასზე დაფუძნებულ პერსპექტიულ სისტემას სხვა სისტემებისგან, ისევე როგორც შემდგენელები განსხვავდებიან ინტერპრეტატორებისგან, რადგან ამ პერსპექტიულ სისტემაში განზოგადებული სურათების ფორმირების გამო, ამოცნობის დრო დამოუკიდებელია. სასწავლო ნიმუშის ზომა. ცნობილია, რომ სწორედ ამ დამოკიდებულების არსებობა იწვევს ისეთ მეთოდებში, როგორიცაა k უახლოესი მეზობლების მეთოდი, ABO და CLD ამოცნობაზე დახარჯული კომპიუტერის პრაქტიკულად მიუღებელ დროს, სავარჯიშო ნიმუშის ისეთ ზომებზე, როდესაც შეგვიძლია ვისაუბროთ საკმარის სტატისტიკაზე. .

ამოცნობის მეთოდების მოკლე მიმოხილვის დასასრულს, ჩვენ წარმოგიდგენთ ზემოაღნიშნულის არსს შემაჯამებელ ცხრილში (ცხრილი 3.1), რომელიც შეიცავს ნიმუშის ამოცნობის სხვადასხვა მეთოდების მოკლე აღწერას შემდეგ პარამეტრებში:

  • ამოცნობის მეთოდების კლასიფიკაცია;
  • აღიარების მეთოდების გამოყენების სფეროები;
  • ამოცნობის მეთოდების შეზღუდვების კლასიფიკაცია.
ამოცნობის მეთოდების კლასიფიკაცია განაცხადის არეალი შეზღუდვები (მინუსები)
ამოცნობის ინტენსიური მეთოდები მეთოდები, რომლებიც დაფუძნებულია მახასიათებლების მნიშვნელობების განაწილების სიმკვრივის შეფასებებზე (ან მსგავსებებსა და განსხვავებებს შორის ობიექტებს შორის) პრობლემები ცნობილი განაწილებით, ჩვეულებრივ ნორმალური, დიდი სტატისტიკის შეგროვების საჭიროება ამოცნობის დროს მთელი სავარჯიშო ნაკრების ჩამოთვლის აუცილებლობა, მაღალი მგრძნობელობა სავარჯიშო ნაკრებისა და არტეფაქტების არაწარმომადგენლობით
გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდები კლასები უნდა იყოს კარგად განცალკევებული, ფუნქციების სისტემა უნდა იყოს ორთონორმალური გადაწყვეტილების ფუნქციის ფორმა წინასწარ უნდა იყოს ცნობილი. მახასიათებლებს შორის კორელაციის შესახებ ახალი ცოდნის გათვალისწინების შეუძლებლობა
ლოგიკური მეთოდები ლოგიკური გადაწყვეტილების წესების (კავშირების) შერჩევისას აუცილებელია სრული ჩამოთვლა. მაღალი გამოთვლითი სირთულე
ლინგვისტური (სტრუქტურული) მეთოდები მხატვრული სივრცის მცირე განზომილების პრობლემები გრამატიკის აღდგენის (განსაზღვრების) ამოცანა განცხადებების გარკვეული ნაკრებიდან (ობიექტების აღწერილობებიდან) რთულია ფორმალიზება. გადაუჭრელი თეორიული პრობლემები
ამოცნობის გაფართოებული მეთოდები პროტოტიპის შედარების მეთოდი მხატვრული სივრცის მცირე განზომილების პრობლემები კლასიფიკაციის შედეგების მაღალი დამოკიდებულება მანძილის ზომებზე (მეტრიკა). უცნობი ოპტიმალური მეტრიკა
k უახლოესი მეზობლის მეთოდი კლასიფიკაციის შედეგების მაღალი დამოკიდებულება მანძილის ზომებზე (მეტრიკა). ამოცნობის დროს სასწავლო ნიმუშის სრული აღრიცხვის აუცილებლობა. გამოთვლითი სირთულე
ნიშნების გამოთვლის ალგორითმები (კენჭისყრა) AVO მცირე განზომილების პრობლემები კლასების რაოდენობისა და მახასიათებლების თვალსაზრისით კლასიფიკაციის შედეგების დამოკიდებულება მანძილის საზომზე (მეტრული). ამოცნობის დროს სასწავლო ნიმუშის სრული აღრიცხვის აუცილებლობა. მეთოდის მაღალი ტექნიკური სირთულე
გადამწყვეტი წესების კოლექტივები (CRC) მცირე განზომილების პრობლემები კლასების რაოდენობისა და მახასიათებლების თვალსაზრისით მეთოდის ძალიან მაღალი ტექნიკური სირთულე, თეორიული პრობლემების გადაუჭრელი რაოდენობა, როგორც კონკრეტული მეთოდების კომპეტენციის სფეროების განსაზღვრისას, ასევე თავად კონკრეტულ მეთოდებში.

ცხრილი 3.1 - ამოცნობის მეთოდების კლასიფიკაციის შემაჯამებელი ცხრილი, მათი გამოყენების სფეროებისა და შეზღუდვების შედარება.

ნიმუშის ამოცნობის როლი და ადგილი რთული სისტემების მართვის ავტომატიზაციაში

ავტომატური მართვის სისტემა შედგება ორი ძირითადი ნაწილისაგან: საკონტროლო ობიექტი და კონტროლის სისტემა.

კონტროლის სისტემა ასრულებს შემდეგ ფუნქციებს:

  • საკონტროლო ობიექტის მდგომარეობის იდენტიფიცირება;
  • მართვის მიზნებიდან გამომდინარე საკონტროლო მოქმედების შემუშავება საკონტროლო ობიექტისა და გარემოს მდგომარეობის გათვალისწინებით;
  • უზრუნველყოფს საკონტროლო ეფექტს საკონტროლო ობიექტზე.

ნიმუშის ამოცნობა სხვა არაფერია, თუ არა რომელიმე ობიექტის მდგომარეობის იდენტიფიკაცია.

ამრიგად, საკონტროლო ობიექტის მდგომარეობის იდენტიფიცირების ეტაპზე ნიმუშის ამოცნობის სისტემის გამოყენების შესაძლებლობა საკმაოდ აშკარა და ბუნებრივი ჩანს. თუმცა, ეს შეიძლება არ იყოს საჭირო. აქედან გამომდინარე, ჩნდება კითხვა, რომელ შემთხვევებში არის მიზანშეწონილი ამოცნობის სისტემის გამოყენება ავტომატური მართვის სისტემაში და რომლებში არა.

ლიტერატურის მონაცემების მიხედვით, ბევრ ადრე შემუშავებულ და თანამედროვე ავტომატიზირებულ მართვის სისტემაში ქვესისტემებში საკონტროლო ობიექტის მდგომარეობის იდენტიფიცირებისა და საკონტროლო მოქმედებების წარმოქმნის მიზნით გამოიყენება „პირდაპირი დათვლის“ დეტერმინისტული მათემატიკური მოდელები, რომლებიც ცალსახად და მარტივად განსაზღვრავს რა. გააკეთეთ საკონტროლო ობიექტთან, თუ მას აქვს გარკვეული გარე პარამეტრები.

ამავდროულად, კითხვა, თუ როგორ არის დაკავშირებული ეს პარამეტრები საკონტროლო ობიექტის გარკვეულ მდგომარეობებთან, არ არის დასმული ან გადაწყვეტილი. ეს პოზიცია შეესაბამება თვალსაზრისს, რომელიც მდგომარეობს იმაში, რომ მათი ერთი-ერთზე ურთიერთობა მიღებულია „ნაგულისხმევად“. ამიტომ ტერმინები: „საკონტროლო ობიექტის პარამეტრები“ და „საკონტროლო ობიექტის მდგომარეობა“ განიხილება სინონიმებად, ხოლო ცნება „საკონტროლო ობიექტის მდგომარეობა“ ცალსახად არ არის შემოტანილი. თუმცა, აშკარაა, რომ ზოგადად, საკონტროლო ობიექტის დაკვირვებულ პარამეტრებსა და მის მდგომარეობას შორის ურთიერთობა დინამიური და სავარაუდოა.

ამრიგად, ტრადიციული ავტომატური მართვის სისტემები არსებითად არის პარამეტრული კონტროლის სისტემები, ე.ი. სისტემები, რომლებიც მართავენ არა საკონტროლო ობიექტის მდგომარეობას, არამედ მხოლოდ მის დაკვირვებად პარამეტრებს. საკონტროლო მოქმედებაზე გადაწყვეტილება მიიღება ისეთ სისტემებში თითქოს „ბრმად“, ე.ი. საკონტროლო ობიექტისა და გარემოს ამჟამინდელ მდგომარეობაში ყოვლისმომცველი გამოსახულების ჩამოყალიბების გარეშე, აგრეთვე გარემოს განვითარებისა და საკონტროლო ობიექტის რეაქციის წინასწარმეტყველების გარეშე მასზე გარკვეული საკონტროლო მოქმედებების მიმართ, მოქმედებენ ერთდროულად გარემოს პროგნოზირებულ გავლენასთან. .

ამ ნაშრომში შემუშავებული პოზიციებიდან გამომდინარე, ტერმინი „გადაწყვეტილების მიღება“ თანამედროვე გაგებით ძნელად გამოიყენება ტრადიციული ავტომატური მართვის სისტემებზე. ფაქტია, რომ „გადაწყვეტილების მიღება“, სულ მცირე, მოიცავს ობიექტის ჰოლისტურ ხედვას გარემოში და არა მხოლოდ მათ ამჟამინდელ მდგომარეობაში, არამედ დინამიკაშიც და ურთიერთქმედებაში როგორც ერთმანეთთან, ისე საკონტროლო სისტემასთან. მოიცავს მთელი ამ სისტემის განვითარების სხვადასხვა ალტერნატიული ვარიანტების განხილვას, ასევე ამ ალტერნატივების მრავალფეროვნების (შემცირების) შემცირებას გარკვეული სამიზნე კრიტერიუმებიდან გამომდინარე. არცერთი მათგანი, ცხადია, არ არის ტრადიციულ ACS-ში, ან არის, მაგრამ გამარტივებული ფორმით.

რა თქმა უნდა, ტრადიციული მეთოდი ადეკვატურია და მისი გამოყენება საკმაოდ სწორი და გამართლებულია იმ შემთხვევებში, როდესაც საკონტროლო ობიექტი მართლაც სტაბილური და მკაცრად განსაზღვრული სისტემაა და მასზე გარემოს გავლენა შეიძლება უგულებელყო.

თუმცა, სხვა შემთხვევებში ეს მეთოდი არაეფექტურია.

თუ საკონტროლო ობიექტი დინამიურია, მაშინ მოდელები, რომლებიც ემყარება მის საკონტროლო ალგორითმებს, სწრაფად ხდება არაადეკვატური, რადგან იცვლება შეყვანისა და გამომავალი პარამეტრებს შორის ურთიერთობა, ისევე როგორც თავად არსებითი პარამეტრების ნაკრები. არსებითად, ეს ნიშნავს, რომ ტრადიციულ ავტომატიზირებულ საკონტროლო სისტემებს შეუძლიათ გააკონტროლონ საკონტროლო ობიექტის მდგომარეობა მხოლოდ წონასწორობის წერტილთან ახლოს მასზე სუსტი კონტროლის მოქმედებების საშუალებით, ე.ი. მცირე დარღვევების მეთოდით. წონასწორობის მდგომარეობიდან შორს, ტრადიციული თვალსაზრისით, საკონტროლო ობიექტის ქცევა გამოიყურება არაპროგნოზირებადი და უკონტროლო.

თუ არ არის ცალსახა კავშირი საკონტროლო ობიექტის შემავალ და გამომავალ პარამეტრებს შორის (ანუ შეყვანის პარამეტრებსა და ობიექტის მდგომარეობას შორის), სხვა სიტყვებით რომ ვთქვათ, თუ ამ ურთიერთობას აქვს გამოხატული ალბათური ბუნება, მაშინ დეტერმინისტული მოდელები, რომელიც ვარაუდობენ, რომ გარკვეული პარამეტრის გაზომვის შედეგი უბრალოდ რიცხვია, თავდაპირველად შეუსაბამო. გარდა ამისა, ამ ურთიერთობის ფორმა შეიძლება უბრალოდ უცნობი იყოს, შემდეგ კი აუცილებელია გავითვალისწინოთ ყველაზე ზოგადი ვარაუდი: რომ ის ალბათურია, ან საერთოდ არ არის განსაზღვრული.

ტრადიციულ პრინციპებზე აგებულ ავტომატურ საკონტროლო სისტემას შეუძლია იმუშაოს მხოლოდ იმ პარამეტრების საფუძველზე, რომელთა ურთიერთობის ნიმუშები უკვე ცნობილია, შესწავლილია და აისახება მათემატიკური მოდელში. სისტემები, რომლებიც საშუალებას მისცემს შექმნას სისტემები, რომლებსაც შეუძლიათ ყველაზე მნიშვნელოვანი პარამეტრების იდენტიფიცირება და დაყენება და მათ შორის კავშირების ბუნება და საკონტროლო ობიექტის მდგომარეობა.

ამ შემთხვევაში აუცილებელია რეალურ სიტუაციაში უფრო განვითარებული და ადეკვატური გაზომვის მეთოდების გამოყენება:

  • კლასიფიკაცია ან ნიმუშის ამოცნობა (სწავლება ტრენინგის ნიმუშზე დაფუძნებული, ამოცნობის ალგორითმების ადაპტირება, კლასების კომპლექტების და შესწავლილი პარამეტრების ადაპტაცია, ყველაზე მნიშვნელოვანი პარამეტრების შერჩევა და აღწერის განზომილების შემცირება მოცემული სიჭარბის შენარჩუნებით და ა.შ.);
  • სტატისტიკური გაზომვები, როდესაც გარკვეული პარამეტრის გაზომვის შედეგი არის არა ერთი რიცხვი, არამედ ალბათობის განაწილება: სტატისტიკური ცვლადის ცვლილება თავისთავად არ ნიშნავს მისი მნიშვნელობის ცვლილებას, არამედ ალბათობის განაწილების მახასიათებლების ცვლილებას. მისი ღირებულებები.

შედეგად, ტრადიციულ დეტერმინისტულ მიდგომაზე დაფუძნებული ავტომატური კონტროლის სისტემები პრაქტიკულად არ მუშაობს რთულ დინამიურ მრავალპარამეტრულ სუსტად განსაზღვრულ საკონტროლო ობიექტებთან, როგორიცაა, მაგალითად, მაკრო და მიკრო-სოციო-ეკონომიკური სისტემები დინამიურ ეკონომიკაში. გარდამავალი პერიოდი“, იერარქიული ელიტა და ეთნიკური ჯგუფები, საზოგადოება და ამომრჩეველი, ადამიანის ფიზიოლოგია და ფსიქიკა, ბუნებრივი და ხელოვნური ეკოსისტემები და მრავალი სხვა.

ძალიან საგულისხმოა, რომ 80-იანი წლების შუა ხანებში ი.პრიგოჟინის სკოლამ შეიმუშავა მიდგომა, რომლის მიხედვითაც ნებისმიერი სისტემის (მათ შორის პიროვნების) განვითარებისას პერიოდები ენაცვლება, რომლებშიც სისტემა იქცევა ან „ძირითადად დეტერმინისტულად“. ან როგორც "ძირითადად შემთხვევითი". ბუნებრივია, რეალურმა საკონტროლო სისტემამ სტაბილურად უნდა მართოს საკონტროლო ობიექტი არა მხოლოდ მისი ისტორიის „დეტერმინისტულ“ მონაკვეთებზე, არამედ იმ მომენტებშიც, როდესაც მისი შემდგომი ქცევა ძალზე გაურკვეველი ხდება. მარტო ეს ნიშნავს, რომ აუცილებელია ისეთი სისტემების მართვის მიდგომების შემუშავება, რომელთა ქცევაში არის შემთხვევითობის დიდი ელემენტი (ან ის, რაც ამჟამად მათემატიკურად არის აღწერილი, როგორც „შემთხვევა“).

მაშასადამე, პერსპექტიული ავტომატური მართვის სისტემების შემადგენლობა, რომლებიც უზრუნველყოფენ რთული დინამიური მრავალპარამეტრული სუსტ დეტერმინისტული სისტემების კონტროლს, როგორც არსებითი ფუნქციონალური რგოლი, აშკარად მოიცავს ქვესისტემებს გარემოსა და კონტროლის ობიექტის მდგომარეობის იდენტიფიკაციისა და პროგნოზირებისთვის, ხელოვნური ინტელექტის მეთოდებზე დაყრდნობით. (პირველ რიგში შაბლონის ამოცნობა), გადაწყვეტილების მიღების მხარდაჭერის მეთოდები და ინფორმაციის თეორია.

მოდით მოკლედ განვიხილოთ გამოსახულების ამომცნობი სისტემების გამოყენების საკითხი საკონტროლო მოქმედების შესახებ გადაწყვეტილების მისაღებად (ეს საკითხი უფრო დეტალურად მოგვიანებით იქნება განხილული, რადგან ეს არის მთავარი ამ სამუშაოსთვის). თუ ავიღებთ საკონტროლო ობიექტის სამიზნეს და სხვა მდგომარეობებს, როგორც ამოცნობის კლასებს, და მასზე გავლენის ფაქტორებს, როგორც მახასიათებლებს, მაშინ ფაქტორებსა და მდგომარეობებს შორის ურთიერთობის საზომი შეიძლება ჩამოყალიბდეს ნიმუშის ამოცნობის მოდელში. ეს საშუალებას გაძლევთ მიიღოთ ინფორმაცია იმ ფაქტორების შესახებ, რომლებიც ხელს უწყობენ ან აფერხებენ მის გადასვლას ამ მდგომარეობაზე, საკონტროლო ობიექტის მოცემული მდგომარეობიდან გამომდინარე და, ამის საფუძველზე, შემუშავდეს გადაწყვეტილება საკონტროლო მოქმედების შესახებ.

ფაქტორები შეიძლება დაიყოს შემდეგ ჯგუფებად:

  • საკონტროლო ობიექტის პრეისტორიის დახასიათება;
  • საკონტროლო ობიექტის მიმდინარე მდგომარეობის დახასიათება;
  • გარემო ფაქტორები;
  • ტექნოლოგიური (მართული) ფაქტორები.

ამრიგად, გამოსახულების ამოცნობის სისტემები შეიძლება გამოყენებულ იქნას როგორც ავტომატური კონტროლის სისტემის ნაწილი: ქვესისტემებში საკონტროლო ობიექტის მდგომარეობის იდენტიფიცირებისთვის და საკონტროლო მოქმედებების გენერირებისთვის.

ეს სასარგებლოა, როდესაც საკონტროლო ობიექტი რთული სისტემაა.

ავტომატური მართვის სისტემაში საკონტროლო მოქმედების შესახებ გადაწყვეტილების მიღება

კომპლექსური სისტემების მიერ ადაპტური ავტომატური მართვის სისტემების სინთეზის პრობლემის გადაწყვეტა განხილულია ამ ნაშრომში, მრავალრიცხოვანი და ღრმა ანალოგიების გათვალისწინებით ნიმუშის ამოცნობისა და გადაწყვეტილების მიღების მეთოდებს შორის.

ერთის მხრივ, ნიმუშის ამოცნობის ამოცანა არის გადაწყვეტილება ცნობადი ობიექტის კუთვნილების შესახებ გარკვეული ამოცნობის კლასში.

მეორე მხრივ, ავტორები გვთავაზობენ გადაწყვეტილების მიღების პრობლემის განხილვას, როგორც დეკოდირების ინვერსიულ პრობლემას ან შაბლონის ამოცნობის ინვერსიულ პრობლემას (იხ. სექცია 2.2.2).

ძირითადი იდეების საერთოობა, რომლებიც საფუძვლად უდევს ნიმუშების ამოცნობისა და გადაწყვეტილების მიღების მეთოდებს, განსაკუთრებით აშკარა ხდება ინფორმაციის თეორიის პოზიციიდან განხილვისას.

გადაწყვეტილების მიმღები ამოცანების მრავალფეროვნება

გადაწყვეტილების მიღება, როგორც მიზნის განხორციელება

განმარტება: გადაწყვეტილების მიღება („არჩევანი“) არის მოქმედება ალტერნატივების ერთობლიობაზე, რის შედეგადაც ვიწროვდება ალტერნატივების თავდაპირველი ნაკრები, ე.ი. ის მცირდება.

არჩევანი არის მოქმედება, რომელიც ანიჭებს მიზანმიმართულობას ყველა აქტივობას. არჩევითი აქტების მეშვეობით ხდება მთელი საქმიანობის დაქვემდებარება კონკრეტულ მიზანზე ან ურთიერთდაკავშირებულ მიზნებზე.

ამდენად, იმისათვის, რომ არჩევანის აქტი გახდეს შესაძლებელი, აუცილებელია შემდეგი:

  • ალტერნატივების ნაკრების შექმნა ან აღმოჩენა, რომლებზედაც უნდა გაკეთდეს არჩევანი;
  • მიზნების განსაზღვრა, რომლის მიღწევისთვისაც ხდება არჩევანი;
  • ალტერნატივების ერთმანეთთან შედარების მეთოდის შემუშავება და გამოყენება, ე.ი. თითოეული ალტერნატივის უპირატესობის რეიტინგის განსაზღვრა გარკვეული კრიტერიუმების მიხედვით, რაც საშუალებას იძლევა ირიბად შეფასდეს, თუ როგორ აკმაყოფილებს თითოეული ალტერნატივა მიზანს.

გადაწყვეტილების მხარდაჭერის სფეროში თანამედროვე მუშაობამ გამოავლინა დამახასიათებელი სიტუაცია, რომელიც მდგომარეობს იმაში, რომ საუკეთესო (გარკვეული გაგებით) გადაწყვეტის პოვნის სრული ფორმალიზაცია შესაძლებელია მხოლოდ კარგად შესწავლილი, შედარებით მარტივი პრობლემებისთვის, მაშინ როცა პრაქტიკაში, უფრო ხშირია სუსტად სტრუქტურირებული პრობლემები, რომლებისთვისაც არ არის შემუშავებული სრულიად ფორმალიზებული ალგორითმები (გარდა ამომწურავი ჩამოთვლისა და საცდელი-შეცდომისა). თუმცა, გამოცდილი, კომპეტენტური და უნარიანი პროფესიონალები ხშირად აკეთებენ არჩევანს, რომელიც საკმაოდ კარგი გამოდის. მაშასადამე, ბუნებრივ სიტუაციებში გადაწყვეტილების მიღების პრაქტიკაში მიმდინარე ტენდენცია არის არაფორმალური პრობლემების გადაჭრის პიროვნების უნარის გაერთიანება ფორმალური მეთოდებისა და კომპიუტერული მოდელირების შესაძლებლობებთან: გადაწყვეტილების მხარდაჭერის ინტერაქტიული სისტემები, საექსპერტო სისტემები, ადაპტირებული ადამიანი-მანქანა ავტომატიზირებული. კონტროლის სისტემები, ნერვული ქსელები და კოგნიტური სისტემები.

გადაწყვეტილების მიღება, როგორც გაურკვევლობის მოხსნა (ინფორმაციული მიდგომა)

ინფორმაციის მიღების პროცესი შეიძლება ჩაითვალოს სიგნალის მიღების შედეგად გაურკვევლობის შემცირებად, ხოლო ინფორმაციის რაოდენობა გაურკვევლობის მოხსნის ხარისხის რაოდენობრივ საზომად.

მაგრამ კომპლექტიდან ალტერნატივების ზოგიერთი ქვეჯგუფის არჩევის შედეგად, ე.ი. გადაწყვეტილების მიღების შედეგად ხდება იგივე (გაურკვევლობის დაქვეითება). ეს ნიშნავს, რომ ყოველი არჩევანი, ყოველი გადაწყვეტილება წარმოშობს გარკვეული რაოდენობის ინფორმაციას და, შესაბამისად, შეიძლება აღწერილი იყოს ინფორმაციის თეორიის თვალსაზრისით.

გადაწყვეტილების მიღების პრობლემების კლასიფიკაცია

გადაწყვეტილების მიმღები ამოცანების სიმრავლე განპირობებულია იმით, რომ სიტუაციის თითოეული კომპონენტი, რომელშიც ხდება გადაწყვეტილების მიღება, შეიძლება განხორციელდეს თვისობრივად განსხვავებული ვარიანტებით.

აქ მოცემულია ამ ვარიანტებიდან მხოლოდ რამდენიმე:

  • ალტერნატივების ნაკრები, ერთი მხრივ, შეიძლება იყოს სასრული, თვლადი ან უწყვეტი, ხოლო მეორეს მხრივ, დახურული (ანუ სრულიად ცნობილი) ან ღია (მათ შორის უცნობი ელემენტები);
  • ალტერნატივა შეიძლება შეფასდეს ერთი ან რამდენიმე კრიტერიუმის მიხედვით, რომელიც, თავის მხრივ, შეიძლება იყოს რაოდენობრივი ან ხარისხობრივი;
  • არჩევანის რეჟიმი შეიძლება იყოს ერთჯერადი (ერთჯერადი), ან მრავალჯერადი, განმეორებადი, არჩევანის შედეგებზე უკუკავშირის ჩათვლით, ე.ი. გადაწყვეტილების მიღების ალგორითმების სწავლის დაშვება წინა არჩევნების შედეგების გათვალისწინებით;
  • თითოეული ალტერნატივის არჩევის შედეგები შეიძლება წინასწარ იყოს ზუსტად ცნობილი (არჩევა დარწმუნებით), ჰქონდეს ალბათური ბუნება, როდესაც შესაძლო შედეგების ალბათობა ცნობილია არჩევანის გაკეთების შემდეგ (არჩევანი რისკის ქვეშ) ან აქვს ბუნდოვანი შედეგი უცნობი ალბათობით (არჩევანი გაურკვევლობის პირობებში);
  • არჩევანზე პასუხისმგებლობა შეიძლება არ იყოს, იყოს ინდივიდუალური ან ჯგუფური;
  • ჯგუფურ არჩევანში მიზნების თანმიმდევრულობის ხარისხი შეიძლება განსხვავდებოდეს მხარეთა ინტერესების სრული დამთხვევიდან (კოოპერატიული არჩევანი) მათ საპირისპირომდე (არჩევანი კონფლიქტურ სიტუაციაში). ასევე შესაძლებელია შუალედური ვარიანტები: კომპრომისი, კოალიცია, მზარდი ან ჩამქრალი კონფლიქტი.

ამ ვარიანტების სხვადასხვა კომბინაცია იწვევს გადაწყვეტილების მიღების მრავალ პრობლემას, რომლებიც შესწავლილია სხვადასხვა ხარისხით.

ენები გადაწყვეტილების მიღების მეთოდების აღწერისთვის

ერთსა და იმავე ფენომენზე შეიძლება საუბარი სხვადასხვა ენებზე ზოგადისა და ადეკვატურობის სხვადასხვა ხარისხით. დღემდე, არჩევანის აღწერისთვის სამი ძირითადი ენა იყო.

უმარტივესი, ყველაზე განვითარებული და ყველაზე პოპულარული კრიტერიუმი ენაა.

კრიტერიუმების ენა

ამ ენის სახელს უკავშირდება ძირითადი ვარაუდი, რომ თითოეული ინდივიდუალური ალტერნატივა შეიძლება შეფასდეს რაიმე კონკრეტული (ერთი) რიცხვით, რის შემდეგაც ალტერნატივების შედარება მცირდება მათი შესაბამისი რიცხვების შედარებამდე.

მოდით, მაგალითად, (X) იყოს ალტერნატივების სიმრავლე, ხოლო x იყოს გარკვეული ალტერნატივა, რომელიც მიეკუთვნება ამ სიმრავლეს: x∈X. მაშინ ითვლება, რომ ყველა x-ისთვის შეიძლება მიენიჭოს q(x) ფუნქცია, რომელსაც ეწოდება კრიტერიუმი (ხარისხის კრიტერიუმი, ობიექტური ფუნქცია, უპირატესობის ფუნქცია, სასარგებლო ფუნქცია და ა.შ.), რომელსაც აქვს თვისება, რომ თუ ალტერნატივა x 1 არის სასურველია x 2 (აღნიშნავს: x 1 > x 2), შემდეგ q (x 1) > q (x 2).

ამ შემთხვევაში არჩევანი მცირდება კრიტერიუმის ფუნქციის უმაღლესი მნიშვნელობის მქონე ალტერნატივის პოვნამდე.

თუმცა, პრაქტიკაში, ალტერნატივების უპირატესობის ხარისხის შედარებისთვის მხოლოდ ერთი კრიტერიუმის გამოყენება აღმოჩნდება გაუმართლებელი გამარტივება, რადგან ალტერნატივების უფრო დეტალური განხილვა იწვევს მათი არა ერთის, არამედ მრავალის მიხედვით შეფასების აუცილებლობას. კრიტერიუმები, რომლებიც შეიძლება იყოს განსხვავებული ხასიათის და ხარისხობრივად განსხვავებული ერთმანეთისგან.

მაგალითად, გარკვეული ტიპის მარშრუტებზე მგზავრებისა და მოქმედი ორგანიზაციისთვის ყველაზე მისაღები ტიპის თვითმფრინავის არჩევისას, შედარება ხდება ერთდროულად მრავალი ჯგუფის კრიტერიუმების მიხედვით: ტექნიკური, ტექნოლოგიური, ეკონომიკური, სოციალური, ერგონომიული და ა.შ.

მრავალკრიტერიუმულ ამოცანებს არ აქვთ უნიკალური ზოგადი გადაწყვეტა. ამიტომ, შემოთავაზებულია მრავალი გზა, რათა მულტიკრიტერიუმულ პრობლემას მივცეთ კონკრეტული ფორმა, რომელიც იძლევა ერთიანი ზოგადი გადაწყვეტის საშუალებას. ბუნებრივია, ეს გადაწყვეტილებები ზოგადად განსხვავებულია სხვადასხვა მეთოდისთვის. ამიტომ, შესაძლოა, მთავარი მრავალკრიტერიუმიანი პრობლემის გადაჭრაში არის მისი ამ ტიპის ფორმულირების დასაბუთება.

მრავალკრიტერიუმების შერჩევის პრობლემის გამარტივების სხვადასხვა ვარიანტები გამოიყენება. ჩამოვთვალოთ რამდენიმე მათგანი.

  1. პირობითი მაქსიმიზაცია (აღმოჩენილია არა ინტეგრალური კრიტერიუმის გლობალური ექსტრემი, არამედ მთავარი კრიტერიუმის ლოკალური ექსტრემი).
  2. მოძებნეთ ალტერნატივა მოცემული თვისებებით.
  3. პარეტოს ნაკრების პოვნა.
  4. მრავალკრიტერიუმიანი ამოცანის ერთკრიტერიუმამდე შემცირება ინტეგრალური კრიტერიუმის შემოღებით.

მოდით უფრო დეტალურად განვიხილოთ მრავალკრიტერიუმიანი პრობლემის ერთკრიტერიუმამდე შემცირების მეთოდის ფორმალური ფორმულირება.

ჩვენ შემოგთავაზებთ ინტეგრალურ კრიტერიუმს q 0 (x), როგორც ვექტორული არგუმენტის სკალარული ფუნქცია:

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

ინტეგრალური კრიტერიუმი შესაძლებელს ხდის ალტერნატივების მოწესრიგებას q 0-ით, რითაც ხაზს უსვამს საუკეთესოს (ამ კრიტერიუმის გაგებით). q 0 ფუნქციის ფორმა განისაზღვრება იმით, თუ რამდენად კონკრეტულად წარმოგვიდგენია თითოეული კრიტერიუმის წვლილი ინტეგრალურ კრიტერიუმში. ჩვეულებრივ გამოიყენება დანამატი და გამრავლების ფუნქციები:

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

კოეფიციენტები მე გთავაზობთ:

  1. განზომილება ან a i ⋅q i /s i რიცხვის ერთი განზომილება (სხვადასხვა კონკრეტულ კრიტერიუმს შეიძლება ჰქონდეს განსხვავებული განზომილებები და მაშინ შეუძლებელია მათზე არითმეტიკული მოქმედებების შესრულება და მათი ინტეგრალურ კრიტერიუმამდე დაყვანა).
  2. ნორმალიზაცია, ე.ი. პირობის უზრუნველყოფა: b i ⋅q i /s i<1.

a i და b i კოეფიციენტები ასახავს კონკრეტული კრიტერიუმის q i შეფარდებულ წვლილს ინტეგრალურ კრიტერიუმში.

ასე რომ, მრავალკრიტერიუმულ გარემოში, ერთ-ერთი ალტერნატივის არჩევის შესახებ გადაწყვეტილების მიღების პრობლემა მცირდება ინტეგრალური კრიტერიუმის მაქსიმიზაციამდე:

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

გადაწყვეტილების მიღების პრობლემის მულტიკრიტერიუმული ფორმულირების მთავარი პრობლემა არის ის, რომ აუცილებელია a i და b i კოეფიციენტების ისეთი ანალიტიკური ფორმის პოვნა, რომელიც უზრუნველყოფს მოდელის შემდეგ თვისებებს:

  • საგნობრივი სფეროსა და ექსპერტების თვალსაზრისის ადეკვატურობის მაღალი ხარისხი;
  • მინიმალური გამოთვლითი სირთულეები ინტეგრალური კრიტერიუმის მაქსიმიზაციაში, ე.ი. მისი გაანგარიშება სხვადასხვა ალტერნატივისთვის;
  • ინტეგრალური კრიტერიუმის მაქსიმალური გაზრდის შედეგების სტაბილურობა საწყისი მონაცემების მცირე აურზაურებიდან.
  • გადაწყვეტის სტაბილურობა ნიშნავს, რომ საწყის მონაცემებში მცირე ცვლილებამ უნდა გამოიწვიოს ინტეგრალური კრიტერიუმის მნიშვნელობის მცირე ცვლილება და, შესაბამისად, მიღებული გადაწყვეტილების მცირე ცვლილება. ამრიგად, თუ საწყისი მონაცემები პრაქტიკულად ერთნაირია, მაშინ გადაწყვეტილება უნდა იქნას მიღებული ან იგივე ან ძალიან ახლოს.

თანმიმდევრული ორობითი შერჩევის ენა

ორობითი მიმართებების ენა არის მრავალკრიტერიუმიანი ენის განზოგადება და ეფუძნება იმ ფაქტს, რომ როდესაც ვაფასებთ რაიმე ალტერნატივას, ეს შეფასება ყოველთვის ფარდობითია, ე.ი. ცალსახად ან უფრო ხშირად ირიბად, სხვა ალტერნატივები შესწავლილი ნაკრებიდან ან ზოგადი პოპულაციიდან გამოიყენება შედარების საფუძვლად ან საცნობარო ჩარჩოდ. ადამიანის აზროვნება დაფუძნებულია საპირისპირო (კონსტრუქციების) ძიებასა და ანალიზზე, ამიტომ ჩვენთვის ყოველთვის უფრო ადვილია ავირჩიოთ ორი საპირისპირო ვარიანტიდან ერთი, ვიდრე ერთი ვარიანტი დიდი და არავითარ შემთხვევაში არეულ-დარეული ნაკრებიდან.

ამრიგად, ამ ენის ძირითადი ვარაუდები შემდეგნაირად იშლება:

  • არ ფასდება ერთი ალტერნატივა, ე.ი. კრიტერიუმის ფუნქცია არ არის შემოღებული;
  • ალტერნატივების თითოეული წყვილისთვის შეიძლება დადგინდეს, რომ ერთი მათგანი უპირატესობას ანიჭებს მეორეს, ან რომ ისინი ექვივალენტური ან შეუდარებელია;
  • ალტერნატივების ნებისმიერ წყვილში უპირატესობის კავშირი არ არის დამოკიდებული არჩევანისთვის წარმოდგენილ სხვა ალტერნატივებზე.

ბინარული ურთიერთობების დაზუსტების სხვადასხვა გზა არსებობს: პირდაპირი, მატრიცული, პრიორიტეტული გრაფიკების გამოყენებით, სექციების მეთოდი და ა.შ.

ერთი წყვილის ალტერნატივებს შორის ურთიერთობა გამოიხატება ეკვივალენტობის, რიგისა და დომინანტობის ცნებებით.

არჩევანის განზოგადებული ენის ფუნქციები

არჩევანის ფუნქციების ენა დაფუძნებულია სიმრავლეების თეორიაზე და საშუალებას აძლევს ადამიანს იმუშაოს კომპლექტების რუკებით მათ ქვეჯგუფებთან, რომლებიც შეესაბამება სხვადასხვა არჩევანს ელემენტების ჩამოთვლის გარეშე. ეს ენა ძალიან ზოგადია და პოტენციურად იძლევა ნებისმიერი არჩევანის აღწერას. თუმცა, განზოგადებული არჩევანის ფუნქციების მათემატიკური აპარატი ამჟამად მხოლოდ შემუშავებული და ტესტირებადია ძირითადად იმ პრობლემებზე, რომლებიც უკვე გადაჭრილია კრიტერიუმული ან ბინარული მიდგომების გამოყენებით.

ჯგუფური არჩევანი

დაე, იყოს ადამიანთა ჯგუფი, რომელსაც აქვს უფლება მონაწილეობა მიიღოს კოლექტიური გადაწყვეტილების მიღებაში. დავუშვათ, რომ ეს ჯგუფი განიხილავს ალტერნატივების კომპლექტს და ჯგუფის თითოეული წევრი აკეთებს არჩევანს. ამოცანაა ისეთი გადაწყვეტის შემუშავება, რომელიც გარკვეულწილად კოორდინაციას გაუწევს ინდივიდუალურ არჩევანს და გარკვეულწილად გამოხატავს ჯგუფის „ზოგად აზრს“, ე.ი. მიღებული როგორც ჯგუფური არჩევანი.

ბუნებრივია, სხვადასხვა ჯგუფური გადაწყვეტილება შეესატყვისება ინდივიდუალური გადაწყვეტილებების კოორდინაციის სხვადასხვა პრინციპებს.

ჯგუფურ არჩევანში ინდივიდუალური გადაწყვეტილებების კოორდინაციის წესებს ხმის მიცემის წესები ეწოდება. ყველაზე გავრცელებულია „უმრავლესობის წესი“, რომლის დროსაც ჯგუფის გადაწყვეტილებას იღებს ალტერნატივა, რომელიც ყველაზე მეტ ხმას მიიღებს.

უნდა გვესმოდეს, რომ ასეთი გადაწყვეტილება მხოლოდ ასახავს ჯგუფში სხვადასხვა თვალსაზრისის გავრცელებას და არა ჭეშმარიტად ოპტიმალურ ვარიანტს, რომლისთვისაც ხმა საერთოდ არავის შეუძლია. „სიმართლე კენჭისყრით არ განისაზღვრება“.

გარდა ამისა, არსებობს ეგრეთ წოდებული „ხმის მიცემის პარადოქსები“, რომელთაგან ყველაზე ცნობილია ისრის პარადოქსი.

ამ პარადოქსებმა შეიძლება გამოიწვიოს და ზოგჯერ იწვევს ხმის მიცემის პროცედურის ძალიან უსიამოვნო მახასიათებლებს: მაგალითად, არის შემთხვევები, როდესაც ჯგუფი საერთოდ ვერ იღებს ერთ გადაწყვეტილებას (ქვორუმი არ არის ან ყველა ხმას აძლევს საკუთარ უნიკალურ ვარიანტს და ა.შ. .), და ზოგჯერ (მრავალეტაპიანი კენჭისყრისას) უმცირესობას შეუძლია თავისი ნება დააკისროს უმრავლესობას.

არჩევანი გაურკვევლობის პირობებში

სიზუსტე გაურკვევლობის განსაკუთრებული შემთხვევაა, კერძოდ: ეს არის გაურკვევლობა ნულთან ახლოს.

არჩევანის თანამედროვე თეორიაში მიჩნეულია, რომ გადაწყვეტილების მიღების პრობლემებში არსებობს გაურკვევლობის სამი ძირითადი ტიპი:

  1. გადაწყვეტილების მიღებისათვის საწყისი მონაცემების ინფორმაციული (სტატისტიკური) გაურკვევლობა.
  2. გადაწყვეტილების მიღების შედეგების გაურკვევლობა (არჩევანი).
  3. გაურკვევლობა გადაწყვეტილების მიღების პროცესის კომპონენტების აღწერაში.

განვიხილოთ ისინი თანმიმდევრობით.

ინფორმაციული (სტატისტიკური) გაურკვევლობა საწყის მონაცემებში

საგნის მიმართ მიღებული მონაცემები არ შეიძლება ჩაითვალოს აბსოლუტურად ზუსტი. გარდა ამისა, აშკარაა, რომ ეს მონაცემები არ გვაინტერესებს თავისთავად, არამედ მხოლოდ როგორც სიგნალები, რომლებიც, შესაძლოა, ატარებენ გარკვეულ ინფორმაციას იმის შესახებ, თუ რა გვაინტერესებს სინამდვილეში. ამრიგად, უფრო რეალურია იმის გათვალისწინება, რომ საქმე გვაქვს არა მხოლოდ ხმაურიან და არაზუსტ, არამედ არაპირდაპირ და შესაძლოა არასრულ მონაცემებთან. გარდა ამისა, ეს მონაცემები არ ეხება მთელ შესწავლილ (ზოგად) პოპულაციას, არამედ მხოლოდ მის გარკვეულ ქვეჯგუფს, რომლის შესახებაც ჩვენ რეალურად შევძელით მონაცემების შეგროვება, მაგრამ ამავე დროს გვინდა გამოვიტანოთ დასკვნები მთლიან პოპულაციაზე და ჩვენ ასევე გვინდა ვიცოდეთ ამ დასკვნების სანდოობის ხარისხი.

ამ პირობებში გამოიყენება სტატისტიკური გადაწყვეტილებების თეორია.

ამ თეორიაში გაურკვევლობის ორი ძირითადი წყაროა. ჯერ ერთი, უცნობია, რა განაწილებას ემორჩილება თავდაპირველი მონაცემები. მეორეც, არ არის ცნობილი, რა განაწილება აქვს კომპლექტს (ზოგად პოპულაციას), რომლის შესახებაც გვინდა გამოვიტანოთ დასკვნები მისი ქვეჯგუფიდან, რომელიც ქმნის საწყის მონაცემებს.

სტატისტიკური პროცედურები არის გადაწყვეტილების მიღების პროცედურები, რომლებიც ხსნის ორივე ამ ტიპის გაურკვევლობას.

უნდა აღინიშნოს, რომ არსებობს მრავალი მიზეზი, რაც იწვევს სტატისტიკური მეთოდების არასწორ გამოყენებას:

  • სტატისტიკურ დასკვნებს, ისევე როგორც ნებისმიერ სხვას, ყოველთვის აქვს გარკვეული სანდოობა ან დარწმუნება. მაგრამ, ბევრი სხვა შემთხვევისგან განსხვავებით, სტატისტიკური დასკვნების სანდოობა ცნობილია და განისაზღვრება სტატისტიკური კვლევის დროს;
  • სტატისტიკური პროცედურის გამოყენების შედეგად მიღებული ხსნარის ხარისხი დამოკიდებულია საწყისი მონაცემების ხარისხზე;
  • მონაცემები, რომლებსაც არ გააჩნიათ სტატისტიკური ხასიათი, არ უნდა ექვემდებარებოდეს სტატისტიკურ დამუშავებას;
  • აუცილებელია გამოვიყენოთ სტატისტიკური პროცედურები, რომლებიც შეესაბამება შესწავლილი პოპულაციის შესახებ აპრიორული ინფორმაციის დონეს (მაგალითად, არ უნდა გამოიყენოთ დისპერსიის ანალიზის მეთოდები არაგაუსიანულ მონაცემებზე). თუ ორიგინალური მონაცემების განაწილება უცნობია, მაშინ ან უნდა დაადგინოთ იგი, ან გამოიყენოთ რამდენიმე განსხვავებული მეთოდი და შევადაროთ შედეგები. თუ ისინი ძალიან განსხვავდებიან, ეს მიუთითებს გამოყენებული ზოგიერთი პროცედურის შეუსრულებლობაზე.

შედეგების გაურკვევლობა

როდესაც ალტერნატივის არჩევის შედეგებს ცალსახად განსაზღვრავს თავად ალტერნატივა, მაშინ ჩვენ ვერ განვასხვავებთ ალტერნატივას და მის შედეგებს, მიგვაჩნია, რომ ალტერნატივის არჩევისას ჩვენ რეალურად ვირჩევთ მის შედეგებს.

თუმცა რეალურ პრაქტიკაში ხშირად უწევს საქმე უფრო რთულ სიტუაციასთან, როდესაც ამა თუ იმ ალტერნატივის არჩევანი ორაზროვნად განსაზღვრავს გაკეთებული არჩევანის შედეგებს.

ალტერნატივებისა და მათი არჩეული შედეგების დისკრეტული ნაკრების შემთხვევაში, იმ პირობით, რომ შესაძლო შედეგების ნაკრები საერთოა ყველა ალტერნატივისთვის, შეგვიძლია ვივარაუდოთ, რომ სხვადასხვა ალტერნატივები ერთმანეთისგან განსხვავდება შედეგის ალბათობების განაწილებით. ეს ალბათობის განაწილება, ზოგად შემთხვევაში, შეიძლება დამოკიდებული იყოს ალტერნატივების არჩევის შედეგებზე და მის შედეგად რეალურად წარმოქმნილ შედეგებზე. უმარტივეს შემთხვევაში, შედეგები თანაბრად სავარაუდოა. თავად შედეგებს, როგორც წესი, აქვს მოგების ან ზარალის მნიშვნელობა და რაოდენობრივია.

თუ შედეგები თანაბარია ყველა ალტერნატივისთვის, მაშინ არჩევანის გაკეთება არაფერია. თუ ისინი განსხვავდებიან, მაშინ ალტერნატივების შედარება შესაძლებელია მათთვის გარკვეული რაოდენობრივი შეფასებების შემოღებით. თამაშის თეორიაში პრობლემების მრავალფეროვნება ასოცირდება ალტერნატივების არჩევის შედეგად დანაკარგებისა და მოგების რიცხვითი მახასიათებლების განსხვავებულ არჩევანთან, ალტერნატივის არჩევის მხარეებს შორის კონფლიქტის სხვადასხვა ხარისხთან და ა.შ.

განვიხილოთ ამ ტიპის გაურკვევლობა, როგორც ბუნდოვანი გაურკვევლობა

არჩევანის ნებისმიერი პრობლემა არის ალტერნატივების ნაკრების მიზნის შევიწროება. როგორც ალტერნატივების ფორმალური აღწერა (თავად მათი სია, მათი ატრიბუტებისა თუ პარამეტრების ჩამონათვალი) და მათი შედარების წესების აღწერა (კრიტერიუმები, ურთიერთობები) ყოველთვის მოცემულია ამა თუ იმ საზომი სკალის მიხედვით (მაშინაც კი, როდესაც ის ამან არ იცის ამის შესახებ).

ცნობილია, რომ ყველა სასწორი ბუნდოვანია, მაგრამ სხვადასხვა ხარისხით. ტერმინი „დაბინდვა“ გულისხმობს სასწორის თვისებას, რომელიც მდგომარეობს იმაში, რომ ყოველთვის შესაძლებელია წარმოვადგინოთ ორი განსხვავებული ალტერნატივა, ე.ი. განსხვავებული ერთი მასშტაბით და განუსხვავებელი, ე.ი. იდენტურია, მეორეში - უფრო ბუნდოვანი. რაც უფრო ნაკლებია გრადაცია გარკვეულ მასშტაბში, მით უფრო ბუნდოვანია.

ამრიგად, ჩვენ შეგვიძლია ნათლად დავინახოთ ალტერნატივები და ამავე დროს ბუნდოვნად დავახარისხოთ ისინი, ე.ი. იყოს ორაზროვანი, თუ რომელ კლასებს მიეკუთვნებიან.

უკვე ბუნდოვან სიტუაციაში გადაწყვეტილების მიღების შესახებ მათ პირველ ნაშრომში, ბელმანმა და ზადემ წამოაყენეს იდეა, რომ ორივე მიზნები და შეზღუდვები უნდა იყოს წარმოდგენილი ალტერნატივების ერთობლიობაში ბუნდოვანი (ბუნდოვანი) კომპლექტების სახით.

ოპტიმიზაციის მიდგომის ზოგიერთი შეზღუდვის შესახებ

ყველა ზემოთ განხილულ შერჩევის პრობლემასა და გადაწყვეტილების მიღების მეთოდში პრობლემა იყო საწყის ნაკრებში საუკეთესოების პოვნა მოცემულ პირობებში, ე.ი. ოპტიმალური ალტერნატივები გარკვეული გაგებით.

ოპტიმალურობის იდეა კიბერნეტიკის ცენტრალური იდეაა და მტკიცედ შევიდა ტექნიკური სისტემების დიზაინისა და ექსპლუატაციის პრაქტიკაში. ამავდროულად, ეს იდეა მოითხოვს ფრთხილ დამოკიდებულებას, როდესაც ვცდილობთ მის გადატანას რთული, დიდი და სუსტად განსაზღვრული სისტემების მართვის სფეროში, როგორიცაა, მაგალითად, სოციალურ-ეკონომიკური სისტემები.

ამ დასკვნის კარგი მიზეზები არსებობს. განვიხილოთ ზოგიერთი მათგანი:

  1. ოპტიმალური გადაწყვეტა ხშირად გამოდის არასტაბილური, ე.ი. პრობლემის პირობებში, შეყვანის მონაცემების ან შეზღუდვების უმნიშვნელო ცვლილებებმა შეიძლება გამოიწვიოს მნიშვნელოვნად განსხვავებული ალტერნატივების შერჩევა.
  2. ოპტიმიზაციის მოდელები შემუშავებულია მხოლოდ საკმაოდ მარტივი ამოცანების ვიწრო კლასებისთვის, რომლებიც ყოველთვის ადეკვატურად და სისტემატურად არ ასახავს რეალურ საკონტროლო ობიექტებს. ყველაზე ხშირად, ოპტიმიზაციის მეთოდები შესაძლებელს ხდის ზოგიერთი დიდი და რთული სისტემის მხოლოდ საკმაოდ მარტივი და კარგად ფორმალურად აღწერილი ქვესისტემების ოპტიმიზაციას, ე.ი. დაუშვით მხოლოდ ადგილობრივი ოპტიმიზაცია. თუმცა, თუ რომელიმე დიდი სისტემის თითოეული ქვესისტემა ოპტიმალურად მუშაობს, ეს საერთოდ არ ნიშნავს იმას, რომ მთლიანობაში სისტემაც ოპტიმალურად იმუშავებს. ამიტომ, ქვესისტემის ოპტიმიზაცია სულაც არ იწვევს მის ქცევას, რაც მას მოეთხოვება მთლიანი სისტემის ოპტიმიზაციისას. უფრო მეტიც, ზოგჯერ ლოკალურმა ოპტიმიზაციამ შეიძლება გამოიწვიოს უარყოფითი შედეგები მთლიანად სისტემისთვის. ამიტომ, ქვესისტემების და მთლიანად სისტემის ოპტიმიზაციისას აუცილებელია განვსაზღვროთ მიზნებისა და ქვემიზნების ხე და მათი პრიორიტეტი.
  3. ხშირად ოპტიმიზაციის მიზნად ითვლება ოპტიმიზაციის კრიტერიუმის მაქსიმიზაცია რომელიმე მათემატიკური მოდელის მიხედვით, მაგრამ სინამდვილეში მიზანი საკონტროლო ობიექტის ოპტიმიზაციაა. ოპტიმიზაციის კრიტერიუმები და მათემატიკური მოდელები ყოველთვის მხოლოდ ირიბად არის დაკავშირებული მიზანთან, ე.ი. მეტ-ნაკლებად ადეკვატური, მაგრამ ყოველთვის მიახლოებითი.

ამრიგად, ოპტიმალურობის იდეა, რომელიც უკიდურესად ნაყოფიერია სისტემებისთვის, რომლებიც ადეკვატური მათემატიკური ფორმალიზაციას ექვემდებარება, სიფრთხილით უნდა გადავიდეს რთულ სისტემებზე. რა თქმა უნდა, მათემატიკური მოდელები, რომლებიც ზოგჯერ შეიძლება შემოთავაზებული იყოს ასეთი სისტემებისთვის, შეიძლება ოპტიმიზირებული იყოს. თუმცა, ყოველთვის უნდა გავითვალისწინოთ ამ მოდელების ძლიერი გამარტივება, რაც რთული სისტემების შემთხვევაში უგულებელყოფა აღარ შეიძლება, ისევე როგორც ის ფაქტი, რომ ამ მოდელების ადეკვატურობის ხარისხი რთული სისტემების შემთხვევაში რეალურად უცნობია. . აქედან გამომდინარე, უცნობია, რა წმინდა პრაქტიკული მნიშვნელობა აქვს ამ ოპტიმიზაციას. ტექნიკურ სისტემებში ოპტიმიზაციის მაღალი პრაქტიკულობა არ უნდა წარმოშობს ილუზიას, რომ ის ისეთივე ეფექტური იქნება რთული სისტემების ოპტიმიზაციისთვის. რთული სისტემების აზრიანი მათემატიკური მოდელირება ძალიან რთული, მიახლოებითი და არაზუსტია. რაც უფრო რთულია სისტემა, მით უფრო ფრთხილად უნდა იყოს მისი ოპტიმიზაციის იდეა.

ამიტომ, რთული, დიდი, სუსტად განსაზღვრული სისტემებისთვის კონტროლის მეთოდების შემუშავებისას, ავტორები უმთავრესად მიიჩნევენ არა მხოლოდ არჩეული მიდგომის ოპტიმალურობას ფორმალური მათემატიკური თვალსაზრისით, არამედ მის ადეკვატურობას მიზანთან და საკუთრივ ბუნებასთან. საკონტროლო ობიექტი.

ექსპერტების შერჩევის მეთოდები

რთული სისტემების შესწავლისას ხშირად ჩნდება პრობლემები, რომლებიც, სხვადასხვა მიზეზის გამო, არ შეიძლება მკაცრად დაისვას და გადაჭრას ამჟამად განვითარებული მათემატიკური აპარატის გამოყენებით. ამ შემთხვევაში მიმართავენ ექსპერტების (სისტემის ანალიტიკოსების) მომსახურებას, რომელთა გამოცდილება და ინტუიცია პრობლემის სირთულის შემცირებას უწყობს ხელს.

თუმცა, გასათვალისწინებელია, რომ ექსპერტები თავად არიან უაღრესად რთული სისტემები და მათი საქმიანობა ასევე დამოკიდებულია ბევრ გარე და შიდა პირობებზე. ამიტომ, საექსპერტო შეფასებების ორგანიზების მეთოდებში დიდი ყურადღება ეთმობა ექსპერტების მუშაობისთვის ხელსაყრელი გარე და ფსიქოლოგიური პირობების შექმნას.

შემდეგი ფაქტორები გავლენას ახდენს ექსპერტის მუშაობაზე:

  • პასუხისმგებლობა გამოცდის შედეგების გამოყენებაზე;
  • იმის ცოდნა, რომ ჩართული არიან სხვა ექსპერტები;
  • ექსპერტებს შორის ინფორმაციული კონტაქტის ხელმისაწვდომობა;
  • ექსპერტთა ინტერპერსონალური ურთიერთობები (თუ მათ შორის არის საინფორმაციო კონტაქტი);
  • ექსპერტის პირადი ინტერესი შეფასების შედეგებით;
  • ექსპერტების პიროვნული თვისებები (თვითშეფასება, შესაბამისობა, ნება და ა.შ.)

ექსპერტებს შორის ურთიერთქმედებამ შეიძლება გამოიწვიოს ან შეაფერხოს მათი აქტივობა. ამიტომ, სხვადასხვა შემთხვევაში გამოიყენება გამოკვლევის სხვადასხვა მეთოდი, რომლებიც განსხვავდება ექსპერტების ერთმანეთთან ურთიერთქმედების ხასიათით: ანონიმური და ღია გამოკითხვები და კითხვარები, შეხვედრები, დისკუსიები, საქმიანი თამაშები, გონებრივი შტურმი და ა.შ.

არსებობს ექსპერტთა მოსაზრებების მათემატიკური დამუშავების სხვადასხვა მეთოდი. ექსპერტებს სთხოვენ შეაფასონ სხვადასხვა ალტერნატივა ერთი ან ინდიკატორების სისტემით. გარდა ამისა, მათ სთხოვენ შეაფასონ თითოეული ინდიკატორის მნიშვნელობის ხარისხი (მისი „წონა“ ან „წვლილი“). თავად ექსპერტებს ასევე ენიჭებათ კომპეტენციის დონე, რომელიც შეესაბამება თითოეული მათგანის წვლილს ჯგუფის შედეგებში.

ექსპერტებთან მუშაობის შემუშავებული მეთოდია „დელფის“ მეთოდი. ამ მეთოდის მთავარი იდეა ისაა, რომ კრიტიკა და არგუმენტაცია სასარგებლო გავლენას ახდენს ექსპერტზე, თუ მის თვითშეფასებაზე არ იმოქმედებს და შექმნილია პირობები, რომლებიც გამორიცხავს პირად დაპირისპირებას.

ხაზგასმით უნდა აღინიშნოს, რომ არსებობს ფუნდამენტური განსხვავება საექსპერტო მეთოდების გამოყენების ხასიათში საექსპერტო სისტემებში და გადაწყვეტილების მხარდაჭერაში. თუ პირველ შემთხვევაში, ექსპერტებს მოეთხოვებათ გადაწყვეტილების მიღების მეთოდების ფორმალიზება, მაშინ მეორეში - მხოლოდ თავად გადაწყვეტილება, როგორც ასეთი.

ვინაიდან ექსპერტები ჩართულნი არიან ზუსტად იმ ფუნქციების განხორციელებაში, რომლებიც ამჟამად ან საერთოდ არ არის უზრუნველყოფილი ავტომატური სისტემებით, ან შესრულებულია ადამიანზე უარესად, ავტომატური სისტემების განვითარების პერსპექტიული მიმართულება არის ამ ფუნქციების მაქსიმალური ავტომატიზაცია.

გადაწყვეტილების მხარდაჭერის ავტომატური სისტემები

ადამიანი ყოველთვის იყენებდა ასისტენტს გადაწყვეტილების მიღებისას: ისინი უბრალოდ იყვნენ ინფორმაციის მიმწოდებლები საკონტროლო ობიექტის შესახებ და კონსულტანტები (მრჩევლები), რომლებიც გვთავაზობენ გადაწყვეტილების ვარიანტებს და აანალიზებენ მათ შედეგებს. გადაწყვეტილებებს მიმღები ყოველთვის იღებდა გარკვეულ საინფორმაციო გარემოში: სამხედრო მეთაურისთვის ეს არის შტაბი, რექტორისთვის, აკადემიური საბჭო, მინისტრისთვის, კოლეგია.

ჩვენს დროში გადაწყვეტილების მიღების საინფორმაციო ინფრასტრუქტურა წარმოუდგენელია გადაწყვეტილების განმეორებითი შეფასების ავტომატური სისტემების და განსაკუთრებით გადაწყვეტილების მხარდაჭერის სისტემების (DDS - Decision Support Systems) გარეშე, ე.ი. ავტომატური სისტემები, რომლებიც სპეციალურად შექმნილია იმ ინფორმაციის მოსამზადებლად, რომელიც ადამიანს სჭირდება გადაწყვეტილების მისაღებად. გადაწყვეტილების მხარდაჭერის სისტემების შემუშავება ხორციელდება, კერძოდ, საერთაშორისო პროექტის ფარგლებში, რომელიც ხორციელდება ლაქსენბურგში (ავსტრია) გამოყენებითი სისტემების ანალიზის საერთაშორისო ინსტიტუტის ეგიდით.

რეალურ სიტუაციებში არჩევანი მოითხოვს მთელი რიგი ოპერაციების შესრულებას, რომელთაგან ზოგი უფრო ეფექტურად ასრულებს ადამიანს, ზოგი კი მანქანას. მათი უპირატესობების ეფექტური კომბინაცია ხარვეზების ერთდროულ კომპენსაციასთან ერთად ვლინდება გადაწყვეტილების მხარდაჭერის ავტომატიზებულ სისტემებში.

ადამიანი გადაწყვეტილებებს მანქანაზე უკეთ იღებს გაურკვევლობის პირობებში, მაგრამ სწორი გადაწყვეტილების მისაღებად მას ასევე სჭირდება ადეკვატური (სრული და სანდო) ინფორმაცია, რომელიც ახასიათებს საგანს. თუმცა ცნობილია, რომ ადამიანი კარგად ვერ უმკლავდება დიდი მოცულობის „ნედლი“ დაუმუშავებელ ინფორმაციას. ამრიგად, მანქანის როლი გადაწყვეტილების მხარდაჭერაში შეიძლება იყოს საკონტროლო ობიექტისა და უკონტროლო ფაქტორების (გარემოს) შესახებ ინფორმაციის წინასწარი მომზადება, გარკვეული გადაწყვეტილების მიღების შედეგების დანახვა და ასევე მთელი ამ ინფორმაციის ვიზუალურად წარმოდგენა. და მოსახერხებელი გზა გადაწყვეტილების მიღების ფორმა.

ამრიგად, გადაწყვეტილების მხარდაჭერის ავტომატური სისტემები ანაზღაურებს პირის სისუსტეებს, ათავისუფლებს მას ინფორმაციის რუტინული წინასწარი დამუშავებისგან და უზრუნველყოფს კომფორტულ საინფორმაციო გარემოს, რომელშიც მას შეუძლია უკეთ აჩვენოს თავისი ძლიერი მხარეები. ეს სისტემები ორიენტირებულია არა გადაწყვეტილების მიმღების ფუნქციების ავტომატიზაციაზე (და, შედეგად, ამ ფუნქციების მისგან გაუცხოებაზე და, შესაბამისად, პასუხისმგებლობაზე მიღებულ გადაწყვეტილებებზე, რაც ხშირად ზოგადად მიუღებელია), არამედ მის დახმარებაზე. კარგი გამოსავალი.

არსებული ნიმუშის ამოცნობის მეთოდების მიმოხილვა

ლ.პ. პოპოვა , და შესახებ. დათიევი

„აღიქმის“ უნარი ადამიანის, ისევე როგორც სხვა ცოცხალი ორგანიზმების მთავარ საკუთრებად ითვლება. ნიმუშის ამოცნობა არის კიბერნეტიკის ფილიალი, რომელიც ავითარებს პრინციპებს და მეთოდებს ობიექტების, ფენომენების, პროცესების, სიგნალების, სიტუაციების კლასიფიკაციისა და იდენტიფიკაციისთვის - ყველა ის ობიექტი, რომელიც შეიძლება აღწერილი იყოს ზოგიერთი მახასიათებლის ან თვისებების სასრული ნაკრებით, რომლებიც ახასიათებს ობიექტს.

სურათი არის ობიექტის აღწერა. გამოსახულებებს აქვთ დამახასიათებელი თვისება, რაც გამოიხატება იმაში, რომ ერთი და იგივე ნაკრებიდან ფენომენების სასრული რაოდენობის გაცნობა შესაძლებელს ხდის მისი წარმომადგენლების თვითნებურად დიდი რაოდენობის ამოცნობას.

ნიმუშის ამოცნობის თეორიაში ორი ძირითადი მიმართულებაა:

    ადამიანისა და სხვა ცოცხალი ორგანიზმების ცნობის უნარის შესწავლა;

    მოწყობილობების აგების თეორიისა და მეთოდების შემუშავება, რომელიც შექმნილია ნიმუშის ამოცნობის ცალკეული პრობლემების გადასაჭრელად გამოყენების გარკვეულ სფეროებში.

გარდა ამისა, სტატიაში აღწერილია მეორე მიმართულების განვითარებასთან დაკავშირებული შაბლონების ამოცნობის სისტემების დანერგვის პრობლემები, პრინციპები და მეთოდები. სტატიის მეორე ნაწილში განხილულია ნიმუშების ამოცნობის ნერვული ქსელის მეთოდები, რომლებიც შეიძლება მივაწეროთ ნიმუშის ამოცნობის თეორიის პირველ მიმართულებას.

გამოსახულების ამომცნობი სისტემების აგების პრობლემები

ამოცანები, რომლებიც წარმოიქმნება ნიმუშის ავტომატური ამოცნობის სისტემების მშენებლობაში, ჩვეულებრივ შეიძლება დაიყოს რამდენიმე ძირითად სფეროდ. პირველი მათგანი დაკავშირებულია ამოცნობადი ობიექტის გაზომვების შედეგად მიღებული საწყისი მონაცემების წარმოდგენასთან. მგრძნობელობის პრობლემა. თითოეული გაზომილი მნიშვნელობა არის გამოსახულების ან ობიექტის გარკვეული "მახასიათებელი. დავუშვათ, რომ გამოსახულებები არის ალფაციფრული სიმბოლოები. ამ შემთხვევაში, საზომი ბადურა, რომელიც ნაჩვენებია ნახ. 1 (a)-ში, წარმატებით შეიძლება გამოყენებულ იქნას. სენსორში თუ ბადურა შედგება n-ელემენტისგან, მაშინ გაზომვის შედეგები შეიძლება წარმოდგენილი იყოს როგორც გაზომვის ვექტორი ან გამოსახულების ვექტორი. ,

სადაც თითოეული ელემენტი xi იღებს, მაგალითად, მნიშვნელობას 1, თუ სიმბოლოს გამოსახულება გადის ბადურის i-ე უჯრედში, ხოლო მნიშვნელობა 0 სხვაგვარად.

განვიხილოთ ნახ. 2 (ბ). ამ შემთხვევაში გამოსახულებები არის t ცვლადის უწყვეტი ფუნქციები (ხმოვანი სიგნალების ტიპი). თუ ფუნქციის მნიშვნელობები იზომება დისკრეტულ წერტილებში t1,t2, ..., tn, მაშინ გამოსახულების ვექტორი შეიძლება ჩამოყალიბდეს x1= f(t1),x2=f(t2),... , xn = f(tn).

სურათი 1. ბადურის გაზომვა

ნიმუშის ამოცნობის მეორე პრობლემა დაკავშირებულია მიღებული საწყისი მონაცემებიდან დამახასიათებელი ნიშნების ან თვისებების შერჩევასთან და ნიმუშის ვექტორების განზომილების შემცირებასთან. ეს პრობლემა ხშირად განიხილება როგორც პრობლემა წინასწარი დამუშავება და ფუნქციების შერჩევა.

სურათების კლასის მახასიათებლები არის დამახასიათებელი თვისებები, რომლებიც საერთოა მოცემული კლასის ყველა სურათისთვის. მახასიათებლები, რომლებიც ახასიათებს განსხვავებებს ცალკეულ კლასებს შორის, შეიძლება განიმარტოს, როგორც ინტერკლასობრივი მახასიათებლები. ყველა განხილული კლასისთვის საერთო ინტრაკლასული მახასიათებლები არ შეიცავს სასარგებლო ინფორმაციას ამოცნობის თვალსაზრისით და შეიძლება არ იყოს გათვალისწინებული. მახასიათებლების არჩევანი განიხილება ერთ-ერთ მნიშვნელოვან ამოცანად, რომელიც დაკავშირებულია ამოცნობის სისტემების მშენებლობასთან. თუ გაზომვის შედეგები შესაძლებელს გახდის ყველა კლასის განმასხვავებელი მახასიათებლების სრული ნაკრების მიღებას, ნიმუშების ფაქტობრივი აღიარება და კლასიფიკაცია არ გამოიწვევს რაიმე განსაკუთრებულ სირთულეს. ამის შემდეგ ავტომატური ამოცნობა დაიყვანება მარტივ შესატყვის პროცესზე ან პროცედურებზე, როგორიცაა ცხრილების ძიება. თუმცა, ამოცნობის პრაქტიკული პრობლემების უმეტესობაში, განმასხვავებელი მახასიათებლების სრული ნაკრების განსაზღვრა უკიდურესად რთულია, თუ არა შეუძლებელი. ორიგინალური მონაცემებიდან, როგორც წესი, შესაძლებელია ზოგიერთი განმასხვავებელი მახასიათებლის ამოღება და მათი გამოყენება ნიმუშის ავტომატური ამოცნობის პროცესის გასამარტივებლად. კერძოდ, გაზომვის ვექტორების განზომილება შეიძლება შემცირდეს ტრანსფორმაციების გამოყენებით, რომლებიც ამცირებენ ინფორმაციის დაკარგვას.

მესამე პრობლემა, რომელიც დაკავშირებულია ნიმუშების ამოცნობის სისტემების მშენებლობასთან, არის იდენტიფიკაციისა და კლასიფიკაციისთვის აუცილებელი გადაწყვეტილების ოპტიმალური პროცედურების პოვნა. მას შემდეგ, რაც ამოსაცნობი შაბლონების შესახებ შეგროვებული მონაცემები წარმოდგენილი იქნება წერტილებით ან საზომი ვექტორებით შაბლონების სივრცეში, მიეცით მანქანას გაერკვია შაბლონების რომელ კლასს შეესაბამება ეს მონაცემები. დაე, მანქანა იყოს შექმნილი ისე, რომ განასხვავოს M კლასები, რომლებიც აღინიშნება w1, w2, ... ..., wm. ამ შემთხვევაში გამოსახულების სივრცე შეიძლება ჩაითვალოს M რეგიონებისგან, რომელთაგან თითოეული შეიცავს იმავე კლასის სურათებს შესაბამის წერტილებს. ამ შემთხვევაში, ამოცნობის პრობლემა შეიძლება ჩაითვალოს, როგორც გადაწყვეტილების რეგიონების საზღვრების აგება, რომლებიც გამოყოფენ M კლასებს რეგისტრირებული გაზომვის ვექტორების საფუძველზე. მოდით ეს საზღვრები განისაზღვროს, მაგალითად, გადაწყვეტილების ფუნქციებით d1(х),d2(x),..., dm(х). ეს ფუნქციები, რომელსაც ასევე უწოდებენ დისკრიმინაციულ ფუნქციებს, არის x-ის გამოსახულების სკალარული და ერთმნიშვნელოვანი ფუნქციები. თუ di (x) > dj (x), მაშინ x-ის გამოსახულება ეკუთვნის w1 კლასს. სხვა სიტყვებით რომ ვთქვათ, თუ I-ე გადაწყვეტილების ფუნქციას di(x) აქვს უმაღლესი მნიშვნელობა, მაშინ ასეთი ავტომატური კლასიფიკაციის სქემის მნიშვნელოვანი ილუსტრაცია, რომელიც დაფუძნებულია გადაწყვეტილების მიღების პროცესის განხორციელებაზე, ნაჩვენებია ნახ. 2 (სქემაზე "GR" - გადამწყვეტი ფუნქციების გენერატორი).

სურათი 2. ავტომატური კლასიფიკაციის სქემა.

გადაწყვეტილების ფუნქციების მიღება შესაძლებელია რამდენიმე გზით. იმ შემთხვევებში, როდესაც ხელმისაწვდომია სრული აპრიორი ინფორმაცია ცნობადი შაბლონების შესახებ, გადაწყვეტილების ფუნქციების დადგენა შესაძლებელია ზუსტად ამ ინფორმაციის საფუძველზე. თუ შაბლონების შესახებ ხელმისაწვდომია მხოლოდ თვისებრივი ინფორმაცია, შესაძლებელია გონივრული ვარაუდების გაკეთება გადაწყვეტილების ფუნქციების ფორმის შესახებ. ამ უკანასკნელ შემთხვევაში, გადაწყვეტილების რეგიონების საზღვრები შეიძლება მნიშვნელოვნად გადავიდეს ჭეშმარიტისაგან და, შესაბამისად, აუცილებელია შეიქმნას სისტემა, რომელსაც შეუძლია მიაღწიოს დამაკმაყოფილებელ შედეგს რიგი თანმიმდევრული კორექტირების გზით.

ობიექტებს (სურათებს), რომელთა ამოცნობა და კლასიფიკაცია ხდება ავტომატური ნიმუშის ამოცნობის სისტემის გამოყენებით, უნდა ჰქონდეს გაზომვადი მახასიათებლების ნაკრები. როდესაც სურათების მთელი ჯგუფისთვის შესაბამისი გაზომვების შედეგები მსგავსია, ითვლება, რომ ეს ობიექტები ერთ კლასს მიეკუთვნება. ნიმუშის ამოცნობის სისტემის მიზანია, შეგროვებული ინფორმაციის საფუძველზე, განსაზღვროს ობიექტების კლასი, ცნობადი ობიექტების გაზომვის მსგავსი მახასიათებლებით. ამოცნობის სისწორე დამოკიდებულია გაზომილ მახასიათებლებში შემავალი განმასხვავებელი ინფორმაციის რაოდენობაზე და ამ ინფორმაციის გამოყენების ეფექტურობაზე.

      ნიმუშების ამოცნობის სისტემების დანერგვის ძირითადი მეთოდები

ნიმუშის ამოცნობა არის ფორმალური ოპერაციების აგება და გამოყენება რეალური ან იდეალური სამყაროს ობიექტების რიცხვითი ან სიმბოლური წარმოდგენების შესახებ, შედეგები, რომელთა გადაწყვეტილებები ასახავს ამ ობიექტებს შორის ეკვივალენტურ ურთიერთობებს. ეკვივალენტურობის მიმართებები გამოხატავს შეფასებული ობიექტების კუთვნილებას ზოგიერთ კლასს, განიხილება როგორც დამოუკიდებელი სემანტიკური ერთეულები.

ამოცნობის ალგორითმების აგებისას, ეკვივალენტურობის კლასები შეიძლება დააწესოს მკვლევარმა, რომელიც იყენებს საკუთარ აზრობრივ იდეებს ან იყენებს გარე დამატებით ინფორმაციას ობიექტების მსგავსებისა და განსხვავებების შესახებ მოგვარებული პრობლემის კონტექსტში. შემდეგ საუბარია „მასწავლებელთან გამჭრიახობაზე“. წინააღმდეგ შემთხვევაში, ე.ი. როდესაც ავტომატური სისტემა აგვარებს კლასიფიკაციის პრობლემას გარე სასწავლო ინფორმაციის ჩართვის გარეშე, საუბარია ავტომატურ კლასიფიკაციაზე ან „უკონტროლო აღიარებაზე“. შაბლონების ამოცნობის ალგორითმების უმეტესობა მოითხოვს ძალიან მნიშვნელოვან გამოთვლით ძალას, რაც შეიძლება უზრუნველყოფილი იყოს მხოლოდ მაღალი ხარისხის კომპიუტერული ტექნოლოგიით.

სხვადასხვა ავტორები (იუ.ლ. ბარაბაში, ვ.ი. ვასილიევი, ა. გონსალესი, პ. უინსტონი, კ. ფუ, ია.ზ. ციპკინი და სხვები) აძლევენ შაბლონის ამოცნობის მეთოდების განსხვავებულ ტიპოლოგიას. ზოგიერთი ავტორი განასხვავებს პარამეტრულ, არაპარამეტრულ და ევრისტიკულ მეთოდებს, ზოგი კი გამოყოფს მეთოდთა ჯგუფებს, რომლებიც დაფუძნებულია ამ დარგის ისტორიულ სკოლებსა და ტენდენციებზე.

ამავდროულად, ცნობილი ტიპოლოგიები არ ითვალისწინებენ ერთ ძალიან მნიშვნელოვან მახასიათებელს, რომელიც ასახავს საგნის არეალის შესახებ ცოდნის წარმოდგენის სპეციფიკას ნებისმიერი ფორმალური ნიმუშის ამოცნობის ალგორითმის გამოყენებით. პოსპელოვი გამოყოფს ცოდნის წარმოდგენის ორ ძირითად გზას:

    ინტენსიური წარმოდგენა - ატრიბუტებს (მახასიათებლებს) შორის ურთიერთობის სქემის სახით.

    გაფართოებული წარმოდგენა - კონკრეტული ფაქტების (ობიექტების, მაგალითების) დახმარებით.

უნდა აღინიშნოს, რომ ამოცნობის მეთოდების ამ ორი ჯგუფის არსებობა: თვისებებით მოქმედი და ობიექტებთან მოქმედი, ღრმად ბუნებრივია. ამ თვალსაზრისით, არცერთი ეს მეთოდი, მეორისგან განცალკევებით აღებული, არ იძლევა შესაძლებლობას შექმნას საგნობრივი არეალის ადეკვატური ასახვა. ამ მეთოდებს შორის არის ურთიერთკომპლიმენტურობის მიმართება N. Bohr-ის გაგებით, ამიტომ პერსპექტიული ამოცნობის სისტემამ უნდა უზრუნველყოს ორივე ამ მეთოდის განხორციელება და არა რომელიმე მათგანის.

ამრიგად, დ.ა. პოსპელოვის მიერ შემოთავაზებული აღიარების მეთოდების კლასიფიკაცია ეფუძნება ფუნდამენტურ კანონებს, რომლებიც საფუძვლად უდევს ადამიანის შემეცნების გზას ზოგადად, რაც მას განსაკუთრებულ (პრივილეგირებულ) მდგომარეობაში აყენებს სხვა კლასიფიკაციებთან შედარებით, რომლებიც, ამ ფონზე, გამოიყურება. უფრო მსუბუქი და ხელოვნური.

ინტენსიური მეთოდები

ინტენსიური მეთოდების გამორჩეული თვისებაა ის, რომ ისინი იყენებენ მახასიათებლების სხვადასხვა მახასიათებლებს და მათ ურთიერთობებს, როგორც ოპერაციების ელემენტებს შაბლონის ამოცნობის ალგორითმების კონსტრუქციასა და გამოყენებაში. ასეთი ელემენტები შეიძლება იყოს ინდივიდუალური მნიშვნელობები ან მახასიათებლის მნიშვნელობების ინტერვალები, საშუალო მნიშვნელობები და განსხვავებები, მახასიათებლების ურთიერთობის მატრიცები და ა. ამავდროულად, ამ მეთოდებში ობიექტები არ განიხილება როგორც ინტეგრალური ინფორმაციის ერთეულები, არამედ მოქმედებენ როგორც ინდიკატორები მათი ატრიბუტების ურთიერთქმედების და ქცევის შესაფასებლად.

ნიმუშის ამოცნობის ინტენსიური მეთოდების ჯგუფი ვრცელია და მისი დაყოფა ქვეკლასებად გარკვეულწილად თვითნებურია:

- მეთოდები, რომლებიც დაფუძნებულია მახასიათებლების მნიშვნელობების განაწილების სიმკვრივის შეფასებებზე

– გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდები

- ლოგიკური მეთოდები

– ლინგვისტური (სტრუქტურული) მეთოდები.

მახასიათებლის მნიშვნელობების განაწილების სიმკვრივის შეფასებებზე დაფუძნებული მეთოდები.ნიმუშის ამოცნობის ეს მეთოდები ნასესხებია სტატისტიკური გადაწყვეტილებების კლასიკური თეორიიდან, რომელშიც კვლევის ობიექტები განიხილება, როგორც მრავალგანზომილებიანი შემთხვევითი ცვლადის რეალიზაცია, რომელიც განაწილებულია ფუნქციების სივრცეში გარკვეული კანონის მიხედვით. ისინი ეფუძნება ბაიესის გადაწყვეტილების მიღების სქემას, რომელიც მიმართავს ამა თუ იმ ცნობად კლასს მიეკუთვნება ობიექტების აპრიორულ ალბათობას და მახასიათებლის ვექტორის მნიშვნელობების პირობითი განაწილების სიმკვრივეს. ეს მეთოდები მცირდება ალბათობის თანაფარდობის განსაზღვრამდე მრავალგანზომილებიანი მახასიათებლების სივრცის სხვადასხვა ზონაში.

მახასიათებლების მნიშვნელობების განაწილების სიმკვრივის შეფასებაზე დაფუძნებული მეთოდების ჯგუფი პირდაპირ კავშირშია დისკრიმინაციული ანალიზის მეთოდებთან. გადაწყვეტილების მიღებისადმი ბაიესის მიდგომა არის ერთ-ერთი ყველაზე განვითარებული თანამედროვე სტატისტიკაში, ეგრეთ წოდებული პარამეტრული მეთოდი, რომლისთვისაც ცნობილია განაწილების კანონის ანალიტიკური გამოხატულება (ამ შემთხვევაში ნორმალური კანონი) და მხოლოდ მცირედ ითვლება. პარამეტრების რაოდენობა (საშუალო ვექტორები და კოვარიანტების მატრიცები) უნდა შეფასდეს.

ეს ჯგუფი ასევე მოიცავს მეთოდს დამოუკიდებელი მახასიათებლებისთვის ალბათობის კოეფიციენტის გამოსათვლელად. ეს მეთოდი, გარდა ნიშან-თვისებების დამოუკიდებლობის დაშვებისა (რაც რეალურად პრაქტიკულად არასოდეს სრულდება), არ გულისხმობს განაწილების კანონის ფუნქციური ფორმის ცოდნას. ის შეიძლება მივაწეროთ არაპარამეტრულ მეთოდებს.

სხვა არაპარამეტრული მეთოდები, რომლებიც გამოიყენება მაშინ, როდესაც განაწილების სიმკვრივის მრუდის ფორმა უცნობია და მისი ბუნების შესახებ რაიმე ვარაუდის გაკეთება შეუძლებელია, განსაკუთრებულ პოზიციას იკავებს. ეს მოიცავს მრავალგანზომილებიანი ჰისტოგრამების ცნობილ მეთოდს, „k-უახლოესი მეზობლების“ მეთოდს, ევკლიდეს დისტანციის მეთოდს, პოტენციური ფუნქციების მეთოდს და ა.შ., რომელთა განზოგადება არის მეთოდი, რომელსაც ეწოდება „პარზენის შეფასება“. ეს მეთოდები ფორმალურად მოქმედებს ობიექტებთან, როგორც ინტეგრალურ სტრუქტურებთან, მაგრამ ამოცნობის ამოცანის ტიპის მიხედვით, მათ შეუძლიათ იმოქმედონ როგორც ინტენსიურ, ასევე გაფართოებულ ჰიპოსტაზებში.

არაპარამეტრული მეთოდები აანალიზებენ ობიექტების შედარებით რაოდენობას, რომლებიც ხვდებიან მოცემულ მრავალგანზომილებიან მოცულობაში და იყენებენ სხვადასხვა მანძილის ფუნქციებს სასწავლო ნიმუშის ობიექტებსა და ამოცნობილ ობიექტებს შორის. რაოდენობრივი მახასიათებლებისთვის, როდესაც მათი რიცხვი გაცილებით ნაკლებია, ვიდრე ნიმუშის ზომა, ობიექტებთან ოპერაციები შუალედურ როლს ასრულებენ პირობითი ალბათობების ლოკალური განაწილების სიმკვრივის შეფასებაში და ობიექტები არ ატარებენ დამოუკიდებელი ინფორმაციის ერთეულების სემანტიკურ დატვირთვას. ამავდროულად, როდესაც მახასიათებლების რაოდენობა შესასწავლი ობიექტების რაოდენობაზე თანაზომიერია ან მეტია, ხოლო მახასიათებლები თვისებრივი ან დიქოტომიური ხასიათისაა, მაშინ არ შეიძლება საუბარი ალბათობის განაწილების სიმკვრივის ლოკალურ შეფასებაზე. ამ შემთხვევაში, ამ არაპარამეტრულ მეთოდებში ობიექტები განიხილება, როგორც დამოუკიდებელი საინფორმაციო ერთეულები (ჰოლისტური ემპირიული ფაქტები) და ეს მეთოდები იძენს შესასწავლ ობიექტების მსგავსებისა და განსხვავების შეფასების მნიშვნელობას.

ამრიგად, არაპარამეტრული მეთოდების იგივე ტექნოლოგიური ოპერაციები, პრობლემის პირობებიდან გამომდინარე, აზრი აქვს ან მახასიათებლის მნიშვნელობების ალბათობის განაწილების სიმკვრივის ლოკალურ შეფასებას, ან ობიექტების მსგავსებისა და განსხვავების შეფასებას.

ცოდნის ინტენსიური წარმოდგენის კონტექსტში აქ განიხილება არაპარამეტრული მეთოდების პირველი მხარე, როგორც ალბათობის განაწილების სიმკვრივის შეფასება. ბევრი ავტორი აღნიშნავს, რომ არაპარამეტრული მეთოდები, როგორიცაა Parzen შეფასებები, კარგად მუშაობს პრაქტიკაში. ძირითადი სირთულეები ამ მეთოდების გამოყენებისას არის მთელი სასწავლო ნიმუშის დამახსოვრების აუცილებლობა, რათა გამოვთვალოთ ლოკალური ალბათობის განაწილების სიმკვრივეები და მაღალი მგრძნობელობა სასწავლო ნიმუშის არაწარმომადგენლობით.

გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდები.მეთოდთა ამ ჯგუფში ცნობილია გადაწყვეტილების ფუნქციის ზოგადი ფორმა და მოცემულია მისი ხარისხი ფუნქციონალურად. ამ ფუნქციიდან გამომდინარე, მოძებნილია გადაწყვეტილების ფუნქციის საუკეთესო მიახლოება ტრენინგის თანმიმდევრობისთვის. ყველაზე გავრცელებულია გადაწყვეტილების ფუნქციების წარმოდგენები წრფივი და განზოგადებული არაწრფივი მრავალწევრების სახით. გადაწყვეტილების წესის ხარისხის ფუნქციონირება ჩვეულებრივ ასოცირდება კლასიფიკაციის შეცდომასთან.

გადაწყვეტილების ფუნქციების კლასის შესახებ დაშვებებზე დაფუძნებული მეთოდების მთავარი უპირატესობა არის ამოცნობის პრობლემის მათემატიკური ფორმულირების სიცხადე, როგორც ექსტრემის პოვნის პრობლემა. ამ პრობლემის გადაწყვეტა ხშირად მიიღწევა გრადიენტული ალგორითმების გამოყენებით. ამ ჯგუფის მეთოდების მრავალფეროვნება აიხსნება გამოყენებული გადაწყვეტილების წესის ხარისხის ფუნქციებითა და ექსტრემალური ძიების ალგორითმებით. განხილული ალგორითმების განზოგადება, რომელიც მოიცავს, კერძოდ, ნიუტონის ალგორითმს, პერცეპტრონის ტიპის ალგორითმებს და ა.შ., არის სტოქასტური დაახლოების მეთოდი. პარამეტრული ამოცნობის მეთოდებისგან განსხვავებით, მეთოდთა ამ ჯგუფის წარმატება იმდენად არ არის დამოკიდებული თეორიული იდეების შეუსაბამობაზე ფუნქციურ სივრცეში ობიექტების განაწილების კანონების შესახებ ემპირიულ რეალობასთან. ყველა ოპერაცია ექვემდებარება ერთ მთავარ მიზანს - გადაწყვეტილების წესის ხარისხის ფუნქციონალური ექსტრემის პოვნას. ამავდროულად, პარამეტრული და განხილული მეთოდების შედეგები შეიძლება იყოს მსგავსი. როგორც ზემოთ იყო ნაჩვენები, პარამეტრული მეთოდები სხვადასხვა კლასებში ობიექტების ნორმალური განაწილების შემთხვევაში თანაბარი კოვარიანტული მატრიცებით იწვევს ხაზოვანი გადაწყვეტილების ფუნქციებს. ჩვენ ასევე აღვნიშნავთ, რომ ხაზოვანი დიაგნოსტიკური მოდელების ინფორმაციული მახასიათებლების შერჩევის ალგორითმები შეიძლება განიმარტოს, როგორც გრადიენტული ალგორითმების კონკრეტული ვარიანტები ექსტრემის საძიებლად.

საკმაოდ კარგად არის შესწავლილი გრადიენტული ალგორითმების შესაძლებლობები ექსტრემის საპოვნელად, განსაკუთრებით ხაზოვანი გადაწყვეტილების წესების ჯგუფში. ამ ალგორითმების კონვერგენცია დადასტურდა მხოლოდ იმ შემთხვევისთვის, როდესაც ობიექტების ცნობადი კლასები გამოსახულია ფუნქციურ სივრცეში კომპაქტური გეომეტრიული სტრუქტურებით. თუმცა, გადაწყვეტილების წესის საკმარისი ხარისხის მიღწევის სურვილი ხშირად შეიძლება დაკმაყოფილდეს ალგორითმების დახმარებით, რომლებსაც არ გააჩნიათ მკაცრი მათემატიკური მტკიცებულება გლობალური ექსტრემის ამოხსნის კონვერგენციის შესახებ.

ასეთი ალგორითმები მოიცავს ევრისტიკული პროგრამირების პროცედურების დიდ ჯგუფს, რომლებიც წარმოადგენს ევოლუციური მოდელირების მიმართულებას. ევოლუციური მოდელირება არის ბუნებისგან ნასესხები ბიონიკური მეთოდი. იგი ეფუძნება ევოლუციის ცნობილი მექანიზმების გამოყენებას, რათა ჩაანაცვლოს რთული ობიექტის აზრიანი მოდელირების პროცესი მისი ევოლუციის ფენომენოლოგიური მოდელირებით.

ევოლუციური მოდელირების ცნობილი წარმომადგენელი ნიმუშის ამოცნობაში არის არგუმენტების ჯგუფური აღრიცხვის მეთოდი (MGUA). GMDH ეფუძნება თვითორგანიზაციის პრინციპს, ხოლო GMDH ალგორითმები ამრავლებენ მასობრივი შერჩევის სქემას. GMDH ალგორითმებში განზოგადებული მრავალწევრის წევრები სინთეზირებული და შერჩეულია სპეციალური გზით, რომელსაც ხშირად უწოდებენ კოლმოგოროვი-გაბორის პოლინომს. ეს სინთეზი და შერჩევა ხდება მზარდი სირთულით და შეუძლებელია წინასწარ წინასწარ განსაზღვრო, რა საბოლოო ფორმა ექნება განზოგადებულ მრავალწევრს. პირველ რიგში, ჩვეულებრივ განიხილება საწყისი მახასიათებლების მარტივი წყვილი კომბინაციები, საიდანაც შედგენილია გადამწყვეტი ფუნქციების განტოლებები, როგორც წესი, არ აღემატება მეორე რიგის. თითოეული განტოლება გაანალიზებულია, როგორც დამოუკიდებელი გადაწყვეტილების ფუნქცია და შედგენილი განტოლებების პარამეტრების მნიშვნელობები ამა თუ იმ გზით გვხვდება სასწავლო ნიმუშიდან. შემდეგ, მიღებული გადაწყვეტილების ფუნქციების ნაკრებიდან, შეირჩევა გარკვეული გაგებით საუკეთესოს ნაწილი. ინდივიდუალური გადაწყვეტილების ფუნქციების ხარისხი მოწმდება საკონტროლო (სატესტო) ნიმუშზე, რომელსაც ზოგჯერ გარე დამატების პრინციპს უწოდებენ. შერჩეული ნაწილობრივი გადაწყვეტილების ფუნქციები ქვემოთ განიხილება, როგორც შუალედური ცვლადები, რომლებიც ემსახურებიან საწყის არგუმენტებს ახალი გადაწყვეტილების ფუნქციების მსგავსი სინთეზისთვის და ა.შ. ასეთი იერარქიული სინთეზის პროცესი გრძელდება მანამ, სანამ არ მიიღწევა გადაწყვეტილების ფუნქციის ხარისხის კრიტერიუმის უკიდურესობა, რაც პრაქტიკაში ვლინდება ამ ხარისხის გაუარესებაში, როდესაც ცდილობთ კიდევ უფრო გაზარდოთ მრავალწევრის წევრების რიგი ორიგინალურ მახასიათებლებთან მიმართებაში.

თვითორგანიზაციის პრინციპს, რომელიც საფუძვლად უდევს GMDH-ს, ეწოდება ევრისტიკული თვითორგანიზაცია, ვინაიდან მთელი პროცესი ეფუძნება ევრისტიკურად არჩეული გარე დამატებების დანერგვას. გადაწყვეტილების შედეგი შეიძლება მნიშვნელოვნად იყოს დამოკიდებული ამ ევრისტიკაზე. მიღებული დიაგნოსტიკური მოდელი დამოკიდებულია იმაზე, თუ როგორ იყოფა ობიექტები სასწავლო და ტესტირების ნიმუშებად, როგორ განისაზღვრება აღიარების ხარისხის კრიტერიუმი, რამდენი ცვლადი გამოტოვებულია შერჩევის შემდეგ რიგში და ა.შ.

GMDH ალგორითმების ეს მახასიათებლები ასევე დამახასიათებელია ევოლუციური მოდელირების სხვა მიდგომებისთვის. მაგრამ აქ ჩვენ აღვნიშნავთ განხილული მეთოდების კიდევ ერთ ასპექტს. ეს არის მათი შინაარსის არსი. გადაწყვეტილების ფუნქციების კლასის (ევოლუციური და გრადიენტული) ვარაუდებზე დაფუძნებული მეთოდების გამოყენებით შესაძლებელია მაღალი სირთულის დიაგნოსტიკური მოდელების აგება და პრაქტიკულად მისაღები შედეგების მიღება. ამავე დროს, პრაქტიკული მიზნების მიღწევას ამ შემთხვევაში არ ახლავს ახალი ცოდნის მოპოვება ცნობადი ობიექტების ბუნების შესახებ. ამ ცოდნის მოპოვების შესაძლებლობა, კერძოდ, ცოდნის ატრიბუტების (მახასიათებლების) ურთიერთქმედების მექანიზმების შესახებ, ფუნდამენტურად შეზღუდულია ასეთი ურთიერთქმედების მოცემული სტრუქტურით, რომელიც ფიქსირდება გადამწყვეტი ფუნქციების არჩეულ ფორმაში. მაშასადამე, მაქსიმუმი, რაც შეიძლება ითქვას კონკრეტული დიაგნოსტიკური მოდელის აგების შემდეგ, არის მახასიათებლების კომბინაციებისა და თავად მახასიათებლების ჩამოთვლა, რომლებიც შეტანილია მიღებულ მოდელში. მაგრამ კომბინაციების მნიშვნელობა, რომელიც ასახავს შესწავლილი ობიექტების განაწილების ბუნებას და სტრუქტურას, ხშირად ამ მიდგომის ფარგლებში აღმოუჩენელი რჩება.

ლოგიკური მეთოდები. ნიმუშის ამოცნობის ლოგიკური მეთოდები დაფუძნებულია ლოგიკური ალგებრის აპარატზე და საშუალებას იძლევა იმუშაოს ინფორმაციასთან, რომელიც შეიცავს არა მხოლოდ ცალკეულ მახასიათებლებს, არამედ მახასიათებლების მნიშვნელობების კომბინაციებს. ამ მეთოდებში ნებისმიერი ატრიბუტის მნიშვნელობები განიხილება, როგორც ელემენტარული მოვლენები.

ყველაზე ზოგადი ფორმით, ლოგიკური მეთოდები შეიძლება დახასიათდეს, როგორც სასწავლო ნიმუშში ლოგიკური შაბლონების ძიება და ლოგიკური გადაწყვეტილების წესების გარკვეული სისტემის ფორმირება (მაგალითად, ელემენტარული მოვლენების შეერთების სახით), თითოეული რომელსაც თავისი წონა აქვს. ლოგიკური მეთოდების ჯგუფი მრავალფეროვანია და მოიცავს სხვადასხვა სირთულისა და სიღრმის ანალიზის მეთოდებს. დიქოტომიური (ლოგიკური) მახასიათებლებისთვის პოპულარულია ეგრეთ წოდებული ხის მსგავსი კლასიფიკატორები, ჩიხური ტესტის მეთოდი, კორას ალგორითმი და სხვა. უფრო რთული მეთოდები ეფუძნება D.S. Mill-ის ინდუქციური მეთოდების ფორმალიზებას. ფორმალიზაცია ხორციელდება კვაზი-აქსიომატური თეორიის აგებით და ეფუძნება მრავალ დახარისხებულ მრავალმნიშვნელოვან ლოგიკას რაოდენობებთან ცვლადი სიგრძის ტოპებზე.

კორას ალგორითმი, ისევე როგორც ნიმუშის ამოცნობის სხვა ლოგიკური მეთოდები, საკმაოდ შრომატევადია, რადგან კავშირების არჩევისას აუცილებელია სრული ჩამოთვლა. ამიტომ, ლოგიკური მეთოდების გამოყენებისას მაღალი მოთხოვნები დგება გამოთვლითი პროცესის ეფექტურ ორგანიზაციაზე და ეს მეთოდები კარგად მუშაობს ფუნქციების სივრცის შედარებით მცირე ზომებთან და მხოლოდ ძლიერ კომპიუტერებზე.

ენობრივი (სინტაქსური ან სტრუქტურული) მეთოდები.ნიმუშების ამოცნობის ენობრივი მეთოდები ემყარება სპეციალური გრამატიკების გამოყენებას, რომლებიც წარმოქმნიან ენებს, რომელთა დახმარებით შეიძლება აღწეროს ცნობადი ობიექტების თვისებების ნაკრები. გრამატიკა ეხება ამ არაწარმოებული ელემენტებიდან ობიექტების აგების წესებს.

თუ სურათების აღწერა ხდება არაწარმოებული ელემენტების (ქვეგამოსახულებების) და მათი ურთიერთობების დახმარებით, მაშინ ენობრივი ან სინტაქსური მიდგომა გამოიყენება ავტომატური ამოცნობის სისტემების შესაქმნელად, თვისებების საერთო პრინციპის გამოყენებით. გამოსახულების აღწერა შესაძლებელია ენის სინტაქსური სტრუქტურის მსგავსი ქვესურათების იერარქიული სტრუქტურის გამოყენებით. ეს გარემოება შესაძლებელს ხდის ფორმალური ენების თეორიის გამოყენებას ნიმუშების ამოცნობის პრობლემების გადაჭრისას. ვარაუდობენ, რომ გამოსახულების გრამატიკა შეიცავს ელემენტების სასრულ კომპლექტს, რომელსაც ეწოდება ცვლადები, არაწარმოებული ელემენტები და ჩანაცვლების წესები. ჩანაცვლების წესების ბუნება განსაზღვრავს გრამატიკის ტიპს. ყველაზე შესწავლილ გრამატიკებს შორის არის რეგულარული, კონტექსტის გარეშე და პირდაპირი შემადგენელი გრამატიკები. ამ მიდგომის ძირითადი პუნქტებია გამოსახულების არაწარმოებული ელემენტების არჩევა, ამ ელემენტების გაერთიანება და მათი დამაკავშირებელი მიმართებები გამოსახულების გრამატიკაში და ბოლოს, ანალიზისა და ამოცნობის პროცესების შესაბამის ენაზე განხორციელება. . ეს მიდგომა განსაკუთრებით გამოსადეგია სურათებთან მუშაობისას, რომლებიც ან არ შეიძლება იყოს აღწერილი რიცხვითი გაზომვებით, ან იმდენად რთულია, რომ მათი ლოკალური მახასიათებლების იდენტიფიცირება შეუძლებელია და უნდა მივმართოთ ობიექტების გლობალურ თვისებებს.

მაგალითად, ე.ა. ბუტაკოვი, ვ.ი. ოსტროვსკი, ი.ლ. ფადეევი გვთავაზობს შემდეგი სისტემის სტრუქტურას გამოსახულების დამუშავებისთვის (ნახ. 3), ლინგვისტური მიდგომის გამოყენებით, სადაც თითოეული ფუნქციური ბლოკი წარმოადგენს პროგრამულ (მიკროპროგრამას) კომპლექსს (მოდულს), რომელიც ახორციელებს შესაბამის ფუნქციებს.

ნახაზი 3. ამომცნობის სტრუქტურული დიაგრამა

გამოსახულების ანალიზის პრობლემაზე მათემატიკური ლინგვისტიკის მეთოდების გამოყენების მცდელობა იწვევს რიგი პრობლემების გადაჭრის აუცილებლობას, რომლებიც დაკავშირებულია ორგანზომილებიანი გამოსახულების სტრუქტურის ფორმალური ენის ერთგანზომილებიან ჯაჭვებზე.

გაფართოების მეთოდები

ამ ჯგუფის მეთოდებში, ინტენსიური მიმართულებისგან განსხვავებით, თითოეულ შესწავლილ ობიექტს მეტ-ნაკლებად ენიჭება დამოუკიდებელი დიაგნოსტიკური მნიშვნელობა. თავის არსში, ეს მეთოდები ახლოსაა კლინიკურ მიდგომასთან, რომელიც განიხილავს ადამიანებს არა ამა თუ იმ ინდიკატორის მიხედვით შეფასებული ობიექტების ჯაჭვად, არამედ როგორც ინტეგრალურ სისტემებს, რომელთაგან თითოეული ინდივიდუალურია და აქვს განსაკუთრებული დიაგნოსტიკური მნიშვნელობა. კვლევის ობიექტებისადმი ასეთი ფრთხილი დამოკიდებულება არ იძლევა საშუალებას გამორიცხოს ან დაკარგოს ინფორმაცია თითოეული ცალკეული ობიექტის შესახებ, რაც ხდება ინტენსიური მიმართულების მეთოდების გამოყენებისას, ობიექტების გამოყენებით მხოლოდ მათი ატრიბუტების ქცევის ნიმუშების აღმოსაჩენად და დასაფიქსირებლად.

განხილული მეთოდების გამოყენებით ნიმუშის ამოცნობის ძირითადი ოპერაციებია ობიექტების მსგავსებისა და განსხვავების განსაზღვრის ოპერაციები. მეთოდების მითითებულ ჯგუფში შემავალი ობიექტები დიაგნოსტიკური პრეცედენტების როლს ასრულებენ. ამავდროულად, კონკრეტული ამოცანის პირობებიდან გამომდინარე, ინდივიდუალური პრეცედენტის როლი შეიძლება განსხვავდებოდეს ყველაზე ფართო საზღვრებში: ძირითადი და განმსაზღვრელიდან ძალიან ირიბ მონაწილეობამდე აღიარების პროცესში. თავის მხრივ, პრობლემის პირობებმა შეიძლება მოითხოვოს სხვადასხვა რაოდენობის დიაგნოსტიკური პრეცედენტების მონაწილეობა წარმატებული გადაწყვეტისთვის: თითოეული ცნობადი კლასიდან ერთიდან ნიმუშის მთლიან ზომამდე, აგრეთვე მსგავსებისა და განსხვავების ზომების გამოთვლის სხვადასხვა ხერხს. ობიექტები. ეს მოთხოვნები ხსნის გაფართოებული მეთოდების შემდგომ დაყოფას ქვეკლასებად:

    პროტოტიპის შედარების მეთოდი;

    k- უახლოესი მეზობლის მეთოდი;

    გადაწყვეტილების წესების გუნდები.

პროტოტიპის შედარების მეთოდი.ეს არის გაფართოებული ამოცნობის უმარტივესი მეთოდი. იგი გამოიყენება, მაგალითად, როდესაც აღიარებული კლასები ნაჩვენებია ფუნქციების სივრცეში კომპაქტურ გეომეტრიულ დაჯგუფებებში. ამ შემთხვევაში პროტოტიპად ირჩევა კლასის გეომეტრიული დაჯგუფების ცენტრი (ან ცენტრთან ყველაზე ახლოს მდებარე ობიექტი).

უცნობი ობიექტის კლასიფიკაციისთვის, ნაპოვნია მასთან ყველაზე ახლოს მდებარე პროტოტიპი და ობიექტი ეკუთვნის იმავე კლასს, როგორც ეს პროტოტიპი. ცხადია, ამ მეთოდით არ იქმნება განზოგადებული კლასის სურათები.

სიახლოვის საზომად შეიძლება გამოყენებულ იქნას სხვადასხვა ტიპის მანძილი. ხშირად დიქოტომიური მახასიათებლებისთვის გამოიყენება ჰემინგის მანძილი, რომელიც ამ შემთხვევაში უდრის ევკლიდეს მანძილის კვადრატს. ამ შემთხვევაში, ობიექტების კლასიფიკაციის გადაწყვეტილების წესი ტოლია წრფივი გადაწყვეტილების ფუნქციის.

ეს ფაქტი განსაკუთრებით უნდა აღინიშნოს. იგი ნათლად აჩვენებს კავშირს პროტოტიპსა და მონაცემთა სტრუქტურის შესახებ ინფორმაციის ინდიკატორულ წარმოდგენას შორის. ზემოაღნიშნული წარმოდგენის გამოყენებით, მაგალითად, ნებისმიერი ტრადიციული საზომი მასშტაბი, რომელიც წარმოადგენს დიქოტომიური მახასიათებლების მნიშვნელობების წრფივ ფუნქციას, შეიძლება ჩაითვალოს ჰიპოთეტურ დიაგნოსტიკური პროტოტიპად. თავის მხრივ, თუ აღიარებული კლასების სივრცითი სტრუქტურის ანალიზი საშუალებას გვაძლევს დავასკვნათ, რომ ისინი გეომეტრიულად კომპაქტურია, მაშინ საკმარისია თითოეული ამ კლასის ჩანაცვლება ერთი პროტოტიპით, რომელიც რეალურად ექვივალენტურია ხაზოვანი დიაგნოსტიკური მოდელის.

პრაქტიკაში, რა თქმა უნდა, სიტუაცია ხშირად განსხვავდება აღწერილი იდეალიზებული მაგალითისგან. მკვლევარი, რომელიც აპირებს გამოიყენოს ამოცნობის მეთოდი, რომელიც დაფუძნებულია დიაგნოსტიკური კლასების პროტოტიპებთან შედარებით, რთული პრობლემების წინაშე დგას. ეს არის, უპირველეს ყოვლისა, სიახლოვის საზომის (მეტრიკის) არჩევანი, რომელსაც შეუძლია მნიშვნელოვნად შეცვალოს ობიექტების განაწილების სივრცითი კონფიგურაცია. და მეორეც, დამოუკიდებელი პრობლემაა ექსპერიმენტული მონაცემების მრავალგანზომილებიანი სტრუქტურების ანალიზი. ორივე ეს პრობლემა განსაკუთრებით მწვავეა მკვლევარისთვის მხატვრული სივრცის მაღალი განზომილების პირობებში, რაც დამახასიათებელია რეალური პრობლემებისთვის.

K-უახლოესი მეზობლების მეთოდი. K- უახლოესი მეზობლის მეთოდი დისკრიმინაციული ანალიზის ამოცანების გადასაჭრელად პირველად იქნა შემოთავაზებული ჯერ კიდევ 1952 წელს. ეს არის შემდეგი.

უცნობი ობიექტის კლასიფიკაციისას, ნაპოვნია მისთვის გეომეტრიულად ყველაზე ახლოს სხვა ობიექტების მოცემული რიცხვი (k) ფუნქციების სივრცეში (უახლოესი მეზობლები), რომლებსაც უკვე ცნობილია ცნობადი კლასების კუთვნილება. უცნობი ობიექტის კონკრეტულ სადიაგნოსტიკო კლასზე მინიჭების გადაწყვეტილება მიიღება მისი უახლოესი მეზობლების ამ ცნობილი წევრობის შესახებ ინფორმაციის გაანალიზებით, მაგალითად, მარტივი ხმების დათვლის გამოყენებით.

თავდაპირველად, k-უახლოესი მეზობლის მეთოდი განიხილებოდა, როგორც არაპარამეტრული მეთოდი ალბათობის თანაფარდობის შესაფასებლად. ამ მეთოდისთვის მიიღება მისი ეფექტურობის თეორიული შეფასებები ბაიესის ოპტიმალურ კლასიფიკატორთან შედარებით. დადასტურებულია, რომ k-უახლოესი მეზობლის მეთოდის ასიმპტოტური შეცდომის ალბათობა აღემატება ბეიესის წესის შეცდომებს არა უმეტეს ორჯერ.

როგორც ზემოთ აღინიშნა, რეალურ პრობლემებში ხშირად საჭიროა ობიექტებთან მუშაობა, რომლებიც აღწერილია ხარისხობრივი (დიქოტომიური) მახასიათებლების დიდი რაოდენობით. ამავდროულად, ფუნქციური სივრცის განზომილება არის შესასწავლი ნიმუშის მოცულობის შესაბამისი ან აღემატება. ასეთ პირობებში მოსახერხებელია სასწავლო ნიმუშის თითოეული ობიექტის ინტერპრეტაცია, როგორც ცალკეული ხაზოვანი კლასიფიკატორი. მაშინ ესა თუ ის დიაგნოსტიკური კლასი წარმოდგენილია არა ერთი პროტოტიპით, არამედ წრფივი კლასიფიკატორების ნაკრებით. ხაზოვანი კლასიფიკატორების კომბინირებული ურთიერთქმედება იწვევს ცალ-ცალკე წრფივ ზედაპირს, რომელიც გამოყოფს ცნობად კლასებს ფუნქციების სივრცეში. გამყოფი ზედაპირის ტიპი, რომელიც შედგება ჰიპერპლანტების ნაწილებისგან, შეიძლება იყოს მრავალფეროვანი და დამოკიდებულია კლასიფიცირებული აგრეგატების შედარებით პოზიციაზე.

ასევე შეიძლება გამოყენებულ იქნას k-უახლოესი მეზობლის კლასიფიკაციის მექანიზმების სხვა ინტერპრეტაცია. იგი ემყარება ზოგიერთი ლატენტური ცვლადის არსებობის იდეას, აბსტრაქტული ან დაკავშირებული თავდაპირველ ფუნქციურ სივრცესთან რაიმე ტრანსფორმაციით. თუ ობიექტებს შორის წყვილი მანძილი ფარული ცვლადების სივრცეში იგივეა, რაც საწყისი მახასიათებლების სივრცეში და ამ ცვლადების რაოდენობა გაცილებით ნაკლებია, ვიდრე ობიექტების რაოდენობა, მაშინ შეიძლება ჩაითვალოს k-უახლოესი მეზობლების მეთოდის ინტერპრეტაცია. პირობითი ალბათობის განაწილების სიმკვრივეების არაპარამეტრული შეფასებების შედარების თვალსაზრისით. აქ წარმოდგენილი ლატენტური ცვლადების კონცეფცია ბუნებით ახლოს არის ჭეშმარიტი განზომილების კონცეფციასთან და სხვა წარმოდგენებთან, რომლებიც გამოიყენება განზომილების შემცირების სხვადასხვა მეთოდებში.

შაბლონის ამოცნობისთვის k-უახლოესი მეზობლების მეთოდის გამოყენებისას მკვლევარმა უნდა გადაჭრას მეტრიკის არჩევის რთული პრობლემა, რათა დადგინდეს დიაგნოზირებული ობიექტების სიახლოვე. ეს პრობლემა ფუნქციური სივრცის მაღალი განზომილების პირობებში უკიდურესად მწვავდება ამ მეთოდის საკმარისად შრომატევადობის გამო, რაც მნიშვნელოვანი ხდება მაღალი ხარისხის კომპიუტერებისთვისაც კი. აქედან გამომდინარე, აქ, ისევე როგორც პროტოტიპის შედარების მეთოდში, აუცილებელია ექსპერიმენტული მონაცემების მრავალგანზომილებიანი სტრუქტურის ანალიზის შემოქმედებითი პრობლემის გადაჭრა, რათა მინიმუმამდე დავიყვანოთ სადიაგნოსტიკო კლასების წარმომადგენლობითი ობიექტების რაოდენობა.

ქულების გამოთვლის ალგორითმები (კენჭისყრა).ქულების გამოთვლის ალგორითმების მოქმედების პრინციპი (ABO) არის პრიორიტეტის (მსგავსების ქულების) გამოთვლა, რომელიც ახასიათებს აღიარებული და საცნობარო ობიექტების "სიახლოვეს" მხატვრული ანსამბლების სისტემის მიხედვით, რომელიც არის მოცემული ქვეჯგუფების სისტემა. მახასიათებლების ნაკრები.

ყველა ადრე განხილული მეთოდისგან განსხვავებით, შეფასებების გამოთვლის ალგორითმები ფუნქციონირებს ობიექტების აღწერილობით ფუნდამენტურად ახალი გზით. ამ ალგორითმებისთვის ობიექტები ერთდროულად არსებობენ ფუნქციების სივრცის ძალიან განსხვავებულ ქვესივრცეში. ABO კლასს თავის ლოგიკურ დასკვნამდე მიჰყავს მახასიათებლების გამოყენების იდეა: რადგან ყოველთვის არ არის ცნობილი მახასიათებლების რომელი კომბინაციებია ყველაზე ინფორმატიული, ABO-ში ობიექტების მსგავსების ხარისხი გამოითვლება მახასიათებლების ყველა შესაძლო ან გარკვეული კომბინაციის შედარებით. შედის ობიექტების აღწერილობაში.

გადაწყვეტილების გუნდების წესები.გადაწყვეტილების წესი იყენებს ორ დონის აღიარების სქემას. პირველ დონეზე მუშაობს კერძო ამოცნობის ალგორითმები, რომელთა შედეგები გაერთიანებულია მეორე დონეზე სინთეზის ბლოკში. ასეთი კომბინაციის ყველაზე გავრცელებული მეთოდები ეფუძნება კონკრეტული ალგორითმის კომპეტენციის სფეროების განაწილებას. კომპეტენციის სფეროების პოვნის უმარტივესი გზაა ფუნქციური სივრცის აპრიორი გაყოფა კონკრეტული მეცნიერების პროფესიული მოსაზრებების საფუძველზე (მაგალითად, ნიმუშის სტრატიფიკაცია რომელიმე მახასიათებლის მიხედვით). შემდეგ, თითოეული შერჩეული სფეროსთვის, აგებულია საკუთარი ამოცნობის ალგორითმი. სხვა მეთოდი ემყარება ფორმალური ანალიზის გამოყენებას, რათა განისაზღვროს ფუნქციური სივრცის ლოკალური არეები, როგორც ცნობადი ობიექტების უბნები, რისთვისაც დადასტურებულია ნებისმიერი კონკრეტული ამოცნობის ალგორითმის წარმატება.

სინთეზური ბლოკის აგების ყველაზე ზოგადი მიდგომა განიხილავს ნაწილობრივი ალგორითმების მიღებულ ინდიკატორებს, როგორც საწყის მახასიათებლებს ახალი განზოგადებული გადაწყვეტილების წესის ასაგებად. ამ შემთხვევაში, შაბლონის ამოცნობაში ინტენსიური და გაფართოებული მიმართულებების ყველა ზემოაღნიშნული მეთოდის გამოყენება შეიძლება. გადაწყვეტილების წესების შექმნის პრობლემის გადასაჭრელად ეფექტურია „კორას“ ტიპის ლოგიკური ალგორითმები და შეფასებების გამოთვლის ალგორითმები (ABO), რომლებიც ქმნიან ე.წ. ამოცნობის ალგორითმები, რომლებშიც ჯდება ყველა არსებული ტიპის ალგორითმები.

ნერვული ქსელის მეთოდები

ნერვული ქსელის მეთოდები არის მეთოდები, რომლებიც დაფუძნებულია სხვადასხვა ტიპის ნერვული ქსელების (NN) გამოყენებაზე. სხვადასხვა NN-ების გამოყენების ძირითადი სფეროები შაბლონისა და გამოსახულების ამოცნობისთვის:

    განაცხადი მოცემული სურათების ძირითადი მახასიათებლების ან მახასიათებლების ამოსაღებად,

    თავად სურათების ან მათგან უკვე ამოღებული მახასიათებლების კლასიფიკაცია (პირველ შემთხვევაში, ძირითადი მახასიათებლების ამოღება ხდება იმპლიციურად ქსელში),

    ოპტიმიზაციის პრობლემების გადაწყვეტა.

მრავალშრიანი ნერვული ქსელები.მრავალშრიანი ნერვული ქსელის (MNN) არქიტექტურა შედგება თანმიმდევრულად დაკავშირებული შრეებისგან, სადაც თითოეული ფენის ნეირონი დაკავშირებულია წინა ფენის ყველა ნეირონთან თავისი შეყვანით და შემდეგის გამომავალთან.

ერთშრიანი NN-ის (ე.წ. ავტო-ასოციაციური მეხსიერების) უმარტივესი გამოყენება არის ქსელის მომზადება, რათა აღადგინოს საკვების სურათები. სატესტო სურათის შეყვანით და რეკონსტრუირებული სურათის ხარისხის გაანგარიშებით, შეიძლება შეფასდეს, რამდენად კარგად ცნობს ქსელმა შეყვანილი სურათი. ამ მეთოდის დადებითი თვისებებია ის, რომ ქსელს შეუძლია დამახინჯებული და ხმაურიანი სურათების აღდგენა, მაგრამ ის არ არის შესაფერისი უფრო სერიოზული მიზნებისთვის.

MNN ასევე გამოიყენება სურათების პირდაპირი კლასიფიკაციისთვის - შეყვანა არის ან თავად სურათი რაიმე ფორმით, ან სურათის ადრე ამოღებული ძირითადი მახასიათებლების ნაკრები, გამოსავალზე, მაქსიმალური აქტივობის მქონე ნეირონი მიუთითებს აღიარებულ კლასზე კუთვნილებაზე (ნახ. 4). თუ ეს აქტივობა გარკვეულ ზღურბლზე დაბალია, მაშინ ითვლება, რომ წარმოდგენილი სურათი არ ეკუთვნის არცერთ ცნობილ კლასს. სასწავლო პროცესი ადგენს შეყვანილი სურათების შესაბამისობას გარკვეულ კლასს. ამას ეწოდება ზედამხედველობითი სწავლება. ეს მიდგომა კარგია წვდომის კონტროლის ამოცანებისთვის ადამიანთა მცირე ჯგუფისთვის. ეს მიდგომა უზრუნველყოფს თავად სურათების პირდაპირ შედარებას ქსელის მიერ, მაგრამ კლასების რაოდენობის მატებასთან ერთად, ტრენინგის დრო და ქსელის მუშაობის დრო ექსპონენტურად იზრდება. ამიტომ, ისეთი ამოცანებისთვის, როგორიცაა მსგავსი ადამიანის ძიება დიდ მონაცემთა ბაზაში, ის მოითხოვს ძირითადი ფუნქციების კომპაქტური ნაკრების ამოღებას, საიდანაც უნდა მოძებნოთ.

კლასიფიკაციის მიდგომა მთელი სურათის სიხშირის მახასიათებლების გამოყენებით აღწერილია. გამოყენებული იქნა ერთშრიანი NS, რომელიც დაფუძნებულია მრავალმნიშვნელოვან ნეირონებზე.

B გვიჩვენებს NN-ის გამოყენებას გამოსახულების კლასიფიკაციისთვის, როდესაც ქსელის შეყვანა იღებს გამოსახულების დაშლის შედეგებს ძირითადი კომპონენტების მეთოდით.

კლასიკურ MNS-ში, შუალედური ნერვული კავშირები სრულად არის დაკავშირებული და გამოსახულება წარმოდგენილია როგორც ერთგანზომილებიანი ვექტორი, თუმცა ის ორგანზომილებიანია. კონვოლუციური ნერვული ქსელის არქიტექტურა მიზნად ისახავს ამ ხარვეზების დაძლევას. მან გამოიყენა ლოკალური რეცეპტორული ველები (ნეირონების ლოკალური ორგანზომილებიანი კავშირის უზრუნველყოფა), ზოგადი წონები (ზოგიერთი მახასიათებლის გამოვლენის უზრუნველყოფა გამოსახულების ნებისმიერ წერტილში) და იერარქიულ ორგანიზაციას სივრცითი ქვენიმუშებით (სივრცითი ქვენიმუში). Convolutional NN (CNN) უზრუნველყოფს ნაწილობრივ წინააღმდეგობას მასშტაბის ცვლილებების, გადაადგილების, ბრუნვის, დამახინჯების მიმართ.

MNS ასევე გამოიყენება გარკვეული ტიპის ობიექტების გამოსავლენად. გარდა იმისა, რომ ნებისმიერ გაწვრთნილ MNS-ს შეუძლია გარკვეულწილად განსაზღვროს, ეკუთვნის თუ არა გამოსახულებები „საკუთარი“ კლასებს, ის შეიძლება სპეციალურად იყოს გაწვრთნილი გარკვეული კლასების საიმედოდ გამოსავლენად. ამ შემთხვევაში, გამომავალი კლასები იქნება კლასები, რომლებიც ეკუთვნის და არ მიეკუთვნებიან მოცემულ გამოსახულების ტიპს. ნერვული ქსელის დეტექტორი გამოიყენებოდა შეყვანის სურათში სახის გამოსახულების დასადგენად. სურათის სკანირება მოხდა 20x20 პიქსელიანი ფანჯრით, რომელიც მიეწოდება ქსელის შეყვანას, რომელიც წყვეტს, მიეკუთვნება თუ არა მოცემული ტერიტორია სახეების კლასს. ტრენინგი ჩატარდა როგორც დადებითი მაგალითების (სახეების სხვადასხვა გამოსახულება) ასევე ნეგატიური მაგალითების გამოყენებით (გამოსახულებები, რომლებიც არ არის სახეები). გამოვლენის სანდოობის ასამაღლებლად გამოიყენეს სხვადასხვა საწყისი წონით გაწვრთნილი NN-ების გუნდი, რის შედეგადაც NN-ებმა სხვადასხვა გზით დაუშვეს შეცდომები და საბოლოო გადაწყვეტილება მიიღეს მთელი გუნდის კენჭისყრით.

სურათი 5. ძირითადი კომპონენტები (საკუთრივ სახეები) და გამოსახულების დაშლა ძირითად კომპონენტებად

NN ასევე გამოიყენება გამოსახულების ძირითადი მახასიათებლების ამოსაღებად, რომლებიც შემდეგ გამოიყენება შემდგომი კლასიფიკაციისთვის. In , ნაჩვენებია ძირითადი კომპონენტის ანალიზის მეთოდის ნერვული ქსელის განხორციელების მეთოდი. ძირითადი კომპონენტის ანალიზის მეთოდის არსი მდგომარეობს იმაში, რომ მივიღოთ მაქსიმალური დეკორელირებული კოეფიციენტები, რომლებიც ახასიათებენ შეყვანის შაბლონებს. ამ კოეფიციენტებს უწოდებენ ძირითად კომპონენტებს და გამოიყენება სურათის სტატისტიკური შეკუმშვისთვის, რომელშიც კოეფიციენტების მცირე რაოდენობა გამოიყენება მთლიანი სურათის წარმოსაჩენად. NN ერთი ფარული ფენით, რომელიც შეიცავს N ნეირონს (რომელიც გამოსახულების განზომილებაზე გაცილებით მცირეა), გაწვრთნილი შეცდომის უკან გავრცელების მეთოდით, რათა აღადგინოს შემავალი სურათი გამოსავალზე, აყალიბებს პირველი N ძირითადი კომპონენტების კოეფიციენტებს გამოსავალზე. ფარული ნეირონები, რომლებიც გამოიყენება შედარებისთვის. როგორც წესი, გამოიყენება 10-დან 200-მდე ძირითადი კომპონენტი. კომპონენტების რიცხვის მატებასთან ერთად, მისი წარმომადგენლობითობა მნიშვნელოვნად მცირდება და დიდი რაოდენობით კომპონენტების გამოყენებას აზრი არ აქვს. ნერვული ელემენტების არაწრფივი აქტივაციის ფუნქციების გამოყენებისას შესაძლებელია არაწრფივი დაშლა ძირითად კომპონენტებად. არაწრფივიობა საშუალებას გაძლევთ უფრო ზუსტად ასახოთ შეყვანის მონაცემების ვარიაციები. ძირითადი კომპონენტის ანალიზის გამოყენებით სახის გამოსახულებების დაშლაში, ჩვენ ვიღებთ ძირითად კომპონენტებს, სახელწოდებით სათანადო სახეები, რომლებსაც ასევე აქვთ სასარგებლო თვისება - არის კომპონენტები, რომლებიც ძირითადად ასახავს სახის ისეთ არსებით მახასიათებლებს, როგორიცაა სქესი, რასა, ემოციები. აღდგენისას, კომპონენტებს აქვთ სახის მსგავსი გარეგნობა, პირველი ასახავს სახის ყველაზე ზოგად ფორმას, მეორე წარმოადგენს სხვადასხვა მცირე განსხვავებას სახეებს შორის (ნახ. 5). ეს მეთოდი კარგად გამოიყენება მსგავსი სახის სურათების მოსაძიებლად დიდ მონაცემთა ბაზებში. ასევე ნაჩვენებია ძირითადი კომპონენტების განზომილების შემდგომი შემცირების შესაძლებლობა NS-ის დახმარებით. შეყვანის სურათის რეკონსტრუქციის ხარისხის შეფასებით, ძალიან ზუსტად შეიძლება დადგინდეს, ეკუთვნის თუ არა ის სახეების კლასს.

მაღალი რიგის ნერვული ქსელები.მაღალი რიგის ნერვული ქსელები (HNN) განსხვავდება MNN-ებისგან იმით, რომ მათ აქვთ მხოლოდ ერთი ფენა, მაგრამ ნეირონების შეყვანები ასევე იღებენ მაღალი რიგის ტერმინებს, რომლებიც შეყვანის ვექტორის ორი ან მეტი კომპონენტის პროდუქტია. ასეთ ქსელებს ასევე შეუძლიათ შექმნან რთული გამყოფი ზედაპირები.

ჰოპფილდის ნერვული ქსელები. Hopfield NN (HSH) არის ერთშრიანი და სრულად დაკავშირებული (არ არსებობს ნეირონების კავშირები საკუთარ თავთან), მისი გამოსასვლელები დაკავშირებულია შეყვანებთან. MNS-ისგან განსხვავებით, NSH დამამშვიდებელია, ე.ი. დაყენებულია საწყის მდგომარეობაში, ის ფუნქციონირებს მანამ, სანამ არ მიაღწევს სტაბილურ მდგომარეობას, რაც იქნება მისი გამომავალი მნიშვნელობა. ოპტიმიზაციის პრობლემებთან მიმართებაში გლობალური მინიმუმის მოსაძებნად გამოიყენება NSH-ის სტოქასტური მოდიფიკაციები.

NSH-ის, როგორც ასოციაციური მეხსიერების გამოყენება საშუალებას გაძლევთ ზუსტად აღადგინოთ გამოსახულება, რომლებზეც ქსელი იყო გაწვრთნილი, როდესაც დამახინჯებული სურათი მიეწოდება შეყვანას. ამ შემთხვევაში, ქსელი „დაიმახსოვრებს“ უახლოეს (ენერგიის ადგილობრივი მინიმალური გაგებით) გამოსახულებას და ამით ამოიცნობს მას. ასეთი ფუნქციონირება ასევე შეიძლება ჩაითვალოს ზემოთ აღწერილი ავტო-ასოციაციური მეხსიერების თანმიმდევრულ გამოყენებად. ავტომატური ასოციაციური მეხსიერებისგან განსხვავებით, NSH სრულყოფილად აღადგენს სურათს. ჩარევის მინიმუმის თავიდან ასაცილებლად და ქსელის სიმძლავრის გაზრდის მიზნით, გამოიყენება სხვადასხვა მეთოდები.

კოჰონენის თვითორგანიზებული ნერვული ქსელები. Kohonen-ის თვითორგანიზებული ნერვული ქსელები (SNNCs) უზრუნველყოფენ გამოსახულების შეყვანის სივრცის ტოპოლოგიურ დალაგებას. ისინი საშუალებას აძლევენ შეყვანის n-განზომილებიანი სივრცის ტოპოლოგიურად უწყვეტ რუკს გამომავალ m-განზომილებაში, m.<

კოგნიტრონი.კოგნიტრონი თავისი არქიტექტურით ჰგავს ვიზუალური ქერქის სტრუქტურას, მას აქვს იერარქიული მრავალშრიანი ორგანიზაცია, რომელშიც ფენებს შორის ნეირონები დაკავშირებულია მხოლოდ ადგილობრივად. ტრენინგი კონკურენტული სწავლებით (მასწავლებლის გარეშე). ტვინის თითოეული ფენა ახორციელებს განზოგადების სხვადასხვა დონეს; შეყვანის ფენა მგრძნობიარეა მარტივი შაბლონების მიმართ, როგორიცაა ხაზები, და მათი ორიენტაცია ვიზუალური არეალის გარკვეულ ადგილებში, ხოლო სხვა ფენების რეაქცია უფრო რთული, აბსტრაქტული და დამოუკიდებელია ნიმუშის პოზიციისგან. მსგავსი ფუნქციები ხორციელდება კოგნიტრონში ვიზუალური ქერქის ორგანიზაციის მოდელირებით.

ნეოკოგნიტრონი არის კოგნიტრონის იდეის შემდგომი განვითარება და უფრო ზუსტად ასახავს ვიზუალური სისტემის სტრუქტურას, საშუალებას გაძლევთ ამოიცნოთ სურათები მათი გარდაქმნების, ბრუნვის, დამახინჯებისა და მასშტაბის ცვლილების მიუხედავად.

კოგნიტრონი არის გამოსახულების ამოცნობის მძლავრი ინსტრუმენტი, თუმცა ის მოითხოვს მაღალ გამოთვლით ხარჯებს, რომლებიც ამჟამად მიუწვდომელია.

განხილული ნერვული ქსელის მეთოდები უზრუნველყოფს გამოსახულების სწრაფ და საიმედო ამოცნობას, მაგრამ ამ მეთოდების გამოყენებისას პრობლემები წარმოიქმნება სამგანზომილებიანი ობიექტების ამოცნობაში. თუმცა, ამ მიდგომას ბევრი უპირატესობა აქვს.

      დასკვნა

ამჟამად, არსებობს საკმაოდ დიდი რაოდენობის ავტომატური ნიმუშის ამოცნობის სისტემები სხვადასხვა გამოყენებითი პრობლემებისთვის.

ნიმუშის აღიარება ფორმალური მეთოდებით, როგორც ფუნდამენტური სამეცნიერო მიმართულება, ამოუწურავია.

გამოსახულების დამუშავების მათემატიკურ მეთოდებს აქვს მრავალფეროვანი გამოყენება: მეცნიერება, ტექნოლოგია, მედიცინა, სოციალური სფერო. მომავალში კიდევ უფრო გაიზრდება ნიმუშების ამოცნობის როლი ადამიანის ცხოვრებაში.

ნერვული ქსელის მეთოდები უზრუნველყოფს გამოსახულების სწრაფ და საიმედო ამოცნობას. ამ მიდგომას ბევრი უპირატესობა აქვს და ერთ-ერთი ყველაზე პერსპექტიულია.

ლიტერატურა

    დ.ვ. ბრილიუკი, ვ.ვ. სტაროვოიტოვი. სურათის ამოცნობის ნერვული ქსელის მეთოდები // /

    Kuzin L.T. კიბერნეტიკის საფუძვლები: კიბერნეტიკური მოდელების საფუძვლები. T.2. - მ.: ენერგია, 1979. - 584გვ.

    პერეგუდოვი F.I., Tarasenko F.P. სისტემის ანალიზის შესავალი: სახელმძღვანელო. - მ .: უმაღლესი სკოლა, 1997. - 389 წ.

    თემნიკოვი F.E., Afonin V.A., Dmitriev V.I. საინფორმაციო ტექნოლოგიების თეორიული საფუძვლები. - მ.: ენერგია, 1979. - 511 წ.

    Tu J., Gonzalez R. Pattern Recognition Principles. / პერ. ინგლისურიდან. - მ.: მირი, 1978. - 410 წ.

    Winston P. ხელოვნური ინტელექტი. / პერ. ინგლისურიდან. - მ.: მირი, 1980. - 520 წ.

    Fu K. სტრუქტურული მეთოდები ნიმუშის ამოცნობაში: თარგმნა ინგლისურიდან. - მ.: მირი, 1977. - 320 წ.

    ციპკინი ია.ზ. იდენტიფიკაციის ინფორმაციის თეორიის საფუძვლები. - მ.: ნაუკა, 1984. - 520 წ.

    პოსპელოვი გ.ს. ხელოვნური ინტელექტი ახალი საინფორმაციო ტექნოლოგიების საფუძველია. - მ.: ნაუკა, 1988. - 280 წ.

    იუ ლიფშიცი, ნიმუშის ამოცნობის სტატისტიკური მეთოდები ///modern/07modernnote.pdf

    Bohr N. ატომური ფიზიკა და ადამიანის ცოდნა. / თარგმანი ინგლისურიდან. - მ.: მირი, 1961. - 151 წ.

    ბუტაკოვი E.A., Ostrovsky V.I., Fadeev I.L. გამოსახულების დამუშავება კომპიუტერზე.1987.-236s.

    Duda R., Hart P. ნიმუშის ამოცნობა და სცენის ანალიზი. / თარგმანი ინგლისურიდან. - მ.: მირი, 1978. - 510 წ.

    ჰერცოგი V.A. კომპიუტერული ფსიქოდიაგნოსტიკა. - პეტერბურგი: ძმობა, 1994. - 365გვ.

    აიზენბერგი I.N., Aizenberg N. N. და Krivosheev G.A. მრავალმნიშვნელოვანი და უნივერსალური ორობითი ნეირონები: სწავლის ალგორითმები, გამოსახულების დამუშავებისა და ამოცნობის აპლიკაციები. ლექციის შენიშვნები ხელოვნურ ინტელექტში - მანქანათმცოდნეობა და მონაცემთა მოპოვება შაბლონების ამოცნობაში, 1999, გვ. 21-35.

    Ranganath S. და Arun K. სახის ამოცნობა ტრანსფორმაციის მახასიათებლებისა და ნერვული ქსელების გამოყენებით. Pattern Recognition 1997, ტ. 30, გვ. 1615-1622 წწ.

    გოლოვკო ვ.ა. ნეიროინტელექტი: თეორია და აპლიკაციები. წიგნი 1. ნერვული ქსელების ორგანიზება და სწავლება პირდაპირი და უკუკავშირით - ბრესტი: BPI, 1999, - 260s.

    Vetter T. და Poggio T. ხაზოვანი ობიექტების კლასები და გამოსახულების სინთეზი ერთი მაგალითის სურათიდან. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, ტ. 19, გვ. 733-742 წწ.

    გოლოვკო ვ.ა. ნეიროინტელექტი: თეორია და აპლიკაციები. წიგნი 2. თვითორგანიზება, ხარვეზების ტოლერანტობა და ნერვული ქსელების გამოყენება - ბრესტი: BPI, 1999, - 228s.

    Lawrence S., Giles C. L., Tsoi A. C. და Back A. D. Face Recognition: A Convolutional Neural Network Approach. IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, pp. 1-24.

    Wasserman F. ნეიროკომპიუტერული ტექნოლოგია: თეორია და პრაქტიკა, 1992 - 184p.

    Rowley H. A., Baluja S. და Kanade T. ნეირონულ ქსელზე დაფუძნებული სახის გამოვლენა. IEEE Transactions on Pattern Analysis and Machine Intelligence 1998, ტ. 20, გვ. 23-37.

    Valentin D., Abdi H., O "Toole A. J. და Cottrell G. W. სახის დამუშავების კონექტიონისტური მოდელები: გამოკითხვა. IN: Pattern Recognition 1994, ტ. 27, გვ. 1209-1230.

    დოკუმენტი

    ისინი ქმნიან ალგორითმებს აღიარებასურათები. მეთოდებიაღიარებასურათებიროგორც ზემოთ აღინიშნა ... რეალობა არ არის არსებობს„ზოგადად ეკოსისტემები“ და არსებობსმხოლოდ რამდენიმე ... დასკვნა ამ დეტალიდან მიმოხილვამეთოდებიაღიარებაჩვენ წარმოვადგინეთ...

  1. სახის გამოსახულებების საფუძველზე ადამიანების იდენტიფიკაციის მეთოდების მიმოხილვა, ვიზუალური ამოცნობის მახასიათებლების გათვალისწინებით

    Მიმოხილვა

    ... აღიარებადაბალი კონტრასტული ობიექტების პირის მიერ, მ.შ. პირები. ჩამოტანილი მიმოხილვასაერთო მეთოდები ... არსებობსმთელი ხაზი მეთოდები ... გზა, კვლევის შედეგად შეიქმნა პლატფორმა განვითარებისათვის მეთოდიაღიარება ...

  2. იმენი გლაზკოვა ვალენტინა ვლადიმეროვნა მრავალ თემატური ჰიპერტექსტური დოკუმენტების კლასიფიკაციის პროგრამული უზრუნველყოფის ინსტრუმენტების მშენებლობის მეთოდების კვლევა და შემუშავება სპეციალობა 05

    დისერტაციის რეზიუმე

    ჰიპერტექსტური დოკუმენტები. თავი შეიცავს მიმოხილვაარსებულიმეთოდებიგანსახილველი პრობლემის გადაწყვეტა, აღწერა ... ყველაზე ნაკლებად შესაბამისი კლასების ამოკვეთით // მათემატიკური მეთოდებიაღიარებასურათები: მე-13 სრულიადრუსული კონფერენცია. ლენინგრადის რეგიონი...

  3. სლაიდი 0 გენეტიკური ტექსტების ანალიზსა და დამუშავებასთან დაკავშირებული ბიოინფორმატიკის ამოცანების მიმოხილვა

    ლექცია

    დნმ და ცილების თანმიმდევრობა. Მიმოხილვაბიოინფორმატიკის ამოცანები, როგორც ამოცანები ... სიგნალები მოითხოვს თანამედროვე მეთოდებიაღიარებასურათები, სტატისტიკური მიდგომები და ... დაბალი გენის სიმკვრივით. არსებულიგენის პროგნოზირების პროგრამები არ...

და ა.შ. ობიექტები, რომლებიც ხასიათდებიან გარკვეული თვისებებისა და მახასიათებლების სასრული ნაკრებით. ასეთი ამოცანები საკმაოდ ხშირად წყდება, მაგალითად, შუქნიშანზე ქუჩის გადაკვეთისას ან მოძრაობისას. ანთებული შუქნიშნის ფერის ამოცნობა და გზის წესების ცოდნა საშუალებას გაძლევთ მიიღოთ სწორი გადაწყვეტილება, გადაკვეთთ თუ არა ქუჩას.

ასეთი აღიარების საჭიროება ჩნდება სხვადასხვა სფეროში - სამხედრო საქმეებიდან და უსაფრთხოების სისტემებიდან ანალოგური სიგნალების დიგიტალიზაციამდე.

გამოსახულების ამოცნობის პრობლემას განსაკუთრებული მნიშვნელობა ენიჭება ინფორმაციის გადატვირთვის პირობებში, როდესაც ადამიანი ვერ უმკლავდება მასში შემოსული შეტყობინებების ხაზოვან-თანმიმდევრულ გაგებას, რის შედეგადაც მისი ტვინი გადადის ერთდროული აღქმისა და აზროვნების რეჟიმში. რომელსაც ასეთი აღიარება ახასიათებს.

შემთხვევითი არ არის, რომ გამოსახულების ამოცნობის პრობლემა აღმოჩნდა ინტერდისციპლინური კვლევის სფეროში - მათ შორის ხელოვნური ინტელექტის შექმნასთან და ტექნიკური სისტემების შექმნასთან დაკავშირებით. ნიმუშის ამოცნობასულ უფრო მეტ ყურადღებას იპყრობს.

ენციკლოპედიური YouTube

    1 / 4

    ნიმუშის ამოცნობის შესავალი

    რ.ვ. შამინი. ლექცია No6 ჰოპფილდის და ჰემინგის ქსელები შაბლონების ამოცნობის პრობლემებში

    [DDSH-2016]: ნერვული ქსელები და თანამედროვე კომპიუტერული ხედვა

    ლექცია 9. ექსპონენციალური გლუვი. ნიმუშის ამოცნობა: kth უახლოესი მეზობლის მეთოდი

    სუბტიტრები

მიმართულებები ნიმუშის ამოცნობაში

არსებობს ორი ძირითადი მიმართულება:

  • ცოცხალი არსებების ამოცნობის უნარის შესწავლა, მათი ახსნა და მოდელირება;
  • გამოყენებითი მიზნებისთვის ინდივიდუალური პრობლემების გადასაჭრელად შექმნილი მოწყობილობების აგების თეორიისა და მეთოდების შემუშავება.

პრობლემის ფორმალური განცხადება

ნიმუშის ამოცნობა არის საწყისი მონაცემების მინიჭება გარკვეულ კლასზე იმ არსებითი მახასიათებლების ხაზგასმით, რომლებიც ახასიათებს ამ მონაცემებს არაარსებითი მონაცემების მთლიანი მასიდან.

ამოცნობის პრობლემების დაყენებისას ისინი ცდილობენ გამოიყენონ მათემატიკური ენა, ცდილობენ - ხელოვნური ნერვული ქსელების თეორიისგან განსხვავებით, სადაც საფუძველი ექსპერიმენტის გზით შედეგის მიღებაა - ექსპერიმენტი ჩაანაცვლონ ლოგიკური მსჯელობითა და მათემატიკური მტკიცებულებებით.

ნიმუშის ამოცნობის პრობლემის კლასიკური განცხადება: მოცემულია ობიექტების ნაკრები. ისინი უნდა იყოს კლასიფიცირებული. ნაკრები წარმოდგენილია ქვესიმრავლებით, რომლებსაც კლასები უწოდებენ. მოცემულია: ინფორმაცია კლასების შესახებ, მთელი ნაკრების აღწერა და ინფორმაციის აღწერა ობიექტის შესახებ, რომლის კუთვნილება კონკრეტულ კლასს უცნობია. საჭიროა, კლასების შესახებ არსებული ინფორმაციისა და ობიექტის აღწერის მიხედვით, დადგინდეს, რომელ კლასს ეკუთვნის ეს ობიექტი.

ყველაზე ხშირად, მონოქრომული სურათები განიხილება ნიმუშის ამოცნობის პრობლემებში, რაც შესაძლებელს ხდის გამოსახულების განხილვას, როგორც ფუნქციას სიბრტყეზე. თუ განვიხილავთ სიბრტყეზე დაყენებულ წერტილს T (\displaystyle T), სადაც ფუნქცია გამოსახულების თითოეულ წერტილში გამოხატავს თავის მახასიათებელს - სიკაშკაშეს, გამჭვირვალობას, ოპტიკურ სიმკვრივეს, მაშინ ასეთი ფუნქცია გამოსახულების ფორმალური ჩანაწერია.

ყველა შესაძლო ფუნქციის ნაკრები f (x , y) (\displaystyle f(x, y))ზედაპირზე T (\displaystyle T)- არის ყველა სურათის ნაკრების მოდელი X (\displaystyle X). კონცეფციის გაცნობა მსგავსებასურათებს შორის შეგიძლიათ დააყენოთ ამოცნობის ამოცანა. ასეთი პარამეტრის სპეციფიკური ფორმა ძლიერ არის დამოკიდებული აღიარების შემდგომ ეტაპებზე ამა თუ იმ მიდგომის შესაბამისად.

გრაფიკული სურათების ამოცნობის ზოგიერთი მეთოდი

გამოსახულების ოპტიკური ამოცნობისთვის შეგიძლიათ გამოიყენოთ ობიექტის ტიპზე გამეორების მეთოდი სხვადასხვა კუთხით, მასშტაბებით, ოფსეტებით და ა.შ. ასოებისთვის, თქვენ უნდა გაიმეოროთ შრიფტი, შრიფტის თვისებები და ა.

მეორე მიდგომა არის ობიექტის კონტურის პოვნა და მისი თვისებების შემოწმება (დაკავშირება, კუთხეების არსებობა და ა.შ.)

კიდევ ერთი მიდგომაა ხელოვნური ნერვული ქსელების გამოყენება. ეს მეთოდი მოითხოვს ან ამოცნობის ამოცანის მაგალითების დიდ რაოდენობას (სწორი პასუხებით), ან სპეციალური ნერვული ქსელის სტრუქტურას, რომელიც ითვალისწინებს ამ ამოცანის სპეციფიკას.

პერცეპტრონი, როგორც ნიმუშის ამოცნობის მეთოდი

ფ. როზენბლატმა, შემოგვთავაზა ტვინის მოდელის კონცეფცია, რომლის ამოცანაა აჩვენოს, თუ როგორ შეიძლება წარმოიშვას ფსიქოლოგიური ფენომენი ზოგიერთ ფიზიკურ სისტემაში, რომლის სტრუქტურა და ფუნქციური თვისებები ცნობილია, აღწერა უმარტივესი დისკრიმინაციის ექსპერიმენტები. ეს ექსპერიმენტები მთლიანად დაკავშირებულია ნიმუშის ამოცნობის მეთოდებთან, მაგრამ განსხვავდება იმით, რომ ამოხსნის ალგორითმი არ არის დეტერმინისტული.

უმარტივესი ექსპერიმენტი, რომლის საფუძველზეც შესაძლებელია გარკვეული სისტემის შესახებ ფსიქოლოგიურად მნიშვნელოვანი ინფორმაციის მიღება, ემყარება იმ ფაქტს, რომ მოდელი წარმოდგენილია ორი განსხვავებული სტიმულით და მოეთხოვება მათზე რეაგირება სხვადასხვა გზით. ასეთი ექსპერიმენტის მიზანი შეიძლება იყოს სისტემის მიერ მათი სპონტანური დისკრიმინაციის შესაძლებლობის შესწავლა ექსპერიმენტატორის ჩარევის არარსებობის შემთხვევაში, ან, პირიქით, იძულებითი დისკრიმინაციის შესწავლა, რომელშიც ექსპერიმენტატორი ცდილობს ასწავლოს სისტემას განახორციელოს საჭირო კლასიფიკაცია.

სასწავლო ექსპერიმენტში პერცეპტრონი ჩვეულებრივ წარმოდგენილია გამოსახულების გარკვეული თანმიმდევრობით, რომელიც მოიცავს თითოეული კლასის წარმომადგენლებს, რომლებიც უნდა გამოირჩეოდნენ. მეხსიერების მოდიფიკაციის ზოგიერთი წესის მიხედვით, რეაქციის სწორი არჩევანი გამყარებულია. შემდეგ საკონტროლო სტიმული წარედგინება პერცეპტრონს და განისაზღვრება ამ კლასის სტიმულებზე სწორი პასუხის მიღების ალბათობა. დამოკიდებულია თუ არა შერჩეული საკონტროლო სტიმული ემთხვევა თუ არ ემთხვევა ერთ-ერთ სურათს, რომელიც გამოიყენებოდა სავარჯიშო თანმიმდევრობაში, მიიღება სხვადასხვა შედეგი:

  1. თუ საკონტროლო სტიმული არ ემთხვევა რომელიმე სასწავლო სტიმულს, მაშინ ექსპერიმენტი ასოცირდება არა მხოლოდ სუფთა დისკრიმინაცია, მაგრამ ასევე მოიცავს ელემენტებს განზოგადებები.
  2. თუ საკონტროლო სტიმული აღაგზნებს სენსორული ელემენტების გარკვეულ კომპლექტს, რომლებიც სრულიად განსხვავდებიან იმ ელემენტებისაგან, რომლებიც გააქტიურდნენ იმავე კლასის ადრე წარმოდგენილი სტიმულის გავლენის ქვეშ, მაშინ ექსპერიმენტი არის გამოკვლევა. სუფთა განზოგადება.

პერცეპტრონებს არ აქვთ სუფთა განზოგადების უნარი, მაგრამ ისინი საკმაოდ დამაკმაყოფილებლად ფუნქციონირებენ დისკრიმინაციის ექსპერიმენტებში, განსაკუთრებით იმ შემთხვევაში, თუ საკონტროლო სტიმული საკმარისად ემთხვევა ერთ-ერთ შაბლონს, რომლის შესახებაც პერცეპრონმა უკვე დაგროვდა გარკვეული გამოცდილება.

ნიმუშის ამოცნობის პრობლემების მაგალითები

  • შტრიხკოდის ამოცნობა
  • სანომრე ნიშნების ამოცნობა
  • გამოსახულების ამოცნობა
  • დედამიწის ქერქის ადგილობრივი უბნების ამოცნობა, რომლებშიც საბადოებია განთავსებული