კომპიუტერული ფილოლოგია. გამოთვლითი ლინგვისტიკა, როგორც გამოყენებითი ლინგვისტური დისციპლინა

ლინგვისტიკა (ლათ. lingua -
ენა), ლინგვისტიკა, ლინგვისტიკა - მეცნიერება,
ენების შესწავლა.
ეს არის ბუნების მეცნიერება ადამიანის ენაზოგადად
და მსოფლიოს ყველა ენაზე, როგორც მას
პერსონალიზებული წარმომადგენლები.
AT ფართო გაგებითსიტყვები, ლინგვისტიკა
იყოფა სამეცნიერო და პრაქტიკულ. Უფრო ხშირად
უბრალოდ ლინგვისტიკაში იგულისხმება ზუსტად
სამეცნიერო ლინგვისტიკა. ის სემიოტიკის ნაწილია
ნიშნების მეცნიერება.
ლინგვისტიკას პროფესიონალურად ეწევიან ლინგვისტები.

ლინგვისტიკა და ინფორმატიკა.
ცხოვრებაში თანამედროვე საზოგადოება მნიშვნელოვანი როლიავტომატური თამაში
საინფორმაციო ტექნოლოგია. მაგრამ განვითარება საინფორმაციო ტექნოლოგიამიმდინარეობს
ძალიან არათანაბარი: თუ თანამედროვე დონეზე კომპიუტერული მეცნიერებადა
საოცარია კომუნიკაციის საშუალება, მერე სემანტიკური დამუშავების სფეროში
ინფორმაციის წარმატება ბევრად უფრო მოკრძალებულია. ეს წარმატებები პირველ რიგში დამოკიდებულია
მიღწევები პროცესების შესწავლაში ადამიანის აზროვნებამეტყველების პროცესები
ადამიანებს შორის კომუნიკაცია და ამ პროცესების კომპიუტერზე სიმულაციის უნარი. და ეს უკიდურესი სირთულის ამოცანაა.როცა ჩვენ ვსაუბრობთპერსპექტიულის შექმნაზე
საინფორმაციო ტექნოლოგიები, შემდეგ ტექსტის ავტომატური დამუშავების პრობლემები
წინა პლანზე მოდის ბუნებრივ ენებზე წარმოდგენილი ინფორმაცია.
ამას განაპირობებს ის, რომ ადამიანის აზროვნება მჭიდროდ არის დაკავშირებული მის ენასთან. მეტი
უფრო მეტიც, ბუნებრივი ენა აზროვნების ინსტრუმენტია. ის ასევე არის
ადამიანებს შორის კომუნიკაციის უნივერსალური საშუალება - აღქმის საშუალება,
ინფორმაციის დაგროვება, შენახვა, დამუშავება და გადაცემა.
გამოყენების პრობლემები ბუნებრივი ენაავტომატურში
ინფორმაციის დამუშავება გამოთვლითი ლინგვისტიკის მეცნიერებაა. ეს მეცნიერება
გაჩნდა შედარებით ცოტა ხნის წინ - ორმოცდაათიანი და სამოციანი წლების მიჯნაზე
გასული საუკუნის. თავდაპირველად, ფორმირებისას, მას ჰქონდა სხვადასხვა
სათაურები: მათემატიკური ლინგვისტიკა, გამოთვლითი ლინგვისტიკა, ინჟინერია
ლინგვისტიკა. მაგრამ ოთხმოციანი წლების დასაწყისში ეს სახელი მასზე დარჩა
კომპიუტერული ლინგვისტიკა.

გამოთვლითი ლინგვისტიკაპრობლემის გადაჭრასთან დაკავშირებული ცოდნის სფეროა
ბუნებრივ ენაზე წარმოდგენილი ინფორმაციის ავტომატური დამუშავება.
Მთავარი მეცნიერული პრობლემებიგამოთვლითი ლინგვისტიკა პრობლემაა
ტექსტების მნიშვნელობის გაგების პროცესის მოდელირება (ტექსტიდან გადასვლა
მისი მნიშვნელობის ფორმალიზებული წარმოდგენა) და მეტყველების სინთეზის პრობლემა (გადასვლა დან
მნიშვნელობის ფორმალიზებული წარმოდგენა ბუნებრივი ენის ტექსტებზე). ეს პრობლემები
წარმოიქმნება რიგი გამოყენებითი პრობლემის გადაჭრისას:
1) კომპიუტერში ტექსტების შეყვანისას შეცდომების ავტომატური აღმოჩენა და გამოსწორება,
2) ავტომატური ანალიზი და სინთეზი ზეპირი მეტყველება,
3) ავტომატური თარგმანიტექსტები ერთი ენიდან მეორეზე,
4) კომპიუტერთან კომუნიკაცია ბუნებრივ ენაზე,
5) ტექსტური დოკუმენტების ავტომატური კლასიფიკაცია და ინდექსირება, მათი
ავტომატური შეჯამება, დოკუმენტების ძიება სრული ტექსტის მონაცემთა ბაზებში.
გასული ნახევარი საუკუნის მანძილზე გამოთვლითი ლინგვისტიკის სფეროში,
მნიშვნელოვანი სამეცნიერო და პრაქტიკული შედეგები: მანქანების სისტემები
ტექსტების თარგმნა ერთი ბუნებრივი ენიდან მეორეზე, ავტომატიზირებული
ტექსტებში ინფორმაციის მოძიება, ზეპირი მეტყველების ავტომატური ანალიზისა და სინთეზის სისტემები და
ბევრი სხვა. მაგრამ იყო იმედგაცრუებებიც. მაგალითად, მანქანური თარგმანის პრობლემა
ტექსტები ერთი ენიდან მეორეზე გაცილებით რთული აღმოჩნდა, ვიდრე წარმოიდგენდა
მანქანური თარგმანის პიონერები და მათი მემკვიდრეები. იგივე შეიძლება ითქვას
ტექსტებში ინფორმაციის ავტომატური ძიება და ზეპირი ანალიზისა და სინთეზის ამოცანის შესახებ
მეტყველება. მეცნიერებს და ინჟინრებს, როგორც ჩანს, ჯერ კიდევ მოუწევთ ბევრი მუშაობა
სასურველი შედეგების მიღწევა.

ბუნებრივი ენის დამუშავება (ინგლ. ბუნებრივი ენის დამუშავება; სინტაქსური,
მორფოლოგიური, სემანტიკური ანალიზებიტექსტი). ეს ასევე მოიცავს:
კორპუსის ლინგვისტიკა, ელექტრონული ტექსტური კორპუსების შექმნა და გამოყენება
შემოქმედება ელექტრონული ლექსიკონები, თეზაური, ონტოლოგიები. მაგალითად, Lingvo. ლექსიკონები
გამოიყენება, მაგალითად, ავტომატური თარგმნისთვის, მართლწერის შესამოწმებლად.
ტექსტების ავტომატური თარგმანი. პოპულარულია რუს მთარგმნელებში
არის Promt. ცნობილია თავისუფალთა შორის გუგლის თარჯიმანითარგმნა
ფაქტების ავტომატური ამოღება ტექსტიდან (ინფორმაციის ამოღება) (ინგლისური ფაქტი
ექსტრაქცია, ტექსტის მოპოვება)
ავტოაბსტრაქცია (ინგლისური ტექსტის ავტომატური შეჯამება). ეს ფუნქცია ჩართულია
მაგალითად, Microsoft Word-ში.
ცოდნის მართვის სისტემების აგება. იხილეთ ექსპერტი სისტემები
კითხვა-პასუხის სისტემების შექმნა (ინგლისური კითხვა პასუხის სისტემები).
ოპტიკური სიმბოლოების ამოცნობა (OCR). მაგალითად, FineReader
მეტყველების ავტომატური ამოცნობა (ASR). არის ფასიანი და უფასო პროგრამული უზრუნველყოფა
მეტყველების ავტომატური სინთეზი

ტიმოფეევა მარია კირილოვნა
ექიმი ფილოლოგიური მეცნიერებები, უფროსი მკვლევარიმათემატიკის ინსტიტუტის ლოგიკური სისტემების ლაბორატორია. ს.ლ. სობოლევა SB RAS, ნოვოსიბირსკის სახელმწიფო უნივერსიტეტის ჰუმანიტარულ მეცნიერებათა ინსტიტუტის ფუნდამენტური და გამოყენებითი ლინგვისტიკის დეპარტამენტის ხელმძღვანელი. დაამთავრა მათემატიკური ენათმეცნიერების ფაკულტეტი ჰუმანიტარულ მეცნიერებათა ფაკულტეტინოვოსიბირსკი სახელმწიფო უნივერსიტეტი.
კვლევის ინტერესები: ენათმეცნიერების ფილოსოფიური და მეთოდოლოგიური საფუძვლები, ლოგიკური პრობლემებიბუნებრივი ენის სემანტიკა და პრაგმატიკა, ფუნქციონალური მათემატიკური მოდელებიბუნებრივი ენა, ბუნებრივი და ფორმალური ენები.

სტუკაჩოვი ალექსეი ილიჩი
ფიზიკა-მათემატიკის მეცნიერებათა კანდიდატი, ასოცირებული პროფესორი, მათემატიკის ინსტიტუტის უფროსი მეცნიერ თანამშრომელი. ს.ლ. სობოლევა SB RAS, ასოცირებული პროფესორი, დისკრეტული მათემატიკისა და ინფორმატიკის დეპარტამენტი, მექანიკა-მათემატიკის ფაკულტეტი, NSU, ასოცირებული პროფესორი, ფუნდამენტური და გამოყენებითი ენათმეცნიერების დეპარტამენტი, ჰუმანიტარულ მეცნიერებათა ინსტიტუტი, NSU
სამეცნიერო ინტერესების სფერო: მათემატიკური ლოგიკა, გამოთვლების თეორია (განზოგადებული გამოთვლება, გამოსათვლელობა დასაშვებ კომპლექტებში, HF- გამოთვლა), მოდელის თეორია ( კონსტრუქციული მოდელები, სისტემების ეფექტური წარმოდგენები, წარმომადგენლობის ხარისხი), გამოთვლითი ანალიზი. მათემატიკური ლინგვისტიკასაკვანძო სიტყვები: ფორმალური სემანტიკა, მონტაგუს სემანტიკა, დისტრიბუციული სემანტიკა.

ბარახნინი ვლადიმერ ბორისოვიჩი
ლაბორატორიის წამყვანი მკვლევარი საინფორმაციო რესურსებიინსტიტუტი გამოთვლითი ტექნოლოგიები SB RAS, კათედრის პროფესორი მათემატიკური მოდელირება NSU, ​​მექანიკა-მათემატიკის ფაკულტეტი, ინფორმატიკის სისტემების დეპარტამენტის პროფესორი და ზოგადი ინფორმატიკანოვოსიბირსკის სახელმწიფო უნივერსიტეტის საინფორმაციო ტექნოლოგიების ფაკულტეტი.
კვლევის ინტერესები: განაწილებული მოდელების აგება ინფორმაციული სისტემები, ნახევრად სტრუქტურირებული ტექსტური დოკუმენტების დამუშავების ალგორითმების შექმნა, ავტომატიზაცია კომპლექსური ანალიზიპოეტური ტექსტები, ინფორმატიკის მეთოდოლოგიური საკითხები.

ბრუში ელენა პავლოვნა
ინფორმატიკის სისტემების ინსტიტუტის ასპირანტი. A.P. Ershova SB RAS, ნოვოსიბირსკის სახელმწიფო უნივერსიტეტის ჰუმანიტარულ მეცნიერებათა ინსტიტუტის ფუნდამენტური და გამოყენებითი ლინგვისტიკის დეპარტამენტის ასისტენტი, გამოთვლითი ლინგვისტი კომპანია "OnPositive"-ში.
კვლევის ინტერესები: ბუნებრივი ენის დამუშავება, მანქანათმცოდნეობა, ხელოვნური ინტელექტი.

პავლოვსკი ევგენი ნიკოლაევიჩი
ფიზიკა-მათემატიკის მეცნიერებათა კანდიდატი, ნოვოსიბირსკის რეგიონის მთავრობასთან არსებული ახალგაზრდა მეცნიერთა და სპეციალისტთა საბჭოს წევრი, ნოვოსიბირსკის ტექნოპარკის ექსპერტთა საბჭოს წევრი, აკადემგოროდოკის ტექნოპარკის საორგანიზაციო კომიტეტის თავმჯდომარე, ციმბირის სიმპოზიუმის მონაცემთა მეცნიერების და საორგანიზაციო კომიტეტის თავმჯდომარე. საინჟინრო კონფერენცია.
პროფესიული მიზანი: დიდი მონაცემების პროექტებში ბიზნეს მოთხოვნების ფორმალიზაციის მიდგომების სისტემატიზაცია.

პალჩუნოვი დიმიტრი ევგენევიჩი
მათემატიკის ინსტიტუტის წამყვანი მეცნიერ-თანამშრომელი. S. L. Soboleva SB RAS, NSU, ზოგადი ინფორმატიკის დეპარტამენტის უფროსი, დეპარტამენტის ხელმძღვანელი "დისკრეტული მათემატიკისა და ინფორმატიკის ინსტიტუტი", მექანიკა-მათემატიკის ფაკულტეტი, NSU.
კვლევის ინტერესები: მიღებულია ფუნდამენტური შედეგები გამორჩეული იდეალების მქონე ლოგიკური ალგებრების კვლევის შესახებ (I-ალგებრები).

სვირიდენკო დიმიტრი ივანოვიჩი
რუსეთის მეცნიერებათა აკადემიის ციმბირის ფილიალის მათემატიკის ინსტიტუტისა და ნოვოსიბირსკის სახელმწიფო უნივერსიტეტის თანამშრომელი, ბიზნესმენი, ორგანიზატორი და მაღალტექნოლოგიური კომპანიების თანამფლობელი, რომლებიც მოქმედებენ საინფორმაციო, საკომუნიკაციო და ციფრული ტექნოლოგიების სფეროში. მონაწილეობს რუსეთის სამეცნიერო ფონდის გრანტით დაფინანსებულ სემანტიკური მოდელირების კვლევაში.
კვლევის ინტერესები: ფილოსოფია, მეთოდოლოგია, გამოყენებითი მათემატიკური ლოგიკა. კონცეფციის ავტორი და მათემატიკური თეორიასემანტიკური მოდელირება, წამოაყენეს რუსეთის მეცნიერებათა აკადემიის აკადემიკოსებთან S.S. Goncharov-თან და Yu.L. Ershov-თან ერთად გასული საუკუნის 80-იან წლებში. ამჟამად ის აგრძელებს ამ კონცეფციის მეთოდოლოგიისა და მათემატიკური თეორიის აქტიურ განვითარებას და ასევე მონაწილეობს ამ კონცეფციის გამოყენებაში. სხვადასხვა სფეროებში. მუშაობს სემანტიკური ჭკვიანი გარიგებების და კონტრაქტების მეთოდოლოგიის, მათემატიკური თეორიისა და ენის შექმნაზე, სემანტიკური მოდელირების იდეების გამოყენებაზე TRIZ-თან და სხვა სფეროებთან მიმართებაში.

სავოსტიანოვი ალექსანდრე ნიკოლაევიჩი
ფიზიოლოგიის სამეცნიერო-კვლევითი ინსტიტუტის დიფერენციალური ფსიქოფიზიოლოგიის ლაბორატორიის წამყვანი მკვლევარი. ფუნდამენტური მედიცინარუსეთის მეცნიერებათა აკადემიის ციმბირის ფილიალის ციტოლოგიისა და გენეტიკის ინსტიტუტის ფსიქოლოგიური გენეტიკის ლაბორატორიის ხელმძღვანელი, ნოვოსიბირსკის სახელმწიფო უნივერსიტეტის საინფორმაციო ტექნოლოგიების ფაკულტეტის ზოგადი ინფორმატიკის განყოფილების პროფესორი, ფუნდამენტალური კათედრის პროფესორი. და გამოყენებითი ლინგვისტიკა ჰუმანიტარული ინსტიტუტი NSU.
სამეცნიერო ინტერესებისაკვანძო სიტყვები: ნეიროფიზიოლოგია, ფსიქოგენეტიკა, ნეიროლინგვისტიკა, ბიოლოგიური სიგნალების კომპიუტერული დამუშავების მეთოდები. კვლევა მიზნად ისახავს ადამიანებში აფექტური პათოლოგიების გაჩენისა და განვითარების რისკის ფაქტორების იდენტიფიცირებას, რაც დამოკიდებულია სოციალურ და კლიმატური პირობებისასიცოცხლო აქტივობა. კვლევის ფარგლებში ტარდება ექსპედიციები რუსეთის სხვადასხვა რეგიონში ( ნოვოსიბირსკის რეგიონი, ტივა, იაკუტია, ალთაის რესპუბლიკა) და მეზობელი ქვეყნები(მონღოლეთი, ჩინეთი) შეგროვება ბიოლოგიური მასალადა EEG ჩანაწერების კოლექციები სხვადასხვაში ექსპერიმენტული პირობები. კვლევის მიზანია შექმნას დიაგნოსტიკური სისტემები, რომლებიც საშუალებას მოგცემთ შეაფასოთ ადამიანის ქცევის ემოციური რეგულაციის დარღვევის რისკი გაზრდილი სტრესის პირობებში.

კომპიუტერული ლინგვისტიკა (ინგლისური გამოთვლითი ლინგვისტიკის ქაღალდის მიკვლევა), გამოყენებითი ლინგვისტიკის ერთ-ერთი მიმართულება, რომელშიც შესწავლილია ენის შესწავლა და ენის ფუნქციონირების მოდელირება გარკვეულ პირობებში, სიტუაციებში და. პრობლემური სფეროებიშემუშავებული და გამოყენებული კომპიუტერული პროგრამები, მონაცემთა ორგანიზებისა და დამუშავების კომპიუტერული ტექნოლოგიები. მეორეს მხრივ, ეს არის კომპიუტერული ენის მოდელების გამოყენების სფერო ენათმეცნიერებაში და მასთან დაკავშირებულ დისციპლინებში. როგორც განსაკუთრებული სამეცნიერო მიმართულებაგამოთვლითი ლინგვისტიკა ჩამოყალიბდა ევროპული კვლევები 1960-იან წლებში. Იმდენად, რამდენადაც ინგლისური ზედსართავი სახელიგამოთვლითი ასევე შეიძლება ითარგმნოს როგორც "გამოთვლითი", ტერმინი "გამოთვლითი ლინგვისტიკა" ასევე გვხვდება ლიტერატურაში, თუმცა, საშინაო მეცნიერებაის მეტს იღებს ვიწრო მნიშვნელობაუახლოვდება „რაოდენობრივი ლინგვისტიკის“ ცნებას.

ხშირად, გამოთვლითი ლინგვისტიკა გულისხმობს ტერმინს „რაოდენობრივი ლინგვისტიკა“, რომელიც ახასიათებს ინტერდისციპლინურ მიმართულებას. გამოყენებითი კვლევა, სადაც ენისა და მეტყველების შესწავლის ძირითად ინსტრუმენტად გამოიყენება ანალიზის რაოდენობრივი ან სტატისტიკური მეთოდები. ზოგჯერ რაოდენობრივი (ან რაოდენობრივი) ლინგვისტიკა ეწინააღმდეგება კომბინატორულ ლინგვისტიკას. ამ უკანასკნელში დომინანტური როლი უჭირავს „არარაოდენობრივ“ მათემატიკურ აპარატს - სიმრავლეების თეორიას, მათემატიკური ლოგიკას, ალგორითმების თეორიას და ა.შ. თეორიული წერტილიგამოყენების ნახვა სტატისტიკური მეთოდებიენათმეცნიერებაში გაძლევთ საშუალებას შეავსოთ სტრუქტურული მოდელიენა ალბათური კომპონენტით, ანუ შექმნას თეორიული სტრუქტურულ-ალბათური მოდელი, რომელსაც აქვს მნიშვნელოვანი ახსნა-განმარტების პოტენციალი. AT განაცხადის ფართობირაოდენობრივი ლინგვისტიკა წარმოდგენილია, უპირველეს ყოვლისა, ამ მოდელის ფრაგმენტების გამოყენებით, რომლებიც გამოიყენება ენის ფუნქციონირების ლინგვისტური მონიტორინგისთვის, კოდირებული ტექსტის გაშიფვრისთვის, ტექსტის ავტორიზაციის/ატრიბუციისთვის და ა.შ.

ტერმინი "გამოთვლითი ლინგვისტიკა" და ამ სფეროს პრობლემები ხშირად ასოცირდება კომუნიკაციის მოდელირებასთან და უპირველეს ყოვლისა - კომპიუტერთან ადამიანის ურთიერთქმედების უზრუნველყოფას ბუნებრივ ან შეზღუდულ ბუნებრივ ენაზე (ამისთვის, სპეციალური სისტემებიბუნებრივი ენის დამუშავება), ასევე ინფორმაციის მოძიების სისტემების (IPS) თეორიასა და პრაქტიკასთან. ადამიანსა და კომპიუტერს შორის ბუნებრივ ენაზე კომუნიკაციის უზრუნველყოფა ზოგჯერ აღინიშნება ტერმინით „ბუნებრივი ენის დამუშავება“ (თარგმანი ინგლისურადტერმინი ბუნებრივი ენის დამუშავება). გამოთვლითი ლინგვისტიკის ეს მიმართულება წარმოიშვა 1960-იანი წლების ბოლოს საზღვარგარეთ და განვითარდა სამეცნიერო და ტექნოლოგიური დისციპლინის ფარგლებში, რომელსაც ეწოდება ხელოვნური ინტელექტი (რ. შენკის, მ. ლებოვიცის, ტ. ვინოგრადის და სხვ. ნაშრომები). თავისი მნიშვნელობით, ფრაზა „ბუნებრივი ენის დამუშავება“ უნდა მოიცავდეს ყველა სფეროს, სადაც კომპიუტერები გამოიყენება ენის მონაცემების დასამუშავებლად. თუმცა პრაქტიკაში დაფიქსირდა ტერმინის უფრო ვიწრო გაგება - მეთოდების, ტექნოლოგიებისა და სპეციფიკური სისტემების შემუშავება, რომლებიც უზრუნველყოფენ ადამიანსა და კომპიუტერს შორის კომუნიკაციას ბუნებრივ ან შეზღუდულ ბუნებრივ ენაზე.

გამოთვლითი ლინგვისტიკა, გარკვეულწილად, შეიძლება მოიცავდეს სამუშაოებს ჰიპერტექსტური სისტემების შექმნის სფეროში, განიხილება როგორც განსაკუთრებული გზატექსტის ორგანიზაცია და კიდევ რამდენად ფუნდამენტურად ახალი სახეობატექსტი, რომელიც თავისი მრავალი თვისებით ეწინააღმდეგება გუტენბერგის ბეჭდვის ტრადიციაში ჩამოყალიბებულ ჩვეულებრივ ტექსტს (იხ. გუტენბერგი).

გამოთვლითი ლინგვისტიკა ასევე მოიცავს ავტომატურ თარგმნას.

გამოთვლითი ლინგვისტიკის ფარგლებში გაჩნდა შედარებით ახალი მიმართულება, რომელიც აქტიურად ვითარდებოდა 1980-90-იანი წლებიდან – კორპუს ლინგვისტიკა, სადაც. ზოგადი პრინციპებიენობრივი მონაცემების კორპუსების (კერძოდ, ტექსტური კორპუსების) აგება თანამედროვე კომპიუტერული ტექნოლოგია. ტექსტური კორპორები არის წიგნების, ჟურნალების, გაზეთების და ა.შ. სპეციალურად შერჩეული ტექსტების კრებულები, რომლებიც გადაცემულია მანქანურ მედიაში და განკუთვნილია ავტომატური დამუშავებისთვის. ტექსტების ერთ-ერთი პირველი კორპუსი შეიქმნა ამერიკული ინგლისურისთვის ბრაუნის უნივერსიტეტში (ე.წ. Brown Corpus) 1962-63 წლებში ვ.ფრანსისის ხელმძღვანელობით. რუსეთში 2000-იანი წლების დასაწყისიდან ვითარდებოდა რუსეთის მეცნიერებათა აკადემიის ვ.ვ.ვინოგრადოვის სახელობის რუსული ენის ინსტიტუტი. ეროვნული კორპუსირუსული ენის, რომელიც შედგება რუსულენოვანი ტექსტების წარმომადგენლობითი ნიმუშისგან, რომლის მოცულობა დაახლოებით 100 მილიონი სიტყვაა. გარდა მონაცემთა კორპუსების რეალური კონსტრუქციისა, კორპუს ლინგვისტიკა ეწევა კომპიუტერული ხელსაწყოების (კომპიუტერული პროგრამების) შექმნას, რომლებიც შექმნილია ტექსტური კორპუსებიდან სხვადასხვა ინფორმაციის ამოსაღებად. მომხმარებლის თვალსაზრისით, ტექსტურ კორპუსებზე დაწესებულია მოთხოვნები წარმომადგენლობითობის (წარმომადგენლობითობის), სისრულის და ეკონომიურობის შესახებ.

კომპიუტერული ლინგვისტიკა აქტიურად ვითარდება როგორც რუსეთში, ასევე მის ფარგლებს გარეთ. ამ სფეროში პუბლიკაციების ნაკადი ძალიან მაღალია. გარდა თემატური კრებულები, შეერთებულ შტატებში 1984 წლიდან ჟურნალი Computational Linguistics გამოდის ყოველკვარტალურად. დიდი ორგანიზაციული და სამეცნიერო მუშაობაატარებს The Association for Computational Linguistics, რომელსაც აქვს რეგიონული სტრუქტურები მთელს მსოფლიოში (კერძოდ, ევროპული ფილიალი). ორ წელიწადში ერთხელ ტარდება საერთაშორისო კონფერენციები COLINT (2008 წელს კონფერენცია ჩატარდა მანჩესტერში). გამოთვლითი ლინგვისტიკის ძირითადი მიმართულებები ასევე განიხილება ყოველწლიურ საერთაშორისო კონფერენციაზე „დიალოგი“, რომელიც ორგანიზებულია რუსეთის ხელოვნური ინტელექტის კვლევითი ინსტიტუტის მიერ, ფილოლოგიის ფაკულტეტიმოსკოვის სახელმწიფო უნივერსიტეტი, Yandex და სხვა მრავალი ორგანიზაცია. ასევე ფართოდ არის წარმოდგენილი შესაბამისი საკითხები საერთაშორისო კონფერენციებისხვადასხვა დონის ხელოვნურ ინტელექტზე.

ლიტ.: ზვეგინცევი V.A. თეორიული და გამოყენებითი ლინგვისტიკა. მ., 1968; პიოტროვსკი რ.გ., ბექტაევი კ.ბ., პიოტროვსკაია ა.ა. მათემატიკური ლინგვისტიკა. მ., 1977; გოროდეცკი B. Yu. ფაქტობრივი პრობლემებიგამოყენებითი ლინგვისტიკა // ახალი უცხოურ ენათმეცნიერებაში. მ., 1983. გამოცემა. 12; Kibrik A.E. გამოყენებითი ლინგვისტიკა // Kibrik A.E. ნარკვევები ენათმეცნიერების ზოგად და გამოყენებით საკითხებზე. მ., 1992; კენედი გ. შესავალი კორპუსის ლინგვისტიკაში. ლ., 1998; ბოლშაკოვი ი.ა., გელბუხი ა. გამოთვლითი ლინგვისტიკა: მოდელები, რესურსები, აპლიკაციები. მეხ., 2004; რუსული ენის ეროვნული კორპუსი: 2003-2005 წწ. მ., 2005; Baranov A. N. შესავალი გამოყენებითი ლინგვისტიკაში. მე-3 გამოცემა. მ., 2007; გამოთვლითი ლინგვისტიკა და ინტელექტუალური ტექნოლოგიები. მ., 2008. გამოცემა. 7.

შესავალი

რა არის გამოთვლითი ლინგვისტიკა?

კომპიუტერული ლინგვისტიკა მიმართულება გამოყენებითი ლინგვისტიკაში, რომელიც ორიენტირებულია კომპიუტერული ინსტრუმენტების გამოყენებაზე - პროგრამები, კომპიუტერული ტექნოლოგიები მონაცემთა ორგანიზებისა და დამუშავებისთვის - ენის ფუნქციონირების მოდელირებისთვის გარკვეულ პირობებში, სიტუაციებში, პრობლემურ სფეროებში და ა.შ., ისევე როგორც მთელ ფარგლებს. კომპიუტერული ენის მოდელები ენათმეცნიერებაში და მასთან დაკავშირებულ დისციპლინებში. სინამდვილეში, მხოლოდ ბოლო შემთხვევადა საუბარი გამოყენებითი ლინგვისტიკამკაცრი გაგებით, ვინაიდან ენის კომპიუტერული მოდელირება ასევე შეიძლება ჩაითვალოს კომპიუტერული მეცნიერებისა და პროგრამირების თეორიის გამოყენების სფეროდ ენის მეცნიერების პრობლემების გადასაჭრელად. თუმცა, პრაქტიკაში, თითქმის ყველაფერი, რაც დაკავშირებულია კომპიუტერების გამოყენებასთან ლინგვისტიკაში, მოიხსენიება როგორც გამოთვლითი ლინგვისტიკა.

როგორც სპეციალური სამეცნიერო მიმართულება, გამოთვლითი ლინგვისტიკა ჩამოყალიბდა 1960-იან წლებში. რუსული ტერმინი "გამოთვლითი ლინგვისტიკა" არის ინგლისური გამოთვლითი ლინგვისტიკის მიკვლევა. ვინაიდან ზედსართავი გამოთვლითი რუსულ ენაზე ასევე შეიძლება ითარგმნოს როგორც "გამოთვლითი", ტერმინი "გამოთვლითი ლინგვისტიკა" ასევე გვხვდება ლიტერატურაში, მაგრამ რუსულ მეცნიერებაში ის უფრო ვიწრო მნიშვნელობას იძენს, უახლოვდება "რაოდენობრივი ლინგვისტიკის" კონცეფციას. ამ სფეროში პუბლიკაციების ნაკადი ძალიან მაღალია. გარდა თემატური კრებულებისა, ჟურნალი Computational Linguistics ყოველკვარტალურად გამოდის შეერთებულ შტატებში. დიდ ორგანიზაციულ და სამეცნიერო მუშაობას ახორციელებს კომპიუტერული ლინგვისტიკის ასოციაცია, რომელსაც აქვს რეგიონული სტრუქტურები (კერძოდ, ევროპული ფილიალი). ყოველ ორ წელიწადში ერთხელ იმართება გამოთვლითი ლინგვისტიკის საერთაშორისო კონფერენციები - COLING. შესაბამისი საკითხები, როგორც წესი, ფართოდ არის წარმოდგენილი ხელოვნური ინტელექტის სხვადასხვა კონფერენციებზე.

Დავალებები

გამოთვლითი ლინგვისტიკა იღებს ენობრივი აქტივობის კომპიუტერული მოდელირების აქტუალურ ლინგვისტურ პრობლემებს. მისი ამოცანებია შექმნას უფრო ზუსტი და სრულყოფილი ლინგვისტური მოდელები და უფრო მოწინავე ალგორითმები ანალიზისა და სინთეზისთვის.

ძირითადი მიმართულებებია:

1)ადამიანისა და კომპიუტერის ურთიერთქმედება: კონტროლი – პროგრამირების ენები, ინფორმაციის გადაცემა – ინტერფეისი.

2) ტექსტებთან მუშაობა: ინდექსირება, ანალიზი და კლასიფიკაცია, ავტომატური რედაქტირება (შეცდომის გამოსწორება), ცოდნის აღმოჩენა, მანქანური თარგმანი.

ამბავი

ინგლისური ენის ქვეჯგუფის მარტივი თაობა მონაცემთა ბაზებზე წვდომისთვის იყო მოწოდებული ერთ-ერთი ადრეული ამერიკული სისტემის LIFER-ის (Language Interface Facility wich Elipsis and Recursion) მიერ, რომელიც შეიქმნა 70-იან წლებში. ამის შემდეგ კომპიუტერულ ბაზარზე გამოჩნდა სხვა, უფრო მოქნილი სისტემები, რომლებიც უზრუნველყოფდნენ შეზღუდულ ბუნებრივ ენაზე ინტერფეისს კომპიუტერთან.

1980-იან წლებში შეერთებულ შტატებში ჩამოყალიბდა მრავალი კომპანია, რომლებიც დაკავებულნი იყვნენ ბუნებრივი ენის ინტერფეისების შემუშავებითა და გაყიდვით მონაცემთა ბაზებთან და ექსპერტულ სისტემებთან. 1985 წელს Semantec Corporation-მა წარმოადგინა ასეთი კითხვა-პასუხის პროგრამული პაკეტი, Carnegie Group-მა შესთავაზა მსგავსი პაკეტი, LanguageCraft.

აქტიური მუშაობა მიმდინარეობს ავტომატური თარგმანის სისტემების შესაქმნელად. ფართოდ გავრცელდა დ.ტომის ხელმძღვანელობით შემუშავებული SYSTRAN ავტომატური მთარგმნელობითი სისტემა, რომელიც დაკვეთით აშშ-ის საჰაერო ძალებმა. 1974 - 1975 წლებში. სისტემა გამოიყენა NASA-ს აეროკოსმოსური ასოციაციის მიერ Apollo-Soyuz პროექტის დოკუმენტების თარგმნისთვის. დღესდღეობით იგი თარგმნის რამდენიმე ენიდან ყოველწლიურად დაახლოებით 100000 გვერდს.

ევროპაში კომპიუტერული თარგმანის სისტემების შექმნაზე მუშაობა სტიმული იყო ევროპის საინფორმაციო ქსელის (EURONET DIANA) ჩამოყალიბებით. 1982 წელს ევროპის ეკონომიკურმა გაერთიანებამ გამოაცხადა ევროპული EUROTRA პროგრამის შექმნა, რომლის მიზანია სისტემის განვითარება. კომპიუტერული თარგმანიყველასთვის ევროპული ენები. თავდაპირველად პროექტი 12 მილიონ დოლარად იყო შეფასებული, 1987 წელს ექსპერტებმა ამ პროექტის ჯამური ღირებულება 160 მილიონ დოლარზე მეტი დაადგინეს.

იაპონიაში, კომპიუტერული ლინგვისტიკის კვლევა ორიენტირებულია მეხუთე თაობის ნაციონალური კომპიუტერული პროგრამის გარშემო, რომელიც 1981 წელს დაიწყო.

არსებობს მთელი რიგი სამხედრო პროექტები ადამიანისა და მანქანის ინტერფეისების ბუნებრივ ენაზე შესაქმნელად. შეერთებულ შტატებში ისინი ძირითადად ხორციელდება სტრატეგიული კომპიუტერული ინიციატივის ფარგლებში, ათწლიანი პროგრამა, რომელიც მიღებულია თავდაცვის დეპარტამენტის მიერ 1983 წელს. მისი მიზანია შექმნას ახალი თაობის "ინტელექტუალური" იარაღი და სამხედრო სისტემები. შეერთებული შტატების გრძელვადიანი ტექნოლოგიური უპირატესობის უზრუნველსაყოფად.

ბუნებრივია, ხელოვნური ინტელექტის ექსპერტები, რომლებიც კარგად ფლობენ კომპიუტერებს და პროგრამირების ენებს, ენერგიულად უდგებიან ენის გაგების პრობლემის გადაჭრას საკუთარი მეთოდებით. იყო ბუნებრივი ენის ალგორითმების ძიება. შეიქმნა ენის გაგების რთული პროგრამები ძალიან ვიწრო სპეციალური სფეროებისთვის, განხორციელდა ნაწილობრივი მანქანური თარგმანის პროგრამები და მრავალი სხვა. მაგრამ არ ყოფილა გადამწყვეტი პროგრესი ენის გაგების პრობლემის გადაწყვეტაში. ენა და ადამიანი იმდენად არის დაკავშირებული, რომ მეცნიერებს მოუწიათ ადამიანის მიერ სამყაროს გაგების პრობლემასთან გამკლავება. და ეს არის ფილოსოფიის სფერო.

ლინგვისტიკის ძირითადი ცნებები

ტერმინი "გამოთვლითი ლინგვისტიკა" ჩვეულებრივ გულისხმობს კომპიუტერული ინსტრუმენტების გამოყენების ფართო არეალს - პროგრამები, კომპიუტერული ტექნოლოგიები მონაცემთა ორგანიზებისა და დამუშავებისთვის - ენის ფუნქციონირების მოდელირებისთვის გარკვეულ პირობებში, სიტუაციებში, პრობლემურ სფეროებში, ისევე როგორც ფარგლებს. კომპიუტერული ენის მოდელების შესახებ.მხოლოდ ლინგვისტიკაში, არამედ მასთან დაკავშირებულ დისციპლინებში. ფაქტობრივად, მხოლოდ ამ უკანასკნელ შემთხვევაში ვსაუბრობთ გამოყენებითი ლინგვისტიკაზე მკაცრი გაგებით, ვინაიდან კომპიუტერული ენის მოდელირება ასევე შეიძლება ჩაითვალოს პროგრამირების თეორიის (კომპიუტერულ მეცნიერებათა) გამოყენების სფეროდ ლინგვისტიკის სფეროში. მიუხედავად ამისა, ზოგადი პრაქტიკა ისეთია, რომ გამოთვლითი ლინგვისტიკის სფერო მოიცავს თითქმის ყველაფერს, რაც დაკავშირებულია კომპიუტერების გამოყენებასთან ლინგვისტიკაში: „ტერმინი „გამოთვლითი ლინგვისტიკა“ ადგენს ზოგად ორიენტაციას კომპიუტერების გამოყენებაზე სხვადასხვა სამეცნიერო და მეცნიერული საკითხების გადასაჭრელად. პრაქტიკული ამოცანებიენასთან ასოცირებული, ამ პრობლემების გადაჭრის გზების შეზღუდვის გარეშე.

გამოთვლითი ლინგვისტიკის ინსტიტუციური ასპექტი. როგორც განსაკუთრებული სამეცნიერო მიმართულება, გამოთვლითი ლინგვისტიკა ჩამოყალიბდა 60-იან წლებში. ამ სფეროში პუბლიკაციების ნაკადი ძალიან მაღალია. გარდა თემატური კრებულებისა, აშშ-ში ყოველკვარტალურად გამოდის ჟურნალი Computational Linguistics. დიდ ორგანიზაციულ და სამეცნიერო მუშაობას ახორციელებს გამოთვლითი ლინგვისტიკის ასოციაცია, რომელსაც აქვს რეგიონული სტრუქტურები მთელს მსოფლიოში (კერძოდ, ევროპის ფილიალი). ყოველ ორ წელიწადში ერთხელ იმართება გამოთვლითი ლინგვისტიკის საერთაშორისო კონფერენციები - KOLING. შესაბამისი საკითხები ასევე ფართოდ არის წარმოდგენილი ხელოვნური ინტელექტის საერთაშორისო კონფერენციებზე სხვადასხვა დონეზე.

გამოთვლითი ლინგვისტიკის შემეცნებითი ინსტრუმენტარიუმი

გამოთვლითი ლინგვისტიკა, როგორც სპეციალური გამოყენებითი დისციპლინაგამოირჩევა უპირველეს ყოვლისა ინსტრუმენტით - ანუ გამოყენებით კომპიუტერული საშუალებებიენის მონაცემების დამუშავება. ვინაიდან კომპიუტერულ პროგრამებს, რომლებიც აყალიბებენ ენის ფუნქციონირების გარკვეულ ასპექტებს, შეუძლიათ გამოიყენონ სხვადასხვა პროგრამირების ხელსაწყოები, როგორც ჩანს, არ არის საჭირო საერთო მეტაენაზე საუბარი. თუმცა, ეს ასე არ არის. არსებობს ზოგადი პრინციპები კომპიუტერული სიმულაციააზროვნება, რომელიც ასე თუ ისე რეალიზდება ნებისმიერში კომპიუტერული მოდელი. ეს ენა ეფუძნება ცოდნის თეორიას, რომელიც განვითარდა ხელოვნური ინტელექტიდა შემეცნებითი მეცნიერების მნიშვნელოვანი დარგის ჩამოყალიბება.

ცოდნის თეორიის მთავარ თეზისში ნათქვამია, რომ აზროვნება არის ცოდნის დამუშავებისა და გენერირების პროცესი. „ცოდნა“ ან „ცოდნა“ განიხილება განუსაზღვრელ კატეგორიად. "პროცესორი", რომელიც ამუშავებს ცოდნას არის შემეცნებითი სისტემაპირი. ეპისტემოლოგიასა და შემეცნებით მეცნიერებაში გამოიყოფა ცოდნის ორი ძირითადი ტიპი - დეკლარაციული („იცოდე რა“) და პროცედურული („იცოდე როგორ“2)). დეკლარაციული ცოდნა, როგორც წესი, წარმოდგენილია როგორც წინადადებების ერთობლიობა, განცხადებები რაღაცის შესახებ. ტიპიური მაგალითიდეკლარაციული ცოდნა შეიძლება ჩაითვალოს სიტყვების ინტერპრეტაციად ჩვეულებრივად განმარტებითი ლექსიკონები. მაგალითად, თასი] – „პატარა მომრგვალებული სასმელი ჭურჭელი, ჩვეულებრივ სახელურით, დამზადებული ფაიფურის, ფაიანსის და სხვ.“. დეკლარაციული ცოდნა ექვემდებარება გადამოწმების პროცედურას "მართალი-მცდარი" თვალსაზრისით. პროცედურული ცოდნა წარმოდგენილია ოპერაციების, შესასრულებელი მოქმედებების თანმიმდევრობით (სიით). ეს არის რამდენიმე ზოგადი ინსტრუქციამოცემულ სიტუაციაში მოქმედებების შესახებ. პროცედურული ცოდნის ტიპიური მაგალითია საყოფაცხოვრებო ტექნიკის გამოყენების ინსტრუქცია.

დეკლარაციული ცოდნისაგან განსხვავებით, პროცედურული ცოდნა არ შეიძლება დადასტურდეს როგორც ჭეშმარიტი ან მცდარი. მათი შეფასება შესაძლებელია მხოლოდ ალგორითმის წარმატებით ან წარუმატებლობით.

გამოთვლითი ლინგვისტიკის შემეცნებითი ინსტრუმენტთა ნაკრების ცნებების უმეტესობა ჰომონიმია: ისინი ერთდროულად ასახელებენ ადამიანის შემეცნებითი სისტემის ზოგიერთ რეალურ ერთეულს და ამ ერთეულების ზოგიერთ მეტაენაზე წარმოდგენის გზებს. სხვა სიტყვებით რომ ვთქვათ, მეტაენის ელემენტებს აქვთ ონტოლოგიური და ინსტრუმენტული ასპექტი. ონტოლოგიურად დეკლარაციული და პროცედურული ცოდნის გამიჯვნა შეესაბამება განსხვავებული ტიპებიადამიანის შემეცნებითი სისტემის ცოდნა. ასე რომ, ცოდნა კონკრეტული საგნებირეალობის ობიექტები უპირატესად დეკლარაციულია და ადამიანის ფუნქციონალური შესაძლებლობები სიარულის, სირბილის, მანქანის მართვისას რეალიზდება კოგნიტურ სისტემაში, როგორც პროცედურული ცოდნა. ინსტრუმენტულად, ცოდნა (როგორც ონტოლოგიურად პროცედურული, ასევე დეკლარაციული) შეიძლება წარმოდგენილი იყოს როგორც აღწერილობების, აღწერილობების ერთობლიობა და როგორც ალგორითმი, ინსტრუქცია. სხვა სიტყვებით რომ ვთქვათ, ონტოლოგიურად დეკლარაციული ცოდნა რეალობის ობიექტის "ცოდნის" შესახებ შეიძლება წარმოდგენილი იყოს პროცედურულად, როგორც ინსტრუქციების ერთობლიობა, მისი შექმნის ალგორითმები, შეკრება (=პროცესული ცოდნის შემოქმედებითი ასპექტი) ან როგორც ალგორითმი მისი ტიპიური გამოყენებისთვის (= ფუნქციური ასპექტიპროცედურული ცოდნა). პირველ შემთხვევაში, ეს შეიძლება იყოს სახელმძღვანელო დამწყები დურგლისთვის, ხოლო მეორეში, საოფისე მაგიდის შესაძლებლობების აღწერა. პირიქითაც მართალია: ონტოლოგიურად პროცედურული ცოდნა შეიძლება დეკლარაციულად იყოს წარმოდგენილი.

ცალკე მსჯელობას მოითხოვს, შეიძლება თუ არა რაიმე ონტოლოგიურად დეკლარაციული ცოდნა წარმოდგენილი იყოს პროცედურულად და ნებისმიერი ონტოლოგიურად პროცედურულად - დეკლარაციულად. მკვლევარები თანხმდებიან, რომ ნებისმიერი დეკლარაციული ცოდნა პრინციპში შეიძლება წარმოდგენილი იყოს პროცედურულად, თუმცა ეს შეიძლება აღმოჩნდეს ძალიან არაეკონომიური კოგნიტური სისტემისთვის. საპირისპირო ძნელად მართალია. ფაქტია, რომ დეკლარაციული ცოდნა ბევრად უფრო მკაფიოა, უფრო ადვილი გასაგებია ადამიანისთვის, ვიდრე პროცედურული ცოდნა. დეკლარაციული ცოდნისგან განსხვავებით, პროცედურული ცოდნა უპირატესად იმპლიციტურია. Ისე, ენის უნარი, როგორც პროცედურული ცოდნა, დაფარულია ადამიანისთვის, არ არის რეალიზებული მის მიერ. ენის ფუნქციონირების მექანიზმების ახსნის მცდელობა იწვევს დისფუნქციას. ლექსიკური სემანტიკის დარგის სპეციალისტებმა, მაგალითად, იციან, რომ სიტყვის შინაარსის გეგმის შესასწავლად აუცილებელი ხანგრძლივი სემანტიკური ინტროსპექცია იწვევს იმ ფაქტს, რომ მკვლევარი ნაწილობრივ კარგავს უნარს განასხვავოს სწორი და. ბოროტად იყენებსგაანალიზებული სიტყვა. სხვა მაგალითების მოყვანა შეიძლება. ცნობილია, რომ მექანიკის თვალსაზრისით, ადამიანის სხეული არის რთული სისტემაორი ურთიერთმოქმედი გულსაკიდი.

ცოდნის თეორიაში ცოდნა შეისწავლება და წარმოდგენილია გამოყენებით სხვადასხვა სტრუქტურებიცოდნა - ჩარჩოები, სცენარები, გეგმები. მ.მინსკის აზრით, „ჩარჩო არის მონაცემთა სტრუქტურა, რომელიც შექმნილია სტერეოტიპული სიტუაციის წარმოსაჩენად“ [Minsky 1978, გვ.254]. უფრო დეტალურად, შეგვიძლია ვთქვათ, რომ ჩარჩო არის კონცეპტუალური სტრუქტურა ცოდნის დეკლარაციული წარმოდგენისთვის ტიპიური თემატურად ერთიანი სიტუაციის შესახებ, რომელიც შეიცავს სლოტებს, რომლებიც ურთიერთდაკავშირებულია გარკვეული სემანტიკური ურთიერთობებით. ილუსტრაციისთვის, ჩარჩო ხშირად წარმოდგენილია ცხრილის სახით, რომლის რიგები ქმნის სლოტებს. თითოეულ სლოტს აქვს თავისი სახელი და შინაარსი (იხ. ცხრილი 1).

ცხრილი 1

"მაგიდის" ჩარჩოს ფრაგმენტი მაგიდის ხედში

დამოკიდებულია იმაზე კონკრეტული დავალებაჩარჩოს სტრუქტურირება შეიძლება იყოს მნიშვნელოვნად უფრო რთული; ჩარჩო შეიძლება შეიცავდეს ჩადგმულ ქვეფრემებს და მითითებებს სხვა ჩარჩოებზე.

ცხრილის ნაცვლად, ხშირად გამოიყენება პრეზენტაციის პრედიკატული ფორმა. ამ შემთხვევაში, ჩარჩო არის პრედიკატის ან ფუნქციის სახით არგუმენტებით. ჩარჩოს წარმოდგენის სხვა გზებიც არსებობს. მაგალითად, ის შეიძლება წარმოდგენილი იყოს ტუპლის სახით შემდეგი სახის: ( (კადრის სახელი) (სლოტის სახელი)) (სლოტის მნიშვნელობა,),..., (სლოტის სახელი n) (სლოტის მნიშვნელობა n) ).

როგორც წესი, ჩარჩოებს ცოდნის წარმომადგენლობით ენებში აქვთ ეს ფორმა.

გამოთვლითი ლინგვისტიკის სხვა შემეცნებითი კატეგორიების მსგავსად, ჩარჩოს ცნება ჰომონია. ონტოლოგიურად ის ადამიანის შემეცნებითი სისტემის ნაწილია და ამ თვალსაზრისით ჩარჩო შეიძლება შევადაროთ ისეთ ცნებებს, როგორიცაა გეშტალტი, პროტოტიპი, სტერეოტიპი, სქემა. კოგნიტურ ფსიქოლოგიაში ეს კატეგორიები განიხილება ზუსტად ონტოლოგიური თვალსაზრისით. ასე რომ, დ.ნორმანი გამოყოფს ადამიანის შემეცნებით სისტემაში ცოდნის არსებობისა და ორგანიზების ორ ძირითად გზას - სემანტიკურ ქსელებსა და სქემებს. "სქემები," წერს ის, "არის ცოდნის ორგანიზებული პაკეტები, რომლებიც იკრიბებიან ცოდნის ინდივიდუალური, თვითმყოფადი ერთეულების წარმოსადგენად. ჩემი სქემა სემისთვის შეიძლება შეიცავდეს ინფორმაციას, რომელიც აღწერს მის ფიზიკური მახასიათებლები, მისი საქმიანობა და პიროვნული თვისებები. ეს სქემა კორელაციაშია სხვა სქემებთან, რომლებიც აღწერენ მის სხვა ასპექტებს" [Norman 1998, გვ.359]. თუ ავიღებთ ჩარჩოს კატეგორიის ინსტრუმენტულ მხარეს, მაშინ ეს არის სტრუქტურა ცოდნის დეკლარაციული წარმოდგენისთვის. არსებულ AI სისტემებში, ჩარჩოები შეიძლება ჩამოყალიბდეს რთული სტრუქტურებიცოდნა; ჩარჩო სისტემები იძლევა იერარქიის საშუალებას - ერთი ჩარჩო შეიძლება იყოს მეორე ჩარჩოს ნაწილი.

შინაარსის თვალსაზრისით, ჩარჩოს ცნება ძალიან ახლოს არის ინტერპრეტაციის კატეგორიასთან. მართლაც, სლოტი არის ვალენტობის ანალოგი, სლოტის შევსება არის აქტანტის ანალოგი. მათ შორის მთავარი განსხვავება ისაა, რომ ინტერპრეტაცია შეიცავს მხოლოდ ენობრივად შესაბამის ინფორმაციას სიტყვის შინაარსის გეგმის შესახებ და ჩარჩო, ჯერ ერთი, სულაც არ არის მიბმული სიტყვასთან და, მეორეც, მოიცავს მოცემულ პრობლემასთან შესაბამის ყველა ინფორმაციას. სიტუაცია, მათ შორის ექსტრალინგვისტური (მსოფლიოს ცოდნა) 3).

სცენარი არის კონცეპტუალური ჩარჩო სტერეოტიპული სიტუაციის ან ქცევის შესახებ ცოდნის პროცედურული წარმოდგენისთვის. სკრიპტის ელემენტები არის ალგორითმის ან ინსტრუქციის ნაბიჯები. ხალხი ჩვეულებრივ საუბრობს "რესტორნის სცენარზე", "ყიდვის სცენარზე" და ა.შ.

თავდაპირველად ჩარჩო ასევე გამოიყენებოდა პროცედურული პრეზენტაციისთვის (შდრ. ტერმინი „პროცედურული ჩარჩო“), მაგრამ ტერმინი „სცენარი“ ახლა უფრო ხშირად გამოიყენება ამ მნიშვნელობით. სცენარი შეიძლება წარმოდგენილი იყოს არა მხოლოდ როგორც ალგორითმი, არამედ როგორც ქსელი, რომლის წვეროები შეესაბამება ზოგიერთ სიტუაციას, ხოლო რკალი შეესაბამება სიტუაციებს შორის კავშირებს. სცენარის კონცეფციასთან ერთად, ზოგიერთი მკვლევარი იყენებს სკრიპტის კატეგორიას ინტელექტის კომპიუტერული მოდელირებისთვის. რ.შენკის მიხედვით, სცენარი არის ზოგადად მიღებული, კარგად ცნობილი თანმიმდევრობა მიზეზობრიობა. მაგალითად, დიალოგის გაგება

ქუჩაში ვედროსავით ასხამს.

მაღაზიაში მაინც უნდა წახვიდე: სახლში არაფერია - გუშინ სტუმრებმა ყველაფერი წაიღეს.

ეფუძნება არაგამოკვეთილ სემანტიკურ ბმულებს, როგორიცაა "თუ წვიმს, არასასურველია გარეთ გასვლა, რადგან შეიძლება ავად გახდე." ეს კავშირები ქმნის დამწერლობას, რომელსაც მშობლიური მოსაუბრეები იყენებენ ერთმანეთის ვერბალური და არავერბალური ქცევის გასაგებად.

სცენარის კონკრეტულ პრობლემურ სიტუაციაზე გამოყენების შედეგად, ა გეგმა). გეგმა გამოიყენება ცოდნის პროცედურულად წარმოსაჩენად შესაძლო ქმედებებიმიღწევისკენ მიმავალი კონკრეტული მიზანი. გეგმა მიზანს აკავშირებს მოქმედებების თანმიმდევრობასთან.

AT ზოგადი შემთხვევაგეგმა მოიცავს პროცედურების თანმიმდევრობას, რომელიც გადასცემს სისტემის საწყის მდგომარეობას საბოლოო მდგომარეობამდე და იწვევს კონკრეტული ქვემიზნისა და მიზნის მიღწევას. AI სისტემებში გეგმა წარმოიქმნება შესაბამისი მოდულის - დაგეგმვის მოდულის დაგეგმვისა თუ დაგეგმვის აქტივობის შედეგად. დაგეგმვის პროცესი შეიძლება ეფუძნებოდეს ერთი ან რამდენიმე სცენარის მონაცემების ადაპტაციას, რომლებიც გააქტიურებულია ტესტირების პროცედურებით, პრობლემური სიტუაციის გადასაჭრელად. გეგმის შესრულებას ახორციელებს აღმასრულებელი მოდული, რომელიც აკონტროლებს შემეცნებით პროცედურებს და ფიზიკური მოქმედებებისისტემები. ელემენტარულ შემთხვევაში გეგმაშია ინტელექტუალური სისტემაარის ოპერაციების მარტივი თანმიმდევრობა; უფრო რთულ ვერსიებში, გეგმა ასოცირდება კონკრეტულ საგანთან, მის რესურსებთან, შესაძლებლობებთან, მიზნებთან, დეტალური ინფორმაციაპრობლემური სიტუაციის შესახებ და ა.შ. გეგმის გაჩენა ხდება სამყაროს მოდელს შორის კომუნიკაციის პროცესში, რომლის ნაწილი ყალიბდება სცენარებით, დაგეგმვის მოდულითა და აღმასრულებელი მოდულით.

სცენარისგან განსხვავებით, გეგმა ეხება კონკრეტული სიტუაცია, კონკრეტული შემსრულებელი და მისდევს კონკრეტული მიზნის მიღწევას. გეგმის არჩევანი რეგულირდება კონტრაქტორის რესურსებით. გეგმის განხორციელებადობა - აუცილებელი პირობამისი წარმოქმნა კოგნიტურ სისტემაში და დაკმაყოფილების მახასიათებელი შეუსაბამოა სცენარისთვის.

Კიდევ ერთი მნიშვნელოვანი კონცეფცია- მსოფლიოს მოდელი. სამყაროს მოდელი ჩვეულებრივ გაგებულია, როგორც სამყაროს შესახებ ცოდნის ერთობლიობა, რომელიც ორგანიზებულია გარკვეული გზით, თანდაყოლილი კოგნიტური სისტემის ან მისი კომპიუტერული მოდელისთვის. კიდევ რამდენიმეში ზოგადი ხედისამყაროს მოდელზე საუბარია, როგორც შემეცნებითი სისტემის ნაწილი, რომელიც ინახავს ცოდნას სამყაროს სტრუქტურის, მისი შაბლონების და ა.შ. სხვა გაგებით, სამყაროს მოდელი ასოცირდება ტექსტის გაგების შედეგებთან ან უფრო ფართოდ, დისკურსი. დისკურსის გაგების პროცესში აგებულია მისი გონებრივი მოდელი, რომელიც არის ტექსტის შინაარსობრივი გეგმისა და ამ საგანში დამახასიათებელი სამყაროს შესახებ ცოდნის ურთიერთქმედების შედეგი [Johnson-Laird 1988, გვ. 237 და შემდგომ.] . პირველი და მეორე გაგება ხშირად გაერთიანებულია. ეს დამახასიათებელია ლინგვისტური მკვლევარებისთვის, რომლებიც მუშაობენ კოგნიტურ ლინგვისტიკასა და კოგნიტურ მეცნიერებაში.

ჩარჩოს კატეგორიასთან მჭიდრო კავშირშია სცენის კონცეფცია. სცენის კატეგორია ძირითადად გამოიყენება ლიტერატურაში, როგორც კონცეპტუალური სტრუქტურის აღნიშვნა აქტუალიზებულის დეკლარაციული წარმოდგენისთვის. მეტყველების აქტიდა თავდადებული ენა ნიშნავს(ჟეტონები, სინტაქსური კონსტრუქციები, გრამატიკული კატეგორიებია.შ) სიტუაციები და მათი ნაწილები5). ენობრივ ფორმებთან ასოცირებული სცენა ხშირად განახლდება გარკვეული სიტყვაან გამოხატულება. შეთქმულების გრამატიკებში (იხ. ქვემოთ), სცენა გამოჩნდება ეპიზოდის ან ნარატივის ნაწილად. ტიპიური მაგალითებისცენები - კუბების ნაკრები, რომლითაც მუშაობს AI სისტემა, სცენა მოთხრობაში და მოქმედების მონაწილეები და ა.შ. ხელოვნურ ინტელექტში სცენები გამოიყენება როგორც გამოსახულების ამოცნობის სისტემებში, ასევე კვლევაზე ორიენტირებულ პროგრამებში (ანალიზი, აღწერა) პრობლემური სიტუაციები. სცენის ცნება ფართოდ გავრცელდა როგორც თეორიულ ენათმეცნიერებაში, ასევე ლოგიკაში, კერძოდ სიტუაციურ სემანტიკაში, რომელშიც მნიშვნელობა ლექსიკური ერთეულიუკავშირდება უშუალოდ სცენას.