Filologia calculatoarelor. Lingvistica computațională ca disciplină lingvistică aplicată

Lingvistică (din lat. lingua -
limbaj), lingvistică, lingvistică - știință,
studiul limbilor.
Aceasta este știința naturalului limbajul umanîn general
și despre toate limbile lumii ca ale lui
reprezentanţi personalizaţi.
LA în sens larg cuvinte, lingvistică
împărțite în științifice și practice. Mai des
doar prin lingvistică se înțelege tocmai
lingvistică științifică. Face parte din semiotică
știința semnelor.
Lingvistica este practicată profesional de lingvişti.

Lingvistică și Informatică.
In viata societate modernă rol important joaca automat
tehnologia de informație. Dar dezvoltare tehnologia de informație se întâmplă
foarte neuniform: dacă nivel modern informaticăși
mijloacele de comunicare este uimitoare, apoi în domeniul prelucrării semantice
succesul informaţiei este mult mai modest. Aceste succese depind în primul rând de
progrese în studiul proceselor gândirea umană, procesele vorbirii
comunicarea între oameni și capacitatea de a simula aceste procese pe un computer. Iar aceasta este o sarcină de o complexitate extremă.Când vorbim pe crearea promițătorului
tehnologia informației, apoi problemele procesării automate a textului
informațiile prezentate în limbile naturale vin în prim-plan.
Acest lucru este determinat de faptul că gândirea unei persoane este strâns legată de limbajul său. Mai mult
Mai mult, limbajul natural este un instrument de gândire. El este de asemenea
mijloc universal de comunicare între oameni - un mijloc de percepție,
acumularea, stocarea, prelucrarea și transmiterea informațiilor.
Probleme de utilizare limbaj naturalîn automat
Procesarea informațiilor este știința lingvisticii computaționale. Această știință
a apărut relativ recent - la cumpăna anilor cincizeci și șaizeci
secolul trecut. La început, în timpul formării sale, a avut diverse
titluri: lingvistică matematică, lingvistică computațională, inginerie
lingvistică. Dar la începutul anilor optzeci, numele i-a rămas
lingvistica computerizată.

Lingvistică computațională este un domeniu de cunoștințe legat de rezolvarea problemelor
prelucrarea automată a informațiilor prezentate în limbaj natural.
Central probleme științifice lingvistica computațională este o problemă
modelarea procesului de înțelegere a sensului textelor (tranziția de la text la
reprezentarea formalizată a sensului său) și problema sintezei vorbirii (tranziția de la
reprezentarea formalizată a sensului la textele în limbaj natural). Aceste probleme
apar la rezolvarea unui număr de probleme aplicate:
1) detectarea și corectarea automată a erorilor la introducerea textelor într-un computer,
2) analiza si sinteza automata vorbire orală,
3) traducere automată texte dintr-o limbă în alta,
4) comunicarea cu un computer într-un limbaj natural,
5) clasificarea și indexarea automată a documentelor text, a acestora
rezumare automată, căutare de documente în baze de date full-text.
În ultima jumătate de secol în domeniul lingvisticii computaționale,
semnificative științifice și rezultate practice: sisteme de mașini
traducerea textelor dintr-o limbă naturală în alta, automatizată
căutarea informațiilor în texte, sisteme de analiză și sinteză automată a vorbirii orale și
multe altele. Dar au fost și dezamăgiri. De exemplu, problema traducerii automate
textele dintr-o limbă în alta s-au dovedit a fi mult mai dificile decât se imagina
pionierii traducerii automate și succesorii lor. Același lucru se poate spune despre
căutarea automată a informațiilor în texte și despre sarcina de a analiza și sintetiza oral
vorbire. Se pare că oamenii de știință și inginerii vor trebui să muncească din greu
atinge rezultatele dorite.

Procesarea limbajului natural (ing. procesarea limbajului natural; sintactic,
morfologic, analize semantice text). Aceasta include, de asemenea:
Lingvistică corpus, crearea și utilizarea corpurilor de text electronic
Creare dicționare electronice, tezaure, ontologii. De exemplu, Lingvo. Dicționare
folosit, de exemplu, pentru traducerea automată, verificarea ortografică.
Traducerea automată a textelor. Popular printre traducătorii rusi
este Promt. Cunoscut printre cei liberi Google Traducere Traduceți
Extragerea automată a faptelor din text (extragerea informațiilor) (fapt englezesc
extracție, extragerea textului)
Auto-abstracting (rezumare automată a textului în engleză). Această caracteristică este activată
de exemplu, în Microsoft Word.
Construirea sistemelor de management al cunoștințelor. Consultați Sisteme experte
Crearea de sisteme de întrebări-răspuns (sisteme de răspuns la întrebări în engleză).
Recunoaștere optică a caracterelor (OCR). De exemplu, FineReader
Recunoaștere automată a vorbirii (ASR). Există software plătit și gratuit
Sinteza automată a vorbirii

Timofeeva Maria Kirillovna
Doctor stiinte filologice, senior Cercetător laboratorul de sisteme logice al Institutului de Matematică. S.L. Soboleva SB RAS, șef al Departamentului de Lingvistică Fundamentală și Aplicată, Institutul de Științe Umaniste al Universității de Stat din Novosibirsk. Absolvent al Departamentului de Lingvistică Matematică Facultatea de Stiinte Umaniste Novosibirsk universitate de stat.
Interese de cercetare: bazele filozofice și metodologice ale lingvisticii, probleme logice semantica si pragmatica limbajului natural, functionala modele matematice limbajul natural, limbajele naturale și formale.

Stukaciov Alexei Ilici
Candidat la științe fizice și matematice, profesor asociat, cercetător senior la Institutul de Matematică. S.L. Soboleva SB RAS, Conferențiar, Departamentul de Matematică Discretă și Informatică, Facultatea de Mecanică și Matematică, NSU, Conferențiar, Departamentul de Lingvistică Fundamentală și Aplicată, Institutul de Științe Umaniste, NSU
Sfera de interese științifice: logica matematica, teoria computabilității (calculabilitate generalizată, calculabilitate în mulțimi admisibile, calculabilitate HF), teoria modelelor ( modele constructive, reprezentări eficiente ale sistemelor, grade de reprezentabilitate), analiză computabilă. Lingvistică matematică Cuvinte cheie: semantică formală, semantică Montagu, semantică distributivă.

Barahnin Vladimir Borisovici
Cercetător principal al laboratorului resurse informaționale institut tehnologii de calcul SB RAS, profesor de catedra modelare matematică Facultatea de Mecanica si Matematica, NSU, Profesor al Departamentului de Sisteme Informatice si informatica generala Facultatea de Tehnologia Informației, Universitatea de Stat din Novosibirsk.
Interese de cercetare: construirea de modele de distributie sisteme de informare, crearea de algoritmi de prelucrare a documentelor text semistructurate, automatizare analiză complexă texte poetice, probleme metodologice ale informaticii.

Bruches Elena Pavlovna
Student postuniversitar al Institutului de Sisteme Informatice care poartă numele. A.P. Ershova SB RAS, asistent al Departamentului de lingvistică fundamentală și aplicată al Institutului de Științe Umaniste al Universității de Stat din Novosibirsk, lingvist computațional la compania „OnPositive”.
Interese de cercetare: procesarea limbajului natural, învățare automată, inteligență artificială.

Pavlovski Evgheni Nikolaevici
Candidat la științe fizice și matematice, membru al Consiliului Tinerilor Oameni de Știință și Specialiști din cadrul Guvernului Regiunii Novosibirsk, membru al consiliului de experți al Technopark din Novosibirsk Akademgorodok, președinte al comitetului de organizare al Simpozionului siberian privind știința datelor și Conferinta de inginerie.
Scop profesional: sistematizarea abordărilor pentru formalizarea cerințelor de business în proiectele de date mari.

Palciunov Dmitri Evghenievici
Cercetător de frunte la Institutul de Matematică. S. L. Soboleva SB RAS, Șef Departament Informatică Generală, NSU, Șef Departament „Institutul de Matematică Discretă și Informatică”, Facultatea de Mecanică și Matematică, NSU.
Interese de cercetare: Se obțin rezultate fundamentale în studiul algebrelor booleene cu idealuri distinse (I-algebre).

Sviridenko Dmitri Ivanovici
Angajat al Institutului de Matematică al Filialei Siberiei a Academiei Ruse de Științe și al Universității de Stat din Novosibirsk, om de afaceri, organizator și coproprietar al companiilor de înaltă tehnologie care operează în domeniul informației, comunicațiilor și tehnologiilor digitale. Participă la cercetări privind modelarea semantică finanțate printr-un grant de la Fundația Rusă pentru Știință.
Interese de cercetare: filozofie, metodologie, logica matematica aplicata. Autorul conceptului și teorie matematică modelare semantică, propusă împreună cu academicienii Academiei Ruse de Științe S.S. Goncharov și Yu.L. Ershov în anii 80 ai secolului trecut. În prezent, el continuă să dezvolte în mod activ metodologia și teoria matematică a acestui concept și este, de asemenea, angajat în aplicații ale acestui concept pentru diverse zone. Lucrează la crearea unei metodologii, a unei teorii matematice și a unui limbaj de tranzacții și contracte inteligente semantice, aplicând ideile de modelare semantică în relație cu TRIZ și alte domenii.

Savostyanov Alexandru Nikolaevici
Cercetător principal la Laboratorul de Psihofiziologie Diferenţială al Institutului de Cercetare în Fiziologie şi medicina fundamentala, Șeful Laboratorului de Genetică Psihologică al Institutului de Citologie și Genetică al Filialei Siberiei a Academiei Ruse de Științe, Profesor al Departamentului de Informatică Generală a Facultății de Tehnologia Informației a Universității de Stat din Novosibirsk, Profesor al Departamentului de Fundamente și Lingvistică aplicată institut umanitar NSU.
Interese științifice Cuvinte cheie: neurofiziologie, psihogenetică, neurolingvistică, metode de prelucrare computerizată a semnalelor biologice. Cercetarea vizează identificarea factorilor de risc pentru apariția și dezvoltarea patologiilor afective la om, în funcție de condiții climatice activitate vitală. Ca parte a cercetării, se efectuează expediții în diferite regiuni ale Rusiei ( Regiunea Novosibirsk, Tyva, Yakutia, Republica Altai) și țări învecinate(Mongolia, China) a colecta material biologicși colecții de înregistrări EEG în diverse conditii experimentale. Scopul cercetării este de a crea sisteme de diagnostic care să permită evaluarea riscului de încălcare a reglării emoționale a comportamentului uman în condiții de stres crescut.

COMPUTER LINGVISTICS (tracing paper din limba engleză computational linguistics), una dintre domeniile lingvisticii aplicate, în care se studiază limba și se modelează funcționarea limbii în anumite condiții, situații și zonele cu probleme dezvoltat și utilizat programe de calculator, tehnologii informatice de organizare si prelucrare a datelor. Pe de altă parte, aceasta este zona de aplicare a modelelor de limbaj informatic în lingvistică și discipline conexe. Ca un special direcție științifică lingvistica computaţională a luat contur în studii europeneîn anii 1960. În măsura în care adjectiv englezesc computațional poate fi tradus și ca „computațional”, termenul „lingvistică computațională” se găsește și în literatură, totuși, în știință domestică el primește mai mult sens restrâns abordând conceptul de „lingvistică cantitativă”.

Adesea, lingvistica computațională se referă la termenul „lingvistică cantitativă”, care caracterizează o direcție interdisciplinară în cercetare aplicată, unde metodele cantitative sau statistice de analiză sunt folosite ca instrument principal pentru studiul limbajului și vorbirii. Uneori, lingvistica cantitativă (sau cantitativă) se opune lingvisticii combinatorii. În aceasta din urmă, rolul dominant este ocupat de un aparat matematic „necantitativ” - teoria mulțimilor, logica matematică, teoria algoritmilor etc. punct teoretic vizualizați utilizarea metode statisticeîn lingvistică vă permite să completați model structural limbaj cu o componentă probabilistică, adică să creeze un model teoretic structural-probabilistic care are un potențial explicativ semnificativ. LA zona de aplicare Lingvistica cantitativă este reprezentată, în primul rând, de utilizarea unor fragmente din acest model utilizate pentru monitorizarea lingvistică a funcționării limbii, decodarea textului codificat, autorizarea/atribuirea textului etc.

Termenul „lingvistică computațională” și problemele din această zonă sunt adesea asociate cu modelarea comunicării și, mai presus de toate, cu furnizarea de interacțiune umană cu un computer într-un limbaj natural natural sau limitat (pentru aceasta, sisteme speciale procesarea limbajului natural), precum și cu teoria și practica sistemelor de regăsire a informațiilor (IPS). Asigurarea comunicării între o persoană și un computer în limbaj natural este uneori desemnată prin termenul „prelucrare a limbajului natural” (traducere din în limba engleză termenul Procesarea limbajului natural). Această zonă a lingvisticii computaționale a apărut la sfârșitul anilor 1960 în străinătate și s-a dezvoltat în cadrul disciplinei științifice și tehnologice numită inteligență artificială (lucrări de R. Schenk, M. Lebovits, T. Winograd etc.). În sensul său, sintagma „prelucrare a limbajului natural” ar trebui să acopere toate domeniile în care computerele sunt utilizate pentru prelucrarea datelor lingvistice. În practică, însă, s-a fixat o înțelegere mai restrânsă a termenului - dezvoltarea de metode, tehnologii și sisteme specifice care asigură comunicarea între o persoană și un computer într-un limbaj natural natural sau limitat.

Lingvistica computațională, într-o anumită măsură, poate include lucrări în domeniul creării de sisteme hipertext, considerate ca mod special organizarea textului și chiar cât de fundamental noul fel text, opus în multe dintre proprietățile sale textului obișnuit format în tradiția tiparului Gutenberg (vezi Gutenberg).

Lingvistica computațională include și traducerea automată.

În cadrul lingvisticii computaționale, a apărut o direcție relativ nouă, care s-a dezvoltat activ încă din anii 1980 și 90 - lingvistica corpusului, unde principii generale construirea de corpuri de date lingvistice (în special, corpuri de text) folosind modern tehnologia calculatoarelor. Corpurile de text sunt colecții de texte special selectate de cărți, reviste, ziare etc., transferate pe suporturi automate și destinate procesării automate. Unul dintre primele corpuri de texte a fost creat pentru engleza americană la Universitatea Brown (așa-numitul Brown Corpus) în 1962-63 sub conducerea lui W. Francis. În Rusia, de la începutul anilor 2000, Institutul Limbii Ruse, numit după V. V. Vinogradov de la Academia Rusă de Științe, a dezvoltat Corpul Național a limbii ruse, constând dintr-un eșantion reprezentativ de texte în limba rusă cu un volum de aproximativ 100 de milioane de întrebuințări de cuvinte. Pe lângă construcția propriu-zisă a corpurilor de date, lingvistica corpusului este angajată în crearea de instrumente informatice (programe de calculator) menite să extragă diverse informații din corpus de text. Din punctul de vedere al utilizatorului, asupra corpurilor de text se impun cerințe de reprezentativitate (reprezentativitate), completitudine și economie.

Lingvistica computațională se dezvoltă activ atât în ​​Rusia, cât și în străinătate. Fluxul de publicații în acest domeniu este foarte mare. Cu exceptia culegeri tematice, în Statele Unite din 1984, revista Computational Linguistics este publicată trimestrial. Excelent organizatoric si munca stiintifica este condus de Asociația pentru Lingvistică Computațională, care are structuri regionale în întreaga lume (în special, filiala europeană). La fiecare doi ani au loc conferințe internaționale COLINT (în 2008 conferința a avut loc la Manchester). Principalele direcții ale lingvisticii computaționale sunt, de asemenea, discutate la conferința internațională anuală „Dialog”, organizată de Institutul de Cercetare al Inteligenței Artificiale din Rusia, Facultatea de Filologie Universitatea de Stat din Moscova, Yandex și o serie de alte organizații. Problemele relevante sunt, de asemenea, prezentate pe larg conferințe internaționale pe inteligența artificială de diferite niveluri.

Lit.: Zvegintsev V. A. Lingvistică teoretică și aplicată. M., 1968; Piotrovsky R. G., Bektaev K. B., Piotrovskaya A. A. Lingvistică matematică. M., 1977; Gorodetsky B. Yu. Probleme reale lingvistică aplicată // Nou în lingvistica străină. M., 1983. Emisiunea. 12; Kibrik A.E. Lingvistică aplicată // Kibrik A.E. Eseuri despre probleme generale și aplicate ale lingvisticii. M., 1992; Kennedy G. Introducere în lingvistica corpusului. L., 1998; Bolshakov I.A., Gelbukh A. Lingvistică computațională: modele, resurse, aplicații. Mekh., 2004; Corpus național al limbii ruse: 2003-2005. M., 2005; Baranov A. N. Introducere în lingvistica aplicată. a 3-a ed. M., 2007; Lingvistică computațională și tehnologii inteligente. M., 2008. Problema. 7.

Introducere

Ce este lingvistica computațională?

lingvistică informatică , o direcție în lingvistică aplicată, axată pe utilizarea instrumentelor informatice - programe, tehnologii informatice de organizare și prelucrare a datelor - pentru modelarea funcționării unei limbi în anumite condiții, situații, arii problematice etc., precum și a întregului domeniu de aplicare. a modelelor de limbaj informatic în lingvistică și discipline conexe. De fapt, doar în ultimul caz si vorbind despre lingvistica aplicataîn sens strict, deoarece modelarea computerizată a unui limbaj poate fi considerată și ca un domeniu de aplicare a informaticii și a teoriei programării pentru rezolvarea problemelor științei limbajului. În practică, totuși, aproape tot ceea ce este legat de utilizarea computerelor în lingvistică este denumit lingvistică computațională.

Ca direcție științifică specială, lingvistica computațională a luat contur în anii 1960. Termenul rusesc „lingvistică computațională” este o hârtie de urmărire din lingvistica computațională engleză. Întrucât adjectivul computațional în limba rusă poate fi tradus și ca „computațional”, termenul „lingvistică computațională” se găsește și în literatură, dar în știința rusă capătă un sens mai restrâns, abordând conceptul de „lingvistică cantitativă”. Fluxul de publicații în acest domeniu este foarte mare. Pe lângă colecțiile tematice, revista Computational Linguistics este publicată trimestrial în Statele Unite. O mare activitate organizatorică și științifică este realizată de Asociația pentru Lingvistică Computațională, care are structuri regionale (în special, filiala europeană). La fiecare doi ani au loc conferințe internaționale de lingvistică computațională - COLING. Problemele relevante sunt de obicei prezentate pe scară largă și la diferite conferințe despre inteligența artificială.

Sarcini

Lingvistică computațională preia problemele lingvistice propriu-zise ale modelării computerizate a activității lingvistice. Sarcinile sale sunt de a construi modele lingvistice mai precise și mai complete și algoritmi mai avansați pentru analiză și sinteză.

Direcțiile principale sunt:

1) Interacțiunea om-calculator: control - limbaje de programare, transfer de informații - interfață.

2) Lucrați cu texte: indexare, analiză și clasificare, editare automată (corectarea erorilor), detectarea cunoștințelor, traducere automată.

Poveste

O generație simplă a unui subset al limbii engleze pentru accesarea bazelor de date a fost oferită de unul dintre primele sisteme americane LIFER (Language Interface Facility wich Elipsis and Recursion), creat în anii 70. În urma acesteia, pe piața calculatoarelor au apărut și alte sisteme mai flexibile, oferind o interfață limitată în limbaj natural cu un computer.

În anii 1980, în Statele Unite s-au înființat o serie de companii angajate în dezvoltarea și vânzarea de interfețe în limbaj natural cu baze de date și sisteme expert. În 1985 Semantec Corporation a prezentat un astfel de pachet software Q&A, Carnegie Group a oferit un pachet similar LanguageCraft.

Se lucrează activ pentru a crea sisteme de traducere automată. Sistemul de traducere automată SYSTRAN, dezvoltat sub conducerea lui D. Tom, comandat de US Air Force, a devenit larg răspândit. În perioada 1974 - 1975. sistemul a fost folosit de Asociația Aerospațială NASA pentru a traduce documente pentru proiectul Apollo-Soyuz. În zilele noastre, ea traduce din mai multe limbi aproximativ 100.000 de pagini anual.

În Europa, munca la crearea sistemelor de traducere pe calculator a fost stimulată de formarea Rețelei Europene de Informații (EURONET DIANA). În 1982, Comunitatea Economică Europeană a anunțat crearea programului european EUROTRA, al cărui scop este dezvoltarea unui sistem traducere pe calculator pentru toți limbi europene. Inițial, proiectul a fost estimat la 12 milioane de dolari; în 1987, experții au determinat costul total al acestui proiect la peste 160 de milioane de dolari.

În Japonia, cercetarea în lingvistică computațională este centrată în jurul unui program de computer de generația a cincea la nivel național, lansat în 1981.

Există o serie de proiecte militare pentru a crea interfețe om-mașină în limbaj natural. În Statele Unite, acestea se desfășoară în principal ca parte a Strategic Computer Initiative, un program de zece ani adoptat de Departamentul Apărării în 1983. Scopul său este de a crea o nouă generație de arme și sisteme militare „inteligente” pentru pentru a asigura pe termen lung superioritatea tehnologică a Statelor Unite.

Desigur, specialiștii în inteligență artificială, cunoscători de calculatoare și limbaje de programare, s-au apucat cu energie să rezolve problema înțelegerii limbajului cu propriile metode. A existat o căutare a algoritmilor în limbaj natural. Au fost create programe complexe de înțelegere a limbajului pentru zone speciale foarte înguste, au fost implementate programe de traducere automată parțială și o serie de altele. Dar nu a existat un progres decisiv în rezolvarea problemei înțelegerii limbii. Limba și omul sunt atât de legate, încât oamenii de știință au fost nevoiți să se ocupe de problema înțelegerii lumii de către om. Și acesta este tărâmul filozofiei.

Concepte de bază ale lingvisticii

Termenul „lingvistică computațională” se referă de obicei la o arie largă de utilizare a instrumentelor informatice - programe, tehnologii informatice de organizare și prelucrare a datelor - pentru a modela funcționarea unei limbi în anumite condiții, situații, zone problematice, precum și domeniul de aplicare. a modelelor de limbaj informatic.numai la lingvistică, dar şi la disciplinele conexe. De fapt, doar în acest din urmă caz ​​vorbim de lingvistică aplicată în sens strict, întrucât modelarea limbajului informatic poate fi considerată și ca un domeniu de aplicare a teoriei programării (informatică) în domeniul lingvisticii. Cu toate acestea, practica generală este de așa natură încât domeniul de aplicare al lingvisticii computaționale acoperă aproape tot ceea ce are legătură cu utilizarea computerelor în lingvistică: „termenul de lingvistică computațională” stabilește o orientare generală către utilizarea computerelor pentru a rezolva o varietate de probleme științifice și sarcini practice asociat cu limba, fără a limita modalitățile de rezolvare a acestor probleme.

Aspectul instituțional al lingvisticii computaționale. Ca direcție științifică specială, lingvistica computațională a luat contur în anii '60. Fluxul de publicații în acest domeniu este foarte mare. Pe lângă colecțiile tematice, revista Computational Linguistics este publicată trimestrial în SUA. O mare activitate organizatorică și științifică este realizată de Asociația pentru Lingvistică Computațională, care are structuri regionale în întreaga lume (în special, filiala europeană). La fiecare doi ani au loc conferințe internaționale de lingvistică computațională - KOLING. Problemele relevante sunt, de asemenea, reprezentate pe scară largă la conferințele internaționale despre inteligența artificială la diferite niveluri.

Setul de instrumente cognitive de lingvistică computațională

Lingvistica computațională ca special disciplina aplicata se remarcă în primul rând prin instrument – ​​adică prin utilizare facilitati informatice prelucrarea datelor lingvistice. Deoarece programele de calculator care modelează anumite aspecte ale funcționării unui limbaj pot folosi o varietate de instrumente de programare, se pare că nu este nevoie să vorbim despre un metalimbaj comun. Cu toate acestea, nu este. Există principii generale simulare pe calculator gândire, care într-un fel sau altul se realizează în orice model de calculator. Acest limbaj se bazează pe teoria cunoașterii dezvoltată în inteligență artificialăși formând o ramură importantă a științei cognitive.

Teza principală a teoriei cunoașterii afirmă că gândirea este un proces de procesare și generare de cunoștințe. „Cunoașterea” sau „cunoașterea” este considerată o categorie nedefinită. „Procesorul” care prelucrează cunoștințele este sistemul cognitiv persoană. În epistemologie și știința cognitivă, se disting două tipuri principale de cunoștințe - declarative („a ști ce”) și procedurale („a ști cum”2)). Cunoașterea declarativă este de obicei prezentată ca un set de propoziții, afirmații despre ceva. Un exemplu tipic cunoștințele declarative pot fi considerate interpretări ale cuvintelor în mod obișnuit dicționare explicative. De exemplu, o cană] - „un vas mic de băut rotunjit, de obicei cu mâner, din porțelan, faianță etc.”. Cunoașterea declarativă se pretează procedurii de verificare în termeni de „adevărat-fals”. Cunoștințele procedurale sunt prezentate ca o secvență (listă) de operații, acțiuni care trebuie efectuate. Asta este atat de specific mie instrucție generală despre acțiunile într-o situație dată. Un exemplu tipic de cunoștințe procedurale sunt instrucțiunile de utilizare a aparatelor de uz casnic.

Spre deosebire de cunoștințele declarative, cunoștințele procedurale nu pot fi verificate ca adevărate sau false. Ele pot fi evaluate doar prin succesul sau eșecul algoritmului.

Cele mai multe dintre conceptele setului de instrumente cognitive ale lingvisticii computaționale sunt omonime: ele desemnează simultan unele entități reale ale sistemului cognitiv uman și modalități de reprezentare a acestor entități în unele metalimbaje. Cu alte cuvinte, elementele de metalimbaj au un aspect ontologic și instrumental. Ontologic îi corespunde separarea cunoștințelor declarative și procedurale tipuri diferite cunoașterea sistemului cognitiv uman. Deci, cunoștințe despre subiecte specifice, obiectele realității sunt predominant declarative, iar abilitățile funcționale ale unei persoane de a merge, alerga, conduce o mașină sunt realizate în sistemul cognitiv ca cunoștințe procedurale. Instrumental, cunoștințele (atât ontologic procedurale, cât și declarative) pot fi reprezentate ca un set de descrieri, descrieri și ca algoritm, o instrucțiune. Cu alte cuvinte, cunoștințele declarative ontologic despre obiectul „tabelului” realității pot fi reprezentate procedural ca un set de instrucțiuni, algoritmi de creare, asamblare (= aspectul creativ al cunoștințelor procedurale) sau ca algoritm de utilizare tipică a acestuia (= aspect functional cunoștințe procedurale). În primul caz, acesta poate fi un ghid pentru un tâmplar începător, iar în al doilea, o descriere a posibilităților unui birou de birou. Este adevărat și invers: cunoștințele ontologice procedurale pot fi reprezentate declarativ.

Este nevoie de o discuție separată dacă orice cunoaștere ontologic declarativă poate fi reprezentată ca procedurală și orice ontologic procedurală - ca declarativă. Cercetătorii sunt de acord că orice cunoaștere declarativă poate fi, în principiu, reprezentată procedural, deși acest lucru se poate dovedi a fi foarte neeconomic pentru un sistem cognitiv. Reversul este greu de adevărat. Faptul este că cunoștințele declarative sunt mult mai explicite, este mai ușor de înțeles pentru o persoană decât cunoștințele procedurale. Spre deosebire de cunoștințele declarative, cunoștințele procedurale sunt predominant implicite. Asa de, abilitate lingvistică, fiind cunoștințe procedurale, este ascunsă unei persoane, nu este realizată de aceasta. O încercare de a explica mecanismele de funcționare a limbajului duce la disfuncție. Specialiștii în domeniul semanticii lexicale știu, de exemplu, că introspecția semantică pe termen lung necesară studierii planului de conținut al cuvântului duce la faptul că cercetătorul își pierde parțial capacitatea de a distinge între corect și abuzuri cuvânt analizat. Alte exemple pot fi citate. Se știe că din punct de vedere al mecanicii, corpul uman este sistem complex două pendule care interacționează.

În teoria cunoașterii, cunoștințele sunt studiate și reprezentate folosind diverse structuri cunoștințe - cadre, scenarii, planuri. Potrivit lui M. Minsky, „un cadru este o structură de date concepută pentru a reprezenta o situație stereotipată” [Minsky 1978, p.254]. Mai detaliat, putem spune că cadrul este o structură conceptuală pentru reprezentarea declarativă a cunoștințelor despre o situație tipificată unificată tematic, care conține sloturi interconectate prin anumite relații semantice. În scopuri ilustrative, un cadru este adesea reprezentat ca un tabel, ale cărui rânduri formează fante. Fiecare slot are propriul său nume și conținut (vezi Tabelul 1).

tabelul 1

Fragment din cadrul „tabelului” într-o vedere de tabel

Depinzând de sarcina specifica structurarea cadrului poate fi semnificativ mai complexă; un cadru poate include subcadre imbricate și referințe la alte cadre.

În locul unui tabel, este adesea folosită o formă predicată de prezentare. În acest caz, cadrul este sub forma unui predicat sau a unei funcție cu argumente. Există și alte moduri de a reprezenta un cadru. De exemplu, poate fi reprezentat ca un tuplu următorul fel: ( (numele cadrului) (numele slotului)) (valoarea slotului,),..., (numele slotului n) (valoarea slotului n) ).

De obicei, cadrele din limbajele de reprezentare a cunoștințelor au această formă.

Ca și alte categorii cognitive ale lingvisticii computaționale, conceptul de cadru este omonim. Ontologic, este o parte a sistemului cognitiv uman și, în acest sens, cadrul poate fi comparat cu concepte precum gestalt, prototip, stereotip, schemă. În psihologia cognitivă, aceste categorii sunt considerate tocmai din punct de vedere ontologic. Deci, D. Norman distinge două moduri principale de existență și organizare a cunoașterii în sistemul cognitiv uman - rețele și scheme semantice. „Schemele”, scrie el, „sunt pachete organizate de cunoștințe asamblate pentru a reprezenta unități individuale de cunoaștere autonome. Schema mea pentru Sam poate conține informații care îi descriu Caracteristici fizice, activitatea sa și trăsături de personalitate. Această schemă se corelează cu alte scheme care descriu alte aspecte ale acesteia” [Norman 1998, p.359]. Dacă luăm latura instrumentală a categoriei cadru, atunci aceasta este o structură pentru reprezentarea declarativă a cunoștințelor. În sistemele AI existente, rame pot structuri complexe cunoştinţe; sistemele de cadru permit ierarhie - un cadru poate face parte dintr-un alt cadru.

Din punct de vedere al conținutului, conceptul de cadru este foarte apropiat de categoria interpretării. Într-adevăr, un slot este un analog al valenței, umplerea unui slot este un analog al unui actant. Principala diferență dintre ele este că interpretarea conține doar informații relevante din punct de vedere lingvistic despre planul conținutului cuvântului, iar cadrul, în primul rând, nu este neapărat legat de cuvânt și, în al doilea rând, include toate informațiile relevante pentru o anumită problemă. situație, inclusiv extralingvistică (cunoașterea lumii) 3).

Un scenariu este un cadru conceptual pentru reprezentarea procedurală a cunoștințelor despre o situație sau un comportament stereotip. Elementele de script sunt pașii unui algoritm sau instrucțiuni. Oamenii vorbesc de obicei despre „scenariu de restaurant”, „scenariu de cumpărare” și așa mai departe.

Cadrul a fost folosit inițial și pentru prezentarea procedurală (cf. termenul „cadru procedural”), dar termenul „scenariu” este acum mai des folosit în acest sens. Un scenariu poate fi reprezentat nu numai ca un algoritm, ci și ca o rețea, ale cărei vârfuri corespund unor situații, iar arcurile corespund conexiunilor dintre situații. Alături de conceptul de script, unii cercetători folosesc categoria unui script pentru modelarea computerizată a inteligenței. Potrivit lui R. Schenk, un scenariu este o secvență general acceptată, binecunoscută cauzalitate. De exemplu, înțelegerea dialogului

Pe stradă se toarnă ca o găleată.

Mai trebuie să mergi la magazin: nu e nimic în casă - ieri oaspeții au măturat totul.

se bazează pe legături semantice non-explicite precum „dacă plouă, nu este de dorit să ieși afară, pentru că te poți îmbolnăvi.” Aceste conexiuni formează un scenariu, care este folosit de vorbitorii nativi pentru a înțelege comportamentul verbal și non-verbal al celuilalt.

Ca rezultat al aplicării scenariului la o situație problemă specifică, a plan). Planul este folosit pentru a reprezenta procedural cunoștințele despre acțiuni posibile conducând la realizare scop specific. Un plan leagă un scop cu o secvență de acțiuni.

LA caz general planul include o succesiune de proceduri care transferă starea inițială a sistemului în starea finală și conduc la atingerea unui subscop ​​și scop specific. În sistemele AI, planul apare ca urmare a activității de planificare sau planificare a modulului corespunzător - modulul de planificare. Procesul de planificare se poate baza pe adaptarea datelor dintr-unul sau mai multe scenarii, activate prin proceduri de testare, pentru a rezolva o situație problematică. Executarea planului este realizată de un modul executiv care controlează procedurile cognitive și actiuni fizice sisteme. În cazul elementar, planul în sistem intelectual este o succesiune simplă de operații; în versiunile mai complexe, planul este asociat cu un subiect specific, resursele, capacitățile, obiectivele sale, informatii detaliate despre o situație problematică etc. Apariția planului are loc în procesul de comunicare între modelul lumii, o parte din care este format din scenarii, modulul de planificare și modulul executiv.

Spre deosebire de un scenariu, este vorba despre un plan situație specifică, un anumit performer și urmărește atingerea unui anumit scop. Alegerea planului este guvernată de resursele contractantului. Fezabilitatea planului - condiție cerută generațiile sale în sistemul cognitiv, iar caracteristica de satisfacție este inaplicabilă scenariului.

Încă una concept important- modelul lumii. Modelul lumii este de obicei înțeles ca un set de cunoștințe despre lume organizat într-un anumit mod, inerent unui sistem cognitiv sau modelului său computerizat. În încă câteva vedere generala despre modelul lumii se vorbește despre o parte a sistemului cognitiv care stochează cunoștințe despre structura lumii, tiparele acesteia etc. În alt sens, modelul lumii este asociat cu rezultatele înțelegerii textului sau, mai larg, discursul. În procesul de înțelegere a discursului se construiește modelul mental al acestuia, care este rezultatul interacțiunii dintre planul conținutului textului și cunoștințele despre lume inerente acestui subiect [Johnson-Laird 1988, p. 237 și secv.]. Prima și a doua înțelegere sunt adesea combinate. Acest lucru este tipic pentru cercetătorii lingvistici care lucrează în lingvistica cognitivă și știința cognitivă.

Strâns legat de categoria cadru este conceptul de scenă. Categoria scenei este folosită în principal în literatură ca desemnare a structurii conceptuale pentru reprezentarea declarativă a actualizării în act de vorbire si dedicat limbajul înseamnă(jetoane, construcţii sintactice, categorii gramaticale etc) situaţii şi părţile lor5). Fiind asociată cu forme lingvistice, scena este adesea actualizată anumit cuvânt sau expresie. În gramaticile intrigilor (vezi mai jos), o scenă apare ca parte a unui episod sau a unei narațiuni. Exemple tipice scene - un set de cuburi cu care funcționează sistemul AI, scena din poveste și participanții la acțiune etc. În inteligența artificială, scenele sunt utilizate în sistemele de recunoaștere a imaginilor, precum și în programele orientate spre cercetare (analiza, descriere) situații problematice. Conceptul de scenă a devenit larg răspândit în lingvistica teoretică, precum și în logică, în special în semantica situațională, în care sensul unitate lexicală se conectează direct la scenă.