Matematické metódy v lingvistike. Lingvistický encyklopedický slovník

matematická disciplína, ktorej predmetom je vývoj formálneho aparátu na popis štruktúry prirodzených a niektorých umelých jazykov. Vznikol v 50. rokoch 20. storočia. 20. storočie; jedným z hlavných podnetov pre vznik M. l. slúžila ako zrelá potreba v lingvistike objasniť jej základné pojmy. Metódy M. l. majú veľa spoločného s metódami matematickej logiky - matematickou disciplínou, ktorá študuje štruktúru matematického uvažovania - a najmä s takými časťami, ako je teória algoritmov a teória automatov. Sú široko používané v M. l. aj algebraické metódy. M. l. sa rozvíja v úzkej interakcii s lingvistikou. Niekedy výraz „M. l." sa používa aj na označenie akéhokoľvek lingvistického výskumu, ktorý používa nejaký matematický aparát.

Matematický opis jazyka vychádza z koncepcie jazyka ako mechanizmu, ktorý siaha až k F. de Saussure, ktorého fungovanie sa prejavuje v rečovej aktivite jeho hovorcov; jeho výsledkom sú „správne texty“ – sekvencie rečových jednotiek podliehajúce určitým vzorcom, z ktorých mnohé umožňujú matematický popis. Vývoj a štúdium metód na matematický popis správnych textov (predovšetkým viet) je obsahom jednej z častí M. l. - teória spôsobov opisu syntaktickej štruktúry. Na popísanie štruktúry vety – presnejšie jej syntaktickej štruktúry – sa v nej dá buď vyčleniť zložky- skupiny slov, ktoré fungujú ako integrálne syntaktické jednotky, alebo označujú pre každé slovo tie slová, ktoré sú mu priamo podriadené (ak nejaké sú). Takže vo vete „Kouč sedí na ožiarení“ (A. S. Puškin), pri opise podľa 1. spôsobu, zložkami bude celá veta P, každé jej jednotlivé slová a skupiny slov A = sedí na ožiarení. a B = na ožiarení (pozri obr. 1, šípky znamenajú "okamžité vnorenie"); popis podľa 2. spôsobu dáva obvod znázornený na obr. 2. Výsledné matematické objekty sa nazývajú systém komponentov(1. spôsob) a strom syntaktickej podriadenosti(2. spôsob).

Presnejšie povedané, systém komponentov je množina segmentov vety, ktorá obsahuje ako prvky celú vetu a všetky výskyty slov v tejto vete („jednoslovné segmenty“) a má vlastnosť, že každé dva segmenty sú v nej zahrnuté buď nepretínajú, alebo jeden z nich je obsiahnutý v inom; syntaktický podraďovací strom alebo jednoducho podraďovací strom je strom, ktorého množina uzlov je množina výskytov slov vo vete. strom v matematike sa nazýva množina, medzi prvkami ktorej - sa nazývajú uzly- vzniká binárna relácia - je tzv podriadenosti a graficky znázornené šípkami smerujúcimi od podriadených uzlov k podriadeným - tak, že: 1) medzi uzlami je práve jeden - tzv. koreň, - nie je podriadený žiadnemu uzlu; 2) každý z ostatných uzlov je podriadený presne jednému uzlu; 3) po začatí z akéhokoľvek uzla pozdĺž šípok nie je možné vrátiť sa do rovnakého uzla. Uzly podraďovacieho stromu sú výskyty slov vo vetách. Pri grafickom znázornení má systém komponentov (ako na obr. 1) tiež podobu stromu ( strom komponentov). Často sa to nazýva strom podraďovania alebo systém komponentov vytvorených pre vetu syntaktická štruktúra vo forme stromu podriadenosti (systému komponentov). Komponentné systémy sa používajú hlavne pri popisoch jazykov s pevným slovosledom, podriadené stromy sa používajú pri opisoch jazykov s voľným slovosledom (najmä ruština), formálne pre každú (nie príliš krátku) vetu, mnohé môžu byť zostavené rôzne syntaktické štruktúry ktoréhokoľvek z týchto dvoch typov, ale z nich je správna iba jedna alebo niekoľko. Koreňom správneho stromu podriadenosti je zvyčajne predikát. Volá sa veta, ktorá má viac správnych syntaktických štruktúr (rovnakého druhu). syntakticky homonymné; rôznym významom vety spravidla zodpovedajú rôzne syntaktické štruktúry. Napríklad veta „Školáci z Rževa išli do Torzhoku“ umožňuje dva pravidelné stromy podriadenosti (obr. 3, a, b); prvý z nich zodpovedá významu „školáci Rzhev išli (nie nevyhnutne z Rzhev) do Torzhok“, druhý - „Školáci (nie nevyhnutne Rzhev) išli z Rzhev do Torzhok“.

V ruštine a mnohých ďalších jazykoch sa stromy podriadenosti viet „obchodného štýlu“ spravidla riadia zákon projektivity, ktorá spočíva v tom, že všetky šípky sa dajú ťahať cez čiaru, na ktorej je veta napísaná, a to tak, aby sa žiadne dve nepretínali a koreň neležal pod žiadnou šípkou. V jazyku fikcie, najmä v poézii, sú odchýlky od zákona projektivity prípustné a najčastejšie slúžia na vytvorenie určitého umeleckého účinku. Neprojektivita teda vo vete „Priatelia krvavého staroveku ľudu tešili sa na vojnu“ (Puškin) vedie k dôraznému zdôrazneniu slova „ľudový“ a zároveň akoby spomaľuje reč. , čím vzniká dojem určitej povznesenosti a vážnosti. Existujú aj iné formálne znaky stromov podriadenosti, ktoré možno použiť na charakterizáciu štýlu. Napríklad maximálny počet vnorených šípok slúži ako miera „syntaktickej objemnosti“ vety (pozri obr. 4).

Pre adekvátnejší popis štruktúry vety sú zložky zvyčajne označené symbolmi gramatických kategórií („nominálna skupina“, „prechodná slovesná skupina“ atď.) a šípkami podraďovacieho stromu - symbolmi syntaktických vzťahy („predikatívne“, „atributívne“ atď.).

Na reprezentáciu hlbokej syntaktickej štruktúry vety sa využíva aj aparát podraďovacích stromov a komponentových systémov, ktorý tvorí medzistupeň medzi sémantickou a obyčajnou syntaktickou štruktúrou (druhá sa často nazýva povrchná syntaktická).

Dokonalejšie znázornenie syntaktickej stavby vety (vyžadujúce však zložitejší matematický aparát) je dané napr. syntaktické skupinové systémy, ktoré zahŕňajú frázy aj syntaktické väzby, a to nielen medzi slovami, ale aj medzi frázami. Syntaktické skupinové systémy vám umožňujú kombinovať prísnosť formálneho opisu štruktúry vety s flexibilitou, ktorá je vlastná tradičným neformálnym opisom. Subordinačné stromy a systémy komponentov sú extrémne špeciálne prípady systémov syntaktických skupín.

Ďalší úsek M. l., ktorý v ňom zaujíma centrálne miesto, je teória formálnych gramatík, ktorej začiatok položili diela N. Chomského. Študuje spôsoby opisu vzorov, ktoré už necharakterizujú jeden text, ale celý súbor správnych textov konkrétneho jazyka. Tieto vzory sú opísané pomocou formálna gramatika- abstraktný „mechanizmus“, ktorý umožňuje jednotným postupom získať správne texty daného jazyka spolu s popismi ich štruktúry. Najpoužívanejším typom formálnej gramatiky je generatívna gramatika, alebo Chomského gramatika, čo je usporiadaný systém Г = ⟨ V, W, P, R ⟩, kde V a W sú disjunktné konečné množiny, tzv. hlavné, alebo terminál, a pomocný, alebo nekoncový, abecedy(ich prvky sa nazývajú hlavné alebo koncové a pomocné alebo nekoncové, symbolov), P je prvok W, tzv počiatočný znak a R je konečná množina pravidlá tvaru φ → ψ, kde φ a ψ sú reťazce (konečné postupnosti) hlavných a pomocných symbolov. Ak φ → ψ je gramatické pravidlo G a ω 1 , ω 2 sú reťazce základných a pomocných symbolov, hovoria, že reťazec ω 1 ψω 2 priamo odvoditeľné do Г z ω 1 φω 2 . Ak ξ 0 , ξ 1 , ..., ξ n sú reťazce a pre každé i = 1, ..., n je reťazec ξ i priamo odvoditeľný z ξ i−1 , hovoríme, že ξ n odvoditeľné do Г od ξ 0 . Nazýva sa množina tých reťazcov základných symbolov, ktoré sú odvoditeľné v Г od jeho počiatočného symbolu jazyk generovaný gramatikouГ a označuje sa L(Г). Ak všetky pravidlá Г majú tvar η 1 Aη 2 → η 1 ωη 2 , potom sa Г nazýva gramatika zložiek(alebo priamo komponenty), skrátene NS- gramatika; ak navyše v každom pravidle sú reťazce η 1 a η 2 ( pravý a ľavý kontext) sú prázdne, potom sa volá gramatika bezkontextový(alebo bezkontextový), skrátene B- gramatika(alebo KS- gramatika). V najbežnejšom lingvistickom výklade sú hlavnými symbolmi slová, pomocnými symbolmi sú symboly gramatických kategórií, začiatočným symbolom je symbol kategórie „veta“; jazyk vygenerovaný gramatikou sa interpretuje ako množina všetkých gramaticky správnych viet daného prirodzeného jazyka. V gramatike NN odvodenie vety poskytuje strom jej prvkov, v ktorom každý prvok pozostáva zo slov „odvodených“ od jedného pomocného symbolu, takže pre každý prvok je uvedená jeho gramatická kategória. Takže ak má gramatika okrem iného pravidlá P → S x, y, im, V y → V i y O, O → S x, y, predložka, V i y → sedí, S manžel, jednotné číslo, im → na , kočiš, S manžel, spev., návrh. → ožarovanie, potom veta „Kouč sedí na ožiarení“ má výstup znázornený na obr. 5, kde šípky prechádzajú z ľavých častí použitých pravidiel k prvkom pravých častí. Systém komponentov zodpovedajúci tomuto záveru sa zhoduje so systémom znázorneným na obr. 1. Možné sú aj iné interpretácie: napríklad hlavné symboly možno interpretovať ako morfy, pomocné - ako symboly typov morfov a prijateľné reťazce morfov, začiatočný symbol - ako symbol typu "tvar slova", a jazyk generovaný gramatikou - ako súbor pravidelných slovných tvarov (morfologická interpretácia); Časté sú aj morfologické a fonologické výklady. Pri reálnych opisoch jazykov sa zvyčajne používajú „viacúrovňové“ gramatiky, ktoré obsahujú sekvenčne pracujúce syntaktické, morfologické a morfologicko-fonologické pravidlá.

Ďalším dôležitým typom formálnej gramatiky je gramatika dominancie, ktorý generuje množinu reťazcov, zvyčajne interpretovaných ako vety, spolu s ich syntaktickými štruktúrami vo forme podraďovacích stromov. Gramatika syntaktických skupín generuje súbor viet spolu s ich syntaktickými štruktúrami, ktoré majú podobu systémov syntaktických skupín. Existujú aj rôzne koncepty transformačná gramatika (stromové gramatiky), ktorý neslúži na generovanie viet, ale na transformáciu stromov interpretovaných ako stromy podriadenosti alebo stromy zložiek. Príkladom môže byť Δ- gramatika- systém pravidiel transformácie stromov interpretovaný ako "čisté" stromy podraďovania viet, teda stromy podraďovania bez lineárneho slovosledu.

stáť oddelene Montagueove gramatiky, ktoré slúžia na súčasný opis syntaktických a sémantických štruktúr vety; využívajú zložitý matematický a logický aparát (tzv intenzionálna logika).

Formálne gramatiky sa používajú na opis nielen prirodzených, ale aj umelých jazykov, najmä programovacích jazykov.

V M. l. tiež vyvinuté analytické modely jazyka, v ktorom sa na základe určitých údajov o reči, ktoré sa považujú za známe, robia formálne konštrukcie, ktorých výsledkom je opis niektorých aspektov štruktúry jazyka. Tieto modely zvyčajne využívajú jednoduchý matematický aparát – jednoduché pojmy teórie množín a algebry; preto sa niekedy nazývajú analytické modely jazyka množinovo-teoretické. V analytických modeloch najjednoduchšieho typu sú počiatočnými údajmi súbor správnych viet a systém okolí- súbory „slov“ patriacich do jednej lexémy (napríklad (dom, dom, dom, dom, dom, dom, dom, dom, dom, dom)). Najjednoduchší odvodený koncept v takýchto modeloch je nahraditeľnosť: slovo a nahradené slovom b, ak každá správna veta obsahuje výskyt slova a, zostáva v platnosti, ak je tento výskyt nahradený výskytom slova b. Ak a vymeniteľné za b a b na a, hovoria to a a b zameniteľné. (Napríklad v ruštine sa slovo „modrý“ nahrádza slovom „modrý“; slová „modrý“ a „modrý“ sú vzájomne zameniteľné.) Trieda slov, ktoré sú navzájom zameniteľné, sa nazýva rodina. Zo susedstiev a rodín možno odvodiť množstvo ďalších jazykovo zmysluplných slovných klasifikácií, z ktorých jedno približne zodpovedá tradičnému systému slovných druhov. V inom type analytických modelov sa namiesto súboru správnych viet používa potenciálny vzťah podriadenosti medzi slovami, čo znamená schopnosť jedného z nich podriadiť druhému v správnych vetách. V takýchto modeloch je možné získať najmä formálne definície množstva tradičných gramatických kategórií – napríklad formálnu definíciu pádov podstatných mien, čo je postup, ktorý umožňuje obnoviť pádový systém jazyka, pričom poznáte iba vzťah potenciálnej podriadenosti, systém susedstiev a množina slov, ktoré sú tvarmi podstatných mien.

Analytické modely jazyka využívajú jednoduché koncepty teórie množín a algebry. Blízko analytickým modelom jazyka dešifrovacie modely- postupy, ktoré umožňujú pomocou dostatočne veľkého množstva textov v neznámom jazyku bez akýchkoľvek predbežných informácií o ňom získať množstvo údajov o jeho štruktúre.

Podľa svojho účelu M. l. je predovšetkým nástrojom teoretickej lingvistiky. Jeho metódy sú zároveň široko využívané v aplikovanom lingvistickom výskume – automatické spracovanie textu, automatický preklad a vývoj súvisiaci s takzvanou komunikáciou medzi človekom a počítačom.

  • Kulagina O. S., O jednom spôsobe definovania gramatických pojmov na základe teórie množín, in: Problémy kybernetiky, c. 1, Moskva, 1958;
  • Chomského N., Syntaktické štruktúry, v zborníku: „Novinka v lingvistike“, v. 2, M., 1962;
  • Hladký A. V., Melchuk I. A., Základy matematickej lingvistiky, M., 1969 (lit.);
  • ich vlastné, Gramatiky stromov, I, II, in: Informačné otázky semiotiky, lingvistiky a automatického prekladu, c. 1, 4, M., 1971-74 (lit.);
  • Marcus S., Množinové teoretické modely jazykov, prel. z angličtiny, M., 1970 (lit.);
  • Hladký A. V., Formálne gramatiky a jazyky, M., 1973 (lit.);
  • jeho vlastné, Pokus o formálne vymedzenie pojmov pád a rod podstatného mena, v So: Problémy gramatického modelovania, M., 1973 (lit.);
  • jeho vlastné, Syntaktické štruktúry prirodzeného jazyka v automatizovaných komunikačných systémoch, M., 1985 (lit.);
  • Sukhotin BV, Optimalizačné metódy pre jazykový výskum. M., 1976 (lit.);
  • Sevbo I. P., Grafické znázornenie syntaktických štruktúr a štylistická diagnostika, K., 1981;
  • Párty B. Kh., Grammar Montagu, mentálne reprezentácie a realita, v knihe: Semiotics, M., 1983;
  • Montague R., Formálna filozofia, New Haven - L., 1974(dosl.).

Niet pochýb, že používanie matematických a logických metód („exaktných metód“) v lingvistike bolo do značnej miery stimulované úlohami aplikovanej lingvistiky. Ak by sa pokúsili použiť tieto metódy na riešenie problémov priamo súvisiacich s oblasťou teoretickej lingvistiky, napríklad na rozlíšenie medzi javmi jazyka a reči * , potom v budúcnosti (aj keď možno nie vždy jasné a blízke), potreby aplikovanej lingvistiky. Mimochodom, to znamená, že hodnotenie výsledkov takýchto operácií by sa malo vykonávať s povinným zohľadnením cieľov aplikovanej lingvistiky.

* (Pozri: G. Herdan, Jazyk ako voľba a šanca, Groningen, 1956.)

O úspešnosti použitia týchto metód v úplne novej oblasti zo všeobecného hľadiska do značnej miery rozhoduje odpoveď na otázku, do akej miery je prípustné stotožniť logicky správny jazyk s jazykom prirodzeným, resp. iná formulácia, je možné zredukovať druhú na prvú * . Odpoveď na túto otázku sa zvyčajne podáva praktickou formou - konštruovaním štatistických, informačno-teoretických, množinovo-teoretických, pravdepodobnostných a iných matematických modelov jazyka, ktoré však nie sú vždy zamerané na konkrétne úlohy ** . Pri konštrukcii modelov tohto druhu ich autori často vychádzajú z predpokladu (z ich pohľadu zrejmého), že akákoľvek aplikácia formálno-logického či matematického aparátu na lingvistický popis a výskum automaticky prispieva k ich zdokonaľovaniu. Warren Plyat o tom dobre povedal vo svojom prehľade prác o matematickej lingvistike: „Ak považujeme jazykové modely za abstraktné systémy diskrétnych prvkov, potom na ne možno aplikovať rôzne matematické koncepty a metódy, od elementárnej myšlienky čísla až po komplexné „logické, štatistické a množinovo-teoretické operácie. Avšak predstava, že akékoľvek použitie čísel a matematických operácií na opis takýchto systémov prvkov robí tvrdenia „presnejšími“ alebo „vedeckými“, je úplne mylná. V prvom rade treba ukázať, že takto získaný nový systém je uspokojivejším modelom ako pôvodný systém, či už v tom zmysle, že umožňuje formulovať jednoduchšie a všeobecnejšie teoretické tvrdenia o niektorých aspektoch modelovanej oblasti, resp. pretože operácie na modeli vrhajú svetlo na výsledky zodpovedajúcich operácií v modelovanej oblasti Jedným z hlavných nebezpečenstiev spojených s konštrukciou matematických modelov jazyka, najmä kvantitatívnych, je, že nerozlišujúce používanie matematického aparátu nevyhnutne vedie k nezmyselnosti a dezorientujúce výsledky.že predpokladom obohatenia lingvistiky pomocou matematiky je nielen znalosť príslušných oblastí matematiky, ale okrem toho aj hlboké pochopenie podstaty lingvistických problémov, ktorých riešenie by malo smerovať pri matematických metódach "*** .

* (St Poznámka G. Curryho: „Skutočnosť, že medzi matematikou a logikou na jednej strane a jazykom na druhej strane existuje úzka súvislosť, sa stáva samozrejmosťou už dávno a teraz sa táto skutočnosť stala stredobodom pozornosti v r. rigoróznejšia myšlienka...“ (N. V. Curry, Niektoré logické aspekty gramatickej štruktúry, v zborníku zo sympózia „Structure of Language and its Mathematical Aspects“, Providence, 1961, s. 57).)

** (V tomto smere sa ako veľmi aktuálna javí poznámka P. Garvina (ktorú uviedol v recenzii W. Bar-Hillela, Language and Information: Selected Essays on Their Theory and Application, London, 1964): „Väčšina prác o teória spracovania informácií a aplikácie pre jej účely výpočtových strojov, je úplne naivná a nepochybne nie taká užitočná, ako by bola žiadúca. Pokiaľ ide o negatívny postoj Bar-Hillela k účinnosti logicko-matematických metód automatického spracovania rečových informácií, P. Garvin sa domnieva, že stále obsahuje pozitívne prvky, pretože tento postoj „prinajmenšom niektorých vedcov prinúti brať svoje teórie menej vážne“ (Americká dokumentácia, New York, zväzok 16, č. 2, 1965, s. 127).)

*** (W. Plath, Matematická lingvistika. In: "Trendy v európskej a americkej lingvistike 1930-1960", Antverpy, 1961, s. 22-2E.)

Aby sme sa podľa možnosti vyhli nebezpečenstvu naznačenému Warrenom Platom, je potrebné nielen čisto empirické pokusy odpovedať na vyššie formulovanú otázku, ale aj usilovať sa o jej všeobecné teoretické pochopenie. V skutočnosti je otázka redukovateľnosti prirodzeného jazyka na jeden alebo druhý logicko-matematický model alebo jeho interpretácia hlavnou otázkou teórie aplikovanej lingvistiky, ktorej potreba sa pociťuje čoraz naliehavejšie. Pri uvažovaní nad touto problematikou je v prvom rade povaha tých javov, ktoré tvoria predmet štúdia na jednej strane logika a matematika a na druhej strane prirodzený jazyk, a potom aj možnosti metód, ktorými každý týchto vedeckých prác by sa malo zvážiť. Už z porovnávacej štúdie týchto bodov bude možné vyvodiť niekoľko všeobecných záverov, ktoré môžu byť užitočné pre všetkých, ktorí musia nevyhnutne vykonávať svoj výskum na priesečníku vymenovaných vied.

Tomuto cieľu do určitej miery slúži sympózium „Štruktúra jazyka a jeho matematické aspekty“, ktoré organizuje Americká matematická spoločnosť*. Ale všetky, ako je zrejmé už zo samotného názvu sympózia, sa dotýkajú len jednotlivých a v niektorých prípadoch veľmi konkrétnych aspektov problému, ktorý nás zaujíma. Hoci vo svojom celku vytvárajú dostatočne zdôvodnené predpoklady na zodpovedanie nami zvažovanej otázky, stále im chýba jasná a jednoznačná formulácia potrebných záverov. Účastníci sympózia v mnohých smeroch pokračujú v línii empirických pokusov o vyriešenie problému, v žiadnom prípade však neponúkajú svoje experimenty lingvistom v nádeji, že sami prídu na to, ako budú nimi prezentované hypotézy a riešenia sa ukážu ako vhodné pre ich účely.

* („Štruktúra jazyka a jeho matematické aspekty“. Proc. zo Soc. z Appl. Math., 12. Providence, 1961.)

Vhodnejšie sú preto ako východisko pre pochopenie výsledkov práce lingvistov, logikov a matematikov v pláne, ktorý rozoberáme, dva články umiestnené v zborníku „Prirodzený jazyk a počítačový stroj“ *: M. Maron „The pohľadu logika na spracovanie lingvistických údajov“ a P Garvin a V. Karash „Lingvistika, lingvistické spracovanie údajov a matematika“. Načrtávajú pracovné možnosti logiky a matematiky, ich vzťah k empirickým vedám, metódy riešenia problémov atď. Vráťme sa k úvahám o problémoch, ktoré tieto články nastolili z hľadiska otázky, ktorá bola formulovaná vyššie.

* ("Prirodzený jazyk a počítač", vyd. bv P. Garvin, New York, 1963.)

2

Zdalo by sa, že na našu otázku už máme absolútne jednoznačnú odpoveď. Takže napríklad N. D. Andreev a JI. R. Zinder píše: „Matematické znázornenie (model) jazykov nie je v žiadnom prípade totožné s jazykom samotným“ * . Riadi sa nimi aj autor knihy „Jazykové modely“ I. I. Revzin, ktorý upozorňuje, že v dôsledku modelovania sa môže objaviť len „viac-menej blízka aproximácia údajov konkrétnej reality“ **. Povedať to však ešte neznamená nič, pretože zostáva neodhalené, prečo je to tak a či sa ešte treba uchýliť k metóde matematického a logického modelovania, a ak áno, v akom rozsahu a za akým účelom.

* (N. D. Andreev, L. R. Zinder, Základné problémy aplikovanej lingvistiky, „Problémy lingvistiky“, 1959, č. 4, s. 18.)

** (I. I. Revzin, Models of language, M., 1962, s.8. Mimochodom, výraz „blízka aproximácia“ je priama tautológia: blízka aproximácia.)

Na vyriešenie všetkých týchto problémov sa najprv stanovuje ako východiskový bod, ktoré vedy – induktívne alebo deduktívne – zahŕňajú lingvistiku, logiku a matematiku. Pokiaľ ide o posledné dve vedy, ich postavenie je jasné – nepochybne patria medzi deduktívne vedy, založené vo svojej výskumnej metodológii na inferencii. Lingvistika je tradične definovaná ako empirická veda, z čoho vyplýva, že jej hlavným vedeckým cieľom je opisovať fakty. To zrejme znamená, že lingvistika by mala byť zaradená do oblasti induktívnych vied. To znamená aj to, že v snahe využiť formálny aparát logiky a matematiky v lingvistike sa pokúšajú aplikovať deduktívne metódy výskumu v induktívnej vede.

V posledných rokoch sa však induktívna povaha jazykovej vedy – lingvistiky dostáva do priamych či nepriamych pochybností. L. Elmslev to urobil v najostrejšej forme. Pravda, terminológia, ktorú používa, je veľmi nejednotná a najmä sa vyznačuje svojráznym a veľmi osobným chápaním pojmov „dedukcia“ a „indukcia“ (v skutočnosti ich interpretuje úplne opačne). Základy jeho lingvistickej teórie, ktorú vykladá, však nenechávajú žiadne pochybnosti o jej metodologickej podstate. Preto považuje za prijateľné používať akékoľvek počiatočné operačné definície, čo je typické pre deduktívne vedy. A on sám svoju teóriu charakterizuje nasledovne: "1. Teória v našom zmysle je sama osebe nezávislá od skúsenosti. Je to to, čo sa nazýva čisto deduktívnym systémom v tom zmysle, že iba ona môže byť použitá na výpočet možností vyplývajúcich z jej premisy 2. Na druhej strane teória zahŕňa množstvo premis, o ktorých je z predchádzajúcich skúseností známe, že spĺňajú podmienky aplikácie na určité experimentálne dáta.Tieto premisy sú najvšeobecnejšie a môžu teda spĺňať podmienky aplikácia na veľké množstvo experimentálnych údajov“ * .

* ("Prolegomena k teórii jazyka". So. "Novinka v lingvistike", zv. 1, M., 1960, s. 274-275.)

Ako je zrejmé z tohto tvrdenia, L. Hjelmslev sa snaží realizovať myšlienku duálnej metodologickej povahy objektov lingvistického výskumu s prevládajúcim dôrazom na ich deduktívne znaky. Treba mu prisúdiť aj dosť nejednoznačný spôsob („na jednej strane... ale na druhej strane...“), ktorý sa vo všeobecnosti stal charakteristickým pre posudzovanie tejto problematiky (a ktorý umožňuje obrátiť sa v oboch smeroch). Myšlienka metodickej duality lingvistiky sa nedávno rozšírila a dokonca slúžila ako teoretický základ pre formulovanie princípov a najnovšieho smeru vo vede o jazyku - lingvistika univerzálií (univerzalizmus). "Memorandum o lingvistických univerzáliách" v tejto súvislosti hovorí: "Štúdium lingvistických univerzálií vedie k celému radu empirických zovšeobecnení o lingvistickom správaní - obe si stále vyžadujú experiment a sú už zavedené. Tieto zovšeobecnenia sú potenciálnym materiálom na vytvorenie deduktívnej štruktúry vedeckého Niektoré a možno väčšina z nich má však stále len status empirických zovšeobecnení, ktoré za súčasného stavu nášho poznania nemožno korelovať so zovšeobecneniami ani deduktívne dedukovať zo zákonov všeobecnejšej platnosti“ * . Nemenej rozhodne sa vyjadruje J. Greenberg v predslove k zbierke venovanej jazykovým univerzáliám. Argumentujúc známymi slovami L. Bloomfielda, že „jediné legitímne zovšeobecnenia o jazyku sú induktívne zovšeobecnenia,“ píše: „Napriek tomu sa zdá byť všeobecne akceptované, že vedecká metóda by mala byť nielen induktívna, ale aj deduktívna. Zovšeobecnenia formulácií získané induktívnym skúmaním vedú k teoretickým hypotézam, na základe ktorých možno dedukciou vyvodiť ďalšie zovšeobecnenia. Tieto musia byť potom podrobené empirickej verifikácii“ ** .

* ("Memorandum Concerning Language Universals", "Universals of Language", vyd. od J. Greenberga, Cambridge, Mass., 1963, str. 262-263.)

** („Univerzály jazyka“, s. IX.)

Skutočnosť, že dejiny lingvistiky pozostávajú nielen z hromadenia faktov jazyka a ich klasifikácie, ale aj zo zmeny pohľadu na jazyk samotný, čo nevyhnutne znamená rozdiel v prístupoch k jazykovým faktom a dokonca aj k ich odlišná teoretická interpretácia prinútila niektorých sovietskych lingvistov tiež dospieť k záverom o metodologickej dualite ich vedy. S. K. Shaumyan však uprednostňuje hovoriť o hypoteticko-deduktívnej metóde a jej vlastnosti popisuje takto: "Hypoteticko-deduktívna metóda je cyklický postup, ktorý začína faktami a končí faktami. V tomto postupe sa rozlišujú štyri fázy:

  1. oprava skutočností, ktoré si vyžadujú vysvetlenie;
  2. predloženie hypotéz na vysvetlenie týchto skutočností;
  3. odvodzovanie z hypotéz predpovedí o skutočnostiach ležiacich mimo okruhu faktov, na vysvetlenie ktorých hypotézy boli predložené;
  4. overenie faktov, ktoré sú predpovedané hypotézami, a určenie pravdepodobnosti hypotéz.

Hypoteticko-deduktívna metóda sa zásadne líši od induktívnej metódy používanej v takých oblastiach poznania, akými sú napríklad deskriptívna botanika alebo zoológia "*. Metóda S. K. Shaumyana vlastne úplne opakuje metódu lingvistiky univerzálií od J. Greenberga. rozdiel je len v názve. Ak napríklad J. Greenberg hovorí o kombinácii induktívnych a deduktívnych metód, potom S. K. Shaumyan nazýva svoju metódu hypoteticko-deduktívnou: označenie je zjavne nekonzistentné pre metódu, ktorá „začína faktami a končí s faktami."

* (S. K. Shaumyan, Problémy teoretickej fonológie, Moskva, 1962, s. 18-19. K hypoteticko-deduktívnej metóde pozri aj článok V.S. "Problémy logiky vedeckého poznania" (M., 1964), s. 66-75 (3. časť článku).)

Otázku, kam treba pripísať lingvistiku, si kladie aj I. I. Revzin. „Zo svojej podstaty,“ odpovedá na túto otázku, „lingvistika musí v prvom rade používať induktívne metódy, opisuje špecifické rečové akty konkrétnych jazykov...

Na druhej strane prítomnosť nekonečnej množiny rečových aktov študovaných lingvistom len ťažko umožňuje formulovať základné pojmy vedy o jazyku zovšeobecnením indukciou.

Z toho vyplýva, že lingvisti potrebujú nielen induktívne, ale aj deduktívne metódy výskumu, aby získali systém všeobecných vedomostí, ktoré pomáhajú pochopiť údaje získané pri analýze konkrétnych jazykov...

Vo svojej deduktívnej časti možno lingvistiku zrejme budovať rovnakým spôsobom, ako sa buduje logika alebo matematika, a to: vyčlení sa určitý minimálny počet primárnych, nedefinovaných pojmov a všetky ostatné pojmy sa definujú prostredníctvom primárnych. Zároveň musia byť niektoré primárne tvrdenia o vzájomnom spojení týchto pojmov (axiómy) jasne formulované a všetky ostatné tvrdenia musia byť dokázané, t. j. zredukované na nejaké iné tvrdenia“ * .

* (I. I. Revzin, Modely jazyka, M., 1962, s. 7-8.)

Metóda dedukcie, stelesnená v logike a matematike, tu pôsobí len ako prostriedok usporiadania „množiny rečových aktov“ za účelom vytvorenia „systému všeobecných pojmov“. V priamom rozpore s touto úlohou je však samotná prezentácia deduktívnej metódy odporúčanej na použitie v lingvistike. Je úplne premyslený z aktov aj z faktov a na počiatočný moment budovania systému všeobecných lingvistických pojmov si vyžaduje súbor nedefinovaných a zjavne absolútne podmienených primárnych pojmov, prostredníctvom ktorých sú definované všetky nasledujúce pojmy.

Tento rozpor nie je náhodný, spočíva v samotnej podstate vied, o ktorých uvažujeme. Zdalo by sa, že záver, že kombinácia induktívnych a deduktívnych metód je prijateľná pri štúdiu lingvistických objektov, otvára dvere pre použitie logických a matematických metód v lingvistike a špecifickou realizáciou tohto záveru je vytvorenie početných formálnych- logické a matematické modely jazyka. Ako však bude zrejmé z nasledujúceho, takýto zjednodušený prístup nemôže poskytnúť uspokojivé výsledky. Môžeme súhlasiť s tým, že v lingvistickom výskume je prípustné a dokonca nevyhnutné kombinovať deduktívne a induktívne metódy. Nakoniec, ako napísal W. Bröndal, „indukcia nie je nič iné ako skrytá dedukcia a za čistými súvislosťami vytvorenými medzi pozorovanými javmi sa absolútne nevyhnutne predpokladá realita, špecifický predmet tejto vedy“ * . To však neznamená, že formálny aparát logiky a matematiky by sa mal bezpodmienečne a mechanicky prenášať do lingvistiky bez akéhokoľvek uvažovania o „špecifickom predmete tejto vedy“. Ako správne poznamenáva ten istý I. I. Revzin, „dôkazy získané deduktívnymi prostriedkami, akokoľvek sú z logického hľadiska bezúhonné, stále nehovoria nič o vlastnostiach skutočného jazyka opísaného modelom“ ** . A na určenie efektívnosti modelov odporúča obrátiť sa na prax, ktorou je strojový preklad a „iné praktické aplikácie lingvistiky“.

* (B. Bröndal, Štrukturálna lingvistika. Citované z knihy: V. A. Zvegintsev, Dejiny lingvistiky v 19. a 20. storočí. v esejach a výpisoch, časť II, Moskva, 1965, s. 95.)

** (I. I. Revzin, Modely jazyka, M., 1962, s. 10.)

A prax aplikovanej lingvistiky ukazuje, že na používanie matematických a logických metód pri skúmaní jazykových javov sú kladené veľmi prísne obmedzenia.

3

Logika poskytuje príklad najdôslednejšieho použitia deduktívnej metódy. Matematika sa v tomto ohľade do značnej miery riadi logikou, a preto ich možno posudzovať spoločne.

Logika ani matematika samozrejme nepredstavujú homogénne systémy z hľadiska ich metód a interpretácie cieľov. Takže napríklad vo vzťahu k logike môžeme hovoriť o logike dialektickej, formálnej, matematickej a v užšom zmysle o objektívnej, sémantickej, fenomenologickej, transcendentálnej, alebo konštruktívnej, kombinatorickej, mnohohodnotovej, modálnej atď. Nevyhnutne však bude potrebné myslieť na všetky takéto delenia a hovoriť len o najvšeobecnejších črtách, ktoré sú vlastné logike a matematike vo všeobecnosti, a hlavne o tých, ktoré najjasnejšie demonštrujú deduktívnu povahu metód týchto vied.

Po zaujatí tejto pozície sa preto nebudeme obracať na induktívnu logiku. Poznamenávame len, že závery v induktívnej logike nie sú určené premisami – teda nie sú tautologické. Závery v induktívnej logike sú priamo závislé od faktov a tie sú určené množstvom našich vedomostí – teda sú založené na pravdepodobnostnom základe. Pravdepodobnosť je hlavným metodologickým nástrojom induktívnej logiky.

Deduktívnu logiku najviac zastupujú formálne a matematické logiky, ktoré majú veľa spoločného. Deduktívna logika je veda, ktorá študuje ľudské myslenie alebo duševné činy z hľadiska ich štruktúry alebo formy, pričom abstrahuje od ich špecifického obsahu. Deduktívna logika sa teda snaží formulovať zákony a princípy, ktorých dodržiavanie je predpokladom dosiahnutia pravdivých výsledkov v procese získavania inferenčných poznatkov. Hlavným metodologickým nástrojom deduktívnej logiky je implikácia. Získava inferenčné znalosti bez priameho odvolania sa na skúsenosť alebo prax, iba aplikáciou zákonov logiky. V procese dedukcie premisa podmieňuje záver: ak je premisa pravdivá, potom musí byť pravdivý aj záver. Záver je teda už v premise a účelom dedukcie je ukázať, čo v latentnom stave je už obsiahnuté v premise. Z toho vyplýva, že každý záver získaný dedukciou je tautologický, teda logicky prázdny, hoci z iných hľadísk, napríklad v prípadoch, keď sa formálny logický aparát používa pre účely iných vied, môže byť novým , nečakané a originálne.

Podobná situácia nastáva v matematike – platnosť argumentov v nej spočíva výlučne na dedukcii. Navyše v matematike je spravidla prijateľné akékoľvek počiatočné hľadisko, akýkoľvek prístup k riešeniu problému - pokiaľ spĺňajú podmienky matematickej dedukcie. Matematika má bohatú množinu takých „počiatočných uhlov pohľadu“ a „prístupov“, ktoré môže výskumník alternatívne použiť na riešenie svojho problému. Matematické problémy sa často prekladajú do rôznych ekvivalentných foriem a každá z nich zahŕňa použitie rôznych oblastí matematickej teórie na vyriešenie problému. Matematik má teda prakticky neobmedzenú voľnosť vo výbere premís – vyberá si tie, ktoré z jeho pohľadu obsahujú najsľubnejšie možnosti na najjednoduchšie, najnebanálnejšie a najelegantnejšie riešenie problému. Jeho talent a skúsenosti sa prejavujú práve v úspešnom výbere predpokladov, tých „povedzme, že ...“ alebo „ak ... tak“, ktoré sú plné matematických prác. Rovnako ako v logike, matematické premisy - axiómy alebo postuláty - určujú definície ešte nedefinovaných jednotiek.

Sloboda výberu premís v matematike je priamo úmerná tomu, že pracuje s nehmotnými jednotkami, resp. predmetmi – jej pozornosť je upriamená na vzťahy medzi nimi. Matematické objekty slúžia ako symboly vyjadrujúce štruktúru čistých vzťahov. Matematický systém možno teda považovať za súbor formálnych vzťahov, ktoré existujú iba na základe vyjadrení týchto vzťahov. Samozrejme, najmä na aplikované účely môžu mať vyhlásenia o vzťahoch tendenciu stelesňovať korešpondenciu s vonkajšou realitou, ale samotné vyhlásenia o vzťahoch to nijako neovplyvňuje – skôr naopak. Matematici neskúmajú „pravdivosť“ svojich axióm, hoci vyžadujú vzájomnú dohodu medzi nimi. Výskum v rámci matematického systému je výskum a vytváranie súvislostí, ktoré umožňujú dokázať, že skutočnosť teórie A implikuje skutočnosť teórie B. Hlavnou otázkou v matematike preto nie je „čo sú A a B?“, ale "Predpokladá A (alebo určuje) B?".

Úplne iná situácia v lingvistike. Zameriava sa hlavne na prvú z týchto otázok, a to jej nedáva príležitosť odtrhnúť sa od reality; preto neoperuje s abstraktmi, ale s konkrétnymi jednotkami, aj keď v mnohých prípadoch inklinuje k vytváraniu abstraktných objektov, ako je koncept fonémy alebo morfémy. Táto situácia je charakteristická nielen pre tradičnú lingvistiku, ale je rovnako charakteristická pre jej najnovšie trendy, spojené pod hlavičkou štrukturalizmu. Vyššie už bolo citovaných množstvo tvrdení, ktoré sa pri pokuse o využitie nielen induktívnych, ale aj deduktívnych metód (resp. matematicko-logických metód) vo vede o jazyku nevyhli potrebe odvolávať sa na skutočný jazykový fakt. Okrem nich možno uviesť ešte jednu vec, ktorá vnáša do uvažovanej problematiky úplnú jasnosť: „Lingvistická analýza,“ píše v tejto súvislosti P. Garvin, „je v podstate induktívny proces v tom zmysle, že sa snaží vytvoriť zoznam prvkov alebo súbor tvrdení, vychádzajúci z jazykových podnetov informátorov alebo zo štúdia textu. Vychádza sa z predpokladu, že v oboch týchto zdrojoch informácií bude možné rozpoznať pravidelne sa vyskytujúce prvky rôzne typy a rády zložitosti. Klasifikácia týchto typov a vyhlásenie o podmienkach ich distribúcie, získané ako výsledok analýzy, tvoria induktívny popisný jazyk“ * .

* (P. Garvin, A Study of Inductive Method in Syntax, "Word", zv. 18 (1962), str. 107,)

V lingvistike sa samozrejme dá použiť aj metóda predpokladov, na základe ktorých sa potom určujú konkrétne predmety, fakty alebo jednotky jazyka. Ale tu sa stretávame s dvoma funkciami, ktoré výrazne upravujú používanie tejto metódy. Na rozdiel od logiky a matematiky sa v tomto prípade bude hľadať „pravdivosť“ takto získaných definícií, teda ich zhoda s experimentálnymi údajmi. Takto je stanovená vzájomná závislosť premisy a inferenčného poznania: premisa určuje záver (definíciu konkrétneho jazykového objektu z hľadiska premisy), ale ak záver nezodpovedá údajom skúsenosti, potom samotná premisa je potrebné opraviť. Takéto úpravy predpokladu však nemajú nič spoločné s preložiteľnosťou do ekvivalentných foriem, ktorá, ako už bolo uvedené, je v matematike prípustná, pretože nie je určená formálnymi úvahami, ale skúsenosťami. Všetko, čo bolo uvedené vyššie, dáva dôvod na záver, že samotný pojem predpoklad a sloboda jeho výberu má v lingvistickej analýze špecifickosť, ktorú nemožno ignorovať pri použití deduktívnej metódy v lingvistike.

Lingvisti nemôžu používať metódu „keby“ alebo „poďme“ s takou voľnosťou ako matematici. Ich sloboda priestorov je veľmi prísne obmedzená. Dejiny vedy o jazyku poznajú mnohé zmeny v „uhloch pohľadu“, alebo, inak povedané, vo východiskových premisách, ktoré boli vyvolané objavením nových faktov, šírením všeobecných vedeckých myšlienok do lingvistiky, či dokonca formovanie originálnych teórií. Ale pre lingvistu je vo všetkých takýchto prípadoch zmena „ak“ alebo počiatočná premisa zmenou celého vedeckého konceptu. Preto lingvista nehovorí „ak“, ale postuluje svoje chápanie premisy, teda vlastne chápanie predmetu svojho skúmania, a na základe tohto chápania podáva definíciu súkromných jednotiek jazyka. overujúc „pravdivosť“ týchto definícií s údajmi zo skúseností. Posledná okolnosť v dôsledku vzájomnej závislosti premisy a záveru v lingvistike slúži ako prostriedok na overenie oprávnenosti samotnej premisy, ktorá stojí na začiatku lingvistickej analýzy deduktívnej formy. Ak teda prejdeme na konkrétne príklady, v minulosti bol jazyk interpretovaný ako prirodzený organizmus (Schleicher), ako individuálna psychofyziologická aktivita (neogramaristmi) atď. Výskumná prax založená na týchto pojmoch ukázala ich nedostatočnosť. Dnes je počiatočným predpokladom lingvistickej analýzy postulát, že jazyk je systém znakov*. Podlieha rovnakej skúške skúseností a praxe ako ktorýkoľvek iný koncept vo vede o jazyku.

* (Pozri: Paul Garvin, Definičný model jazyka. In: "Prirodzený jazyk a počítač", ed. od P. L. Garvina, New York, 1964.)

Už tieto predbežné a najvšeobecnejšie úvahy ukazujú, že deduktívne metódy nie sú v lingvistike v žiadnom prípade kontraindikované, ale ich aplikácia si vyžaduje splnenie špecifických podmienok. Práve tieto špecifické podmienky kladú určité obmedzenia na mechanický prenos metód logiky a matematiky do oblasti lingvistiky. Ak sa však obmedzíme na takéto všeobecné tvrdenie, veľa zostáva nejasných. Preto je potrebné prehĺbiť problematiku, o ktorej uvažujeme, a v záujme posilnenia prípadných záverov sa obrátiť na prax aplikovanej lingvistiky, kde je opodstatnenosť predpokladov a súlad s experimentálnymi údajmi záverov urobených na ich základe sa prejavujú najzreteľnejšie.

4

Vzťah medzi jazykom a logikou je veľmi zvláštny. Zástupcovia empirických vied, medzi ktoré patrí lingvistika, študujú konkrétny objekt alebo jav, aby ho opísali alebo vysvetlili. Svoje výsledky formulujú v jazyku nazývanom objektový jazyk. Logik ovláda dôkazy, závery, úsudky atď., ale sú mu dostupné len v jazykovej forme. Ukazuje sa teda, že logik je o krok ďalej od reálneho sveta ako predstavitelia empirických vied. Jeho analýza nie je zameraná priamo na skutočný objekt skúmaný empirickými vedami, ale na ich jazyk*. Inými slovami, skúma jazyk a získané výsledky formuluje v jazyku, ktorý sa nazýva metajazyk.

* („Logická analýza vedeckých poznatkov,“ píšu v tejto súvislosti P. V. Tavanets a V. S. Shvyrev, „je predovšetkým a priamo analýzou jazyka, v ktorom sú tieto poznatky vyjadrené.“ Pozri článok „Logika vedeckého poznania“ v sob. "Problémy logiky vedeckého poznania", M., 1964, s. 161)

Z logického hľadiska základnou jednotkou jazyka nie je znak a nie ním označený predmet, ale veta, keďže len v nej sa môže odvíjať logický proces. Preto iba veta môže byť pravdivá alebo nepravdivá. A slová samé o sebe nemôžu mať tieto vlastnosti. Ale predtým, ako zistíme, či je veta pravdivá alebo nie, musíme povedať, že má význam.

Pojmy pravda a význam patria do oblasti sémantiky. Prostredníctvom týchto vzťahov sa určuje pravdivosť alebo nepravdivosť vety: ak veta opisuje predmety správne, je pravdivá a ak je nesprávna, nie je. Ale jazykové výrazy môžu vstúpiť do iných vzťahov, než aké existujú medzi objektmi, ktoré označujú. Okrem toho môžu ponuky vstúpiť do vzťahov s inými ponukami. Úlohou logika je zistiť povahu vzťahu medzi jazykovými výrazmi a vetami a stanoviť pravidlá na určenie, či sa postup predpísaný v danom prípade dodrží alebo nie. Pri riešení poslednej otázky sa logik neodvoláva na predmety opísané vetou. Zaujíma ho jazyková forma, nie jej obsah, čo, samozrejme, nebráni jej zmysluplnej interpretácii, ktorej výsledkom je formalizovaný jazyk. Formalizovaný jazyk môže byť reprezentovaný ako abstraktný systém, ako je napríklad predikátový počet.

Logik teda môže v závislosti od cieľov štúdie pracovať na dvoch úrovniach - syntaktickej (logická syntax) a sémantickej (logická sémantika). Najprv zvážte aplikáciu prvej z týchto úrovní na prirodzený jazyk.

Ak logik, ktorý sa zaoberá štúdiom jazykových foriem a vzťahov medzi nimi, môže zostať na syntaktickej úrovni a pracovať s pojmami, ktoré nie sú zmysluplné, potom to lingvista nemôže urobiť. Všetky úrovne prirodzeného jazyka (snáď s výnimkou fonematickej) sú zmysluplné, a teda mimo sémantiky nemysliteľné. Prirodzený jazyk navyše neexistuje mimo pragmatiky, ktorá sa od nej nedá ľahko odtrhnúť z jednoduchého dôvodu, že v rečovom akte sa neustále transpoluje do sémantiky. Prirodzený jazyk je preto vždy výkladom a navyše dvojstupňovým, keďže je spojený so sémantikou aj pragmatikou * . A tento výklad sa zatiaľ nehodí na žiadnu formalizáciu.

* (St Poznámky Nielsa Bohra o matematickom jazyku, kde „jednoznačnosť definícií potrebných na objektívny popis sa dosahuje používaním matematických symbolov práve preto, že sa týmto spôsobom vyhýbajú odkazom na vedomý subjekt, ktoré prenikajú každodenným jazykom“ (Nieles Bohr, Atomic Physics and Human Kognícia, M., 1961, s. 96).)

Prejdime teraz na druhú úroveň, keď sa kalkulu pripisuje interpretácia pomocou sémantických pravidiel. A v tomto prípade získame vzdelanie, ktoré nie je v žiadnom prípade porovnateľné s prirodzeným jazykom. Pravda, tu máme do činenia so zmysluplnými pojmami, ale v logickom a prirodzenom jazyku budujú svoj vzťah k „pravde“ na úplne iných základoch. Ako píše A. Tarsky, „pravda“, „v každom prípade vo svojom klasickom výklade“, je taká, že sa „zhoduje so skutočnosťou“ * . Ale toto kritérium „pravdy“ sa v skutočnosti vzťahuje len na prirodzené jazyky, ktoré sú vždy orientované na realitu. Iná situácia je v logickej sémantike. Sémantická analýza sa spolieha iba na logickú interpretáciu systému a zahŕňa stanovenie určitých pravidiel, ktoré formulujú pravdivostné podmienky. Predpisuje dôsledok týchto pravidiel bez toho, aby odpovedal na otázku, do akej miery sa tu odohráva „zhoda s realitou“. Okrem toho samotné zameranie sa na realitu sa uskutočňuje v prirodzenom jazyku nie priamo, ale prostredníctvom človeka, čo opäť vedie k nutnosti obrátiť sa na tretiu rovinu – pragmatickú. „Prechod do sémantickej roviny,“ uvádzajú P. V. Tavanets a V. S. Shvyrev, „nie je sám osebe návratom k živému jazyku v jeho konkrétnosti, ako by sa na prvý pohľad mohlo zdať, vzhľadom na podstatu jazyka ako „bezprostredného realitou myslenia.“ Pôvodná schéma sémantiky „jazyk-realita“ v skutočnosti ešte neposkytuje konkrétny obraz jazyka ako bezprostrednej reality myslenia, a to z jednoduchého dôvodu, že jazyk nie je spojený s realitou sám osebe v nejakom mystickom spôsobom, ale prostredníctvom človeka, jeho konaním, jeho správaním. Preto v skutočnosti konkrétnu predstavu o jazyku ako nositeľa myslenia možno dosiahnuť len na úrovni jeho pragmatickej analýzy podľa schémy „jazyk – človek akcie s jazykom a na základe jazyka – realita“ **.

* (A. Tarski, Grundlegung der Wissenschaftlichen Semantik. "Actes du Congres International de Philosophie Scientique", 1936.)

* (Pozri článok „Logika vedeckého poznania“ v sob. „Problémy logiky vedeckého poznania“ (M., 1964, s. 16).)

Ale to nie je všetko. O posudzovanej problematike V. M. Glushkov píše: „Živý ľudský jazyk možno považovať za formálny jazyk až po sformulovaní prísneho systému pravidiel, ktorý umožňuje odlíšiť výrazy, ktoré sú v jazyku prípustné, od všetkých ostatných výrazov. teda zmysluplné vety z nezmyselných " * . Pri vysvetľovaní ťažkostí, ktoré vznikajú pri formalizácii prirodzeného jazyka, ďalej poukazuje na to, že "žiadny ustálený formalizovaný jazyk nemôže byť adekvátny živému ľudskému jazyku, keďže ten sa na rozdiel od prvého neustále vyvíja a zdokonaľuje. Preto akákoľvek formalizácia z akéhokoľvek živého ľudského jazyka je len jeho viac či menej úspešný okamžitý odliatok, ktorý stráca svoju podobnosť s originálom, keď sa ten druhý vyvíja“ ** . Ak by sa to všetko zredukovalo len na toto, potom by to bola polovica problémov. Aplikovaná lingvistika vychádza z momentov vývoja jazyka, má tendenciu ho považovať za úplne stabilný systém, a predsa nie je možné dosiahnuť formalizáciu prirodzeného jazyka. Deje sa to z veľmi jednoduchého dôvodu. Formálny systém a prirodzený jazyk zakladajú svoju účinnosť na opačných kvalitách. Akýkoľvek formálny systém je vždy identický sám so sebou. Práve táto vlastnosť mu umožňuje vykonávať svoje funkcie vo všetkých špecifických prípadoch jeho aplikácie. A prirodzený jazyk – pokiaľ ide o jeho obsah, jeho sémantiku alebo, ako sa v týchto prípadoch zvykne hovoriť, v informatívnom zmysle – nie je nikdy totožný sám so sebou. Práve táto schopnosť umožňuje fungovať vo všetkých špecifických prípadoch jej aplikácie. Keďže jazyk zostáva rovnaký, v rôznych situáciách je vždy iný. Zároveň nemá ani výslovné, ani formatívne pravidlá, ani pravidlá „pravdy“, ani transformačné pravidlá na určenie, ktorý z potenciálnych významov či odtieňov významov dané slovo v danej situácii dostane. Navyše, takmer každé slovo prirodzeného jazyka môže nadobudnúť význam, ktorý nie je ustálený v žiadnom jazyku – môže sa po vzniku zafixovať v jazyku, ale s rovnakým úspechom, ako rýchly plameň, vzplanúť, stratiť sa v ňom. jazykový „priestor“ a vyjdite von. A so všetkými týmito vlastnosťami sa prirodzený jazyk ukazuje ako úžasne dokonalý nástroj, ktorý vám umožní dosiahnuť úplné vzájomné porozumenie, pokiaľ ide o najzložitejšie pojmy, a to v akejkoľvek situácii. Prečo sa to deje?

* (V. M. Glushkov, Myslenie a kybernetika, "Problémy filozofie", 1963, č. 1, s. 37-38.)

** (V. M. Glushkov, Myslenie a kybernetika, "Problémy filozofie", 1963, č.1, s.38.)

Odpoveď na túto otázku treba zrejme čiastočne hľadať v jednej myšlienke zakladateľa semiotiky Ch.Piercea, ktorú vytrvalo opakuje v mnohých svojich dielach. Dá sa to interpretovať takto. V modernej lingvistike sa jazyk zvyčajne definuje ako systém znakov. Toto je základný predpoklad pre všetky lingvistické analýzy. Ak je to tak, potom jazyk nie je len systém znakov, ale systém vzájomne sa interpretujúcich znakov, ktoré existujú v jazyku, pokiaľ sú interpretované v iných znakoch. C. Pierce to formuluje takto: "Žiadny znak nemôže fungovať ako znak, ak nie je interpretovaný v inom znaku. Preto je pre znak absolútne nevyhnutné, aby pôsobil na iný znak" * . A inde: „Celým účelom znamenia je, že sa bude vykladať v inom znamení“ ** . A možno to najdôležitejšie: "Znak nie je znakom, pokiaľ sa nepreloží do iného znaku, v ktorom dostane úplnejší vývoj" ***.

* (Ch. Peirce, Collected Papers, Cambridge, Mass., zv. osem, §. 225.)

** (Tamže, §. 191.)

*** (Ch. Peirce, Collected Papers, Cambridge, Mass., zv. 5, § 594.)

Prirodzený jazyk je teda sústavou znakov, ktoré vzájomnou interpretáciou dokážu v sémantickom vyjadrení reagovať na všetky ľudské potreby. Tu je však potrebné jedno dôležité upozornenie. Koniec koncov, všetky potreby tohto druhu sú určené postojom človeka k javom vonkajšieho sveta a sociálnemu prostrediu, v ktorom sa jeho život odohráva. Vzhľadom na túto okolnosť nemôže byť transformačná sémantika, ak by mohla byť vytvorená, založená len na pravidlách vzájomnej interpretácie znakov, byť uzavretej a konečnej povahy. Ukazuje sa, že ide o derivát veľmi veľkého počtu veličín, ktoré sa všetkými možnými spôsobmi stavajú proti formalizácii *.

* (P. Jacobson v tejto súvislosti uvádza: „Čisto lingvistickú sémantiku môžeme vybudovať, ak prijmeme Peirceov postoj, že podstatnou črtou každého jazykového znaku je, že ho možno preložiť iným jazykovým znakom, rozvinutejším, explicitnejším, resp. naopak, elipsovitejší znak toho istého alebo iného jazykového systému. Práve vďaka tejto preložiteľnosti sa odhaľujú sémantické invarianty, ktoré hľadáme v signifikátore. Získavame tak možnosť riešiť aj sémantické problémy jazyka. pomocou distributívnej analýzy“ (príhovor na 1. medzinárodnom sympóziu „Sign in the system of language“, Erfurt, NDR, 1959). Citované z knihy: V. A. Zvegintsev, Dejiny lingvistiky XIX - XX storočia v esejach a úryvkoch, časť 2, M., 1965, s. 398.

V súvislosti s vyššie uvedeným je dôležité zvážiť črty postupu pri riešení problémov a samotný pojem determinácie v logike a matematike na jednej strane a v lingvistike na strane druhej.

Pred vyriešením problému v matematike je potrebné ho presne sformulovať – práve táto formulácia je predpokladom úspešného riešenia problému. V tomto prípade, ako už bolo spomenuté, matematik môže danú formuláciu úlohy ľubovoľne pretransformovať do ekvivalentnej verzie – matematika má na to vhodné prostriedky. Už v tomto primárnom štádiu metodológie výskumu sa lingvistika výrazne líši od matematiky. Pri formulovaní svojich problémov má lingvista k dispozícii určité množstvo odpozorovaných empirických údajov, ktorým nie vždy môže dať presnú formuláciu, ale ktoré chtiac-nechtiac musí, chtiac-nechtiac, urobiť základom svojho výskumu, už v samotnom procese tohto výskumu. Aby sme nezachádzali ďaleko za príklady, môžeme sa odvolať na lingvistický význam, ktorý tvorí základ všetkých prác v oblasti automatického spracovania rečových informácií, no zároveň je definovaný veľmi vágne a protirečivo. Práve táto okolnosť núti výskumníkov v tejto oblasti neustále meniť svoju stratégiu.

Teraz sa však výskum začal a dosiahlo sa nejaké riešenie. Čo to znamená vo vzťahu k logike a matematike a vo vzťahu k lingvistike? Logika, ako je uvedené vyššie, umožňuje explicitne vyjadriť závery implicitne prítomné v premise, ale nemá pravidlá, ktorých použitie môže zaručiť, že sa dosiahne požadované riešenie, pretože nejde o prostriedok na dosiahnutie nového. závery, ale len technika.určenie ich správnosti. Nie je magickým kľúčom ku všetkým záhadám. Je celkom zrejmé, že ak by logika mala takéto pravidlá, neexistovali by žiadne nevyriešené problémy. Stačilo by uplatniť istý súbor logických pravidiel a na akúkoľvek otázku, ktorá nás trápi, by sme automaticky dostali pohotovú odpoveď. Vo svetle povedaného nadobúda špecifický význam aj pojem určenie problému alebo úlohy.

V logike a matematike sa každý konečný výsledok považuje za pravdivý, ak v procese dokazovania nebolo porušené žiadne formálne pravidlo. Keďže v tomto prípade sú možné rôzne spôsoby dokazovania, existencia rôznych riešení je prípustná. Ale všetky môžu byť predmetom overovania z hľadiska požiadavky logiky alebo matematiky. Iná situácia je v lingvistike. Nedisponuje aparátom, ktorým by overovala alebo dokazovala správnosť vyvodených záverov. V súlade s tým je tiež určená pravdivosť prijatých rozhodnutí - nie je stanovená formálnymi pravidlami, ale jej zhodou s údajmi o skúsenostiach. Za týchto podmienok by sa teoreticky dalo očakávať jediné konečné riešenie. V praxi to však tak nie je, ako svedčia protichodné lingvistické definície aj hlavných kategórií jazyka. Istá subjektivita hodnotení je v tomto prípade vždy prítomná a do určitej miery je determinovaná množstvom faktov (a samozrejme ich povahou), ktorými výskumník disponuje. Z toho vyplýva, že „pravdivosť“ riešenia v lingvistike je vždy daná v nejakej aproximácii a nie je deterministická, ale pravdepodobnostná.

Za týchto podmienok je veľmi dôležité testovať správnosť jazykových definícií a interpretácií na základe objektívnych kritérií. Možnosť takéhoto overenia poskytuje široká oblasť aplikovanej lingvistiky, kde proti prirodzenému jazyku stojí stroj, ktorý v tejto opozícii zastupuje záujmy logiky a matematiky.

5

Digitálny počítač sa používa na riešenie praktických problémov aplikovanej lingvistiky. Je schopný vnímať, uchovávať, prenášať, preskupovať a vydávať informácie. Interpretuje a vykonáva súbor príkazov (príkazový program) a tiež ich upravuje v procese vykonávania úlohy. Je schopný riešiť veľmi zložité problémy, ale celý proces prechodu od úlohy k riešeniu musí byť vyčerpávajúco a dôsledne opísaný z hľadiska postupnosti základných elementárnych operácií. Informácie sa do stroja zadávajú pomocou dvojmiestneho (binárneho) kódu alebo jazyka. Stroj pracuje s takto zakódovanými slovami zodpovedajúcimi základným logickým väzbám alebo funkciám výrokového alebo predikátového počtu. Stroj môže riešiť zložité matematické problémy práve preto, že je možné zredukovať zložité matematické operácie na postupnosť aritmetických operácií a tieto zase na logické operácie. Preto možno digitálny počítač považovať za logický stroj.

Či už je zložitosť úlohy akákoľvek, stroj ju rieši pomocou sledu elementárnych operácií, ktorých program musí byť formulovaný absolútne jednoznačne (dôsledne), presne, podrobne a vyčerpávajúco. Inými slovami, nemalo by ísť za hranice stanovené logickým výrokovým kalkulom, a keď si položíme otázku, či si stroj dokáže poradiť so spracovaním informácií obsiahnutých v prirodzených jazykoch, musíme najprv zistiť, do akej miery je logický výrok kalkul je adekvátnym modelom pre prirodzený jazyk.

Vzhľadom na špecifiká digitálneho počítača opísaného vyššie, prvá vec, ktorú treba urobiť, aby stroj „pochopil“ úlohu a začal spracovávať rečové informácie v súlade s touto úlohou, je preformulovať informácie obsiahnuté v prirodzenom jazyku do logického jazyka. Ide teda o preklad prirodzeného jazyka do jazyka logického výrokového počtu. Zároveň, ako ukázal Bar-Hillel, treba čeliť takým ťažkostiam, ktoré vykresľujú vyhliadky na automatické spracovanie vo veľmi pochmúrnom svetle, pokiaľ sa nezmení celý smer hľadania riešenia tohto problému. Minimálne budeme musieť rátať s nasledujúcimi prekážkami, na zdolávanie ktorých zatiaľ nemáme potrebné prostriedky.

* (Y. Bar-Hillel, Ukážka nerealizovateľnosti plne automatického prekladu vysokej kvality, "Advances in Computers:", zv. 1, New York, 1960, str. 158-163.)

Odpoveď: Logický výrokový kalkul je príliš slabý na to, aby bol schopný aj pri vzdialenej aproximácii preformulovať prirodzený jazyk, ktorý je neuveriteľne zložitý vo svojej sémantickej štruktúre, má obrovské množstvo nadbytočných prvkov a čo je najdôležitejšie, často sa vyznačuje takouto vágnosťou. a neurčitosť vo vyjadrovaní.„význam“, že žiadna dvojhodnotová logika si neporadí s vytvorením umelého protipólu prirodzeného jazyka * . Pravda, logika, ako bolo zdôraznené, sa zaoberá iba jazykovou formou. Ale keďže ide o automatické spracovanie informácií, je potrebné vedieť rozlišovať medzi sémantickými informáciami, a ak to nemožno dosiahnuť pomocou logických prostriedkov, ktoré máme k dispozícii, ako potom môžeme získať istotu, že náš preklad prirodzeného jazyka? do logiky je správne?

* (V článku Ch. Hocketta „Gramatika pre poslucháča“ je uvedených veľa príkladov takýchto ťažkostí v „prirodzenom“ chápaní vety, ktoré sa riešia následnými a ďalekosiahlymi krokmi analýzy (Ch, Hockett, Grammar for the Hearer, „Structure jazyka a jeho matematických aspektov“, Providence, 1961, s. 220-236).)

B. Automat nemôže brať do úvahy to, čo Bar-Hillel nazýva „všeobecné pozadie informácií“, ktoré v skutočnosti zostáva mimo hraníc prirodzeného jazyka, a preto ho nemožno preložiť do logického jazyka. Lingvisti v týchto prípadoch hovoria o extra lingvistickom kontexte (referenčnom rámci), ktorý pre nás nenápadne, no veľmi rozhodujúcim spôsobom koriguje alebo dokonca úplne prehodnocuje všetky naše slová. Koniec koncov, aj taká jednoduchá fráza ako „Vrátim sa pred zotmením“ si vyžaduje prinajmenšom predchádzajúce znalosti o tom, kedy, kde bola vyslovená a v akom ročnom období, aby ste jej presne porozumeli a určili časový údaj v nej obsiahnutý. . Len predbežné informácie tohto druhu sú často jediným prostriedkom na objasnenie tých vnútrofrázových vzťahov, s ktorými si nevie poradiť ani výrokový kalkul, ani predikátový kalkul. Vezmime si napríklad dve vety, ktoré blikali v novinách:

Postgraduálny študent univerzity z mesta Kursk;

Ctihodný inovátor Sibíri, -

vidíme, že každý z nich možno interpretovať dvoma spôsobmi. Ak sa budeme držať len formálnych gramatických znakov, tak prvú vetu možno rovnako dobre chápať ako „Absolvent univerzity so sídlom v meste Kursk“ a ako „Absolvent vysokej školy žijúci v meste Kursk (resp. pôvodom z mesta Kursk). A druhú vetu možno interpretovať ako „Ctený inovátor, ktorého oblasťou činnosti je Sibír“ a ako „Ctený inovátor, ktorý je obyvateľom Sibíri“. A len predbežný poznatok (predbežná informácia), ktorý nie je nijako vyjadrený v návrhoch, o tom, že v meste Kursk nie je žiadna univerzita a že „ctený inovátor“ je čestný titul udeľovaný v Sovietskom zväze jednotlivými správnymi obvodmi, umožňuje správne pochopiť tieto návrhy. Ak sa pozriete pozorne, potom takmer každá fráza hovoreného jazyka je veľmi solídnou a rozvetvenou predbežnou informáciou, ktorá je pre človeka samozrejmá, ale presahuje „pochopenie“ stroja, ktorý nepozná ani klan, ani kmeň.

B. Automat nedokáže robiť intertextuálne sémantické závery, ktoré sa tiahnu cez niekoľko viet (a niekedy dokonca zámerne pre celý príbeh, aby úplne neodhalil jeho charakter alebo dejový ťah). Na túto okolnosť upozornil holandský lingvista A. Reichling, ktorý svoju myšlienku ilustroval na nasledujúcom príklade. Predpokladajme, že čítame príbeh, ktorý sa začína vetou „Hrám sa s bratom“. Ak sa tam zastavíme, nebudeme mať k dispozícii žiadne údaje, ktoré by objasnili, ako treba túto frázu chápať, o akej hre tu hovoríme. Koniec koncov, môžete hrať o peniaze (karty atď.), na hudobnom nástroji, v divadle alebo kine, s hračkami, futbalom, hrať pre zábavu, hrať sa s človekom a jeho osudom atď. Ale tu čítame ďalej : "Povedal som to, keď ma Wilhelm jedného dňa stretol v bare." Teraz môžeme s väčšou pravdepodobnosťou dospieť k záveru, že zjavne hovoríme o hre o peniaze. Ale stále existujú ďalšie možnosti. Nasleduje: "Môj brat prišiel k stolu a kocky boli hodené." Teraz je jasné, o ktorú hru ide, hoci nikde v texte nie je uvedený presný význam slova „hra“. Uhádli sme o ňom podľa súhrnu tých vonkajších znakov, ktoré sú v texte uvedené v rôznych vetách. Tieto znaky tu nasledujú za sebou, no v napísanom rozprávaní sa dajú od seba výrazne oddeliť. Človek si ich môže vybrať zo širokého lingvistického kontextu (v tomto prípade sa ním zaoberáme), porovnať a následne urobiť vhodný záver. Stroj je o túto možnosť zbavený.

* (Na kolokviu, ktoré v roku 1961 zorganizovalo Stichting Studiecentrum voor Administration Automatisering. K dispozícii je aj nemecký preklad správy: A. Reichling, Moglichkeiten und Grenzen der mechanischen Ubersetzung, aus der Sicht des Linguisten, „Beitrage zur Sprachkunde und Informationsverarbeitung“, Heft 1, Wifcn, 1963.)

Ale možno to nepotrebuje? Skutočne, pri strojovom preklade týchto viet do nemčiny alebo francúzštiny neexistujú žiadne zvláštne ťažkosti (samozrejme, ťažkosti nastanú pri preklade iných viet). Pri preklade do nemčiny môžeme použiť doslovnosť: Ich spile mit meinem Bruder. Tak isto vo francúzštine môžeme začať: Je joue avec... Už pri preklade do angličtiny vznikajú ťažkosti s gramatickým poradím, keďže v uvedenom texte nie je naznačené, akú formu má stroj zvoliť: 1. I hrám sa s bratom, 2. Hrám sa s bratom alebo 3. Budem sa hrať s bratom? A pri preklade do španielčiny je to naozaj zlé, pretože stroj si bude musieť vybrať aspoň medzi tromi slovesami: jugar, tocar alebo trabajar.

Tu je logický jazyk bezmocný.

D. Automat sa vlastne zaoberá rečou (alebo presnejšie povedané rečovými segmentmi) – v jej písomnej a ústnej forme. Každá z týchto foriem reči má svoj vlastný systém pragmatických prvkov, ktoré sú tiež schopné transformovať sa na sémantické (a pravidlá takéhoto prechodu neboli študované a sú do značnej miery ľubovoľné). Takže napríklad ústna reč má takú suprasegmentálnu nadstavbu ako intonácia. Teraz je možné klasifikovať intonáciu podľa funkčných typov a rozlišovať intonácie opytovacie, naratívne a iné. Je však absolútne nesporné, že intonácia neexistuje nezávisle od viet; určite interaguje s významom v nich obsiahnutým. Na podporu tohto tvrdenia stačí poukázať na rečnícku otázku, ktorá je otázkou len svojou vonkajšou štruktúrou, ale nie je otázkou vo význame: nevyžaduje odpoveď od poslucháčov. Vzniká tak nový druh ťažkostí, s ktorými si logický jazyk nevie poradiť.

E. Spôsob automatického spracovania rečových informácií (a najmä strojového prekladu) je založený na predpoklade, že každá veta a jazyk ako celok sa „rozloží“ na určitý počet elementárnych sémantických jednotiek (slov). , z ktorého potom možno podľa určitých pravidiel „zbierať“ dané vety. Dôsledkom tohto predpokladu je ďalší, podľa ktorého je význam vety aritmetickým súčtom významov slov, z ktorých pozostáva. Matematika sa tu berie ako model, kde sú tie najzložitejšie operácie, ktoré počítač vykonáva, v konečnom dôsledku zredukované na extrémne elementárne. Ale v jazyku sa stretávame s takmer úplne opačným obrazom. Nejde len o to, že v rôznych jazykoch sú vety sémanticky "chápané" na časti rôznymi spôsobmi. Napríklad:

Dievča kráča. Dievča stojí. Klobúk dievčaťu pristane. Das Madchen geht. Das Madchen steht. Der Hut steht dem Madchen(doslova: Klobúk stojí za dievča).

Ide tiež o to, že ani v rámci toho istého jazyka najčastejšie neexistuje aritmeticky správny vzťah medzi významom vety a významom (významom) slov, z ktorých pozostáva. E. Benveniste pri tejto príležitosti píše: "Veta sa realizuje prostredníctvom slov. Ale slová nie sú len segmenty vety. Veta je celok, ktorý sa nedá redukovať na súčet jej častí, význam inherentný celku je distribuovaný na celú sadu komponentov" *. Reč nie je o idiomatických výrazoch (ako: „nedbalo robiť“, „drieť niekomu okuliare“ atď.), ale o najbežnejších vetách. Vezmime si elementárny príklad:

Počkaj! - Idem do divadla.

Dá sa tvrdiť, že význam tejto vety je aritmetickým súčtom významov slov: počkaj, choď, divadlo, ja, v? Na základe takéhoto aritmetického znázornenia by sme mali očakávať, že akákoľvek kombinácia týchto slov, prezentovaná v gramaticky správnej vete, si zachová rovnaký význam - koniec koncov, súčet pojmov sa nemení preskupením miesta pojmov. . Skúsme však tento návrh mierne upraviť:

Idem do divadla - počkajte!

Vidíme, že vo svojom význame sa táto druhá veta výrazne líši od prvej.

* (E. Benveniste, Les niveaux de G Analysis linguistique, "Preprinty referátov pre 9. medzinárodný kongres lingvistov", Cambridge, Mass., 1962, s. 497)

Toto je jeden z najelementárnejších príkladov, a ak sa obrátime na zložitejšie, potom je obzvlášť zjavná impotencia akýchkoľvek transformačných pravidiel, ktoré by mali podliehať takýmto prípadom. Nemôže to byť inak: veta je napokon sled monosém a monoséma (pozri časť „Systém sémantického výskumu“) ako syntaktická konfigurácia je viac ako slovo. Táto okolnosť vedie k tomu, že veta ako postupnosť monosém je postupnosťou vzájomne určených prvkov, ktoré sú navzájom sémantickým vzťahom spojené do nerozlučiteľného reťazca, ktorý môže byť schematicky a vo vysoko zovšeobecnenej podobe nasledovný * :

* (Pozri „Príloha“ na konci knihy.)

Práve pre tieto vlastnosti viet je kvalitatívny rozdiel medzi posledným a slovami. Ak možno slová definovať ako znaky, potom vety nepochybne presahujú úroveň znakov.

Otázka „rozložiteľnosti“ jazyka a viet spočíva na všeobecnejšej otázke. Existujú štruktúry schopné vykonávať svoje funkcie iba v komplexnom zložení. Keď sa ich pokúsite rozložiť na menšie časti alebo ich zredukovať na elementárnejšie štruktúry, v skutočnosti sa rozpadnú, prestanú existovať ako také, stratia vlastnosti obsiahnuté v ich komplexnom zložení. Taký je jazyk. Pochopil to W. Humboldt (pristupuje však k tejto problematike trochu z iného uhla), keď napísal: „Aby človek pochopil aspoň jedno jediné slovo, nielen ako duchovný impulz (t.j. reflexívne. - V. . Z.), ale ako artikulovaný zvuk označujúci pojem musí byť v ňom už zakotvený celý jazyk a vo všetkých jeho súvislostiach. V jazyku nie je nič singulárne, každý z jeho jednotlivých prvkov sa prejavuje len ako súčasť celku. "*. Preložením tohto úsudku W. Humboldta do jazyka modernej vedy dostaneme nasledujúcu formuláciu patriacu M. Taubemu: „...je ľahké pochopiť, že jazyk ako systém zmysluplných symbolov, ústnych alebo písaných, nie je formálny systém a nedá sa naň zredukovať bez toho, aby sa zničila jeho skutočná podstata... Keď sa jazyk formalizuje, prestáva byť jazykom a stáva sa kódom“ ** .

* (W. Humboldt, O porovnávacom štúdiu jazykov vo vzťahu k rôznym epochám ich vývoja. Citované z knihy: V. A. Zvegintsev, Dejiny lingvistiky XIX - XX storočia v esejach a úryvkoch, časť I, M., 1964, s. 79.)

** (M. Taube, Výpočtové stroje a zdravý rozum, M. * 1964, s. 18.)

Ale aj keď je možné zvládnuť uvedené jazykové ťažkosti, stále existujú prekážky správneho logického usporiadania - v tomto prípade hovoríme o takzvaných "pravidlách rozhodovania" (pravidlách rozhodovania). Ak totiž chceme mať istotu, že stroj bude pôsobiť logicky bezchybne, musíme mu poskytnúť súbor pravidiel, podľa ktorých môže dôsledne prejsť od zdrojových informácií k požadovaným záverom. V prípade výrokových logických kalkulov máme takéto pravidlá, ale pre zložitejšie logiky takéto pravidlá neexistujú a navyše existujú dôvody domnievať sa, že takéto pravidlá nemožno nájsť. Ak sa zameriame na pravidlá, ktoré už máme k dispozícii, tak ich použitie skomplikuje proces riešenia natoľko (aj s použitím vylepšených počítačov), že hra nebude stáť za sviečku * .

* (Aby A. L. Samuel ukázal prácu, ktorú musí vykonať krok za krokom počítač, obracia sa na príklad hry dámy. Píše: "Na to, aby počítač mohol hrať dámu, musíme najprv znázorniť polohu dám na hracej ploche tak, aby si ju počítač zapamätal. Potom treba analyzovať dôsledky každého z dostupných ťahov pohľadom do budúcnosti, ako by to človek vo všeobecnosti urobil. , berúc do úvahy každý počiatočný pohyb v poradí, potom všetky možné odvetné ťahy súpera, potom pre každý z nich všetky protiodpovede atď., molekulárna povaha hmoty a konečná rýchlosť svetla, potom by takému počítaču trvalo mnoho storočí a možno aj dlhšie ako vek vesmíru, kým by urobil svoj prvý krok“ (A. L. Samuel, Umelá inteligencia: Pokrok a problémy. Príloha ku knihe: M. Taube, Počítačové stroje a zdravý rozum, Moskva, 1964* s. 140-141).)

V tejto podobe je problém aplikácie logických a matematických metód vo vede o jazyku načrtnutý na základe údajov aplikovanej lingvistiky. Aké sú závery? Závery už boli formulované vyššie - logická analýza umožňuje kombináciu induktívnych metód s deduktívnymi, ale keď hovoríme o použití deduktívnych metód v lingvistike, netreba všetko redukovať na slepé podriaďovanie lingvistického výskumu logicko-matematickým metódam. . Prirodzený jazyk sa proti takémuto násiliu búri. A prax aplikovanej lingvistiky potvrdzuje tieto závery a stanovuje, že medzi formalizovaným logickým jazykom a prirodzeným jazykom existujú také rozdiely, že dostatočne úplný (informatívne vyjadrený) preklad druhého jazyka do prvého je nemožný. Znamená to, že v lingvistike (a najmä v aplikovanej) by sa malo upustiť od používania logicko-matematických metód? Samozrejme, že nie. Netreba však preceňovať ich schopnosti. Zatiaľ čo oni sú dosť skromní. A aby sme tu neboli neopodstatnení, obráťme sa na svedectvo matematikov a logikov, ktorí v praxi svojej práce musia svoje poznatky aplikovať pri štúdiu prirodzeného jazyka.

Tu je to, čo hovorí matematik: „Pomoc matematiky pri štúdiu prirodzeného jazyka ešte zďaleka nie je samozrejmá... Predtým, než budeme môcť uvažovať o použití matematiky na kalkul, je potrebné určiť hranice a funkcie jazykových jednotiek. Toto je nematematický problém, je súčasťou induktívnych metód v lingvistike.

Ukázalo sa, že matematika nenahrádza empirickú metodológiu, aj keď sa o to niektorí lingvisti snažia. Naopak, až po zistení jednotiek a vzťahov prirodzeného jazyka induktívnou metódou a ich vhodnom potvrdení (overení) sa vytvoria potrebné podmienky pre realistickú aplikáciu matematiky na prirodzený jazyk. Matematici zároveň buď zistia, že majú do činenia s novým prejavom toho, čo je im v podstate už známe, alebo dostanú podnet na matematické myslenie nového poriadku.

* (P. Garvin a W. Karush, Lingvistika - spracovanie údajov a matematika, "Prirodzený jazyk a počítač", New York, 1963, s. 368-369. Pozri tiež článok v tej istej knihe: W. Ksrush, The Use of Mathematics in the Behavioral Sciences, s. 64-83.)

A tu je to, čo hovorí logik: "Vyhliadky na automatické spracovanie rečových informácií sú veľmi dobré, ale úloha logiky v tejto oblasti je obmedzená. Avšak ako nástroj lingvistickej analýzy, nie ako súbor pravidiel na vyvodzovanie záverov." , dáva skutočné sľuby“ * . A ďalej stanovuje, ktorá výskumná stratégia je vhodnejšia: „Problémy by sa nemali riešiť dôsledným dodržiavaním súboru pravidiel stanovených logikom, ale skôr použitím heuristických techník ** ... Empirický induktívny prístup k automatickému spracovaniu rečových informácií mali by sa uprednostňovať, v ktorých sa hľadajú hrubé pravidlá na riešenie informačných problémov. Netreba sa snažiť preložiť bežný jazyk do logického jazyka za účelom jeho následného spracovania, ale skôr hľadať pravidlá heuristického typu, ktoré mu umožnia zvládnuť s prirodzeným jazykom.Človek by mal prestať hľadať absolútnu istotu a obrátiť sa na približné metódy, ktoré sa nahromadením skúseností zdokonaľujú a zdokonaľujú. Uprednostňujeme zvažovanie aproximácií rovnakým spôsobom, akým sa teória uvažuje vo vede, kde modifikácie a vylepšenia sa vykonávajú na základe údajov získaných ako výsledok experimentu "***.

* (M. Maron, Logician's View of Language - Data Processing, citovaná kniha, s.144.)

** (Pomerne jasnú predstavu o heuristickej technike podáva A. L. Samuel. V kontraste s formálnou technikou logického postupu píše, že namiesto toho by sa dala použiť technika, „kde sa množstvo viac-menej svojvoľne zvolených postupov skúma dosť neúplným spôsobom a každý dáva nejaké vodítko o tom, či sme na správna stopa*, až nakoniec hádaním nedospejeme k uspokojivému dôkazu. V oboch týchto prípadoch môžeme niekedy dospieť k správnej alebo aspoň veľmi dobrej odpovedi v úžasne krátkom čase, no zároveň neexistuje žiadna istota, že vôbec niekedy dostaneme riešenie, rovnako ako istota, že riešenie, ktoré nám bolo predložené, je to najlepšie. Tento spôsob riešenia problémov sa nazýva „heuristický“ postup, na rozdiel od aplikácie "algoritmus" ... Heuristické riešenie problémov, keď je úspešné, treba samozrejme považovať za vyššiu mentálnu aktivitu ako riešenie problémov pomocou viac-menej automatického postupu. Citované z ruského prekladu: A. L. Samuel, Umelá inteligencia: Pokrok a problémy. Príloha ku knihe: M. Taube, Výpočtové stroje a zdravý rozum, M., 1964, s. 136-137.)

*** (M. Maron, op. cit., s. 143-144,)

Toto sú všeobecné závery. Hovoria, že lingvisti zohrávajú vedúcu úlohu v spoločnej práci s logikmi a matematikmi. Povinnosťou jazykovedcov je pripraviť jazykový materiál tak, aby bol prístupný na spracovanie logickými a matematickými metódami. Práve v tomto smere treba v lingvistike hľadať realistickú kombináciu induktívnych a deduktívnych metód. A keď pri riešení problémov aplikovanej lingvistiky hovoríme o heuristických hypotézach, mali by pochádzať predovšetkým od lingvistu, keďže ten má k jazyku bližšie a vo svojej pozícii je povinný ho lepšie poznať a rozumieť mu.

Obsah
Úvod
Kapitola 1. História aplikácie matematických metód v lingvistike
1.1. Formovanie štruktúrnej lingvistiky na prelome 19. – 20. stor.
1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia
Záver
Literatúra
Úvod
V 20. storočí pretrváva trend vzájomného pôsobenia a prenikania rôznych oblastí poznania, pričom hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.
Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.Účelom mojej semestrálnej práce je stručne poukázať na prepojenie matematiky s takým odvetvím lingvistiky, ako je lingvistika. Od 50. rokov 20. storočia sa matematika používa v lingvistike na vytvorenie teoretického aparátu na opis štruktúry jazykov (prirodzených aj umelých). Treba však povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa na objasnenie základných pojmov lingvistiky začali využívať matematické metódy v lingvistike, avšak s rozvojom výpočtovej techniky sa takýto teoretický predpoklad začal uplatňovať aj v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Pred lingvistami vyvstala otázka: ako sa naučiť reprezentovať jazykové vzory vo forme, v ktorej sa dajú priamo aplikovať na technológiu. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel si všimol interakciu jazyka a vedomia a významný lingvista začiatku dvadsiateho storočia Ferdinand de Saussure (o jeho vplyve na rozvoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď identifikuje kvantitatívne charakteristiky jazyka (napríklad počet pohlaví, prípady) so zvláštnosťami národnej mentality (viac o tom v časti 2. 2, "Štatistické metódy v lingvistike").
Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.
Kapitola I. História aplikácie matematických metód v lingvistike
1.1 Formovanie štruktúrnej lingvistiky na prelome XIX - XX storočia
Matematický opis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý sa datuje od slávneho švajčiarskeho lingvistu zo začiatku dvadsiateho storočia Ferdinanda de Saussure.
Východiskovým článkom jeho koncepcie je teória jazyka ako systému pozostávajúceho z troch častí (jazyk sám o sebe - langue, reč - podmienečné prepustenie a rečová aktivita - langage), v ktorej sa každé slovo (člen systému) nepovažuje za samo osebe. ale v spojení s inými....

I MATEMATICKÉ ASPEKTY JAZYKOVEJ ŠTRUKTÚRY

AT.Zvegintsev APLIKÁCIA LOGICKÝCH A MATEMATICKÝCH METÓD V LINGVISTIKE

].

Niet pochýb, že používanie matematických a logických metód v lingvistike bolo do značnej miery stimulované úlohami aplikovanej lingvistiky. Ak by sa pokúsili aplikovať tieto metódy na riešenie problémov priamo súvisiacich s oblasťou teoretickej lingvistiky, napríklad na rozlíšenie medzi javmi jazyka a reči, 1 potom v budúcnosti (aj keď možno nie vždy jasné a blízke), stále mali na zreteli potreby aplikovanej lingvistiky.

O úspešnosti použitia týchto metód v úplne novej oblasti zo všeobecného hľadiska do značnej miery rozhoduje odpoveď na otázku, do akej miery je prípustné stotožniť logicky správny jazyk s jazykom prirodzeným, resp. inej formulácie, je možné zredukovať druhú na prvú 2 . Odpoveď na túto otázku sa zvyčajne podáva v praktickej forme. - konštrukciou štatistických, informačno-teoretických, množinovo-teoretických, pravdepodobnostných a iných jazykových modelov, ktoré však nie sú vždy zamerané na konkrétne úlohy. Pri konštrukcii modelov tohto druhu ich autori často vychádzajú z predpokladu (z ich pohľadu zrejmého), že akákoľvek aplikácia formálneho logického či matematického aparátu na lingvistický popis a výskum automaticky prispieva k ich zdokonaľovaniu. Autor: toto je dobré

1 Pozri . G. Herdan, Jazyk ako voľba a šanca, Gronigen, 1956.

2 St Poznámka G. Curryho: „Skutočnosť, že existuje úzke prepojenie medzi matematikou a logikou na jednej strane a jazykom - na druhej strane sa to ukázalo už veľmi dávno a teraz sa táto skutočnosť stala stredobodom pozornosti v užšom zmysle...“ (pozri nižšie, s. 98).

Warren Plath vo svojej recenzii práce matematickej lingvistiky povedal: „Ak považujeme jazykové modely za abstraktné systémy diskrétnych prvkov, potom na ne možno aplikovať rôzne matematické koncepty a metódy, od elementárnej myšlienky čísla až po komplexnú logiku. , štatistické a množinovo-teoretické operácie. Avšak predstava, že akékoľvek použitie čísel a matematických operácií na opis takýchto systémov prvkov robí tvrdenia „presnejšími“ alebo „vedeckými“, je úplne mylná. V prvom rade treba ukázať, že takto získaný nový systém je uspokojivejším modelom ako pôvodný systém, či už v tom zmysle, že umožňuje formulovať jednoduchšie a všeobecnejšie teoretické tvrdenia o niektorých aspektoch modelovanej oblasti, resp. pretože operácie na modeli vrhajú svetlo na výsledky zodpovedajúcich operácií v modelovanej oblasti. Jedným z najväčších nebezpečenstiev spojených s budovaním matematických modelov jazyka, najmä kvantitatívnych, je, že nerozlišujúce používanie matematického aparátu nevyhnutne vedie k nezmyselným a dezorientujúcim výsledkom. Preto je potrebné jasne pochopiť, že predpokladom obohatenia lingvistiky pomocou matematiky je nielen znalosť príslušných oblastí matematiky, ale okrem toho hlboké pochopenie podstaty lingvistických problémov, riešenie ktorá by mala byť riadená matematickými metódami.

Aby sme sa čo najviac vyhli nebezpečenstvu naznačenému Warrenom Plathom, je potrebné mať nielen čisto empirické pokusy odpovedať na vyššie formulovanú otázku, ale snažiť sa aj o jej všeobecné teoretické pochopenie. V skutočnosti je otázka redukovateľnosti prirodzeného jazyka na jeden z jeho logicko-matematických modelov alebo interpretácií hlavnou otázkou teórie aplikovanej lingvistiky, ktorej potreba sa pociťuje čoraz naliehavejšie. Na vyriešenie tohto problému je v prvom rade potrebné zvážiť povahu tých javov, ktoré tvoria predmet štúdia, na jednej strane logiku a matematiku.

3 Pozrite si článok Poplatok v tejto zbierke, s. 202.

a na druhej strane prirodzený jazyk a potom aj možnosti tých metód, ktoré každá z týchto vied využíva. Už z porovnávacej štúdie týchto bodov bude možné vyvodiť niektoré všeobecné závery. Ten druhý nemusí byť zbytočný pre všetkých, ktorí musia nevyhnutne vykonávať svoj výskum na priesečníku týchto vied.

Tento cieľ do určitej miery sledovalo aj sympózium „Štruktúra jazyka a jeho matematické aspekty“, ktoré usporiadala Americká matematická spoločnosť. Vybrané príspevky z tohto sympózia tvoria nasledujúcu sekciu. Ale všetky, ako je zrejmé už zo samotného názvu sympózia, sa dotýkajú len jednotlivých a v niektorých prípadoch veľmi konkrétnych aspektov problému, ktorý nás zaujíma. Vo svojom celku síce vytvárajú dostatočne zdôvodnené predpoklady na zodpovedanie našej otázky, no stále im chýba jasná a jednoznačná formulácia potrebných záverov. Účastníci sympózia v mnohých ohľadoch pokračujú v línii empirických pokusov o vyriešenie tohto problému, v žiadnom prípade však neponúkajú svoje experimenty pozornosti lingvistov v nádeji, že títo sami prídu na to, aké vhodné sú hypotézy a riešenia predložené ich likvidácia sa ukáže ako vhodná pre účely lingvistiky.

2.

Zdá sa, že na našu otázku už máme jednoznačnú odpoveď. N. D. Andreev a L. R. Zinder teda píšu: „Matematické znázornenie (model) jazykov nie je v žiadnom prípade totožné s jazykom samotným“ 4 . Túto myšlienku rozvíja aj autor knihy „Models of Language“ II Revzin, ktorý upozorňuje, že výsledkom modelovania môže byť len „viac-menej tesné priblíženie údajov konkrétnej reality“ 5 . Povedať to však znamená ešte nepovedať nič, keďže to zostáva

4 N. D. Andreev, L. R. Zinder, Hlavné problémy aplikovanej lingvistiky, "Problémy lingvistiky", 1959, č.4, s.18

5 I. I. Revzin, Modely jazyka, Moskva, 1962, s.8. Mimochodom, výraz „blízka aproximácia“ je priama tautológia: blízka aproximácia.

nezverejnili, prečo je to tak a či by sa ešte malo uchýliť k metóde matematického a logického modelovania, a ak áno, v akom rozsahu a za akým účelom.

Predtým, ako pristúpime k riešeniu týchto otázok, je potrebné najprv zistiť, ktoré vedy – induktívne alebo deduktívne – zahŕňajú lingvistiku, logiku a matematiku. Pokiaľ ide o posledné dve vedy, ich postavenie je jasné – nepochybne patria medzi deduktívne vedy, ktoré sa v metodológii výskumu opierajú o inferenciu. Lingvistika je tradične definovaná ako empirická veda, pretože sa verí, že jej hlavným vedeckým cieľom je opis faktov. To zrejme znamená, že lingvistika by mala byť zaradená do oblasti induktívnych vied. To znamená aj to, že v snahe využiť formálny aparát logiky a matematiky v lingvistike sa pokúšajú aplikovať deduktívne metódy výskumu v induktívnej vede.

V posledných rokoch však induktívna povaha vedy o jazyku prichádza do úvahy buď priamo, alebo nepriamo. L. Elmslev to urobil v najostrejšej forme. Pravda, terminológia, ktorú používa, je veľmi nejednotná a najmä sa vyznačuje svojráznym a veľmi osobným chápaním pojmov dedukcia a indukcia (v skutočnosti ich vykladá v opačnom zmysle). Základy jeho lingvistickej teórie však nenechávajú pochybnosti o jej metodologickej podstate. Preto považuje za prijateľné používať akékoľvek počiatočné operačné definície, čo je typické pre deduktívne vedy. A on sám svoju teóriu charakterizuje takto: „1. Teória je v našom zmysle nezávislá od skúsenosti. Sama o sebe nehovorí nič o možnosti jeho aplikácie, ani o postoji k experimentálnym údajom. Nezahŕňa postulát existencie. Je to to, čo sa nazýva čisto deduktívny systém v tom zmysle, že iba on môže byť použitý na výpočet možností vyplývajúcich z jeho predpokladov. 2. Na druhej strane teória zahŕňa množstvo premis, o ktorých je známe, že spĺňajú podmienky aplikácie na určité experimentálne údaje. Tieto predpoklady sú najvšeobecnejšie, a preto môžu spĺňať podmienky aplikácie na veľký počet experimentálnych údajov“ 6 .

Ako je zrejmé z tohto tvrdenia, L. Hjelmslev sa snaží realizovať myšlienku duálnej metodologickej povahy objektov lingvistického výskumu s prevládajúcim dôrazom na ich deduktívne znaky. Treba mu pripísať aj ten dosť nejednoznačný spôsob („na jednej strane..., ale na druhej strane...“), ktorý sa vo všeobecnosti stal charakteristickým pre posudzovanie tejto problematiky (a ktorý umožňuje obrátiť sa v oboch smeroch). Myšlienka metodologickej duality lingvistiky sa nedávno rozšírila a dokonca slúžila ako teoretický základ pre formulovanie princípov najnovšieho trendu vo vede o jazyku. - lingvistika univerzálií (univerzalizmus). „Memorandum o lingvistických univerzáliách“ v tejto súvislosti hovorí: „Štúdium lingvistických univerzálií vedie k celému radu empirických zovšeobecnení o lingvistickom správaní - obe stále vyžadujú experimentovanie, ako aj tie, ktoré sú už zavedené. Tieto zovšeobecnenia sú potenciálnym materiálom na vytvorenie deduktívnej štruktúry vedeckých zákonov. Niektoré a možno väčšina z nich však stále majú len status empirických zovšeobecnení, ktoré za súčasného stavu nášho poznania nemožno korelovať so zovšeobecneniami ani deduktívne dedukovať zo zákonitostí všeobecnejšieho významu“ 7 . Nemenej rozhodne sa vyjadruje J. Gryanberg v predslove k zborníku venovanému jazykovým univerzáliám. Argumentujúc známymi slovami L. Bloomfielda, že „jediné legitímne zovšeobecnenia o jazyku sú induktívne zovšeobecnenia,“ píše: „Napriek tomu sa zdá byť všeobecne akceptované, že vedecká metóda by mala byť nielen induktívna, ale aj deduktívna. Formulácia zovšeobecnení získaných induktívnym výskumom vedie k teoretickým hypotézam založeným na

6 L. Elmslev, Prolegomena k teórii jazyka, so. "New-in Linguistics", zv. I, M., 1960, s. 274-275.

7 Memorandum o jazykových univerzáloch, v Universals of Language, ed. od J. Greenberga, Cambridge, Mass., 1963, str. 262 - 263.

z čoho dedukciou možno následne odvodiť ďalšie zovšeobecnenia. Tieto musia byť potom podrobené empirickému overeniu.

Skutočnosť, že dejiny lingvistiky pozostávajú nielen z hromadenia faktov jazyka a ich klasifikácie, ale aj zo zmeny pohľadu na jazyk samotný, čo nevyhnutne znamená rozdiel v prístupoch k jazykovým faktom a dokonca aj k ich odlišná teoretická interpretácia prinútila niektorých sovietskych lingvistov tiež dospieť k záverom o metodologickej dualite ich vedy. S. K. Shaumyan však uprednostňuje hypoteticko-deduktívnu metódu a jej znaky opisuje takto: „Hypoteticko-deduktívna metóda je cyklický postup, ktorý začína faktami a končí faktami. Tento postup má štyri fázy:

1) oprava skutočností, ktoré si vyžadujú vysvetlenie;

2) predloženie hypotéz na vysvetlenie týchto skutočností;

3) odvodzovanie z hypotéz predpovedí o skutočnostiach ležiacich mimo okruhu faktov, na vysvetlenie ktorých hypotézy boli predložené;

4) overenie faktov, ktoré sú predpovedané hypotézami, a určenie pravdepodobnosti hypotéz.

Hypoteticko-deduktívna metóda sa zásadne líši od induktívnej metódy používanej v takých oblastiach poznania, ako je napríklad deskriptívna botanika alebo zoológia“ 9 . Metóda S. K. Shaumyana úplne opakuje metódu lingvistiky univerzálií a J. Greenberga. Rozdiel je len v názve. Ak napríklad J. Greenberg hovorí o kombinácii induktívnej a deduktívnej metódy, potom S. K. Shaumyan nazýva svoju metódu hypoteticko-deduktívnou - označenie je zjavne nekonzistentné pre metódu, ktorá „začína faktami a končí faktami“.

Otázku, kam treba pripísať lingvistiku, si kladie aj I. I. Revzin. „Zo svojej podstaty,

8 Univerzálne jazyky ​​s. IX.

9 S. K-Shaumyan, Problémy teoretickej fonológie, M., 1962, porov. 18-19. K hypoteticko-deduktívnej metóde pozri aj článok V. S. Shvyreva Niektoré otázky logickej a metodologickej analýzy vzťahu medzi teoretickou a empirickou úrovňou vedeckého poznania, v zborníku „Problémy logiky vedeckého poznania“, M. "Veda", 1964, s. 66-75 (3. oddiel článku).

Na túto otázku odpovedá - lingvistika musí v prvom rade používať induktívne metódy, opisuje konkrétne rečové akty konkrétnych jazykov...

Na druhej strane prítomnosť nekonečnej množiny rečových aktov študovaných lingvistom len ťažko umožňuje formulovať základné pojmy vedy o jazyku zovšeobecnením indukciou.

Z toho vyplýva, že lingvisti potrebujú nielen induktívne, ale aj deduktívne výskumné metódy, aby získali systém všeobecných vedomostí, ktoré pomáhajú pochopiť údaje, ktoré sa získavajú pri analýze konkrétnych jazykov...

Vo svojej deduktívnej časti možno lingvistiku zrejme budovať rovnakým spôsobom, ako sa buduje logika alebo matematika, a to: vyčlení sa určitý minimálny počet primárnych, nedefinovaných pojmov a všetky ostatné pojmy sa definujú prostredníctvom primárnych. Zároveň musia byť niektoré primárne tvrdenia o vzájomnom spojení týchto pojmov (axiómy) jasne formulované a všetky ostatné tvrdenia musia byť dokázané, teda zredukované na nejaké iné tvrdenia“ 10 .

Metóda dedukcie, stelesnená v logike a matematike, tu pôsobí len ako prostriedok usporiadania „množiny rečových aktov“, za účelom vytvorenia „systému všeobecných pojmov“. V priamom rozpore s touto úlohou je však samotná prezentácia deduktívnej metódy odporúčanej na použitie v lingvistike. Je úplne premyslená z aktov aj z faktov a na počiatočný moment konštrukcie systému všeobecných lingvistických pojmov si vyžaduje súbor nedefinovaných a zjavne absolútne podmienených primárnych pojmov, prostredníctvom ktorých sa určujú všetky nasledujúce pojmy.

Tento rozpor nie je náhodný, spočíva v samotnej podstate vied, o ktorých uvažujeme. Zdalo by sa, že záver, že pri štúdiu lingvistických objektov je prípustná kombinácia induktívnych a deduktívnych metód, otvára dvere pre použitie logických a matematických metód v lingvistike a špecifickou realizáciou tohto záveru je vytvorenie početných

10 I. I. Revzin, Modely jazyka, M., 1962, s. 7-8.

formálno-logické a matematické modely jazyka. Ako však bude uvedené nižšie, takýto zjednodušený prístup nemôže poskytnúť uspokojivé výsledky. Môžeme súhlasiť s tým, že v lingvistickom výskume je prípustné a dokonca nevyhnutné kombinovať deduktívne a induktívne metódy. Nakoniec, ako napísal W. Bröndal, „indukcia nie je nič iné ako skrytá dedukcia a za čistými súvislosťami vytvorenými medzi pozorovanými javmi sa absolútne nevyhnutne predpokladá realita, špecifický predmet tejto vedy“ 11 . To však neznamená, že formálny aparát logiky a matematiky by sa mal bezpodmienečne a mechanicky prenášať do lingvistiky bez akéhokoľvek zohľadnenia „špecifického predmetu tejto vedy“. Ako správne poznamenáva ten istý I. I. Revzin, „dôkazy získané deduktívnymi prostriedkami, akokoľvek sú z logického hľadiska bezúhonné, stále nehovoria nič o vlastnostiach skutočného jazyka opísaného modelom“ 12 . A na zistenie efektívnosti modelov odporúča obrátiť sa na prax, ktorou je strojový preklad a „iné praktické aplikácie, lingvistika“.

A prax aplikovanej lingvistiky ukazuje, že na používanie matematických a logických metód pri skúmaní jazykových javov sú kladené veľmi prísne obmedzenia.

Logika poskytuje príklad najdôslednejšieho použitia deduktívnej metódy. Matematika sa v tomto ohľade do značnej miery riadi logikou, a preto ich možno posudzovať spoločne.

Logika ani matematika samozrejme nepredstavujú homogénne systémy z hľadiska ich metód a interpretácie cieľov. Takže napríklad vo vzťahu k logike môžeme hovoriť o logike dialektickej, formálnej, matematickej a v užšom zmysle - o predmetovej, sémantickej, fenomenologickej, transcendentálnej, či konštruktívnej, kombinatorickej, mnohohodnotovej,

11 W. Bröndal, Štrukturálna lingvistika. Cit. na
Kniha V. A. Zveginceva „Dejiny lingvistiky v 19. a 20. storočí. v obryse
kah a extrakty, časť II, M., Uchpedgiz, 1960, s. 41-42.

12 I. I. Revzin, Modely jazyka, M., 1962, s.

vzdialené atď. Nevyhnutne však budeme musieť myslieť na všetky takéto pododdelenia a hovoriť len o najvšeobecnejších črtách vlastných logike a matematike ako celku, a najmä o tých, ktoré najjasnejšie demonštrujú deduktívnu povahu metód tieto vedy.

Po zaujatí tejto pozície sa preto nebudeme obracať na induktívnu logiku. Poznamenávame len, že závery v induktívnej logike nie sú určené premisami – teda nie sú tautologické. Závery v induktívnej logike sú priamo závislé od faktov a tie sú určené množstvom našich vedomostí – teda sú založené na pravdepodobnostnom základe. Pravdepodobnosť je hlavným metodologickým nástrojom induktívnej logiky.

Deduktívnu logiku najviac zastupujú formálne a matematické logiky, ktoré majú veľa spoločného. Deduktívna logika je veda, ktorá študuje ľudské myslenie alebo duševné činy z hľadiska ich štruktúry alebo formy, pričom abstrahuje od ich špecifického obsahu. Deduktívna logika sa teda snaží formulovať zákony a princípy, ktorých dodržiavanie je predpokladom dosiahnutia pravdivých výsledkov v procese získavania inferenčných poznatkov. Hlavným metodologickým nástrojom deduktívnej logiky je implikácia. Získava odvodzovacie znalosti bez priameho odvolania sa na skúsenosti alebo prax, iba prostredníctvom aplikácie zákonov logiky. V procese dedukcie premisa podmieňuje záver: ak je pravdivá premisa, tak záver to by malo byť pravda. Záver je teda už v premise a účelom dedukcie je ukázať, čo v latentnom stave je už obsiahnuté v premise. Z toho vyplýva, že každý záver získaný dedukciou je tautologický, teda logicky prázdny, aj keď z iných hľadísk, napríklad v prípadoch, keď sa formálny logický aparát používa pre účely iných vied, môže byť nový, nečakaný a originálny.

Podobná situácia nastáva v matematike – platnosť argumentov v nej spočíva výlučne na dedukcii. Navyše v matematike je spravidla prijateľné akékoľvek počiatočné hľadisko, akýkoľvek prístup k riešeniu problému - pokiaľ spĺňajú podmienky matematickej dedukcie. Matematika má bohatú množinu takých „počiatočných uhlov pohľadu“ a „prístupov“, ktoré môže výskumník alternatívne použiť na riešenie svojho problému. Matematické problémy sa často prekladajú do rôznych ekvivalentných foriem a každá z nich zahŕňa použitie rôznych oblastí matematickej teórie na vyriešenie problému. Matematik má teda prakticky neobmedzenú voľnosť vo výbere premís – vyberá si tie, ktoré z jeho pohľadu obsahujú najsľubnejšie možnosti na najjednoduchšie, najnebanálnejšie a najelegantnejšie riešenie problému. Jeho talent a skúsenosti sa prejavujú práve v úspešnom výbere predpokladov, tých „povedzme, že ...“ alebo „ak ..., tak“, ktoré sú plné matematických prác. Rovnako ako v logike, matematické premisy - axiómy alebo postuláty - určujú definície ešte nedefinovaných jednotiek.

Sloboda výberu premís v matematike je priamo závislá od tých nehmotných jednotiek alebo objektov, s ktorými operuje - jej pozornosť je zameraná na vzťah medzi nimi. Matematické objekty pôsobia ako symboly vyjadrujúce štruktúru čistých vzťahov. Matematický systém možno teda považovať za súbor formálnych vzťahov, ktoré existujú len na základe vyjadrenia týchto vzťahov. Samozrejme, najmä na aplikačné účely môžu byť výroky o vzťahoch zamerané na to, aby v nich stelesňovali korešpondenciu s vonkajšou realitou, čo na tieto výroky samotné nebude mať vplyv, skôr naopak. Matematici neskúmajú „pravdivosť“ svojich axióm, hoci vyžadujú vzájomnú dohodu medzi nimi. Výskum v rámci matematického systému je výskum a vytváranie súvislostí, ktoré umožňujú dokázať, že skutočnosť teórie A implikuje skutočnosť teórie B. Hlavnou otázkou v matematike preto nie je „čo sú A a B“, ale „ predpokladá A (alebo podmienky) B? »

Úplne iná je situácia v lingvistike – zameriava sa najmä na prvú z týchto otázok, a to jej nedáva možnosť odtrhnúť sa od reality; preto neoperuje s abstraktmi, ale s konkrétnymi jednotkami, aj keď v mnohých prípadoch má tendenciu vytvárať abstraktné objekty ako koncept fonémy alebo morfémy. Táto situácia je charakteristická nielen pre tradičnú lingvistiku, ale je rovnako charakteristická pre jej najnovšie trendy, spojené pod hlavičkou štrukturalizmu. Vyššie už bolo citovaných množstvo tvrdení, ktorých autori, snažiaci sa vo vede o jazyku využívať nielen induktívne, ale aj deduktívne metódy (resp. matematické a logické metódy), sa predsa len nevyhli potrebe odvolávať sa na skutočnú jazykovednú skutočnosť. Okrem nich možno uviesť ešte jednu vec, ktorá vnáša do posudzovanej problematiky úplnú jasnosť. "Lingvistická analýza,- P. Garvin v tejto súvislosti píše,- v podstate induktívny proces v tom zmysle, že sa snaží vytvoriť zoznam prvkov alebo súbor výrokov z jazykových podnetov informátorov alebo zo štúdia textu. Vychádza z predpokladu, že v oboch týchto zdrojoch informácií bude možné rozpoznať pravidelne sa vyskytujúce prvky rôzneho typu a rádu zložitosti. Klasifikácia týchto typov a vyjadrenie podmienok ich distribúcie, získané ako výsledok analýzy, tvoria induktívny popis jazyka“ 13 .

V lingvistike sa samozrejme dá použiť aj metóda predpokladov, na základe ktorých sa potom určujú konkrétne predmety, fakty alebo jednotky jazyka. Ale tu sa stretávame s dvoma funkciami, ktoré výrazne upravujú používanie tejto metódy. Na rozdiel od logiky a matematiky sa v tomto prípade bude hľadať „pravda“ takto získaných definícií, teda ich korešpondencia s údajmi skúseností. Takto je stanovená vzájomná závislosť premisy a inferenčného poznania: premisa určuje záver (definíciu konkrétneho jazykového objektu z hľadiska premisy), ale ak záver nezodpovedá údajom skúsenosti, potom samotná premisa je potrebné opraviť. Úpravy predpokladov tohto druhu však nemajú nič spoločné s preložiteľnosťou do ekvivalentných foriem, ktorá, ako už bolo uvedené, je v matematike prípustná, pretože nie je podmienená

13 P. Garvin, A Study of Inductive Method in Syntax, "Word", zv. 18, 1962, str. 107.

formálne úvahy, ale údaje o skúsenostiach. Všetko, čo bolo uvedené vyššie, dáva dôvod na záver, že samotný pojem predpoklad a sloboda jeho výberu má v lingvistickej analýze špecifickosť, ktorú nemožno ignorovať pri použití deduktívnej metódy v lingvistike.

Lingvisti nemôžu používať metódu „ak“ alebo „poďme“ s takou voľnosťou ako matematici. Ich sloboda priestorov je veľmi prísne obmedzená. Dejiny vedy o jazyku poznajú mnohé zmeny v „hľadiskách“ alebo, inými slovami, počiatočných premisách, ktoré boli vyvolané objavením nových faktov, šírením všeobecných vedeckých myšlienok do lingvistiky, či dokonca formovaním pôvodných teórie. Ale pre lingvistu je vo všetkých takýchto prípadoch zmena „ak“ alebo počiatočná premisa zmenou celého vedeckého konceptu. Preto lingvista nehovorí „ak“, ale postuluje svoje chápanie predpokladu, teda v skutočnosti porozumenie predmetu svojho výskumu, a na základe tohto pochopenia dáva definíciu súkromných jednotiek jazyka. , pričom tieto definície kontrolujeme s údajmi o skúsenostiach. Posledná okolnosť v dôsledku vzájomnej závislosti premisy a záveru v lingvistike slúži ako prostriedok na overenie oprávnenosti samotnej premisy, ktorá stojí na začiatku lingvistickej analýzy deduktívnej formy. Ak sa teda obrátime na konkrétne príklady,vJazyk bol v minulosti interpretovaný ako vyjadrenie duchovnej podstaty ľudu (Humboldt), ako prírodný organizmus (Schleicher), ako individuálna psychofyziologická aktivita (neogramaristmi) atď. Výskumná prax založená na týchto koncepcie ukázali svoju nedostatočnosť. Dnes je počiatočným predpokladom lingvistickej analýzy postulát, že jazyk je systém znakov. Podlieha rovnakej skúške skúseností a praxe ako ktorýkoľvek iný koncept vo vede o jazyku.

Už tieto predbežné a najvšeobecnejšie úvahy ukazujú, že deduktívne metódy nie sú v lingvistike v žiadnom prípade kontraindikované, ale ich aplikácia si vyžaduje splnenie špecifických podmienok. Práve tieto špecifické podmienky kladú určité obmedzenia na mechanický prenos metód logiky a matematiky do oblasti lingvistiky. Ak sa však obmedzíme na takéto všeobecné tvrdenie, veľa zostáva nejasných. Preto je potrebné nami zvažovanú problematiku prehĺbiť a v záujme posilnenia prípadných záverov obrátiť sa na prax aplikovanej lingvistiky, kde je opodstatnenosť predpokladov a súlad s experimentálnymi údajmi záverov urobených o ich najzreteľnejšie sa prejavujú.

Vzťah medzi jazykom a logikou je veľmi zvláštny. Zástupcovia empirických vied, medzi ktoré patrí lingvistika, študujú konkrétny objekt alebo jav, aby ho opísali alebo vysvetlili. Svoje výsledky formulujú v jazyku nazývanom objektový jazyk. Logik ovláda dôkazy, závery, úsudky atď., ale sú mu dostupné len v jazykovej forme. Ukazuje sa teda, že logik je o krok ďalej od reálneho sveta ako predstavitelia empirických vied. Jeho analýza nie je zameraná priamo na skutočný objekt skúmaný empirickými vedami, ale na ich jazyk 14 . Inými slovami, skúma jazyk a získané výsledky formuluje v jazyku, ktorý sa nazýva metajazyk.

Z logického hľadiska základnou jednotkou jazyka nie je znak a nie ním označený predmet, ale veta, keďže len v nej sa môže odvíjať logický proces. Preto iba veta môže byť pravdivá alebo nepravdivá. A slová samé o sebe nemôžu mať tieto vlastnosti. Ale predtým, ako zistíme, či je veta pravdivá alebo nie, musíme povedať, že má význam.

Pojmy pravda a význam patria do oblasti sémantiky, ktorá študuje vzťah medzi jazykom a predmetmi, ktoré označuje. Prostredníctvom týchto vzťahov sa určuje pravdivosť alebo nepravdivosť vety: ak veta opisuje predmety správne, je pravdivá a ak je nesprávna, nie je. Ale jazykové výrazy môžu vstúpiť do iných vzťahov ako do tých, ktoré

14 „Logická analýza vedeckých poznatkov,“ píšu v tejto súvislosti P. V. Tavanets a V. S. Shvyrev, „je predovšetkým a priamo analýzou jazyka, v ktorom sú tieto poznatky vyjadrené.“ Pozri článok „Logika vedeckého poznávania“ v zborníku „Problémy logiky vedeckého poznávania“, M., „Nauka“, 1964, s. 161.

existujú medzi objektmi, ktoré označujú. Okrem toho môžu ponuky vstúpiť do vzťahov s inými ponukami. Úlohou logika je zistiť povahu vzťahu medzi jazykovými výrazmi a vetami a stanoviť pravidlá na určenie, či sa postup predpísaný v danom prípade dodrží alebo nie. Pri riešení tejto poslednej otázky sa logik neodvoláva na predmety opísané vetou. Zaujíma ho jazyková forma, nie jej obsah, čo, samozrejme, nebráni interpretácii jeho obsahu, výsledkom čoho je formalizovaný jazyk. Formalizovaný jazyk môže byť reprezentovaný ako abstraktný systém, ako je napríklad predikátový počet.

Logik teda môže v závislosti od cieľov štúdie pracovať na dvoch úrovniach - syntaktickej (logická syntax) a sémantickej (logická sémantika). Najprv zvážte aplikáciu prvej z týchto úrovní na prirodzený jazyk.

Ak logik, ktorý sa zaoberá štúdiom jazykových foriem a vzťahov medzi nimi, môže zostať v syntaktickej rovine a pracovať s nezmyselnými termínmi, potom to lingvista nemôže urobiť. Všetky úrovne prirodzeného jazyka (snáď s výnimkou fonematickej) sú zmysluplné, a teda mimo sémantiky nemysliteľné. Prirodzený jazyk navyše neexistuje mimo pragmatiky, ktorá sa od nej nedá ľahko odtrhnúť z jednoduchého dôvodu, že v rečovom akte sa neustále transpoluje do sémantiky. Prirodzený jazyk je preto vždy výkladom a navyše dvojstupňovým, keďže je spojený so sémantikou aj pragmatikou 15 . A tento výklad sa zatiaľ nehodí na žiadnu formalizáciu.

Prejdime teraz na druhú úroveň, keď sa kalkulu pripisuje interpretácia pomocou sémantických pravidiel. A v tomto prípade získame vzdelanie, ktoré nie je v žiadnom prípade porovnateľné s prirodzeným jazykom. pravda,

15 St Poznámky Nielsa Bohra o matematickom jazyku, kde „jednoznačnosť definícií potrebných pre objektívny popis sa dosahuje používaním matematických symbolov práve preto, že týmto spôsobom sa vyhýbame odkazom na vedomý subjekt, ktoré prenikajú každodenným jazykom“. (Níl Bor, Atómová fyzika a ľudské poznanie, M., IL, 1961, s. 96.)tu máme do činenia so zmysluplnými pojmami, ale v logickom a prirodzenom jazyku budujú svoj vzťah k „pravde“ na úplne iných základoch. Ako píše A. Tarski, „pravda“, „v každom prípade vo svojej klasickej interpretácii“ je pravdivá do tej miery, do akej sa „zhoduje so skutočnosťou“ 16 . Toto kritérium pravdivosti však v skutočnosti platí len pre prirodzené jazyky, ktoré sú vždy orientované na realitu. Iná situácia je v logickej sémantike. Sémantická analýza sa spolieha iba na logickú interpretáciu systému a zahŕňa ustanovenie na- iurčité pravidlá, ktoré formulujú pravdivostné podmienky,iPredpisuje dodržiavanie týchto pravidiel bez toho, aby odpovedal na otázku, do akej miery sa tu „náhoda“ odohráva.ivzťah s realitou. Okrem toho samotné zameranie sa na realitu sa uskutočňuje v prirodzenom jazyku nie priamo, ale prostredníctvom človeka, čo opäť vyžaduje obrátiť sa na tretiu úroveň,- pragmatický. „... Prechod na sémantickú úroveň,- zistili P. V. Tavanets a V. S. Shvyrev,- nie je samo o sebe návratom k živému jazyku v jeho konkrétnosti, ako by sa na prvý pohľad mohlo zdať vzhľadom na to, že sémantická funkcia jazyka je akoby podstatou jazyka ako „bezprostrednej reality myslenia“. V skutočnosti pôvodná schéma sémantiky „jazyk - realita“ ešte nepodáva konkrétny obraz jazyka ako bezprostrednej myšlienkovej reality z jednoduchého dôvodu, že jazyk nie je spojený s realitou sám osebe nejakým mystickým spôsobom, ale prostredníctvom človeka, jeho konania, jeho správania. Preto v skutočnosti možno konkrétnu predstavu jazyka ako nositeľa myslenia dosiahnuť len na úrovni jeho pragmatickej analýzy podľa „jazyka“. - ľudské činy s jazykom a založené na jazyku - realita“ 17.

Ale to nie je všetko. V súvislosti s týmto problémom M. | Gluškov píše: „Živý ľudský jazyk možno považovať za formálny jazyk až po sformulovaní prísneho systému pravidiel, ktorý umožňuje

16A. T a g s k i, Grundlegung der Wissenschaftlichen Semantik
(Actes du
Congrès International de Philosophie Scientifique, 1936).

17 Pozri článok „Logika vedeckého poznania“ v zborníku „Pro-
problémy logiky vedeckého poznania“, M., „Nauka“,
1964, strana 16.

odlíšiť výrazy povolené v jazyku od všetkých ostatných výrazov, teda zmysluplných vietOdnezmyselný“ 18. Pri vysvetľovaní ťažkostí, ktoré vznikajú pri formalizácii prirodzeného jazyka, ďalej poukazuje na to, že „...žiadny ustálený formalizovaný jazyk nemôže byť adekvátny živému ľudskému jazyku, keďže ten sa na rozdiel od prvého neustále vyvíja a zdokonaľuje. Preto je akákoľvek formalizácia akéhokoľvek živého ľudského jazyka iba jeho viac či menej vydarenou okamžitou kópiou, ktorá s vývojom originálu stráca svoju podobnosť. Ak by sa všetko zredukovalo len na toto, bola by to polovica problémov. V aplikovanej lingvistike myslia na momenty vývoja jazyka, snažia sa ho považovať za úplne stabilný systém, no stále sa im nedarí dosiahnuť formalizácia prirodzeného jazyka. Deje sa to z veľmi jednoduchého dôvodu. Formálny systém a prirodzený jazyk zakladajú svoju účinnosť na opačných kvalitách. Akýkoľvek formálny systém je vždy identický sám so sebou. Práve táto vlastnosť mu umožňuje vykonávať svoje funkcie vo všetkých špecifických prípadoch jeho aplikácie. A prirodzený jazyk – pokiaľ ide o jeho obsah, jeho sémantiku alebo, ako sa v týchto prípadoch zvykne hovoriť, v informatívnom zmysle – nie je nikdy totožný sám so sebou. Práve táto jeho schopnosť mu umožňuje fungovať vo všetkých konkrétnych prípadoch jeho uplatnenia. Keďže jazyk zostáva rovnaký, v rôznych situáciách je vždy iný. Zároveň nemá ani výslovné ani formatívne pravidlá, ani pravidlá pravdivosti, ani transformačné pravidlá na určenie, ktorý z potenciálnych významov či odtieňov významov dané slovo v danej situácii dostane. Navyše, takmer každé slovo prirodzeného jazyka môže nadobudnúť význam, ktorý nie je ustálený v žiadnom jazyku – môže sa po vzniku zafixovať v jazyku, ale s rovnakým úspechom, ako rýchly plameň, blikajúci, stratiť sa v jazyku. jazykový priestor a ísť von.

18 V. M. Glushkov, Myslenie a kybernetika, „Problematika fi-
losofia“, 1963, č. 1, s. 37-38

19 Tamže, s. 38.

A so všetkými týmito vlastnosťami sa prirodzený jazyk ukazuje ako úžasne dokonalý nástroj, ktorý vám umožňuje dosiahnuť úplné vzájomné porozumenie týkajúce sa najzložitejších konceptov a v akýchkoľvek situáciách. Prečo sa to deje?

Odpoveď na túto otázku treba zrejme čiastočne hľadať v jednej z myšlienok zakladateľa semiotiky Ch.Piercea, ktorú vytrvalo opakuje v mnohých svojich dielach. Zredukuje sa na nasledovné. V modernej lingvistike sa jazyk zvyčajne definuje ako systém znakov. Toto je základný predpoklad pre všetky lingvistické analýzy. Ak je to tak, potom jazyk nie je len systém znakov, ale systém vzájomne sa interpretujúcich znakov, ktoré v ňom existujú, pokiaľ sú interpretované v iných znakoch. C. Pierce to formuluje takto: „Žiadny znak nemôže fungovať ako znak, ak nie je interpretovaný v inom znaku. Preto je pre znamenie absolútne nevyhnutné, aby pôsobilo na iné znamenie“ 20 . A inde: „Celým účelom znamenia je, že sa bude vykladať v inom znamení“ 21 . A nakoniec asi to najdôležitejšie: „Znak nie je znakom, pokiaľ sa nepremietne do iného znaku, v ktorom dostane úplnejší vývoj“ 22 .

Prirodzený jazyk je teda sústavou znakov, ktoré vzájomnou interpretáciou dokážu v sémantickom vyjadrení reagovať na všetky ľudské potreby. Tu je však potrebné jedno dôležité upozornenie. Koniec koncov, všetky potreby tohto druhu sú určené postojom človeka k javom vonkajšieho sveta a sociálnemu prostrediu, v ktorom sa jeho život odohráva. Vzhľadom na túto okolnosť nemôže byť transformačná sémantika, ak by mohla byť vytvorená, založená len na pravidlách vzájomnej interpretácie znakov, teda byť uzavretej a konečnej povahy. Ukazuje sa, že ide o derivát veľmi veľkého počtu veličín, ktoré sa všetkými možnými spôsobmi stavajú proti formalizácii.

20 Ch. R e i g c e , Collected Papers, Cambridge, Mass., zv. osem,
p. 225.

21 Tamže, roč. 8 str. 191.

22 Tamže, roč. 5, str. 594.

V súvislosti s vyššie uvedeným je dôležité uvažovať o črtách postupu pri riešení problémov a o samotnom koncepte riešiteľnosti v logike a matematike na jednej strane a v lingvistike na strane druhej.

Pred riešením problému v matematike musí byť problém formulovaný presne. Práve táto formulácia je predpokladom úspešného riešenia problému. Zároveň, ako už bolo zdôraznené, matematička môže danú formuláciu úlohy ľubovoľne transformovať do ekvivalentného variantu, má na to aj vhodné prostriedky. Už v tejto prvej fáze metodológie výskumu sa lingvistika výrazne líši od matematiky. Pri formulovaní svojich problémov má lingvista k dispozícii určité množstvo odpozorovaných empirických údajov, ktoré nie vždy môže presne formulovať, ale ktoré však chtiac-nechtiac musí dať za základ svojho výskumu - už v procese tohto výskumu sám sa objasňujú formulácie, ktoré sú často cieľom samotného výskumu.výskum. Aby sme nezachádzali ďaleko za príklady, môžeme sa odvolať na lingvistický význam, ktorý je základom výskumu v oblasti automatického spracovania rečových informácií, no zároveň je definovaný veľmi vágne a rozporuplne. Práve táto okolnosť núti výskumníkov v tejto oblasti neustále meniť svoju stratégiu.

Teraz sa však výskum začal a dosiahlo sa nejaké riešenie. Čo to znamená vo vzťahu k logike a matematike a vo vzťahu k lingvistike? Logika, ako je uvedené vyššie, umožňuje explicitne vyjadriť závery, ktoré sú implicitné v predpoklade. Logika však nemá pravidlá, ktorých použitie môže zaručiť, že sa v tomto prípade dosiahne požadované riešenie, pretože nejde o prostriedok na dosiahnutie nových záverov, ale iba o metódu na určenie ich správnosti. Nie je magickým kľúčom ku všetkým záhadám. Je celkom zrejmé, že ak by logika mala takéto pravidlá, neexistovali by žiadne nevyriešené problémy. Stačilo by uplatniť istý súbor logických pravidiel a na akúkoľvek otázku, ktorá nás trápi, by sme automaticky dostali pohotovú odpoveď. Vo svetle povedaného nadobúda špecifický význam aj pojem riešiteľnosť problému alebo úlohy.

V logike a matematike sa každý konečný výsledok považuje za pravdivý, ak v procese dokazovania nebolo porušené žiadne formálne pravidlo. Keďže v tomto prípade sú možné rôzne spôsoby dokazovania, existencia rôznych riešení je prípustná. Ale všetky môžu byť predmetom overovania z hľadiska požiadavky logiky alebo matematiky. Iná situácia je v lingvistike. Nedisponuje aparátom, ktorým by overovala alebo dokazovala správnosť vyvodených záverov. V súlade s tým je tiež určená pravdivosť prijatých rozhodnutí - nie je stanovená formálnymi pravidlami, ale jej zhodou s údajmi o skúsenostiach. Za týchto podmienok by sa teoreticky dalo očakávať jediné konečné riešenie. V praxi to však tak nie je, ako svedčia protichodné lingvistické definície aj hlavných kategórií jazyka. V tomto prípade vždy existuje určitá subjektivita hodnotení, ktorá je do značnej miery určená množstvom faktov, ktorými výskumník disponuje. Z toho vyplýva, že pravdivosť rozhodnutia v lingvistike je vždy daná v nejakej aproximácii a nie je deterministická, ale pravdepodobnostná.

Za týchto podmienok je veľmi dôležité testovať správnosť jazykových definícií a interpretácií na základe objektívnych kritérií. Možnosť takéhoto overenia poskytuje široká oblasť aplikovanej lingvistiky, kde proti prirodzenému jazyku stojí stroj, ktorý zastupuje záujmy logiky a matematiky.

Digitálny počítač sa používa na riešenie praktických problémov aplikovanej lingvistiky. Je schopný vnímať, uchovávať, prenášať, preskupovať a vydávať informácie. Interpretuje a vykonáva množinu príkazov (príkazový program) a tiež ich upravuje počas vykonávania úlohy. Je schopný riešiť veľmi zložité problémy, ale celý proces prechodu od úlohy k riešeniu musí byť vyčerpávajúco a dôsledne opísaný z hľadiska postupnosti základných elementárnych operácií. Informácie sa do stroja zadávajú pomocou dvojmiestneho (binárneho) kódu alebo jazyka. Stroj pracuje s takto zakódovanými slovami, zodpovedajúcimi hlavným logickým spojeniam . alebo funkcie výrokového alebo predikátového počtu. Stroj môže riešiť zložité matematické problémy práve preto, že je možné zredukovať zložité matematické operácie na postupnosť aritmetických operácií a tieto zase na logické operácie. Preto možno digitálny počítač považovať rovnakým spôsobom ako logický stroj.

Či už je zložitosť úlohy akákoľvek, stroj ju rieši pomocou sledu elementárnych operácií, ktorých program musí byť formulovaný absolútne jednoznačne (dôsledne), presne, podrobne a vyčerpávajúco. Inými slovami, nesmie ísť za hranice stanovené logickým kalkulom výrokov; a keď sa sami seba pýtame, či si stroj dokáže poradiť so spracovaním informácií obsiahnutých v prirodzených jazykoch, musíme najprv zistiť, do akej miery je logický výrokový kalkul adekvátnym modelom pre prirodzený jazyk.

Vzhľadom na špecifiká digitálneho počítača opísaného vyššie, prvá vec, ktorú musíte urobiť, aby stroj „pochopil“ úlohu a začal spracovávať rečové informácie v súlade s touto úlohou, je preformulovať informácie obsiahnuté v prirodzenom jazyku do logického jazyka. Hovoríme o preklade prirodzeného jazyka do jazyka logického výrokového počtu.

Zároveň, ako ukázal Bar-Hillel 23, treba čeliť takým ťažkostiam, ktoré vykresľujú vyhliadky na automatické spracovanie informácií vo veľmi pochmúrnom svetle, pokiaľ sa nezmení celý smer hľadania riešenia tohto problému. Minimálne budeme musieť rátať s nižšie uvedenými prekážkami, na zdolávanie ktorých zatiaľ nemáme potrebné prostriedky.

Odpoveď: Logický počet výrokov je príliš slabý na to, aby bol schopný, čo i len vzdialene

23 Y. V a g - H i 1 1 f 1, Ukážka neuskutočniteľnosti plne automatického prekladu vysokej kvality, "Pokroky v počítačoch", ed. od F. Alt., zv. ja, N. Y., 1960, str. 158-163.

aproximácia, na preformulovanie prirodzeného jazyka, ktorý je vo svojej sémantickej štruktúre neuveriteľne zložitý, má obrovské množstvo nadbytočných prvkov a čo je najdôležitejšie, často sa vyznačuje takou vágnosťou a neurčitosťou vo vyjadrení „významu“, že neexistuje žiadna dvojhodnotová logika. schopný vyrovnať sa s vytvorením umelého dvojčaťa prirodzeného jazyka 24 . Pravda, logika, ako bolo zdôraznené, sa zaoberá iba jazykovou formou. Ale keďže ide o automatické spracovanie informácií, je potrebné vedieť rozlišovať medzi sémantickými informáciami, a ak to nie je možné dosiahnuť pomocou logických prostriedkov, ktoré máme k dispozícii, ako potom môžeme získať „istotu, že náš preklad prirodzeného jazyka? do logiky je správne?

B. Zariadenie nemôže brať do úvahy to, čo Bar-Hillel nazýva „spoločné predchádzajúce údaje informácií“(generálne pozadie informácií),ktoré v skutočnosti zostávajú mimo prirodzeného jazyka, a preto ich nemožno preložiť do logického jazyka. Lingvisti v týchto prípadoch hovoria o mimojazykovom kontexte.(referenčný rámec), ktorý jemným, ale veľmi rozhodným spôsobom opravuje alebo dokonca úplne prehodnocuje všetky naše slová. Koniec koncov, aj taká jednoduchá fráza ako „Vrátim sa pred zotmením“ si vyžaduje prinajmenšom predchádzajúce znalosti o tom, kde bola vyslovená a v ktorú dennú a ročnú dobu, aby sme jej presne porozumeli a určili časový údaj v nej obsiahnutý. Len predbežné informácie tohto druhu sú často jediným prostriedkom na objasnenie tých vnútrofázových vzťahov, s ktorými si nevie poradiť ani výrokový, ani predikátový kalkul. Takže ako príklad použijeme dve vety, ktoré blikali v novinách:

Postgraduálny študent univerzity z mesta Kursk. Ctihodný inovátor Sibíri,

vidíme, že každý z nich možno interpretovať dvoma spôsobmi. Keby len formálne

24 V článku Ch.Hocketta „Gramatika pre poslucháča“, ktorý je súčasťou tejto časti, je uvedených veľa príkladov takýchto ťažkostí v „prirodzenom“ chápaní vety, ktoré sa riešia následnými a ďalekosiahlymi krokmi analýzy.

gramatických čŕt, potom možno prvú vetu rovnako dobre chápať ako „študent z univerzity v meste Kursk“ a ako „študent vysokej školy žijúci v meste Kursk (alebo pochádzajúci z mesta Kursk )". A druhú vetu možno interpretovať ako „Ctený inovátor, ktorého oblasťou činnosti je Sibír“ a ako „Ctený inovátor, ktorý je obyvateľom Sibíri“. A len predbežné a vo vetách nevyjadrené vedomosti (predbežné informácie), ktoré uvádzajú, že v meste Kursk nie je žiadna univerzita a že zaslúžená racionalistická zápcha existuje čestný titul udeľovaný v Sovietskom zväze jednotlivými správnymi obvodmi, umožňujú správne pochopiť tieto návrhy. Ak sa pozriete pozorne, potom takmer každá fráza hovoreného jazyka je veľmi solídna a rozvetvená predbežná informácia, ktorá je pre človeka samozrejmá, ale leží mimo „pochopenia“ stroja, ktorý nepozná ani klan, ani kmeň.

B. Automat nedokáže robiť intertextuálne sémantické závery, ktoré sa tiahnu cez niekoľko viet (a niekedy dokonca zámerne pre celý príbeh, aby úplne neodhalil jeho charakter alebo dejový ťah). Na túto okolnosť upozornil holandský lingvista A. Reichling 25, ktorý svoju myšlienku ilustroval na nasledujúcom príklade. Predpokladajme, že čítame príbeh, ktorý sa začína vetou: "Hrám sa s bratom." Ak sa tam zastavíme, nebudeme mať k dispozícii žiadne údaje, ktoré by objasnili, ako treba túto frázu chápať, o akej hre tu hovoríme. Koniec koncov, môžete hrať o peniaze (karty atď.), na hudobnom nástroji, v divadle alebo kine, s hračkami, futbalom, hrať pre zábavu, hrať sa s človekom a jeho osudom atď. Ale tu čítame ďalej : „Povedal som to, keď ma Wilhelm jedného dňa stretol

25 Na kolokviu Stichting Studiecentrum voor Administratívna automatizácia,organizovaný v roku 1961. Existuje aj nemecký preklad správy: A. R e i c h 1 i n g, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, "Beiträge zur Sprachkunde und Informationsverarbeitung", Heft I., Viedeň, 1963.

v bare“. Teraz môžeme s väčšou pravdepodobnosťou dospieť k záveru, že zjavne hovoríme o hre o peniaze. Ale stále existujú ďalšie možnosti. Nasleduje: "Môj brat prišiel k stolu a kocky boli hodené." Teraz je jasné, o ktorú hru ide, hoci nikde v texte nie je uvedený presný význam slova „hra“. Uhádli sme o ňom podľa súhrnu tých vonkajších znakov, ktoré sú v texte uvedené v rôznych vetách. Tieto znaky tu nasledujú jeden za druhým, no v písomnom rozprávaní ich možno od seba výrazne oddeliť. Osoba si ich môže vybrať zo širokého lingvistického kontextu, porovnať ich a potom vyvodiť príslušný záver. Stroj je o túto možnosť zbavený.

Ale možno to nie je také dôležité? Pri strojovom preklade týchto viet do nemčiny alebo francúzštiny skutočne nevznikajú žiadne zvláštne ťažkosti (samozrejme, ťažkosti môžu nastať pri preklade iných viet). Pri preklade do nemčiny môžeme použiť doslovnosť:Ich spiele mit meinem Bruder.Podobne vo francúzštine môžeme začať: Je vám to jasné... Pri preklade do angličtiny však vznikajú gramatické ťažkosti, pretože v uvedenom texte nie je uvedené, akú formu by mal stroj zvoliť: 1. Hrám sa s bratom, 2. Hrám sa s bratom, alebo 3. Zahrám sa s bratom. A pri preklade do španielčiny to bude naozaj zlé, pretože stroj si bude musieť vybrať aspoň medzi tromi slovesami: jugar, tocar alebo trabajar.

Tu je logický jazyk bezmocný.

D. Stroj v skutočnosti pracuje s rečou (alebo presnejšie povedané s rečovými segmentmi) - v jej písomnej a ústnej forme. Každá z týchto foriem reči má svoj vlastný systém pragmatických prvkov, ktoré sú tiež schopné transformovať sa na sémantické (a pravidlá takéhoto prechodu neboli študované a sú do značnej miery ľubovoľné). Takže napríklad ústna reč má takú suprasegmentálnu nadstavbu ako intonácia. Zdá sa, že teraz je možné klasifikovať intonáciu podľa funkčných typov, zvýrazniť intonácie opytovacie, naratívne atď. Je však úplne jasné, že intonácia neexistuje izolovane od viet. Ona, samozrejme, interaguje s významom v nich obsiahnutým. Na podporu tohto stačí poukázať na rečnícku otázku, ktorá je otázkou len vo svojej vonkajšej štruktúre, ale nie vo svojom význame. - nevyžaduje si odpoveď od poslucháčov. Toto sú nové ťažkosti, s ktorými si logický jazyk nevie poradiť.

E. Ale aj keď je možné zvládnuť uvedené jazykové ťažkosti, stále existujú prekážky správneho logického usporiadania. - v tomto prípade hovoríme o takzvaných „pravidlách vyvodzovania rozhodnutí“(pravidlá rozhodovania). Ak totiž chceme mať istotu, že stroj bude fungovať logicky bezchybne, musíme mu poskytnúť súbor pravidiel, podľa ktorých môže dôsledne prejsť od zdrojových informácií k potrebným záverom. Máme takéto pravidlá pre logické výrokové kalkulácie, ale pre zložitejšie logiky takéto pravidlá neexistujú a navyše existuje dôvod domnievať sa, že takéto pravidlá nemožno nájsť. Ak sa zameriame na pravidlá, ktoré už máme k dispozícii, tak ich použitie skomplikuje proces rozlíšenia natoľko (aj pri pokročilých počítačoch), že hra nebude stáť za sviečku.

V tejto podobe je problém aplikácie logických a matematických metód vo vede o jazyku načrtnutý na základe údajov aplikovanej lingvistiky. Aké sú závery? Závery už boli formulované vyššie. - lingvistická analýza umožňuje kombináciu induktívnych metód s deduktívnymi, ale keď hovoríme o použití deduktívnych metód v lingvistike, netreba všetko redukovať na slepé podriaďovanie lingvistického výskumu logicko-matematickým metódam. Prirodzený jazyk sa proti takémuto násiliu búri. A prax aplikovanej lingvistiky potvrdzuje tieto závery a stanovuje, že medzi formalizovaným logickým jazykom a prirodzeným jazykom existujú také rozdiely, že sú celkom úplné (v informatívnom vyjadrení), preklad druhého do prvého je nemožný. Znamená to, že v lingvistike, a najmä v aplikovanej lingvistike, by sa malo upustiť od používania logicko-matematických metód? Samozrejme, že nie. Nemali by ste sa však na ne úplne spoliehať, ale kombinovať ich s inými. A aby sme neboli neopodstatnení, obráťme sa na svedectvo matematikov a logikov, ktorí v praxi musia svoje poznatky aplikovať pri štúdiu prirodzeného jazyka.

Matematik hovorí: „Pomoc matematiky pri štúdiu prirodzeného jazyka nie je ešte ani zďaleka zrejmá... Predtým, než budeme môcť uvažovať o použití matematiky na kalkul, je potrebné definovať hranice a funkcie jazykových jednotiek. Toto - nematematický problém, je súčasťou induktívnych metód v lingvistike.

Ukázalo sa, že matematika nenahrádza empirickú metodológiu, aj keď sa o to niektorí lingvisti snažia. Naopak, až po zistení jednotiek a vzťahov prirodzeného jazyka induktívnou metódou a ich vhodnom potvrdení (overení) sa vytvoria potrebné podmienky pre realistickú aplikáciu matematiky na prirodzený jazyk. Matematici zároveň buď zistia, že majú do činenia s novým prejavom toho, čo je im v podstate už známe, alebo dostanú podnet na matematické myslenie nového poriadku.

A tu je to, čo hovorí logik: „Vyhliadky na automatické spracovanie rečových informácií sú veľmi dobré, ale úloha logiky v tejto oblasti je obmedzená. Avšak ako nástroj lingvistickej analýzy, nie ako súbor pravidiel na vyvodzovanie záverov, dáva skutočné sľuby“ 27 . A potom zistí, ktorá výskumná stratégia je v tomto prípade vhodnejšia: „Problémy by sa nemali riešiť neústupným dodržiavaním pravidiel stanovených logikom, ale skôr použitím heuristických techník... Na automatické spracovanie rečových informácií je potrebné použiť empirický preferovaný je induktívny prístup, pri ktorom sa hľadajú hrubé pravidlá riešenia informačných problémov. Človek by sa nemal snažiť preložiť bežný jazyk do logického jazyka za účelom jeho ďalšieho spracovania, ale skôr hľadať pravidlá heuristického typu, ktoré mu umožnia vyrovnať sa s prirodzeným jazykom. Nevyhnutné prestaň hľadať

26 P. Garvin a W. C a g u s h, lingvistika, dátové procesy-
spev a matematika, "Prirodzený jazyk a počítač", N. Y.,
1963, str. 368-369.
Cm . aj v tom istom knižnom článku W. K a g u s h,
Využitie matematiky v behaviorálnych vedách, s. 64-83.

27 M. M a g o n, Pohľad logika na jazykové dátové procesy-
spievať,
spomínaná kniha, str. 144.

absolútnu istotu a obrátiť sa na približné metódy, ktoré sa s nahromadením skúseností budú zdokonaľovať a zdokonaľovať. Uprednostňujeme zvažovanie aproximácií rovnakým spôsobom, akým sa teória zvažuje vo vede, kde sa modifikácie a vylepšenia robia na základe údajov získaných ako výsledok experimentu.

Toto sú všeobecné závery. Hovoria, že lingvisti zohrávajú vedúcu úlohu v spoločnej práci s logikmi a matematikmi. Povinnosťou jazykovedcov je pripraviť jazykový materiál tak, aby bol prístupný na spracovanie logickými a matematickými metódami. Práve v tomto smere treba v lingvistike hľadať realistickú kombináciu induktívnych a deduktívnych metód. A keď pri riešení problémov aplikovanej lingvistiky hovoríme o heuristických hypotézach, mali by pochádzať predovšetkým od lingvistu, keďže ten má k jazyku bližšie a vo svojej pozícii je povinný ho lepšie poznať a rozumieť mu.

S ohľadom na tieto úvahy by sa malo pristupovať k článkom v tejto časti. Ako už bolo spomenuté, sú prevzaté zo zbierky materiálov sympózia o aplikovanej matematike „The Structure of Language and Its Mathematical Aspects“ (sympózium sa konalo v New Yorku v apríli 1960, materiály sympózia boli publikované v roku 1961) .

Sympózia sa zúčastnili matematici, logici a lingvisti, teda len predstavitelia tých vied, ktorých spoločné práce boli spomenuté vyššie. Téma sympózia, formulovaná celkom voľne, dala jeho účastníkom príležitosť hovoriť o veľmi konkrétnych a špeciálnych problémoch, ako aj o dosť všeobecných, bez toho, aby sa viazali buď na jediné chápanie úloh prejednávanej problematiky, alebo posúdenie ich podielu na celom probléme ako celku. Azda jediným teoretickým začiatkom, ktorý spojil účastníkov sympózia, bola téza citovaná R. Jakobsonom v „Predhovore“ k materiálom, podľa ktorej by mala lingvistika

28 Tamže, s. 143-144.

treba považovať za most medzi matematickými a humanitnými disciplínami. Inak každý autor komunikácie konal v súlade so svojimi individuálnymi záujmami a v súlade so smerom svojej výskumnej práce.

Vzhľadom na určitý limit strán tohto zborníka nebolo možné použiť všetky články zahrnuté v materiáloch sympózia. Určitý výber príspevkov však musel byť urobený tak, aby sovietskemu čitateľovi poskytol možnosť urobiť si celkom úplný obraz o všeobecných trendoch v skúmaní problému, ktorý je v názve sympózia. Všetky články tejto sekcie sú svojou informačnou kvalitou nepopierateľné zaujímavé tak pre teóriu lingvistiky, ako aj pre výskumnú prax aplikovanej lingvistiky.

AT.Zvegintsev

Formovanie štruktúrnej lingvistiky na prelome 19. – 20. storočia. Štatistické metódy v učení sa jazykov. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia. Učenie sa jazyka metódami formálnej logiky. Vlastnosti strojového prekladu.

ÚVOD

Kapitola 1. História aplikácie matematických metód v lingvistike

1.1. Formovanie štruktúrnej lingvistiky na prelome 19. - 20. stor.

1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1. Strojový preklad

2.2.Štatistické metódy v učení sa jazykov

2.3. Učenie sa jazyka metódami formálnej logiky

2.4. Perspektívy aplikácie matematických metód v lingvistike

Záver

Literatúra

Dodatok 1. Ronald Schleifer. Ferdinand de Saussure

Dodatok 2. Ferdinand de Saussure (preklad)

ÚVOD

V 20. storočí pretrváva trend interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.

Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.

Cieľom mojej práce na kurze je stručne poukázať na prepojenie medzi matematikou a takým odvetvím lingvistiky, ako je lingvistika. Od 50. rokov 20. storočia sa matematika používa v lingvistike na vytvorenie teoretického aparátu na opis štruktúry jazykov (prirodzených aj umelých). Zároveň treba povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa matematické metódy v lingvistike začali používať na objasnenie základných pojmov lingvistiky, s rozvojom výpočtovej techniky však takýto teoretický predpoklad začal nachádzať uplatnenie v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Jazykovedci stáli pred otázkou: ako sa naučiť reprezentovať jazykové vzory v podobe, v akej sa dajú priamo aplikovať na techniku. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. . Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel zaznamenal interakciu jazyka a vedomia a Ferdinand de Saussure, významný lingvista začiatku dvadsiateho storočia (o jeho vplyve na vývoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď stotožňuje kvantitatívne charakteristiky jazyka (napr. počet rodov, prípadov) so zvláštnosťami národnej mentality (viac o tom v časti 2.2 „Štatistické metódy v lingvistike“).

Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.

Kapitola IHistória aplikácie matematických metód v lingvistike

1.1 Formovanie štruktúrnej lingvistikyna prelome XIX - XX storočia

Matematický popis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý siaha až k slávnemu švajčiarskemu lingvistovi zo začiatku dvadsiateho storočia Ferdinandovi de Saussure.

Počiatočným článkom jeho koncepcie je teória jazyka ako systému pozostávajúceho z troch častí (jazyk sám o sebe je Jazyk, reč - heslo a rečová aktivita - Jazyk), v ktorom sa každé slovo (člen systému) nepovažuje samo o sebe, ale v spojení s inými členmi. Ako neskôr poznamenal ďalší významný lingvista, Dán Louis Hjelmslev, Saussure „bol prvý, kto požadoval štrukturálny prístup k jazyku, teda vedecký opis jazyka zaznamenávaním vzťahov medzi jednotkami“.

Saussure pochopil jazyk ako hierarchickú štruktúru a ako prvý nastolil problém hodnoty a významu jazykových jednotiek. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi.

Štrukturálna jednotka jazyka Saussure považovala slovo „znamenie“, v ktorom sa spájal zvuk a význam. Žiadny z týchto prvkov neexistuje jeden bez druhého: preto rodený hovorca chápe rôzne odtiene významu polysémantického slova ako samostatný prvok v štruktúrnom celku, v jazyku.

V teórii F. de Saussura tak možno vidieť interakciu lingvistiky na jednej strane so sociológiou a sociálnou psychológiou (treba poznamenať, že súčasne sa rozvíja Husserlova fenomenológia, Freudova psychoanalýza, Einsteinova teória relativity , experimentuje sa s formou a obsahom v literatúre, hudbe a výtvarnom umení, na druhej strane s matematikou (pojem systemicita zodpovedá algebraickému konceptu jazyka). Takáto koncepcia zmenila koncepciu jazykovej interpretácie ako takú: Javy sa začali interpretovať nie vo vzťahu k príčinám ich vzniku, ale vo vzťahu k súčasnosti a budúcnosti. Interpretácia prestala byť nezávislá od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).

Fungovanie jazykového mechanizmu sa prejavuje prostredníctvom rečovej aktivity rodených hovoriacich. Výsledkom reči sú takzvané "správne texty" - sekvencie rečových jednotiek, ktoré sa riadia určitými vzormi, z ktorých mnohé umožňujú matematický popis. Teória spôsobov opisu syntaktickej štruktúry sa zaoberá štúdiom metód matematického opisu správnych textov (predovšetkým viet). V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Na Západe Saussureove myšlienky rozvíjajú mladší súčasníci veľkého švajčiarskeho lingvistu: v Dánsku - mnou už spomínaný L. Hjelmslev, ktorý dal vznik algebraickej teórii jazyka vo svojom diele „Základy lingvistickej teórie“, v r. USA - E. Sapir, L. Bloomfield, C. Harris, v Českej republike - ruský emigrant N. Trubetskoy.

Štatistickými zákonitosťami v štúdiu jazyka sa začal zaoberať nik iný ako zakladateľ genetiky Georg Mendel. Až v roku 1968 filológovia zistili, že ho v posledných rokoch života fascinovalo štúdium jazykových javov pomocou metód matematiky. Mendel priniesol túto metódu do lingvistiky z biológie; v 90. rokoch len tí najodvážnejší lingvisti a biológovia tvrdili uskutočniteľnosť takejto analýzy. V archíve kláštora sv. Tomáša v Brne, ktorého opátom bol Mendel, sa našli listy so stĺpcami priezvisk zakončenými na „mann“, „bauer“, „mayer“ a s niektorými zlomkami a výpočtami. V snahe odhaliť formálne zákonitosti pôvodu rodových mien robí Mendel zložité výpočty, v ktorých berie do úvahy počet samohlások a spoluhlások v nemeckom jazyku, celkový počet slov, ktoré zvažuje, počet priezvisk, počet hlások a spoluhlások v nemeckom jazyku. atď.

U nás sa štrukturálna lingvistika začala rozvíjať približne v rovnakom období ako na Západe – na prelome 19. – 20. storočia. Súčasne s F. de Saussurom koncept jazyka ako systému rozvinuli vo svojich prácach profesori Kazanskej univerzity F.F. Fortunatov a I.A. Baudouin de Courtenay. Ten si dlho korešpondoval s de Saussurom, respektíve ženevská a kazaňská lingvistická škola navzájom spolupracovali. Ak možno Saussura nazvať ideológom „exaktných“ metód v lingvistike, potom Baudouin de Courtenay položil praktické základy ich aplikácie. Bol prvým, kto oddelil lingvistiku (napr presné veda využívajúca štatistické metódy a funkčnú závislosť) z filológie (spoločenstvo humanitných disciplín, ktoré študujú duchovnú kultúru prostredníctvom jazyka a reči). Samotný vedec veril, že „lingvistika môže byť v blízkej budúcnosti užitočná, iba ak sa oslobodí od povinného spojenia s filológiou a literárnou históriou“. Fonológia sa stala „skúšobnou pôdou“ pre zavedenie matematických metód do lingvistiky – zvuky ako „atómy“ jazykového systému, majúce obmedzený počet ľahko merateľných vlastností, boli najvhodnejším materiálom pre formálne, rigorózne metódy opisu. Fonológia popiera existenciu významu zvuku, preto bol v štúdiách eliminovaný „ľudský“ faktor. V tomto zmysle sú fonémy ako fyzické alebo biologické objekty.

Fonémy ako najmenšie jazykové prvky prijateľné pre vnímanie predstavujú samostatnú sféru, samostatnú „fenomenologickú realitu“. Napríklad v angličtine sa zvuk „t“ môže vyslovovať inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Hlavné je, že fonéma bude plniť svoju hlavnú – zmysluplnú – funkciu. Rozdiely medzi jazykmi sú navyše také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty rovnakej fonémy (ako anglické „t“, vyslovované s aspiráciou alebo bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V 20. - 30. rokoch 20. storočia, po Saussure, Jacobson a N. S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto znaky vychádzajú zo stavby rečových orgánov – jazyka, zubov, hlasiviek. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „Existujú len rozdiely v jazyku“. Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov aj prostriedkom komunikácie a tieto dve funkcie sa nikdy nezhodujú. Môžeme si všimnúť striedanie formy a obsahu: jazykové kontrasty definujú jeho štruktúrne jednotky a tieto jednotky spolupôsobia a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku distinktívne znaky tvoria fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do morfém, morfémy - do slov, slová - do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac ako len súčet jeho častí.

Saussure navrhol myšlienku novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá študovala úlohu znakov v spoločnosti. Saussure nazval túto vedu semiológiou (z gréckeho "semeion" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (alebo artikulované) v zmysle týchto štruktúr. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola v mnohých ohľadoch protikladom racionalizmu vo svojej lingvistickej analýze: išlo o pokus študovať v systéme problém „pravdepodobnosti“ v jazyku. Takýto výskum pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, nie zdrojom života básne“. Báseň slúži na výmenu zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia je vyjadrená nielen slovami, ale aj tým, čo tieto slová vyvolávajú, presahuje kontrolu vedomia a závisí len od zákonov jazyka“ (pozri . Príloha 1).

Saussureho pokus o štúdium vlastných mien v neskororímskej poézii zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnú povahu znakov, ako aj formálnu podstatu Saussureovej lingvistiky, ktorá vylučuje možnosť analýzy významu. Todorov prichádza k záveru, že dnes sa Saussureove diela zdajú byť mimoriadne konzistentné vo svojej neochote študovať symboly javu, ktoré majú jasne definovaný význam [Príloha 1]. Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu Nibelungov definuje symboly len preto, aby ich priradil k chybným čítaniam: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semiológia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na dejinách a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách na jednej strane a štrukturalistickými koncepciami, ktoré stierajú protiklad medzi formou a obsahom (subjektom a objektom), na druhej strane. význam a pôvod v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike - spisy Ferdinanda de Saussura o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.

Na prvom medzinárodnom kongrese lingvistov v Haagu v roku 1928 boli zastúpení aj ruskí vedci. S. Kartsevsky, R. Yakobson a N. Trubetskoy vypracovali správu, ktorá skúmala hierarchickú štruktúru jazyka – v duchu najmodernejších myšlienok zo začiatku minulého storočia. Jakobson vo svojich spisoch rozvinul Saussureove myšlienky, že základné prvky jazyka by sa mali skúmať predovšetkým v súvislosti s ich funkciami, a nie s dôvodmi ich výskytu.

Žiaľ, po nástupe Stalina k moci v roku 1924 je ruská lingvistika, podobne ako mnohé iné vedy, hodená späť. Mnohí talentovaní vedci boli nútení emigrovať, boli vyhnaní z krajiny alebo zomreli v táboroch. Až od polovice 50. rokov je možný určitý pluralizmus teórií – viac o tom v časti 1.2.

1.2 Aplikácia matematických metód v lingvistike v druhej polovici 20.

Do polovice dvadsiateho storočia sa vytvorili štyri svetové lingvistické školy, z ktorých každá sa ukázala byť predchodcom určitej „presnej“ metódy. Leningradská fonologická škola(jeho predkom bol žiak Baudouina de Courtenay L.V. Shcherba) použil psycholingvistický experiment založený na analýze reči rodených hovorcov ako hlavné kritérium na zovšeobecnenie zvuku vo forme fonémy.

Vedci Pražský lingvistický krúžok, konkrétne - jej zakladateľ N.S. Trubetskoy, ktorý emigroval z Ruska, rozvinul teóriu opozícií – sémantickú štruktúru jazyka opísali ako súbor opozične konštruovaných sémantických jednotiek – sem. Táto teória sa uplatnila pri štúdiu nielen jazyka, ale aj umeleckej kultúry.

Ideológovia americký deskriptivizmus boli lingvisti L. Bloomfield a E. Sapir. Jazyk bol deskriptivistom prezentovaný ako súbor rečových výrokov, ktoré boli hlavným predmetom ich štúdia. Zamerali sa na pravidlá vedeckého opisu (odtiaľ názov) textov: štúdium organizácie, usporiadania a klasifikácie ich prvkov. Formalizácia analytických postupov v oblasti fonológie a morfológie (rozvoj princípov štúdia jazyka na rôznych úrovniach, distributívna analýza, metóda priamych konštituentov a pod.) viedla k formulovaniu všeobecných otázok lingvistického modelovania. Nepozornosť plánovania obsahu jazyka, ako aj paradigmatickej stránky jazyka neumožňovali deskriptivistom dostatočne plnohodnotne interpretovať jazyk ako systém.

V 60. rokoch sa rozvinula teória formálnych gramatík, ktorá vznikla najmä vďaka pôsobeniu amerického filozofa a lingvistu N. Chomského. Je právom považovaný za jedného z najznámejších moderných vedcov a osobností verejného života, venuje sa mu množstvo článkov, monografií a dokonca aj celovečerný dokument. Pod názvom zásadne nového spôsobu opisu syntaktickej štruktúry vynájdenej Chomskym - generatívnej (generujúcej) gramatiky - bol zodpovedajúci trend v lingvistike tzv. generativizmus.

Chomsky, potomok prisťahovalcov z Ruska, študoval od roku 1945 lingvistiku, matematiku a filozofiu na Pensylvánskej univerzite, pričom bol silne ovplyvnený svojím učiteľom Zeligom Harrisom – podobne ako Harris aj Chomsky považoval a stále považuje svoje politické názory za blízke anarchizmu (stále je známy ako kritik existujúceho politického systému USA a ako jeden z duchovných vodcov antiglobalizmu).

Chomského prvé veľké vedecké dielo, diplomová práca „Morfológia modernej hebrejčiny » (1951) zostal nepublikovaný. Chomsky získal doktorát na Pensylvánskej univerzite v roku 1955, ale veľa z výskumu, z ktorého vychádzala jeho dizertačná práca (úplne publikovaná až v roku 1975 pod názvom Logická štruktúra lingvistickej teórie) a jeho prvá monografia Syntaktické štruktúry (1957, Rus. trans , 1962), bola vykonaná na Harvardskej univerzite v rokoch 1951-1955. V tom istom roku 1955 sa vedec presťahoval na Massachusetts Institute of Technology, kde sa v roku 1962 stal profesorom.

Chomského teória prešla niekoľkými fázami svojho vývoja.

V prvej monografii „Syntaktické štruktúry“ vedec predstavil jazyk ako mechanizmus na generovanie nekonečnej množiny viet pomocou konečnej množiny gramatických prostriedkov. Na opísanie jazykových vlastností navrhol koncepty hlbokých (skrytých pred priamym vnímaním a generovaných systémom rekurzívnych, t.j. opakovane aplikovateľných pravidiel) a povrchových (priamo vnímaných) gramatických štruktúr, ako aj transformácií, ktoré opisujú prechod. od hlbokých štruktúr po povrchové. Jednej hĺbkovej štruktúre môže zodpovedať niekoľko povrchových štruktúr (napríklad pasívna štruktúra Dekrét podpisuje prezident odvodené z rovnakej hlbokej štruktúry ako aktívny konštrukt Prezident dekrét podpisuje) a naopak (teda nejednoznačnosť matka miluje dcéru opísaný ako výsledok zhody povrchových štruktúr, ktoré sa vracajú k dvom rozdielnym hlbokým, z ktorých jedna je matkou tá, ktorá miluje dcéru, a druhá tá, ktorú miluje dcéra).

Chomského štandardná teória sa považuje za model „Aspektov“ uvedený v Chomského knihe „Aspekty teórie syntaxe“. V tomto modeli boli po prvýkrát do formálnej teórie zavedené pravidlá sémantickej interpretácie, ktoré pripisovali význam hlbokým štruktúram. V Aspektoch sa jazyková kompetencia stavia do protikladu k používaniu jazyka (výkonu), preberá sa takzvaná Katz-Postalova hypotéza o zachovaní významu pri transformácii, v súvislosti s ktorou je vylúčený koncept fakultatívnej transformácie a aparát tzv. zavádzajú sa syntaktické znaky popisujúce lexikálnu kompatibilitu.

Chomsky v 70. rokoch pracoval na teórii riadenia a väzby (GB-teória – zo slov. vláda a viazanie) je všeobecnejší ako predchádzajúci. Vedec v ňom upustil od špecifických pravidiel, ktoré popisujú syntaktické štruktúry konkrétnych jazykov. Všetky transformácie boli nahradené jednou univerzálnou transformáciou pohybu. V rámci GB teórie existujú aj súkromné ​​moduly, z ktorých každý zodpovedá za svoju časť gramatiky.

Už nedávno, v roku 1995, Chomsky predložil minimalistický program, kde je ľudský jazyk opísaný ako strojový jazyk. Toto je len program - nie model alebo teória. Chomsky v nej identifikuje dva hlavné subsystémy ľudského jazykového aparátu: lexikón a výpočtový systém, ako aj dve rozhrania – fonetické a logické.

Chomského formálne gramatiky sa stali klasickými pre popis nielen prirodzených, ale aj umelých jazykov - najmä programovacích jazykov. Rozvoj štruktúrnej lingvistiky v druhej polovici 20. storočia možno právom považovať za „chomskú revolúciu“.

Moskovská fonologická škola, ktorej predstaviteľmi boli A.A. Reformatsky, V.N. Sidorov, P.S. Kuznecov, A.M. Suchotin, R.I. Avanesov, použil podobnú teóriu na štúdium fonetiky. Postupne sa začínajú uplatňovať „exaktné“ metódy nielen vo fonetike, ale aj v syntaxi. Lingvisti aj matematici u nás aj v zahraničí začínajú študovať štruktúru jazyka. V 50. a 60. rokoch 20. storočia sa v ZSSR začala nová etapa interakcie medzi matematikou a lingvistikou spojená s rozvojom systémov strojového prekladu.

Podnetom na začatie týchto prác u nás bol prvý vývoj v oblasti strojového prekladu v USA (hoci prvé mechanizované prekladacie zariadenie P. P. Smirnova-Trojanského bolo vynájdené v ZSSR v roku 1933, keďže bolo primitívne, sa nerozšírili). V roku 1947 A. Butt a D. Britten prišli s kódom na preklad slov po slove pomocou počítača, o rok neskôr R. Richens navrhol pravidlo na delenie slov na kmene a koncovky v strojovom preklade. Tie roky boli úplne iné ako dnes. Boli to veľmi veľké a drahé stroje, ktoré zaberali celé miestnosti a na údržbu si vyžadovali veľký personál inžinierov, operátorov a programátorov. V podstate sa tieto počítače používali na vykonávanie matematických výpočtov pre potreby vojenských inštitúcií - nové v matematike, fyzike a technike slúžili predovšetkým vojenským záležitostiam. V raných fázach bol vývoj MP aktívne podporovaný armádou, s tým všetkým (v podmienkach studenej vojny) sa v USA rozvíjal rusko-anglický smer a v ZSSR smer anglo-ruský.

V januári 1954 sa na Massachusettskej technickej univerzite uskutočnil „Georgetownský experiment“ – prvá verejná ukážka prekladu z ruštiny do angličtiny na stroji IBM-701. Abstrakt správy o úspešnom absolvovaní experimentu, ktorú vytvoril D.Yu. Panov, objavil sa v RJ "Matematika", 1954, č. 10: "Preklad z jedného jazyka do druhého pomocou stroja: správa o prvom úspešnom teste."

D. Yu.Panov (v tom čase riaditeľ Ústavu vedeckých informácií - INI, neskôr VINITI) prilákal I. K. Belskaja, ktorý neskôr viedol skupinu strojového prekladu na Ústave presnej matematiky a počítačového inžinierstva Akadémie vied ZSSR. práca na strojovom preklade. Koncom roku 1955 sa datujú prvé skúsenosti s prekladom z angličtiny do ruštiny pomocou stroja BESM. Programy pre BESM zostavil N.P. Trifonov a L.N. Korolev, ktorého doktorandská práca bola venovaná metódam vytvárania slovníkov pre strojový preklad.

Paralelne prebiehali práce na strojovom preklade na Oddelení aplikovanej matematiky Matematického inštitútu Akadémie vied ZSSR (teraz Inštitút aplikovanej matematiky M. V. Keldysha Ruskej akadémie vied). Z iniciatívy matematika A.A. Ljapunov. Zapojil O.S. Kulagin a jej študenti T.D. Wentzel a N.N. Ricco. Myšlienky Ljapunova a Kulaginy o možnosti využitia technológie na preklad z jedného jazyka do druhého boli publikované v časopise Nature, 1955, č. Od konca roku 1955 T.N. Moloshnaya, ktorý potom začal samostatnú prácu na anglicko-ruskom prekladovom algoritme.

R. Frumkina, ktorý sa v tom čase zaoberal prekladovým algoritmom zo španielčiny, pripomína, že v tejto fáze práce bolo ťažké urobiť nejaké konzistentné kroky. Oveľa častejšie som sa musel riadiť heuristickou skúsenosťou – vlastnou alebo kolegami.

Zároveň bola prvá generácia systémov strojového prekladu veľmi nedokonalá. Všetky boli založené na sekvenčných prekladových algoritmoch „slovo po slove“, „fráza po fráze“ – sémantické spojenia medzi slovami a vetami neboli nijako brané do úvahy. Ide napríklad o tieto vety: John hľadal svoju krabicu na hračky.Nakoniec to našiel. Krabička bola v pere.John bol veľmi šťastný. (John hľadal svoju krabicu na hračky. Nakoniec ju našiel. Krabica bola v ohrádke. John bol veľmi šťastný.).“ „Pero“ v tomto kontexte nie je „pero“ (nástroj na písanie), ale „ohrádka“ ( hracie pero). Znalosť synoným, antoným a obrazných významov je ťažké zadať do počítača. Sľubným smerom bol vývoj počítačových systémov zameraných na využitie ľudského prekladača.

Postupom času boli systémy priameho prekladu nahradené T-systémami (z anglického slova "transfer" - transformácia), v ktorých sa preklad uskutočňoval na úrovni syntaktických štruktúr. Algoritmy T-systémov využívali mechanizmus, ktorý umožňoval zostaviť syntaktickú štruktúru podľa gramatických pravidiel jazyka vstupnej vety (podobne ako sa cudzí jazyk vyučuje na strednej škole) a následne syntetizovať výstupnú vetu. transformáciou syntaktickej štruktúry a dosadením potrebných slov zo slovníka.

Ljapunov hovoril o preklade tak, že vytiahol význam preloženého textu a prezentoval ho v inom jazyku. Za najdokonalejší sa stále považuje prístup k budovaniu systémov strojového prekladu založený na získavaní sémantickej reprezentácie vstupnej vety sémantickou analýzou a syntéze vstupnej vety podľa získanej sémantickej reprezentácie. Takéto systémy sa nazývajú I-systémy (od slova „interlingua“). Zároveň úloha ich vytvorenia, zasadená na prelome 50. a 60. rokov, nie je dodnes úplne vyriešená, a to aj napriek úsiliu Medzinárodnej federácie IFIP - svetovej komunity vedcov v oblasti spracovania informácií. .

Vedci premýšľali o tom, ako formalizovať a zostaviť algoritmy na prácu s textami, aké slovníky by sa mali vkladať do stroja, aké lingvistické vzory by sa mali používať pri strojovom preklade. Tradičná lingvistika takéto predstavy nemala – nielen z hľadiska sémantiky, ale ani z hľadiska syntaxe. V tom čase neexistovali zoznamy syntaktických konštrukcií pre žiadny jazyk, neboli skúmané podmienky ich kompatibility a zameniteľnosti, neboli vyvinuté pravidlá na zostavovanie veľkých jednotiek syntaktickej štruktúry z menších konštitučných prvkov.

Potreba vytvorenia teoretických základov strojového prekladu viedla k formovaniu a rozvoju matematickej lingvistiky. Vedúcu úlohu v tejto veci v ZSSR zohrali matematici A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, lingvisti V.Yu. Rosenzweig, P.S. Kuznecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginova dizertačná práca bola venovaná štúdiu formálnej teórie gramatík (súčasne s N. Khomskym v USA), Kuznecov predložil úlohu axiomatizácie lingvistiky, ktorá siaha až k prácam F.F. Fortunatov.

6. mája 1960 bola prijatá vyhláška Prezídia Akadémie vied ZSSR „O vývoji štrukturálnych a matematických metód štúdia jazyka“ a na Jazykovednom ústave a Ústave sv. ruský jazyk. Od roku 1960 začali popredné humanitárne univerzity v krajine - Filologická fakulta Moskovskej štátnej univerzity, Leninrad, Novosibirské univerzity, Moskovský štátny inštitút cudzích jazykov - školiť personál v oblasti automatického spracovania textu.

Práce o strojovom preklade tohto obdobia, nazývané „klasické“, sú zároveň viac teoretické ako praktické. Nákladovo efektívne systémy strojového prekladu sa začali vytvárať až v osemdesiatych rokoch minulého storočia. O tom budem hovoriť neskôr v časti 2.1, Strojový preklad.

60. - 70. roky 20. storočia zahŕňajú hlboký teoretický vývoj využívajúci metódy teórie množín a matematickej logiky, ako je teória poľa a teória fuzzy množín.

Autorom teórie poľa v lingvistike bol sovietsky básnik, prekladateľ a lingvista V.G. Admoni. Svoju teóriu spočiatku rozvíjal na základe nemeckého jazyka. Pre Admoniho pojem „pole“ označuje ľubovoľnú neprázdnu množinu jazykových prvkov (napríklad „lexikálne pole“, „sémantické pole“).

Štruktúra poľa je heterogénna: pozostáva z jadra, ktorého prvky majú kompletný súbor znakov, ktoré definujú množinu, a z periférie, ktorej prvky môžu mať obe znaky danej množiny (nie všetky) a susedných. Uvediem príklad ilustrujúci toto tvrdenie: napríklad v angličtine je pole zložených slov („day-dream“ – „sen“ ťažko oddeliteľné od oblasti fráz („slzný plyn“ – „slzný plyn“)) .

Už vyššie spomínaná teória fuzzy množín úzko súvisí s teóriou poľa. V ZSSR jazykovedci V.G. Admoni, I.P. Ivanová, G.G. Pochentsov, jeho predkom však bol americký matematik L. Zadeh, ktorý v roku 1965 publikoval článok „Fuzzy Logic“. Zade matematicky zdôvodnil teóriu fuzzy množín a zvážil ich na základe lingvistického materiálu.

V tejto teórii nehovoríme ani tak o príslušnosti prvkov k danej množine (Aa), ale o miere tohto členstva (Aa), keďže periférne prvky môžu v tej či onej miere patriť do viacerých polí. Zade (Lofti-zade) bol rodák z Azerbajdžanu, do 12 rokov mal prax komunikácie v štyroch jazykoch - azerbajdžančine, ruštine, angličtine a perzštine - a používal tri rôzne abecedy: cyriliku, latinku, arabčinu. Keď sa vedca pýtajú, čo je spoločné medzi teóriou fuzzy množín a lingvistikou, nepopiera toto spojenie, ale objasňuje: „Nie som si istý, či štúdium týchto jazykov malo veľký vplyv na moje myslenie. Ak to tak bolo, tak len podvedome. Zadeh v mladosti študoval na presbyteriánskej škole v Teheráne a po druhej svetovej vojne emigroval do USA. "Otázkou nie je, či som Američan, Rus, Azerbajdžan alebo niekto iný," povedal v jednom z rozhovorov, "som formovaný všetkými týmito kultúrami a národmi a medzi každým z nich sa cítim celkom dobre." V týchto slovách je niečo podobné tomu, čo charakterizuje teóriu fuzzy množín – odklon od jednoznačných definícií a ostrých kategórií.

U nás sa v 70. rokoch prekladali a študovali diela západných jazykovedcov 20. storočia. I.A. Melčuk preložil diela N. Chomského do ruštiny. NA. Slyusareva vo svojej knihe „Teória F. de Saussura vo svetle modernej lingvistiky“ spája postuláty Saussurovho učenia s aktuálnymi problémami lingvistiky 70. rokov. Existuje tendencia k ďalšej matematizácii lingvistiky. Popredné domáce univerzity školia personál v odbore „Matematická (teoretická, aplikovaná) lingvistika“. Zároveň na Západe dochádza k prudkému skoku vo vývoji výpočtovej techniky, ktorá si vyžaduje stále nové a nové jazykové základy.

V 80. rokoch 20. storočia profesor Ústavu orientalistiky Akadémie vied Yu.K. Lekomtsev pri analýze jazyka lingvistiky prostredníctvom analýzy schém, tabuliek a iných typov zápisov používaných v lingvistických popisoch považuje matematické systémy za vhodné na tieto účely (najmä systémy maticovej algebry).

V priebehu dvadsiateho storočia teda dochádzalo k zbližovaniu exaktných a humanitných vied. Interakcia matematiky a lingvistiky stále viac nachádzala praktické aplikácie. Viac o tom v ďalšej kapitole.

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1 Strojový preklad

Myšlienka prekladu z jedného jazyka do druhého pomocou univerzálneho mechanizmu vznikla niekoľko storočí predtým, ako sa začal prvý vývoj v tejto oblasti - už v roku 1649 René Descartes navrhol myšlienku jazyka, v ktorom by boli ekvivalentné myšlienky rôzne jazyky by boli vyjadrené jedným symbolom. Prvé pokusy o realizáciu tejto myšlienky v 30. – 40. rokoch 20. storočia, začiatok teoretického rozvoja v polovici storočia, zdokonaľovanie prekladateľských systémov pomocou techniky v 70. – 80. rokoch 20. storočia, prudký rozvoj prekladateľskej techniky v posl. desaťročie – to sú fázy vývoja strojového prekladu ako odvetvia. Počítačová lingvistika ako veda vyrástla z prác o strojovom preklade.

S rozvojom výpočtovej techniky koncom 70. a začiatkom 80. rokov si výskumníci stanovili reálnejšie a nákladovo efektívnejšie ciele – stroj sa nestal konkurentom (ako sa predtým predpokladalo), ale pomocníkom ľudského prekladateľa. Strojový preklad prestáva slúžiť výlučne vojenským úlohám (všetky sovietske a americké vynálezy a výskumy zamerané predovšetkým na ruštinu a angličtinu tak či onak prispeli k studenej vojne). V roku 1978 sa cez prepojenú sieť Arpa prenášali slová v prirodzenom jazyku a o šesť rokov neskôr sa v USA objavili prvé programy na preklad mikropočítačov.

V 70. rokoch Komisia Európskych spoločenstiev kupuje anglicko-francúzsku verziu počítačového prekladača Systran, pričom objednáva aj francúzsko-anglickú a taliansko-anglickú verziu a systém prekladu z ruštiny do angličtiny, ktorý používajú americké ozbrojené sily. Takto boli položené základy projektu EUROTRA.

O oživení strojového prekladu v 70-80 rokoch. svedčia o tom tieto skutočnosti: Komisia Európskych spoločenstiev (CEC) kupuje anglicko-francúzsku verziu Systran, ako aj prekladový systém z ruštiny do angličtiny (posledný vyvinutý po správe ALPAC a naďalej ho používa US Air Sila a NASA); okrem toho CEC nariaďuje vývoj francúzsko-anglickej a taliansko-anglickej verzie. Súčasne dochádza k rýchlemu rozmachu činností strojového prekladu v Japonsku; v USA Panamerická zdravotnícka organizácia (PAHO) nariaďuje rozvoj španielsko-anglického smeru (systém SPANAM); Americké letectvo financuje vývoj systému strojového prekladu v Lingvistic Research Center na Texaskej univerzite v Austine; Skupina TAUM v Kanade dosahuje pozoruhodný pokrok vo vývoji svojho systému METEO (meteorologický preklad). Množstvo projektov začalo v 70. a 80. rokoch. sa následne rozvinuli do plnohodnotných komerčných systémov.

V období rokov 1978-93 sa na výskum v oblasti strojového prekladu minulo 20 miliónov dolárov v USA, 70 miliónov v Európe a 200 miliónov v Japonsku.

Jednou z noviniek je technológia TM (translation memory), ktorá funguje na princípe akumulácie: počas procesu prekladu sa ukladá pôvodný segment (veta) a jej preklad, výsledkom čoho je vytvorenie lingvistickej databázy; ak sa v novo preloženom texte nájde identický alebo podobný segment, zobrazí sa spolu s prekladom a údajom o percentuálnej zhode. Prekladateľ potom urobí rozhodnutie (upraví, zamietne alebo prijme preklad), ktorého výsledok je uložený v systéme, takže nie je potrebné prekladať tú istú vetu dvakrát. Známy komerčný systém založený na technológii TM je v súčasnosti vyvinutý systémom TRADOS (založený v roku 1984).

V súčasnosti niekoľko desiatok spoločností vyvíja komerčné systémy strojového prekladu vrátane: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softvér; Linguistica b.v. a ďalšie Teraz môžete využívať služby automatických prekladačov priamo na webe: alphaWorks; Online prekladač PROMT, LogoMedia.net, prekladateľská služba Babel Fish od AltaVista; InfiniT.com; Preklad internetu.

Komerčne efektívne prekladateľské systémy sa objavili v druhej polovici 80. rokov aj u nás. Rozšíril sa samotný pojem strojového prekladu (začal zahŕňať „vytváranie množstva automatických a automatizovaných systémov a zariadení, ktoré automaticky alebo poloautomaticky vykonávajú celý cyklus prekladu alebo jednotlivé úlohy v dialógu s človekom“) a vládne prostriedky na rozvoj tohto odvetvia sa zvýšili.

Hlavnými jazykmi domácich prekladateľských systémov sa stali ruština, angličtina, nemčina, francúzština a japončina. All-Union Translation Center (VTsP) vyvinulo systém na preklad z angličtiny a nemčiny do ruštiny na počítači ES-1035-ANRAP. Pozostával z troch slovníkov – vstupného anglického a nemeckého a výstupného ruského – pod jedným softvérom. Existovalo niekoľko vzájomne zameniteľných špecializovaných slovníkov – pre výpočtovú techniku, programovanie, rádioelektroniku, strojárstvo, poľnohospodárstvo, hutníctvo. Systém mohol pracovať v dvoch režimoch – automatickom a interaktívnom, kedy sa na obrazovke zobrazoval zdrojový text a preklad na frázu, ktorú si človek mohol upraviť. Rýchlosť prekladu textu do ANRAP (od začiatku písania až po koniec tlače) bola približne 100 strán za hodinu.

V roku 1989 vznikla rodina komerčných prekladateľov typu SPRINT, pracujúcich s ruským, anglickým, nemeckým a japonským jazykom. Ich hlavnou výhodou bola kompatibilita s IBM PC - domáce systémy strojového prekladu tak dosiahli medzinárodnú úroveň kvality. Súčasne sa vyvíja systém strojového prekladu z francúzštiny do ruštiny FRAP, ktorý zahŕňa 4 stupne analýzy textu: grafemickú, morfologickú, syntaktickú a sémantiku. V LGPI ich. Herzen, prebiehali práce na štvorjazyčnom (anglický, francúzsky, španielsky, ruský) systém SILOD-MP (v priemyselnom režime sa používali anglicko-ruský a francúzsko-ruský slovník.

Pre špecializovaný preklad textov z elektrotechniky existoval systém ETAP-2. Analýza vstupného textu v nej prebiehala v dvoch rovinách – morfologickej a syntaktickej. Slovník ETAP-2 obsahoval asi 4 tisíc hesiel; štádium transformácie textu - asi 1000 pravidiel (96 všeobecných, 342 súkromných, zvyšok tvorí slovník). To všetko zabezpečilo uspokojivú kvalitu prekladu (povedzme, že názov patentu „Optical phase grid organization and coupling device having a take management“ bol preložený ako „Zariadenie s optickou fázovou mriežkou a spojovacie zariadenie s takýmto zariadením“ – napriek tautológia, význam je zachovaný).

V Minskom pedagogickom ústave cudzích jazykov bol na základe anglicko-ruského slovníka slovných tvarov a fráz vynájdený systém na strojový preklad názvov, v Ústave orientalistiky Akadémie vied systém na prekladanie z japončiny do ruštiny. Prvá automatická slovníková a terminologická služba (SLOTHERM) pre výpočtovú techniku ​​a programovanie, vytvorená na Moskovskom výskumnom ústave automatizačných systémov, obsahovala približne 20 000 výrazov vo výkladovom slovníku a špeciálnych slovníkoch pre lingvistický výskum.

Systémy strojového prekladu sa postupne začali využívať nielen na určený účel, ale aj ako dôležitá súčasť systémov automatického učenia (na výučbu prekladu, kontrolu pravopisu a gramatických znalostí).

90. roky so sebou priniesli rýchly rozvoj trhu s PC (od stolných po vreckové) a informačných technológií, rozšírené používanie internetu (ktorý sa stáva viac medzinárodným a viacjazyčným). To všetko spôsobilo, že ďalší vývoj automatizovaných prekladateľských systémov bol žiadaný. Od začiatku 90. rokov 20. storočia Na trh PC systémov vstupujú aj domáci vývojári.

V júli 1990 bol na PC Fóre v Moskve predstavený prvý komerčný systém strojového prekladu v Rusku s názvom PROMT (PROgrammer's Machine Translation).V roku 1991 ZAO [!!! V súlade s federálnym zákonom-99 z 05.05. bola nahradená neverejnou akciovou spoločnosťou] „Projekt MT“ a už v roku 1992 vyhrala spoločnosť PROMT súťaž NASA na dodávku systémov MP (PROMT bola jedinou neamerickou spoločnosťou v tejto súťaži). celá rodina systémov pod novým názvom STYLUS na preklady z angličtiny, nemčiny, francúzštiny, taliančiny a španielčiny do ruštiny a z ruštiny do angličtiny a v roku 1993 bol na báze STYLUS vytvorený prvý systém strojového prekladu na svete pre Windows. STYLUS 2.0 pre Windows 3.X/95/NT bola uvedená na trh a v rokoch 1995-1996 bola predstavená tretia generácia systémov strojového prekladu, plne 32-bitový STYLUS 3.0 pre Windows 95/NT, súčasne s vývojom úplne nový, prvý na svete rusko-nemecký a rusko-francúzsky systém strojového prekladu.

V roku 1997 bola podpísaná dohoda s francúzskou spoločnosťou Softissimo o vytvorení prekladových systémov z francúzštiny do nemčiny a angličtiny a naopak a v decembri tohto roku bol vydaný prvý nemecko-francúzsky prekladateľský systém na svete. V tom istom roku spoločnosť PROMT vydala systém implementovaný pomocou technológie Gigant, ktorý podporuje niekoľko jazykových smerov v jednom shellu, ako aj špeciálny prekladač pre prácu na internete WebTranSite.

V roku 1998 vyšla celá plejáda programov pod novým názvom PROMT 98. O rok neskôr PROMT vydal dva nové produkty: unikátny softvérový balík pre prácu na internete - PROMT Internet a prekladač pre firemné poštové systémy - PROMT Mail Prekladateľ. V novembri 1999 bol PROMT uznaný ako najlepší systém strojového prekladu testovaný francúzskym časopisom PC Expert, keď prekonal svojich konkurentov o 30 percent. Pre firemných klientov boli vyvinuté aj špeciálne serverové riešenia - podnikový prekladový server PROMT Translation Server (PTS) a internetové riešenie PROMT Internet Translation Server (PITS). V roku 2000 PROMT aktualizoval celý svoj rad softvérových produktov vydaním novej generácie systémov MT: PROMT Translation Office 2000, PROMT Internet 2000 a Magic Gooddy 2000.

Online preklad s podporou systému PROMT sa používa na mnohých domácich a zahraničných stránkach: Online Translator PROMT, InfiniT.com, Translate.Ru, Lycos atď., Ako aj v inštitúciách rôznych profilov na preklady obchodných dokumentov, články a listy (existujú prekladateľské systémy zabudované priamo v programe Outlook Express a iných e-mailových klientoch).

V súčasnosti sa objavujú nové technológie strojového prekladu založené na využívaní systémov umelej inteligencie a štatistických metód. O druhom - v ďalšej časti.

2.2 Extrajazykových metód

Značná pozornosť sa v modernej lingvistike venuje štúdiu jazykových javov pomocou metód kvantitatívnej matematiky. Kvantitatívne údaje často pomáhajú hlbšie pochopiť skúmané javy, ich miesto a úlohu v systéme súvisiacich javov. Odpoveď na otázku „koľko“ pomáha odpovedať na otázky „čo“, „ako“, „prečo“ – taký je heuristický potenciál kvantitatívnej charakteristiky.

Štatistické metódy zohrávajú významnú úlohu vo vývoji systémov strojového prekladu (pozri časť 2.1). V štatistickom prístupe sa problém prekladu posudzuje z hľadiska hlučného kanála. Predstavte si, že potrebujeme preložiť vetu z angličtiny do ruštiny. Princíp noisy channel nám ponúka nasledujúce vysvetlenie vzťahu medzi anglickou a ruskou vetou: anglická veta nie je nič iné ako ruská veta skomolená nejakým hlukom. Aby sme mohli obnoviť pôvodnú ruskú vetu, potrebujeme vedieť, čo ľudia zvyčajne hovoria v ruštine a ako sa ruské frázy skomolia do angličtiny. Preklad sa uskutočňuje vyhľadávaním takej ruskej vety, ktorá maximalizuje súčin bezpodmienečnej pravdepodobnosti ruskej vety a pravdepodobnosti anglickej vety (originálu) danej ruskej vety. Podľa Bayesovej vety je táto ruská veta najpravdepodobnejším prekladom angličtiny:

kde e je prekladová veta a f je pôvodná veta

Potrebujeme teda zdrojový model a model kanála alebo jazykový model a model prekladu. Jazykový model musí priradiť skóre pravdepodobnosti akejkoľvek vete v cieľovom jazyku (v našom prípade ruštine) a prekladový model pôvodnej vete. (pozri tabuľku 1)

Vo všeobecnosti systém strojového prekladu funguje v dvoch režimoch:

1. Systémové školenie: vezme sa trénovací korpus paralelných textov a pomocou lineárneho programovania sa hľadajú také hodnoty prekladových korešpondenčných tabuliek, ktoré maximalizujú pravdepodobnosť (napríklad) ruskej časti korpusu s dostupnou angličtinou podľa na vybraný model prekladu. Model ruského jazyka je postavený na ruskej časti toho istého korpusu.

2. Využitie: na základe údajov získaných pre neznámu anglickú vetu sa hľadá ruština, ktorá maximalizuje súčin pravdepodobností priradených jazykovým modelom a modelom prekladu. Program používaný na takéto vyhľadávanie sa nazýva dekodér.

Najjednoduchším štatistickým modelom prekladu je model doslovného prekladu. Tento model predpokladá, že na preloženie vety z jedného jazyka do druhého stačí preložiť všetky slová (vytvoriť „vrecko slov“) a model zabezpečí ich umiestnenie v správnom poradí. a, f | e) až P(a | e , f), t.j. pravdepodobnosti daného zarovnania pri danej dvojici viet, každá pravdepodobnosť P(a, f | e) je normalizovaná súčtom pravdepodobností všetkých zarovnaní danej dvojice viet:

Implementácia Viterbiho algoritmu, ktorý sa používa na trénovanie modelu #1, je nasledovná:

1. Celá tabuľka pravdepodobnosti korešpondencie prekladu je vyplnená rovnakými hodnotami.

2. Pre všetky možné varianty párových spojení slov sa vypočíta pravdepodobnosť P(a, f | e):

3. Hodnoty P(a, f | e) sa normalizujú, aby sa získali hodnoty P(a | e, f).

4. Vypočíta sa frekvencia každého translačného páru, vážená pravdepodobnosťou každej možnosti zarovnania.

5. Výsledné vážené frekvencie sa normalizujú a tvoria novú tabuľku pravdepodobností korešpondencie prekladu

6. Algoritmus sa opakuje od kroku 2.

Uvažujme ako príklad trénovanie podobného modelu na korpuse dvoch párov viet (obr. 2):

Biely dom

Po veľkom počte iterácií dostaneme tabuľku (tabuľka 2), ktorá ukazuje, že preklad sa vykonáva s vysokou presnosťou.

Štatistické metódy sú tiež široko používané pri štúdiu slovnej zásoby, morfológie, syntaxe a štýlu. Vedci z Permskej štátnej univerzity vypracovali štúdiu založenú na tvrdení, že stereotypné frázy sú dôležitým „stavebným materiálom“ textu. Tieto frázy pozostávajú z „jadrových“ opakovaných slov a závislých špecifikátorov slov a majú výrazné štylistické zafarbenie.

Vo vedeckom štýle možno „jadrové“ slová nazvať: výskum, štúdium, úloha, problém, otázka, jav, fakt, pozorovanie, analýza atď. V žurnalistike budú iné slová „jadrové“, ktoré majú zvýšenú hodnotu špeciálne pre text novín: čas, osoba, moc, podnikanie, akcia, zákon, život, história, miesto atď. (celkom 29)

Pre jazykovedcov je zaujímavá aj odborná diferenciácia národného jazyka, originalita používania slovnej zásoby a gramatiky v závislosti od druhu zamestnania. Je známe, že vodiči v odbornej reči používajú tvar w o fer, hovoria medici k o klub namiesto kokteilu Yu sh - takéto príklady možno uviesť. Úlohou štatistiky je sledovať variabilitu výslovnosti a zmenu jazykovej normy.

Profesijné rozdiely vedú k rozdielom nielen gramatickým, ale aj lexikálnym. Jakutská štátna univerzita pomenovaná po M.K. Ammosova bolo analyzovaných 50 dotazníkov s najčastejšími reakciami na určité slová medzi lekármi a staviteľmi (tabuľka 3).

Stavitelia

človek

pacient (10), osobnosť (5)

muž (5)

dobre

pomoc (8), pomoc (7)

zlo (16)

života

smrť (10)

krásne (5)

smrť

mŕtvola (8)

život (6)

oheň

teplo (8), horieť (6)

oheň (7)

prstom

ruka (14), panaritium (5)

veľký (7), index (6)

oči

zrak (6), žiak, oftalmológ (po 5)

hnedá (10), veľká (6)

hlavu

myseľ (14), mozog (5)

veľký (9), inteligentný (8), inteligentný (6)

stratiť

vedomie, život (každý 4)

peniaze (5), nájsť (4)

Možno konštatovať, že lekári častejšie ako stavbári dávajú asociácie súvisiace s ich profesijnou činnosťou, keďže slovné podnety uvedené v dotazníku súvisia viac s ich profesiou ako s profesiou stavbára.

Štatistické zákonitosti v jazyku sa používajú na vytváranie frekvenčných slovníkov - slovníkov, ktoré poskytujú číselné charakteristiky frekvencie slov (tvarov slov, slovných spojení) ľubovoľného jazyka - jazyka pisateľa, akéhokoľvek diela a pod. slovo sa používa ako charakteristika použitia v texte určitého zväzku

Model vnímania reči nie je možný bez slovníka ako jeho základnej zložky. Vo vnímaní reči je základnou operačnou jednotkou slovo. Z toho vyplýva najmä to, že každé slovo vnímaného textu musí byť stotožnené s príslušnou jednotkou vnútornej slovnej zásoby poslucháča (či čitateľa). Je prirodzené predpokladať, že vyhľadávanie je od začiatku obmedzené na niektoré subdomény slovníka. Podľa väčšiny moderných teórií vnímania reči poskytuje skutočná fonetická analýza znejúceho textu v typickom prípade iba niektoré čiastkové informácie o možnom fonologickom vzhľade slova a tento druh informácií zodpovedá nie jednému, ale určitému MNOHÉM slovám. slovníka; Preto vznikajú dva problémy:

a) vybrať vhodný súbor podľa určitých parametrov;

(b) v rámci vymedzeného súboru (ak je primerane pridelený) „eliminovať“ všetky slová okrem jediného, ​​ktoré najlepšie zodpovedá danému slovu rozpoznaného textu. Jednou zo stratégií „vypadnutia“ je vylúčenie nízkofrekvenčných slov. Z toho vyplýva, že slovnou zásobou pre vnímanie reči je frekvenčný slovník. Práve vytvorenie počítačovej verzie frekvenčného slovníka ruského jazyka je prvotnou úlohou predkladaného projektu.

Na základe materiálu ruského jazyka existuje 5 frekvenčných slovníkov (nepočítajúc odvetvové slovníky). Všimnime si len niektoré všeobecné nedostatky existujúcich slovníkov.

Všetky známe frekvenčné slovníky ruského jazyka sú založené na spracovaní polí písaných (tlačených) textov. Čiastočne z tohto dôvodu, keď je identita slova z veľkej časti založená na formálnej, grafickej zhode, nie je dostatočne zohľadnená sémantika. V dôsledku toho sú aj frekvenčné charakteristiky posunuté, skreslené; ak napríklad kompilátor frekvenčného slovníka zahrnie slová z kombinácie „navzájom“ do všeobecnej štatistiky používania slova „priateľ“, potom je to sotva opodstatnené: vzhľadom na sémantiku musíme priznať, že tieto sú už rôzne slová, alebo skôr, že samostatnou jednotkou slovníka je len kombinácia ako celok.

Vo všetkých existujúcich slovníkoch sú slová umiestnené iba v základných tvaroch: podstatné mená v jednotnom čísle, nominatív, slovesá v infinitívnom tvare atď. Niektoré zo slovníkov poskytujú informácie o frekvencii slovných tvarov, ale zvyčajne to nerobia dostatočne dôsledne, nie vyčerpávajúco. Frekvencie rôznych slovných tvarov toho istého slova sa zjavne nezhodujú. Vývojár modelu vnímania reči musí brať do úvahy, že v reálnom percepčnom procese je to práve konkrétna slovná forma, ktorá je „ponorená“ v texte, ktorý podlieha rozpoznaniu: na základe analýzy počiatočnej časti exponentu tvar slova sa vytvorí množina slov s identickým začiatkom, pričom začiatočná časť slovnej formy nemusí byť nevyhnutne identická s počiatočnou časťou slovníkovej formy . Práve tvar slova má špecifickú rytmickú štruktúru, ktorá je tiež mimoriadne dôležitým parametrom pre percepčný výber slov. Napokon, v konečnom znázornení rozpoznanej výpovede sú slová opäť reprezentované zodpovedajúcimi tvarmi slov.

Existuje mnoho prác, ktoré demonštrujú dôležitosť frekvencie v procese vnímania reči. Nie sú nám ale známe práce, kde by sa používala frekvencia slovných tvarov – naopak, všetci autori frekvenciu jednotlivých tvarov slov prakticky ignorujú, pričom sa odvolávajú výlučne na lexémy. Ak sa nimi získané výsledky nepovažujú za artefakty, treba predpokladať, že rodený hovorca má nejakým spôsobom prístup k informáciám o pomere frekvencií slovných foriem a slovníkových foriem, teda vlastne lexém. Navyše, takýto prechod od slovnej formy k lexéme, samozrejme, nemožno vysvetliť prirodzenou znalosťou zodpovedajúcej paradigmy, keďže frekvenčná informácia musí byť použitá pred konečnou identifikáciou slova, inak jednoducho stráca svoj význam.

Podľa primárnych štatistických charakteristík je možné s danou relatívnou chybou určiť tú časť slovníka, ktorá obsahuje slová s vysokou frekvenciou výskytu, bez ohľadu na druh textu. Zavedením postupného zoradenia do slovníka je tiež možné získať sériu slovníkov pokrývajúcich prvých 100, 1000, 5000 atď. častých slov. Štatistické charakteristiky slovníka sú zaujímavé v súvislosti so sémantickou analýzou slovnej zásoby. Štúdium predmetovo-ideologických skupín a sémantických polí ukazuje, že lexikálne asociácie sú podporované sémantickými väzbami, ktoré sú sústredené okolo lexém s najbežnejším významom. Opis významov v lexikálno-sémantickej oblasti možno uskutočniť identifikáciou slov s významovo najabstraktnejšími lexémami. Zdá sa, že „prázdne“ (z hľadiska nominatívnych potencií) slovníkové jednotky tvoria štatisticky homogénnu vrstvu.

Nemenej hodnotné sú slovníky pre jednotlivé žánre. Štúdium miery ich podobnosti a charakteru štatistických distribúcií poskytne zaujímavé informácie o kvalitatívnom rozvrstvení slovnej zásoby v závislosti od sféry používania reči.

Zostavovanie veľkých frekvenčných slovníkov si vyžaduje použitie výpočtovej techniky. ZAVEDENIE čiastočnej mechanizácie a automatizácie do procesu práce na slovníku je zaujímavé ako experiment strojového spracovania slovníkov pre rôzne texty. Takýto slovník si vyžaduje prísnejší systém spracovania a akumulácie slovnej zásoby. V miniatúre ide o systém na vyhľadávanie informácií, ktorý je schopný poskytnúť informácie o rôznych aspektoch textu a slovnej zásoby. Niektoré základné požiadavky na tento systém sú naplánované od samého začiatku: celkový počet inventárnych slov, štatistické charakteristiky jedného slova a celých slovníkov, zoradenie častých a zriedkavých oblastí slovníka atď. Súbor kariet stroja vám umožňuje na automatické vytváranie reverzných slovníkov pre jednotlivé žánre a zdroje. Mnoho ďalších užitočných štatistických informácií o jazyku sa získa z nahromadeného súboru informácií. Počítačový frekvenčný slovník vytvára experimentálny základ pre prechod k rozsiahlejšej automatizácii práce so slovnou zásobou.

Štatistické údaje frekvenčných slovníkov možno široko využiť aj pri riešení iných lingvistických problémov - napríklad pri analýze a určovaní aktívnych prostriedkov tvorby slov v modernom ruskom jazyku, pri riešení problémov zdokonaľovania grafiky a pravopisu, ktoré súvisia s prevzatím zohľadňovať štatistické informácie o slovnej zásobe (pri tom všetkom je dôležité brať do úvahy pravdepodobnostné charakteristiky grafémových kombinácií, typy slovných spojení písmen), praktický prepis a transliteráciu. Štatistické parametre slovníka budú užitočné aj pri riešení problémov automatizácie písania, rozpoznávania a automatického čítania doslovného textu.

Moderné výkladové slovníky a gramatiky ruského jazyka sú postavené najmä na základe literárnych a umeleckých textov. Existujú frekvenčné slovníky jazyka A.S. Puškin, A.S. Griboedová, F.M. Dostojevskij, V.V. Vysockij a mnohí ďalší autori. Na Katedre histórie a teórie literatúry Smolenského štátu. Vysoká škola pedagogická už niekoľko rokov pracuje na zostavovaní frekvenčných slovníkov básnických a prozaických textov. Pre túto štúdiu boli vybrané frekvenčné slovníky všetkých textov Puškina a ďalších dvoch básnikov zlatého veku – „Beda z vtipu“ od Gribojedova a celá Lermontovova poézia; Pasternak a ďalší piati básnici Strieborného veku - Balmont 1894-1903, "Básne o krásnej dáme" od Bloka, "Stone" od Mandelstama, "Ohnivý stĺp" od Gumilyova, "Anno Domini MCMXXI" od Achmatovej a "Sestry of Môj život“ od Pasternaka a ďalších štyroch básnikov doby železnej – „Básne Jurija Živaga“, „Keď sa vyjasní“, celý korpus textov M. Petrovsa, „Cesta je ďaleko“, „Veterné sklo“, "Rozlúčka so snehom" a "Podkovy" od Mezhirova, "Antimirov" od Voznesenskyho a "Snežnica » Rylenkova.

Treba poznamenať, že tieto slovníky sú svojou povahou odlišné: niektoré predstavujú slovnú zásobu jedného dramatického diela, iné - knihy textov alebo niekoľko kníh alebo celý korpus básní básnika. Výsledky analýzy prezentované v tomto príspevku treba brať s rezervou, nemožno ich brať ako absolútne. Zároveň sa pomocou špeciálnych opatrení dá do určitej miery znížiť rozdiel v ontologickom charaktere textov.

V posledných rokoch sa čoraz zreteľnejšie prejavuje protiklad medzi hovorovou a knižnou rečou. Táto problematika je obzvlášť ostro diskutovaná medzi metodikmi, ktorí požadujú obrat vo výučbe smerom k hovorenému jazyku. Špecifickosť hovorovej reči zároveň zostáva stále nevysvetlená.

Slovníky boli spracované vytvorením používateľskej aplikácie v prostredí kancelárskeho programu EXCEL97. Súčasťou aplikácie sú štyri pracovné listy knihy EXCEL - "Hárok s názvom", list "Slovníky" s počiatočnými údajmi, "Blízky" a "Vzdialenosti" s výsledkami, ako aj sadu makier.

Počiatočné informácie sa zadávajú na hárku "Slovníky". Slovníky študovaných textov sa zapisujú do buniek EXCEL, posledný stĺpec S sa tvorí zo získaných výsledkov a rovná sa počtu slov nájdených v iných slovníkoch. Tabuľky „Blízkosť“ a „Vzdialenosti“ obsahujú vypočítané miery blízkosti M, korelácie R a vzdialenosti D.

Aplikačné makrá sú programovacie procedúry založené na udalostiach napísané vo Visual Basic for Application (VBA). Procedúry sú založené na objektoch knižnice VBA a metódach ich spracovania. Pre operácie s pracovnými hárkami aplikácie sa teda používa kľúčový objekt Pracovný hárok (pracovný hárok) a príslušný spôsob aktivácie hárku Aktivovať (aktivovať). Nastavenie rozsahu analyzovaných zdrojových údajov na hárku Slovník sa vykonáva metódou Select objektu Range (rozsah) a prenos slov ako hodnôt do premenných sa vykonáva ako vlastnosť Value (hodnota) rovnakého rozsahu. objekt.

Napriek tomu, že analýza korelácie poradia nás robí obozretnými, pokiaľ ide o závislosť tém medzi rôznymi textami, väčšina najfrekventovanejších slov v každom texte má zhodu v jednom alebo viacerých iných textoch. Stĺpec S zobrazuje počet takýchto slov medzi 15 najfrekventovanejšími slovami u každého autora. Slová napísané tučným písmom sa v našej tabuľke vyskytujú iba v slovách jedného básnika. Blok, Achmatova a Petrovs nemajú zvýraznené slová vôbec, majú S = 15. Títo traja básnici majú rovnakých 15 najfrekventovanejších slov, líšia sa len miestom v zozname. Ale aj Puškin, ktorého slovná zásoba je najoriginálnejšia, má S = 8 a je tam 7 zvýraznených slov.

Výsledky ukazujú, že existuje určitá vrstva slovnej zásoby, ktorá koncentruje hlavné témy poézie. Spravidla sú tieto slová krátke: z celkového počtu (225) slovných použití jednoslabičných 88, dvojslabičných 127, trojslabičných 10. Tieto slová často predstavujú hlavné mytologémy a môžu sa rozdeliť do dvojíc: noc - deň, zem - nebo (slnko), Boh - človek (ľudia), život - smrť, telo - duša, Rím - svet(v Mandelstame); možno kombinovať do mytológov vyššej úrovne: nebo, hviezda, slnko, zem; v človeku spravidla vynikne telo, srdce, krv, ruka, noha, líce, oči. Z ľudských stavov sa uprednostňuje spánok a láska. Dom a mestá patria do ľudského sveta – Moskva, Rím, Paríž. Kreativita je reprezentovaná lexémami slovo a pieseň.

Griboedov a Lermontov nemajú medzi najfrekventovanejšími slovami takmer žiadne slová označujúce prírodu. Majú trikrát toľko slov, ktoré označujú človeka, časti jeho tela, prvky jeho duchovného sveta. Puškin a básnici dvadsiateho storočia. Označenia človeka a prírody sú približne rovnaké. V tomto dôležitom aspekte predmetu môžeme povedať, že dvadsiate storočie. nasledoval Puškina.

Minimálna téma biznis medzi najfrekventovanejšími slovami sa vyskytuje len u Gribojedova a Puškina. Lermontov a básnici dvadsiateho storočia. ustupuje minimálnej téme slovo. Slovo nevylučuje skutky (biblický výklad témy: v Novom zákone sa všetko učenie Ježiša Krista považuje za slovo Božie alebo slovo Ježišovo a apoštoli sa niekedy nazývajú služobníkmi Slova). Posvätný význam lexémy slova sa presvedčivo prejavuje napríklad v Pasternakovom verši „A obraz sveta, zjavený v Slove“. Posvätný význam lexémy slovo v spojení a kontraste s ľudskými záležitosťami sa presvedčivo prejavuje v rovnomennej básni Gumilyova.

Žetóny, ktoré sa nachádzajú len v jednom texte, charakterizujú originalitu danej knihy alebo zbierky kníh. Napríklad slovo „myseľ“ je najfrekventovanejšie v Griboedovovej komédii „Beda vtipu“ – medzi frekventovanými slovami iných textov sa však nevyskytuje. Téma mysle je v komédii jednoznačne najvýznamnejšia. Táto lexéma sprevádza obraz Chatského a meno Chatského je v komédii najčastejšie. Dielo teda organicky spája najčastejšie spoločné podstatné meno s najfrekventovanejším vlastným menom.

Najvyšší korelačný koeficient spája témy tragických kníh „Ohnivý stĺp“ od Gumilyova a „Anno Domini MCMXXI“ od Achmatovovej. Medzi 15 najfrekventovanejšími podstatnými menami je 10 bežných, medzi ktoré patrí krv, srdce, duša, láska, slovo, nebo. Pripomeňme, že kniha Akhmatova obsahovala miniatúru „Nebudeš nažive ...“, napísanú medzi zatknutím Gumilyova a jeho popravou.

Témy sviečky a davu v študovanom materiáli sa nachádzajú iba v "Básňach Jurija Živaga". Téma sviečky vo veršoch z románu má mnoho kontextových významov: spája sa s obrazom Ježiša Krista, s témami viery, nesmrteľnosti, tvorivosti, milostného dátumu. Sviečka je najdôležitejším zdrojom svetla v ústredných scénach románu. Téma davu sa rozvíja v súvislosti s hlavnou myšlienkou románu, v ktorej je súkromný život človeka s jeho neotrasiteľnými hodnotami v protiklade k nemorálnosti nového štátu, postaveného na princípoch potešenia davu. .

Práca zahŕňa aj tretiu etapu, ktorá sa odráža aj v programe, a to výpočet rozdielu v poradových číslach slov spoločných pre dva slovníky a priemernej vzdialenosti medzi rovnakými slovami dvoch slovníkov. Táto fáza umožňuje prejsť od všeobecných trendov v interakcii slovníkov identifikovaných pomocou štatistík na úroveň približujúcu sa textu. Napríklad knihy Gumilyova a Achmatovovej štatisticky významne korelujú. Pozeráme sa na to, ktoré slová sa ukázali ako bežné pre ich slovníky, a predovšetkým vyberáme tie, ktorých sériové čísla sa líšia minimálne alebo sú rovné nule. Práve tieto slová majú rovnaké poradové číslo, a preto sú tieto minimálne témy v mysliach dvoch básnikov rovnako dôležité. Ďalej by ste sa mali presunúť na úroveň textov a kontextov.

Kvantitatívne metódy tiež pomáhajú študovať charakteristiky národov - rodených hovorcov. Povedzme, že v ruštine je 6 prípadov, v angličtine nie sú žiadne a v niektorých jazykoch národov Dagestanu počet prípadov dosahuje 40. L. Perlovský vo svojom článku „Vedomie, jazyk a kultúra“ tieto koreluje charakteristiky so sklonom národov k individualizmu alebo kolektivizmu, s vnímaním vecí a javov oddelene alebo v spojení s inými. Koniec koncov, práve v anglicky hovoriacom svete (nie sú žiadne prípady - vec sa vníma „sama od seba“) sa objavili také pojmy ako individuálna sloboda, liberalizmus a demokracia (podotýkam, že tieto pojmy používam len v súvislosti s tzv. jazyk, bez akýchkoľvek hodnotiacich charakteristík). Napriek tomu, že takéto dohady stále zostávajú len na úrovni odvážnych vedeckých hypotéz, pomáhajú pozerať sa na už známe javy novým spôsobom.

Ako vidíme, kvantitatívne charakteristiky možno uplatniť v úplne iných oblastiach lingvistiky, čím sa čoraz viac stierajú hranice medzi „exaktnými“ a „humanitárnymi“ metódami. Lingvistika sa pri riešení svojich problémov čoraz viac uchyľuje k pomoci nielen matematiky, ale aj počítačovej techniky.

2.3 Učenie Ijazyka metódami formálnej logiky

S nekvantitatívnymi metódami matematiky, najmä s logikou, interaguje moderná teoretická lingvistika nemenej plodne ako s kvantitatívnymi. Rýchly rozvoj počítačových technológií a rast ich úlohy v modernom svete si vyžiadal revíziu prístupu k interakcii jazyka a logiky vo všeobecnosti.

Metódy logiky sa široko používajú pri vývoji formalizovaných jazykov, najmä programovacích jazykov, ktorých prvkami sú niektoré symboly (podobné matematickým), vybrané (alebo skonštruované z predtým vybraných symbolov) a interpretované určitým spôsobom, spojené bez „tradičného“ používania, chápania a chápania.funkcie rovnakých symbolov v iných kontextoch. Programátor sa vo svojej práci neustále zaoberá logikou. Zmyslom programovania je len naučiť počítač uvažovať (v najširšom zmysle slova). Zároveň sa ukazuje, že metódy „uvažovania“ sú veľmi odlišné. Každý programátor strávi určitý čas hľadaním chýb vo svojich programoch a programoch iných ľudí. Teda hľadať chyby v uvažovaní, v logike. A to tiež zanecháva stopy. V bežnej reči je oveľa jednoduchšie odhaliť logické chyby. Relatívna jednoduchosť jazykov, ktoré študujú logici, im umožňuje jasnejšie objasniť štruktúry týchto jazykov, ako by to mohli dosiahnuť lingvisti, ktorí analyzujú výlučne zložité prirodzené jazyky. Vzhľadom na skutočnosť, že jazyky, ktoré študujú logici, využívajú vzťahy skopírované z prirodzených jazykov, môžu logici významne prispieť k všeobecnej teórii jazyka. Situácia je tu podobná ako vo fyzike: fyzik formuluje vety aj pre ideálne zjednodušené prípady, ktoré sa v prírode vôbec nevyskytujú – formuluje zákony pre ideálne plyny, ideálne kvapaliny, hovorí o pohybe pri neprítomnosti trenia, o pohybe bez trenia, o pohybe bez trenia. atď. Pre tieto zidealizované prípady sa dajú stanoviť jednoduché zákony, ktoré by výrazne prispeli k pochopeniu toho, čo sa v skutočnosti deje a čo by fyzike zrejme zostalo neznáme, keby sa snažila uvažovať o realite priamo, v celej jej zložitosti.

Pri štúdiu prirodzených jazykov sa používajú logické metódy, aby si študenti jazyka nemohli hlúpo „zapamätať“ čo najviac slov, ale lepšie pochopili jeho štruktúru. L. Shcherba vo svojich prednáškach použil aj príklad vety zostavenej podľa zákonov ruského jazyka: „Lesknúca sa kuzdra shteko boka bokra a kučera bokra,“ a potom sa študentov opýtal, čo to znamená. Napriek tomu, že význam slov vo vete zostal nejasný (v ruštine jednoducho neexistujú), bolo možné jasne odpovedať: „kuzdra“ je subjekt, ženské podstatné meno, v jednotnom čísle, nominatíve, „ bokr“ je animovaný atď. Preklad tejto frázy je asi takýto: „Niečo ženské naraz urobilo niečo s nejakým mužským tvorom a potom to začalo robiť niečo také dlhé, postupné s mláďaťom.“ Podobným príkladom textu (umeleckého) z neexistujúcich slov, postaveného úplne podľa zákonov jazyka, je Jabberwock Lewisa Carrolla (v Alici v krajine zázrakov Carroll prostredníctvom svojej postavy Humpty Dumpty vysvetľuje význam slov, ktoré vynájdené: "varené" - osem hodín večer, keď je čas uvariť večeru, "chlivky" - chatrné a obratné, "shorek" - kríženec fretky, jazveca a vývrtky, "potápanie" -​ skočiť, potápať sa, točiť sa, "nava" - tráva pod slnečnými hodinami (presahuje trochu doprava, trochu doľava a trochu dozadu), "grunt" - chrochtať a smiať sa, "zelyuk" - zelený moriak, "myumzik" - vták; jej perie sú strapaté a trčia na všetky strany, ako metla, "mova" - ďaleko od domova).

Jeden z hlavných konceptov modernej logiky a teoretickej lingvistiky, ktorý sa používa pri štúdiu jazykov rôzneho logického a matematického počtu, prirodzených jazykov, na opísanie vzťahu medzi jazykmi rôznych „úrovní“ a na charakterizáciu vzťahu medzi uvažované jazyky a s ich pomocou opísané tematické oblasti, je pojem metajazyk. Metajazyk je jazyk používaný na vyjadrenie úsudkov o inom jazyku, o jazyku-objekte. Pomocou metajazyka študujú štruktúru znakových kombinácií (výrazov) jazyka-objektu, dokazujú vety o jeho výrazových vlastnostiach, o jeho vzťahu k iným jazykom a pod.. Skúmaný jazyk sa v r. vzťah k tomuto metajazyku. Predmetným jazykom aj metajazykom môžu byť bežné (prirodzené) jazyky. Metajazyk sa môže líšiť od objektového jazyka (napríklad v učebnici angličtiny pre Rusov je metajazykom ruština a objektovým jazykom angličtina), ale môže sa s ním aj zhodovať alebo sa môže líšiť len čiastočne, napríklad v špeciálnej terminológii (Ruská lingvistická terminológia je prvkom metajazyka na opis ruského jazyka, súčasťou metajazyka na opis sémantiky prirodzených jazykov sú tzv. sémantické faktory).

Koncept „metalinguage“ sa stal veľmi plodným v súvislosti so štúdiom formalizovaných jazykov, ktoré sú postavené v rámci matematickej logiky. Na rozdiel od formalizovaných predmetových jazykov je v tomto prípade metajazyk, pomocou ktorého sa formuluje metateória (štúdium vlastností predmetovej teórie formulovanej v predmetnom jazyku), spravidla obyčajný prirodzený jazyk, nejakým špeciálnym spôsobom fragment prirodzeného jazyka ohraničený zvláštnym spôsobom, neobsahujúci žiadnu nejednoznačnosť, metafory, „metafyzické“ pojmy a pod. prvky bežného jazyka, ktoré bránia jeho využitiu ako nástroja presného vedeckého výskumu. Zároveň môže byť samotný metajazyk formalizovaný a (bez ohľadu na to) sa môže stať predmetom skúmania realizovaného pomocou metametajazyka a takýto rad možno „myslieť“ ako rastúci donekonečna.

Logika nás učí plodnému rozlišovaniu medzi jazykom-objektom a metajazykom. Jazyk-objekt je samotným predmetom logického výskumu a metajazyk je tým nevyhnutne umelým jazykom, v ktorom sa takýto výskum uskutočňuje. Logické myslenie spočíva len vo formulovaní vzťahov a štruktúry reálneho jazyka (objektového jazyka) v jazyku symbolov (metalanguage).

Metajazyk musí byť v každom prípade „nie chudobnejší“ ako jeho objektívny jazyk (t. j. pre každý jeho výraz v metajazyku musí byť uvedený jeho názov, „preklad“) – v opačnom prípade, ak tieto požiadavky nie sú splnené (čo určite vyžaduje miesto v prirodzených jazykoch, ak osobitné dohody neustanovujú inak) vznikajú sémantické paradoxy (antinómie).

Ako sa vytváralo stále viac nových programovacích jazykov, v súvislosti s problémom programovania prekladačov vznikla naliehavá potreba vytvoriť metajazyky. V súčasnosti sa na popis syntaxe programovacích jazykov najčastejšie používa metajazyk formy Backus-Naur (skrátene BNF). Ide o kompaktnú formu v podobe niektorých vzorcov podobných tým matematickým. Pre každý koncept jazyka existuje jedinečný metaformula (normálny vzorec). Skladá sa z ľavej a pravej časti. Ľavá strana špecifikuje definovaný koncept a pravá strana špecifikuje množinu prípustných jazykových konštruktov, ktoré sú kombinované do tohto konceptu. Vzorec používa špeciálne metaznaky vo forme lomených zátvoriek, ktoré obsahujú definovaný pojem (na ľavej strane vzorca) alebo predtým definovaný pojem (na jeho pravej strane), pričom je vyznačené oddelenie ľavej a pravej časti. metaznakom "::=", ktorého význam je ekvivalentný slovám "podľa definície existuje". Metalingvistické vzorce sú v nejakej forme vložené do prekladačov; s ich pomocou sa konštrukty používané programátorom skontrolujú z hľadiska formálnej zhody s niektorým z konštruktov, ktoré sú syntakticky platné v tomto jazyku. Existujú aj samostatné metajazyky rôznych vied - poznanie teda existuje vo forme rôznych metajazykov.

Logické metódy slúžili aj ako základ pre vytvorenie systémov umelej inteligencie založených na koncepte konekcionizmu. Konekcionizmus je zvláštny smer vo filozofickej vede, ktorého predmetom sú otázky poznania. V rámci tohto trendu sa pokúšajú vysvetliť intelektuálne schopnosti človeka pomocou umelých neurónových sietí. Neurónové siete, ktoré sa skladajú z veľkého množstva štruktúrnych jednotiek podobných neurónom, pričom každému prvku je priradená váha, ktorá určuje silu spojenia s inými prvkami, sú neurónové siete zjednodušenými modelmi ľudského mozgu. Experimenty s neurónovými sieťami tohto druhu preukázali ich schopnosť naučiť sa vykonávať úlohy, ako je rozpoznávanie vzorov, čítanie a identifikácia jednoduchých gramatických štruktúr.

Filozofi sa začali zaujímať o konekcionizmus, keďže konekcionistický prístup sľúbil poskytnúť alternatívu ku klasickej teórii mysle a myšlienke, ktorá sa v tejto teórii široko používa, že fungovanie mysle je podobné spracovaniu symbolického jazyka digitálnym počítač. Tento koncept je veľmi kontroverzný, no v posledných rokoch si nachádza čoraz viac priaznivcov.

Logické štúdium jazyka pokračuje v Saussureho koncepte jazyka ako systému. To, že neustále pokračuje, opäť potvrdzuje smelosť vedeckých dohadov zo začiatku minulého storočia. Posledný oddiel mojej práce budem venovať perspektívam rozvoja matematických metód v lingvistike dnes.

2.4 Perspektívy aplikácie matematických metód v lingvistike

V ére počítačovej techniky dostali metódy matematickej lingvistiky novú perspektívu rozvoja. Hľadanie riešení problémov lingvistickej analýzy sa v súčasnosti čoraz viac realizuje na úrovni informačných systémov. Zároveň automatizácia procesu spracovania lingvistického materiálu, ktorá výskumníkovi poskytuje významné príležitosti a výhody, pre neho nevyhnutne kladie nové požiadavky a úlohy.

Spojenie „exaktných“ a „humanitných“ poznatkov sa stalo úrodnou pôdou pre nové objavy v oblasti lingvistiky, informatiky a filozofie.

Strojový preklad z jedného jazyka do druhého zostáva rýchlo rastúcim odvetvím informačných technológií. Napriek tomu, že počítačom podporovaný preklad sa kvalitou nikdy nedá porovnať s ľudským prekladom (najmä pri literárnych textoch), stroj sa stal nepostrádateľným pomocníkom človeka pri prekladaní veľkých objemov textu. Predpokladá sa, že v blízkej budúcnosti budú vytvorené pokročilejšie prekladové systémy založené predovšetkým na sémantickej analýze textu.

Nemenej perspektívnou oblasťou je interakcia lingvistiky a logiky, ktorá slúži ako filozofický základ pre pochopenie informačných technológií a takzvanej „virtuálnej reality“. V blízkej budúcnosti budú práce na vytváraní systémov umelej inteligencie pokračovať – aj keď opäť sa nikdy nebude rovnať tomu človeku vo svojich schopnostiach. Takáto súťaž je bezvýznamná: v našej dobe by sa stroj nemal stať (a stáva sa) nie súperom, ale pomocníkom človeka, nie niečím z ríše fantázie, ale súčasťou skutočného sveta.

Pokračuje štúdium jazyka štatistickými metódami, čo umožňuje presnejšie určiť jeho kvalitatívne vlastnosti. Je dôležité, aby tie najodvážnejšie hypotézy o jazyku našli svoj matematický, a teda aj logický dôkaz.

Najdôležitejšie je, že rôzne odvetvia aplikácie matematiky v lingvistike, predtým dosť izolované, sa v posledných rokoch navzájom korelujú a spájajú do koherentného systému, analogicky s jazykovým systémom, ktorý objavil pred storočím Ferdinand de Saussure. a Yvan Baudouin de Courtenay. Toto je kontinuita vedeckých poznatkov.

Lingvistika v modernom svete sa stala základom rozvoja informačných technológií. Pokiaľ informatika zostane rýchlo sa rozvíjajúcim odvetvím ľudskej činnosti, spojenie matematiky a lingvistiky bude naďalej zohrávať svoju úlohu v rozvoji vedy.

Záver

V priebehu 20. storočia prešli počítačové technológie dlhú cestu – od vojenského k mierovému využitiu, od úzkeho okruhu cieľov až po prienik do všetkých odvetví ľudského života. Matematika ako veda nachádzala s rozvojom výpočtovej techniky stále nový praktický význam. Tento proces pokračuje aj dnes.

Predtým nemysliteľný „tandem“ „fyzikov“ a „textárov“ sa stal realitou. Pre plnú interakciu matematiky a informatiky s humanitnými vedami boli potrební kvalifikovaní odborníci z oboch strán. Zatiaľ čo počítačoví vedci čoraz viac potrebujú systematické humanitárne znalosti (jazykové, kultúrne, filozofické), aby pochopili zmeny v realite, ktorá ich obklopuje, v interakcii človeka a techniky, rozvíjali stále viac nových jazykových a mentálnych konceptov, písali programy, potom akékoľvek „Humanitné odbory“ v našej dobe pre svoj odborný rast musia ovládať aspoň základy práce s počítačom.

Matematika, ktorá je úzko prepojená s informatikou, sa naďalej rozvíja a interaguje s prírodnými a humanitnými vedami. V novom storočí trend matematizácie vedy neoslabuje, ale naopak narastá. Na základe kvantitatívnych údajov sú pochopené zákonitosti vývoja jazyka, jeho historické a filozofické charakteristiky.

Matematický formalizmus je najvhodnejší na opis vzorcov v lingvistike (ako vlastne aj v iných vedách – humanitných aj prírodných). Situácia sa vo vede niekedy vyvíja tak, že bez použitia vhodného matematického jazyka nie je možné pochopiť podstatu fyzikálnych, chemických atď. proces nie je možný. Vytvorenie planetárneho modelu atómu, slávny anglický fyzik XX storočia. E. Rutherford mal matematické ťažkosti. Jeho teória spočiatku nebola prijatá: neznela presvedčivo a dôvodom bola Rutherfordova neznalosť teórie pravdepodobnosti, na základe mechanizmu ktorej bolo možné pochopiť len modelové znázornenie atómových interakcií. Uvedomujúc si to, už vtedy vynikajúci vedec, majiteľ Nobelovej ceny, sa prihlásil na seminár matematika profesora Lamba a dva roky spolu so študentmi navštevoval kurz a vypracoval workshop z teórie pravdepodobnosti. . Na jeho základe dokázal Rutherford opísať správanie elektrónu, čím jeho štruktúrny model získal presvedčivú presnosť a získal uznanie. Podobne je to aj s lingvistikou.

Tu vzniká otázka, čo je na objektívnych javoch také matematické, vďaka čomu ich možno opísať jazykom matematiky, jazykom kvantitatívnych charakteristík? Ide o homogénne jednotky hmoty rozložené v priestore a čase. Tie vedy, ktoré zašli ďalej ako iné smerom k izolácii homogenity a ukázalo sa, že sú vhodnejšie na použitie matematiky v nich.

Internet, ktorý sa rýchlo rozvíjal v 90. rokoch minulého storočia, spájal zástupcov rôznych krajín, národov a kultúr. Napriek tomu, že angličtina je naďalej hlavným jazykom medzinárodnej komunikácie, internet sa v súčasnosti stal viacjazyčným. To viedlo k vývoju komerčne úspešných systémov strojového prekladu, ktoré sú široko používané v rôznych oblastiach ľudskej činnosti.

Počítačové siete sa stali predmetom filozofickej reflexie – vytváralo sa čoraz viac nových lingvistických, logických, svetonázorových konceptov, ktoré pomáhajú pochopiť „virtuálnu realitu“. V mnohých umeleckých dielach vznikali scenáre – častejšie pesimistické – o dominancii strojov nad človekom a virtuálnej reality – nad vonkajším svetom. Zďaleka nie vždy sa takéto predpovede ukázali ako nezmyselné. Informačné technológie nie sú len sľubným odvetvím na investovanie do ľudských vedomostí, ale sú aj spôsobom kontroly informácií, a teda aj ľudského myslenia.

Tento jav má negatívnu aj pozitívnu stránku. Negatívne – pretože kontrola nad informáciami je v rozpore s neodňateľným ľudským právom na slobodný prístup k nim. Pozitívne – pretože nedostatok tejto kontroly môže viesť ku katastrofálnym následkom pre ľudstvo. Stačí pripomenúť jeden z najmúdrejších filmov posledného desaťročia – „Keď sa skončí svet“ od Wima Wendersa, ktorého postavy sú úplne ponorené do „virtuálnej reality“ vlastných snov nahratých na počítači. Zároveň ani jeden vedec a ani jeden umelec nedokáže dať jednoznačnú odpoveď na otázku: čo čaká vedu a techniku ​​v budúcnosti.

Zameranie sa na „budúcnosť“, ktoré sa niekedy zdalo fantastické, bolo charakteristickým znakom vedy v polovici dvadsiateho storočia, keď sa vynálezcovia snažili vytvoriť dokonalé modely technológie, ktoré by fungovali bez ľudského zásahu. Čas ukázal utopistický charakter takéhoto výskumu. Zároveň by bolo zbytočné za to odsudzovať vedcov – bez ich nadšenia v 50. – 60. rokoch by informačné technológie v 90. rokoch neurobili taký mohutný skok a nemali by sme to, čo máme teraz.

Posledné desaťročia dvadsiateho storočia zmenili priority vedy – výskumu, invenčný pátos ustúpil komerčnému záujmu. Opäť to nie je dobré ani zlé. Toto je realita, v ktorej sa veda čoraz viac integruje do každodenného života.

21. storočie pokračovalo v tomto trende a za vynálezmi v dnešnej dobe nestojí len sláva a uznanie, ale predovšetkým peniaze. Aj preto je dôležité zabezpečiť, aby sa najnovšie výdobytky vedy a techniky nedostali do rúk teroristických skupín alebo diktátorských režimov. Úloha je ťažká až nemožná; realizovať to čo najviac je úlohou celého svetového spoločenstva.

Informácie sú zbraňou a zbrane nie sú o nič menej nebezpečné ako jadrové alebo chemické zbrane – len nepôsobia fyzicky, ale skôr psychicky. Ľudstvo sa musí zamyslieť nad tým, čo je preňho v tomto prípade dôležitejšie – sloboda alebo kontrola.

Najnovšie filozofické koncepcie súvisiace s rozvojom informačných technológií a pokus o ich pochopenie poukázali na limity tak prírodovedného materializmu, ktorý dominoval v 19. a začiatkom 20. storočia, ako aj extrémneho idealizmu, ktorý popiera význam materiálneho sveta. . Pre moderné myslenie, najmä myslenie Západu, je dôležité prekonať tento dualizmus v myslení, keď sa okolitý svet jasne delí na materiálny a ideálny. Cestou k tomu je dialóg kultúr, porovnávanie rôznych pohľadov na okolité javy.

Paradoxne, informačné technológie môžu v tomto procese zohrávať dôležitú úlohu. Počítačové siete a najmä internet nie sú len zdrojom zábavy a bujnej komerčnej činnosti, sú aj prostriedkom zmysluplnej, kontroverznej komunikácie medzi predstaviteľmi rôznych civilizácií v modernom svete, ako aj dialógu medzi minulosťou a darček. Dá sa povedať, že internet posúva priestorové a časové hranice.

A v dialógu kultúr prostredníctvom informačných technológií je stále dôležitá úloha jazyka ako najstaršieho univerzálneho komunikačného prostriedku. Preto lingvistika v interakcii s matematikou, filozofiou a informatikou zažila svoj druhý zrod a rozvíja sa dodnes. Trend súčasnosti bude pokračovať aj v budúcnosti – „až na koniec sveta“, ako pred 15 rokmi predpovedal ten istý V. Wenders. Pravda, nie je známe, kedy tento koniec nastane – ale či je to teraz dôležité, pretože budúcnosť sa aj tak skôr či neskôr stane prítomnosťou.

Príloha 1

Ferdinand de Saussure

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je všeobecne považovaný za zakladateľa modernej lingvistiky v jej pokusoch opísať skôr štruktúru jazyka než históriu konkrétnych jazykov a jazykových foriem. V jeho diele na prelome 20. a 20. storočia nachádza hlavné východisko metóda štrukturalizmu v lingvistike a literárnej vede a významná vetva semiotiky. Dokonca sa tvrdilo, že komplex stratégií a koncepcií, ktorý sa začal nazývať „postštrukturalizmus“ – dielo Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a ďalších – naznačuje Saussureova práca. v lingvistike a anagramatickom čítaní neskorej latinskej poézie, literárnej moderny až po psychoanalýzu a filozofiu na začiatku 20. storočia. Ako tvrdia Algirdas Julien Greimas a Joseph Courtes v knihe Semiotics and Language: An Analytic Dictionary, pod názvom „Interpretácia“ sa začiatkom dvadsiateho storočia objavil nový spôsob interpretácie, ktorý sa stotožňuje so saussurovskou lingvistikou, husserovskou fenomenológiou a freudovou psychoanalýzou. V tomto móde „interpretácia už nie je záležitosťou pripisovania daného obsahu forme, ktorá by inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje ekvivalentný obsah významového prvku v rámci daného semiotického systému“ ( 159). v tomto chápaní „interpretácie“ sa forma a obsah nerozlišujú; skôr je každá „forma“ alternatívne aj sémantickým „obsahom“, „označujúcou formou“, takže interpretácia ponúka analogickú parafrázu niečoho, čo už v rámci nejakého iného systému označenia znamená.

Takáto reinterpretácia formy a chápania – ktorú Claude Levi-Strauss opisuje v jednej zo svojich najprogramovejších artikulácií konceptu štrukturalizmu v „Štruktúra a forma: Úvahy o diele Vladimíra Proppa“ – je implicitná v Saussureovom posmrtnom kurze. vo všeobecnej lingvistike (1916, prekl., 1959, 1983). Saussure počas svojho života publikoval relatívne málo a jeho hlavné dielo, Kurz, bolo prepisom niekoľkých kurzov všeobecnej lingvistiky, ktoré ponúkal v rokoch 1907-11 jeho študentmi. Saussure v kurze vyzval na „vedecké“ štúdium jazyka v protiklade k práci v historickej lingvistike, ktorá sa uskutočnila v devätnástom storočí. Táto práca je jedným z veľkých úspechov západného intelektu: brať konkrétne slová ako stavebné kamene jazyk, historická (alebo „diachrónna“) lingvistika sledovala pôvod a vývoj západných jazykov z predpokladaného spoločného jazykového zdroja, najskôr z „indoeurópskeho“ jazyka a potom zo skoršieho „p roto-indoeurópsky“ jazyk.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „prvkov slova“. Jeho práca bola pokusom zredukovať množstvo faktov o jazyku, ktoré tak podrobne skúma historická lingvistika, na zvládnuteľný počet návrhov. Saussure v Kurze hovorí, že „porovnávacia škola“ filológie devätnásteho storočia „nepodarila sa vytvoriť skutočnú vedu lingvistiky“, pretože „zlyhala pri hľadaní podstaty predmetu svojho štúdia“ (3). Túto „prirodzenosť“, tvrdí, nemožno nájsť jednoducho v „elementárnych“ slovách, ktoré jazyk obsahuje – zdanlivo „pozitívnych“ faktoch (alebo „látkach“) jazyka – ale vo formálnych vzťahoch, z ktorých vznikajú tieto „látky“.

Saussureovo systematické prehodnocovanie jazyka je založené na troch predpokladoch. Prvým je, že vedecké štúdium jazyka potrebuje skôr rozvíjať a študovať systém než históriu jazykových javov. Z tohto dôvodu rozlišuje medzi jednotlivými výskytmi jazyka – jeho konkrétnymi „rečové udalosti", ktoré označuje ako podmienečné prepustenie - a vlastný predmet lingvistiky, systém (alebo „kód"), ktorým sa riadia tieto udalosti, a ktoré označuje ako jazyk. Takáto systematická štúdia si navyše vyžaduje „synchronické" koncepcia vzťahu medzi prvkami jazyka v určitom okamihu, skôr než „diachrónne“ štúdium vývoja jazyka v histórii.

Tento predpoklad viedol k tomu, čo Roman Jakobson v roku 1929 označil za „štrukturalizmus“, v ktorom „akýkoľvek súbor javov skúmaných súčasnou vedou nie je považovaný za mechanickú aglomeráciu, ale ako štrukturálny celok, ktorý mechanická koncepcia procesov dáva k otázke. ich funkcie“ („Romantický“ 711). V tejto pasáži Jakobson vyjadruje Saussurov zámer definovať lingvistiku ako vedecký systém na rozdiel od jednoduchého, „mechanického“ účtovania historických náhod. Okrem toho Jakobson opisuje aj druhý základný predpoklad v Saussurovčine – môžeme teraz to nazývame „štrukturálne“ – lingvistika: že základné prvky jazyka možno skúmať iba vo vzťahu k ich funkciám, a nie vo vzťahu k ich príčinám. Európske „slová“), tieto udalosti a entity musia byť situované do systémového rámca v ktorej súvisia s inými takzvanými udalosťami a entitami. Ide o radikálnu zmenu orientácie v chápaní skúseností a javov, ktorej význam prirovnal filozof Ernst Cassirer k „novej Galileiovej vede, ktorá v 17. storočí zmenila celý náš koncept fyzického sveta“ (citované v Culler, Pursuit 2 štyri). Táto zmena, ako poznamenávajú Greimas a Courtes, nanovo poníma „interpretáciu“ a teda znovu poníma vysvetľovanie a pochopenie seba samého. Namiesto toho, aby vysvetlenie „je v zmysle príčin javu, takže ako „účinok“ je nejakým spôsobom podriadené jeho príčinám, vysvetlenie tu spočíva v podriadení javu jeho „funkcii“ orientovanej na budúcnosť, resp. "účel." Vysvetlenie už nie je nezávislé od ľudských zámerov alebo účelov (aj keď tieto zámery môžu byť neosobné, spoločné alebo freudovskými výrazmi „nevedomé“).

Vo svojej lingvistike Saussure uskutočňuje túto transformáciu špecificky v redefinícii lingvistického „slova“, ktoré opisuje ako lingvistický „znak“ a definuje ho funkcionalisticky. Znak, tvrdí, je spojením „pojmu a zvukového obrazu“, ktorý nazval „označený a označujúci“ (66-67; preklad Roya Harrisa z roku 1983 ponúka výrazy „označenie“ a „signál“). Povaha ich „kombinácie“ je „funkčná“ v tom, že ani označované, ani označujúce nie sú „príčinou“ toho druhého, ale „každý má svoje hodnoty od druhého“ (8). prvok jazyka, znak relačné a podrobuje dôslednej analýze základný predpoklad historickej lingvistiky, konkrétne identitu elementárnych jednotiek jazyka a označenia (t. j. „slov“). slovo „strom“ ako „rovnaké“ slovo nie je preto, slovo je definované inherentnými kvalitami – nie je to „mechanická aglomerácia“ takýchto kvalít – ale pretože je definované ako prvok v systéme, „štrukturálny celok“ jazyka.

Takáto relačná (alebo „diakritická“) definícia entity riadi koncepciu všetkých prvkov jazyka v štrukturálnej lingvistike. Najzreteľnejšie je to v najpôsobivejšom úspechu saussurovskej lingvistiky, vo vývoji konceptov „foném“ a „charakteristických čŕt“ jazyka. Fonémy sú najmenšie artikulované a označovacie jednotky jazyka. Nie sú to zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, o ktorých sa zmieňuje Saussure, ktoré hovoriaci vnímajú – fenomenálne vnímané – ako prenášajúce význam. (Elmar Holenstein teda opisuje Jakobsonovu lingvistiku, ktorá dôležitým spôsobom nasleduje Saussura, ako „fenomenologický štrukturalizmus.“) Z tohto dôvodu vedúci hovorca pražského školského štrukturalizmu Jan Mukařovský v roku 1937 poznamenal, že „štruktúra . . . je fenomenologická a nie empirická realita; nejde o dielo samotné, ale o súbor funkčných vzťahov, ktoré sa nachádzajú vo vedomí kolektívu (generácie, prostredia atď.)“ (cit. v Galan 35). Podobne Levi-Strauss, vedúci hovorca francúzskeho štrukturalizmu v roku 1960 poznamenal, že „štruktúra nemá zreteľný obsah; je sám osebe obsahom a logická organizácia, v ktorej je zatknutý, je koncipovaná ako vlastnosť skutočného“ (167; pozri tiež Jakobson, Fundamentals 27-28).

Fonémy, najmenšie vnímateľné prvky jazyka, teda nie sú pozitívnymi objektmi, ale „fenomenologickou realitou“. Napríklad v angličtine sa fonéma /t/ môže vyslovovať mnohými rôznymi spôsobmi, ale vo všetkých prípadoch ju anglicky hovoriaci rozpozná ako /t/. Nasávané t (t. j. t vyslovené s nádychom podobným h po ňom), vysoký alebo nízky zvuk t, predĺžený zvuk t atď., budú všetky fungovať rovnakým spôsobom pri rozlišovaní významu „to“ a „do“ v angličtine. Okrem toho rozdiely medzi jazykmi sú také, že fonologické variácie v jednom jazyku môžu predstavovať odlišné fonémy v inom jazyku; angličtina teda rozlišuje medzi /l/ a /r/, zatiaľ čo ostatné jazyky sú tak štruktúrované, že tieto artikulácie sa považujú za variácie tej istej fonémy (ako aspirované a nenasávané t v angličtine). V každom prirodzenom jazyku je obrovské množstvo možných slov kombináciou malého počtu foném. Angličtina má napríklad menej ako 40 foném, ktoré dohromady tvoria viac ako milión rôznych slov.

Samotné fonémy jazyka sú systematicky organizovanými štruktúrami znakov. V 20. a 30. rokoch 20. storočia po Saussurovom vedení Jakobson a N. S. Trubetzkoy izolovali „rozlišovacie črty“ foném. Tieto črty sú založené na fyziologickej štruktúre rečových orgánov – jazyka, zubov, hlasiviek atď. Saussure v Kurze spomína a Harris to opisuje ako „fyziologickú fonetiku“ (39; Baskinov skorší preklad používa termín „fonológia“ [(1959) 38]) – a spájajú sa do „zväzkov“ binárnych opozícií, aby vytvorili fonémy. Napríklad v angličtine je rozdiel medzi /t/ a /d/ prítomnosťou alebo absenciou „hlasu“ (zapojenie hlasiviek) a na úrovni vyjadrenia sa tieto fonémy vzájomne definujú. Týmto spôsobom je fonológia špecifickým príkladom všeobecného jazykového pravidla opísaného Saussurom: V jazyku sú len rozdiely. ešte dôležitejšie: rozdiel vo všeobecnosti zahŕňa pozitívne pojmy, medzi ktorými je rozdiel stanovený; ale v jazyku sú len rozdiely bez kladných výrazov. Či už berieme označované alebo označujúce, jazyk nemá ani idey, ani zvuky, ktoré existovali pred jazykovým systémom. (120)

V tomto rámci nie sú jazykové identity určené inherentnými kvalitami, ale systémovými ("štrukturálnymi") vzťahmi.

Povedal som, že fonológia „išla po vzore“ Saussura, pretože aj keď jeho analýza fyziológie tvorby jazyka „by sa v súčasnosti, ako hovorí Harris, „nazývala „fyzickou“, na rozdiel od „psychologickej“ alebo „funkčnej“. „“ (Čítanie 49), následne v Kurze artikuloval smer a obrysy funkčnej analýzy jazyka. Podobne jeho jediné rozšírené publikované dielo Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoáre o primitívnom systéme samohlások v indoeurópskych jazykoch), ktoré vyšlo v roku 1878, bolo plne situované do projektu 19. storočia historická lingvistika. Napriek tomu v rámci tejto práce, ako tvrdil Jonathan Culler, Saussure demonštroval „plodnosť myslenia o jazyku ako o systéme čisto vzťahových položiek, aj keď pracuje na úlohe historickej rekonštrukcie“ (Saussure 66). Analýzou systematických štrukturálnych vzťahov medzi fonémami na vysvetlenie vzorcov striedania samohlások v existujúcich indoeurópskych jazykoch Saussure naznačil, že okrem niekoľkých rôznych foném /a/ musela existovať ešte jedna fonéma, ktorú by bolo možné formálne opísať. „Čo robí Saussureho dielo tak pôsobivým,“ uzatvára Culler, „je skutočnosť, že takmer o päťdesiat rokov neskôr, keď bol objavený a rozlúštený klinopisný chetitský jazyk, sa zistilo, že obsahuje fonému napísanú h, ktorá sa správa tak, ako Saussure predpovedal. . Čisto formálnou analýzou objavil to, čo je dnes známe ako hrtan indoeurópsky“ (66).

Táto koncepcia relačného alebo diakritického určenia prvkov významu, ktorá je v kurze implicitná aj explicitná, naznačuje tretí predpoklad riadiaci štrukturálnu lingvistiku, čo Saussure nazýva „svojvoľná povaha znaku“. Tým chce povedať, že vzťah medzi označujúcim a označovaným v jazyku nie je nikdy potrebný (alebo „motivovaný“): rovnako ľahko by sme mohli nájsť zvukový označujúci arbre ako strom označujúci, aby sme sa spojili s pojmom „strom“. Okrem toho to však znamená, že aj označované je ľubovoľné: pojem „strom“ by sa dal definovať tak jednoducho podľa kvality dreva (čo by vylučovalo palmy), ako aj podľa veľkosti (čo vylučuje „nízke dreviny“, ktoré volacie kríky). To by malo objasniť, že číslovanie predpokladov, ktoré uvádzam, nepredstavuje poradie priorít: každý predpoklad – systémová povaha signifikácie (najlepšie sa dá pochopiť „synchrónnym štúdiom jazyka“), relačná alebo „diakritická“ povaha prvkov významu, svojvoľný charakter znakov - odvodzuje svoju hodnotu od ostatných.

To znamená, že Saussureovská lingvistika javy, ktoré študuje, v preklenujúcich vzťahoch kombinácie a kontrastu v jazyku. V tejto koncepcii je jazyk procesom artikulácie významu (označenia) aj jeho produktom (komunikáciou), pričom tieto dve funkcie jazyka nie sú ani identické, ani úplne kongruentné (pozri Schleifer, „Deconstruction“). Tu môžeme vidieť striedanie formy a obsahu, ktoré Greimas a Courtes opisujú v modernistickej interpretácii: jazyk predstavuje kontrasty, ktoré formálne definujú jeho jednotky, a tieto jednotky sa spájajú na nasledujúcich úrovniach, aby vytvorili označujúci obsah. Keďže prvky jazyka sú ľubovoľné, navyše ani kontrast ani kombináciu nemožno považovať za základné. V jazyku sa teda rozlišovacie znaky spájajú a vytvárajú kontrastné fonémy na inej úrovni vnímania, fonémy sa spájajú a vytvárajú kontrastné morfémy, morfémy sa spájajú a vytvárajú slová, slová sa spájajú a vytvárajú vety atď. V každom prípade je celá fonéma, slovo alebo veta a tak ďalej väčšia ako súčet jej častí (rovnako ako voda, H2O, v Saussureovom príklade [(1959) 103] je viac ako mechanická aglomerácia vodíka a kyslíka).

Tri predpoklady Kurzu všeobecnej lingvistiky viedli Saussura k volanie po novej vede dvadsiateho storočia, ktorá by presahovala rámec lingvistickej vedy a skúmala „život znakov v spoločnosti“. Saussure nazval túto vedu „sémiológia (z gréckeho semeion „znamenie“)“ (16). „Veda“ semiotiky, ako sa začala praktizovať vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch 20. storočia, rozšírila štúdium jazyka a jazykových štruktúr na literárne artefakty tvorené (alebo artikulované) týmito štruktúrami. Počas konca svojej kariéry, dokonca aj keď ponúkal kurzy všeobecnej lingvistiky, Saussure pokračoval vo svojej vlastnej „semiotickej“ analýze neskorej latinskej poézie v snahe objaviť zámerne skryté anagramy vlastných mien. Metóda štúdia bola v mnohých ohľadoch opakom funkčného racionalizmu jeho lingvistických analýz: pokúšala sa, ako Saussure spomína v jednom z 99 zošitov, v ktorých sa tejto štúdii venoval, systematicky skúmať problém „náhody“, ktorý „... sa stáva nevyhnutným základom všetkého“ (cit. v Starobinski 101). Takáto štúdia, ako hovorí sám Saussure, sa zameriava na „hmotný fakt“ náhody a zmyslu (cit. 101), takže „tematické slovo“, ktorého anagram Saussure hľadá, ako tvrdí Jean Starobinski, „je pre básnika , nástroj a nie životne dôležitý zárodok básne. Od básne sa vyžaduje, aby znovu použila fonické materiály tematického slova“ (45). Starobinski v tejto analýze hovorí: "Saussure sa nestratil pri hľadaní skrytých významov." Namiesto toho sa zdá, že jeho práca demonštruje túžbu vyhnúť sa všetkým problémom vyplývajúcim z vedomia: „Keďže poézia sa nerealizuje len slovami, ale je niečím, čo sa rodí zo slov, vymyká sa svojvoľnej kontrole vedomia a závisí výlučne od druhu jazykovej zákonnosti. “ (121).

Ide o Saussurov pokus objaviť vlastné mená v neskorej latinskej poézii – to, čo Tzvetan Todorov nazýva redukciou „slova“. . . k jeho signifikantovi“ (266) – zdôrazňuje jeden z prvkov, ktoré riadili jeho lingvistickú analýzu, svojvoľnú povahu znaku. (Zdôrazňuje aj formálny charakter saussurovskej lingvistiky – „jazyk,“ tvrdí, „je formou a nie substancia" - ktorá účinne eliminuje sémantiku ako hlavný predmet analýzy.) Ako Todorov uzatvára, Saussureova práca sa dnes javí ako pozoruhodne homogénna v tom, že odmieta akceptovať symbolické javy. . . . Vo svojom výskume anagramov venuje pozornosť iba javom opakovania, nie javom vyvolávania. . . . Vo svojich štúdiách o Nibelungoch rozpoznáva symboly len preto, aby ich pripísal chybným čítaniam: keďže nie sú zámerné, symboly neexistujú. Napokon vo svojich kurzoch všeobecnej lingvistiky uvažuje o existencii semiológie, a teda aj o iných znakoch ako lingvistických; ale toto tvrdenie je zároveň obmedzené skutočnosťou, že semiológia je venovaná jedinému typu znakov: tým, ktoré sú ľubovoľné. (269-70)

Ak je to pravda, je to preto, že Saussure si nedokázal predstaviť „zámer“ bez subjektu; nemohol celkom uniknúť protikladu medzi formou a obsahom, čo jeho dielo natoľko spochybňovalo. Namiesto toho sa uchýlil k „jazykovej zákonnosti“. Nachádza sa medzi koncepciami dejín, subjektivity a kauzálnej interpretácie z devätnásteho storočia na jednej strane a medzi „štrukturalistickými“ koncepciami dvadsiateho storočia toho, čo Levi-Strauss nazýval „kantovstvo bez transcendentálny subjekt“ (citované v Connerton 23) – koncepty, ktoré stierajú protiklad medzi formou a obsahom (alebo subjektom a objektom) a hierarchiou popredia a pozadia v plnohodnotnom štrukturalizme, psychoanalýze a dokonca aj kvantovej mechanike – dielo Ferdinanda de Saussure v lingvistike a semiotike ohraničuje signálny moment v štúdiu významu a kultúry.

Ronald Schleifer

Príloha 2

Ferdinand de Saussure (preklad)

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je považovaný za zakladateľa modernej lingvistiky - vďaka jeho pokusom popísať skôr štruktúru jazyka než históriu jednotlivých jazykov a slovných foriem. Základy štrukturálnych metód v lingvistike a literárnej kritike a do značnej miery aj semiotike položil v jeho dielach na samom začiatku 20. storočia. Je dokázané, že metódy a koncepty takzvaného „postštrukturalizmu“, vyvinuté v dielach Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a ďalších, siahajú až k lingvistickým dielam Saussura a ďalších. anagramatické čítania neskororímskej poézie. Treba poznamenať, že Saussureova práca o lingvistike a lingvistickej interpretácii pomáha spájať široké spektrum intelektuálnych disciplín – od fyziky po literárne inovácie, psychoanalýzu a filozofiu začiatku dvadsiateho storočia. A. J. Greimas a J. Kurte v Semiotics and Language píšu: „Analytický slovník s názvom „Interpretácia“ ako nový druh interpretácie sa objavil na začiatku 20. storočia spolu s lingvistikou Saussura, fenomenológiou Husserla a psychoanalýzou. Freuda. V takom prípade „interpretácia nie je pripisovanie daného obsahu forme, ktorá by inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje rovnaký obsah významného prvku v rámci daného semiotického systému“ (159). ). V tomto chápaní „interpretácie“ sú forma a obsah neoddeliteľné; naopak, každá forma je naplnená sémantickým významom („zmysluplná forma“), takže interpretácia ponúka nové, podobné prerozprávanie niečoho zmysluplného v inom znakovom systéme.

Podobné chápanie formy a obsahu, ktoré prezentoval Claude Lévi-Strauss v jednom z programových diel štrukturalizmu („Štruktúra a forma: Úvahy o dielach Vladimíra Proppa“), môžeme vidieť v Saussureho posmrtnej knihe Kurz v Všeobecná jazykoveda (1916, prel., 1959, 1983). Počas svojho života Saussure publikoval len málo, "Course" - jeho hlavné dielo - bolo zozbierané z poznámok študentov, ktorí navštevovali jeho prednášky zo všeobecnej lingvistiky v rokoch 1907-11. Saussure v Kurze vyzval na „vedecké“ štúdium jazyka, ktoré postavilo do protikladu s komparatívno-historickou lingvistikou devätnásteho storočia. Toto dielo možno považovať za jeden z najväčších úspechov západného myslenia: vychádzajúc z jednotlivých slov ako štrukturálnych prvkov jazyka, historická (alebo „diachronická“) lingvistika dokázala vznik a vývoj západoeurópskych jazykov od r. bežný, indoeurópsky jazyk – a skorší protoindoeurópsky.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „slovných prvkov“. Jeho práca bola pokusom zredukovať mnohé fakty o jazyku náhodne študované porovnávacou lingvistikou na malý počet teorémov. Porovnávacia filologická škola 19. storočia, píše Saussure, „nepodarila sa vytvoriť skutočnú lingvistickú školu“, pretože „nepochopila podstatu predmetu štúdia“ (3). Táto „podstata“ podľa neho nespočíva len v jednotlivých slovách – „pozitívnych substanciách“ jazyka – ale aj vo formálnych spojeniach, ktoré napomáhajú existencii týchto substancií.

Saussurov „test“ jazyka je založený na troch predpokladoch. Po prvé, vedecké chápanie jazyka nie je založené na historickom, ale na štrukturálnom fenoméne. Preto rozlišoval medzi jednotlivými javmi jazyka – „udalosťami reči“, ktoré definuje ako „podmienečné prepustenie“ – a vlastným, podľa neho, predmetom štúdia lingvistiky, systémom (kódom, štruktúrou), ktorý tieto udalosti riadi ( "jazyk"). Takéto systematické štúdium si navyše vyžaduje skôr „synchrónne“ poňatie vzťahu medzi prvkami jazyka v danom momente, než „diachrónne“ štúdium vývoja jazyka prostredníctvom jeho dejín.

Táto hypotéza bola predchodcom toho, čo by Roman Jakobson v roku 1929 nazval „štrukturalizmom“ – teóriou, v ktorej „akýkoľvek súbor javov skúmaných modernou vedou nie je považovaný za mechanickú akumuláciu, ale za štrukturálny celok, v ktorom konštruktívna zložka koreluje s funkciu“ („Romantický „711). V tejto pasáži Jakobson formuloval Saussurovu myšlienku definovania jazyka ako štruktúry, na rozdiel od „mechanického“ vymenovania historických udalostí. Jakobson okrem toho rozvíja ďalší saussurovský predpoklad, ktorý sa stal predchodcom štrukturálnej lingvistiky: základné prvky jazyka by sa nemali skúmať ani tak v súvislosti s ich príčinami, ale s ich funkciami. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi. Išlo o radikálny obrat v porovnávaní javov s okolitou realitou, ktorého význam porovnával filozof Ernst Cassirer s „Galileovou vedou, ktorá v sedemnástom storočí prevrátila predstavy o hmotnom svete“, teda so samotnými vysvetleniami. Javy sa začali interpretovať nie vo vzťahu k príčinám ich vzniku, ale vo vzťahu k účinku, ktorý môžu mať v prítomnosti a budúcnosti. Interpretácia prestala byť nezávislá od úmyslov človeka (napriek tomu, že úmysly môžu byť neosobné, „v bezvedomí“ vo freudovskom zmysle slova).

Saussure vo svojej lingvistike ukazuje najmä tento obrat v zmene pojmu slova v lingvistike, ktoré definuje ako znak a popisuje z hľadiska jeho funkcií. Znak je preňho kombináciou zvuku a významu, „signified and designation“ (66-67; v anglickom preklade z roku 1983 od Roya Harrisa – „signification“ a „signal“). Povaha tejto zlúčeniny je "funkčná" (ani jeden, ani druhý prvok nemôže existovať jeden bez druhého); navyše „jeden si požičiava vlastnosti od druhého“ (8). Saussure teda definuje hlavný štrukturálny prvok jazyka – znak – a robí základom historickej lingvistiky identitu znakov so slovami, čo si vyžaduje obzvlášť dôslednú analýzu. Preto môžeme chápať rôzne významy povedzme toho istého slova „strom“ – nie preto, že slovo je iba súborom určitých vlastností, ale preto, že je definované ako prvok v systéme znakov, v „štrukturálnom celku“, v jazyku.

Takýto relatívny („diakritický“) koncept jednoty je základom konceptu všetkých prvkov jazyka v štruktúrnej lingvistike. Je to zrejmé najmä v najoriginálnejšom objave saussurovskej lingvistiky, vo vývoji konceptu „foném“ a „rozlišovacích znakov“ jazyka. Fonémy sú najmenšie z hovorených a zmysluplných jazykových jednotiek. Nie sú to len zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, poznamenáva Saussure, ktoré rodení hovoriaci vnímajú ako význam. (Treba poznamenať, že Elmar Holenstein nazýva Jakobsonovu lingvistiku, ktorá vo svojich hlavných ustanoveniach pokračuje v myšlienkach a konceptoch Saussura, „fenomenologický štrukturalizmus“). Preto popredný rečník Pražskej školy štrukturalizmu Jan Mukarowski v roku 1937 poznamenal, že „štruktúra. . . nie empirický, ale fenomenologický koncept; nejde o samotný výsledok, ale o súbor významných vzťahov kolektívneho vedomia (generácie, iných atď.)“. Podobnú myšlienku vyslovil v roku 1960 Lévi-Strauss, vodca francúzskeho štrukturalizmu: „Štruktúra nemá určitý obsah; je zmysluplný sám o sebe a logická konštrukcia, v ktorej je uzavretý, je odtlačkom reality.

Fonémy ako najmenšie lingvistické prvky prijateľné pre vnímanie zase predstavujú samostatnú integrálnu „fenomenologickú realitu“. Napríklad v angličtine sa zvuk „t“ môže vyslovovať inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Nasávanie, zdvihnutie alebo spustenie, dlhý zvuk „t“ atď. rovnako rozlíši význam slov „do“ a „urobiť“. Rozdiely medzi jazykmi sú navyše také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty rovnakej fonémy (ako anglické „t“, vyslovované s aspiráciou a bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V 20. - 30. rokoch 20. storočia, po Saussure, Jacobson a N. S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto znaky vychádzajú zo štruktúry rečových orgánov – jazyka, zubov, hlasiviek – Saussure si to všíma v „Kurse všeobecnej lingvistiky“ a Harris to nazýva „fyziologická fonetika“ (v Baskinovom skoršom preklade termín „fonológia " sa používa) - sú spojené do "uzlov » durg proti priateľovi, aby vydávali zvuky. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „V jazyku sú len rozdiely.“ Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Už som spomenul, že fonológia sa vo svojom vývoji opierala o myšlienky Saussura. Hoci jeho analýza lingvistickej fyziológie v modernej dobe, Harris hovorí, „by sa nazývala „fyzická“, na rozdiel od „psychologickej“ alebo „funkčnej“, v Kurze jasne formuloval smer a základné princípy funkčnej analýzy jazyka. Jeho jediné dielo vydané počas jeho života, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Poznámky k pôvodnému samohláskovému systému v indoeurópskych jazykoch), vydané v roku 1878, bolo úplne v súlade s porovnávacou historickou lingvistikou 19. storočie. Napriek tomu v tejto práci, hovorí Jonathan Culler, Saussure ukázal „plodnosť myšlienky jazyka ako systému vzájomne prepojených javov, dokonca aj s jeho historickou rekonštrukciou“. Pri analýze vzťahu medzi fonémami, vysvetlením striedania samohlások v moderných jazykoch indoeurópskej skupiny Saussure navrhol, že okrem niekoľkých rôznych zvukov „a“ musia existovať aj iné formálne popísané fonémy. „Na Saussureho diele pôsobí zvláštny dojem,“ uzatvára Kaller, „že takmer o 50 rokov neskôr, keď bolo objavené a rozlúštené klinové písmo Chetitov, bola nájdená fonéma v písme označená „h“, ktorá sa správala tak, ako Saussure predpovedal. Prostredníctvom formálnej analýzy objavil to, čo je dnes v indoeurópskych jazykoch známe ako hrdelný zvuk.

V koncepte relatívnej (diakritickej) definície znakov, explicitných aj implicitných v kurze, existuje tretí kľúčový predpoklad štrukturálnej lingvistiky, ktorý Saussure nazval „ľubovoľná povaha znaku“. To znamená, že vzťah medzi zvukom a významom v jazyku nie je ničím motivovaný: rovnako ľahko možno spojiť slovo „arbre“ a slovo „strom“ s pojmom „strom“. Navyše to znamená, že aj zvuk je ľubovoľný: pojem „strom“ možno definovať prítomnosťou kôry (okrem paliem) a veľkosťou (okrem „nízkych drevín“ – kríkov). Z toho by malo byť zrejmé, že všetky predpoklady, ktoré uvádzam, nie sú rozdelené na viac a menej dôležité: každý z nich - systémová povaha znakov (najzrozumiteľnejšia pri "synchrónnom" štúdiu jazyka), ich relatívna (diakritická) podstata , svojvoľná povaha znakov - pochádza z zvyšku.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je zároveň vyjadrením významu slov (označenie) aj ich výsledkom (komunikáciou) – a tieto dve funkcie sa nikdy nezhodujú (pozri Shleiferovu „Dekonštrukciu jazyka“). Striedanie formy a obsahu, ktoré popisujú Greimas a Kurte, môžeme vidieť v najnovšej verzii interpretácie: jazykové kontrasty definujú jej štruktúrne jednotky a tieto jednotky na seba na seba nadväzujúco pôsobia, aby vytvorili určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku distinktívne znaky tvoria fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do kontrastných morfém, morfémy - do slov, slová - do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac ako súčet jeho častí (rovnako ako voda, v Saussureovom príklade, je viac ako len kombinácia vodíka a kyslíka).

Tri predpoklady „kurzu všeobecnej lingvistiky“ viedli Saussura k myšlienke novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá by študovala „život znakov v spoločnosti“. Saussure nazval túto vedu semiológiou (z gréckeho "semeion" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (alebo formulované) týmito štruktúrami. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola v mnohom protikladom racionalizmu vo svojej lingvistickej analýze: išlo o pokus, ako píše Saussure v jednom z 99 zošitov, študovať v systéme problém „pravdepodobnosti“, ktorý sa „stáva základom všetkého. " Takéto vyšetrovanie, tvrdí sám Saussure, pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „Kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, a nie zdrojom života pre báseň. Báseň slúži na prevrátenie zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia je vyjadrená nielen slovami, ale aj tým, čo tieto slová vyvolávajú, presahuje kontrolu vedomia a závisí len od jazykové zákony“.

Saussureho pokus o štúdium vlastných mien v neskororímskej poézii (Cvetan Todorov to nazval skratkou „slova... len predtým, ako je napísané“), zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnosť znakov, ako aj formálna podstata saussurovskej lingvistiky („Jazyk“, tvrdí on, „podstata formy, nie jav“), čo vylučuje možnosť analyzovať význam. Todorov uzatvára, že dnešné Saussureove spisy sa zdajú byť pozoruhodne konzistentné v ich neochote študovať symboly [javy, ktoré majú presne definovaný význam]. . . . Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu Nibelungov definuje symboly len preto, aby ich priradil k chybným čítaniam: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semilógia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na dejinách a subjektívnych dohadoch na jednej strane a metódami náhodnej interpretácie založenej na týchto koncepciách a na druhej strane štrukturalistickými koncepciami, ktoré Lévi-Strauss nazval „kantovstvom bez transcendentna“. herec“ – vymazanie konfrontácie medzi formou a obsahom (subjektom a objektom), významom a pôvodom v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike – diela Ferlinanda de Saussura o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúra.

Ronald Shleifer

Literatúra

1. Admoni V.G. Základy teórie gramatiky / V.G. Admoni; Akadémia vied ZSSR.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematické metódy v lingvistike. M., 1974.

4. Arnold I.V. Sémantická štruktúra slova v modernej angličtine a metodológia jeho štúdia. /I.V. Arnold-L .: Vzdelávanie, 1966. - 187 s.

6.Bashlykov A.M. Automatický prekladový systém. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7.Baudouin de Courtenay: Teoretické dedičstvo a modernita: Abstrakty správ z medzinárodnej vedeckej konferencie / Ed.I.G. Kondratiev. - Kazaň: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Prvky matematickej lingvistiky. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Jazyk a štatistika. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretická a aplikovaná lingvistika. / V.A. Zvegincev - M., 1969. - 143 s.

11. Kasevič, V.B. Sémantika. Syntax. Morfológia. // V.B. Kasevič - M., 1988. - 292 s.

12. Lekomtsev Yu.K. ÚVOD do formálneho jazyka lingvistiky / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. Jazykové dedičstvo Baudouina de Courtenay na konci 20. storočia: abstrakty z medzinárodnej vedeckej a praktickej konferencie 15. – 18. marca 2000. - Krasnojarsk, 2000. - 125 s.

Matveeva G.G. Skryté gramatické významy a identifikácia sociálnej osoby („portrét“) hovoriaceho / G.G. Matvejev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Skúsenosti s vytváraním lingvistických modelov „Význam<-->Text". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Preklad a aplikovaná lingvistika / L.L. Nelyubin. - M.: Vyššia škola, 1983. - 207 s.

16. O exaktných metódach výskumu jazyka: o takzvanej „matematickej lingvistike“ / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva a ďalší - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematická lingvistika: Učebnica / L.G. Piotrovsky, K.B. Bektajev, A.A. Piotrovskaja. - M.: Vyššia škola, 1977. - 160 s.

18. On je. Text, stroj, osoba. - L., 1975. - 213 s.

19. On je. Aplikovaná lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. jazykové modely. M., 1963. Revzin, I.I. Moderná štruktúrna lingvistika. Problémy a metódy. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Základy všeobecného a strojového prekladu / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teória F. de Saussura vo svetle modernej lingvistiky / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Sova, L.Z. Analytická lingvistika / L.Z. Sova - M., 1970. - 192 s.

24. Saussure F. de. Poznámky zo všeobecnej lingvistiky / F. de Saussure; Za. od fr. - M.: Progress, 2000. - 187 s.

25. On je. Kurz všeobecnej lingvistiky / Per. od fr. - Jekaterinburg, 1999. -426 s.

26. Štatistika reči a automatická analýza textu / Ed. vyd. R.G. Piotrovského. L., 1980. - 223 s.

27. Štoll, P. Sady. Logika. Axiomatické teórie / R. Stoll; Za. z angličtiny. - M., 1968. - 180 s.

28. Tenier, L. Základy štruktúrnej syntaxe. M., 1988.

29. Ubin I.I. Automatizácia prekladateľských činností v ZSSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tichomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderná matematika. M., 1966.

31. Shenk, R. Spracovanie pojmových informácií. M., 1980.

32. Shikhanovič, Yu.A. ÚVOD do modernej matematiky (počiatočné pojmy). M., 1965

33. Shcherba L.V. Ruské samohlásky z kvalitatívneho a kvantitatívneho hľadiska / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Občan sveta // Spark - 1996. - č.5. - str. 13

35. V.A. Uspenského. Predbežné pre čitateľov „Novej literárnej revue“ k semiotickým posolstvám Andreja Nikolajeviča Kolmogorova. - Nová literárna revue. -1997. - č. 24. - S. 18-23

36. Perlovský L. Vedomie, jazyk a kultúra. - Poznanie je moc. -2000. №4 - S. 20-33

Úvod? Prednáška Teória prekladu