Matematické metódy v komparatívnej lingvistike.

Úvod

Kapitola 1. História aplikácie matematických metód v lingvistike

1.1. Formovanie štruktúrnej lingvistiky na prelome 19. – 20. stor.

1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1. Strojový preklad

2.2.Štatistické metódy v učení sa jazykov

2.3. Učenie sa jazyka metódami formálnej logiky

2.4. Perspektívy aplikácie matematických metód v lingvistike

Záver

Literatúra

Dodatok 1. Ronald Schleifer. Ferdinand de Saussure

Príloha 2. Ferdinand de Saussure (preklad)

Úvod

V 20. storočí pretrváva trend interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.

Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.

Cieľom mojej práce v kurze je stručne poukázať na prepojenie matematiky s takou oblasťou lingvistiky, akou je lingvistika. Od roku 1950 sa matematika používa v lingvistike na vytvorenie teoretického aparátu na popis štruktúry jazykov (prirodzených aj umelých). Treba však povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa matematické metódy v lingvistike začali používať na objasnenie základných pojmov lingvistiky, s rozvojom výpočtovej techniky však takýto teoretický predpoklad začal nachádzať uplatnenie v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Lingvisti stáli pred otázkou: ako sa naučiť reprezentovať jazykové vzory v podobe, v akej sa dajú priamo aplikovať na techniku. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. . Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel zaznamenal interakciu jazyka a vedomia a Ferdinand de Saussure, významný lingvista začiatku dvadsiateho storočia (o jeho vplyve na rozvoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď stotožňuje kvantitatívne charakteristiky jazyka (napr. počet rodov, prípadov) so zvláštnosťami národnej mentality (viac v časti 2.2 „Štatistické metódy v lingvistike“).

Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.

Kapitola I. História aplikácie matematických metód v lingvistike

1.1 Formovanie štruktúrnej lingvistiky na prelome XIX - XX storočia

Matematický opis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý siaha až k slávnemu švajčiarskemu lingvistovi zo začiatku dvadsiateho storočia Ferdinandovi de Saussure.

Počiatočným článkom jeho koncepcie je teória jazyka ako systému pozostávajúceho z troch častí (jazyk samotný je Jazyk, reč - heslo a rečová aktivita - Jazyk), v ktorom sa každé slovo (člen systému) nepovažuje samo o sebe, ale v spojení s inými členmi. Ako neskôr poznamenal ďalší významný lingvista, Dán Louis Hjelmslev, Saussure „bol prvý, kto požadoval štrukturálny prístup k jazyku, teda vedecký popis jazyka zaznamenávaním vzťahov medzi jednotkami“.

Saussure pochopil jazyk ako hierarchickú štruktúru a ako prvý nastolil problém hodnoty a významu jazykových jednotiek. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi.

Štrukturálna jednotka jazyka Saussure považovala slovo „znamenie“, v ktorom sa spájal zvuk a význam. Žiadny z týchto prvkov neexistuje jeden bez druhého: preto rodený hovorca chápe rôzne odtiene významu polysémantického slova ako samostatný prvok v štruktúrnom celku, v jazyku.

V teórii F. de Saussura tak možno vidieť interakciu lingvistiky na jednej strane so sociológiou a sociálnou psychológiou (treba podotknúť, že v tom istom období boli Husserlova fenomenológia, Freudova psychoanalýza, Einsteinova teória relativity rozvíjali sa experimenty s formou a obsahom v literatúre, hudbe a výtvarnom umení, na druhej strane s matematikou (pojem konzistencie zodpovedá algebraickému konceptu jazyka). Takáto koncepcia zmenila koncepciu jazykovej interpretácie ako takú: Javy sa začali interpretovať nie vo vzťahu k príčinám ich vzniku, ale vo vzťahu k súčasnosti a budúcnosti. Interpretácia prestala byť nezávislá od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).

Fungovanie jazykového mechanizmu sa prejavuje prostredníctvom rečovej aktivity rodených hovoriacich. Výsledkom reči sú takzvané „správne texty“ – sekvencie rečových jednotiek, ktoré sa riadia určitými vzormi, z ktorých mnohé umožňujú matematický popis. Teória spôsobov opisu syntaktickej štruktúry sa zaoberá štúdiom metód matematického popisu správnych textov (predovšetkým viet). V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Saussureove myšlienky rozvinuli na Západe mladší súčasníci veľkého švajčiarskeho lingvistu: v Dánsku - mnou už spomínaný L. Hjelmslev, ktorý dal vznik algebraickej teórii jazyka vo svojom diele „Základy lingvistickej teórie“, v r. USA - E. Sapir, L. Bloomfield, C. Harris, v ČR - ruský vedec-emigrant N. Trubetskoy.

Štatistickými zákonitosťami v štúdiu jazyka sa začal zaoberať nik iný ako zakladateľ genetiky Georg Mendel. Až v roku 1968 filológovia zistili, že ho v posledných rokoch života fascinovalo štúdium jazykových javov pomocou metód matematiky. Mendel priniesol túto metódu do lingvistiky z biológie; v 90. rokoch len tí najodvážnejší lingvisti a biológovia tvrdili uskutočniteľnosť takejto analýzy. V archíve kláštora sv. Tomáša v Brne, ktorého opátom bol Mendel, sa našli listy so stĺpcami priezvisk zakončenými na „mann“, „bauer“, „mayer“ a s niektorými zlomkami a výpočtami. Mendel v snahe odhaliť formálne zákonitosti pôvodu rodových mien robí zložité výpočty, v ktorých berie do úvahy počet samohlások a spoluhlások v nemeckom jazyku, celkový počet slov, ktoré zvažuje, počet priezvisk, počet mien, počet hlások a spoluhlások. atď.

U nás sa štrukturálna lingvistika začala rozvíjať približne v rovnakom období ako na Západe – na prelome 19. – 20. storočia. Súčasne s F. de Saussurom koncept jazyka ako systému rozvinuli vo svojich prácach profesori Kazanskej univerzity F.F. Fortunatov a I.A. Baudouin de Courtenay. Ten si dlho korešpondoval s de Saussurom, respektíve ženevská a kazaňská lingvistická škola navzájom spolupracovali. Ak možno Saussura nazvať ideológom „exaktných“ metód v lingvistike, potom Baudouin de Courtenay položil praktické základy ich aplikácie. Bol prvým, kto oddelil lingvistiku (napr presné veda využívajúca štatistické metódy a funkčnú závislosť) z filológie (spoločenstvo humanitných disciplín, ktoré študujú duchovnú kultúru prostredníctvom jazyka a reči). Samotný vedec veril, že „lingvistika môže byť v blízkej budúcnosti užitočná, iba ak sa oslobodí od povinného spojenia s filológiou a literárnou históriou“. Fonológia sa stala „skúšobnou pôdou“ pre zavedenie matematických metód do lingvistiky – zvuky ako „atómy“ jazykového systému, majúce obmedzený počet ľahko merateľných vlastností, boli najvhodnejším materiálom pre formálne, rigorózne metódy opisu. Fonológia popiera existenciu významu zvuku, preto bol v štúdiách eliminovaný „ľudský“ faktor. V tomto zmysle sú fonémy ako fyzické alebo biologické objekty.

Fonémy ako najmenšie jazykové prvky prijateľné pre vnímanie predstavujú samostatnú sféru, samostatnú „fenomenologickú realitu“. Napríklad v angličtine môže byť zvuk „t“ vyslovovaný inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Hlavné je, že fonéma bude plniť svoju hlavnú – zmysluplnú – funkciu. Okrem toho rozdiely medzi jazykmi sú také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty rovnakej fonémy (ako anglické „t“, vyslovované s aspiráciou alebo bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V rokoch 1920-1930, po Saussure, Jacobson a N.S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto vlastnosti sú založené na štruktúre orgánov reči - jazyk, zuby, hlasivky. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „Existujú len rozdiely v jazyku“. Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov aj prostriedkom komunikácie a tieto dve funkcie sa nikdy nezhodujú. Môžeme si všimnúť striedanie formy a obsahu: jazykové kontrasty definujú jeho štruktúrne jednotky a tieto jednotky spolupôsobia a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku tvoria distinktívne znaky fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do morfém, morfémy do slov, slová do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac než len súčet jeho častí.

Saussure navrhol myšlienku novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá študovala úlohu znakov v spoločnosti. Saussure nazval túto vedu semiológiou (z gréckeho "semeîon" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. – 30. rokoch 20. storočia a v Paríži v 50. – 60. rokoch, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (resp. formulované) pomocou týchto štruktúr. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola v mnohých ohľadoch protikladom racionalizmu vo svojej lingvistickej analýze: bol pokusom študovať v systéme problém „pravdepodobnosti“ v jazyku. Takýto výskum pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, nie zdrojom života básne“. Báseň slúži na výmenu zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia sa nevyjadruje len slovami, ale aj tým, čo tieto slová vyvolávajú, vymyká sa kontrole vedomia a závisí len od zákony jazyka“ (pozri . Príloha 1).

Saussureho pokus o štúdium vlastných mien v neskororímskej poézii zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnú povahu znakov, ako aj formálnu podstatu Saussureovej lingvistiky, ktorá vylučuje možnosť analýzy významu. Todorov prichádza k záveru, že dnes sa Saussureove diela zdajú byť mimoriadne konzistentné vo svojej neochote študovať symboly javu, ktoré majú jasne definovaný význam [Príloha 1]. Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu knihy Nibelungov definuje symboly len preto, aby ich priradil k chybným údajom: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semiológia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na histórii a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách na jednej strane a na druhej strane štrukturalistickými koncepciami, ktoré stierajú protiklad medzi formou a obsahom (subjektom a objektom) , význam a pôvod v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike, spisy Ferdinanda de Saussure o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.

Na prvom medzinárodnom kongrese lingvistov v Haagu v roku 1928 boli zastúpení aj ruskí vedci. S. Kartsevsky, R. Yakobson a N. Trubetskoy vypracovali správu, ktorá skúmala hierarchickú štruktúru jazyka – v duchu najmodernejších myšlienok zo začiatku minulého storočia. Jakobson vo svojich spisoch rozvinul Saussurove myšlienky, že základné prvky jazyka by sa mali študovať predovšetkým v súvislosti s ich funkciami, a nie s dôvodmi ich výskytu.

Žiaľ, po nástupe Stalina k moci v roku 1924 je ruská lingvistika, podobne ako mnohé iné vedy, hodená späť. Mnohí talentovaní vedci boli nútení emigrovať, boli vyhnaní z krajiny alebo zomreli v táboroch. Až v polovici 50. rokov 20. storočia bol možný určitý pluralizmus teórií – viac o tom v časti 1.2.

1.2 Aplikácia matematických metód v lingvistike v druhej polovici 20.

Do polovice dvadsiateho storočia sa vytvorili štyri svetové lingvistické školy, z ktorých každá sa ukázala byť predchodcom určitej „presnej“ metódy. Leningradská fonologická škola(jeho predkom bol žiak Baudouina de Courtenay L.V. Shcherba) použil psycholingvistický experiment založený na analýze reči rodených hovoriacich ako hlavné kritérium na zovšeobecnenie zvuku vo forme fonémy.

Vedci Pražský lingvistický krúžok, najmä jej zakladateľ N.S. Trubetskoy, ktorý emigroval z Ruska, rozvinul teóriu opozícií - sémantickú štruktúru jazyka opísali ako súbor opozične konštruovaných sémantických jednotiek - sem. Táto teória sa uplatnila pri štúdiu nielen jazyka, ale aj umeleckej kultúry.

Ideológovia americký deskriptivizmus boli lingvisti L. Bloomfield a E. Sapir. Jazyk bol deskriptivistom prezentovaný ako súbor rečových výrokov, ktoré boli hlavným predmetom ich štúdia. Zamerali sa na pravidlá vedeckého opisu (odtiaľ názov) textov: štúdium organizácie, usporiadania a klasifikácie ich prvkov. Formalizácia analytických postupov v oblasti fonológie a morfológie (rozvoj princípov štúdia jazyka na rôznych úrovniach, distributívna analýza, metóda priamych konštituentov a pod.) viedla k formulovaniu všeobecných otázok lingvistického modelovania. Nepozornosť plánovania obsahu jazyka, ako aj paradigmatickej stránky jazyka neumožňovali deskriptivistom dostatočne plnohodnotne interpretovať jazyk ako systém.

V 60. rokoch sa rozvinula teória formálnych gramatík, ktorá vznikla najmä vďaka práci amerického filozofa a lingvistu N. Chomského. Je právom považovaný za jedného z najznámejších moderných vedcov a osobností verejného života, venuje sa mu množstvo článkov, monografií a dokonca aj celovečerný dokument. Pod názvom zásadne nového spôsobu opisu syntaktickej štruktúry vynájdenej Chomským - generatívnej (generatívnej) gramatiky - bol zodpovedajúci trend v lingvistike tzv. generativizmus.

Chomsky, potomok prisťahovalcov z Ruska, študoval od roku 1945 lingvistiku, matematiku a filozofiu na Pensylvánskej univerzite, pričom bol silne ovplyvnený svojím učiteľom Zeligom Harrisom – podobne ako Harris aj Chomsky považoval a stále považuje svoje politické názory za blízke anarchizmu (stále je známy ako kritik existujúceho politického systému USA a ako jeden z duchovných vodcov antiglobalizmu).

Chomského prvé veľké vedecké dielo, diplomová práca „Morfológia modernej hebrejčiny » (1951) zostal nepublikovaný. Chomsky získal doktorát na Pensylvánskej univerzite v roku 1955, ale veľa z výskumu, z ktorého vychádzala jeho dizertačná práca (úplne publikovaná až v roku 1975 pod názvom Logická štruktúra lingvistickej teórie) a jeho prvá monografia Syntaktické štruktúry (1957, Rus. trans 1962) sa uskutočnil na Harvardskej univerzite v rokoch 1951-1955. V tom istom roku 1955 sa vedec presťahoval na Massachusetts Institute of Technology, kde sa v roku 1962 stal profesorom.

Chomského teória prešla niekoľkými fázami svojho vývoja.

V prvej monografii „Syntaktické štruktúry“ vedec predstavil jazyk ako mechanizmus na generovanie nekonečného súboru viet pomocou konečného súboru gramatických prostriedkov. Na opísanie jazykových vlastností navrhol koncepty hlbokých (skrytých pred priamym vnímaním a generovaných systémom rekurzívnych, t.j. opakovane aplikovateľných pravidiel) a povrchových (priamo vnímaných) gramatických štruktúr, ako aj transformácií, ktoré popisujú prechod. od hlbokých štruktúr po povrchové. Jednej hĺbkovej štruktúre môže zodpovedať niekoľko povrchových štruktúr (napríklad pasívna štruktúra Dekrét podpisuje prezident odvodené z rovnakej hlbokej štruktúry ako aktívny konštrukt Prezident dekrét podpisuje) a naopak (teda nejednoznačnosť matka miluje dcéru opísané ako výsledok zhody povrchových štruktúr, ktoré sa vracajú k dvom rozdielnym hlbokým, z ktorých jedna je matkou tá, ktorá miluje dcéru, a druhá tá, ktorú miluje dcéra).

Chomského štandardná teória sa považuje za model „Aspektov“ uvedený v Chomského knihe „Aspekty teórie syntaxe“. V tomto modeli boli po prvýkrát do formálnej teórie zavedené pravidlá sémantickej interpretácie, ktoré pripisovali význam hlbokým štruktúram. V Aspektoch sa jazyková kompetencia stavia do protikladu k používaniu jazyka (výkonu), preberá sa takzvaná Katz-Postalova hypotéza o zachovaní významu pri transformácii, v súvislosti s ktorou je vylúčený koncept fakultatívnej transformácie a aparát tzv. zavádzajú sa syntaktické znaky popisujúce lexikálnu kompatibilitu.

Chomsky v 70. rokoch pracoval na teórii riadenia a väzby (GB-teória – zo slov. vláda a viazanie) je všeobecnejší ako predchádzajúci. Vedec v ňom upustil od špecifických pravidiel, ktoré popisujú syntaktické štruktúry konkrétnych jazykov. Všetky transformácie boli nahradené jednou univerzálnou transformáciou pohybu. V rámci GB teórie existujú aj súkromné ​​moduly, z ktorých každý zodpovedá za svoju časť gramatiky.

Už nedávno, v roku 1995, Chomsky predložil minimalistický program, kde je ľudský jazyk opísaný ako strojový jazyk. Je to len program, nie model alebo teória. Chomsky v nej identifikuje dva hlavné subsystémy ľudského jazykového aparátu: lexikón a výpočtový systém, ako aj dve rozhrania – fonetické a logické.

Chomského formálne gramatiky sa stali klasickými pre popis nielen prirodzených, ale aj umelých jazykov - najmä programovacích jazykov. Rozvoj štruktúrnej lingvistiky v druhej polovici 20. storočia možno právom považovať za „chomskú revolúciu“.

Moskovská fonologická škola, ktorej predstaviteľmi boli A.A. Reformatsky, V.N. Sidorov, P.S. Kuznecov, A.M. Suchotin, R.I. Avanesov, použil podobnú teóriu na štúdium fonetiky. Postupne sa začínajú uplatňovať „exaktné“ metódy nielen vo fonetike, ale aj v syntaxi. Lingvisti aj matematici u nás aj v zahraničí začínajú študovať štruktúru jazyka. V 50. a 60. rokoch 20. storočia sa v ZSSR začala nová etapa interakcie medzi matematikou a lingvistikou spojená s rozvojom systémov strojového prekladu.

Podnetom na začatie týchto prác u nás bol prvý vývoj v oblasti strojového prekladu v Spojených štátoch (hoci prvé mechanizované prekladacie zariadenie P. P. Smirnov-Troyansky bolo vynájdené v ZSSR už v roku 1933, keďže bolo primitívne , sa nerozšírilo). V roku 1947 prišli A. Butt a D. Britten s kódom na preklad slov po slove pomocou počítača, o rok neskôr R. Richens navrhol pravidlo rozdeľovania slov na kmene a koncovky v strojovom preklade. Tie roky boli úplne iné ako dnes. Boli to veľmi veľké a drahé stroje, ktoré zaberali celé miestnosti a na údržbu si vyžadovali veľký tím inžinierov, operátorov a programátorov. V podstate sa tieto počítače používali na vykonávanie matematických výpočtov pre potreby vojenských inštitúcií - nové v matematike, fyzike a technike slúžili predovšetkým vojenským záležitostiam. V raných fázach rozvoj MP aktívne podporovala armáda, pričom (v podmienkach studenej vojny) sa v USA rozvíjal rusko-anglický smer a v ZSSR smer anglo-ruský.

V januári 1954 sa na Massachusettskej technickej univerzite uskutočnil Georgetownský experiment, prvá verejná demonštrácia prekladu z ruštiny do angličtiny na stroji IBM-701. Abstrakt správy o úspešnom absolvovaní experimentu, ktorú vytvoril D.Yu. Panov, objavil sa v RJ "Matematika", 1954, č. 10: "Preklad z jedného jazyka do druhého pomocou stroja: správa o prvom úspešnom teste."

D. Yu.Panov (v tom čase riaditeľ Ústavu vedeckých informácií - INI, neskôr VINITI) prilákal I. K. Belskaja, ktorý neskôr viedol skupinu strojového prekladu na Ústave presnej matematiky a počítačového inžinierstva Akadémie vied ZSSR. práca na strojovom preklade. Koncom roku 1955 sa datujú prvé skúsenosti s prekladom z angličtiny do ruštiny pomocou stroja BESM. Programy pre BESM zostavil N.P. Trifonov a L.N. Korolev, ktorého doktorandská práca bola venovaná metódam vytvárania slovníkov pre strojový preklad.

Paralelne prebiehali práce na strojovom preklade na Oddelení aplikovanej matematiky Matematického inštitútu Akadémie vied ZSSR (teraz Inštitút aplikovanej matematiky M. V. Keldysha Ruskej akadémie vied). Z iniciatívy matematika A.A. Ljapunov. Zapojil O.S. Kulagin a jej študenti T.D. Wentzel a N.N. Ricco. Myšlienky Ljapunova a Kulaginy o možnosti využitia technológie na preklad z jedného jazyka do druhého boli publikované v časopise Nature, 1955, č. Od konca roku 1955 k nim pribudol T.N. Moloshnaya, ktorý potom začal samostatnú prácu na anglicko-ruskom prekladovom algoritme.

R. Frumkina, ktorý sa v tom čase zaoberal prekladovým algoritmom zo španielčiny, pripomína, že v tejto fáze práce bolo ťažké urobiť nejaké konzistentné kroky. Oveľa častejšie som sa musel riadiť heuristickou skúsenosťou – vlastnou alebo kolegami.

Avšak prvá generácia systémov strojového prekladu bola veľmi nedokonalá. Všetky boli založené na sekvenčných prekladových algoritmoch „slovo po slove“, „fráza po fráze“ – sémantické spojenia medzi slovami a vetami neboli nijako brané do úvahy. Ide napríklad o tieto vety: John hľadal svoju krabicu na hračky.Nakoniec to našiel. Krabička bola v pere.John bol veľmi šťastný. (John hľadal svoju krabicu s hračkami. Nakoniec ju našiel. Krabica bola v ohrádke. John bol veľmi šťastný.). „Pero“ v tomto kontexte nie je „pero“ (nástroj na písanie), ale „ohrádka“ ( hracie pero). Znalosť synoným, antoným a prenesených významov je ťažké zadať do počítača. Sľubným smerom bol vývoj počítačových systémov zameraných na využitie ľudského prekladača.

Postupom času boli systémy priameho prekladu nahradené T-systémami (z anglického slova "transfer" - transformácia), v ktorých sa preklad uskutočňoval na úrovni syntaktických štruktúr. Algoritmy T-systémov využívali mechanizmus, ktorý umožňoval zostaviť syntaktickú štruktúru podľa gramatických pravidiel jazyka vstupnej vety (podobne ako sa cudzí jazyk vyučuje na strednej škole) a následne syntetizovať výstupnú vetu. transformáciou syntaktickej štruktúry a dosadením potrebných slov zo slovníka.

Ljapunov hovoril o preklade extrahovaním významu preloženého textu a jeho prezentáciou v inom jazyku. Za najdokonalejší sa stále považuje prístup k budovaniu systémov strojového prekladu založený na získavaní sémantickej reprezentácie vstupnej vety sémantickou analýzou a syntéze vstupnej vety podľa získanej sémantickej reprezentácie. Takéto systémy sa nazývajú I-systémy (od slova „interlingua“). Úloha ich vytvorenia, zasadená koncom 50. a začiatkom 60. rokov, však dodnes nie je úplne vyriešená, a to aj napriek úsiliu Medzinárodnej federácie IFIP, svetovej komunity vedcov v oblasti spracovania informácií.

Vedci premýšľali o tom, ako formalizovať a zostaviť algoritmy na prácu s textami, aké slovníky by sa mali vkladať do stroja, aké lingvistické vzory by sa mali používať pri strojovom preklade. Tradičná lingvistika takéto predstavy nemala – nielen z hľadiska sémantiky, ale ani z hľadiska syntaxe. V tom čase neexistovali zoznamy syntaktických konštrukcií pre žiadny jazyk, neboli skúmané podmienky ich kompatibility a zameniteľnosti, neboli vyvinuté pravidlá na zostavovanie veľkých jednotiek syntaktickej štruktúry z menších konštitučných prvkov.

Potreba vytvorenia teoretických základov strojového prekladu viedla k formovaniu a rozvoju matematickej lingvistiky. Vedúcu úlohu v tejto veci v ZSSR zohrali matematici A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, lingvisti V.Yu. Rosenzweig, P.S. Kuznecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginova dizertačná práca bola venovaná štúdiu formálnej teórie gramatík (súčasne s N. Khomským v USA), Kuznecov predložil úlohu axiomatizácie lingvistiky, ktorá siaha až k prácam F.F. Fortunatov.

Dňa 6. mája 1960 bola prijatá vyhláška Prezídia Akadémie vied ZSSR „O vývoji štrukturálnych a matematických metód štúdia jazyka“ a na Jazykovednom ústave a Ústave sv. ruský jazyk. Od roku 1960 sa na popredných humanitných univerzitách v krajine - na filologickej fakulte Moskovskej štátnej univerzity, Leninrad, na univerzitách v Novosibirsku, na Moskovskom štátnom inštitúte cudzích jazykov - začalo školenie v oblasti automatického spracovania textu.

Diela strojového prekladu z tohto obdobia, nazývané „klasické“, sú však skôr teoretické ako praktické. Nákladovo efektívne systémy strojového prekladu sa začali vytvárať až v osemdesiatych rokoch minulého storočia. O tom budem hovoriť neskôr v časti 2.1, Strojový preklad.

60. - 70. roky 20. storočia zahŕňajú hlboký teoretický vývoj využívajúci metódy teórie množín a matematickej logiky, ako je teória poľa a teória fuzzy množín.

Autorom teórie poľa v lingvistike bol sovietsky básnik, prekladateľ a lingvista V.G. Admoni. Svoju teóriu spočiatku rozvíjal na základe nemeckého jazyka. Pre Admoniho pojem „pole“ označuje ľubovoľnú neprázdnu množinu jazykových prvkov (napríklad „lexikálne pole“, „sémantické pole“).

Štruktúra poľa je heterogénna: pozostáva z jadra, ktorého prvky majú kompletný súbor znakov, ktoré definujú množinu, a z periférie, ktorej prvky môžu mať obe znaky danej množiny (nie všetky) a susedných. Uvediem príklad ilustrujúci toto tvrdenie: napríklad v angličtine je pole zložených slov („day-dream“ – „sen“ ťažko oddeliteľné od oblasti fráz („slzný plyn“ – „slzný plyn“)) .

Už vyššie spomínaná teória fuzzy množín úzko súvisí s teóriou poľa. V ZSSR jazykovedci V.G. Admoni, I.P. Ivanová, G.G. Pochentsov, jeho predkom však bol americký matematik L. Zadeh, ktorý v roku 1965 publikoval článok „Fuzzy Logic“. Po matematickom zdôvodnení teórie fuzzy množín ich Zade zvažoval na základe lingvistického materiálu.

V tejto teórii nehovoríme ani tak o príslušnosti prvkov k danej množine (АОа), ako o miere tejto príslušnosti (mАОа), keďže periférne prvky môžu v tej či onej miere patriť do viacerých polí. Zade (Lofti-zade) bol rodák z Azerbajdžanu, do 12 rokov mal prax v komunikácii v štyroch jazykoch – azerbajdžančine, ruštine, angličtine a perzštine – a používal tri rôzne abecedy: cyriliku, latinku, arabčinu. Keď sa vedca pýtajú, čo je spoločné medzi teóriou fuzzy množín a lingvistikou, nepopiera toto spojenie, ale objasňuje: „Nie som si istý, či štúdium týchto jazykov malo veľký vplyv na moje myslenie. Ak to tak bolo, tak len podvedome. Zadeh v mladosti študoval na presbyteriánskej škole v Teheráne a po druhej svetovej vojne emigroval do USA. "Otázkou nie je, či som Američan, Rus, Azerbajdžan alebo niekto iný," povedal v jednom z rozhovorov, "som formovaný všetkými týmito kultúrami a národmi a medzi každým z nich sa cítim celkom dobre." V týchto slovách je niečo podobné tomu, čo charakterizuje teóriu fuzzy množín – odklon od jednoznačných definícií a ostrých kategórií.

U nás sa v 70. rokoch prekladali a študovali diela západných jazykovedcov 20. storočia. I.A. Melčuk preložil diela N. Chomského do ruštiny. NA. Slyusareva vo svojej knihe „Teória F. de Saussura vo svetle modernej lingvistiky“ spája postuláty Saussurovho učenia s aktuálnymi problémami lingvistiky 70. rokov. Existuje tendencia k ďalšej matematizácii lingvistiky. Popredné domáce univerzity školia personál v odbore „Matematická (teoretická, aplikovaná) lingvistika“. Zároveň na Západe dochádza k prudkému skoku vo vývoji výpočtovej techniky, ktorá si vyžaduje stále nové a nové jazykové základy.

V priebehu dvadsiateho storočia teda dochádzalo k zbližovaniu exaktných a humanitných vied. Interakcia matematiky a lingvistiky stále viac nachádzala praktické aplikácie. Viac o tom v ďalšej kapitole.

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1 Strojový preklad

Myšlienka prekladu z jedného jazyka do druhého pomocou univerzálneho mechanizmu vznikla niekoľko storočí predtým, ako sa začal prvý vývoj v tejto oblasti - v roku 1649 René Descartes navrhol myšlienku jazyka, v ktorom by boli ekvivalentné myšlienky rôzne jazyky by boli vyjadrené jedným symbolom. Prvé pokusy o realizáciu tejto myšlienky v 30. – 40. rokoch 20. storočia, začiatok teoretického rozvoja v polovici storočia, zdokonaľovanie prekladateľských systémov pomocou techniky v 70. – 80. rokoch 20. storočia, prudký rozvoj prekladateľskej techniky v posl. desaťročie – to sú fázy vývoja strojového prekladu ako odvetvia. Počítačová lingvistika ako veda vyrástla z diel o strojovom preklade.

S rozvojom výpočtovej techniky koncom 70. a začiatkom 80. rokov si výskumníci stanovili reálnejšie a nákladovo efektívnejšie ciele – stroj sa nestal konkurentom (ako sa doteraz predpokladalo), ale pomocníkom ľudského prekladateľa. Strojový preklad prestáva slúžiť výlučne vojenským úlohám (všetky sovietske a americké vynálezy a výskumy zamerané predovšetkým na ruštinu a angličtinu tak či onak prispeli k studenej vojne). V roku 1978 sa cez prepojenú sieť Arpa prenášali slová v prirodzenom jazyku a o šesť rokov neskôr sa v USA objavili prvé programy na preklad mikropočítačov.

V 70. rokoch Komisia Európskych spoločenstiev kupuje anglicko-francúzsku verziu počítačového prekladača Systran, pričom objednáva aj francúzsko-anglickú a taliansko-anglickú verziu a systém prekladov z ruštiny do angličtiny, ktorý používajú americké ozbrojené sily. Takto boli položené základy projektu EUROTRA.

O oživení strojového prekladu v 70-80 rokoch. Svedčia o tom tieto skutočnosti: Komisia Európskych spoločenstiev (CEC) kupuje anglicko-francúzsku verziu Systran, ako aj prekladový systém z ruštiny do angličtiny (posledný vyvinutý po správe ALPAC a naďalej ho používa US Air Sila a NASA); okrem toho CEC nariaďuje vývoj francúzsko-anglickej a taliansko-anglickej verzie. Súčasne dochádza k rýchlemu rozmachu činností strojového prekladu v Japonsku; v USA Panamerická zdravotnícka organizácia (PAHO) nariaďuje rozvoj španielsko-anglického smeru (systém SPANAM); Americké letectvo financuje vývoj systému strojového prekladu v Lingvistic Research Center na Texaskej univerzite v Austine; Skupina TAUM v Kanade dosahuje pozoruhodný pokrok vo vývoji svojho systému METEO (meteorologický preklad). Množstvo projektov začalo v 70. a 80. rokoch. sa následne rozvinuli do plnohodnotných komerčných systémov.

V období rokov 1978-93 sa na výskum v oblasti strojového prekladu minulo 20 miliónov dolárov v USA, 70 miliónov v Európe a 200 miliónov v Japonsku.

Jednou z noviniek je technológia TM (prekladová pamäť), ktorá funguje na princípe akumulácie: počas procesu prekladu sa ukladá pôvodný segment (veta) a jej preklad, výsledkom čoho je vytvorenie lingvistickej databázy; ak sa v novo preloženom texte nájde identický alebo podobný segment, zobrazí sa spolu s prekladom a údajom o percentuálnej zhode. Prekladateľ následne urobí rozhodnutie (upraví, zamietne alebo prijme preklad), ktorého výsledok systém uloží, takže nie je potrebné prekladať tú istú vetu dvakrát. Známy komerčný systém založený na technológii TM je v súčasnosti vyvinutý systémom TRADOS (založený v roku 1984).

V súčasnosti niekoľko desiatok spoločností vyvíja systémy komerčného strojového prekladu vrátane: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softvér; Linguistica b.v. a ďalšie Teraz môžete využívať služby automatických prekladačov priamo na webe: alphaWorks; Online prekladač PROMT, LogoMedia.net, prekladateľská služba Babel Fish od AltaVista; InfiniT.com; Preklad internetu.

Komerčne efektívne prekladateľské systémy sa objavili v druhej polovici 80. rokov aj u nás. Rozšíril sa samotný pojem strojového prekladu (začal zahŕňať „vytváranie množstva automatických a automatizovaných systémov a zariadení, ktoré automaticky alebo poloautomaticky vykonávajú celý prekladateľský cyklus alebo jednotlivé úlohy v dialógu s človekom“) a vládne prostriedky na rozvoj tohto odvetvia sa zvýšili.

Hlavnými jazykmi domácich prekladateľských systémov sa stali ruština, angličtina, nemčina, francúzština a japončina. All-Union Translation Center (VTsP) vyvinulo systém na preklad z angličtiny a nemčiny do ruštiny na počítači ES-1035 -ANRAP. Pozostával z troch slovníkov – vstupného anglického a nemeckého a výstupného ruského – pod jedným softvérom. Existovalo niekoľko vzájomne zameniteľných odborných slovníkov – o výpočtovej technike, programovaní, rádioelektronike, strojárstve, poľnohospodárstve, hutníctve. Systém mohol pracovať v dvoch režimoch – automatickom a interaktívnom, kedy sa na obrazovke zobrazoval zdrojový text a preklad na frázu, ktorú si človek mohol upraviť. Rýchlosť prekladu textu do ANRAP (od začiatku písania až po koniec tlače) bola približne 100 strán za hodinu.

V roku 1989 vznikla rodina komerčných prekladateľov typu SPRINT, pracujúcich s ruským, anglickým, nemeckým a japonským jazykom. Ich hlavnou výhodou bola kompatibilita s IBM PC - domáce systémy strojového prekladu tak dosiahli medzinárodnú úroveň kvality. Súčasne sa vyvíja systém strojového prekladu z francúzštiny do ruštiny FRAP, ktorý zahŕňa 4 stupne analýzy textu: grafematickú, morfologickú, syntaktickú a sémantickú. V LGPI ich. Herzen, prebiehali práce na štvorjazyčnom (anglický, francúzsky, španielsky, ruský) systém SILOD-MP (v priemyselnom režime sa používali anglicko-ruské a francúzsko-ruské slovníky.

Pre špecializovaný preklad textov z elektrotechniky existoval systém ETAP-2. Analýza vstupného textu v nej prebiehala v dvoch rovinách – morfologickej a syntaktickej. Slovník ETAP-2 obsahoval asi 4 tisíc hesiel; štádium transformácie textu - asi 1000 pravidiel (96 všeobecných, 342 súkromných, zvyšok tvorí slovník). To všetko zabezpečilo uspokojivú kvalitu prekladu (napr. názov patentu „Optical phase grid organization and coupling device having a take management“ bol preložený ako „Zariadenie s optickou fázovou mriežkou a spojovacie zariadenie s takým zariadením“ – napriek tautológia, význam je zachovaný).

V Minskom pedagogickom ústave cudzích jazykov bol na základe anglicko-ruského slovníka slovných tvarov a fráz vynájdený systém strojového prekladu názvov, v Ústave orientalistiky Akadémie vied systém pre preklad. z japončiny do ruštiny. Prvá automatická slovníková a terminologická služba (SLOTHERM) pre výpočtovú techniku ​​a programovanie, vytvorená na Moskovskom výskumnom ústave automatizačných systémov, obsahovala približne 20 000 výrazov vo výkladovom slovníku a špeciálnych slovníkoch pre lingvistický výskum.

Systémy strojového prekladu sa postupne začali využívať nielen na určený účel, ale aj ako dôležitá súčasť systémov automatického učenia (na výučbu prekladu, kontrolu pravopisu a gramatických znalostí).

90. roky so sebou priniesli prudký rozvoj trhu s PC (od stolných po vreckové) a informačných technológií, rozšírené používanie internetu (ktorý sa stáva viac medzinárodným a viacjazyčným). To všetko spôsobilo, že ďalší vývoj automatizovaných prekladateľských systémov bol žiadaný. Od začiatku 90. rokov 20. storočia Na trh PC systémov vstupujú aj domáci vývojári.

V júli 1990 bol na PC Fóre v Moskve predstavený prvý komerčný systém strojového prekladu v Rusku s názvom PROMT (PROgrammer's Machine Translation), PROMT vyhral súťaž NASA na dodávku MP systémov (PROMT bola jedinou neamerickou spoločnosťou v tomto V roku 1992 PROMT uvoľnil celú rodinu systémov pod novým názvom STYLUS na preklad z angličtiny, nemčiny, francúzštiny, taliančiny a španielčiny do ruštiny a z ruštiny do angličtiny a na svete bol vytvorený prvý systém strojového prekladu pre Windows základom STYLUS v roku 1993. V roku 1994 bol vydaný STYLUS 2.0 pre Windows 3.X/95/NT a v rokoch 1995-1996 tretia generácia systémov strojového prekladu, plne 32-bitový STYLUS 3.0 pre Windows 95/NT, pričom úspešne sa dokončil vývoj úplne nových, svetovo prvých rusko-nemeckých a rusko-francúzskych systémov strojového prekladu.

V roku 1997 bola podpísaná dohoda s francúzskou spoločnosťou Softissimo o vytvorení prekladových systémov z francúzštiny do nemčiny a angličtiny a naopak a v decembri tohto roku bol vydaný prvý nemecko-francúzsky prekladateľský systém na svete. V tom istom roku spoločnosť PROMT vydala systém implementovaný pomocou technológie Gigant, ktorý podporuje niekoľko jazykových smerov v jednom shellu, ako aj špeciálny prekladač pre prácu na internete WebTranSite.

V roku 1998 vyšla celá plejáda programov pod novým názvom PROMT 98. O rok neskôr PROMT vydal dva nové produkty: unikátny softvérový balík pre prácu na internete - PROMT Internet a prekladač pre firemné poštové systémy - PROMT Mail Prekladateľ. V novembri 1999 bol PROMT uznaný ako najlepší systém strojového prekladu testovaný francúzskym časopisom PC Expert, čím prekonal svojich konkurentov o 30 percent. Pre firemných klientov boli vyvinuté aj špeciálne serverové riešenia - podnikový prekladový server PROMT Translation Server (PTS) a internetové riešenie PROMT Internet Translation Server (PITS). V roku 2000 PROMT aktualizoval celý svoj rad softvérových produktov vydaním novej generácie systémov MT: PROMT Translation Office 2000, PROMT Internet 2000 a Magic Gooddy 2000.

Online preklad s podporou systému PROMT sa používa na mnohých domácich a zahraničných stránkach: Online Translator PROMT, InfiniT.com, Translate.Ru, Lycos atď., Ako aj v inštitúciách rôznych profilov na preklady obchodných dokumentov, články a listy (existujú prekladateľské systémy zabudované priamo v programe Outlook Express a iných e-mailových klientoch).

V súčasnosti sa objavujú nové technológie strojového prekladu založené na využívaní systémov umelej inteligencie a štatistických metód. Posledne menované sú diskutované v ďalšej časti.

2.2 Štatistické metódy v učení sa jazykov

Značná pozornosť sa v modernej lingvistike venuje štúdiu jazykových javov pomocou metód kvantitatívnej matematiky. Kvantitatívne údaje často pomáhajú hlbšie pochopiť skúmané javy, ich miesto a úlohu v systéme súvisiacich javov. Odpoveď na otázku „koľko“ pomáha odpovedať na otázky „čo“, „ako“, „prečo“ – taký je heuristický potenciál kvantitatívnej charakteristiky.

Štatistické metódy zohrávajú významnú úlohu vo vývoji systémov strojového prekladu (pozri časť 2.1). V štatistickom prístupe sa problém prekladu zvažuje z hľadiska hlučného kanála. Predstavte si, že potrebujeme preložiť vetu z angličtiny do ruštiny. Princíp noisy channel nám ponúka nasledujúce vysvetlenie vzťahu medzi anglickou a ruskou vetou: anglická veta nie je nič iné ako ruská veta skomolená nejakým hlukom. Aby sme mohli obnoviť pôvodnú ruskú vetu, potrebujeme vedieť, čo ľudia zvyčajne hovoria v ruštine a ako sú ruské frázy skreslené do angličtiny. Preklad sa uskutočňuje vyhľadávaním takej ruskej vety, ktorá maximalizuje súčin bezpodmienečnej pravdepodobnosti ruskej vety a pravdepodobnosti anglickej vety (originálu) danej ruskej vety. Podľa Bayesovej vety je táto ruská veta najpravdepodobnejším prekladom angličtiny:

kde e je prekladová veta a f je pôvodná veta

Potrebujeme teda zdrojový model a model kanála alebo jazykový model a model prekladu. Jazykový model musí priradiť skóre pravdepodobnosti akejkoľvek vete v cieľovom jazyku (v našom prípade ruštine) a prekladový model pôvodnej vete. (pozri tabuľku 1)

Vo všeobecnosti systém strojového prekladu funguje v dvoch režimoch:

1. Systémové školenie: vezme sa trénovací korpus paralelných textov a pomocou lineárneho programovania sa hľadajú také hodnoty prekladových korešpondenčných tabuliek, ktoré maximalizujú pravdepodobnosť (napríklad) ruskej časti korpusu s dostupnou angličtinou podľa na vybraný model prekladu. Model ruského jazyka je postavený na ruskej časti toho istého korpusu.

2. Využitie: na základe údajov získaných pre neznámu anglickú vetu sa hľadá ruština, ktorá maximalizuje súčin pravdepodobností priradených jazykovým modelom a modelom prekladu. Program používaný na takéto vyhľadávanie sa nazýva dekodér.

Najjednoduchším štatistickým modelom prekladu je model doslovného prekladu. Tento model predpokladá, že na preloženie vety z jedného jazyka do druhého stačí preložiť všetky slová (vytvoriť „vrecko slov“) a model zabezpečí ich umiestnenie v správnom poradí. a, f | e) až P(a | e , f), t.j. pravdepodobnosti daného zarovnania pri danej dvojici viet, každá pravdepodobnosť P(a, f | e) je normalizovaná súčtom pravdepodobností všetkých zarovnaní danej dvojice viet:

Implementácia Viterbiho algoritmu, ktorý sa používa na trénovanie modelu #1, je nasledovná:

1. Celá tabuľka pravdepodobností korešpondencie prekladu je vyplnená rovnakými hodnotami.

2. Pre všetky možné varianty párových spojení slov sa vypočíta pravdepodobnosť P(a, f | e):

3. Hodnoty P(a, f | e) sa normalizujú, aby sa získali hodnoty P(a | e, f).

4. Vypočíta sa frekvencia každého translačného páru, vážená pravdepodobnosťou každej možnosti zarovnania.

5. Výsledné vážené frekvencie sú normalizované a tvoria novú tabuľku pravdepodobností korešpondencie prekladu

6. Algoritmus sa opakuje od kroku 2.

Uvažujme ako príklad trénovanie podobného modelu na korpuse dvoch párov viet (obr. 2):

Biely dom


Po veľkom počte iterácií dostaneme tabuľku (tabuľka 2), ktorá ukazuje, že preklad sa vykonáva s vysokou presnosťou.


Štatistické metódy sú tiež široko používané pri štúdiu slovnej zásoby, morfológie, syntaxe a štýlu. Vedci z Permskej štátnej univerzity vypracovali štúdiu založenú na tvrdení, že stereotypné frázy sú dôležitým „stavebným materiálom“ textu. Tieto frázy pozostávajú z „jadrových“ opakovaných slov a závislých špecifikátorov slov a majú výrazné štylistické zafarbenie.

Vo vedeckom štýle možno „jadrové“ slová nazvať: výskum, štúdium, úloha, problém, otázka, jav, fakt, pozorovanie, analýza atď. V žurnalistike budú iné slová „jadrové“, ktoré majú zvýšenú hodnotu špeciálne pre text novín: čas, osoba, moc, podnikanie, akcia, zákon, život, história, miesto atď. (celkom 29)

Pre jazykovedcov je zaujímavá aj odborná diferenciácia národného jazyka, originalita používania slovnej zásoby a gramatiky v závislosti od druhu zamestnania. Je známe, že vodiči v odbornej reči používajú tvar sh o fer, hovoria medici k o klub namiesto kokteilu Yu sh - takéto príklady možno uviesť. Úlohou štatistiky je sledovať variabilitu výslovnosti a zmenu jazykovej normy.

Profesijné rozdiely vedú k rozdielom nielen gramatickým, ale aj lexikálnym. Jakutská štátna univerzita pomenovaná po M.K. Ammosova bolo analyzovaných 50 dotazníkov s najbežnejšími reakciami na určité slová medzi lekármi a staviteľmi (tabuľka 3).

Stavitelia

Ľudské

pacient (10), osobnosť (5)

muž (5)

dobre

pomoc (8), pomoc (7)

zlo (16)

život

smrť (10)

krásne (5)

smrť

mŕtvola (8)

život (6)

oheň

teplo (8), horieť (6)

oheň (7)

prstom

ruka (14), panaritium (5)

veľký (7), index (6)

oči

zrak (6), žiak, oftalmológ (po 5)

hnedá (10), veľká (6)

hlavu

myseľ (14), mozog (5)

veľký (9), inteligentný (8), inteligentný (6)

stratiť

vedomie, život (každý 4)

peniaze (5), nájsť (4)


Možno konštatovať, že lekári častejšie ako stavbári dávajú asociácie súvisiace s ich profesijnou činnosťou, keďže slovné podnety uvedené v dotazníku súvisia viac s ich profesiou ako s profesiou stavbára.

Štatistické zákonitosti v jazyku sa využívajú na vytváranie frekvenčných slovníkov – slovníkov, ktoré dávajú číselné charakteristiky frekvencie slov (tvarov slov, slovných spojení) ľubovoľného jazyka – jazyka pisateľa, akéhokoľvek diela a pod. slovo sa používa ako charakteristika výskytu slova v texte určitého zväzku

Model vnímania reči nie je možný bez slovníka ako jeho základnej zložky. Vo vnímaní reči je základnou operačnou jednotkou slovo. Z toho vyplýva najmä to, že každé slovo vnímaného textu musí byť stotožnené s príslušnou jednotkou vnútornej slovnej zásoby poslucháča (či čitateľa). Je prirodzené predpokladať, že vyhľadávanie je od začiatku obmedzené na niektoré subdomény slovníka. Podľa väčšiny moderných teórií vnímania reči poskytuje skutočná fonetická analýza znejúceho textu v typickom prípade len niektoré čiastkové informácie o možnom fonologickom vzhľade slova a tento druh informácií zodpovedá nie jednému, ale určitému MNOHÉM slovám. slovníka; Preto vznikajú dva problémy:

a) vybrať vhodný súbor podľa určitých parametrov;

(b) v rámci vymedzeného súboru (ak je primerane pridelený) „eliminovať“ všetky slová, okrem jediného, ​​ktoré najlepšie zodpovedá danému slovu rozpoznaného textu. Jednou zo stratégií „odpadnutia“ je vylúčenie nízkofrekvenčných slov. Z toho vyplýva, že slovnou zásobou pre vnímanie reči je frekvenčný slovník. Práve vytvorenie počítačovej verzie frekvenčného slovníka ruského jazyka je prvotnou úlohou predkladaného projektu.

Na základe materiálu ruského jazyka existuje 5 frekvenčných slovníkov (nepočítajúc odvetvové slovníky). Všimnime si len niektoré všeobecné nedostatky existujúcich slovníkov.

Všetky známe frekvenčné slovníky ruského jazyka sú založené na spracovaní polí písaných (tlačených) textov. Čiastočne z tohto dôvodu, keď je identita slova z veľkej časti založená na formálnej, grafickej zhode, nie je dostatočne zohľadnená sémantika. V dôsledku toho sú aj frekvenčné charakteristiky posunuté, skreslené; ak napríklad kompilátor frekvenčného slovníka zaradí slová zo spojenia „navzájom“ do všeobecnej štatistiky používania slova „priateľ“, potom je to sotva opodstatnené: vzhľadom na sémantiku musíme priznať, že tieto sú už rôzne slová, alebo skôr, že samostatnou jednotkou slovníka je len kombinácia ako celok.

Vo všetkých existujúcich slovníkoch sú slová umiestnené iba v základných tvaroch: podstatné mená v jednotnom čísle, nominatív, slovesá v infinitívnom tvare atď. Niektoré zo slovníkov poskytujú informácie o frekvencii slovných tvarov, ale väčšinou to nerobia dostatočne dôsledne, nie vyčerpávajúco. Frekvencie rôznych slovných tvarov toho istého slova sa zjavne nezhodujú. Vývojár modelu vnímania reči musí brať do úvahy, že v reálnom percepčnom procese je to práve konkrétna forma slova, ktorá je „ponorená“ do textu, ktorý je predmetom rozpoznávania: na základe analýzy počiatočnej časti exponentu slovnej formy sa vytvorí množina slov s identickým začiatkom, pričom začiatočná časť slovnej formy nemusí byť nevyhnutne identická s počiatočnou časťou slovníkovej formy . Práve tvar slova má špecifickú rytmickú štruktúru, ktorá je tiež mimoriadne dôležitým parametrom pre percepčný výber slov. Napokon, v konečnom znázornení rozpoznanej výpovede sú slová opäť reprezentované zodpovedajúcimi tvarmi slov.

Existuje mnoho prác, ktoré demonštrujú dôležitosť frekvencie v procese vnímania reči. Nie sú nám ale známe práce, kde by sa používala frekvencia slovných tvarov – naopak, všetci autori frekvenciu jednotlivých tvarov slov prakticky ignorujú, pričom sa odvolávajú výlučne na lexémy. Ak sa nimi získané výsledky nepovažujú za artefakty, treba predpokladať, že rodený hovorca má nejakým spôsobom prístup k informáciám o pomere frekvencií slovných foriem a slovníkových foriem, teda vlastne lexém. Navyše, takýto prechod od slovnej formy k lexéme, samozrejme, nemožno vysvetliť prirodzenou znalosťou zodpovedajúcej paradigmy, pretože frekvenčná informácia musí byť použitá pred konečnou identifikáciou slova, inak jednoducho stráca svoj význam.

Podľa primárnych štatistických charakteristík je možné s danou relatívnou chybou určiť tú časť slovníka, ktorá obsahuje slová s vysokou frekvenciou výskytu, bez ohľadu na druh textu. Zavedením postupného zoradenia do slovníka je tiež možné získať sériu slovníkov pokrývajúcich prvých 100, 1000, 5000 atď. častých slov. Štatistické charakteristiky slovníka sú zaujímavé v súvislosti so sémantickou analýzou slovnej zásoby. Štúdium predmetových ideologických skupín a sémantických polí ukazuje, že lexikálne asociácie sú podporované sémantickými väzbami, ktoré sú sústredené okolo lexém s najbežnejším významom. Opis významov v lexikálno-sémantickej oblasti možno uskutočniť identifikáciou slov s významovo najabstraktnejšími lexémami. Zjavne „prázdne“ (z hľadiska nominatívnych potencií) slovníkové jednotky tvoria štatisticky homogénnu vrstvu.

Nemenej hodnotné sú slovníky pre jednotlivé žánre. Štúdium miery ich podobnosti a charakteru štatistických distribúcií poskytne zaujímavé informácie o kvalitatívnom rozvrstvení slovnej zásoby v závislosti od sféry používania reči.

Zostavovanie veľkých frekvenčných slovníkov si vyžaduje použitie výpočtovej techniky. Zavedenie čiastočnej mechanizácie a automatizácie do procesu práce na slovníku je zaujímavé ako experiment strojového spracovania slovníkov pre rôzne texty. Takýto slovník si vyžaduje prísnejší systém spracovania a akumulácie slovnej zásoby. V miniatúre ide o systém na vyhľadávanie informácií, ktorý je schopný poskytnúť informácie o rôznych aspektoch textu a slovnej zásoby. Niektoré základné požiadavky na tento systém sú naplánované od samého začiatku: celkový počet inventárnych slov, štatistické charakteristiky jedného slova a celých slovníkov, zoradenie častých a zriedkavých oblastí slovníka atď. Súbor kariet stroja vám umožňuje na automatické vytváranie reverzných slovníkov pre jednotlivé žánre a zdroje. Mnoho ďalších užitočných štatistických informácií o jazyku sa získa z nahromadeného súboru informácií. Počítačový frekvenčný slovník vytvára experimentálny základ pre prechod k rozsiahlejšej automatizácii práce so slovnou zásobou.

Štatistické údaje frekvenčných slovníkov môžu byť široko používané aj pri riešení iných lingvistických problémov - napríklad pri analýze a určovaní aktívnych prostriedkov tvorby slov v modernom ruskom jazyku, pri riešení problémov zdokonaľovania grafiky a pravopisu, ktoré súvisia so zohľadnením štatistické informácie o slovnej zásobe (dôležité je brať do úvahy pravdepodobnostné charakteristiky grafémových kombinácií, typy kombinácií písmen realizovaných v slovách), praktický prepis a transliterácia. Štatistické parametre slovníka budú užitočné aj pri riešení problémov automatizácie písania, rozpoznávania a automatického čítania doslovného textu.

Moderné výkladové slovníky a gramatiky ruského jazyka sú postavené najmä na základe literárnych a umeleckých textov. Existujú frekvenčné slovníky jazyka A.S. Puškin, A.S. Griboedová, F.M. Dostojevskij, V.V. Vysockij a mnohí ďalší autori. Na Katedre histórie a teórie literatúry Smolenského štátu. Vysoká škola pedagogická už niekoľko rokov pracuje na zostavovaní frekvenčných slovníkov básnických a prozaických textov. Pre túto štúdiu boli vybrané frekvenčné slovníky všetkých textov Puškina a ďalších dvoch básnikov zlatého veku – „Beda z vtipu“ od Griboedova a celá Lermontovova poézia; Pasternak a ďalší piati básnici Strieborného veku - Balmont 1894-1903, "Básne o krásnej pani" od Bloka, "Stone" od Mandelstama, "Ohnivý stĺp" od Gumilyova, "Anno Domini MCMXXI" od Achmatovej a "Sestry of Môj život“ od Pasternaka a ďalších štyroch básnikov doby železnej – „Básne Jurija Živaga“, „Keď sa vyjasní“, celý korpus textov M. Petrovsa, „Cesta je ďaleko“, „Veterné sklo“, "Rozlúčka so snehom" a "Podkovy" od Mezhirova, "Antimirov" od Voznesenskyho a "Snehové gule" » Rylenkova.

Treba poznamenať, že tieto slovníky sú svojou povahou odlišné: niektoré predstavujú slovnú zásobu jedného dramatického diela, iné - knihy textov alebo niekoľko kníh alebo celý korpus básní básnika. Výsledky analýzy prezentované v tomto príspevku treba brať s rezervou, nemožno ich brať ako absolútne. Pomocou špeciálnych opatrení však možno rozdiel v ontologickom charaktere textov do určitej miery zmenšiť.

V posledných rokoch sa čoraz zreteľnejšie prejavuje protiklad medzi hovorovou a knižnou rečou. Táto problematika je obzvlášť ostro diskutovaná medzi metodikmi, ktorí požadujú obrat vo výučbe smerom k hovorenej reči. Špecifickosť hovorovej reči však stále zostáva nevysvetlená.

Slovníky boli spracované vytvorením používateľskej aplikácie v prostredí kancelárskeho programu EXCEL97. Súčasťou aplikácie sú štyri pracovné listy knihy EXCEL - "Hárok titulkov", list "Slovníky" s počiatočnými údajmi, "Blízkosť" a "Vzdialenosti" s výsledkami, ako aj sadu makier.

Počiatočné informácie sa zadávajú na hárku "Slovníky". Slovníky študovaných textov sa zapisujú do buniek EXCEL, posledný stĺpec S sa tvorí zo získaných výsledkov a rovná sa počtu slov nájdených v iných slovníkoch. Tabuľky „Blízkosť“ a „Vzdialenosti“ obsahujú vypočítané miery blízkosti M, korelácie R a vzdialenosti D.

Aplikačné makrá sú programovacie procedúry založené na udalostiach napísané vo Visual Basic for Application (VBA). Procedúry sú založené na objektoch knižnice VBA a metódach ich spracovania. Pre operácie s pracovnými hárkami aplikácie sa teda používa kľúčový objekt Pracovný hárok (hárok) a zodpovedajúci spôsob aktivácie hárku Aktivovať (aktivovať). Nastavenie rozsahu analyzovaných zdrojových údajov na hárku Slovník sa vykonáva metódou Select objektu Range (rozsah) a prenos slov ako hodnôt do premenných sa vykonáva ako vlastnosť Value (hodnota) rovnakého rozsahu. objekt.

Napriek tomu, že analýza korelácie poradia nás robí obozretnými, pokiaľ ide o závislosť tém medzi rôznymi textami, väčšina najfrekventovanejších slov v každom texte má zhodu v jednom alebo viacerých iných textoch. Stĺpec S zobrazuje počet takýchto slov medzi 15 najfrekventovanejšími slovami u každého autora. Slová napísané tučným písmom sa v našej tabuľke vyskytujú iba v slovách jedného básnika. Blok, Achmatova a Petrovs nemajú zvýraznené slová vôbec, majú S = 15. Títo traja básnici majú rovnakých 15 najfrekventovanejších slov, líšia sa len miestom v zozname. Ale aj Puškin, ktorého slovná zásoba je najoriginálnejšia, má S = 8 a je tam 7 zvýraznených slov.

Výsledky ukazujú, že existuje určitá vrstva slovnej zásoby, ktorá koncentruje hlavné témy poézie. Spravidla sú tieto slová krátke: z celkového počtu (225) slovných použití jednoslabičných 88, dvojslabičných 127, trojslabičných 10. Tieto slová často predstavujú hlavné mytologémy a môžu byť rozdelené do párov: noc - deň, zem - nebo (slnko), Boh - človek (ľudia), život - smrť, telo - duša, Rím - svet(v Mandelstame); možno kombinovať do mytológov vyššej úrovne: nebo, hviezda, slnko, zem; v človeku spravidla vynikne telo, srdce, krv, ruka, noha, líce, oči. Z ľudských stavov sa uprednostňuje spánok a láska. Dom a mestá patria do ľudského sveta – Moskva, Rím, Paríž. Kreativita je reprezentovaná lexémami slovo a pieseň.

Griboedov a Lermontov nemajú medzi najfrekventovanejšími slovami takmer žiadne slová označujúce prírodu. Majú trikrát toľko slov, ktoré označujú človeka, časti jeho tela, prvky jeho duchovného sveta. Puškin a básnici dvadsiateho storočia. Označenia človeka a prírody sú približne rovnaké. V tomto dôležitom aspekte predmetu môžeme povedať, že dvadsiate storočie. nasledoval Puškina.

Minimálna téma prípad medzi najfrekventovanejšími slovami sa vyskytuje len u Gribojedova a Puškina. Lermontov a básnici dvadsiateho storočia. ustupuje minimálnej téme slovo. Slovo nevylučuje skutky (biblický výklad témy: v Novom zákone sa všetko učenie Ježiša Krista považuje za slovo Božie alebo slovo Ježišovo a apoštoli sa niekedy nazývajú služobníkmi Slova). Posvätný význam lexémy slova sa presvedčivo prejavuje napríklad v Pasternakovom verši „A obraz sveta, zjavený v Slove“. Posvätný význam lexémy slovo v spojení a kontraste s ľudskými záležitosťami sa presvedčivo prejavuje v rovnomennej básni Gumiľjova.

Žetóny, ktoré sa nachádzajú len v jednom texte, charakterizujú originalitu danej knihy alebo zbierky kníh. Napríklad slovo myseľ je najfrekventovanejšie v Griboedovovej komédii "Beda múdrosti" - v iných textoch sa však medzi najfrekventovanejšími slovami nevyskytuje. Téma mysle je v komédii jednoznačne najvýznamnejšia. Táto lexéma sprevádza obraz Chatského a meno Chatského je v komédii najčastejšie. Dielo tak organicky spája najčastejšie spoločné podstatné meno s najfrekventovanejším vlastným menom.

Najvyšší korelačný koeficient spája témy tragických kníh „Ohnivý stĺp“ od Gumilyova a „Anno Domini MCMXXI“ od Achmatovovej. Medzi 15 najfrekventovanejšími podstatnými menami je 10 bežných, medzi ktoré patrí krv, srdce, duša, láska, slovo, nebo. Pripomeňme, že kniha Akhmatovovej obsahovala miniatúru „Nebudeš nažive ...“, napísanú medzi zatknutím Gumilyova a jeho popravou.

Témy sviečky a davu v študovanom materiáli sa nachádzajú iba v "Básňach Jurija Živaga". Téma sviečky vo veršoch z románu má mnoho kontextových významov: spája sa s obrazom Ježiša Krista, s témami viery, nesmrteľnosti, tvorivosti, milostného dátumu. Sviečka je najdôležitejším zdrojom svetla v ústredných scénach románu. Téma davu sa rozvíja v súvislosti s hlavnou myšlienkou románu, v ktorej je súkromný život človeka s jeho neotrasiteľnými hodnotami v protiklade s nemorálnosťou nového štátu, postavenom na princípoch potešenia davu. .

Práca zahŕňa aj tretiu etapu, ktorá sa odráža aj v programe, a to výpočet rozdielu v poradových číslach slov spoločných pre dva slovníky a priemernej vzdialenosti medzi rovnakými slovami dvoch slovníkov. Táto fáza umožňuje prejsť od všeobecných trendov v interakcii slovníkov identifikovaných pomocou štatistík na úroveň približujúcu sa textu. Napríklad knihy Gumilyova a Achmatovovej štatisticky významne korelujú. Pozeráme sa na to, ktoré slová sa ukázali ako bežné pre ich slovníky, a predovšetkým vyberáme tie, ktorých sériové čísla sa líšia minimálne alebo sú rovné nule. Práve tieto slová majú rovnaké poradové číslo, a preto sú tieto minimálne témy v mysliach dvoch básnikov rovnako dôležité. Ďalej by ste sa mali presunúť na úroveň textov a kontextov.

Kvantitatívne metódy tiež pomáhajú študovať charakteristiky národov - rodených hovorcov. Povedzme, že v ruštine je 6 prípadov, v angličtine nie sú žiadne a v niektorých jazykoch národov Dagestanu počet prípadov dosahuje 40. L. Perlovský vo svojom článku „Vedomie, jazyk a kultúra“ tieto koreluje charakteristiky so sklonom národov k individualizmu alebo kolektivizmu, s vnímaním vecí a javov oddelene alebo v spojení s inými. Koniec koncov, práve v anglicky hovoriacom svete (nie sú žiadne prípady - vec sa vníma „sama od seba“) sa objavili také pojmy ako individuálna sloboda, liberalizmus a demokracia (podotýkam, že tieto pojmy používam len v súvislosti s tzv. jazyk, bez akýchkoľvek hodnotiacich charakteristík). Napriek tomu, že takéto dohady stále zostávajú len na úrovni odvážnych vedeckých hypotéz, pomáhajú pozerať sa na už známe javy novým spôsobom.

Ako vidíme, kvantitatívne charakteristiky možno uplatniť v úplne iných oblastiach lingvistiky, čím sa čoraz viac stierajú hranice medzi „exaktnými“ a „humanitárnymi“ metódami. Lingvistika sa pri riešení svojich problémov čoraz viac uchyľuje k pomoci nielen matematiky, ale aj počítačovej techniky.

2.3 Učenie sa jazyka metódami formálnej logiky

S nekvantitatívnymi metódami matematiky, najmä s logikou, interaguje moderná teoretická lingvistika nemenej plodne ako s kvantitatívnymi. Rýchly rozvoj počítačových technológií a rast ich úlohy v modernom svete si vyžiadal revíziu prístupu k interakcii jazyka a logiky vo všeobecnosti.

Metódy logiky sú široko používané pri vývoji formalizovaných jazykov, najmä programovacích jazykov, ktorých prvkami sú niektoré symboly (podobné matematickým), vybrané (alebo konštruované z predtým vybraných symbolov) a interpretované určitým spôsobom, súvisiace k akémukoľvek „tradičnému“ používaniu, chápaniu a chápaniu.funkcie tých istých symbolov v iných kontextoch. Programátor sa vo svojej práci neustále zaoberá logikou. Zmyslom programovania je práve naučiť počítač uvažovať (v najširšom zmysle slova). Zároveň sa ukazuje, že metódy „uvažovania“ sú veľmi odlišné. Každý programátor strávi určitý čas hľadaním chýb vo svojich programoch a programoch iných ľudí. Teda hľadať chyby v uvažovaní, v logike. A to tiež zanecháva stopy. V bežnej reči je oveľa jednoduchšie odhaliť logické chyby. Relatívna jednoduchosť jazykov, ktoré študujú logici, im umožňuje jasnejšie objasniť štruktúry týchto jazykov, ako by to mohli dosiahnuť lingvisti, ktorí analyzujú výlučne zložité prirodzené jazyky. Vzhľadom na skutočnosť, že jazyky, ktoré študujú logici, využívajú vzťahy skopírované z prirodzených jazykov, môžu logici významne prispieť k všeobecnej teórii jazyka. Situácia je tu podobná ako vo fyzike: fyzik formuluje vety aj pre ideálne zjednodušené prípady, ktoré sa v prírode vôbec nevyskytujú – formuluje zákony pre ideálne plyny, ideálne kvapaliny, hovorí o pohybe pri absencii trenia, o pohybe bez trenia, o pohybe bez trenia. atď. Pre tieto zidealizované prípady možno stanoviť jednoduché zákony, ktoré by výrazne prispeli k pochopeniu toho, čo sa skutočne deje a čo by fyzike zrejme zostalo neznáme, keby sa pokúsila uvažovať o realite priamo, v celej jej zložitosti.

Pri štúdiu prirodzených jazykov sa využívajú logické metódy, aby si študenti jazyka hlúpo „nezapamätali“ čo najviac slov, ale lepšie pochopili jeho štruktúru. L. Shcherba vo svojich prednáškach použil aj príklad vety zostavenej podľa zákonov ruského jazyka: „Lesknúca sa kuzdra shteko boked a bokra a curls a bokra,“ a potom sa študentov opýtal, čo to znamená. Napriek tomu, že význam slov vo vete zostal nejasný (v ruštine jednoducho neexistujú), bolo možné jasne odpovedať: „kuzdra“ je subjekt, ženské podstatné meno, v jednotnom čísle, nominatíve, „ bokr“ je animovaný atď. Preklad tejto frázy je asi takýto: „Niečo ženské naraz urobilo niečo s nejakým mužským tvorom a potom začalo robiť niečo dlhé, postupné s mláďaťom. Podobným príkladom textu (umeleckého) z neexistujúcich slov, postaveného úplne podľa zákonitostí jazyka, je Jabberwock Lewisa Carrolla (v Alici v krajine zázrakov Carroll ústami svojej postavy Humpty Dumpty vysvetľuje význam slová, ktoré vymyslel: „varené“ – osem hodín večer, keď je čas variť večeru, „chlivky“ – chatrné a obratné, „shorek“ – kríženec fretky, jazveca a vývrtky, „potápať sa“. " - skákať, potápať sa, točiť sa, "nava" - tráva pod slnečnými hodinami (presahuje trochu doprava, trochu doľava a trochu dozadu), "grunt" - chrčať a smiať sa, "zelyuk" - a zelená morka, „myumzik“ - vták; jej perie sú strapaté a trčia na všetky strany, ako metla, „mova“ - ďaleko od domova).

Jeden z hlavných konceptov modernej logiky a teoretickej lingvistiky, ktorý sa používa pri štúdiu jazykov rôzneho logického a matematického počtu, prirodzených jazykov, na opísanie vzťahu medzi jazykmi rôznych „úrovní“ a na charakterizáciu vzťahu medzi uvažované jazyky a s ich pomocou popísané tematické oblasti, je pojem metajazyk. Metajazyk je jazyk používaný na vyjadrenie úsudkov o inom jazyku, o jazyku-objekte. Pomocou metajazyka študujú štruktúru znakových kombinácií (výrazov) jazyka-objektu, dokazujú vety o jeho výrazových vlastnostiach, o jeho vzťahu k iným jazykom atď. Skúmaný jazyk sa v r. vzťah k tomuto metajazyku. Predmetným jazykom aj metajazykom môžu byť bežné (prirodzené) jazyky. Metajazyk sa môže líšiť od objektového jazyka (napríklad v učebnici angličtiny pre Rusov je metajazykom ruština a objektovým jazykom angličtina), ale môže sa s ním aj zhodovať alebo sa môže líšiť len čiastočne, napríklad v špeciálnej terminológii (Ruská lingvistická terminológia je prvkom metajazyka.) na opis ruského jazyka sú súčasťou metajazyka na opis sémantiky prirodzených jazykov tzv. sémantické faktory.

Logika nás učí plodnému rozlišovaniu medzi jazykom-objektom a metajazykom. Jazyk-objekt je samotným predmetom logického výskumu a metajazyk je tým nevyhnutne umelým jazykom, v ktorom sa takýto výskum uskutočňuje. Logické myslenie spočíva len vo formulovaní vzťahov a štruktúry reálneho jazyka (objektového jazyka) v jazyku symbolov (metalanguage).

Metajazyk musí byť v každom prípade „nie chudobnejší“ ako jeho objektívny jazyk (t. j. pre každý jeho výraz v metajazyku musí byť uvedený jeho názov, „preklad“) – v opačnom prípade, ak tieto požiadavky nie sú splnené (čo určite vyžaduje miesto v prirodzených jazykoch, ak osobitné dohody neustanovujú inak, vznikajú sémantické paradoxy (antinómie).

Ako sa vytváralo stále viac nových programovacích jazykov, v súvislosti s problémom programovania prekladačov vznikla naliehavá potreba vytvoriť metajazyky. V súčasnosti sa na popis syntaxe programovacích jazykov najčastejšie používa metajazyk formy Backus-Naur (skrátene BNF). Ide o kompaktnú formu v podobe niektorých vzorcov podobných tým matematickým. Pre každý koncept jazyka existuje jedinečný metavzorec (normálny vzorec). Skladá sa z ľavej a pravej časti. Ľavá strana špecifikuje definovaný koncept a pravá strana špecifikuje množinu prípustných jazykových konštruktov, ktoré sú kombinované do tohto konceptu. Vzorec používa špeciálne metaznaky vo forme lomených zátvoriek, ktoré obsahujú definovaný koncept (na ľavej strane vzorca) alebo predtým definovaný koncept (na jeho pravej strane), pričom oddelenie ľavej a pravej časti je označené metaznak "::=", ktorého význam je ekvivalentný slovám "podľa definície existuje". Metalingvistické vzorce sú v nejakej forme vložené do prekladačov; s ich pomocou sa konštrukty používané programátorom skontrolujú z hľadiska formálnej zhody s niektorým z konštruktov, ktoré sú syntakticky platné v tomto jazyku. Existujú aj samostatné metajazyky rôznych vied - teda poznanie existuje vo forme rôznych metajazykov.

Logické metódy slúžili aj ako základ pre vytváranie systémov umelej inteligencie založených na koncepte konekcionizmu. Konekcionizmus je zvláštny smer vo filozofickej vede, ktorého predmetom sú otázky poznania. V rámci tohto trendu sa pokúšajú vysvetliť intelektuálne schopnosti človeka pomocou umelých neurónových sietí. Neurónové siete, ktoré sa skladajú z veľkého množstva štruktúrnych jednotiek podobných neurónom, pričom každému prvku je priradená váha, ktorá určuje silu spojenia s inými prvkami, sú neurónové siete zjednodušenými modelmi ľudského mozgu. Experimenty s neurónovými sieťami tohto druhu preukázali ich schopnosť naučiť sa vykonávať úlohy, ako je rozpoznávanie vzorov, čítanie a identifikácia jednoduchých gramatických štruktúr.

Filozofi sa začali zaujímať o konekcionizmus, keďže konekcionistický prístup sľúbil poskytnúť alternatívu ku klasickej teórii mysle a myšlienke, ktorá sa v tejto teórii široko používa, že fungovanie mysle je podobné spracovaniu symbolického jazyka digitálnym počítač. Tento koncept je veľmi kontroverzný, no v posledných rokoch si nachádza čoraz viac priaznivcov.

Logické štúdium jazyka pokračuje v Saussurovom koncepte jazyka ako systému. Skutočnosť, že neustále pokračuje, opäť potvrdzuje smelosť vedeckých dohadov zo začiatku minulého storočia. Posledný oddiel mojej práce budem venovať perspektívam rozvoja matematických metód v lingvistike dnes.

2.4 Perspektívy aplikácie matematických metód v lingvistike

V ére počítačovej techniky dostali metódy matematickej lingvistiky novú perspektívu rozvoja. Hľadanie riešení problémov lingvistickej analýzy sa v súčasnosti čoraz viac realizuje na úrovni informačných systémov. Zároveň automatizácia procesu spracovania lingvistického materiálu, ktorá výskumníkovi poskytuje významné príležitosti a výhody, pre neho nevyhnutne kladie nové požiadavky a úlohy.

Spojenie „exaktných“ a „humanitných“ poznatkov sa stalo úrodnou pôdou pre nové objavy v oblasti lingvistiky, informatiky a filozofie.

Strojový preklad z jedného jazyka do druhého zostáva rýchlo rastúcim odvetvím informačných technológií. Napriek tomu, že počítačom podporovaný preklad sa kvalitou nikdy nevyrovná ľudskému prekladu (najmä pri literárnych textoch), stroj sa stal nepostrádateľným pomocníkom človeka pri prekladaní veľkých objemov textu. Predpokladá sa, že v blízkej budúcnosti budú vytvorené pokročilejšie prekladové systémy založené predovšetkým na sémantickej analýze textu.

Rovnako sľubným smerom je interakcia lingvistiky a logiky, ktorá slúži ako filozofický základ pre pochopenie informačných technológií a takzvanej „virtuálnej reality“. V blízkej budúcnosti budú práce na vytváraní systémov umelej inteligencie pokračovať – aj keď opäť sa nikdy nebude rovnať tomu človeku vo svojich schopnostiach. Takáto súťaž je bezvýznamná: v našej dobe by sa stroj nemal stať (a stáva sa) nie súperom, ale pomocníkom človeka, nie niečím z ríše fantázie, ale súčasťou skutočného sveta.

Štúdium jazyka štatistickými metódami pokračuje, čo umožňuje presnejšie určiť jeho kvalitatívne vlastnosti. Je dôležité, aby tie najodvážnejšie hypotézy o jazyku našli svoj matematický, a teda aj logický dôkaz.

Najdôležitejšie je, že rôzne odvetvia aplikácie matematiky v lingvistike, predtým dosť izolované, sa v posledných rokoch navzájom korelujú a spájajú do koherentného systému, analogicky s jazykovým systémom, ktorý pred storočím objavil Ferdinand de Saussure. a Yvan Baudouin de Courtenay. Toto je kontinuita vedeckých poznatkov.

Lingvistika v modernom svete sa stala základom rozvoja informačných technológií. Pokiaľ informatika zostane rýchlo sa rozvíjajúcim odvetvím ľudskej činnosti, spojenie matematiky a lingvistiky bude naďalej zohrávať svoju úlohu v rozvoji vedy.

Záver

Počas 20. storočia prešli počítačové technológie dlhú cestu – od vojenského k mierovému využitiu, od úzkeho okruhu cieľov až po prienik do všetkých oblastí ľudského života. Matematika ako veda nachádzala s rozvojom výpočtovej techniky stále nový praktický význam. Tento proces pokračuje aj dnes.

Predtým nemysliteľný „tandem“ „fyzikov“ a „textárov“ sa stal realitou. Pre plnú interakciu matematiky a informatiky s humanitnými vedami boli potrební kvalifikovaní odborníci z oboch strán. Zatiaľ čo počítačoví vedci stále viac potrebujú systematické humanitné znalosti (jazykové, kultúrne, filozofické), aby pochopili zmeny v realite okolo seba, v interakcii človeka a techniky, rozvíjali stále viac nových jazykových a mentálnych konceptov, písali programy, potom akékoľvek „Humanitné vedy“ v našej dobe pre svoj odborný rast musia ovládať aspoň základy práce s počítačom.

Matematika, ktorá je úzko prepojená s informatikou, sa naďalej rozvíja a interaguje s prírodnými a humanitnými vedami. V novom storočí trend matematizácie vedy neoslabuje, ale naopak narastá. Na základe kvantitatívnych údajov sú pochopené zákonitosti vývoja jazyka, jeho historické a filozofické charakteristiky.

Matematický formalizmus je najvhodnejší na opis vzorcov v lingvistike (rovnako ako v iných vedách, humanitných aj prírodných). Situácia sa vo vede niekedy vyvíja tak, že bez použitia vhodného matematického jazyka nie je možné pochopiť podstatu fyzikálnych, chemických atď. proces nie je možný. Vytvorenie planetárneho modelu atómu, slávny anglický fyzik XX storočia. E. Rutherford mal matematické ťažkosti. Jeho teória spočiatku nebola prijatá: neznela presvedčivo a dôvodom bola Rutherfordova neznalosť teórie pravdepodobnosti, na základe mechanizmu ktorej bolo možné pochopiť len modelové znázornenie atómových interakcií. Uvedomujúc si to, už vtedy vynikajúci vedec, majiteľ Nobelovej ceny, sa prihlásil na seminár matematika profesora Lamba a dva roky spolu so študentmi navštevoval kurz a vypracoval workshop z teórie pravdepodobnosti. . Na jeho základe dokázal Rutherford opísať správanie elektrónu, čím jeho štruktúrny model získal presvedčivú presnosť a získal uznanie. Rovnako je to aj s lingvistikou.

Tu vzniká otázka, čo je na objektívnych javoch také matematické, vďaka čomu ich možno opísať jazykom matematiky, jazykom kvantitatívnych charakteristík? Ide o homogénne jednotky hmoty rozložené v priestore a čase. Tie vedy, ktoré zašli ďalej než ostatné smerom k izolácii homogenity a ukázalo sa, že sú vhodnejšie na použitie matematiky v nich.

Internet, ktorý sa rýchlo rozvíjal v 90. rokoch minulého storočia, spájal zástupcov rôznych krajín, národov a kultúr. Napriek tomu, že angličtina je naďalej hlavným jazykom medzinárodnej komunikácie, internet sa v súčasnosti stal viacjazyčným. To viedlo k vývoju komerčne úspešných systémov strojového prekladu, ktoré sú široko používané v rôznych oblastiach ľudskej činnosti.

Počítačové siete sa stali objektom filozofickej reflexie – vytváralo sa čoraz viac nových lingvistických, logických, svetonázorových konceptov, ktoré pomáhajú pochopiť „virtuálnu realitu“. V mnohých umeleckých dielach vznikali scenáre – častejšie pesimistické – o dominancii strojov nad človekom a virtuálnej reality – nad vonkajším svetom. Zďaleka nie vždy sa takéto predpovede ukázali ako nezmyselné. Informačné technológie nie sú len sľubným odvetvím na investovanie do ľudských vedomostí, ale sú aj spôsobom kontroly informácií, a teda aj ľudského myslenia.

Tento jav má negatívnu aj pozitívnu stránku. Negatívne – pretože kontrola nad informáciami je v rozpore s neodňateľným ľudským právom na slobodný prístup k nim. Pozitívne – pretože nedostatok tejto kontroly môže viesť ku katastrofálnym následkom pre ľudstvo. Stačí pripomenúť jeden z najmúdrejších filmov posledného desaťročia – „Keď sa skončí svet“ od Wima Wendersa, ktorého postavy sú úplne ponorené do „virtuálnej reality“ vlastných snov nahratých na počítači. Ani jeden vedec a ani jeden umelec však nevie dať jednoznačnú odpoveď na otázku: čo čaká vedu a techniku ​​v budúcnosti.

Zameranie sa na „budúcnosť“, ktoré sa niekedy zdalo fantastické, bolo charakteristickým znakom vedy v polovici dvadsiateho storočia, keď sa vynálezcovia snažili vytvoriť dokonalé modely technológie, ktoré by mohli fungovať bez ľudského zásahu. Čas ukázal utopistický charakter takéhoto výskumu. Bolo by však zbytočné za to odsudzovať vedcov – bez ich nadšenia v 50. – 60. rokoch by informačné technológie v 90. rokoch neurobili taký silný skok a nemali by sme to, čo máme teraz.

Posledné desaťročia dvadsiateho storočia zmenili priority vedy – výskum, invenčný pátos ustúpil komerčnému záujmu. Opäť to nie je dobré ani zlé. Toto je realita, v ktorej sa veda čoraz viac integruje do každodenného života.

21. storočie pokračovalo v tomto trende a za vynálezmi v dnešnej dobe nestojí len sláva a uznanie, ale predovšetkým peniaze. Aj preto je dôležité zabezpečiť, aby sa najnovšie výdobytky vedy a techniky nedostali do rúk teroristických skupín alebo diktátorských režimov. Úloha je ťažká až nemožná; realizovať ho v maximálnej miere je úlohou celého svetového spoločenstva.

Informácie sú zbraňou a zbrane nie sú o nič menej nebezpečné ako jadrové alebo chemické – len nepôsobia fyzicky, ale skôr psychicky. Ľudstvo sa musí zamyslieť nad tým, čo je preňho v tomto prípade dôležitejšie – sloboda alebo kontrola.

Najnovšie filozofické koncepcie súvisiace s rozvojom informačných technológií a pokus o ich pochopenie poukázali na limity tak prírodovedného materializmu, ktorý dominoval v 19. a začiatkom 20. storočia, ako aj extrémneho idealizmu, ktorý popiera význam materiálneho sveta. . Pre moderné myslenie, najmä myslenie Západu, je dôležité prekonať tento dualizmus v myslení, keď sa okolitý svet jasne delí na materiálny a ideálny. Cestou k tomu je dialóg kultúr, porovnávanie rôznych pohľadov na okolité javy.

Paradoxne, informačné technológie môžu v tomto procese zohrávať dôležitú úlohu. Počítačové siete a najmä internet nie sú len zdrojom zábavy a živej komerčnej činnosti, sú aj prostriedkom zmysluplnej, kontroverznej komunikácie medzi predstaviteľmi rôznych civilizácií v modernom svete, ako aj dialógu medzi minulosťou a darček. Dá sa povedať, že internet posúva priestorové a časové hranice.

A v dialógu kultúr prostredníctvom informačných technológií je stále dôležitá úloha jazyka ako najstaršieho univerzálneho komunikačného prostriedku. Preto lingvistika v interakcii s matematikou, filozofiou a informatikou zažila svoj druhý zrod a rozvíja sa dodnes. Trend súčasnosti bude pokračovať aj v budúcnosti – „až na koniec sveta“, ako pred 15 rokmi predpovedal ten istý V. Wenders. Pravda, nie je známe, kedy tento koniec nastane – ale či na tom teraz záleží, pretože budúcnosť sa aj tak skôr či neskôr stane prítomnosťou.

Dodatok 1

Ferdinand de Saussure

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je všeobecne považovaný za zakladateľa modernej lingvistiky v jej pokusoch opísať skôr štruktúru jazyka než históriu konkrétnych jazykov a jazykových foriem. V jeho diele na prelome 20. a 20. storočia nachádza hlavný východiskový bod metóda štrukturalizmu v lingvistike a literárnej vede a významná vetva semiotiky. Dokonca sa tvrdilo, že komplex stratégií a koncepcií, ktorý sa začal nazývať „postštrukturalizmus“ – dielo Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a ďalších – naznačuje Saussureova práca. v lingvistike a anagramatickom čítaní neskorej latinskej poézie, literárnej moderny až po psychoanalýzu a filozofiu na začiatku 20. storočia. Ako tvrdia Algirdas Julien Greimas a Joseph Courtés v knihe Semiotics and Language: An Analytic Dictionary, pod názvom „Interpretácia“ vznikol na začiatku dvadsiateho storočia nový spôsob interpretácie, ktorý stotožňujú so saussurovskou lingvistikou, husserovskou fenomenológiou a freudovou psychoanalýzou. V tomto móde „interpretácia už nie je záležitosťou pripisovania daného obsahu forme, ktorá by mu inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje ekvivalentný obsah významového prvku v rámci daného semiotického systému“ ( 159). v tomto chápaní „interpretácie“ sa forma a obsah nerozlišujú; skôr je každá „forma“ alternatívne aj sémantickým „obsahom“, „označujúcou formou“, takže interpretácia ponúka analogickú parafrázu niečoho, čo už znamená v rámci nejakého iného systému označenia.

Takáto reinterpretácia formy a chápania – ktorú Claude Lévi-Strauss opisuje v jednej zo svojich najprogramovejších artikulácií konceptu štrukturalizmu, v „Štruktúra a forma: Úvahy o diele Vladimíra Proppa“ – je implicitná v Saussureovom posmrtnom kurze. vo všeobecnej lingvistike (1916, prekl., 1959, 1983). Saussure počas svojho života publikoval relatívne málo a jeho hlavné dielo, Kurz, bolo prepisom niekoľkých kurzov všeobecnej lingvistiky, ktoré ponúkal v rokoch 1907-11. Saussure v kurze vyzval na „vedecké“ štúdium jazyka na rozdiel od práce v historickej lingvistike, ktorá sa uskutočnila v devätnástom storočí. Táto práca je jedným z veľkých úspechov západného intelektu: brať konkrétne slová ako stavebné kamene jazyk, historická (alebo „diachrónna“) lingvistika sledovala pôvod a vývoj západných jazykov z predpokladaného spoločného jazykového zdroja, najskôr z „indoeurópskeho“ jazyka a potom zo skoršieho „p roto-indoeurópsky“ jazyk.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „prvkov slova“. Jeho práca bola pokusom zredukovať množstvo faktov o jazyku, ktoré tak podrobne skúma historická lingvistika, na zvládnuteľný počet návrhov. Saussure v Kurze hovorí, že „porovnávacia škola“ filológie devätnásteho storočia „nepodarila sa vytvoriť skutočnú vedu lingvistiky“, pretože „zlyhala pri hľadaní podstaty predmetu svojho štúdia“ (3). Túto „prirodzenosť“, tvrdí, nemožno nájsť jednoducho v „elementárnych“ slovách, ktoré jazyk obsahuje – zdanlivo „pozitívnych“ faktoch (alebo „látkach“) jazyka –, ale vo formálnych vzťahoch, z ktorých vznikajú tieto „látky“.

Saussurovo systematické prehodnocovanie jazyka je založené na troch predpokladoch. Prvým je, že vedecké štúdium jazyka potrebuje skôr rozvíjať a študovať systém ako históriu jazykových javov. Z tohto dôvodu rozlišuje medzi jednotlivými výskytmi jazyka – jeho konkrétne „rečové udalosti", ktoré označuje ako podmienečné prepustenie – a vlastný predmet lingvistiky, systém (alebo „kód"), ktorým sa tieto udalosti riadia, a ktoré označuje ako jazyk. Takáto systematická štúdia si navyše vyžaduje „ synchrónna" koncepcia vzťahu medzi prvkami jazyka v konkrétnom okamihu, skôr než "diachrónne" štúdium vývoja jazyka v histórii.

Tento predpoklad viedol k tomu, čo Roman Jakobson v roku 1929 označil za „štrukturalizmus“, v ktorom „akýkoľvek súbor javov skúmaných súčasnou vedou nie je považovaný za mechanickú aglomeráciu, ale ako štrukturálny celok, ktorý mechanická koncepcia procesov dáva k otázke. ich funkcie“ („Romantický“ 711). V tejto pasáži Jakobson vyjadruje Saussurov zámer definovať lingvistiku ako vedecký systém na rozdiel od jednoduchého, „mechanického“ účtovania historických náhod. Okrem toho Jakobson opisuje aj druhý základný predpoklad v Saussurovčine – môžeme teraz to nazývame „štrukturálne“ – lingvistika: že základné prvky jazyka možno skúmať iba vo vzťahu k ich funkciám, a nie vo vzťahu k ich príčinám. Európske „slová“), tieto udalosti a entity musia byť situované do systémového rámca v ktorej súvisia s inými takzvanými udalosťami a entitami. Ide o radikálnu zmenu orientácie v chápaní skúseností a javov, ktorých význam prirovnal filozof Ernst Cassirer k „novej Galileiovej vede, ktorá v 17. storočí zmenila celý náš koncept fyzického sveta“ (citované v Culler, Pursuit 2 4). Táto zmena, ako poznamenávajú Greimas a Courtés, nanovo poníma „interpretáciu“, a teda nanovo poníma vysvetľovanie a pochopenie seba samých. Namiesto toho, aby vysvetlenie „je v zmysle príčin javu, takže ako „účinok“ je nejakým spôsobom podriadené jeho príčinám, vysvetlenie tu spočíva v podriadení javu jeho „funkcii“ orientovanej na budúcnosť, resp. "účel." Vysvetlenie už nie je nezávislé od ľudských zámerov alebo účelov (aj keď tieto zámery môžu byť neosobné, spoločné alebo freudovskými výrazmi „nevedomé“).

Vo svojej lingvistike Saussure uskutočňuje túto transformáciu špecificky v redefinícii lingvistického „slova“, ktoré opisuje ako lingvistický „znak“ a definuje ho funkcionalistickými pojmami. Znak, tvrdí, je spojením „pojemu a zvukového obrazu“, ktorý nazval „označený a označujúci“ (66-67; preklad Roya Harrisa z roku 1983 ponúka výrazy „označenie“ a „signál“). Povaha ich „kombinácie“ je „funkčná“ v tom, že ani označované, ani označujúce nie sú „príčinou“ toho druhého, ale „každý má svoje hodnoty od druhého“ (8). prvok jazyka, znak relačné a podrobuje dôslednej analýze základný predpoklad historickej lingvistiky, konkrétne identitu elementárnych jednotiek jazyka a označenia (t. j. „slov“). slovo „strom“ ako „rovnaké“ slovo nie je preto, slovo je definované inherentnými vlastnosťami – nie je to „mechanická aglomerácia“ takýchto kvalít – ale preto, že je definované ako prvok v systéme, „štrukturálny celok“ jazyka.

Takáto relačná (alebo „diakritická“) definícia entity riadi koncepciu všetkých prvkov jazyka v štrukturálnej lingvistike. Najzreteľnejšie je to v najpôsobivejšom úspechu saussurovskej lingvistiky, vo vývoji konceptov „foném“ a „charakteristických čŕt“ jazyka. Fonémy sú najmenšie artikulované a označovacie jednotky jazyka. Nie sú to zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, o ktorých hovorí Saussure, ktoré hovoriaci vnímajú – fenomenálne vnímané – ako prenášajúce význam. (Elmar Holenstein teda opisuje Jakobsonovu lingvistiku, ktorá dôležitým spôsobom nasleduje Saussura, ako „fenomenologický štrukturalizmus.“) Z tohto dôvodu vedúci hovorca pražského školského štrukturalizmu Jan Mukařovský v roku 1937 poznamenal, že „štruktúra . . . je fenomenologická a nie empirická realita; nejde o dielo samotné, ale o súbor funkčných vzťahov, ktoré sa nachádzajú vo vedomí kolektívu (generácie, prostredia atď.)“ (cit. v Galan 35). Podobne Lévi-Strauss, vedúci hovorca francúzskeho štrukturalizmu v roku 1960 poznamenal, že „štruktúra nemá zreteľný obsah; je to obsah sám o sebe a logická organizácia, v ktorej je zatknutý, je koncipovaná ako vlastnosť skutočného“ (167; pozri tiež Jakobson, Fundamentals 27-28).

Fonémy, najmenšie vnímateľné prvky jazyka, teda nie sú pozitívnymi objektmi, ale „fenomenologickou realitou“. Napríklad v angličtine sa fonéma /t/ môže vyslovovať mnohými rôznymi spôsobmi, ale vo všetkých prípadoch ju anglicky hovoriaci rozpozná, že funguje ako /t/. Nasávané t (t. j. t vyslovené s nádychom podobným h po ňom), vysoký alebo nízky zvuk t, predĺžený zvuk t atď., budú všetky fungovať rovnakým spôsobom pri rozlišovaní významu „to“ a „do“ v angličtine. Okrem toho rozdiely medzi jazykmi sú také, že fonologické variácie v jednom jazyku môžu predstavovať odlišné fonémy v inom jazyku; angličtina teda rozlišuje medzi /l/ a /r/, zatiaľ čo iné jazyky sú tak štruktúrované, že tieto artikulácie sa považujú za variácie tej istej fonémy (ako aspirované a nenasávané t v angličtine). V každom prirodzenom jazyku je obrovské množstvo možných slov kombináciou malého počtu foném. Angličtina má napríklad menej ako 40 foném, ktoré dohromady tvoria viac ako milión rôznych slov.

Samotné fonémy jazyka sú systematicky organizovanými štruktúrami znakov. V 20. a 30. rokoch 20. storočia po Saussurovom vedení Jakobson a N. S. Trubetzkoy izolovali „rozlišovacie črty“ foném. Tieto črty sú založené na fyziologickej štruktúre rečových orgánov – jazyka, zubov, hlasiviek atď. Saussure v Kurze spomína a Harris to opisuje ako „fyziologickú fonetiku“ (39; Baskinov skorší preklad používa termín „fonológia“ [(1959) 38]) – a spájajú sa do „zväzkov“ binárnych opozícií, aby vytvorili fonémy. Napríklad v angličtine je rozdiel medzi /t/ a /d/ prítomnosťou alebo absenciou „hlasu“ (zapojenie hlasiviek) a na úrovni vyjadrenia sa tieto fonémy vzájomne definujú. Týmto spôsobom je fonológia špecifickým príkladom všeobecného pravidla jazyka opísaného Saussurom: V jazyku sú len rozdiely. ešte dôležitejšie: rozdiel vo všeobecnosti zahŕňa pozitívne pojmy, medzi ktorými je rozdiel stanovený; ale v jazyku sú len rozdiely bez kladných výrazov. Či už berieme označované alebo označujúce, jazyk nemá ani idey, ani zvuky, ktoré existovali pred jazykovým systémom. (120)

V tomto rámci nie sú jazykové identity určené inherentnými kvalitami, ale systémovými ("štrukturálnymi") vzťahmi.

Povedal som, že fonológia „išla po vzore“ Saussura, pretože aj keď jeho analýza fyziológie tvorby jazyka „by sa v súčasnosti, ako hovorí Harris, „nazývala „fyzickou“, na rozdiel od „psychologickej“ alebo „funkčnej“. „“ (Čítanie 49), následne v Kurze artikuloval smer a obrysy funkčnej analýzy jazyka. Podobne jeho jediné rozšírené publikované dielo Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoáre o primitívnom systéme samohlások v indoeurópskych jazykoch), ktoré vyšlo v roku 1878, bolo plne situované do projektu 19. storočia historická lingvistika. Napriek tomu v rámci tejto práce, ako tvrdil Jonathan Culler, Saussure demonštroval „plodnosť myslenia o jazyku ako o systéme čisto vzťahových položiek, dokonca aj keď pracuje na úlohe historickej rekonštrukcie“ (Saussure 66). Analýzou systematických štrukturálnych vzťahov medzi fonémami na vysvetlenie vzorcov striedania samohlások v existujúcich indoeurópskych jazykoch Saussure naznačil, že okrem niekoľkých rôznych foném /a/ musela existovať ešte jedna fonéma, ktorú by bolo možné formálne opísať. „To, čo robí Saussurovu prácu takou pôsobivou,“ uzatvára Culler, „je skutočnosť, že takmer o päťdesiat rokov neskôr, keď bola objavená a rozlúštená chetitčina v klinovom písme, sa zistilo, že obsahuje fonému napísanú h, ktorá sa správa tak, ako Saussure predpovedal. . Čisto formálnou analýzou objavil to, čo je dnes známe ako hrtan indoeurópsky“ (66).

Táto koncepcia relačného alebo diakritického určenia prvkov významu, ktorá je v kurze implicitná aj explicitná, naznačuje tretí predpoklad, ktorým sa riadi štrukturálna lingvistika, čo Saussure nazýva „svojvoľná povaha znaku“. Tým chce povedať, že vzťah medzi označujúcim a označovaným v jazyku nie je nikdy nevyhnutný (alebo „motivovaný“): možno rovnako ľahko nájsť zvukový označujúci arbre ako strom označujúci, aby sa spojili s pojmom „strom“. Okrem toho to však znamená, že aj označované je ľubovoľné: pojem „strom“ by sa dal definovať rovnako ľahko podľa kvality dreva (čo by vylučovalo palmy), ako aj podľa veľkosti (čo vylučuje „nízke dreviny“, ktoré volacie kríky). To by malo objasniť, že číslovanie predpokladov, ktoré uvádzam, nepredstavuje poradie priorít: každý predpoklad – systémová povaha významu (najlepšie pochopiteľné „synchrónnym štúdiom jazyka“), relačná alebo „diakritická“ povaha prvkov význam, svojvoľnosť znakov – odvodzuje svoju hodnotu od ostatných.

To znamená, že saussurovská lingvistika javy, ktoré študuje, v preklenujúcich vzťahoch kombinácie a kontrastu v jazyku. V tejto koncepcii je jazyk procesom artikulácie významu (označenia) aj jeho produktom (komunikácia), pričom tieto dve funkcie jazyka nie sú ani identické, ani úplne kongruentné (pozri Schleifer, „Deconstruction“). Tu môžeme vidieť striedanie formy a obsahu, ktoré Greimas a Courtés opisujú v modernistickej interpretácii: jazyk predstavuje kontrasty, ktoré formálne definujú jeho jednotky, a tieto jednotky sa spájajú na nasledujúcich úrovniach, aby vytvorili označujúci obsah. Keďže prvky jazyka sú ľubovoľné, navyše ani kontrast ani kombináciu nemožno považovať za základné. V jazyku sa teda rozlišovacie znaky spájajú a vytvárajú kontrastné fonémy na inej úrovni vnímania, fonémy sa spájajú a vytvárajú kontrastné morfémy, morfémy sa spájajú a vytvárajú slová, slová sa spájajú do viet atď. V každom prípade je celá fonéma, slovo alebo veta a tak ďalej väčšia ako súčet jej častí (rovnako ako voda, H2O, v Saussureovom príklade [(1959) 103] je viac ako mechanická aglomerácia vodíka a kyslíka).

Tri predpoklady Kurzu všeobecnej lingvistiky viedli Saussura k volanie po novej vede dvadsiateho storočia, ktorá by presahovala rámec lingvistickej vedy a skúmala „život znakov v spoločnosti“. Saussure nazval túto vedu „sémiológia (z gréckeho semeîon „znamenie“)“ (16). „Veda“ semiotiky, ako sa začala praktizovať vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch 20. storočia, rozšírila štúdium jazyka a jazykových štruktúr na literárne artefakty tvorené (alebo artikulované) týmito štruktúrami. Počas konca svojej kariéry, dokonca aj keď ponúkal kurzy všeobecnej lingvistiky, Saussure pokračoval vo vlastnej „semiotickej“ analýze neskorej latinskej poézie v snahe objaviť zámerne skryté anagramy vlastných mien. Metóda štúdia bola v mnohých ohľadoch opakom funkčného racionalizmu jeho lingvistických analýz: pokúšala sa, ako Saussure spomína v jednom z 99 zošitov, v ktorých sa venoval tejto štúdii, systematicky skúmať problém „náhody“, ktorý „... sa stáva nevyhnutným základom všetkého“ (cit. v Starobinski 101). Takáto štúdia, ako hovorí sám Saussure, sa zameriava na „hmotný fakt“ náhody a zmyslu (cit. 101), takže „tematické slovo“, ktorého anagram Saussure hľadá, ako tvrdí Jean Starobinski, „je pre básnika , nástroj a nie životne dôležitý zárodok básne. Od básne sa vyžaduje, aby znovu použila fonické materiály tematického slova“ (45). Starobinski v tejto analýze hovorí: "Saussure sa nestratil pri hľadaní skrytých významov." Namiesto toho sa zdá, že jeho práca demonštruje túžbu vyhnúť sa všetkým problémom vyplývajúcim z vedomia: „Keďže poézia nie je realizovaná len slovami, ale je niečím, čo sa rodí zo slov, uniká svojvoľnej kontrole vedomia a závisí výlučne od druhu jazykovej zákonnosti. “ (121).

Teda Saussurov pokus objaviť vlastné mená v neskorej latinskej poézii – to, čo Tzvetan Todorov nazýva redukciou „slova. . . k svojmu označujúcemu“ (266) – zdôrazňuje jeden z prvkov, ktoré riadili jeho lingvistickú analýzu, svojvoľnú povahu znaku. (Zdôrazňuje aj formálny charakter saussurovskej lingvistiky – „jazyk,“ tvrdí, „je formou a nie substancia“ – ktorá účinne eliminuje sémantiku ako hlavný predmet analýzy.) Ako Todorov uzatvára, Saussureova práca sa dnes javí ako pozoruhodne homogénna v tom, že odmieta akceptovať symbolické javy. . . . Vo svojom výskume anagramov venuje pozornosť iba javom opakovania, nie javom vyvolávania. . . . Vo svojich štúdiách o Nibelungoch rozpoznáva symboly len preto, aby ich pripísal chybným čítaniam: keďže nie sú úmyselné, symboly neexistujú. Napokon sa vo svojich kurzoch všeobecnej lingvistiky zamýšľa nad existenciou semiológie, a teda aj iných znakov ako lingvistických; ale toto tvrdenie je zároveň obmedzené skutočnosťou, že semiológia je venovaná jedinému typu znakov: tým, ktoré sú ľubovoľné. (269-70)

Ak je to pravda, je to preto, že Saussure si nedokázal predstaviť „zámer“ bez subjektu; nemohol celkom uniknúť protikladu medzi formou a obsahom, čo jeho dielo natoľko spochybňovalo. Namiesto toho sa uchýlil k „jazykovej zákonnosti“. Nachádza sa na jednej strane medzi koncepciami histórie, subjektivity a kauzálnej interpretácie z devätnásteho storočia, ktoré sa riadia týmito koncepciami, a na druhej strane medzi „štrukturalistickými“ koncepciami dvadsiateho storočia toho, čo Lévi-Strauss nazýval „kantovstvo bez transcendentálny subjekt“ (citované v Connerton 23) – koncepty, ktoré stierajú protiklad medzi formou a obsahom (alebo subjektom a objektom) a hierarchiou popredia a pozadia v plne rozvinutom štrukturalizme, psychoanalýze a dokonca aj kvantovej mechanike – dielo Ferdinanda de Saussure v lingvistike a semiotike ohraničuje signálny moment v štúdiu významu a kultúry.

Ronald Schleifer

Dodatok 2

Ferdinand de Saussure (preklad)

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je považovaný za zakladateľa modernej lingvistiky, a to vďaka jeho pokusom popísať skôr štruktúru jazyka než históriu jednotlivých jazykov a slovných foriem. Základy štrukturálnych metód v lingvistike a literárnej kritike a do značnej miery aj semiotike položil v jeho dielach na samom začiatku 20. storočia. Je dokázané, že metódy a koncepty takzvaného „postštrukturalizmu“, vyvinuté v dielach Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a iných, siahajú až k lingvistickým dielam Saussura a ďalších. anagramatické čítania neskororímskej poézie. Je potrebné poznamenať, že Saussureova práca o lingvistike a lingvistickej interpretácii pomáha prepojiť širokú škálu intelektuálnych disciplín, od fyziky po literárne inovácie, psychoanalýzu a filozofiu začiatku dvadsiateho storočia. A. J. Greimas a J. Kurte v Semiotics and Language píšu: „Analytický slovník s názvom „Interpretácia“ ako nový druh interpretácie sa objavil na začiatku 20. storočia spolu s lingvistikou Saussura, fenomenológiou Husserla a psychoanalýzou. Freuda. V takom prípade „interpretácia nie je pripisovanie daného obsahu forme, ktorá by inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje rovnaký obsah významného prvku v rámci daného semiotického systému“ (159). ). V tomto chápaní „interpretácie“ sú forma a obsah neoddeliteľné; naopak, každá forma je naplnená sémantickým významom („zmysluplná forma“), takže interpretácia ponúka nové, podobné prerozprávanie niečoho zmysluplného v inom znakovom systéme.

Podobné chápanie formy a obsahu, ktoré prezentoval Claude Lévi-Strauss v jednom z kľúčových diel štrukturalizmu („Štruktúra a forma: Úvahy o dielach Vladimíra Proppa“), môžeme vidieť v Saussureho posmrtne vydanej knihe Kurz v r. Všeobecná jazykoveda (1916, prel., 1959, 1983). Počas svojho života Saussure publikoval len málo, "Course" - jeho hlavné dielo - bolo zozbierané z poznámok študentov, ktorí navštevovali jeho prednášky zo všeobecnej lingvistiky v rokoch 1907-11. Saussure v kurze vyzval na „vedecké“ štúdium jazyka, pričom ho postavil do protikladu s komparatívno-historickou lingvistikou devätnásteho storočia. Toto dielo možno považovať za jeden z najväčších úspechov západného myslenia: berúc jednotlivé slová ako štrukturálne prvky jazyka za základ, historická (alebo „diachronická“) lingvistika dokázala pôvod a vývoj západoeurópskych jazykov od r. bežný, indoeurópsky jazyk – a skorší protoindoeurópsky.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „slovných prvkov“. Jeho práca bola pokusom zredukovať mnohé fakty o jazyku náhodne študované komparatívnou lingvistikou na malý počet teorémov. Porovnávacia filologická škola 19. storočia, píše Saussure, „nepodarila sa vytvoriť skutočnú lingvistickú školu“, pretože „nepochopila podstatu predmetu štúdia“ (3). Táto „podstata“ podľa neho nespočíva len v jednotlivých slovách – „pozitívnych substanciách“ jazyka – ale aj vo formálnych spojeniach, ktoré napomáhajú existencii týchto substancií.

Saussurov „test“ jazyka je založený na troch predpokladoch. Po prvé, vedecké chápanie jazyka nie je založené na historickom, ale na štrukturálnom fenoméne. Preto rozlišoval medzi jednotlivými javmi jazyka – „udalosťami reči“, ktoré definuje ako „podmienečné prepustenie“ – a vlastným, podľa neho, predmetom štúdia lingvistiky, systémom (kódom, štruktúrou), ktorý tieto udalosti riadi ( "jazyk"). Takéto systematické štúdium si navyše vyžaduje skôr „synchrónne“ poňatie vzťahu medzi prvkami jazyka v danom momente, než „diachrónne“ štúdium vývoja jazyka prostredníctvom jeho dejín.

Táto hypotéza bola predchodcom toho, čo by Roman Jakobson v roku 1929 nazval „štrukturalizmom“ – teóriou, v ktorej „akýkoľvek súbor javov skúmaných modernou vedou nie je považovaný za mechanickú akumuláciu, ale za štrukturálny celok, v ktorom konštruktívna zložka koreluje s funkcia" ("Romantický "711). V tejto pasáži Jakobson sformuloval Saussurovu myšlienku definovania jazyka ako štruktúry, na rozdiel od „mechanického“ vymenovania historických udalostí. Okrem toho Jakobson rozvíja ďalší saussurovský predpoklad, ktorý sa stal predchodcom štrukturálnej lingvistiky: základné prvky jazyka by sa nemali skúmať ani tak v súvislosti s ich príčinami, ale s ich funkciami. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi. Išlo o radikálny obrat v porovnávaní javov s okolitou realitou, ktorého význam porovnával filozof Ernst Cassirer s „Galileovou vedou, ktorá zmenila predstavy o hmotnom svete v 17. storočí“. , ako poznamenávajú Greimas a Kurthe, mení myšlienku „interpretácie“, následne aj samotné vysvetlenia. Javy sa začali interpretovať nie vo vzťahu k príčinám ich výskytu, ale vo vzťahu k účinku, ktorý môžu mať na prítomnosť a budúcnosť.Výklad prestal byť nezávislý od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).

Saussure vo svojej lingvistike ukazuje najmä tento obrat v zmene pojmu slova v lingvistike, ktoré definuje ako znak a popisuje z hľadiska jeho funkcií. Znakom je pre neho spojenie zvuku a významu, „označené a označenie“ (66-67; v anglickom preklade z roku 1983 od Roya Harrisa – „označenie“ a „signál“). Povaha tejto zlúčeniny je „funkčná“ (ani jeden, ani druhý prvok nemôže existovať jeden bez druhého); navyše „jeden si požičiava vlastnosti od druhého“ (8). Saussure teda definuje hlavný štrukturálny prvok jazyka – znak – a robí základom historickej lingvistiky identitu znakov so slovami, čo si vyžaduje obzvlášť dôslednú analýzu. Preto môžeme chápať rôzne významy povedzme toho istého slova „strom“ – nie preto, že slovo je len súborom určitých vlastností, ale preto, že je definované ako prvok v systéme znakov, v „štrukturálnom celku“, v jazyku.

Takýto relatívny („diakritický“) koncept jednoty je základom konceptu všetkých prvkov jazyka v štruktúrnej lingvistike. Je to zreteľné najmä v najoriginálnejšom objave saussurovskej lingvistiky, vo vývoji konceptu „foném“ a „rozlišovacích znakov“ jazyka. Fonémy sú najmenšie z hovorených a zmysluplných jazykových jednotiek. Nie sú to len zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, poznamenáva Saussure, ktoré rodení hovoriaci vnímajú ako význam. (Treba poznamenať, že Elmar Holenstein nazýva Jakobsonovu lingvistiku, ktorá vo svojich hlavných ustanoveniach pokračuje v myšlienkach a konceptoch Saussura, „fenomenologický štrukturalizmus“). Preto popredný rečník Pražskej školy štrukturalizmu Jan Mukarowski v roku 1937 poznamenal, že „štruktúra. . . nie empirický, ale fenomenologický koncept; nejde o samotný výsledok, ale o súbor významných vzťahov kolektívneho vedomia (generácie, iných atď.)“. Podobnú myšlienku vyslovil v roku 1960 Lévi-Strauss, líder francúzskeho štrukturalizmu: „Štruktúra nemá určitý obsah; je zmysluplný sám o sebe a logická konštrukcia, v ktorej je uzavretý, je odtlačkom reality.

Fonémy ako najmenšie lingvistické prvky prijateľné pre vnímanie zase predstavujú samostatnú integrálnu „fenomenologickú realitu“. Napríklad v angličtine môže byť zvuk „t“ vyslovovaný inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Nasávanie, zdvihnutie alebo spustenie, dlhý zvuk „t“ atď. rovnako rozlíši význam slov „do“ a „urobiť“. Okrem toho rozdiely medzi jazykmi sú také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty tej istej fonémy (ako anglické „t“, vyslovované s aspiráciou a bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V rokoch 1920-1930, po Saussure, Jacobson a N.S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto znaky vychádzajú zo štruktúry rečových orgánov – jazyka, zubov, hlasiviek – Saussure to poznamenáva v „Kurse všeobecnej lingvistiky“ a Harris to nazýva „fyziologická fonetika“ (v Baskinovom skoršom preklade termín „fonológia " sa používa) - sú spojené do "uzlov » durg proti priateľovi, aby vydával zvuky. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „V jazyku sú len rozdiely.“ Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Už som spomenul, že fonológia sa vo svojom vývoji opierala o myšlienky Saussura. Hoci jeho analýza lingvistickej fyziológie v modernej dobe, hovorí Harris, „by sa volala „fyzická“, na rozdiel od „psychologickej“ alebo „funkčnej“, v Kurze jasne formuloval smer a základné princípy funkčnej analýzy jazyka. Jeho jediné publikované dielo počas jeho života, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Poznámky k pôvodnému samohláskovému systému v indoeurópskych jazykoch), vydané v roku 1878, bolo úplne v súlade s porovnávacou historickou lingvistikou 19. storočie. Napriek tomu v tejto práci, hovorí Jonathan Culler, Saussure ukázal „plodnosť myšlienky jazyka ako systému vzájomne prepojených javov, dokonca aj s jeho historickou rekonštrukciou“. Pri analýze vzťahu medzi fonémami, vysvetlením striedania samohlások v moderných jazykoch indoeurópskej skupiny Saussure navrhol, že okrem niekoľkých rôznych zvukov „a“ musia existovať aj iné fonémy, ktoré sú formálne opísané. „Na Saussureho diele pôsobí zvláštny dojem,“ uzatvára Kaller, „že takmer o 50 rokov neskôr, keď bolo objavené a rozlúštené klinové písmo Chetitov, bola nájdená fonéma v písme označená „h“, ktorá sa správala tak, ako Saussure predpovedal. Prostredníctvom formálnej analýzy objavil to, čo je dnes v indoeurópskych jazykoch známe ako hrdelný zvuk.

V koncepte relatívnej (diakritickej) definície znakov, explicitných aj implikovaných v kurze, existuje tretí kľúčový predpoklad štrukturálnej lingvistiky, ktorý Saussure nazval „ľubovoľná povaha znaku“. To znamená, že vzťah medzi zvukom a významom v jazyku nie je ničím motivovaný: rovnako ľahko možno spojiť slovo „arbre“ a slovo „strom“ s pojmom „strom“. Navyše to znamená, že aj zvuk je ľubovoľný: pojem „strom“ možno definovať prítomnosťou kôry (okrem paliem) a veľkosťou (okrem „nízkych drevín“ – kríkov). Z toho by malo byť zrejmé, že všetky predpoklady, ktoré uvádzam, nie sú rozdelené na viac a menej dôležité: každý z nich - systémová povaha znakov (najzrozumiteľnejšia pri "synchrónnom" štúdiu jazyka), ich relatívna (diakritická) podstata, svojvoľná povaha znakov – pochádza z ostat.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov (označenie) aj ich výsledkom (komunikáciou) – a tieto dve funkcie sa nikdy nezhodujú (pozri Shleiferovu „Dekonštrukciu jazyka“). Striedanie formy a obsahu, ktoré popisujú Greimas a Kurte, môžeme vidieť v najnovšej verzii interpretácie: jazykové kontrasty definujú jej štruktúrne jednotky a tieto jednotky interagujú na postupných úrovniach a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku tvoria distinktívne znaky fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do kontrastných morfém, morfémy do slov, slová do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac ako súčet jeho častí (rovnako ako voda, v Saussureovom príklade, je viac ako kombinácia vodíka a kyslíka).

Tri predpoklady „kurzu všeobecnej lingvistiky“ viedli Saussura k myšlienke novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá by študovala „život znakov v spoločnosti“. Saussure nazval túto vedu semiológiou (z gréckeho "semeîon" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. a 30. rokoch 20. storočia a v 50. a 60. rokoch v Paríži, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (alebo formulované) pomocou týchto štruktúr. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola vo svojej lingvistickej analýze v mnohom protikladom racionalizmu: išlo o pokus, ako píše Saussure v jednom z 99 zošitov, študovať v systéme problém „pravdepodobnosti“, ktorý „sa stáva základom všetkého. " Takéto vyšetrovanie, tvrdí sám Saussure, pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „Kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, a nie zdrojom života pre báseň. Báseň slúži na prevrátenie zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia sa nevyjadruje len slovami, ale aj tým, čo tieto slová vyvolávajú, ide mimo kontrolu vedomia a závisí len od jazykové zákony“.

Saussurov pokus o štúdium vlastných mien v neskororímskej poézii (Cvetan Todorov to nazval skratkou „slova ... len predtým, ako bolo napísané“), zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnosť znakov, ako aj formálna podstata saussurovskej lingvistiky ("Jazyk," tvrdí, "podstata formy, nie javu"), čo vylučuje možnosť analýzy významu. Todorov uzatvára, že dnešné Saussureove spisy sa zdajú byť pozoruhodne konzistentné v ich neochote študovať symboly [javy, ktoré majú presne definovaný význam]. . . . Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu knihy Nibelungov definuje symboly len preto, aby ich priradil k chybným údajom: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semilógia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na histórii a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách na jednej strane a na druhej strane štrukturalistickými koncepciami, ktoré Levi-Strauss nazval „kantovstvom bez transcendentna“. herec“ – vymazanie protikladu medzi formou a obsahom (predmetom a objektom), významom a pôvodom v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike, spisy Ferlinanda de Saussure o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.

Ronald Shleifer

Literatúra

1. Admoni V.G. Základy teórie gramatiky / V.G. Admoni; Akadémia vied ZSSR.-M.: Nauka, 1964.-104s.

4. Arnold I.V. Sémantická štruktúra slova v modernej angličtine a metodológia jej štúdia. /I.V. Arnold - L .: Vzdelávanie, 1966. - 187 s.

6.Bashlykov A.M. Systém automatického prekladu. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 s.

7.Baudouin de Courtenay: Teoretické dedičstvo a modernita: Abstrakty správ z medzinárodnej vedeckej konferencie / Ed.I.G. Kondratiev. - Kazaň: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Prvky matematickej lingvistiky. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Jazyk a štatistika. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretická a aplikovaná lingvistika. / V.A. Zvegincev - M., 1969. - 143 s.

11. Kasevič, V.B. Sémantika. Syntax. Morfológia. // V.B. Kasevich -M., 1988. - 292 s.

12. Lekomtsev Yu.K. Úvod do formálneho jazyka lingvistiky / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 s., ill.

13. Jazykové dedičstvo Baudouina de Courtenay na konci 20. storočia: Abstrakty z medzinárodnej vedeckej a praktickej konferencie 15. – 18. marca 2000. - Krasnojarsk, 2000. - 125 s.

Matveeva G.G. Skryté gramatické významy a identifikácia sociálnej osoby („portrét“) hovoriaceho / G.G. Matvejev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Skúsenosti s budovaním lingvistických modelov „Význam<-->Text". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Preklad a aplikovaná lingvistika / L.L. Nelyubin. - M. : Vyššia škola, 1983. - 207 s.

16. O exaktných metódach výskumu jazyka: o takzvanej „matematickej lingvistike“ / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva a ďalší - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematická lingvistika: Učebnica / L.G. Piotrovsky, K.B. Bektajev, A.A. Piotrovskaja. - M.: Vyššia škola, 1977. - 160 s.

18. On je. Text, stroj, osoba. - L., 1975. - 213 s.

19. On je. Aplikovaná lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. jazykové modely. M., 1963. Revzin, I.I. Moderná štruktúrna lingvistika. Problémy a metódy. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Základy všeobecného a strojového prekladu / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teória F. de Saussura vo svetle modernej lingvistiky / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Sova, L.Z. Analytická lingvistika / L.Z. Sova - M., 1970. - 192 s.

24. Saussure F. de. Poznámky zo všeobecnej lingvistiky / F. de Saussure; Za. od fr. – M.: Progress, 2000. – 187 s.

25. On je. Kurz všeobecnej lingvistiky / Per. od fr. - Jekaterinburg, 1999. -426 s.

26. Štatistika reči a automatická analýza textu / Ed. vyd. R.G. Piotrovského. L., 1980. - 223 s.

27. Štoll, P. Sady. Logika. Axiomatické teórie / R. Stoll; Za. z angličtiny. - M., 1968. - 180 s.

28. Tenier, L. Základy štruktúrnej syntaxe. M., 1988.

29. Ubin I.I. Automatizácia prekladateľských činností v ZSSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tichomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderná matematika. M., 1966.

31. Shenk, R. Spracovanie pojmových informácií. M., 1980.

32. Shikhanovič, Yu.A. Úvod do modernej matematiky (počiatočné pojmy). M., 1965

33. Shcherba L.V. Ruské samohlásky z kvalitatívneho a kvantitatívneho hľadiska / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Občan sveta // Ogonyok - 1996. - č.5. – str.13

35. V.A. Uspenského. Predbežné pre čitateľov „Novej literárnej revue“ k semiotickým posolstvám Andreja Nikolajeviča Kolmogorova. - Nová literárna recenzia. –1997. - č. 24. - S. 18-23

36. Perlovský L. Vedomie, jazyk a kultúra. - Poznanie je moc. –2000. č. 4 - S. 20-33

37. Frumkina R.M. O nás - šikmo. // Ruský denník. - 2000. - č. 1. – str. 12

38. Fitialov, S.Ya. O modelovaní syntaxe v štruktúrnej lingvistike // Problémy štruktúrnej lingvistiky. M., 1962.

39. On je. O ekvivalencii gramatiky NN a gramatiky závislosti // Problémy štruktúrnej lingvistiky. M., 1967.

40. Chomsky, N. Logické základy lingvistickej teórie // Nové v lingvistike. Problém. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//tlač. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. lis. jhu.ru

46. ​​​​en.wikipedia.org

Obsah
Úvod
Kapitola 1. História aplikácie matematických metód v lingvistike
1.1. Formovanie štruktúrnej lingvistiky na prelome 19. – 20. stor.
1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia
Záver
Literatúra
Úvod
V 20. storočí pretrváva trend vzájomného pôsobenia a prenikania rôznych oblastí poznania, pričom hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.
Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.Cieľom mojej seminárnej práce je stručne poukázať na prepojenie matematiky s takou oblasťou lingvistiky, akou je lingvistika. Od roku 1950 sa matematika používa v lingvistike na vytvorenie teoretického aparátu na popis štruktúry jazykov (prirodzených aj umelých). Treba však povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa matematické metódy v lingvistike začali využívať na objasnenie základných pojmov lingvistiky, avšak s rozvojom výpočtovej techniky sa takýto teoretický predpoklad začal uplatňovať aj v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Pred lingvistami vyvstala otázka: ako sa naučiť reprezentovať jazykové vzory vo forme, v ktorej sa dajú priamo aplikovať na technológiu. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel si všimol interakciu jazyka a vedomia a významný lingvista začiatku dvadsiateho storočia Ferdinand de Saussure (o jeho vplyve na rozvoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď identifikuje kvantitatívne charakteristiky jazyka (napríklad počet pohlaví, prípady) so zvláštnosťami národnej mentality (viac o tom v časti 2. 2, "Štatistické metódy v lingvistike").
Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.
Kapitola I. História aplikácie matematických metód v lingvistike
1.1 Formovanie štruktúrnej lingvistiky na prelome XIX - XX storočia
Matematický popis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý sa datuje od slávneho švajčiarskeho lingvistu zo začiatku dvadsiateho storočia Ferdinanda de Saussure.
Východiskovým článkom jeho konceptu je teória jazyka ako systému pozostávajúceho z troch častí (jazyk sám o sebe - langue, reč - podmienečné prepustenie a rečová aktivita - langage), v ktorej sa každé slovo (člen systému) nepovažuje za samo osebe. ale v spojení s inými....

Anastasia Anufrieva, Michail Ivlev, Vsevolod Miroshnikov, Jekaterina Artyukh

Práce žiakov 5. ročníka. Výskumný projekt: "Matematická lingvistika". Skupinová práca na predmetoch - matematika a cudzí jazyk.

Stiahnuť ▼:

Náhľad:

Hlavné oddelenie školstva radnice v Novosibirsku

Palác kreativity pre deti a študentov "Junior"

Otvorená mestská súťaž výskumných projektov

žiaci 5.-8

Smer: prírodno-matematický projekt

Matematická lingvistika

Ivlev, Michail

Miroshnikov Vsevolod,

Artyukh Jekaterina

MBOUSOSH №26, 5. ročník

Kalininsky okres Novosibirsk

Projektoví konzultanti:Yasyurenko Maya Dmitrievna,

učiteľka matematiky a informatiky,

Sevastyanova Tatyana Sergeevna,

učiteľ angličtiny

I kvalifikačná kategória.

Kontaktné čísla manažérov:

8-952-924-02-66 (Yasyurenko M.D.)

8-913-896-81-77 (Sevastyanova T.S.)

Novosibirsk 2013

Projekt: "Matematická lingvistika"

Účastníci projektu:Anufrieva Anastasia, Ivlev Michail, Miroshnikov Vsevolod, Artyukh Jekaterina.

Projektoví konzultanti:Yasyurenko Maya Dmitrievna, učiteľka matematiky a informatiky. Sevastyanova Tatyana Sergeevna, učiteľka angličtiny I

kvalifikačnej kategórii.

Stupeň: 5A

Názov, číslo vzdelávacej inštitúcie, kde sa projekt realizoval:MBOUSOSH №26, Kalininsky okres, mesto Novosibirsk

Oblasť:matematika, cudzí jazyk.

Čas projektu:novembra 2012 - február 2013 (dlhodobý)

Cieľ projektu: hľadanie spoločného základu medzi matematikou a lingvistikou.

Úlohy:

  1. Oboznámte sa s históriou vývoja matematiky a formovania jazykovedy.
  2. Nájdite jednotlivé príklady aplikácie matematiky v lingvistike.
  3. Študovať perspektívy aplikácie matematických metód v lingvistike. Vyvodiť závery.

Typ projektu (podľa typu aktivity):hľadanie, výskum

Použité technológie: multimédiá

Formulár produktu projektu:"Matematická lingvistika" (multimediálna prezentácia).

štúdium:

- výber a štúdium teoretického materiálu na túto tému;

- spracovanie prijatých informácií;

- určenie perspektív aplikácie matematických metód v lingvistike.

Rozsah výsledku projektu:vzdelávacie (matematika, cudzí jazyk).

Úvod………………………………………………………………………………………..2

Kapitola 1. História aplikácie matematických metód v lingvistike

1.1. Dejiny matematiky………………………………………………………....3

1.2. Formovanie lingvistiky………………………………………………………...4

1.3. Matematická lingvistika………………………………………………..8

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1. Učenie sa jazyka metódami formálnej logiky………………………………11

2.2. Perspektívy aplikácie matematických metód v lingvistike ...... 13

Záver ……………………………………………………………………………… 14

Literatúra……………………………………………………………………………… 15

Úvod.

V dvadsiatom storočí došlo k trendu interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.

Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Matematika preniká čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, pričom rozširuje ich heuristický potenciál (odpoveď na otázku „koľko“ často pomáha odpovedať na otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.

Zmyslom našej práce je stručne poukázať na prepojenie matematiky s takým odvetvím lingvistiky, ako je lingvistika. Spočiatku sa matematické metódy v lingvistike začali používať na objasnenie základných pojmov lingvistiky, s rozvojom výpočtovej techniky však takýto teoretický predpoklad začal nachádzať uplatnenie v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Lingvisti stáli pred otázkou: ako sa naučiť reprezentovať jazykové vzory v podobe, v akej sa dajú priamo aplikovať na techniku. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Nemecký filozof, lingvista Friedrich Schlegel zaznamenal interakciu jazyka a vedomia a významný lingvista začiatku dvadsiateho storočia Ferdinand de Saussure spojil štruktúru jazyka s jeho príslušnosťou k ľuďom. Interakcia matematiky a lingvistiky je mnohostranná téma a v našej práci sa nezaoberáme všetkými, ale predovšetkým jej aplikovanými aspektmi.

Kapitola 1. História aplikácie matematických metód v lingvistike.

1.1. História matematiky.

V histórii matematikyTradične existuje niekoľko fáz vo vývoji matematických vedomostí:

  1. Formovanie konceptugeometrický obrazec a čísla ako idealizáciareálne objekty a súbory homogénnych objektov. Vznik počítania a merania, ktoré umožnili porovnávať rôzne čísla, dĺžky, plochy a objemy.
  2. Vynález aritmetických operácií. Empirická akumulácia (pokusom a omylom) poznatkov o vlastnostiach aritmetických operácií, o metódach merania plôch azväzkovjednoduché postavy a telá. V tomto smere sa dosiahol pokroksumerský babylonský, čínsky a indickýstaroveká matematika.
  3. Vzhľad v staroveké Gréckodeduktívny matematický systém, ktorý ukázal, ako získať nové matematické pravdy na základe existujúcich. Vrcholným úspechom starogréckej matematiky bol„Začiatky“ Euklida, ktorý dve tisícročia plnil úlohu štandardu matematickej prísnosti.
  4. Matematici krajín islamunielen zachovali antické výdobytky, ale dokázali ich aj syntetizovať s objavmi indických matematikov, ktorí v teórii čísel pokročili ďalej ako Gréci.
  5. V XVI-XVIII storočia sa európska matematika znovuzrodila a ide ďaleko vpred. Jeho koncepčným základom v tomto období bolo presvedčenie, že matematické modely sú akousi ideálnou kostrou Vesmíru, a preto je objavovanie matematických právd súčasne objavovaním nových vlastností reálneho sveta. Hlavným úspechom na tejto ceste bol vývoj matematických modelov závislosti premenných (funkciu) a všeobecná teória pohybu (infinitezimálna analýza). Všetky prírodné vedy boli prebudované na základe novoobjavených matematických modelov, čo viedlo ku kolosálnejpokrok.
  6. V 19. – 20. storočí sa ukazuje, že vzťah medzi matematikou a realitou už zďaleka nie je taký jednoduchý, ako sa zdalo predtým. Na druh „základnej otázky filozofie matematiky“: nájsť príčinu „nepochopiteľnej účinnosti matematiky v prírodných vedách“ neexistuje žiadna všeobecne akceptovaná odpoveď. V tomto, a nielen v tomto smere, sa matematici rozdelili do mnohých diskutujúcich škôl. Objavilo sa niekoľko nebezpečných trendov: príliš úzka špecializácia, izolácia od praktických problémov atď. Zároveň sila matematiky a jej prestíž, podporená efektívnosťou jej aplikácie, sú vysoké ako nikdy predtým.

Okrem veľkého historického záujmu má pre rozvoj veľký význam analýza vývoja matematikyfilozofia a metodikymatematiky. K pokroku konkrétnych matematických disciplín často prispieva aj znalosť histórie; napríklad starovekýČínsky problém (teorém) o zvyškochvytvoril celú sekciuteória čísel.

Zdôvodnenie matematiky

Začiatkom 19. storočia mala pomerne prísne logické (deduktívne) opodstatnenie iba euklidovská geometria, hoci už vtedy bola jej prísnosť právom považovaná za nedostatočnú. Vlastnosti nových objektov (napr.komplexné čísla, nekonečne malýatď.) boli jednoducho považované za v podstate rovnaké ako objekty už známych; ak takáto extrapolácia nebola možná, vlastnosti sa vybrali empiricky.

Augustín Louis Cauchy

Budovanie základov matematiky sa začalo analýzou. AT1821Cauchypublikoval „Algebraickú analýzu“, kde jasne definoval základné pojmy vychádzajúce z pojmu limita. Napriek tomu sa dopustil viacerých chýb, napríklad integroval a diferencoval série termín po termíne bez toho, aby dokázal prípustnosť takýchto operácií. Dokončili základy analýzyWeierstrass, ktorý objasnil úlohu dôležitého pojmujednotná kontinuita. Súčasne Weierstrass (60. roky 19. storočia) aDedekind(70. roky 19. storočia) zdôvodnil teóriureálne čísla.


Popisy snímok:

Matematická lingvistika Autori: Anastasia Anufrieva, Michail Ivlev, Vsevolod Miroshnikov, Ekaterina Artyukh MBOUSOSH#26, 5. ročník Kalininského okresu v Novosibirsku Konzultanti projektu: Maya Dmitrievna Yasyurenko, učiteľka matematiky a informatiky, kvalifikácia učiteľka angličtiny, kategória Angličtina. Tatyana S.

Účel projektu: hľadanie spoločného základu medzi matematikou a lingvistikou.

Ciele projektu: Oboznámiť sa s históriou vývoja matematiky a formovania jazykovedy. Nájdite jednotlivé príklady aplikácie matematiky v lingvistike. Študovať perspektívy aplikácie matematických metód v lingvistike. Vyvodiť závery.

V dvadsiatom storočí došlo k trendu interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.

Etapy rozvoja matematických vedomostí: Formovanie pojmu geometrický útvar a číslo ako idealizácia reálnych objektov a množín homogénnych objektov. Vznik počítania a merania, ktoré umožnili porovnávať rôzne čísla, dĺžky, plochy a objemy.

Vynález aritmetických operácií. Vznik deduktívneho matematického systému v starovekom Grécku. Matematici krajín islamu nielen zachovali staroveké výdobytky, ale dokázali ich aj syntetizovať s objavmi indických matematikov, ktorí v teórii čísel pokročili ďalej ako Gréci.

V XVI-XVIII storočia sa európska matematika znovuzrodila a ide ďaleko vpred. V 19. – 20. storočí sa ukazuje, že vzťah medzi matematikou a realitou už zďaleka nie je taký jednoduchý, ako sa zdalo predtým.

Augustín Louis Cauchy

História lingvistiky vo svojom vývoji prešla 5 obdobiami. 1 obdobie - 5-4 storočia. pred Kr. - XVI storočia. 2 obdobie - XVII-XVIII storočia. 3. obdobie - koniec 18. - prvá polovica 19. storočia. 4 obdobie - obdobie systematického jazykového vzdelávania - koniec 19. - prvá tretina 20. stor. Obdobie 5 - 30-te roky XX storočia. Do teraz.

Matematická lingvistika: Študuje vlastnosti semiotického a matematického modelovania prirodzeného jazyka (a reči) s cieľom preložiť informácie obsiahnuté v neformálnej forme v texte do formalizovaného umelého jazyka (napríklad do nejakého informačného jazyka) založeného na takomto matematickom aparáte ako teória množín a vzťahy algebry, teória fuzzy množín a lingvistickej premennej, teória pravdepodobnosti a matematická štatistika, ako aj prvky teórie informácie. Úzko súvisí s inžinierskou lingvistikou. Odvetvie lingvistiky, ktoré študuje možnosti aplikácie matematických metód pri štúdiu a opise jazyka.

Metajazyk je jazyk používaný na vyjadrenie úsudkov o inom jazyku, o jazyku-objekte. Pomocou metajazyka študujú štruktúru znakových kombinácií (výrazov) jazyka-objektu, dokazujú vety o jeho výrazových vlastnostiach, o jeho vzťahu k iným jazykom atď.

Lingvistika v modernom svete sa stala základom rozvoja informačných technológií. Pokiaľ informatika zostane rýchlo sa rozvíjajúcim odvetvím ľudskej činnosti, spojenie matematiky a lingvistiky bude naďalej zohrávať svoju úlohu v rozvoji vedy.

Obsah
Úvod
Kapitola 1. História aplikácie matematických metód v lingvistike
1.1. Formovanie štruktúrnej lingvistiky na prelome 19. – 20. stor.
1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia
Kapitola 2. Vybrané príklady využitia matematiky v lingvistike
2.1. Strojový preklad
2.2.Štatistické metódy v učení sa jazykov
2.3. Učenie sa jazyka metódami formálnej logiky
2.4. Perspektívy aplikácie matematických metód v lingvistike
Záver
Literatúra
Dodatok 1. Ronald Schleifer. Ferdinand de Saussure
Príloha 2. Ferdinand de Saussure (preklad)

Úvod
V 20. storočí pretrváva trend interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.
Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.
Cieľom mojej práce v kurze je stručne poukázať na prepojenie matematiky s takou oblasťou lingvistiky, akou je lingvistika. Od roku 1950 sa matematika používa v lingvistike na vytvorenie teoretického aparátu na popis štruktúry jazykov (prirodzených aj umelých). Treba však povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa matematické metódy v lingvistike začali používať na objasnenie základných pojmov lingvistiky, s rozvojom výpočtovej techniky však takýto teoretický predpoklad začal nachádzať uplatnenie v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Lingvisti stáli pred otázkou: ako sa naučiť reprezentovať jazykové vzory v podobe, v akej sa dajú priamo aplikovať na techniku. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. . Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel zaznamenal interakciu jazyka a vedomia a Ferdinand de Saussure, významný lingvista začiatku dvadsiateho storočia (o jeho vplyve na rozvoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď stotožňuje kvantitatívne charakteristiky jazyka (napr. počet rodov, prípadov) so zvláštnosťami národnej mentality (viac v časti 2.2 „Štatistické metódy v lingvistike“).
Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.

Kapitola I. História aplikácie matematických metód v lingvistike
1.1 Formovanie štruktúrnej lingvistiky na prelome XIX - XX storočia
Matematický opis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý siaha až k slávnemu švajčiarskemu lingvistovi zo začiatku dvadsiateho storočia Ferdinandovi de Saussure.
Počiatočným článkom jeho koncepcie je teória jazyka ako systému pozostávajúceho z troch častí (jazyk samotný je Jazyk, reč - heslo a rečová aktivita - Jazyk), v ktorom sa každé slovo (člen systému) nepovažuje samo o sebe, ale v spojení s inými členmi. Ako neskôr poznamenal ďalší významný lingvista, Dán Louis Hjelmslev, Saussure „bol prvý, kto požadoval štrukturálny prístup k jazyku, teda vedecký popis jazyka zaznamenávaním vzťahov medzi jednotkami“.
Saussure pochopil jazyk ako hierarchickú štruktúru a ako prvý nastolil problém hodnoty a významu jazykových jednotiek. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi.
Štrukturálna jednotka jazyka Saussure považovala slovo „znamenie“, v ktorom sa spájal zvuk a význam. Žiadny z týchto prvkov neexistuje jeden bez druhého: preto rodený hovorca chápe rôzne odtiene významu polysémantického slova ako samostatný prvok v štruktúrnom celku, v jazyku.
V teórii F. de Saussura tak možno vidieť interakciu lingvistiky na jednej strane so sociológiou a sociálnou psychológiou (treba podotknúť, že v tom istom období boli Husserlova fenomenológia, Freudova psychoanalýza, Einsteinova teória relativity rozvíjali sa experimenty s formou a obsahom v literatúre, hudbe a výtvarnom umení, na druhej strane s matematikou (pojem konzistencie zodpovedá algebraickému konceptu jazyka). Takáto koncepcia zmenila koncepciu jazykovej interpretácie ako takú: Javy sa začali interpretovať nie vo vzťahu k príčinám ich vzniku, ale vo vzťahu k súčasnosti a budúcnosti. Interpretácia prestala byť nezávislá od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).
Fungovanie jazykového mechanizmu sa prejavuje prostredníctvom rečovej aktivity rodených hovoriacich. Výsledkom reči sú takzvané „správne texty“ – sekvencie rečových jednotiek, ktoré sa riadia určitými vzormi, z ktorých mnohé umožňujú matematický popis. Teória spôsobov opisu syntaktickej štruktúry sa zaoberá štúdiom metód matematického popisu správnych textov (predovšetkým viet). V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.
Saussureove myšlienky rozvinuli na Západe mladší súčasníci veľkého švajčiarskeho lingvistu: v Dánsku - mnou už spomínaný L. Hjelmslev, ktorý dal vznik algebraickej teórii jazyka vo svojom diele „Základy lingvistickej teórie“, v r. USA - E. Sapir, L. Bloomfield, C. Harris, v ČR - ruský vedec-emigrant N. Trubetskoy.
Štatistickými zákonitosťami v štúdiu jazyka sa začal zaoberať nik iný ako zakladateľ genetiky Georg Mendel. Až v roku 1968 filológovia zistili, že ho v posledných rokoch života fascinovalo štúdium jazykových javov pomocou metód matematiky. Mendel priniesol túto metódu do lingvistiky z biológie; v 90. rokoch len tí najodvážnejší lingvisti a biológovia tvrdili uskutočniteľnosť takejto analýzy. V archíve kláštora sv. Tomáša v Brne, ktorého opátom bol Mendel, sa našli listy so stĺpcami priezvisk zakončenými na „mann“, „bauer“, „mayer“ a s niektorými zlomkami a výpočtami. Mendel v snahe odhaliť formálne zákonitosti pôvodu rodových mien robí zložité výpočty, v ktorých berie do úvahy počet samohlások a spoluhlások v nemeckom jazyku, celkový počet slov, ktoré zvažuje, počet priezvisk, počet mien, počet hlások a spoluhlások. atď.
U nás sa štrukturálna lingvistika začala rozvíjať približne v rovnakom období ako na Západe – na prelome 19. – 20. storočia. Súčasne s F. de Saussurom koncept jazyka ako systému rozvinuli vo svojich prácach profesori Kazanskej univerzity F.F. Fortunatov a I.A. Baudouin de Courtenay. Ten si dlho korešpondoval s de Saussurom, respektíve ženevská a kazaňská lingvistická škola navzájom spolupracovali. Ak možno Saussura nazvať ideológom „exaktných“ metód v lingvistike, potom Baudouin de Courtenay položil praktické základy ich aplikácie. Bol prvým, kto oddelil lingvistiku (napr presné veda využívajúca štatistické metódy a funkčnú závislosť) z filológie (spoločenstvo humanitných disciplín, ktoré študujú duchovnú kultúru prostredníctvom jazyka a reči). Samotný vedec veril, že „lingvistika môže byť v blízkej budúcnosti užitočná, iba ak sa oslobodí od povinného spojenia s filológiou a literárnou históriou“. Fonológia sa stala „skúšobnou pôdou“ pre zavedenie matematických metód do lingvistiky – zvuky ako „atómy“ jazykového systému, majúce obmedzený počet ľahko merateľných vlastností, boli najvhodnejším materiálom pre formálne, rigorózne metódy opisu. Fonológia popiera existenciu významu zvuku, preto bol v štúdiách eliminovaný „ľudský“ faktor. V tomto zmysle sú fonémy ako fyzické alebo biologické objekty.
Fonémy ako najmenšie jazykové prvky prijateľné pre vnímanie predstavujú samostatnú sféru, samostatnú „fenomenologickú realitu“. Napríklad v angličtine môže byť zvuk „t“ vyslovovaný inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Hlavná vec je, že fonéma bude vykonávať svoju hlavnú - sémantickú - funkciu. Okrem toho rozdiely medzi jazykmi sú také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty rovnakej fonémy (ako anglické „t“, vyslovované s aspiráciou alebo bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.
Zvuky jazyka sú systematicky organizovaným súborom funkcií. V rokoch 1920-1930, po Saussure, Jacobson a N.S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto vlastnosti sú založené na štruktúre orgánov reči - jazyk, zuby, hlasivky. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „Existujú len rozdiely v jazyku“. Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.
V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov aj prostriedkom komunikácie a tieto dve funkcie sa nikdy nezhodujú. Môžeme si všimnúť striedanie formy a obsahu: jazykové kontrasty definujú jeho štruktúrne jednotky a tieto jednotky spolupôsobia a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku tvoria distinktívne znaky fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do morfém, morfémy do slov, slová do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac než len súčet jeho častí.
Saussure navrhol myšlienku novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá študovala úlohu znakov v spoločnosti. Saussure nazval túto vedu semiológiou (z gréckeho "semeîon" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. – 30. rokoch 20. storočia a v Paríži v 50. – 60. rokoch, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (resp. formulované) pomocou týchto štruktúr. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola v mnohých ohľadoch protikladom racionalizmu vo svojej lingvistickej analýze: bol pokusom študovať v systéme problém „pravdepodobnosti“ v jazyku. Takýto výskum pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, nie zdrojom života básne“. Báseň slúži na výmenu zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia sa nevyjadruje len slovami, ale aj tým, čo tieto slová vyvolávajú, vymyká sa kontrole vedomia a závisí len od zákony jazyka“ (pozri . Príloha 1).
Saussureho pokus o štúdium vlastných mien v neskororímskej poézii zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnú povahu znakov, ako aj formálnu podstatu Saussureovej lingvistiky, ktorá vylučuje možnosť analýzy významu. Todorov prichádza k záveru, že dnes sa Saussureove diela zdajú byť mimoriadne konzistentné vo svojej neochote študovať symboly javu, ktoré majú jasne definovaný význam [Príloha 1]. Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu knihy Nibelungov definuje symboly len preto, aby ich priradil k chybným údajom: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semiológia môže opísať iba náhodné, ľubovoľné znaky.
Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na histórii a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách na jednej strane a na druhej strane štrukturalistickými koncepciami, ktoré stierajú protiklad medzi formou a obsahom (subjektom a objektom) , význam a pôvod v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike, spisy Ferdinanda de Saussure o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.
Na prvom medzinárodnom kongrese lingvistov v Haagu v roku 1928 boli zastúpení aj ruskí vedci. S. Kartsevsky, R. Yakobson a N. Trubetskoy vypracovali správu, ktorá skúmala hierarchickú štruktúru jazyka – v duchu najmodernejších myšlienok zo začiatku minulého storočia. Jakobson vo svojich spisoch rozvinul Saussurove myšlienky, že základné prvky jazyka by sa mali študovať predovšetkým v súvislosti s ich funkciami, a nie s dôvodmi ich výskytu.
Žiaľ, po nástupe Stalina k moci v roku 1924 je ruská lingvistika, podobne ako mnohé iné vedy, hodená späť. Mnohí talentovaní vedci boli nútení emigrovať, boli vyhnaní z krajiny alebo zomreli v táboroch. Až v polovici 50. rokov 20. storočia bol možný určitý pluralizmus teórií – viac o tom v časti 1.2.
1.2 Aplikácia matematických metód v lingvistike v druhej polovici 20.
Do polovice dvadsiateho storočia sa vytvorili štyri svetové lingvistické školy, z ktorých každá sa ukázala byť predchodcom určitej „presnej“ metódy. Leningradská fonologická škola(jeho predkom bol žiak Baudouina de Courtenay L.V. Shcherba) použil psycholingvistický experiment založený na analýze reči rodených hovoriacich ako hlavné kritérium na zovšeobecnenie zvuku vo forme fonémy.
Vedci Pražský lingvistický krúžok, najmä jej zakladateľ N.S. Trubetskoy, ktorý emigroval z Ruska, rozvinul teóriu opozícií - sémantickú štruktúru jazyka opísali ako súbor opozične konštruovaných sémantických jednotiek - sem. Táto teória sa uplatnila pri štúdiu nielen jazyka, ale aj umeleckej kultúry.
Ideológovia americký deskriptivizmus boli lingvisti L. Bloomfield a E. Sapir. Jazyk bol deskriptivistom prezentovaný ako súbor rečových výrokov, ktoré boli hlavným predmetom ich štúdia. Zamerali sa na pravidlá vedeckého opisu (odtiaľ názov) textov: štúdium organizácie, usporiadania a klasifikácie ich prvkov. Formalizácia analytických postupov v oblasti fonológie a morfológie (rozvoj princípov štúdia jazyka na rôznych úrovniach, distributívna analýza, metóda priamych konštituentov a pod.) viedla k formulovaniu všeobecných otázok lingvistického modelovania. Nepozornosť plánovania obsahu jazyka, ako aj paradigmatickej stránky jazyka neumožňovali deskriptivistom dostatočne plnohodnotne interpretovať jazyk ako systém.

Formovanie štruktúrnej lingvistiky na prelome 19. – 20. storočia. Štatistické metódy v učení sa jazykov. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia. Učenie sa jazyka metódami formálnej logiky. Vlastnosti strojového prekladu.

ÚVOD

Kapitola 1. História aplikácie matematických metód v lingvistike

1.1. Formovanie štruktúrnej lingvistiky na prelome 19. - 20. stor.

1.2. Aplikácia matematických metód v lingvistike v druhej polovici 20. storočia

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1. Strojový preklad

2.2.Štatistické metódy v učení sa jazykov

2.3. Učenie sa jazyka metódami formálnej logiky

2.4. Perspektívy aplikácie matematických metód v lingvistike

Záver

Literatúra

Dodatok 1. Ronald Schleifer. Ferdinand de Saussure

Príloha 2. Ferdinand de Saussure (preklad)

ÚVOD

V 20. storočí pretrváva trend interakcie a vzájomného prenikania rôznych oblastí poznania. Hranice medzi jednotlivými vedami sa postupne stierajú; pribúdajú odbory duševnej činnosti, ktoré sú „na križovatke“ humanitných, technických a prírodovedných poznatkov.

Ďalšou zjavnou črtou modernity je túžba študovať štruktúry a ich základné prvky. Preto čoraz väčšie miesto vo vedeckej teórii aj v praxi prislúcha matematike. Pri kontakte na jednej strane s logikou a filozofiou, na druhej strane so štatistikou (a následne aj so spoločenskými vedami) preniká matematika čoraz hlbšie do tých oblastí, ktoré boli dlho považované za čisto „humanitárne“, rozširujúce ich heuristický potenciál (odpoveď na otázku „koľko“ často pomôže zodpovedať otázky „čo“ a „ako“). Výnimkou nebola ani lingvistika.

Cieľom mojej práce v kurze je stručne poukázať na prepojenie matematiky s takou oblasťou lingvistiky, akou je lingvistika. Od roku 1950 sa matematika používa v lingvistike na vytvorenie teoretického aparátu na popis štruktúry jazykov (prirodzených aj umelých). Zároveň treba povedať, že takéto praktické uplatnenie pre seba nenašlo hneď. Spočiatku sa matematické metódy v lingvistike začali používať na objasnenie základných pojmov lingvistiky, s rozvojom výpočtovej techniky však takýto teoretický predpoklad začal nachádzať uplatnenie v praxi. Riešenie takých úloh, ako je strojový preklad, strojové vyhľadávanie informácií, automatické spracovanie textu, si vyžadovalo zásadne nový prístup k jazyku. Lingvisti stáli pred otázkou: ako sa naučiť reprezentovať jazykové vzory v podobe, v akej sa dajú priamo aplikovať na techniku. Pojem „matematická lingvistika“, ktorý je v súčasnosti populárny, sa vzťahuje na akýkoľvek lingvistický výskum, ktorý používa presné metódy (a pojem presné metódy vo vede vždy úzko súvisí s matematikou). Niektorí vedci z minulých rokov sa domnievajú, že samotný výraz nemožno povýšiť na pojem, pretože neznamená žiadnu špeciálnu „lingvistiku“, ale iba nový smer zameraný na zlepšenie, zvýšenie presnosti a spoľahlivosti metód výskumu jazyka. . Lingvistika využíva kvantitatívne (algebraické) aj nekvantitatívne metódy, čím sa približuje k matematickej logike a následne aj k filozofii a dokonca aj k psychológii. Dokonca aj Schlegel zaznamenal interakciu jazyka a vedomia a Ferdinand de Saussure, významný lingvista začiatku dvadsiateho storočia (o jeho vplyve na rozvoj matematických metód v lingvistike poviem neskôr), spojil štruktúru jazyka s jeho príslušnosťou. k ľuďom. Moderný bádateľ L. Perlovský ide ďalej, keď stotožňuje kvantitatívne charakteristiky jazyka (napr. počet rodov, prípadov) so zvláštnosťami národnej mentality (viac v časti 2.2 „Štatistické metódy v lingvistike“).

Interakcia matematiky a lingvistiky je mnohostranná téma a vo svojej práci sa nebudem venovať všetkým, ale predovšetkým jej aplikovaným aspektom.

Kapitola IHistória aplikácie matematických metód v lingvistike

1.1 Formovanie štruktúrnej lingvistikyna prelome XIX - XX storočia

Matematický opis jazyka je založený na myšlienke jazyka ako mechanizmu, ktorý siaha až k slávnemu švajčiarskemu lingvistovi zo začiatku dvadsiateho storočia Ferdinandovi de Saussure.

Počiatočným článkom jeho koncepcie je teória jazyka ako systému pozostávajúceho z troch častí (jazyk samotný je Jazyk, reč - heslo a rečová aktivita - Jazyk), v ktorom sa každé slovo (člen systému) nepovažuje samo o sebe, ale v spojení s inými členmi. Ako neskôr poznamenal ďalší významný lingvista, Dán Louis Hjelmslev, Saussure „bol prvý, kto požadoval štrukturálny prístup k jazyku, teda vedecký popis jazyka zaznamenávaním vzťahov medzi jednotkami“.

Saussure pochopil jazyk ako hierarchickú štruktúru a ako prvý nastolil problém hodnoty a významu jazykových jednotiek. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi.

Štrukturálna jednotka jazyka Saussure považovala slovo „znamenie“, v ktorom sa spájal zvuk a význam. Žiadny z týchto prvkov neexistuje jeden bez druhého: preto rodený hovorca chápe rôzne odtiene významu polysémantického slova ako samostatný prvok v štruktúrnom celku, v jazyku.

V teórii F. de Saussura tak možno vidieť interakciu lingvistiky na jednej strane so sociológiou a sociálnou psychológiou (treba podotknúť, že v tom istom období boli Husserlova fenomenológia, Freudova psychoanalýza, Einsteinova teória relativity sa rozvíjali experimenty s formou a obsahom v literatúre, hudbe a výtvarnom umení, na druhej strane s matematikou (pojem systemicita zodpovedá algebraickému konceptu jazyka). Takáto koncepcia zmenila koncepciu jazykovej interpretácie ako takú: Javy sa začali interpretovať nie vo vzťahu k príčinám ich vzniku, ale vo vzťahu k súčasnosti a budúcnosti. Interpretácia prestala byť nezávislá od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).

Fungovanie jazykového mechanizmu sa prejavuje prostredníctvom rečovej aktivity rodených hovoriacich. Výsledkom reči sú takzvané „správne texty“ – sekvencie rečových jednotiek, ktoré sa riadia určitými vzormi, z ktorých mnohé umožňujú matematický popis. Teória spôsobov opisu syntaktickej štruktúry sa zaoberá štúdiom metód matematického popisu správnych textov (predovšetkým viet). V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Na Západe Saussureove myšlienky rozvíjajú mladší súčasníci veľkého švajčiarskeho lingvistu: v Dánsku - mnou už spomínaný L. Hjelmslev, ktorý dal vznik algebraickej teórii jazyka vo svojom diele „Základy lingvistickej teórie“, v r. USA - E. Sapir, L. Bloomfield, C. Harris, v ČR ruský emigrant N. Trubetskoy.

Štatistickými zákonitosťami v štúdiu jazyka sa začal zaoberať nik iný ako zakladateľ genetiky Georg Mendel. Až v roku 1968 filológovia zistili, že ho v posledných rokoch života fascinovalo štúdium jazykových javov pomocou metód matematiky. Mendel priniesol túto metódu do lingvistiky z biológie; v 90. rokoch len tí najodvážnejší lingvisti a biológovia tvrdili uskutočniteľnosť takejto analýzy. V archíve kláštora sv. Tomáša v Brne, ktorého opátom bol Mendel, sa našli listy so stĺpcami priezvisk zakončenými na „mann“, „bauer“, „mayer“ a s niektorými zlomkami a výpočtami. Mendel v snahe odhaliť formálne zákonitosti pôvodu rodových mien robí zložité výpočty, v ktorých berie do úvahy počet samohlások a spoluhlások v nemeckom jazyku, celkový počet slov, ktoré zvažuje, počet priezvisk, počet mien, počet hlások a spoluhlások. atď.

U nás sa štrukturálna lingvistika začala rozvíjať približne v rovnakom období ako na Západe – na prelome 19. – 20. storočia. Súčasne s F. de Saussurom koncept jazyka ako systému rozvinuli vo svojich prácach profesori Kazanskej univerzity F.F. Fortunatov a I.A. Baudouin de Courtenay. Ten si dlho korešpondoval s de Saussurom, respektíve ženevská a kazaňská lingvistická škola navzájom spolupracovali. Ak možno Saussura nazvať ideológom „exaktných“ metód v lingvistike, potom Baudouin de Courtenay položil praktické základy ich aplikácie. Bol prvým, kto oddelil lingvistiku (napr presné veda využívajúca štatistické metódy a funkčnú závislosť) z filológie (spoločenstvo humanitných disciplín, ktoré študujú duchovnú kultúru prostredníctvom jazyka a reči). Samotný vedec veril, že „lingvistika môže byť v blízkej budúcnosti užitočná, iba ak sa oslobodí od povinného spojenia s filológiou a literárnou históriou“. Fonológia sa stala „skúšobnou pôdou“ pre zavedenie matematických metód do lingvistiky – zvuky ako „atómy“ jazykového systému, majúce obmedzený počet ľahko merateľných vlastností, boli najvhodnejším materiálom pre formálne, rigorózne metódy opisu. Fonológia popiera existenciu významu zvuku, preto bol v štúdiách eliminovaný „ľudský“ faktor. V tomto zmysle sú fonémy ako fyzické alebo biologické objekty.

Fonémy ako najmenšie jazykové prvky prijateľné pre vnímanie predstavujú samostatnú sféru, samostatnú „fenomenologickú realitu“. Napríklad v angličtine môže byť zvuk „t“ vyslovovaný inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Hlavné je, že fonéma bude plniť svoju hlavnú – zmysluplnú – funkciu. Okrem toho rozdiely medzi jazykmi sú také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty rovnakej fonémy (ako anglické „t“, vyslovované s aspiráciou alebo bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V 20-tych až 30-tych rokoch 20. storočia, po Saussure, Jacobson a N.S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto znaky vychádzajú zo stavby rečových orgánov – jazyka, zubov, hlasiviek. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „Existujú len rozdiely v jazyku“. Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov aj prostriedkom komunikácie a tieto dve funkcie sa nikdy nezhodujú. Môžeme si všimnúť striedanie formy a obsahu: jazykové kontrasty definujú jeho štruktúrne jednotky a tieto jednotky spolupôsobia a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku distinktívne črty tvoria fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do morfém, morfémy - do slov, slová - do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac než len súčet jeho častí.

Saussure navrhol myšlienku novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá študovala úlohu znakov v spoločnosti. Saussure nazval túto vedu semiológiou (z gréckeho "semeion" - znak). „Veda“ semiotiky, ktorá sa rozvíjala vo východnej Európe v 20. a 30. rokoch 20. storočia a v 50. a 60. rokoch v Paríži, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (alebo formulované) pomocou týchto štruktúr. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola v mnohých ohľadoch protikladom racionalizmu vo svojej lingvistickej analýze: bol pokusom študovať v systéme problém „pravdepodobnosti“ v jazyku. Takýto výskum pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, nie zdrojom života básne“. Báseň slúži na výmenu zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia sa nevyjadruje len slovami, ale aj tým, čo tieto slová vyvolávajú, vymyká sa kontrole vedomia a závisí len od zákony jazyka“ (pozri . Príloha 1).

Saussureho pokus o štúdium vlastných mien v neskororímskej poézii zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnú povahu znakov, ako aj formálnu podstatu Saussureovej lingvistiky, ktorá vylučuje možnosť analýzy významu. Todorov prichádza k záveru, že dnes sa Saussureove diela zdajú byť mimoriadne konzistentné vo svojej neochote študovať symboly javu, ktoré majú jasne definovaný význam [Príloha 1]. Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu knihy Nibelungov definuje symboly len preto, aby ich priradil k chybným údajom: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semiológia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Medzi koncepciami devätnásteho storočia založenými na histórii a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách na jednej strane a na druhej strane štrukturalistickými koncepciami, ktoré stierajú protiklad medzi formou a obsahom (subjektom a objektom) , význam a pôvod v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike - spisy Ferdinanda de Saussura o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.

Na prvom medzinárodnom kongrese lingvistov v Haagu v roku 1928 boli zastúpení aj ruskí vedci. S. Kartsevsky, R. Yakobson a N. Trubetskoy vypracovali správu, ktorá skúmala hierarchickú štruktúru jazyka – v duchu najmodernejších myšlienok zo začiatku minulého storočia. Jakobson vo svojich spisoch rozvinul Saussurove myšlienky, že základné prvky jazyka by sa mali študovať predovšetkým v súvislosti s ich funkciami, a nie s dôvodmi ich výskytu.

Žiaľ, po nástupe Stalina k moci v roku 1924 je ruská lingvistika, podobne ako mnohé iné vedy, hodená späť. Mnohí talentovaní vedci boli nútení emigrovať, boli vyhnaní z krajiny alebo zomreli v táboroch. Až od polovice 50. rokov je možný určitý pluralizmus teórií – viac o tom v časti 1.2.

1.2 Aplikácia matematických metód v lingvistike v druhej polovici 20.

Do polovice dvadsiateho storočia sa vytvorili štyri svetové lingvistické školy, z ktorých každá sa ukázala byť predchodcom určitej „presnej“ metódy. Leningradská fonologická škola(jeho predkom bol žiak Baudouina de Courtenay L.V. Shcherba) použil psycholingvistický experiment založený na analýze reči rodených hovoriacich ako hlavné kritérium na zovšeobecnenie zvuku vo forme fonémy.

Vedci Pražský lingvistický krúžok, konkrétne - jej zakladateľ N.S. Trubetskoy, ktorý emigroval z Ruska, rozvinul teóriu opozícií – sémantickú štruktúru jazyka opísali ako súbor opozične vybudovaných sémantických jednotiek – sem. Táto teória sa uplatnila pri štúdiu nielen jazyka, ale aj umeleckej kultúry.

Ideológovia americký deskriptivizmus boli lingvisti L. Bloomfield a E. Sapir. Jazyk bol deskriptivistom prezentovaný ako súbor rečových výrokov, ktoré boli hlavným predmetom ich štúdia. Zamerali sa na pravidlá vedeckého opisu (odtiaľ názov) textov: štúdium organizácie, usporiadania a klasifikácie ich prvkov. Formalizácia analytických postupov v oblasti fonológie a morfológie (rozvoj princípov štúdia jazyka na rôznych úrovniach, distributívna analýza, metóda priamych konštituentov a pod.) viedla k formulovaniu všeobecných otázok lingvistického modelovania. Nepozornosť plánovania obsahu jazyka, ako aj paradigmatickej stránky jazyka neumožňovali deskriptivistom dostatočne plnohodnotne interpretovať jazyk ako systém.

V 60. rokoch sa rozvinula teória formálnych gramatík, ktorá vznikla najmä vďaka práci amerického filozofa a lingvistu N. Chomského. Je právom považovaný za jedného z najznámejších moderných vedcov a osobností verejného života, venuje sa mu množstvo článkov, monografií a dokonca aj celovečerný dokument. Pod názvom zásadne nového spôsobu opisu syntaktickej štruktúry vynájdenej Chomským - generatívnej (generatívnej) gramatiky - bol zodpovedajúci trend v lingvistike tzv. generativizmus.

Chomsky, potomok prisťahovalcov z Ruska, študoval od roku 1945 lingvistiku, matematiku a filozofiu na Pensylvánskej univerzite, pričom bol silne ovplyvnený svojím učiteľom Zeligom Harrisom – podobne ako Harris aj Chomsky považoval a stále považuje svoje politické názory za blízke anarchizmu (stále je známy ako kritik existujúceho politického systému USA a ako jeden z duchovných vodcov antiglobalizmu).

Chomského prvé veľké vedecké dielo, diplomová práca „Morfológia modernej hebrejčiny » (1951) zostal nepublikovaný. Chomsky získal doktorát na Pensylvánskej univerzite v roku 1955, ale veľa z výskumu, z ktorého vychádzala jeho dizertačná práca (úplne publikovaná až v roku 1975 pod názvom Logická štruktúra lingvistickej teórie) a jeho prvá monografia Syntaktické štruktúry (1957, Rus. trans 1962) sa uskutočnil na Harvardskej univerzite v rokoch 1951-1955. V tom istom roku 1955 sa vedec presťahoval na Massachusetts Institute of Technology, kde sa v roku 1962 stal profesorom.

Chomského teória prešla niekoľkými fázami svojho vývoja.

V prvej monografii „Syntaktické štruktúry“ vedec predstavil jazyk ako mechanizmus na generovanie nekonečného súboru viet pomocou konečného súboru gramatických prostriedkov. Na opísanie jazykových vlastností navrhol koncepty hlbokých (skrytých pred priamym vnímaním a generovaných systémom rekurzívnych, t.j. opakovane aplikovateľných pravidiel) a povrchových (priamo vnímaných) gramatických štruktúr, ako aj transformácií, ktoré popisujú prechod. od hlbokých štruktúr po povrchové. Jednej hĺbkovej štruktúre môže zodpovedať niekoľko povrchových štruktúr (napríklad pasívna štruktúra Dekrét podpisuje prezident odvodené z rovnakej hlbokej štruktúry ako aktívny konštrukt Prezident dekrét podpisuje) a naopak (teda nejednoznačnosť matka miluje dcéru opísané ako výsledok zhody povrchových štruktúr, ktoré sa vracajú k dvom rozdielnym hlbokým, z ktorých jedna je matkou tá, ktorá miluje dcéru, a druhá tá, ktorú miluje dcéra).

Chomského štandardná teória sa považuje za model „Aspektov“ uvedený v Chomského knihe „Aspekty teórie syntaxe“. V tomto modeli boli po prvýkrát do formálnej teórie zavedené pravidlá sémantickej interpretácie, ktoré pripisovali význam hlbokým štruktúram. V Aspektoch sa jazyková kompetencia stavia do protikladu k používaniu jazyka (výkonu), preberá sa takzvaná Katz-Postalova hypotéza o zachovaní významu pri transformácii, v súvislosti s ktorou je vylúčený koncept fakultatívnej transformácie a aparát tzv. zavádzajú sa syntaktické znaky popisujúce lexikálnu kompatibilitu.

Chomsky v 70. rokoch pracoval na teórii riadenia a väzby (GB-teória – zo slov. vláda a viazanie) je všeobecnejší ako predchádzajúci. Vedec v ňom upustil od špecifických pravidiel, ktoré popisujú syntaktické štruktúry konkrétnych jazykov. Všetky transformácie boli nahradené jednou univerzálnou transformáciou pohybu. V rámci GB teórie existujú aj súkromné ​​moduly, z ktorých každý zodpovedá za svoju časť gramatiky.

Už nedávno, v roku 1995, Chomsky predložil minimalistický program, kde je ľudský jazyk opísaný ako strojový jazyk. Toto je len program - nie model alebo teória. Chomsky v nej identifikuje dva hlavné subsystémy ľudského jazykového aparátu: lexikón a výpočtový systém, ako aj dve rozhrania – fonetické a logické.

Chomského formálne gramatiky sa stali klasickými pre popis nielen prirodzených, ale aj umelých jazykov - najmä programovacích jazykov. Rozvoj štruktúrnej lingvistiky v druhej polovici 20. storočia možno právom považovať za „chomskú revolúciu“.

Moskovská fonologická škola, ktorej predstaviteľmi boli A.A. Reformatsky, V.N. Sidorov, P.S. Kuznecov, A.M. Suchotin, R.I. Avanesov, použil podobnú teóriu na štúdium fonetiky. Postupne sa začínajú uplatňovať „exaktné“ metódy nielen vo fonetike, ale aj v syntaxi. Lingvisti aj matematici u nás aj v zahraničí začínajú študovať štruktúru jazyka. V 50. a 60. rokoch 20. storočia sa v ZSSR začala nová etapa interakcie medzi matematikou a lingvistikou spojená s rozvojom systémov strojového prekladu.

Podnetom na začatie týchto prác u nás bol prvý vývoj v oblasti strojového prekladu v Spojených štátoch (hoci prvé mechanizované prekladacie zariadenie P. P. Smirnov-Troyansky bolo vynájdené v ZSSR už v roku 1933, keďže bolo primitívne , sa nerozšírilo). V roku 1947 prišli A. Butt a D. Britten s kódom na preklad slov po slove pomocou počítača, o rok neskôr R. Richens navrhol pravidlo rozdeľovania slov na kmene a koncovky v strojovom preklade. Tie roky boli úplne iné ako dnes. Boli to veľmi veľké a drahé stroje, ktoré zaberali celé miestnosti a na údržbu si vyžadovali veľký tím inžinierov, operátorov a programátorov. V podstate sa tieto počítače používali na vykonávanie matematických výpočtov pre potreby vojenských inštitúcií - nové v matematike, fyzike a technike slúžili predovšetkým vojenským záležitostiam. V raných fázach bol vývoj MP aktívne podporovaný armádou, s tým všetkým (v podmienkach studenej vojny) sa v USA rozvíjal rusko-anglický smer a v ZSSR smer anglo-ruský.

V januári 1954 sa na Massachusettskej technickej univerzite uskutočnil „Georgetownský experiment“ – prvá verejná ukážka prekladu z ruštiny do angličtiny na stroji IBM-701. Abstrakt správy o úspešnom absolvovaní experimentu, ktorú vytvoril D.Yu. Panov, objavil sa v RJ "Matematika", 1954, č. 10: "Preklad z jedného jazyka do druhého pomocou stroja: správa o prvom úspešnom teste."

D. Yu.Panov (v tom čase riaditeľ Ústavu vedeckých informácií - INI, neskôr VINITI) prilákal I. K. Belskaja, ktorý neskôr viedol skupinu strojového prekladu na Ústave presnej matematiky a počítačového inžinierstva Akadémie vied ZSSR. práca na strojovom preklade. Koncom roku 1955 sa datujú prvé skúsenosti s prekladom z angličtiny do ruštiny pomocou stroja BESM. Programy pre BESM zostavil N.P. Trifonov a L.N. Korolev, ktorého doktorandská práca bola venovaná metódam vytvárania slovníkov pre strojový preklad.

Paralelne prebiehali práce na strojovom preklade na Oddelení aplikovanej matematiky Matematického inštitútu Akadémie vied ZSSR (teraz Inštitút aplikovanej matematiky M. V. Keldysha Ruskej akadémie vied). Z iniciatívy matematika A.A. Ljapunov. Zapojil O.S. Kulagin a jej študenti T.D. Wentzel a N.N. Ricco. Myšlienky Ljapunova a Kulaginy o možnosti využitia technológie na preklad z jedného jazyka do druhého boli publikované v časopise Nature, 1955, č. Od konca roku 1955 k nim pribudol T.N. Moloshnaya, ktorý potom začal samostatnú prácu na anglicko-ruskom prekladovom algoritme.

R. Frumkina, ktorý sa v tom čase zaoberal prekladovým algoritmom zo španielčiny, pripomína, že v tejto fáze práce bolo ťažké urobiť nejaké konzistentné kroky. Oveľa častejšie som sa musel riadiť heuristickou skúsenosťou – vlastnou alebo kolegami.

Zároveň bola prvá generácia systémov strojového prekladu veľmi nedokonalá. Všetky boli založené na sekvenčných prekladových algoritmoch „slovo po slove“, „fráza po fráze“ – sémantické spojenia medzi slovami a vetami neboli nijako brané do úvahy. Ide napríklad o tieto vety: John hľadal svoju krabicu na hračky.Nakoniec to našiel. Krabička bola v pere.John bol veľmi šťastný. (John hľadal svoju krabicu s hračkami. Nakoniec ju našiel. Krabica bola v ohrádke. John bol veľmi šťastný.). „Pero“ v tomto kontexte nie je „pero“ (nástroj na písanie), ale „ohrádka“ ( hracie pero). Znalosť synoným, antoným a prenesených významov je ťažké zadať do počítača. Sľubným smerom bol vývoj počítačových systémov zameraných na využitie ľudského prekladača.

Postupom času boli systémy priameho prekladu nahradené T-systémami (z anglického slova "transfer" - transformácia), v ktorých sa preklad uskutočňoval na úrovni syntaktických štruktúr. Algoritmy T-systémov využívali mechanizmus, ktorý umožňoval zostaviť syntaktickú štruktúru podľa gramatických pravidiel jazyka vstupnej vety (podobne ako sa cudzí jazyk vyučuje na strednej škole) a následne syntetizovať výstupnú vetu. transformáciou syntaktickej štruktúry a dosadením potrebných slov zo slovníka.

Ljapunov hovoril o preklade extrahovaním významu preloženého textu a jeho prezentáciou v inom jazyku. Za najdokonalejší sa stále považuje prístup k budovaniu systémov strojového prekladu založený na získavaní sémantickej reprezentácie vstupnej vety sémantickou analýzou a syntéze vstupnej vety podľa získanej sémantickej reprezentácie. Takéto systémy sa nazývajú I-systémy (od slova „interlingua“). Zároveň úloha ich vytvorenia, zasadená koncom 50. a začiatkom 60. rokov, nie je dodnes úplne vyriešená, a to aj napriek úsiliu Medzinárodnej federácie IFIP - svetovej komunity vedcov v oblasti spracovania informácií. .

Vedci premýšľali o tom, ako formalizovať a zostaviť algoritmy na prácu s textami, aké slovníky by sa mali vkladať do stroja, aké lingvistické vzory by sa mali používať pri strojovom preklade. Tradičná lingvistika takéto predstavy nemala – nielen z hľadiska sémantiky, ale ani z hľadiska syntaxe. V tom čase neexistovali zoznamy syntaktických konštrukcií pre žiadny jazyk, neboli skúmané podmienky ich kompatibility a zameniteľnosti, neboli vyvinuté pravidlá na zostavovanie veľkých jednotiek syntaktickej štruktúry z menších konštitučných prvkov.

Potreba vytvorenia teoretických základov strojového prekladu viedla k formovaniu a rozvoju matematickej lingvistiky. Vedúcu úlohu v tejto veci v ZSSR zohrali matematici A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, lingvisti V.Yu. Rosenzweig, P.S. Kuznecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginova dizertačná práca bola venovaná štúdiu formálnej teórie gramatík (súčasne s N. Khomským v USA), Kuznecov predložil úlohu axiomatizácie lingvistiky, ktorá siaha až k prácam F.F. Fortunatov.

Dňa 6. mája 1960 bola prijatá vyhláška Prezídia Akadémie vied ZSSR „O vývoji štrukturálnych a matematických metód štúdia jazyka“ a na Jazykovednom ústave a Ústave sv. ruský jazyk. Od roku 1960 začali popredné humanitárne univerzity v krajine - Filologická fakulta Moskovskej štátnej univerzity, Leninrad, Novosibirské univerzity, Moskovský štátny inštitút cudzích jazykov - školiť personál v oblasti automatického spracovania textu.

Práce o strojovom preklade tohto obdobia, nazývané „klasické“, sú zároveň viac teoretické ako praktické. Nákladovo efektívne systémy strojového prekladu sa začali vytvárať až v osemdesiatych rokoch minulého storočia. O tom budem hovoriť neskôr v časti 2.1, Strojový preklad.

60. - 70. roky 20. storočia zahŕňajú hlboký teoretický vývoj využívajúci metódy teórie množín a matematickej logiky, ako je teória poľa a teória fuzzy množín.

Autorom teórie poľa v lingvistike bol sovietsky básnik, prekladateľ a lingvista V.G. Admoni. Svoju teóriu spočiatku rozvíjal na základe nemeckého jazyka. Pre Admoniho pojem „pole“ označuje ľubovoľnú neprázdnu množinu jazykových prvkov (napríklad „lexikálne pole“, „sémantické pole“).

Štruktúra poľa je heterogénna: pozostáva z jadra, ktorého prvky majú kompletný súbor znakov, ktoré definujú množinu, a z periférie, ktorej prvky môžu mať obe znaky danej množiny (nie všetky) a susedných. Uvediem príklad ilustrujúci toto tvrdenie: napríklad v angličtine je pole zložených slov („day-dream“ – „sen“ ťažko oddeliteľné od oblasti fráz („slzný plyn“ – „slzný plyn“)) .

Už vyššie spomínaná teória fuzzy množín úzko súvisí s teóriou poľa. V ZSSR jazykovedci V.G. Admoni, I.P. Ivanová, G.G. Pochentsov, jeho predkom však bol americký matematik L. Zadeh, ktorý v roku 1965 publikoval článok „Fuzzy Logic“. Po matematickom zdôvodnení teórie fuzzy množín ich Zade zvažoval na základe lingvistického materiálu.

V tejto teórii nehovoríme ani tak o príslušnosti prvkov k danej množine (Aa), ale o miere tejto príslušnosti (Aa), keďže periférne prvky môžu v tej či onej miere patriť do viacerých polí. Zade (Lofti-zade) bol rodák z Azerbajdžanu, do 12 rokov mal prax v komunikácii v štyroch jazykoch – azerbajdžančine, ruštine, angličtine a perzštine – a používal tri rôzne abecedy: cyriliku, latinku, arabčinu. Keď sa vedca pýtajú, čo je spoločné medzi teóriou fuzzy množín a lingvistikou, nepopiera toto spojenie, ale objasňuje: „Nie som si istý, či štúdium týchto jazykov malo veľký vplyv na moje myslenie. Ak to tak bolo, tak len podvedome. Zadeh v mladosti študoval na presbyteriánskej škole v Teheráne a po druhej svetovej vojne emigroval do USA. "Otázkou nie je, či som Američan, Rus, Azerbajdžan alebo niekto iný," povedal v jednom z rozhovorov, "som formovaný všetkými týmito kultúrami a národmi a medzi každým z nich sa cítim celkom dobre." V týchto slovách je niečo podobné tomu, čo charakterizuje teóriu fuzzy množín – odklon od jednoznačných definícií a ostrých kategórií.

U nás sa v 70. rokoch prekladali a študovali diela západných jazykovedcov 20. storočia. I.A. Melčuk preložil diela N. Chomského do ruštiny. NA. Slyusareva vo svojej knihe „Teória F. de Saussura vo svetle modernej lingvistiky“ spája postuláty Saussurovho učenia s aktuálnymi problémami lingvistiky 70. rokov. Existuje tendencia k ďalšej matematizácii lingvistiky. Popredné domáce univerzity školia personál v odbore „Matematická (teoretická, aplikovaná) lingvistika“. Zároveň na Západe dochádza k prudkému skoku vo vývoji výpočtovej techniky, ktorá si vyžaduje stále nové a nové jazykové základy.

V 80. rokoch 20. storočia profesor Ústavu orientalistiky Akadémie vied Yu.K. Lekomtsev pri analýze jazyka lingvistiky prostredníctvom analýzy schém, tabuliek a iných typov zápisov používaných v lingvistických popisoch považuje matematické systémy za vhodné na tieto účely (najmä systémy maticovej algebry).

V priebehu dvadsiateho storočia teda dochádzalo k zbližovaniu exaktných a humanitných vied. Interakcia matematiky a lingvistiky stále viac nachádzala praktické aplikácie. Viac o tom v ďalšej kapitole.

Kapitola 2. Vybrané príklady využitia matematiky v lingvistike

2.1 Strojový preklad

Myšlienka prekladu z jedného jazyka do druhého pomocou univerzálneho mechanizmu vznikla niekoľko storočí predtým, ako sa začal prvý vývoj v tejto oblasti - v roku 1649 René Descartes navrhol myšlienku jazyka, v ktorom by boli ekvivalentné myšlienky rôzne jazyky by boli vyjadrené jedným symbolom. Prvé pokusy o realizáciu tejto myšlienky v 30. – 40. rokoch 20. storočia, začiatok teoretického rozvoja v polovici storočia, zdokonaľovanie prekladateľských systémov pomocou techniky v 70. – 80. rokoch 20. storočia, prudký rozvoj prekladateľskej techniky v posl. desaťročie – to sú fázy vývoja strojového prekladu ako odvetvia. Počítačová lingvistika ako veda vyrástla z diel o strojovom preklade.

S rozvojom výpočtovej techniky koncom 70. a začiatkom 80. rokov si výskumníci stanovili reálnejšie a nákladovo efektívnejšie ciele – stroj sa nestal konkurentom (ako sa doteraz predpokladalo), ale pomocníkom ľudského prekladateľa. Strojový preklad prestáva slúžiť výlučne vojenským úlohám (všetky sovietske a americké vynálezy a výskumy zamerané predovšetkým na ruštinu a angličtinu tak či onak prispeli k studenej vojne). V roku 1978 sa cez prepojenú sieť Arpa prenášali slová v prirodzenom jazyku a o šesť rokov neskôr sa v USA objavili prvé programy na preklad mikropočítačov.

V 70. rokoch Komisia Európskych spoločenstiev kupuje anglicko-francúzsku verziu počítačového prekladača Systran, pričom objednáva aj francúzsko-anglickú a taliansko-anglickú verziu a systém prekladov z ruštiny do angličtiny, ktorý používajú americké ozbrojené sily. Takto boli položené základy projektu EUROTRA.

O oživení strojového prekladu v 70-80 rokoch. Svedčia o tom tieto skutočnosti: Komisia Európskych spoločenstiev (CEC) kupuje anglicko-francúzsku verziu Systran, ako aj prekladový systém z ruštiny do angličtiny (posledný vyvinutý po správe ALPAC a naďalej ho používa US Air Sila a NASA); okrem toho CEC nariaďuje vývoj francúzsko-anglickej a taliansko-anglickej verzie. Súčasne dochádza k rýchlemu rozmachu činností strojového prekladu v Japonsku; v USA Panamerická zdravotnícka organizácia (PAHO) nariaďuje rozvoj španielsko-anglického smeru (systém SPANAM); Americké letectvo financuje vývoj systému strojového prekladu v Lingvistic Research Center na Texaskej univerzite v Austine; Skupina TAUM v Kanade dosahuje pozoruhodný pokrok vo vývoji svojho systému METEO (meteorologický preklad). Množstvo projektov začalo v 70. a 80. rokoch. sa následne rozvinuli do plnohodnotných komerčných systémov.

V období rokov 1978-93 sa na výskum v oblasti strojového prekladu minulo 20 miliónov dolárov v USA, 70 miliónov v Európe a 200 miliónov v Japonsku.

Jednou z noviniek je technológia TM (prekladová pamäť), ktorá funguje na princípe akumulácie: počas procesu prekladu sa ukladá pôvodný segment (veta) a jej preklad, výsledkom čoho je vytvorenie lingvistickej databázy; ak sa v novo preloženom texte nájde identický alebo podobný segment, zobrazí sa spolu s prekladom a údajom o percentuálnej zhode. Prekladateľ následne urobí rozhodnutie (upraví, zamietne alebo prijme preklad), ktorého výsledok systém uloží, takže nie je potrebné prekladať tú istú vetu dvakrát. Známy komerčný systém založený na technológii TM je v súčasnosti vyvinutý systémom TRADOS (založený v roku 1984).

V súčasnosti niekoľko desiatok spoločností vyvíja systémy komerčného strojového prekladu vrátane: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softvér; Linguistica b.v. a ďalšie Teraz môžete využívať služby automatických prekladačov priamo na webe: alphaWorks; Online prekladač PROMT, LogoMedia.net, prekladateľská služba Babel Fish od AltaVista; InfiniT.com; Preklad internetu.

Komerčne efektívne prekladateľské systémy sa objavili v druhej polovici 80. rokov aj u nás. Rozšíril sa samotný pojem strojového prekladu (začal zahŕňať „vytváranie množstva automatických a automatizovaných systémov a zariadení, ktoré automaticky alebo poloautomaticky vykonávajú celý prekladateľský cyklus alebo jednotlivé úlohy v dialógu s človekom“) a vládne prostriedky na rozvoj tohto odvetvia sa zvýšili.

Hlavnými jazykmi domácich prekladateľských systémov sa stali ruština, angličtina, nemčina, francúzština a japončina. All-Union Translation Center (VTsP) vyvinulo systém na preklad z angličtiny a nemčiny do ruštiny na počítači ES-1035-ANRAP. Pozostával z troch slovníkov – vstupného anglického a nemeckého a výstupného ruského – pod jedným softvérom. Existovalo niekoľko vzájomne zameniteľných odborných slovníkov – pre výpočtovú techniku, programovanie, rádioelektroniku, strojárstvo, poľnohospodárstvo, hutníctvo. Systém mohol pracovať v dvoch režimoch – automatickom a interaktívnom, kedy sa na obrazovke zobrazoval zdrojový text a preklad na frázu, ktorú si človek mohol upraviť. Rýchlosť prekladu textu do ANRAP (od začiatku písania až po koniec tlače) bola približne 100 strán za hodinu.

V roku 1989 vznikla rodina komerčných prekladateľov typu SPRINT, pracujúcich s ruským, anglickým, nemeckým a japonským jazykom. Ich hlavnou výhodou bola kompatibilita s IBM PC - domáce systémy strojového prekladu tak dosiahli medzinárodnú úroveň kvality. Súčasne sa vyvíja systém strojového prekladu z francúzštiny do ruštiny FRAP, ktorý zahŕňa 4 stupne analýzy textu: grafematickú, morfologickú, syntaktickú a sémantickú. V LGPI ich. Herzen, prebiehali práce na štvorjazyčnom (anglický, francúzsky, španielsky, ruský) systém SILOD-MP (v priemyselnom režime sa používali anglicko-ruské a francúzsko-ruské slovníky.

Pre špecializovaný preklad textov z elektrotechniky existoval systém ETAP-2. Analýza vstupného textu v nej prebiehala v dvoch rovinách – morfologickej a syntaktickej. Slovník ETAP-2 obsahoval asi 4 tisíc hesiel; štádium transformácie textu - asi 1000 pravidiel (96 všeobecných, 342 súkromných, zvyšok tvorí slovník). Toto všetko zabezpečilo uspokojivú kvalitu prekladu (povedzme, názov patentu „Optical phase grid organization and coupling device having a take management“ bol preložený ako „Zariadenie s optickou fázovou mriežkou a spojovacie zariadenie s takýmto zariadením“ – napriek tautológia, význam je zachovaný).

V Minskom pedagogickom ústave cudzích jazykov bol na základe anglicko-ruského slovníka slovných tvarov a fráz vynájdený systém strojového prekladu názvov, v Ústave orientalistiky Akadémie vied systém pre preklad. z japončiny do ruštiny. Prvá automatická slovníková a terminologická služba (SLOTHERM) pre výpočtovú techniku ​​a programovanie, vytvorená na Moskovskom výskumnom ústave automatizačných systémov, obsahovala približne 20 000 výrazov vo výkladovom slovníku a špeciálnych slovníkoch pre lingvistický výskum.

Systémy strojového prekladu sa postupne začali využívať nielen na určený účel, ale aj ako dôležitá súčasť systémov automatického učenia (na výučbu prekladu, kontrolu pravopisu a gramatických znalostí).

90. roky so sebou priniesli prudký rozvoj trhu s PC (od stolných po vreckové) a informačných technológií, rozšírené používanie internetu (ktorý sa stáva viac medzinárodným a viacjazyčným). To všetko spôsobilo, že ďalší vývoj automatizovaných prekladateľských systémov bol žiadaný. Od začiatku 90. rokov 20. storočia Na trh PC systémov vstupujú aj domáci vývojári.

V júli 1990 bol na PC Fóre v Moskve predstavený prvý komerčný systém strojového prekladu v Rusku s názvom PROMT (PROgrammer's Machine Translation) V roku 1991 ZAO [!!! V súlade s federálnym zákonom-99 z 05.05. bola nahradená neverejnou akciovou spoločnosťou] „Proekt MT“ a už v roku 1992 vyhrala spoločnosť PROMT súťaž NASA na dodávku systémov MP (PROMT bola jedinou neamerickou spoločnosťou v tejto súťaži). celá rodina systémov pod novým názvom STYLUS na preklady z angličtiny, nemčiny, francúzštiny, taliančiny a španielčiny do ruštiny a z ruštiny do angličtiny a v roku 1993 na základe STYLUS vznikol prvý systém strojového prekladu na svete pre Windows STYLUS 2.0 pre Windows 3.X/95/NT bola uvedená na trh a v rokoch 1995-1996 bola predstavená tretia generácia systémov strojového prekladu, plne 32-bitový STYLUS 3.0 pre Windows 95/NT, súčasne s vývojom úplne nový, prvý na svete rusko-nemecký a rusko-francúzsky systém strojového prekladu.

V roku 1997 bola podpísaná dohoda s francúzskou spoločnosťou Softissimo o vytvorení prekladových systémov z francúzštiny do nemčiny a angličtiny a naopak a v decembri tohto roku bol vydaný prvý nemecko-francúzsky prekladateľský systém na svete. V tom istom roku spoločnosť PROMT vydala systém implementovaný pomocou technológie Gigant, ktorý podporuje niekoľko jazykových smerov v jednom shellu, ako aj špeciálny prekladač pre prácu na internete WebTranSite.

V roku 1998 vyšla celá plejáda programov pod novým názvom PROMT 98. O rok neskôr PROMT vydal dva nové produkty: unikátny softvérový balík pre prácu na internete - PROMT Internet a prekladač pre firemné poštové systémy - PROMT Mail Prekladateľ. V novembri 1999 bol PROMT uznaný ako najlepší systém strojového prekladu testovaný francúzskym časopisom PC Expert, čím prekonal svojich konkurentov o 30 percent. Pre firemných klientov boli vyvinuté aj špeciálne serverové riešenia - podnikový prekladový server PROMT Translation Server (PTS) a internetové riešenie PROMT Internet Translation Server (PITS). V roku 2000 PROMT aktualizoval celý svoj rad softvérových produktov vydaním novej generácie systémov MT: PROMT Translation Office 2000, PROMT Internet 2000 a Magic Gooddy 2000.

Online preklad s podporou systému PROMT sa používa na mnohých domácich a zahraničných stránkach: Online Translator PROMT, InfiniT.com, Translate.Ru, Lycos atď., Ako aj v inštitúciách rôznych profilov na preklady obchodných dokumentov, články a listy (existujú prekladateľské systémy zabudované priamo v programe Outlook Express a iných e-mailových klientoch).

V súčasnosti sa objavujú nové technológie strojového prekladu založené na využívaní systémov umelej inteligencie a štatistických metód. O druhom - v ďalšej časti.

2.2 Extrajazykových metód

Značná pozornosť sa v modernej lingvistike venuje štúdiu jazykových javov pomocou metód kvantitatívnej matematiky. Kvantitatívne údaje často pomáhajú hlbšie pochopiť skúmané javy, ich miesto a úlohu v systéme súvisiacich javov. Odpoveď na otázku „koľko“ pomáha odpovedať na otázky „čo“, „ako“, „prečo“ – taký je heuristický potenciál kvantitatívnej charakteristiky.

Štatistické metódy zohrávajú významnú úlohu vo vývoji systémov strojového prekladu (pozri časť 2.1). V štatistickom prístupe sa problém prekladu zvažuje z hľadiska hlučného kanála. Predstavte si, že potrebujeme preložiť vetu z angličtiny do ruštiny. Princíp noisy channel nám ponúka nasledujúce vysvetlenie vzťahu medzi anglickou a ruskou vetou: anglická veta nie je nič iné ako ruská veta skomolená nejakým hlukom. Aby sme mohli obnoviť pôvodnú ruskú vetu, potrebujeme vedieť, čo ľudia zvyčajne hovoria v ruštine a ako sú ruské frázy skreslené do angličtiny. Preklad sa uskutočňuje vyhľadávaním takej ruskej vety, ktorá maximalizuje súčin bezpodmienečnej pravdepodobnosti ruskej vety a pravdepodobnosti anglickej vety (originálu) danej ruskej vety. Podľa Bayesovej vety je táto ruská veta najpravdepodobnejším prekladom angličtiny:

kde e je prekladová veta a f je pôvodná veta

Potrebujeme teda zdrojový model a model kanála alebo jazykový model a model prekladu. Jazykový model musí priradiť skóre pravdepodobnosti akejkoľvek vete v cieľovom jazyku (v našom prípade ruštine) a prekladový model pôvodnej vete. (pozri tabuľku 1)

Vo všeobecnosti systém strojového prekladu funguje v dvoch režimoch:

1. Systémové školenie: vezme sa trénovací korpus paralelných textov a pomocou lineárneho programovania sa hľadajú také hodnoty prekladových korešpondenčných tabuliek, ktoré maximalizujú pravdepodobnosť (napríklad) ruskej časti korpusu s dostupnou angličtinou podľa na vybraný model prekladu. Model ruského jazyka je postavený na ruskej časti toho istého korpusu.

2. Využitie: na základe údajov získaných pre neznámu anglickú vetu sa hľadá ruština, ktorá maximalizuje súčin pravdepodobností priradených jazykovým modelom a modelom prekladu. Program používaný na takéto vyhľadávanie sa nazýva dekodér.

Najjednoduchším štatistickým modelom prekladu je model doslovného prekladu. Tento model predpokladá, že na preloženie vety z jedného jazyka do druhého stačí preložiť všetky slová (vytvoriť „vrecko slov“) a model zabezpečí ich umiestnenie v správnom poradí. a, f | e) až P(a | e , f), t.j. pravdepodobnosti daného zarovnania pri danej dvojici viet, každá pravdepodobnosť P(a, f | e) je normalizovaná súčtom pravdepodobností všetkých zarovnaní danej dvojice viet:

Implementácia Viterbiho algoritmu, ktorý sa používa na trénovanie modelu #1, je nasledovná:

1. Celá tabuľka pravdepodobností korešpondencie prekladu je vyplnená rovnakými hodnotami.

2. Pre všetky možné varianty párových spojení slov sa vypočíta pravdepodobnosť P(a, f | e):

3. Hodnoty P(a, f | e) sa normalizujú, aby sa získali hodnoty P(a | e, f).

4. Vypočíta sa frekvencia každého translačného páru, vážená pravdepodobnosťou každej možnosti zarovnania.

5. Výsledné vážené frekvencie sú normalizované a tvoria novú tabuľku pravdepodobností korešpondencie prekladu

6. Algoritmus sa opakuje od kroku 2.

Uvažujme ako príklad trénovanie podobného modelu na korpuse dvoch párov viet (obr. 2):

Biely dom

Po veľkom počte iterácií dostaneme tabuľku (tabuľka 2), ktorá ukazuje, že preklad sa vykonáva s vysokou presnosťou.

Štatistické metódy sú tiež široko používané pri štúdiu slovnej zásoby, morfológie, syntaxe a štýlu. Vedci z Permskej štátnej univerzity vypracovali štúdiu založenú na tvrdení, že stereotypné frázy sú dôležitým „stavebným materiálom“ textu. Tieto frázy pozostávajú z „jadrových“ opakovaných slov a závislých špecifikátorov slov a majú výrazné štylistické zafarbenie.

Vo vedeckom štýle možno „jadrové“ slová nazvať: výskum, štúdium, úloha, problém, otázka, jav, fakt, pozorovanie, analýza atď. V žurnalistike budú iné slová „jadrové“, ktoré majú zvýšenú hodnotu špeciálne pre text novín: čas, osoba, moc, podnikanie, akcia, zákon, život, história, miesto atď. (celkom 29)

Pre jazykovedcov je zaujímavá aj odborná diferenciácia národného jazyka, originalita používania slovnej zásoby a gramatiky v závislosti od druhu zamestnania. Je známe, že vodiči v odbornej reči používajú tvar sh o fer, hovoria medici k o klub namiesto kokteilu Yu sh - takéto príklady možno uviesť. Úlohou štatistiky je sledovať variabilitu výslovnosti a zmenu jazykovej normy.

Profesijné rozdiely vedú k rozdielom nielen gramatickým, ale aj lexikálnym. Jakutská štátna univerzita pomenovaná po M.K. Ammosova bolo analyzovaných 50 dotazníkov s najbežnejšími reakciami na určité slová medzi lekármi a staviteľmi (tabuľka 3).

Stavitelia

Ľudské

pacient (10), osobnosť (5)

muž (5)

dobre

pomoc (8), pomoc (7)

zlo (16)

život

smrť (10)

krásne (5)

smrť

mŕtvola (8)

život (6)

oheň

teplo (8), horieť (6)

oheň (7)

prstom

ruka (14), panaritium (5)

veľký (7), index (6)

oči

zrak (6), žiak, oftalmológ (po 5)

hnedá (10), veľká (6)

hlavu

myseľ (14), mozog (5)

veľký (9), inteligentný (8), inteligentný (6)

stratiť

vedomie, život (každý 4)

peniaze (5), nájsť (4)

Možno konštatovať, že lekári častejšie ako stavbári dávajú asociácie súvisiace s ich profesijnou činnosťou, keďže slovné podnety uvedené v dotazníku súvisia viac s ich profesiou ako s profesiou stavbára.

Štatistické zákonitosti v jazyku sa využívajú na vytváranie frekvenčných slovníkov – slovníkov, ktoré dávajú číselné charakteristiky frekvencie slov (tvarov slov, slovných spojení) ľubovoľného jazyka – jazyka pisateľa, akéhokoľvek diela a pod. slovo sa používa ako charakteristika frekvencie výskytu slova v texte určitého zväzku

Model vnímania reči nie je možný bez slovníka ako jeho základnej zložky. Vo vnímaní reči je základnou operačnou jednotkou slovo. Z toho vyplýva najmä to, že každé slovo vnímaného textu musí byť stotožnené s príslušnou jednotkou vnútornej slovnej zásoby poslucháča (či čitateľa). Je prirodzené predpokladať, že vyhľadávanie je od začiatku obmedzené na niektoré subdomény slovníka. Podľa väčšiny moderných teórií vnímania reči poskytuje skutočná fonetická analýza znejúceho textu v typickom prípade len niektoré čiastkové informácie o možnom fonologickom vzhľade slova a tento druh informácií zodpovedá nie jednému, ale určitému MNOHÉM slovám. slovníka; Preto vznikajú dva problémy:

a) vybrať vhodný súbor podľa určitých parametrov;

(b) v rámci vymedzeného súboru (ak je primerane pridelený) „eliminovať“ všetky slová, okrem jediného, ​​ktoré najlepšie zodpovedá danému slovu rozpoznaného textu. Jednou zo stratégií „vypadnutia“ je vylúčenie nízkofrekvenčných slov. Z toho vyplýva, že slovnou zásobou pre vnímanie reči je frekvenčný slovník. Práve vytvorenie počítačovej verzie frekvenčného slovníka ruského jazyka je prvotnou úlohou predkladaného projektu.

Na základe materiálu ruského jazyka existuje 5 frekvenčných slovníkov (nepočítajúc odvetvové slovníky). Všimnime si len niektoré všeobecné nedostatky existujúcich slovníkov.

Všetky známe frekvenčné slovníky ruského jazyka sú založené na spracovaní polí písaných (tlačených) textov. Čiastočne z tohto dôvodu, keď je identita slova z veľkej časti založená na formálnej, grafickej zhode, nie je dostatočne zohľadnená sémantika. V dôsledku toho sú aj frekvenčné charakteristiky posunuté, skreslené; ak napríklad kompilátor frekvenčného slovníka zaradí slová zo spojenia „navzájom“ do všeobecnej štatistiky používania slova „priateľ“, potom je to sotva opodstatnené: vzhľadom na sémantiku musíme priznať, že tieto sú už rôzne slová, alebo skôr, že samostatnou jednotkou slovníka je len kombinácia ako celok.

Vo všetkých existujúcich slovníkoch sú slová umiestnené iba v základných tvaroch: podstatné mená v jednotnom čísle, nominatív, slovesá v infinitívnom tvare atď. Niektoré zo slovníkov poskytujú informácie o frekvencii slovných tvarov, ale väčšinou to nerobia dostatočne dôsledne, nie vyčerpávajúco. Frekvencie rôznych slovných tvarov toho istého slova sa zjavne nezhodujú. Vývojár modelu vnímania reči musí brať do úvahy, že v reálnom percepčnom procese je to práve konkrétna forma slova, ktorá je „ponorená“ do textu, ktorý je predmetom rozpoznávania: na základe analýzy počiatočnej časti exponentu slovnej formy sa vytvorí množina slov s identickým začiatkom, pričom začiatočná časť slovnej formy nemusí byť nevyhnutne identická s počiatočnou časťou slovníkovej formy . Práve tvar slova má špecifickú rytmickú štruktúru, ktorá je tiež mimoriadne dôležitým parametrom pre percepčný výber slov. Napokon, v konečnom znázornení rozpoznanej výpovede sú slová opäť reprezentované zodpovedajúcimi tvarmi slov.

Existuje mnoho prác, ktoré demonštrujú dôležitosť frekvencie v procese vnímania reči. Nie sú nám ale známe práce, kde by sa používala frekvencia slovných tvarov – naopak, všetci autori frekvenciu jednotlivých tvarov slov prakticky ignorujú, pričom sa odvolávajú výlučne na lexémy. Ak sa nimi získané výsledky nepovažujú za artefakty, treba predpokladať, že rodený hovorca má nejakým spôsobom prístup k informáciám o pomere frekvencií slovných foriem a slovníkových foriem, teda vlastne lexém. Navyše, takýto prechod od slovnej formy k lexéme, samozrejme, nemožno vysvetliť prirodzenou znalosťou zodpovedajúcej paradigmy, pretože frekvenčná informácia musí byť použitá pred konečnou identifikáciou slova, inak jednoducho stráca svoj význam.

Podľa primárnych štatistických charakteristík je možné s danou relatívnou chybou určiť tú časť slovníka, ktorá obsahuje slová s vysokou frekvenciou výskytu, bez ohľadu na druh textu. Zavedením postupného zoradenia do slovníka je tiež možné získať sériu slovníkov pokrývajúcich prvých 100, 1000, 5000 atď. častých slov. Štatistické charakteristiky slovníka sú zaujímavé v súvislosti so sémantickou analýzou slovnej zásoby. Štúdium predmetových ideologických skupín a sémantických polí ukazuje, že lexikálne asociácie sú podporované sémantickými väzbami, ktoré sú sústredené okolo lexém s najbežnejším významom. Opis významov v lexikálno-sémantickej oblasti možno uskutočniť identifikáciou slov s významovo najabstraktnejšími lexémami. Zjavne „prázdne“ (z hľadiska nominatívnych potencií) slovníkové jednotky tvoria štatisticky homogénnu vrstvu.

Nemenej hodnotné sú slovníky pre jednotlivé žánre. Štúdium miery ich podobnosti a charakteru štatistických distribúcií poskytne zaujímavé informácie o kvalitatívnom rozvrstvení slovnej zásoby v závislosti od sféry používania reči.

Zostavovanie veľkých frekvenčných slovníkov si vyžaduje použitie výpočtovej techniky. ZAVEDENIE čiastočnej mechanizácie a automatizácie do procesu práce na slovníku je zaujímavé ako experiment strojového spracovania slovníkov pre rôzne texty. Takýto slovník si vyžaduje prísnejší systém spracovania a akumulácie slovnej zásoby. V miniatúre ide o systém na vyhľadávanie informácií, ktorý je schopný poskytnúť informácie o rôznych aspektoch textu a slovnej zásoby. Niektoré základné požiadavky na tento systém sú naplánované od samého začiatku: celkový počet inventárnych slov, štatistické charakteristiky jedného slova a celých slovníkov, zoradenie častých a zriedkavých oblastí slovníka atď. Súbor kariet stroja vám umožňuje na automatické vytváranie reverzných slovníkov pre jednotlivé žánre a zdroje. Mnoho ďalších užitočných štatistických informácií o jazyku sa získa z nahromadeného súboru informácií. Počítačový frekvenčný slovník vytvára experimentálny základ pre prechod k rozsiahlejšej automatizácii práce so slovnou zásobou.

Štatistické údaje frekvenčných slovníkov možno široko využiť aj pri riešení iných lingvistických problémov - napríklad pri analýze a určovaní aktívnych prostriedkov tvorby slov v modernom ruskom jazyku, riešení problémov zdokonaľovania grafiky a pravopisu, ktoré súvisia s braním do úvahy. zohľadňovať štatistické informácie o slovnej zásobe (pri tom všetkom je dôležité brať do úvahy pravdepodobnostné charakteristiky grafémových kombinácií, typy slovných spojení písmen), praktický prepis a transliteráciu. Štatistické parametre slovníka budú užitočné aj pri riešení problémov automatizácie písania, rozpoznávania a automatického čítania doslovného textu.

Moderné výkladové slovníky a gramatiky ruského jazyka sú postavené najmä na základe literárnych a umeleckých textov. Existujú frekvenčné slovníky jazyka A.S. Puškin, A.S. Griboedová, F.M. Dostojevskij, V.V. Vysockij a mnohí ďalší autori. Na Katedre histórie a teórie literatúry Smolenského štátu. Vysoká škola pedagogická už niekoľko rokov pracuje na zostavovaní frekvenčných slovníkov básnických a prozaických textov. Pre túto štúdiu boli vybrané frekvenčné slovníky všetkých textov Puškina a ďalších dvoch básnikov zlatého veku – „Beda z vtipu“ od Gribojedova a celá Lermontovova poézia; Pasternak a ďalší piati básnici Strieborného veku - Balmont 1894-1903, "Básne o krásnej dáme" od Bloka, "Stone" od Mandelstama, "Ohnivý stĺp" od Gumilyova, "Anno Domini MCMXXI" od Achmatovej a "Sestry of Môj život“ od Pasternaka a ďalších štyroch básnikov doby železnej – „Básne Jurija Živaga“, „Keď sa vyjasní“, celý korpus textov M. Petrovsa, „Cesta je ďaleko“, „Čelné sklo“, „Rozlúčka so snehom“ a „Podkovy“ od Mezhirova, „Antimirov“ od Voznesenskyho a „Snehové gule » Rylenkova.

Treba poznamenať, že tieto slovníky sú svojou povahou odlišné: niektoré predstavujú slovnú zásobu jedného dramatického diela, iné - knihy textov alebo niekoľko kníh alebo celý korpus básní básnika. Výsledky analýzy prezentované v tomto príspevku treba brať s rezervou, nemožno ich brať ako absolútne. Zároveň sa pomocou špeciálnych opatrení dá do určitej miery zmenšiť rozdiel v ontologickom charaktere textov.

V posledných rokoch sa čoraz zreteľnejšie prejavuje protiklad medzi hovorovou a knižnou rečou. Táto problematika je obzvlášť ostro diskutovaná medzi metodikmi, ktorí požadujú obrat vo výučbe smerom k hovorenej reči. Špecifickosť hovorovej reči zároveň zostáva stále nevysvetlená.

Slovníky boli spracované vytvorením používateľskej aplikácie v prostredí kancelárskeho programu EXCEL97. Súčasťou aplikácie sú štyri pracovné listy knihy EXCEL - "Hárok titulkov", list "Slovníky" s počiatočnými údajmi, "Blízkosti" a "Vzdialenosti" s výsledkami, ako aj sadu makier.

Počiatočné informácie sa zadávajú na hárku "Slovníky". Slovníky študovaných textov sa zapisujú do buniek EXCEL, posledný stĺpec S sa tvorí zo získaných výsledkov a rovná sa počtu slov nájdených v iných slovníkoch. Tabuľky „Blízkosť“ a „Vzdialenosti“ obsahujú vypočítané miery blízkosti M, korelácie R a vzdialenosti D.

Aplikačné makrá sú programovacie procedúry založené na udalostiach napísané vo Visual Basic for Application (VBA). Procedúry sú založené na objektoch knižnice VBA a metódach ich spracovania. Pre operácie s pracovnými hárkami aplikácie sa teda používa kľúčový objekt Pracovný hárok (hárok) a zodpovedajúci spôsob aktivácie hárku Aktivovať (aktivovať). Nastavenie rozsahu analyzovaných zdrojových údajov na hárku Slovník sa vykonáva metódou Select objektu Range (rozsah) a prenos slov ako hodnôt do premenných sa vykonáva ako vlastnosť Value (hodnota) rovnakého rozsahu. objekt.

Napriek tomu, že analýza korelácie poradia nás robí obozretnými, pokiaľ ide o závislosť tém medzi rôznymi textami, väčšina najfrekventovanejších slov v každom texte má zhodu v jednom alebo viacerých iných textoch. Stĺpec S zobrazuje počet takýchto slov medzi 15 najfrekventovanejšími slovami u každého autora. Slová napísané tučným písmom sa v našej tabuľke vyskytujú iba v slovách jedného básnika. Blok, Achmatova a Petrovs nemajú zvýraznené slová vôbec, majú S = 15. Títo traja básnici majú rovnakých 15 najfrekventovanejších slov, líšia sa len miestom v zozname. Ale aj Puškin, ktorého slovná zásoba je najoriginálnejšia, má S = 8 a je tam 7 zvýraznených slov.

Výsledky ukazujú, že existuje určitá vrstva slovnej zásoby, ktorá koncentruje hlavné témy poézie. Spravidla sú tieto slová krátke: z celkového počtu (225) slovných použití jednoslabičných 88, dvojslabičných 127, trojslabičných 10. Tieto slová často predstavujú hlavné mytologémy a môžu byť rozdelené do párov: noc - deň, zem - nebo (slnko), Boh - človek (ľudia), život - smrť, telo - duša, Rím - svet(v Mandelstame); možno kombinovať do mytológov vyššej úrovne: nebo, hviezda, slnko, zem; v človeku spravidla vynikne telo, srdce, krv, ruka, noha, líce, oči. Z ľudských stavov sa uprednostňuje spánok a láska. Dom a mestá patria do ľudského sveta – Moskva, Rím, Paríž. Kreativita je reprezentovaná lexémami slovo a pieseň.

Griboedov a Lermontov nemajú medzi najfrekventovanejšími slovami takmer žiadne slová označujúce prírodu. Majú trikrát toľko slov, ktoré označujú človeka, časti jeho tela, prvky jeho duchovného sveta. Puškin a básnici dvadsiateho storočia. Označenia človeka a prírody sú približne rovnaké. V tomto dôležitom aspekte predmetu môžeme povedať, že dvadsiate storočie. nasledoval Puškina.

Minimálna téma prípad medzi najfrekventovanejšími slovami sa vyskytuje len u Gribojedova a Puškina. Lermontov a básnici dvadsiateho storočia. ustupuje minimálnej téme slovo. Slovo nevylučuje skutky (biblický výklad témy: v Novom zákone sa všetko učenie Ježiša Krista považuje za slovo Božie alebo slovo Ježišovo a apoštoli sa niekedy nazývajú služobníkmi Slova). Posvätný význam lexémy slova sa presvedčivo prejavuje napríklad v Pasternakovom verši „A obraz sveta, zjavený v Slove“. Posvätný význam lexémy slovo v spojení a kontraste s ľudskými záležitosťami sa presvedčivo prejavuje v rovnomennej básni Gumiľjova.

Žetóny, ktoré sa nachádzajú len v jednom texte, charakterizujú originalitu danej knihy alebo zbierky kníh. Napríklad slovo „myseľ“ je najfrekventovanejšie v Griboedovovej komédii „Beda vtipu“ – medzi frekventovanými slovami iných textov sa však nevyskytuje. Téma mysle je v komédii jednoznačne najvýznamnejšia. Táto lexéma sprevádza obraz Chatského a meno Chatského je v komédii najčastejšie. Dielo tak organicky spája najčastejšie spoločné podstatné meno s najfrekventovanejším vlastným menom.

Najvyšší korelačný koeficient spája témy tragických kníh „Ohnivý stĺp“ od Gumilyova a „Anno Domini MCMXXI“ od Achmatovovej. Medzi 15 najfrekventovanejšími podstatnými menami je 10 bežných, medzi ktoré patrí krv, srdce, duša, láska, slovo, nebo. Pripomeňme, že kniha Akhmatovovej obsahovala miniatúru „Nebudeš nažive ...“, napísanú medzi zatknutím Gumilyova a jeho popravou.

Témy sviečky a davu v študovanom materiáli sa nachádzajú iba v "Básňach Jurija Živaga". Téma sviečky vo veršoch z románu má mnoho kontextových významov: spája sa s obrazom Ježiša Krista, s témami viery, nesmrteľnosti, tvorivosti, milostného dátumu. Sviečka je najdôležitejším zdrojom svetla v ústredných scénach románu. Téma davu sa rozvíja v súvislosti s hlavnou myšlienkou románu, v ktorej je súkromný život človeka s jeho neotrasiteľnými hodnotami v protiklade s nemorálnosťou nového štátu, postavenom na princípoch potešenia davu. .

Práca zahŕňa aj tretiu etapu, ktorá sa odráža aj v programe, a to výpočet rozdielu v poradových číslach slov spoločných pre dva slovníky a priemernej vzdialenosti medzi rovnakými slovami dvoch slovníkov. Táto fáza umožňuje prejsť od všeobecných trendov v interakcii slovníkov identifikovaných pomocou štatistík na úroveň približujúcu sa textu. Napríklad knihy Gumilyova a Achmatovovej štatisticky významne korelujú. Pozeráme sa na to, ktoré slová sa ukázali ako bežné pre ich slovníky, a predovšetkým vyberáme tie, ktorých sériové čísla sa líšia minimálne alebo sú rovné nule. Práve tieto slová majú rovnaké poradové číslo, a preto sú tieto minimálne témy v mysliach dvoch básnikov rovnako dôležité. Ďalej by ste sa mali presunúť na úroveň textov a kontextov.

Kvantitatívne metódy tiež pomáhajú študovať charakteristiky národov - rodených hovorcov. Povedzme, že v ruštine je 6 prípadov, v angličtine nie sú žiadne a v niektorých jazykoch národov Dagestanu počet prípadov dosahuje 40. L. Perlovský vo svojom článku „Vedomie, jazyk a kultúra“ tieto koreluje charakteristiky so sklonom národov k individualizmu alebo kolektivizmu, s vnímaním vecí a javov oddelene alebo v spojení s inými. Koniec koncov, práve v anglicky hovoriacom svete (nie sú žiadne prípady - vec sa vníma „sama od seba“) sa objavili také pojmy ako individuálna sloboda, liberalizmus a demokracia (podotýkam, že tieto pojmy používam len v súvislosti s tzv. jazyk, bez akýchkoľvek hodnotiacich charakteristík). Napriek tomu, že takéto dohady stále zostávajú len na úrovni odvážnych vedeckých hypotéz, pomáhajú pozerať sa na už známe javy novým spôsobom.

Ako vidíme, kvantitatívne charakteristiky možno uplatniť v úplne iných oblastiach lingvistiky, čím sa čoraz viac stierajú hranice medzi „exaktnými“ a „humanitárnymi“ metódami. Lingvistika sa pri riešení svojich problémov čoraz viac uchyľuje k pomoci nielen matematiky, ale aj počítačovej techniky.

2.3 Učenie Ijazyka metódami formálnej logiky

S nekvantitatívnymi metódami matematiky, najmä s logikou, interaguje moderná teoretická lingvistika nemenej plodne ako s kvantitatívnymi. Rýchly rozvoj počítačových technológií a rast ich úlohy v modernom svete si vyžiadal revíziu prístupu k interakcii jazyka a logiky vo všeobecnosti.

Metódy logiky sú široko používané pri vývoji formalizovaných jazykov, najmä programovacích jazykov, ktorých prvkami sú niektoré symboly (podobné matematickým), vybrané (alebo konštruované z predtým vybraných symbolov) a interpretované určitým spôsobom, súvisiace k akémukoľvek „tradičnému“ používaniu, chápaniu a chápaniu.funkcie tých istých symbolov v iných kontextoch. Programátor sa vo svojej práci neustále zaoberá logikou. Zmyslom programovania je práve naučiť počítač uvažovať (v najširšom zmysle slova). Zároveň sa ukazuje, že metódy „uvažovania“ sú veľmi odlišné. Každý programátor strávi určitý čas hľadaním chýb vo svojich programoch a programoch iných ľudí. Teda hľadať chyby v uvažovaní, v logike. A to tiež zanecháva stopy. V bežnej reči je oveľa jednoduchšie odhaliť logické chyby. Relatívna jednoduchosť jazykov, ktoré študujú logici, im umožňuje jasnejšie objasniť štruktúry týchto jazykov, ako by to mohli dosiahnuť lingvisti, ktorí analyzujú výlučne zložité prirodzené jazyky. Vzhľadom na skutočnosť, že jazyky, ktoré študujú logici, využívajú vzťahy skopírované z prirodzených jazykov, môžu logici významne prispieť k všeobecnej teórii jazyka. Situácia je tu podobná ako vo fyzike: fyzik formuluje vety aj pre ideálne zjednodušené prípady, ktoré sa v prírode vôbec nevyskytujú – formuluje zákony pre ideálne plyny, ideálne kvapaliny, hovorí o pohybe pri absencii trenia, o pohybe bez trenia, o pohybe bez trenia. atď. Pre tieto zidealizované prípady možno stanoviť jednoduché zákony, ktoré by výrazne prispeli k pochopeniu toho, čo sa skutočne deje a čo by fyzike zrejme zostalo neznáme, keby sa pokúsila uvažovať o realite priamo, v celej jej zložitosti.

Pri štúdiu prirodzených jazykov sa využívajú logické metódy, aby si študenti jazyka hlúpo „nezapamätali“ čo najviac slov, ale lepšie pochopili jeho štruktúru. L. Shcherba vo svojich prednáškach použil aj príklad vety zostavenej podľa zákonov ruského jazyka: „Pokazený kuzdra shteko boke bokra a krúti bokra,“ a potom sa študentov opýtal, čo to znamená. Napriek tomu, že význam slov vo vete zostal nejasný (v ruštine jednoducho neexistujú), bolo možné jasne odpovedať: „kuzdra“ je subjekt, ženské podstatné meno, v jednotnom čísle, nominatíve, „ bokr“ je animovaný atď. Preklad tejto frázy je asi takýto: „Niečo ženské naraz urobilo niečo s nejakým mužským tvorom a potom začalo robiť niečo dlhé, postupné s mláďaťom. Podobným príkladom textu (umeleckého) z neexistujúcich slov, postaveného úplne podľa zákonitostí jazyka, je Jabberwock Lewisa Carrolla (v Alici v krajine zázrakov Carroll ústami svojej postavy Humpty Dumpty vysvetľuje význam slová, ktoré vymyslel: „varené“ – osem hodín večer, keď je čas variť večeru, „chlivky“ – chatrné a obratné, „shorek“ – kríženec fretky, jazveca a vývrtky, „potápať sa“. " - skákať, potápať sa, točiť sa, "nava" - tráva pod slnečnými hodinami (presahuje trochu doprava, trochu doľava a trochu dozadu), "grunt" - chrčať a smiať sa, "zelyuk" - a zelená morka, „myumzik“ - vták; jej perie sú strapaté a trčia na všetky strany, ako metla, „mova“ - ďaleko od domova).

Jeden z hlavných konceptov modernej logiky a teoretickej lingvistiky, ktorý sa používa pri štúdiu jazykov rôzneho logicko-matematického počtu, prirodzených jazykov, na opísanie vzťahu medzi jazykmi rôznych „úrovní“ a na charakterizáciu vzťahu medzi uvažované jazyky a s ich pomocou popísané tematické oblasti, je pojem metajazyk. Metajazyk je jazyk používaný na vyjadrenie úsudkov o inom jazyku, o jazyku-objekte. Pomocou metajazyka študujú štruktúru znakových kombinácií (výrazov) jazyka-objektu, dokazujú vety o jeho výrazových vlastnostiach, o jeho vzťahu k iným jazykom atď. Skúmaný jazyk sa v r. vzťah k tomuto metajazyku. Predmetným jazykom aj metajazykom môžu byť bežné (prirodzené) jazyky. Metajazyk sa môže líšiť od objektového jazyka (napríklad v učebnici angličtiny pre Rusov je ruština metajazykom a angličtina objektovým jazykom), ale môže sa s ním aj zhodovať alebo sa môže líšiť len čiastočne, napríklad v špeciálnej terminológii (Ruská lingvistická terminológia je prvkom metajazyka na opis ruského jazyka, súčasťou metajazyka na opis sémantiky prirodzených jazykov sú tzv. sémantické faktory).

Koncept „metalinguage“ sa stal veľmi plodným v súvislosti so štúdiom formalizovaných jazykov, ktoré sú postavené v rámci matematickej logiky. Na rozdiel od formalizovaných predmetových jazykov je v tomto prípade metajazyk, pomocou ktorého sa formuluje metateória (štúdium vlastností predmetovej teórie formulovanej v predmetnom jazyku), spravidla obyčajným prirodzeným jazykom, nejakým špeciálnym spôsobom. obmedzený fragment prirodzeného jazyka, ktorý neobsahuje žiadnu nejednoznačnosť, metafory, „metafyzické“ pojmy atď. prvky bežného jazyka, ktoré bránia jeho použitiu ako nástroja presného vedeckého výskumu. Zároveň môže byť samotný metajazyk formalizovaný a (bez ohľadu na to) sa môže stať predmetom skúmania realizovaného pomocou metametajazyka a takýto rad možno „myslieť“ ako rastúci donekonečna.

Logika nás učí plodnému rozlišovaniu medzi jazykom-objektom a metajazykom. Jazyk-objekt je samotným predmetom logického výskumu a metajazyk je tým nevyhnutne umelým jazykom, v ktorom sa takýto výskum uskutočňuje. Logické myslenie spočíva len vo formulovaní vzťahov a štruktúry reálneho jazyka (objektového jazyka) v jazyku symbolov (metalanguage).

Metajazyk musí byť v každom prípade „nie chudobnejší“ ako jeho objektívny jazyk (to znamená, že pre každý jeho výraz v metajazyku musí byť jeho názov, „preklad“) – v opačnom prípade, ak tieto požiadavky nie sú splnené (čo určite prebieha v prirodzených jazykoch, ak osobitné dohody neustanovujú inak, vznikajú sémantické paradoxy (antinómie).

Ako sa vytváralo stále viac nových programovacích jazykov, v súvislosti s problémom programovania prekladačov vznikla naliehavá potreba vytvoriť metajazyky. V súčasnosti sa na popis syntaxe programovacích jazykov najčastejšie používa metajazyk formy Backus-Naur (skrátene BNF). Ide o kompaktnú formu v podobe niektorých vzorcov podobných tým matematickým. Pre každý koncept jazyka existuje jedinečný metavzorec (normálny vzorec). Skladá sa z ľavej a pravej časti. Ľavá strana špecifikuje definovaný koncept a pravá strana špecifikuje množinu prípustných jazykových konštruktov, ktoré sú kombinované do tohto konceptu. Vzorec používa špeciálne metaznaky vo forme lomených zátvoriek, ktoré obsahujú definovaný koncept (na ľavej strane vzorca) alebo predtým definovaný koncept (na jeho pravej strane), pričom oddelenie ľavej a pravej časti je označené metaznak "::=", ktorého význam je ekvivalentný slovám "podľa definície existuje". Metalingvistické vzorce sú v nejakej forme vložené do prekladačov; s ich pomocou sa konštrukty používané programátorom skontrolujú z hľadiska formálnej zhody s niektorým z konštruktov, ktoré sú syntakticky platné v tomto jazyku. Existujú aj samostatné metajazyky rôznych vied - teda poznanie existuje vo forme rôznych metajazykov.

Logické metódy slúžili aj ako základ pre vytváranie systémov umelej inteligencie založených na koncepte konekcionizmu. Konekcionizmus je zvláštny smer vo filozofickej vede, ktorého predmetom sú otázky poznania. V rámci tohto trendu sa pokúšajú vysvetliť intelektuálne schopnosti človeka pomocou umelých neurónových sietí. Neurónové siete, ktoré sa skladajú z veľkého množstva štruktúrnych jednotiek podobných neurónom, pričom každému prvku je priradená váha, ktorá určuje silu spojenia s inými prvkami, sú neurónové siete zjednodušenými modelmi ľudského mozgu. Experimenty s neurónovými sieťami tohto druhu preukázali ich schopnosť naučiť sa vykonávať úlohy, ako je rozpoznávanie vzorov, čítanie a identifikácia jednoduchých gramatických štruktúr.

Filozofi sa začali zaujímať o konekcionizmus, keďže konekcionistický prístup sľúbil poskytnúť alternatívu ku klasickej teórii mysle a myšlienke, ktorá sa v tejto teórii široko používa, že fungovanie mysle je podobné spracovaniu symbolického jazyka digitálnym počítač. Tento koncept je veľmi kontroverzný, no v posledných rokoch si nachádza čoraz viac priaznivcov.

Logické štúdium jazyka pokračuje v Saussurovom koncepte jazyka ako systému. Skutočnosť, že neustále pokračuje, opäť potvrdzuje smelosť vedeckých dohadov zo začiatku minulého storočia. Posledný oddiel mojej práce budem venovať perspektívam rozvoja matematických metód v lingvistike dnes.

2.4 Perspektívy aplikácie matematických metód v lingvistike

V ére počítačovej techniky dostali metódy matematickej lingvistiky novú perspektívu rozvoja. Hľadanie riešení problémov lingvistickej analýzy sa v súčasnosti čoraz viac realizuje na úrovni informačných systémov. Zároveň automatizácia procesu spracovania lingvistického materiálu, ktorá výskumníkovi poskytuje významné príležitosti a výhody, pre neho nevyhnutne kladie nové požiadavky a úlohy.

Spojenie „exaktných“ a „humanitných“ poznatkov sa stalo úrodnou pôdou pre nové objavy v oblasti lingvistiky, informatiky a filozofie.

Strojový preklad z jedného jazyka do druhého zostáva rýchlo rastúcim odvetvím informačných technológií. Napriek tomu, že počítačom podporovaný preklad sa kvalitou nikdy nevyrovná ľudskému prekladu (najmä pri literárnych textoch), stroj sa stal nepostrádateľným pomocníkom človeka pri prekladaní veľkých objemov textu. Predpokladá sa, že v blízkej budúcnosti budú vytvorené pokročilejšie prekladové systémy založené predovšetkým na sémantickej analýze textu.

Rovnako sľubným smerom je interakcia lingvistiky a logiky, ktorá slúži ako filozofický základ pre pochopenie informačných technológií a takzvanej „virtuálnej reality“. V blízkej budúcnosti budú práce na vytváraní systémov umelej inteligencie pokračovať – aj keď opäť sa nikdy nebude rovnať tomu človeku vo svojich schopnostiach. Takáto súťaž je bezvýznamná: v našej dobe by sa stroj nemal stať (a stáva sa) nie súperom, ale pomocníkom človeka, nie niečím z ríše fantázie, ale súčasťou skutočného sveta.

Štúdium jazyka štatistickými metódami pokračuje, čo umožňuje presnejšie určiť jeho kvalitatívne vlastnosti. Je dôležité, aby tie najodvážnejšie hypotézy o jazyku našli svoj matematický, a teda aj logický dôkaz.

Najdôležitejšie je, že rôzne odvetvia aplikácie matematiky v lingvistike, predtým dosť izolované, sa v posledných rokoch navzájom korelujú a spájajú do koherentného systému, analogicky s jazykovým systémom, ktorý pred storočím objavil Ferdinand de Saussure. a Yvan Baudouin de Courtenay. Toto je kontinuita vedeckých poznatkov.

Lingvistika v modernom svete sa stala základom rozvoja informačných technológií. Pokiaľ informatika zostane rýchlo sa rozvíjajúcim odvetvím ľudskej činnosti, spojenie matematiky a lingvistiky bude naďalej zohrávať svoju úlohu v rozvoji vedy.

Záver

V priebehu 20. storočia prešli počítačové technológie dlhú cestu – od vojenského k mierovému využitiu, od úzkeho okruhu cieľov až po prienik do všetkých odvetví ľudského života. Matematika ako veda nachádzala s rozvojom výpočtovej techniky stále nový praktický význam. Tento proces pokračuje aj dnes.

Predtým nemysliteľný „tandem“ „fyzikov“ a „textárov“ sa stal realitou. Pre plnú interakciu matematiky a informatiky s humanitnými vedami boli potrební kvalifikovaní odborníci z oboch strán. Zatiaľ čo počítačoví vedci stále viac potrebujú systematické humanitné znalosti (jazykové, kultúrne, filozofické), aby pochopili zmeny v realite okolo seba, v interakcii človeka a techniky, rozvíjali stále viac nových jazykových a mentálnych konceptov, písali programy, potom akékoľvek „Humanitné vedy“ v našej dobe pre svoj odborný rast musia ovládať aspoň základy práce s počítačom.

Matematika, ktorá je úzko prepojená s informatikou, sa naďalej rozvíja a interaguje s prírodnými a humanitnými vedami. V novom storočí trend matematizácie vedy neoslabuje, ale naopak narastá. Na základe kvantitatívnych údajov sú pochopené zákonitosti vývoja jazyka, jeho historické a filozofické charakteristiky.

Matematický formalizmus je najvhodnejší na opis vzorcov v lingvistike (ako vlastne aj v iných vedách – humanitných aj prírodných). Situácia sa vo vede niekedy vyvíja tak, že bez použitia vhodného matematického jazyka nie je možné pochopiť podstatu fyzikálnych, chemických atď. proces nie je možný. Vytvorenie planetárneho modelu atómu, slávny anglický fyzik XX storočia. E. Rutherford mal matematické ťažkosti. Jeho teória spočiatku nebola prijatá: neznela presvedčivo a dôvodom bola Rutherfordova neznalosť teórie pravdepodobnosti, na základe mechanizmu ktorej bolo možné pochopiť len modelové znázornenie atómových interakcií. Uvedomujúc si to, už vtedy vynikajúci vedec, majiteľ Nobelovej ceny, sa prihlásil na seminár matematika profesora Lamba a dva roky spolu so študentmi navštevoval kurz a vypracoval workshop z teórie pravdepodobnosti. . Na jeho základe dokázal Rutherford opísať správanie elektrónu, čím jeho štruktúrny model získal presvedčivú presnosť a získal uznanie. Rovnako je to aj s lingvistikou.

Tu vzniká otázka, čo je na objektívnych javoch také matematické, vďaka čomu ich možno opísať jazykom matematiky, jazykom kvantitatívnych charakteristík? Ide o homogénne jednotky hmoty rozložené v priestore a čase. Tie vedy, ktoré zašli ďalej než ostatné smerom k izolácii homogenity a ukázalo sa, že sú vhodnejšie na použitie matematiky v nich.

Internet, ktorý sa rýchlo rozvíjal v 90. rokoch minulého storočia, spájal zástupcov rôznych krajín, národov a kultúr. Napriek tomu, že angličtina je naďalej hlavným jazykom medzinárodnej komunikácie, internet sa v súčasnosti stal viacjazyčným. To viedlo k vývoju komerčne úspešných systémov strojového prekladu, ktoré sú široko používané v rôznych oblastiach ľudskej činnosti.

Počítačové siete sa stali objektom filozofickej reflexie – vytváralo sa čoraz viac nových lingvistických, logických, svetonázorových konceptov, ktoré pomáhajú pochopiť „virtuálnu realitu“. V mnohých umeleckých dielach boli vytvorené scenáre – častejšie pesimistické – o dominancii strojov nad ľuďmi a virtuálnej reality – nad vonkajším svetom. Zďaleka nie vždy sa takéto predpovede ukázali ako nezmyselné. Informačné technológie nie sú len sľubným odvetvím na investovanie do ľudských vedomostí, ale sú aj spôsobom kontroly informácií, a teda aj ľudského myslenia.

Tento jav má negatívnu aj pozitívnu stránku. Negatívne – pretože kontrola nad informáciami je v rozpore s neodňateľným ľudským právom na slobodný prístup k nim. Pozitívne – pretože nedostatok tejto kontroly môže viesť ku katastrofálnym následkom pre ľudstvo. Stačí pripomenúť jeden z najmúdrejších filmov posledného desaťročia – „Keď sa skončí svet“ od Wima Wendersa, ktorého postavy sú úplne ponorené do „virtuálnej reality“ vlastných snov nahratých na počítači. Zároveň nejeden vedec a ani jeden umelec nevie dať jednoznačnú odpoveď na otázku: čo čaká vedu a techniku ​​v budúcnosti.

Zameranie sa na „budúcnosť“, ktoré sa niekedy zdalo fantastické, bolo charakteristickým znakom vedy v polovici dvadsiateho storočia, keď sa vynálezcovia snažili vytvoriť dokonalé modely technológie, ktoré by mohli fungovať bez ľudského zásahu. Čas ukázal utopistický charakter takéhoto výskumu. Zároveň by bolo zbytočné za to odsudzovať vedcov – bez ich nadšenia v 50. – 60. rokoch by informačné technológie v 90. rokoch neurobili taký mohutný skok a nemali by sme to, čo máme teraz.

Posledné desaťročia dvadsiateho storočia zmenili priority vedy – výskumu, invenčný pátos ustúpil komerčnému záujmu. Opäť to nie je dobré ani zlé. Toto je realita, v ktorej sa veda čoraz viac integruje do každodenného života.

21. storočie pokračovalo v tomto trende a za vynálezmi v dnešnej dobe nestojí len sláva a uznanie, ale predovšetkým peniaze. Aj preto je dôležité zabezpečiť, aby sa najnovšie výdobytky vedy a techniky nedostali do rúk teroristických skupín alebo diktátorských režimov. Úloha je ťažká až nemožná; realizovať to čo najviac je úlohou celého svetového spoločenstva.

Informácie sú zbraňou a zbrane nie sú o nič menej nebezpečné ako jadrové alebo chemické zbrane – len nepôsobia fyzicky, ale skôr psychicky. Ľudstvo sa musí zamyslieť nad tým, čo je preňho v tomto prípade dôležitejšie – sloboda alebo kontrola.

Najnovšie filozofické koncepcie súvisiace s rozvojom informačných technológií a pokus o ich pochopenie poukázali na limity tak prírodovedného materializmu, ktorý dominoval v 19. a začiatkom 20. storočia, ako aj extrémneho idealizmu, ktorý popiera význam materiálneho sveta. . Pre moderné myslenie, najmä myslenie Západu, je dôležité prekonať tento dualizmus v myslení, keď sa okolitý svet jasne delí na materiálny a ideálny. Cestou k tomu je dialóg kultúr, porovnávanie rôznych pohľadov na okolité javy.

Paradoxne, informačné technológie môžu v tomto procese zohrávať dôležitú úlohu. Počítačové siete a najmä internet nie sú len zdrojom zábavy a bujnej komerčnej činnosti, sú aj prostriedkom zmysluplnej, kontroverznej komunikácie predstaviteľov rôznych civilizácií v modernom svete, ako aj dialógu medzi minulosťou a darček. Dá sa povedať, že internet posúva priestorové a časové hranice.

A v dialógu kultúr prostredníctvom informačných technológií je stále dôležitá úloha jazyka ako najstaršieho univerzálneho komunikačného prostriedku. Preto lingvistika v interakcii s matematikou, filozofiou a informatikou zažila svoj druhý zrod a rozvíja sa dodnes. Trend súčasnosti bude pokračovať aj v budúcnosti – „až na koniec sveta“, ako pred 15 rokmi predpovedal ten istý V. Wenders. Pravda, nie je známe, kedy tento koniec nastane – ale či je to teraz dôležité, pretože budúcnosť sa aj tak skôr či neskôr stane prítomnosťou.

Dodatok 1

Ferdinand de Saussure

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je všeobecne považovaný za zakladateľa modernej lingvistiky v jej pokusoch opísať skôr štruktúru jazyka než históriu konkrétnych jazykov a jazykových foriem. V jeho diele na prelome 20. a 20. storočia nachádza hlavný východiskový bod metóda štrukturalizmu v lingvistike a literárnej vede a významná vetva semiotiky. Dokonca sa tvrdilo, že komplex stratégií a koncepcií, ktorý sa začal nazývať „postštrukturalizmus“ – dielo Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a ďalších – naznačuje Saussureova práca. v lingvistike a anagramatickom čítaní neskorej latinskej poézie, literárnej moderny až po psychoanalýzu a filozofiu na začiatku 20. storočia. Ako tvrdia Algirdas Julien Greimas a Joseph Courtes v knihe Semiotics and Language: An Analytic Dictionary, pod názvom „Interpretácia“ sa začiatkom dvadsiateho storočia objavil nový spôsob interpretácie, ktorý sa stotožňuje so saussurovskou lingvistikou, husserovskou fenomenológiou a freudovou psychoanalýzou. V tomto móde „interpretácia už nie je záležitosťou pripisovania daného obsahu forme, ktorá by mu inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje ekvivalentný obsah významového prvku v rámci daného semiotického systému“ ( 159). v tomto chápaní „interpretácie“ sa forma a obsah nerozlišujú; skôr je každá „forma“ alternatívne aj sémantickým „obsahom“, „označujúcou formou“, takže interpretácia ponúka analogickú parafrázu niečoho, čo už znamená v rámci nejakého iného systému označenia.

Takáto reinterpretácia formy a chápania – ktorú Claude Levi-Strauss opisuje v jednej zo svojich najprogramovejších artikulácií konceptu štrukturalizmu, v „Štruktúra a forma: Úvahy o diele Vladimíra Proppa“ – je implicitná v Saussureovom posmrtnom kurze. vo všeobecnej lingvistike (1916, prekl., 1959, 1983). Saussure počas svojho života publikoval relatívne málo a jeho hlavné dielo, Kurz, bolo prepisom niekoľkých kurzov všeobecnej lingvistiky, ktoré ponúkal v rokoch 1907-11. Saussure v kurze vyzval na „vedecké“ štúdium jazyka v protiklade k práci v historickej lingvistike, ktorá sa uskutočnila v devätnástom storočí. Táto práca je jedným z veľkých úspechov západného intelektu: brať konkrétne slová ako stavebné kamene jazyk, historická (alebo „diachrónna“) lingvistika sledovala pôvod a vývoj západných jazykov z predpokladaného spoločného jazykového zdroja, najskôr z „indoeurópskeho“ jazyka a potom zo skoršieho „p roto-indoeurópsky“ jazyk.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „prvkov slova“. Jeho práca bola pokusom zredukovať množstvo faktov o jazyku, ktoré tak podrobne skúma historická lingvistika, na zvládnuteľný počet návrhov. Saussure v Kurze hovorí, že „porovnávacia škola“ filológie devätnásteho storočia „nepodarila sa vytvoriť skutočnú vedu lingvistiky“, pretože „zlyhala pri hľadaní podstaty predmetu svojho štúdia“ (3). Túto „prirodzenosť“, tvrdí, nemožno nájsť jednoducho v „elementárnych“ slovách, ktoré jazyk obsahuje – zdanlivo „pozitívnych“ faktoch (alebo „látkach“) jazyka – ale vo formálnych vzťahoch, z ktorých vznikajú tieto „látky“.

Saussurovo systematické prehodnocovanie jazyka je založené na troch predpokladoch. Prvým je, že vedecké štúdium jazyka potrebuje skôr rozvíjať a študovať systém ako históriu jazykových javov. Z tohto dôvodu rozlišuje medzi jednotlivými výskytmi jazyka – jeho konkrétne „udalosti prejavu“, ktoré označuje ako podmienečné prepustenie – a vlastný predmet lingvistiky, systém (alebo „kód“) riadiaci tieto udalosti, ktoré označuje ako jazyk. Takáto systematická štúdia si navyše vyžaduje „ synchrónna" koncepcia vzťahu medzi prvkami jazyka v konkrétnom okamihu, skôr než "diachrónne" štúdium vývoja jazyka v histórii.

Tento predpoklad viedol k tomu, čo Roman Jakobson v roku 1929 označil za „štrukturalizmus“, v ktorom „akýkoľvek súbor javov skúmaných súčasnou vedou nie je považovaný za mechanickú aglomeráciu, ale ako štrukturálny celok, ktorý mechanická koncepcia procesov dáva k otázke. ich funkcie“ („Romantický“ 711). V tejto pasáži Jakobson vyjadruje Saussurov zámer definovať lingvistiku ako vedecký systém v protiklade k jednoduchému, „mechanickému“ účtovaniu historických náhod. Okrem toho Jakobson opisuje aj druhý základný predpoklad v Saussurovčine – môžeme teraz to nazývame „štrukturálne“ – lingvistika: že základné prvky jazyka možno skúmať iba vo vzťahu k ich funkciám, a nie vo vzťahu k ich príčinám. Európske „slová“), tieto udalosti a entity musia byť situované do systémového rámca v ktorej súvisia s inými takzvanými udalosťami a entitami. Ide o radikálnu zmenu orientácie v chápaní skúseností a javov, ktorej význam prirovnal filozof Ernst Cassirer k „novej Galileiovej vede, ktorá v 17. storočí zmenila celý náš koncept fyzického sveta“ (citované v Culler, Pursuit 2 4). Táto zmena, ako poznamenávajú Greimas a Courtes, pretvára „interpretáciu“ a teda pretvára vysvetlenie a pochopenie seba samých. Namiesto toho, aby vysvetlenie „je v zmysle príčin javu, takže ako „účinok“ je nejakým spôsobom podriadené jeho príčinám, vysvetlenie tu spočíva v podriadení javu jeho „funkcii“ orientovanej na budúcnosť, resp. "účel." Vysvetlenie už nie je nezávislé od ľudských zámerov alebo účelov (aj keď tieto zámery môžu byť neosobné, spoločné alebo freudovskými výrazmi „nevedomé“).

Vo svojej lingvistike Saussure uskutočňuje túto transformáciu špecificky v redefinícii lingvistického „slova“, ktoré opisuje ako lingvistický „znak“ a definuje ho funkcionalistickými pojmami. Znak, tvrdí, je spojením „pojemu a zvukového obrazu“, ktorý nazval „označený a označujúci“ (66-67; preklad Roya Harrisa z roku 1983 ponúka výrazy „označenie“ a „signál“). Povaha ich „kombinácie“ je „funkčná“ v tom, že ani označované, ani označujúce nie sú „príčinou“ toho druhého, ale „každý má svoje hodnoty od druhého“ (8). prvok jazyka, znak relačné a podrobuje dôslednej analýze základný predpoklad historickej lingvistiky, konkrétne identitu elementárnych jednotiek jazyka a označenia (t. j. „slov“). slovo „strom“ ako „rovnaké“ slovo nie je preto, slovo je definované inherentnými kvalitami – nie je to „mechanická aglomerácia“ takýchto kvalít – ale preto, že je definované ako prvok v systéme, „štrukturálny celok“ jazyka.

Takáto relačná (alebo „diakritická“) definícia entity riadi koncepciu všetkých prvkov jazyka v štrukturálnej lingvistike. Najzreteľnejšie je to v najpôsobivejšom úspechu saussurovskej lingvistiky, vo vývoji konceptov „foném“ a „charakteristických čŕt“ jazyka. Fonémy sú najmenšie artikulované a označovacie jednotky jazyka. Nie sú to zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, o ktorých hovorí Saussure, ktoré hovoriaci vnímajú – fenomenálne vnímané – ako prenášajúce význam. (Elmar Holenstein teda opisuje Jakobsonovu lingvistiku, ktorá dôležitým spôsobom nasleduje Saussura, ako „fenomenologický štrukturalizmus.“) Z tohto dôvodu vedúci hovorca pražského školského štrukturalizmu Jan Mukařovský v roku 1937 poznamenal, že „štruktúra . . . je fenomenologická a nie empirická realita; nejde o dielo samotné, ale o súbor funkčných vzťahov, ktoré sa nachádzajú vo vedomí kolektívu (generácie, prostredia atď.)“ (cit. v Galan 35). Podobne Levi-Strauss, vedúci hovorca francúzskeho štrukturalizmu v roku 1960 poznamenal, že „štruktúra nemá zreteľný obsah; je to obsah sám o sebe a logická organizácia, v ktorej je zatknutý, je koncipovaná ako vlastnosť skutočného“ (167; pozri tiež Jakobson, Fundamentals 27-28).

Fonémy, najmenšie vnímateľné prvky jazyka, teda nie sú pozitívnymi objektmi, ale „fenomenologickou realitou“. Napríklad v angličtine sa fonéma /t/ môže vyslovovať mnohými rôznymi spôsobmi, ale vo všetkých prípadoch ju anglicky hovoriaci rozpozná, že funguje ako /t/. Nasávané t (t. j. t vyslovené s nádychom podobným h po ňom), vysoký alebo nízky zvuk t, predĺžený zvuk t atď., budú všetky fungovať rovnakým spôsobom pri rozlišovaní významu „to“ a „do“ v angličtine. Okrem toho rozdiely medzi jazykmi sú také, že fonologické variácie v jednom jazyku môžu predstavovať odlišné fonémy v inom jazyku; angličtina teda rozlišuje medzi /l/ a /r/, zatiaľ čo iné jazyky sú tak štruktúrované, že tieto artikulácie sa považujú za variácie tej istej fonémy (ako aspirované a nenasávané t v angličtine). V každom prirodzenom jazyku je obrovské množstvo možných slov kombináciou malého počtu foném. Angličtina má napríklad menej ako 40 foném, ktoré dohromady tvoria viac ako milión rôznych slov.

Samotné fonémy jazyka sú systematicky organizovanými štruktúrami znakov. V 20. a 30. rokoch 20. storočia po Saussurovom vedení Jakobson a N. S. Trubetzkoy izolovali „rozlišovacie črty“ foném. Tieto črty sú založené na fyziologickej štruktúre rečových orgánov – jazyka, zubov, hlasiviek atď. Saussure v Kurze spomína a Harris to opisuje ako „fyziologickú fonetiku“ (39; Baskinov skorší preklad používa termín „fonológia“ [(1959) 38]) – a spájajú sa do „zväzkov“ binárnych opozícií, aby vytvorili fonémy. Napríklad v angličtine je rozdiel medzi /t/ a /d/ prítomnosťou alebo absenciou „hlasu“ (zapojenie hlasiviek) a na úrovni vyjadrenia sa tieto fonémy vzájomne definujú. Týmto spôsobom je fonológia špecifickým príkladom všeobecného pravidla jazyka opísaného Saussurom: V jazyku sú len rozdiely. ešte dôležitejšie: rozdiel vo všeobecnosti zahŕňa pozitívne pojmy, medzi ktorými je rozdiel stanovený; ale v jazyku sú len rozdiely bez kladných výrazov. Či už berieme označované alebo označujúce, jazyk nemá ani idey, ani zvuky, ktoré existovali pred jazykovým systémom. (120)

V tomto rámci nie sú jazykové identity určené inherentnými kvalitami, ale systémovými ("štrukturálnymi") vzťahmi.

Povedal som, že fonológia „išla po vzore“ Saussura, pretože aj keď jeho analýza fyziológie tvorby jazyka „by sa v súčasnosti, ako hovorí Harris, „nazývala „fyzickou“, na rozdiel od „psychologickej“ alebo „funkčnej“. „“ (Čítanie 49), následne v Kurze artikuloval smer a obrysy funkčnej analýzy jazyka. Podobne jeho jediné rozšírené publikované dielo Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoáre o primitívnom systéme samohlások v indoeurópskych jazykoch), ktoré vyšlo v roku 1878, bolo plne situované do projektu 19. storočia historická lingvistika. Napriek tomu v rámci tejto práce, ako tvrdil Jonathan Culler, Saussure demonštroval „plodnosť myslenia o jazyku ako o systéme čisto vzťahových položiek, dokonca aj keď pracuje na úlohe historickej rekonštrukcie“ (Saussure 66). Analýzou systematických štrukturálnych vzťahov medzi fonémami na vysvetlenie vzorcov striedania samohlások v existujúcich indoeurópskych jazykoch Saussure naznačil, že okrem niekoľkých rôznych foném /a/ musela existovať ešte jedna fonéma, ktorú by bolo možné formálne opísať. „To, čo robí Saussurovu prácu takou pôsobivou,“ uzatvára Culler, „je skutočnosť, že takmer o päťdesiat rokov neskôr, keď bola objavená a rozlúštená chetitčina v klinovom písme, sa zistilo, že obsahuje fonému napísanú h, ktorá sa správa tak, ako Saussure predpovedal. . Čisto formálnou analýzou objavil to, čo je dnes známe ako hrtan indoeurópsky“ (66).

Táto koncepcia relačného alebo diakritického určenia prvkov významu, ktorá je v kurze implicitná aj explicitná, naznačuje tretí predpoklad, ktorým sa riadi štrukturálna lingvistika, čo Saussure nazýva „svojvoľná povaha znaku“. Tým chce povedať, že vzťah medzi označujúcim a označovaným v jazyku nie je nikdy nevyhnutný (alebo „motivovaný“): možno rovnako ľahko nájsť zvukový označujúci arbre ako strom označujúci, aby sa spojili s pojmom „strom“. Okrem toho to však znamená, že aj označované je ľubovoľné: pojem „strom“ by sa dal definovať rovnako ľahko podľa kvality dreva (čo by vylučovalo palmy), ako aj podľa veľkosti (čo vylučuje „nízke dreviny“, ktoré volacie kríky). To by malo objasniť, že číslovanie predpokladov, ktoré uvádzam, nepredstavuje poradie priorít: každý predpoklad – systémová povaha signifikácie (najlepšie pochopiteľné štúdiom jazyka „synchrónne“), relačná alebo „diakritická“ povaha prvkov významu, svojvoľnosť znakov – odvodzuje svoju hodnotu od ostatných.

To znamená, že saussurovská lingvistika javy, ktoré študuje, v preklenujúcich vzťahoch kombinácie a kontrastu v jazyku. V tejto koncepcii je jazyk procesom artikulácie významu (označenia) aj jeho produktom (komunikácia), pričom tieto dve funkcie jazyka nie sú ani identické, ani úplne kongruentné (pozri Schleifer, „Deconstruction“). Tu môžeme vidieť striedanie formy a obsahu, ktoré Greimas a Courtes opisujú v modernistickej interpretácii: jazyk predstavuje kontrasty, ktoré formálne definujú jeho jednotky, a tieto jednotky sa spájajú na nasledujúcich úrovniach, aby vytvorili označujúci obsah. Keďže prvky jazyka sú ľubovoľné, navyše ani kontrast ani kombináciu nemožno považovať za základné. V jazyku sa teda rozlišovacie znaky spájajú a vytvárajú kontrastné fonémy na inej úrovni vnímania, fonémy sa spájajú a vytvárajú kontrastné morfémy, morfémy sa spájajú a vytvárajú slová, slová sa spájajú do viet atď. V každom prípade je celá fonéma, slovo alebo veta a tak ďalej väčšia ako súčet jej častí (rovnako ako voda, H2O, v Saussureovom príklade [(1959) 103] je viac ako mechanická aglomerácia vodíka a kyslíka).

Tri predpoklady Kurzu všeobecnej lingvistiky viedli Saussura k volanie po novej vede dvadsiateho storočia, ktorá by presahovala rámec lingvistickej vedy a skúmala „život znakov v spoločnosti“. Saussure nazval túto vedu „sémiológia (z gréckeho semeion „znamenie“)“ (16). „Veda“ semiotiky, ako sa začala praktizovať vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch 20. storočia, rozšírila štúdium jazyka a jazykových štruktúr na literárne artefakty tvorené (alebo artikulované) týmito štruktúrami. Počas konca svojej kariéry, dokonca aj keď ponúkal kurzy všeobecnej lingvistiky, Saussure pokračoval vo vlastnej „semiotickej“ analýze neskorej latinskej poézie v snahe objaviť zámerne skryté anagramy vlastných mien. Metóda štúdia bola v mnohých ohľadoch opakom funkčného racionalizmu jeho lingvistických analýz: pokúšala sa, ako Saussure spomína v jednom z 99 zošitov, v ktorých sa venoval tejto štúdii, systematicky skúmať problém „náhody“, ktorý „... sa stáva nevyhnutným základom všetkého“ (cit. v Starobinski 101). Takáto štúdia, ako hovorí sám Saussure, sa zameriava na „hmotný fakt“ náhody a zmyslu (cit. 101), takže „tematické slovo“, ktorého anagram Saussure hľadá, ako tvrdí Jean Starobinski, „je pre básnika , nástroj a nie životne dôležitý zárodok básne. Od básne sa vyžaduje, aby znovu použila fonické materiály tematického slova“ (45). Starobinski v tejto analýze hovorí: "Saussure sa nestratil pri hľadaní skrytých významov." Namiesto toho sa zdá, že jeho práca demonštruje túžbu vyhnúť sa všetkým problémom vyplývajúcim z vedomia: „Keďže poézia nie je realizovaná len slovami, ale je niečím, čo sa rodí zo slov, uniká svojvoľnej kontrole vedomia a závisí výlučne od druhu jazykovej zákonnosti. “ (121).

Ide o Saussurov pokus objaviť vlastné mená v neskorej latinskej poézii – čo Tzvetan Todorov nazýva redukciou „slova“. . . k jeho signifikantovi“ (266) – zdôrazňuje jeden z prvkov, ktoré riadili jeho lingvistickú analýzu, svojvoľnú povahu znaku. (Zdôrazňuje aj formálny charakter saussurovskej lingvistiky – „jazyk,“ tvrdí, „je formou a nie substancia" - ktorá účinne eliminuje sémantiku ako hlavný predmet analýzy.) Ako Todorov uzatvára, Saussureova práca sa dnes javí ako pozoruhodne homogénna v tom, že odmieta akceptovať symbolické javy. . . . Vo svojom výskume anagramov venuje pozornosť iba javom opakovania, nie javom vyvolávania. . . . Vo svojich štúdiách o Nibelungoch rozpoznáva symboly len preto, aby ich pripísal chybným čítaniam: keďže nie sú úmyselné, symboly neexistujú. Napokon sa vo svojich kurzoch všeobecnej lingvistiky zamýšľa nad existenciou semiológie, a teda aj iných znakov ako lingvistických; ale toto tvrdenie je zároveň obmedzené skutočnosťou, že semiológia je venovaná jedinému typu znakov: tým, ktoré sú ľubovoľné. (269-70)

Ak je to pravda, je to preto, že Saussure si nedokázal predstaviť „zámer“ bez subjektu; nemohol celkom uniknúť protikladu medzi formou a obsahom, čo jeho dielo natoľko spochybňovalo. Namiesto toho sa uchýlil k „jazykovej zákonnosti“. Nachádza sa medzi koncepciami dejín, subjektivity a kauzálnej interpretácie z devätnásteho storočia na jednej strane a medzi „štrukturalistickými“ koncepciami dvadsiateho storočia toho, čo Levi-Strauss nazýval „kantovstvo bez transcendentálny subjekt“ (citované v Connerton 23) – koncepty, ktoré stierajú protiklad medzi formou a obsahom (alebo subjektom a objektom) a hierarchiou popredia a pozadia v plnohodnotnom štrukturalizme, psychoanalýze a dokonca aj kvantovej mechanike – dielo Ferdinanda de Saussure v lingvistike a semiotike ohraničuje signálny moment v štúdiu významu a kultúry.

Ronald Schleifer

Dodatok 2

Ferdinand de Saussure (preklad)

Švajčiarsky lingvista Ferdinand de Saussure (1857-1913) je považovaný za zakladateľa modernej lingvistiky - vďaka jeho pokusom popísať štruktúru jazyka, a nie históriu jednotlivých jazykov a slovných foriem. Základy štrukturálnych metód v lingvistike a literárnej kritike a do značnej miery aj semiotike položil v jeho dielach na samom začiatku 20. storočia. Je dokázané, že metódy a koncepty takzvaného „postštrukturalizmu“, vyvinuté v dielach Jacquesa Derridu, Michela Foucaulta, Jacquesa Lacana, Julie Kristevovej, Rolanda Barthesa a iných, siahajú až k lingvistickým dielam Saussura a ďalších. anagramatické čítania neskororímskej poézie. Je potrebné poznamenať, že Saussureova práca o lingvistike a lingvistickej interpretácii pomáha prepojiť širokú škálu intelektuálnych disciplín - od fyziky po literárne inovácie, psychoanalýzu a filozofiu začiatku dvadsiateho storočia. A. J. Greimas a J. Kurte v Semiotics and Language píšu: „Analytický slovník s názvom „Interpretácia“ ako nový druh interpretácie sa objavil na začiatku 20. storočia spolu s lingvistikou Saussura, fenomenológiou Husserla a psychoanalýzou. Freuda. V takom prípade „interpretácia nie je pripisovanie daného obsahu forme, ktorá by inak chýbala, ale je to parafráza, ktorá iným spôsobom formuluje rovnaký obsah významného prvku v rámci daného semiotického systému“ (159). ). V tomto chápaní „interpretácie“ sú forma a obsah neoddeliteľné; naopak, každá forma je naplnená sémantickým významom („zmysluplná forma“), takže interpretácia ponúka nové, podobné prerozprávanie niečoho zmysluplného v inom znakovom systéme.

Podobné chápanie formy a obsahu, ktoré prezentoval Claude Lévi-Strauss v jednom z kľúčových diel štrukturalizmu („Štruktúra a forma: Úvahy o dielach Vladimíra Proppa“), môžeme vidieť v Saussureho posmrtne vydanej knihe „Course in Všeobecná jazykoveda“ (1916, prel., 1959, 1983). Počas svojho života Saussure publikoval len málo, "Course" - jeho hlavné dielo - bolo zozbierané z poznámok študentov, ktorí navštevovali jeho prednášky zo všeobecnej lingvistiky v rokoch 1907-11. Saussure v kurze vyzval na „vedecké“ štúdium jazyka, pričom ho postavil do protikladu s komparatívno-historickou lingvistikou devätnásteho storočia. Toto dielo možno považovať za jeden z najväčších úspechov západného myslenia: berúc jednotlivé slová ako štrukturálne prvky jazyka za základ, historická (alebo „diachrónna“) lingvistika dokázala pôvod a vývoj západoeurópskych jazykov od r. bežný, indoeurópsky jazyk - a skorší protoindoeurópsky.

Saussure spochybnil práve túto štúdiu jedinečných výskytov slov so sprievodným predpokladom, že základnou „jednotkou“ jazyka je v skutočnosti pozitívna existencia týchto „slovných prvkov“. Jeho práca bola pokusom zredukovať mnohé fakty o jazyku náhodne študované komparatívnou lingvistikou na malý počet teorémov. Porovnávacia filologická škola 19. storočia, píše Saussure, „nepodarila sa vytvoriť skutočnú lingvistickú školu“, pretože „nepochopila podstatu predmetu štúdia“ (3). Táto „podstata“ podľa neho nespočíva len v jednotlivých slovách – „pozitívnych substanciách“ jazyka – ale aj vo formálnych spojeniach, ktoré napomáhajú existencii týchto substancií.

Saussurov „test“ jazyka je založený na troch predpokladoch. Po prvé, vedecké chápanie jazyka nie je založené na historickom, ale na štrukturálnom fenoméne. Preto rozlišoval medzi jednotlivými javmi jazyka – „udalosťami reči“, ktoré definuje ako „podmienečné prepustenie“ – a vlastným, podľa neho, predmetom štúdia lingvistiky, systémom (kódom, štruktúrou), ktorý tieto udalosti riadi ( "jazyk"). Takéto systematické štúdium si navyše vyžaduje skôr „synchrónne“ poňatie vzťahu medzi prvkami jazyka v danom momente, než „diachrónne“ štúdium vývoja jazyka prostredníctvom jeho dejín.

Táto hypotéza bola predchodcom toho, čo by Roman Jakobson v roku 1929 nazval „štrukturalizmom“ – teóriou, v ktorej „akýkoľvek súbor javov skúmaných modernou vedou nie je považovaný za mechanickú akumuláciu, ale za štrukturálny celok, v ktorom konštruktívna zložka koreluje s funkcia" ("Romantický "711). V tejto pasáži Jakobson sformuloval Saussurovu myšlienku definovania jazyka ako štruktúry, na rozdiel od „mechanického“ vymenovania historických udalostí. Okrem toho Jakobson rozvíja ďalší saussurovský predpoklad, ktorý sa stal predchodcom štrukturálnej lingvistiky: základné prvky jazyka by sa nemali skúmať ani tak v súvislosti s ich príčinami, ale s ich funkciami. Samostatné javy a udalosti (povedzme história pôvodu jednotlivých indoeurópskych slov) by sa nemali študovať samy osebe, ale v systéme, v ktorom sú korelované s podobnými komponentmi. Išlo o radikálny obrat v porovnávaní javov s okolitou realitou, ktorého význam porovnával filozof Ernst Cassirer s „Galileovou vedou, ktorá zmenila predstavy o hmotnom svete v 17. storočí“. , ako poznamenávajú Greimas a Kurthe, mení myšlienku „interpretácie“, následne aj samotné vysvetlenia. Javy sa začali interpretovať nie vo vzťahu k príčinám ich výskytu, ale vo vzťahu k účinku, ktorý môžu mať na prítomnosť a budúcnosť.Výklad prestal byť nezávislý od zámerov človeka (napriek tomu, že zámery môžu byť neosobné, „nevedomé“ vo freudovskom zmysle slova).

Saussure vo svojej lingvistike ukazuje najmä tento obrat v zmene pojmu slova v lingvistike, ktoré definuje ako znak a popisuje z hľadiska jeho funkcií. Znakom je pre neho spojenie zvuku a významu, „označené a označenie“ (66-67; v anglickom preklade z roku 1983 od Roya Harrisa – „označenie“ a „signál“). Povaha tejto zlúčeniny je "funkčná" (ani jeden, ani druhý prvok nemôže existovať jeden bez druhého); navyše „jeden si požičiava vlastnosti od druhého“ (8). Saussure teda definuje hlavný štrukturálny prvok jazyka – znak – a robí základom historickej lingvistiky identitu znakov so slovami, čo si vyžaduje obzvlášť dôslednú analýzu. Preto môžeme chápať rôzne významy povedzme toho istého slova „strom“ – nie preto, že slovo je len súborom určitých vlastností, ale preto, že je definované ako prvok v systéme znakov, v „štrukturálnom celku“, v jazyku.

Takýto relatívny („diakritický“) koncept jednoty je základom konceptu všetkých prvkov jazyka v štruktúrnej lingvistike. Je to zreteľné najmä v najoriginálnejšom objave saussurovskej lingvistiky, vo vývoji konceptu „foném“ a „rozlišovacích znakov“ jazyka. Fonémy sú najmenšie z hovorených a zmysluplných jazykových jednotiek. Nie sú to len zvuky, ktoré sa vyskytujú v jazyku, ale „zvukové obrazy“, poznamenáva Saussure, ktoré rodení hovoriaci vnímajú ako význam. (Treba poznamenať, že Elmar Holenstein nazýva Jakobsonovu lingvistiku, ktorá vo svojich hlavných ustanoveniach pokračuje v myšlienkach a konceptoch Saussura, „fenomenologický štrukturalizmus“). Preto popredný rečník Pražskej školy štrukturalizmu Jan Mukarowski v roku 1937 poznamenal, že „štruktúra. . . nie empirický, ale fenomenologický koncept; nejde o samotný výsledok, ale o súbor významných vzťahov kolektívneho vedomia (generácie, iných atď.)“. Podobnú myšlienku vyslovil v roku 1960 Lévi-Strauss, líder francúzskeho štrukturalizmu: „Štruktúra nemá určitý obsah; je zmysluplný sám o sebe a logická konštrukcia, v ktorej je uzavretý, je odtlačkom reality.

Fonémy ako najmenšie lingvistické prvky prijateľné pre vnímanie zase predstavujú samostatnú integrálnu „fenomenologickú realitu“. Napríklad v angličtine môže byť zvuk „t“ vyslovovaný inak, ale vo všetkých prípadoch ho človek, ktorý hovorí po anglicky, bude vnímať ako „t“. Nasávanie, zdvihnutie alebo spustenie, dlhý zvuk „t“ atď. rovnako rozlíši význam slov „do“ a „urobiť“. Okrem toho rozdiely medzi jazykmi sú také, že odrody jedného zvuku v jednom jazyku môžu zodpovedať rôznym fonémam v inom; napríklad „l“ a „r“ v angličtine sú odlišné, zatiaľ čo v iných jazykoch sú to varianty tej istej fonémy (ako anglické „t“, vyslovované s aspiráciou a bez nej). Obrovská slovná zásoba každého prirodzeného jazyka je súborom kombinácií oveľa menšieho počtu foném. Napríklad v angličtine sa na vyslovenie a napísanie asi milióna slov používa iba 40 foném.

Zvuky jazyka sú systematicky organizovaným súborom funkcií. V 20-tych až 30-tych rokoch 20. storočia, po Saussure, Jacobson a N.S. Trubetskoy vyčlenili „charakteristické črty“ foném. Tieto znaky sú založené na štruktúre rečových orgánov – jazyk, zuby, hlasivky – Saussure si to všíma v „Kurse všeobecnej lingvistiky“ a Harris to nazýva „fyziologická fonetika“ (v Baskinovom skoršom preklade termín „fonológia " sa používa) - sú spojené do "uzlov » durg proti priateľovi, aby vydával zvuky. Napríklad v angličtine je rozdiel medzi „t“ a „d“ prítomnosťou alebo absenciou „hlasu“ (napätie hlasiviek) a úrovňou hlasu, ktorá odlišuje jednu fonému od druhej. Za príklad všeobecného jazykového pravidla opísaného Saussurom možno teda považovať fonológiu: „V jazyku sú len rozdiely.“ Ešte dôležitejšie nie je toto: rozdiel zvyčajne zahŕňa presné podmienky, medzi ktorými sa nachádza; ale v jazyku sú len rozdiely bez presných podmienok. Či už uvažujeme o „označovaní“ alebo „označovanom“ – v jazyku neexistujú pojmy ani zvuky, ktoré by existovali pred vývojom jazykového systému.

V takejto štruktúre sa lingvistické analógie nedefinujú pomocou ich inherentných kvalít, ale pomocou systémových („štrukturálnych“) vzťahov.

Už som spomenul, že fonológia sa vo svojom vývoji opierala o myšlienky Saussura. Hoci jeho analýza lingvistickej fyziológie v modernej dobe, hovorí Harris, „by sa volala „fyzická“, na rozdiel od „psychologickej“ alebo „funkčnej“, v Kurze jasne formuloval smer a základné princípy funkčnej analýzy jazyka. Jeho jediné dielo vydané počas jeho života, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Poznámky k pôvodnému samohláskovému systému v indoeurópskych jazykoch), vydané v roku 1878, bolo úplne v súlade s porovnávacou historickou lingvistikou 19. storočie. Napriek tomu v tejto práci, hovorí Jonathan Culler, Saussure ukázal „plodnosť myšlienky jazyka ako systému vzájomne prepojených javov, dokonca aj s jeho historickou rekonštrukciou“. Pri analýze vzťahu medzi fonémami, vysvetlením striedania samohlások v moderných jazykoch indoeurópskej skupiny Saussure navrhol, že okrem niekoľkých rôznych zvukov „a“ musia existovať aj iné fonémy, ktoré sú formálne opísané. „Na Saussureho diele pôsobí zvláštny dojem,“ uzatvára Kaller, „že takmer o 50 rokov neskôr, keď bolo objavené a rozlúštené klinové písmo Chetitov, bola nájdená fonéma v písme označená „h“, ktorá sa správala tak, ako Saussure predpovedal. Prostredníctvom formálnej analýzy objavil to, čo je dnes v indoeurópskych jazykoch známe ako hrdelný zvuk.

V koncepte relatívnej (diakritickej) definície znakov, explicitných aj implikovaných v kurze, existuje tretí kľúčový predpoklad štrukturálnej lingvistiky, ktorý Saussure nazval „ľubovoľná povaha znaku“. To znamená, že vzťah medzi zvukom a významom v jazyku nie je ničím motivovaný: rovnako ľahko možno spojiť slovo „arbre“ a slovo „strom“ s pojmom „strom“. Navyše to znamená, že aj zvuk je ľubovoľný: pojem „strom“ možno definovať prítomnosťou kôry (okrem paliem) a veľkosťou (okrem „nízkych drevín“ – kríkov). Z toho by malo byť zrejmé, že všetky predpoklady, ktoré uvádzam, nie sú rozdelené na viac a menej dôležité: každý z nich - systémová povaha znakov (najzrozumiteľnejšia pri "synchrónnom" štúdiu jazyka), ich relatívna (diakritická) podstata, svojvoľná povaha znakov – pochádza z ostat.

V saussurovskej lingvistike sa teda skúmaný jav chápe ako súbor prirovnaní a opozícií jazyka. Jazyk je vyjadrením významu slov (označenie) aj ich výsledkom (komunikáciou) – a tieto dve funkcie sa nikdy nezhodujú (pozri Shleiferovu „Dekonštrukciu jazyka“). Striedanie formy a obsahu, ktoré popisujú Greimas a Kurte, môžeme vidieť v najnovšej verzii interpretácie: jazykové kontrasty definujú jej štruktúrne jednotky a tieto jednotky interagujú na postupných úrovniach a vytvárajú určitý zmysluplný obsah. Keďže prvky jazyka sú náhodné, základom nemôže byť ani kontrast, ani kombinácia. To znamená, že v jazyku distinktívne znaky tvoria fonetický kontrast na inej úrovni porozumenia, fonémy sa spájajú do kontrastných morfém, morfémy - do slov, slová - do viet atď. V každom prípade celá fonéma, slovo, veta atď. je viac ako súčet jeho častí (rovnako ako voda, v Saussureovom príklade, je viac ako kombinácia vodíka a kyslíka).

Tri predpoklady „kurzu všeobecnej lingvistiky“ viedli Saussura k myšlienke novej vedy dvadsiateho storočia, oddelenej od lingvistiky, ktorá by študovala „život znakov v spoločnosti“. Saussure nazval túto vedu semiológiou (z gréckeho "semeion" - znak). „Veda“ semiotika, ktorá sa rozvíjala vo východnej Európe v 20. a 30. rokoch 20. storočia a v Paríži v 50. a 60. rokoch, rozšírila štúdium jazyka a jazykových štruktúr na literárne poznatky komponované (alebo formulované) s týmito štruktúrami. Okrem toho, v súmraku svojej kariéry, súbežne s kurzom všeobecnej lingvistiky, sa Saussure zaoberal „semiotickou“ analýzou neskororímskej poézie a snažil sa objaviť zámerne zostavené anagramy vlastných mien. Táto metóda bola vo svojej lingvistickej analýze v mnohom protikladom racionalizmu: išlo o pokus, ako píše Saussure v jednom z 99 zošitov, študovať v systéme problém „pravdepodobnosti“, ktorý „sa stáva základom všetkého. " Takéto vyšetrovanie, tvrdí sám Saussure, pomáha zamerať sa na „skutočnú stránku“ pravdepodobnosti; „Kľúčové slovo“, pre ktoré Saussure hľadá anagram, je podľa Jeana Starobinského „nástrojom pre básnika, a nie zdrojom života pre báseň. Báseň slúži na prevrátenie zvukov kľúčového slova. Podľa Starobinského sa v tejto analýze "Saussure neponára do hľadania skrytých významov." Naopak, v jeho dielach je badateľná túžba vyhnúť sa otázkam súvisiacim s vedomím: „keďže poézia sa nevyjadruje len slovami, ale aj tým, čo tieto slová vyvolávajú, ide mimo kontrolu vedomia a závisí len od jazykové zákony“.

Saussureho pokus o štúdium vlastných mien v neskororímskej poézii (Cvetan Todorov to nazval skratkou „slova... len predtým, ako je napísané“), zdôrazňuje jednu zo zložiek jeho lingvistickej analýzy – svojvoľnosť znakov, ako aj formálna podstata saussurovskej lingvistiky ("Jazyk," tvrdí, "podstatou je forma, nie jav"), čo vylučuje možnosť analýzy významu. Todorov uzatvára, že dnešné Saussureove spisy sa zdajú byť pozoruhodne konzistentné v ich neochote študovať symboly [javy, ktoré majú presne definovaný význam]. . . . Saussure pri skúmaní anagramov venuje pozornosť iba opakovaniu, ale nie predchádzajúcim možnostiam. . . . Pri štúdiu knihy Nibelungov definuje symboly len preto, aby ich priradil k chybným údajom: ak sú neúmyselné, symboly neexistujú. Veď vo svojich spisoch o všeobecnej lingvistike vychádza z predpokladu existencie semiológie, ktorá opisuje nielen jazykové znaky; ale tento predpoklad je obmedzený skutočnosťou, že semilógia môže opísať iba náhodné, ľubovoľné znaky.

Ak je to naozaj tak, je to len preto, že si nevedel predstaviť „zámer“ bez predmetu; nedokázal úplne preklenúť priepasť medzi formou a obsahom – v jeho spisoch sa to zmenilo na otázku. Namiesto toho sa obrátil na „jazykovú legitimitu“. Na jednej strane medzi koncepciami devätnásteho storočia založenými na histórii a subjektívnych dohadoch a metódami náhodnej interpretácie založenej na týchto koncepciách a na druhej strane medzi štrukturalistickými koncepciami, ktoré Lévi-Strauss nazval „kantovstvom bez transcendentného aktéra“. “ – vymazanie protikladu medzi formou a obsahom (predmetom a objektom), významom a pôvodom v štrukturalizme, psychoanalýze a dokonca aj v kvantovej mechanike, spisy Ferlinanda de Saussura o lingvistike a semiotike predstavujú zlomový bod v štúdiu významov v jazyku a kultúre.

Ronald Shleifer

Literatúra

1. Admoni V.G. Základy teórie gramatiky / V.G. Admoni; Akadémia vied ZSSR.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematické metódy v lingvistike. M., 1974.

4. Arnold I.V. Sémantická štruktúra slova v modernej angličtine a metodológia jej štúdia. /I.V. Arnold-L .: Vzdelávanie, 1966. - 187 s.

6.Bashlykov A.M. Systém automatického prekladu. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7.Baudouin de Courtenay: Teoretické dedičstvo a modernita: Abstrakty správ z medzinárodnej vedeckej konferencie / Ed.I.G. Kondratiev. - Kazaň: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Prvky matematickej lingvistiky. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Jazyk a štatistika. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretická a aplikovaná lingvistika. / V.A. Zvegincev - M., 1969. - 143 s.

11. Kasevič, V.B. Sémantika. Syntax. Morfológia. // V.B. Kasevič - M., 1988. - 292 s.

12. Lekomtsev Yu.K. ÚVOD do formálneho jazyka lingvistiky / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. Jazykové dedičstvo Baudouina de Courtenay na konci 20. storočia: Abstrakty z medzinárodnej vedeckej a praktickej konferencie 15. – 18. marca 2000. - Krasnojarsk, 2000. - 125 s.

Matveeva G.G. Skryté gramatické významy a identifikácia sociálnej osoby („portrét“) hovoriaceho / G.G. Matvejev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Skúsenosti s budovaním lingvistických modelov „Význam<-->Text". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Preklad a aplikovaná lingvistika / L.L. Nelyubin. - M.: Vyššia škola, 1983. - 207 s.

16. O exaktných metódach výskumu jazyka: o takzvanej „matematickej lingvistike“ / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva a ďalší - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematická lingvistika: Učebnica / L.G. Piotrovsky, K.B. Bektajev, A.A. Piotrovskaja. - M.: Vyššia škola, 1977. - 160 s.

18. On je. Text, stroj, osoba. - L., 1975. - 213 s.

19. On je. Aplikovaná lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. jazykové modely. M., 1963. Revzin, I.I. Moderná štruktúrna lingvistika. Problémy a metódy. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Základy všeobecného a strojového prekladu / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teória F. de Saussura vo svetle modernej lingvistiky / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Sova, L.Z. Analytická lingvistika / L.Z. Sova - M., 1970. - 192 s.

24. Saussure F. de. Poznámky zo všeobecnej lingvistiky / F. de Saussure; Za. od fr. - M.: Progress, 2000. - 187 s.

25. On je. Kurz všeobecnej lingvistiky / Per. od fr. - Jekaterinburg, 1999. -426 s.

26. Štatistika reči a automatická analýza textu / Ed. vyd. R.G. Piotrovského. L., 1980. - 223 s.

27. Štoll, P. Sady. Logika. Axiomatické teórie / R. Stoll; Za. z angličtiny. - M., 1968. - 180 s.

28. Tenier, L. Základy štruktúrnej syntaxe. M., 1988.

29. Ubin I.I. Automatizácia prekladateľských činností v ZSSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tichomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderná matematika. M., 1966.

31. Shenk, R. Spracovanie pojmových informácií. M., 1980.

32. Shikhanovič, Yu.A. ÚVOD do modernej matematiky (počiatočné pojmy). M., 1965

33. Shcherba L.V. Ruské samohlásky z kvalitatívneho a kvantitatívneho hľadiska / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Občan sveta // Spark - 1996. - č.5. - str.13

35. V.A. Uspenského. Predbežné pre čitateľov „Novej literárnej revue“ k semiotickým posolstvám Andreja Nikolajeviča Kolmogorova. - Nová literárna revue. -1997. - č. 24. - S. 18-23

36. Perlovský L. Vedomie, jazyk a kultúra. - Poznanie je moc. -2000. №4 - S. 20-33

Úvod? Prednáška Teória prekladu