Kielellinen tietosanakirja. Vertailevan kielitieteen matemaattiset menetelmät

Rakennekielitieteen muodostuminen 1800-1900-luvun vaihteessa. Tilastolliset menetelmät kieltenoppimisessa. Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla. Kielen oppiminen muodollisen logiikan menetelmillä. Konekäännösten ominaisuudet.

JOHDANTO

Luku 1. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1. Rakennekielitieteen muodostuminen 1800-1900-luvun vaihteessa

1.2. Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1. Konekäännös

2.2.Tilastolliset menetelmät kieltenoppimisessa

2.3. Kielen oppiminen muodollisen logiikan menetelmillä

2.4. Matemaattisten menetelmien soveltamisen mahdollisuudet kielitieteessä

Johtopäätös

Kirjallisuus

Liite 1. Ronald Schleifer. Ferdinand de Saussure

Liite 2. Ferdinand de Saussure (käännös)

JOHDANTO

1900-luvulla on jatkunut suuntaus eri tiedonalojen vuorovaikutukseen ja tunkeutumiseen. Yksittäisten tieteiden väliset rajat hämärtyvät vähitellen; on yhä enemmän henkisen toiminnan aloja, jotka ovat humanitaarisen, teknisen ja luonnontieteellisen tiedon "risteyksessä".

Toinen nykyaikaisuuden ilmeinen piirre on halu tutkia rakenteita ja niiden osatekijöitä. Siksi matematiikalle annetaan yhä suurempi paikka sekä tieteellisessä teoriassa että käytännössä. Matematiikka tunkeutuu yhä syvemmälle ja syvemmälle niille alueille, joita pidettiin pitkään puhtaina. "humanitaarinen", laajentamalla heidän heuristista potentiaaliaan (vastaus kysymykseen "kuinka paljon" auttaa usein vastaamaan kysymyksiin "mitä" ja "miten"). Kielitiede ei ollut poikkeus.

Kurssityöni tarkoituksena on tuoda lyhyesti esille matematiikan ja sellaisen kielitieteen haaran kuin kielitieteen välinen yhteys. 1950-luvulta lähtien matematiikkaa on käytetty kielitieteessä luomaan teoreettinen laite kielten (sekä luonnollisten että keinotekoisten) rakenteen kuvaamiseen. Samalla on sanottava, että se ei heti löytänyt sellaista käytännön sovellusta itselleen. Aluksi kielitieteen matemaattisia menetelmiä alettiin käyttää kielitieteen peruskäsitteiden selkiyttämiseen, mutta tietotekniikan kehittymisen myötä tällainen teoreettinen lähtökohta alkoi löytää käyttöä käytännössä. Sellaisten tehtävien, kuten konekääntämisen, koneellisen tiedonhaun, automaattisen tekstinkäsittelyn, ratkaiseminen vaati täysin uutta lähestymistapaa kieleen. Kielitieteilijät kohtasivat kysymyksen: kuinka oppia esittämään kielellisiä malleja siinä muodossa, jossa niitä voidaan soveltaa suoraan tekniikkaan. Aikamme suosittu termi "matemaattinen kielitiede" viittaa kaikkeen kielitieteelliseen tutkimukseen, jossa käytetään eksakteja menetelmiä (ja eksaktien menetelmien käsite liittyy aina läheisesti matematiikkaan). Jotkut viime vuosien tiedemiehet uskovat, että itse ilmaisua ei voi nostaa termin arvoon, koska se ei tarkoita mitään erityistä "kielitiedettä", vaan vain uutta suuntaa, joka keskittyy kielen tutkimusmenetelmien parantamiseen, tarkkuuden ja luotettavuuden lisäämiseen. . Kielitiede käyttää sekä kvantitatiivisia (algebrallisia) että ei-kvantitatiivisia menetelmiä, mikä tuo sen lähemmäksi matemaattista logiikkaa ja siten myös filosofiaa ja jopa psykologiaa. Jopa Schlegel pani merkille kielen ja tietoisuuden vuorovaikutuksen, ja 1900-luvun alun tunnettu kielitieteilijä Ferdinand de Saussure (kerron hänen vaikutuksestaan ​​kielitieteen matemaattisten menetelmien kehitykseen myöhemmin) yhdisti kielen rakenteen sen kuulumiseen. kansalle. Nykytutkija L. Perlovsky menee pidemmälle tunnistamalla kielen kvantitatiiviset ominaisuudet (esimerkiksi sukupuolten lukumäärät, tapaukset) kansallisen mentaliteetin erityispiirteisiin (tästä lisää luvussa 2.2, "Kielitieteen tilastolliset menetelmät").

Matematiikan ja kielitieteen vuorovaikutus on monitahoinen aihe, enkä käsittele työssäni kaikkea, vaan ennen kaikkea sen soveltavia puolia.

Luku IMatemaattisten menetelmien soveltamisen historiaa kielitieteessä

1.1 Rakennekielitieteen muodostuminenXIX - XX vuosisatojen vaihteessa

Kielen matemaattinen kuvaus perustuu ajatukseen kielestä mekanismina, joka juontaa juurensa 1900-luvun alun kuuluisaan sveitsiläiseen kielitieteilijään Ferdinand de Saussureen.

Hänen käsityksensä alkulinkki on teoria kielestä järjestelmänä, joka koostuu kolmesta osasta (kieli itsessään on Kieli, puhe - Salasana, ja puhetoiminta - Kieli), jossa jokaista sanaa (järjestelmän jäsentä) ei pidetä sellaisenaan, vaan muiden jäsenten yhteydessä. Kuten toinen merkittävä kielitieteilijä, tanskalainen Louis Hjelmslev, myöhemmin huomautti, Saussure "oli ensimmäinen, joka vaati rakenteellista lähestymistapaa kieleen, toisin sanoen kielen tieteellistä kuvausta kirjaamalla yksiköiden väliset suhteet".

Saussure, joka ymmärsi kielen hierarkkisena rakenteena, esitti ensimmäisenä ongelman kielellisten yksiköiden arvosta ja merkityksestä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa.

Saussuren kielen rakenneyksikkö piti sanaa "merkki", jossa ääni ja merkitys yhdistettiin. Mikään näistä elementeistä ei ole olemassa ilman toisiaan: siksi äidinkielenään puhuva ymmärtää polysemanttisen sanan merkityksen eri sävyt erillisenä elementtinä rakenteellisessa kokonaisuudessa, kielessä.

Näin ollen F. de Saussuren teoriassa voidaan nähdä kielitieteen vuorovaikutusta toisaalta sosiologian ja sosiaalipsykologian kanssa (on huomattava, että samaan aikaan kehittyvät Husserlin fenomenologia, Freudin psykoanalyysi, Einsteinin suhteellisuusteoria , kirjallisuudessa, musiikissa ja kuvataiteessa tehdään muoto- ja sisältökokeita, toisaalta matematiikan kanssa (systeemisyyden käsite vastaa algebrallista kielen käsitettä). Tällainen käsite muutti kielellisen tulkinnan käsitettä sellaisenaan: Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa nykyhetkeen ja tulevaisuuteen. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tietoisia" sanan freudilaisessa merkityksessä).

Kielellisen mekanismin toiminta ilmenee äidinkielenään puhuvien puhetoiminnan kautta. Puheen tuloksena ovat niin sanotut "oikeat tekstit" - puheyksiköiden sekvenssit, jotka noudattavat tiettyjä kuvioita, joista monet mahdollistavat matemaattisen kuvauksen. Syntaktisen rakenteen kuvaustapojen teoria käsittelee oikeiden tekstien (ensisijaisesti lauseiden) matemaattisen kuvauksen menetelmiä. Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Lännessä Saussuren ajatuksia kehittävät suuren sveitsiläisen kielitieteilijän nuoremmat aikalaiset: Tanskassa - jo mainitsemani L. Hjelmslev, joka synnytti teoksessaan "Kieliteorian perusteet" algebrallisen kieliteorian. USA - E. Sapir, L. Bloomfield, C. Harris, Tšekin tasavallassa - venäläinen emigranttitieteilijä N. Trubetskoy.

Tilastollisia säännönmukaisuuksia kielentutkimuksessa alkoi käsitellä ei kukaan muu kuin genetiikan perustaja Georg Mendel. Vasta vuonna 1968 filologit havaitsivat, että hänen elämänsä viimeisinä vuosina hän kiehtoi kielellisten ilmiöiden tutkimista matematiikan menetelmiä käyttäen. Mendel toi tämän menetelmän kielitieteeseen biologiasta; 1990-luvulla vain rohkeimmat lingvistit ja biologit väittivät tällaisen analyysin toteutettavuuden. Pyhän Pietarin luostarin arkistossa. Brnon Tomaszista, jonka apotti oli Mendel, löydettiin arkkeja, joissa oli sukunimien sarakkeita, jotka päättyivät "mann", "bauer", "mayer", ja joissa oli murto-osia ja laskelmia. Yrittääkseen löytää sukunimien alkuperän muodolliset lait Mendel tekee monimutkaisia ​​laskelmia, joissa hän ottaa huomioon saksan kielen vokaalien ja konsonanttien määrän, harkitsemiensa sanojen kokonaismäärän, sukunimien lukumäärän, jne.

Maamme rakennekielitiede alkoi kehittyä suunnilleen samaan aikaan kuin lännessä - 1800-1900-luvun vaihteessa. Samanaikaisesti F. de Saussuren kanssa Kazanin yliopiston professorit F.F. kehittivät töissään kielen käsitteen järjestelmänä. Fortunatov ja I.A. Baudouin de Courtenay. Jälkimmäinen vastasi pitkään de Saussuren kanssa, vastaavasti Geneven ja Kazanin kielitieteen koulut tekivät yhteistyötä keskenään. Jos Saussurea voidaan kutsua kielitieteen "tarkkojen" menetelmien ideologiksi, niin Baudouin de Courtenay loi käytännön perustan niiden soveltamiselle. Hän oli ensimmäinen, joka erotti kielitieteen (esim tarkka tilastollisia menetelmiä ja toiminnallista riippuvuutta käyttävä tiede) filologiasta (humanitaaristen tieteenalojen yhteisö, joka tutkii henkistä kulttuuria kielen ja puheen kautta). Tiedemies itse uskoi, että "kielitiede voi olla hyödyllistä lähitulevaisuudessa, vain vapautettuna pakollisesta liitosta filologian ja kirjallisuuden historian kanssa". Fonologiasta tuli "koekenttä" matemaattisten menetelmien käyttöönotolle kielitieteeseen - äänet kielijärjestelmän "atomeina", joilla oli rajoitettu määrä helposti mitattavissa olevia ominaisuuksia, olivat kätevintä materiaalia muodollisille, tiukoille kuvausmenetelmille. Fonologia kiistää äänen merkityksen olemassaolon, joten "ihminen" tekijä eliminoitiin tutkimuksissa. Tässä mielessä foneemit ovat kuin fyysisiä tai biologisia esineitä.

Foneemit pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä sfääriä, erillistä "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Tärkeintä on, että foneemi suorittaa päätehtävänsä. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla tai ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Kielen äänet ovat systemaattisesti järjestetty joukko ominaisuuksia. 1920-1930-luvuilla, Saussuren jälkeen, Jacobson ja N.S. Trubetskoy korostivat foneemien "erottuvat piirteet". Nämä ominaisuudet perustuvat puheelinten rakenteeseen - kieli, hampaat, äänihuulet. Esimerkiksi englannin kielessä ero "t":n ja "d":n välillä on "äänen" olemassaolo tai puuttuminen (äänihuulien jännitys) ja äänen taso, joka erottaa yhden foneemin toisesta. Näin ollen fonologiaa voidaan pitää esimerkkinä Saussuren kuvaamasta yleisestä kielisäännöstä: "Kielessä on vain eroja". Vielä tärkeämpää ei ole tämä: ero tarkoittaa yleensä tarkat olosuhteet, joiden välillä se sijaitsee; mutta kielessä on vain eroja ilman tarkkoja ehtoja. Tarkastellaanpa sitten "nimeämistä" tai "merkittyä" - kielessä ei ole käsitteitä eikä ääniä, jotka olisivat olleet olemassa ennen kielijärjestelmän kehitystä.

Näin ollen Saussurean kielitieteessä tutkittu ilmiö ymmärretään kielen vertailujen ja vastakohtien joukkona. Kieli on sekä sanojen merkityksen ilmaus että viestintäväline, eivätkä nämä kaksi toimintoa koskaan kohtaa. Voimme havaita muodon ja sisällön vuorottelua: kielelliset kontrastit määrittelevät sen rakenneyksiköt, ja nämä yksiköt muodostavat vuorovaikutuksessa tietyn merkityksellisen sisällön. Koska kielen elementit ovat satunnaisia, ei kontrasti tai yhdistelmä voi olla perusta. Tämä tarkoittaa, että kielessä tunnusmerkit muodostavat foneettisen kontrastin eri ymmärrystasolla, foneemit yhdistetään morfeemiksi, morfeemit - sanoiksi, sanat - lauseiksi jne. Joka tapauksessa kokonainen foneemi, sana, lause jne. on enemmän kuin vain osiensa summa.

Saussure ehdotti ajatusta uudesta 1900-luvun tieteestä, joka on erillinen kielitieteestä, joka tutkii merkkien roolia yhteiskunnassa. Saussure kutsui tätä tiedettä semiologiaksi (kreikan sanasta "semeion" - merkki). Semiotiikan "tiede", joka kehittyi Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näiden rakenteiden perusteella muodostetuiksi (tai artikuloiduiksi) kirjallisiksi löydöksiksi. Lisäksi uransa hämärässä, yleisen kielitieteen kurssin ohella, Saussure harjoitti myöhäisroomalaisen runouden "semioottista" analyysiä yrittäen löytää tarkoituksella laadittuja erisnimien anagrammeja. Tämä menetelmä oli monella tapaa rationalismin vastakohta lingvistisessä analyysissään: se oli yritys tutkia järjestelmässä kielen "todennäköisyyden" ongelmaa. Tällainen tutkimus auttaa keskittymään todennäköisyyden "todelliseen puoleen"; "avainsana", jolle Saussure etsii anagrammia, on Jean Starobinskyn mukaan "runoilijan työkalu, ei runon elämän lähde". Runon tarkoitus on vaihtaa avainsanan äänet. Starobinskyn mukaan tässä analyysissä "Saussure ei syvenny piilotettujen merkityksien etsimiseen". Päinvastoin, hänen teoksissaan on havaittavissa halu välttää tietoisuuteen liittyviä kysymyksiä: "koska runous ilmaistaan ​​paitsi sanoissa, myös siinä, mitä nämä sanat synnyttävät, se menee tietoisuuden hallinnan ulkopuolelle ja riippuu vain kielen lait” (katso . Liite 1).

Saussuren yritys tutkia erisnimiä myöhäisroomalaisessa runoudessa korostaa yhtä hänen kielellisen analyysinsä komponenteista - merkkien mielivaltaista luonnetta sekä Saussuren kielitieteen muodollista olemusta, joka sulkee pois mahdollisuuden analysoida merkitystä. Todorov päättelee, että nykyään Saussuren teokset näyttävät olevan erittäin johdonmukaisia ​​haluttomuudessaan tutkia ilmiön symboleja, joilla on selkeä merkitys [Liite 1]. Anagrammeja tutkiessaan Saussure kiinnittää huomiota vain toistoon, mutta ei aikaisempiin vaihtoehtoihin. . . . Nibelungia tutkiessaan hän määrittelee symbolit vain liittääkseen ne virheellisiin lukemiin: jos ne ovat tahattomia, symboleja ei ole olemassa. Loppujen lopuksi hän tekee yleisen kielitieteen kirjoituksissaan oletuksen semiologian olemassaolosta, joka ei kuvaa vain kielellisiä merkkejä; mutta tätä oletusta rajoittaa se tosiasia, että semiologia voi kuvata vain satunnaisia, mielivaltaisia ​​merkkejä.

Jos tämä todella on niin, se johtuu vain siitä, että hän ei voinut kuvitella "aikomusta" ilman esinettä; hän ei kyennyt täysin kuromaan umpeen muodon ja sisällön välistä kuilua - hänen kirjoituksissaan tämä muuttui kysymykseksi. Sen sijaan hän kääntyi "kieliseen legitiimiyteen". Toisaalta 1800-luvun historiaan ja subjektiivisiin olettamuksiin perustuvien käsitteiden ja näihin käsitteisiin perustuvien satunnaisen tulkintamenetelmien ja toisaalta muodon ja sisällön (subjektin ja objektin) vastakohtaisuutta pyyhkivien strukturalististen käsitteiden välillä, merkitys ja alkuperä strukturalismissa, psykoanalyysissä ja jopa kvanttimekaniikassa - Ferdinand de Saussuren kirjoitukset lingvistiikasta ja semiotiikasta merkitsevät käännekohtaa kielen ja kulttuurin merkityksien tutkimuksessa.

Venäläiset tiedemiehet olivat myös edustettuina ensimmäisessä kansainvälisessä kielitieteilijöiden kongressissa Haagissa vuonna 1928. S. Kartsevsky, R. Yakobson ja N. Trubetskoy tekivät raportin, jossa tarkasteltiin kielen hierarkkista rakennetta - viime vuosisadan alun nykyaikaisimpien ideoiden hengessä. Jakobson kehitti kirjoituksissaan Saussuren ajatuksia siitä, että kielen peruselementtejä tulisi tutkia ennen kaikkea niiden toimintojen, ei niiden esiintymisen syiden yhteydessä.

Valitettavasti Stalinin tultua valtaan vuonna 1924 venäläinen kielitiede, kuten monet muutkin tieteet, heitetään takaisin. Monet lahjakkaat tiedemiehet pakotettiin muuttamaan maasta, heidät karkotettiin maasta tai kuoli leireillä. Vasta 1950-luvun puolivälistä lähtien tietty teorioiden moniarvoisuus on tullut mahdolliseksi - tästä lisää luvussa 1.2.

1.2 Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

1900-luvun puoliväliin mennessä oli muodostunut neljä maailman kielellistä koulukuntaa, joista jokainen osoittautui tietyn "tarkan" menetelmän esi-isäksi. Leningradin fonologinen koulu(sen esi-isä oli Baudouin de Courtenay L.V. Shcherban oppilas) käytti äidinkielenään puhujien puheen analysointiin perustuvaa psykolingvististä koetta pääkriteerinä äänen yleistämiseksi foneemin muodossa.

Tiedemiehet Prahan kielitieteellinen ympyrä, erityisesti - sen perustaja N.S. Venäjältä muuttanut Trubetskoy kehitti oppositioteorian - kielen semanttista rakennetta kuvailivat ryhmänä oppositioon rakennettuja semanttisia yksiköitä - Sem. Tätä teoriaa sovellettiin paitsi kielen, myös taiteellisen kulttuurin tutkimuksessa.

Ideologit Amerikkalainen deskriptivismi olivat kielitieteilijät L. Bloomfield ja E. Sapir. Kieli esitettiin deskriptivisteille joukkona puhelauseita, jotka olivat heidän tutkimuksensa pääkohteena. Heidän painopisteensä oli tekstien tieteellisen kuvauksen (siis nimen) säännöissä: niiden elementtien organisoinnin, järjestelyn ja luokittelun tutkimisessa. Analyyttisten menettelyjen formalisointi fonologian ja morfologian alalla (kielen tutkimisen periaatteiden kehittäminen eri tasoilla, distributiivinen analyysi, suorien ainesosien menetelmä jne.) johti yleisten kielellisen mallinnuksen kysymysten muotoiluun. Välinpitämättömyys kielen sisältösuunnitelmaan ja kielen paradigmaattiseen puoleen ei antanut deskriptivistien tulkita kieltä riittävän täysin järjestelmänä.

1960-luvulla kehittyi muodollisten kielioppien teoria, joka syntyi pääasiassa amerikkalaisen filosofin ja kielitieteilijän N. Chomskyn työn ansiosta. Häntä pidetään oikeutetusti yhtenä kuuluisimmista nykyajan tiedemiehistä ja julkisuuden henkilöistä, hänelle on omistettu monia artikkeleita, monografioita ja jopa täyspitkä dokumentti. Chomskyn keksimän, perustavanlaatuisen uuden tavan kuvailla syntaktista rakennetta - generatiivista (generatiivista) kielioppia - nimitettiin vastaava kielitieteen suuntaus ns. generatiivisuus.

Chomsky, Venäjältä tulleiden maahanmuuttajien jälkeläinen, opiskeli kielitiedettä, matematiikkaa ja filosofiaa Pennsylvanian yliopistossa vuodesta 1945 lähtien vahvasti opettajansa Zelig Harrisin vaikutuksesta – kuten Harris, Chomsky piti ja pitää poliittisia näkemyksiään lähellä anarkismia (hän ​​on edelleen tunnetaan Yhdysvaltain nykyisen poliittisen järjestelmän kriitikkona ja yhtenä antiglobalismin henkisistä johtajista).

Chomskyn ensimmäinen suuri tieteellinen työ, pro gradu -työ "Modernin heprean morfologia » (1951) on jäänyt julkaisematta. Chomsky väitteli tohtoriksi Pennsylvanian yliopistosta vuonna 1955, mutta suuri osa hänen väitöskirjansa (julkaistu kokonaisuudessaan vasta vuonna 1975 otsikolla The Logical Structure of Linguistic Theory) ja hänen ensimmäisen monografiansa Syntactic Structures (1957, Rus. trans. 1962), esitettiin Harvardin yliopistossa vuosina 1951-1955. Samana vuonna 1955 tiedemies muutti Massachusetts Institute of Technologyyn, jossa hänestä tuli professori vuonna 1962.

Chomskyn teoria on käynyt läpi useita kehitysvaiheita.

Ensimmäisessä monografiassa "Syntaktiset rakenteet" tiedemies esitteli kielen mekanismina, jolla luodaan ääretön joukko lauseita käyttämällä rajallista joukkoa kieliopillisia keinoja. Kielellisten ominaisuuksien kuvaamiseksi hän ehdotti käsitteitä syvä (piilotettu suoralta havainnolta ja generoitu rekursiivisten eli toistuvasti sovellettavien sääntöjen) ja pinnan (suoraan havaittujen) kieliopillisten rakenteiden käsitteitä sekä muunnoksia, jotka kuvaavat siirtymää. syvistä rakenteista pintarakenteisiin. Useat pintarakenteet voivat vastata yhtä syvärakennetta (esimerkiksi passiivirakennetta Asetuksen allekirjoittaa presidentti johdettu samasta syvärakenteesta kuin aktiivinen konstruktio Presidentti allekirjoittaa asetuksen) ja päinvastoin (siis epäselvyys äiti rakastaa tytärtään kuvataan kahden eri syvän pintarakenteiden yhteensattuman tuloksena, joista toisessa äiti on se, joka rakastaa tytärtä, ja toisessa se, jota tytär rakastaa).

Chomskyn standarditeoriaa pidetään "Aspects"-mallina, joka on esitetty Chomskyn kirjassa "Aspects of the Theory of Syntax". Tässä mallissa ensimmäistä kertaa muodolliseen teoriaan otettiin käyttöön semanttisen tulkinnan säännöt, jotka antavat merkityksen syville rakenteille. Aspektissa kielellinen kompetenssi vastustetaan kielen käyttöä (suorituskykyä), omaksutaan ns. Katz-Postal-hypoteesi merkityksen säilymisestä muunnoksen aikana, jonka yhteydessä valinnaisen muunnoksen käsite suljetaan pois, ja laitteisto Leksikaalista yhteensopivuutta kuvaavat syntaktiset ominaisuudet otetaan käyttöön.

1970-luvulla Chomsky työskenteli ohjauksen ja sitomisen teorian parissa (GB-teoria - sanoista hallitus ja sitova) on yleisempi kuin edellinen. Siinä tiedemies hylkäsi erityiset säännöt, jotka kuvaavat tiettyjen kielten syntaktisia rakenteita. Kaikki muunnokset on korvattu yhdellä universaalilla siirtomuunnolla. GB-teorian puitteissa on myös yksityisiä moduuleja, joista jokainen vastaa omasta kielioppinsa osasta.

Jo äskettäin, vuonna 1995, Chomsky esitti minimalistisen ohjelman, jossa ihmisen kieltä kuvataan konekielenä. Tämä on vain ohjelma – ei malli tai teoria. Siinä Chomsky tunnistaa kaksi ihmisen kielilaitteen pääosajärjestelmää: sanaston ja laskentajärjestelmän sekä kaksi rajapintaa - foneettisen ja loogisen.

Chomskyn muodollisista kieliopeista on tullut klassisia paitsi luonnollisten, myös keinotekoisten kielten - erityisesti ohjelmointikielten - kuvaamiseen. Rakennekielitieteen kehitystä 1900-luvun jälkipuoliskolla voidaan perustellusti pitää "chomskilaisena vallankumouksena".

Moskovan fonologinen koulu, jonka edustajat olivat A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov käytti samanlaista teoriaa fonetiikan tutkimiseen. Pikkuhiljaa "tarkkoja" menetelmiä aletaan soveltaa paitsi fonetiikassa myös syntaksissa. Sekä kielitieteilijät että matemaatikot, niin kotimaassa kuin ulkomaillakin, alkavat tutkia kielen rakennetta. 1950- ja 60-luvuilla Neuvostoliitossa alkoi uusi vaihe matematiikan ja kielitieteen vuorovaikutuksessa, joka liittyi konekäännösjärjestelmien kehittämiseen.

Sysäyksenä näiden töiden aloittamiselle maassamme oli ensimmäinen kehitys konekäännösalalla Yhdysvalloissa (vaikka P. P. Smirnov-Troyanskyn ensimmäinen mekaaninen käännöslaite keksittiin Neuvostoliitossa vuonna 1933, koska se oli primitiivistä, ei yleistynyt). Vuonna 1947 A. Butt ja D. Britten keksivät koodin sana kerrallaan kääntämiseen tietokoneella, ja vuotta myöhemmin R. Richens ehdotti sääntöä sanojen jakamisesta varsiksi ja päätteiksi konekäännöksissä. Ne vuodet olivat aivan erilaisia ​​kuin nykyään. Nämä olivat erittäin suuria ja kalliita koneita, jotka veivät kokonaisia ​​huoneita ja vaativat suuren henkilöstön insinöörejä, käyttäjiä ja ohjelmoijia ylläpitämään niitä. Pohjimmiltaan näitä tietokoneita käytettiin matemaattisten laskelmien suorittamiseen sotilaslaitosten tarpeisiin - matematiikassa, fysiikassa ja tekniikassa uusi palveli ennen kaikkea sotilasasioita. Alkuvaiheessa armeija tuki aktiivisesti MP:n kehittämistä, kaiken tämän kanssa (kylmän sodan olosuhteissa), venäläis-englannin suuntaus kehittyi Yhdysvalloissa ja anglo-venäläinen suunta Neuvostoliitossa.

Tammikuussa 1954 "Georgetown Experiment" tapahtui Massachusettsin teknisessä yliopistossa - ensimmäinen julkinen esittely käännöksestä venäjän kielestä englanniksi IBM-701-koneella. Tiivistelmä viestistä kokeen onnistumisesta, laati D.Yu. Panov, ilmestyi RJ "Mathematics", 1954, nro 10: "Käännös kielestä toiseen koneella: raportti ensimmäisestä onnistuneesta testistä."

D. Yu. Panov (tuohon aikaan tieteellisen tiedon instituutin - INI, myöhemmin VINITI - johtaja) houkutteli I. K. Belskajan, joka johti myöhemmin konekäännösryhmää Neuvostoliiton tiedeakatemian tarkan matematiikan ja tietokonetekniikan instituutissa. konekäännöstyötä. Vuoden 1955 lopussa ensimmäinen kokemus kääntämisestä englannista venäjäksi BESM-koneen avulla juontaa juurensa. BESM:n ohjelmat on koonnut N.P. Trifonov ja L.N. Korolev, jonka väitöskirja oli omistettu konekäännössanakirjojen rakentamismenetelmille.

Samanaikaisesti konekäännöstyötä tehtiin Neuvostoliiton tiedeakatemian matemaattisen instituutin soveltavan matematiikan osastolla (nykyinen Venäjän tiedeakatemian M.V. Keldyshin soveltavan matematiikan instituutti). Matemaatikko A.A. Ljapunov. Hän osallistui O.S. Kulagin ja hänen oppilaansa T.D. Wentzel ja N.N. Ricco. Ljapunovin ja Kulaginan ajatukset mahdollisuudesta käyttää teknologiaa kääntämään kielestä toiseen julkaistiin Nature-lehdessä, 1955, nro 8. Vuoden 1955 lopusta lähtien T.N. Moloshnaya, joka aloitti sitten itsenäisen työn englannin-venäläisen käännösalgoritmin parissa.

R. Frumkina, joka tuolloin harjoitti espanjan kielen käännösalgoritmia, muistelee, että työn tässä vaiheessa oli vaikea ottaa johdonmukaisia ​​askeleita. Paljon useammin minun piti seurata heuristista kokemusta - omaa tai kollegoideni.

Samaan aikaan konekäännösjärjestelmien ensimmäinen sukupolvi oli erittäin epätäydellinen. Ne kaikki perustuivat peräkkäisiin käännösalgoritmeihin "sana sanalta", "lause fraasilta" - sanojen ja lauseiden välisiä semanttisia yhteyksiä ei otettu millään tavalla huomioon. Esimerkiksi lauseet ovat: John etsi lelulaatikkoaan.Lopulta hän löysi sen. Laatikko oli kynässä.John oli hyvin onnellinen. (John etsi lelulaatikkoaan. Lopulta hän löysi sen. Laatikko oli leikkikehässä. John oli hyvin iloinen.)” "Kynä" ei ole tässä yhteydessä "kynä" (kirjoitustyökalu), vaan "leikkikehä" ( leikkikehä). Synonyymien, antonyymien ja kuvaannollisten merkityksien tuntemus on vaikea syöttää tietokoneeseen. Lupaava suunta oli ihmiskääntäjän käyttöön keskittyneiden tietokonejärjestelmien kehittäminen.

Ajan myötä suorat käännösjärjestelmät korvattiin T-järjestelmillä (englannin sanasta "siirto" - muunnos), joissa käännös suoritettiin syntaktisten rakenteiden tasolla. T-järjestelmien algoritmit käyttivät mekanismia, joka mahdollisti syntaktisen rakenteen rakentamisen syöttölauseen kielen kielioppisääntöjen mukaan (samalla tavalla kuin lukiossa opetetaan vierasta kieltä) ja sitten syntetisoi ulostulolause. muuttamalla syntaktista rakennetta ja korvaamalla tarvittavat sanat sanakirjasta.

Ljapunov puhui kääntämisestä poimimalla käännetyn tekstin merkityksen ja esittämällä sen toisella kielellä. Täydellisimpana pidetään edelleen lähestymistapaa konekäännösjärjestelmien rakentamiseen, joka perustuu syöttölauseen semanttisen esityksen saamiseen semanttisella analyysillä ja syöttölauseen syntetisoinnilla saadun semanttisen esityksen mukaisesti. Tällaisia ​​järjestelmiä kutsutaan I-järjestelmiksi (sanasta "interlingua"). Samaan aikaan 50-luvun lopulla ja 60-luvun alussa alkanut tehtävä niiden luominen ei ole toistaiseksi täysin ratkaistu, huolimatta IFIP:n kansainvälisen järjestön - tiedonkäsittelyn alan tiedeyhteisön - ponnisteluista. .

Tutkijat miettivät, kuinka formalisoida ja rakentaa algoritmeja tekstien kanssa työskentelyyn, mitä sanakirjoja koneeseen tulisi syöttää, mitä kielellisiä malleja tulisi käyttää konekäännöksissä. Perinteisellä kielitieteellä ei ollut tällaisia ​​ideoita - ei vain semantiikan, vaan myös syntaksin suhteen. Tuolloin minkään kielen syntaktisista rakenteista ei ollut luetteloita, niiden yhteensopivuuden ja vaihdettavuuden ehtoja ei tutkittu, sääntöjä suurten syntaktisen rakenteen yksiköiden rakentamiselle pienemmistä osaelementeistä ei kehitetty.

Tarve luoda konekääntämisen teoreettinen perusta johti matemaattisen kielitieteen muodostumiseen ja kehittymiseen. Johtava rooli tässä asiassa Neuvostoliitossa oli matemaatikoilla A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, kielitieteilijät V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginan väitöskirja oli omistettu kielioppien muodollisen teorian tutkimukselle (samanaikaisesti N. Khomskyn kanssa USA:ssa), Kuznetsov esitti kielitieteen aksiomatisoinnin tehtäväksi, joka juontaa juurensa F. F.:n töihin. Fortunatov.

6. toukokuuta 1960 hyväksyttiin Neuvostoliiton tiedeakatemian puheenjohtajiston asetus "Kielen tutkimuksen rakenteellisten ja matemaattisten menetelmien kehittämisestä", ja vastaavat jaostot perustettiin kielitieteen instituuttiin ja instituuttiin. venäjän kieli. Vuodesta 1960 lähtien maan johtavat humanitaariset yliopistot - Moskovan valtionyliopiston filologinen tiedekunta, Leninrad, Novosibirskin yliopistot, Moskovan valtion vieraiden kielten instituutti - alkoivat kouluttaa henkilöstöä automaattisen tekstinkäsittelyn alalla.

Samaan aikaan tämän ajanjakson "klassisiksi" kutsutut konekäännöstyöt kiinnostavat enemmän teoreettista kuin käytännöllistä. Kustannustehokkaita konekäännösjärjestelmiä alettiin luoda vasta viime vuosisadan 80-luvulla. Puhun tästä myöhemmin osiossa 2.1, Konekäännös.

1960-70-luvuilla on syvällistä teoreettista kehitystä käyttäen joukkoteorian ja matemaattisen logiikan menetelmiä, kuten kenttäteoriaa ja sumea joukkoteoria.

Kielitieteen kenttäteorian kirjoittaja oli Neuvostoliiton runoilija, kääntäjä ja kielitieteilijä V.G. Admoni. Hän kehitti teoriansa alun perin saksan kielen pohjalta. Admonin kohdalla käsite "kenttä" tarkoittaa mielivaltaista ei-tyhjää kielellisten elementtien joukkoa (esimerkiksi "leksikaalinen kenttä", "semanttinen kenttä").

Kentän rakenne on heterogeeninen: se koostuu ytimestä, jonka elementeillä on täydellinen joukko joukon määritteleviä ominaisuuksia, ja reunasta, jonka elementeillä voi olla sekä tietyn joukon ominaisuuksia (ei kaikkia) ja naapurit. Annan esimerkin, joka havainnollistaa tätä lausuntoa: esimerkiksi englannin kielessä yhdistelmäsanojen kenttä ("day-dream" - "dream" on vaikea erottaa lausekentästä ("tear gas" - "tear gas") .

Jo edellä mainittu sumeiden joukkojen teoria liittyy läheisesti kenttäteoriaan. Neuvostoliitossa kielitieteilijät V.G. Admoni, I.P. Ivanova, G.G. Pochentsov sen esi-isä oli kuitenkin amerikkalainen matemaatikko L. Zadeh, joka julkaisi vuonna 1965 artikkelin "Fuzzy Logic". Antaessaan matemaattisen perustelun sumeiden joukkojen teorialle Zade käsitteli niitä kielellisen materiaalin perusteella.

Tässä teoriassa ei puhuta niinkään elementtien kuulumisesta tiettyyn joukkoon (Aa), vaan tämän jäsenyyden asteesta (Aa), koska reunaelementit voivat kuulua useaan kenttään tavalla tai toisella. Zade (Lofti-zade) oli kotoisin Azerbaidžanista, 12-vuotiaaksi asti hänellä oli käytäntö kommunikoida neljällä kielellä - azerbaidžanilla, venäjällä, englanniksi ja persiaksi - ja hän käytti kolmea eri aakkoset: kyrillinen, latina, arabia. Kun tiedemieheltä kysytään, mikä on yhteistä sumeiden joukkojen teorian ja kielitieteen välillä, hän ei kiellä tätä yhteyttä, mutta selventää: ”En ole varma, että näiden kielten tutkimisella olisi ollut suuri vaikutus ajatteluuni. Jos näin oli, niin vain alitajuisesti. Nuoruudessaan Zadeh opiskeli presbyteerikoulussa Teheranissa, ja toisen maailmansodan jälkeen hän muutti Yhdysvaltoihin. "Kysymys ei ole siitä, olenko amerikkalainen, venäläinen, azerbaidžanilainen vai joku muu", hän sanoi eräässä keskustelussa. "Minua ovat muokanneet kaikki nämä kulttuurit ja kansat ja viihdyn heidän keskellään. Näissä sanoissa on jotain samanlaista kuin sumeiden joukkojen teorialle - poikkeaminen yksiselitteisistä määritelmistä ja terävistä kategorioista.

Maassamme 70-luvulla käännettiin ja tutkittiin 1900-luvun länsimaisten kielitieteilijöiden teoksia. I.A. Melchuk käänsi N. Chomskyn teokset venäjäksi. PÄÄLLÄ. Slyusareva kirjassaan "F. de Saussuren teoria modernin kielitieteen valossa" yhdistää Saussuren opetuksen postulaatit 70-luvun varsinaisiin kielitieteen ongelmiin. Kielitieteen matematisointia on edelleen taipumus. Johtavat kotimaiset yliopistot kouluttavat henkilöstöä erikoisalalla "Matemaattinen (teoreettinen, soveltava) kielitiede". Samaan aikaan lännessä tietotekniikan kehityksessä tapahtuu jyrkkä harppaus, joka vaatii yhä enemmän uusia kielellisiä perusteita.

1980-luvulla tiedeakatemian itämaisen tutkimuksen instituutin professori Yu.K. Lekomtsev, joka analysoi kielitieteen kieltä analysoimalla kaavioita, taulukoita ja muita kielellisissä kuvauksissa käytettyjä merkintöjä, pitää matemaattisia järjestelmiä sopivina näihin tarkoituksiin (pääasiassa matriisialgebran järjestelmiä).

Niinpä koko 1900-luvun ajan eksakti- ja humanistiset tieteet lähentyivät. Matematiikan ja kielitieteen vuorovaikutus löysi yhä enemmän käytännön sovelluksia. Tästä lisää seuraavassa luvussa.

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1 Konekäännös

Ajatus kääntää kielestä toiseen yleismaailmallisen mekanismin avulla syntyi useita vuosisatoja ennen tämän alueen ensimmäisen kehityksen alkamista - jo vuonna 1649 Rene Descartes ehdotti ajatusta kielestä, jossa vastaavat ajatukset eri kieliä ilmaistaisiin yhdellä symbolilla. Ensimmäiset yritykset toteuttaa tämä ajatus 1930-40-luvuilla, teoreettisen kehityksen alku vuosisadan puolivälissä, käännösjärjestelmien parantaminen tekniikan avulla 1970-80-luvuilla, käännöstekniikan nopea kehitys viime vuosina. vuosikymmen - nämä ovat konekääntämisen alan kehitysvaiheita. Konekäännöstöistä johtuen tietokonelingvistiikka tieteenä on kasvanut.

Tietotekniikan kehittyessä 70-luvun lopulla ja 80-luvun alussa tutkijat asettivat itselleen realistisempia ja kustannustehokkaampia tavoitteita - koneesta ei tullut kilpailijaa (kuten aiemmin oletettiin), vaan ihmiskääntäjän apulainen. Konekäännös lakkaa palvelemasta yksinomaan sotilaallisia tehtäviä (kaikki Neuvostoliiton ja Amerikan keksinnöt ja tutkimus, jotka keskittyivät ensisijaisesti venäjäksi ja englanniksi, vaikuttivat tavalla tai toisella kylmään sotaan). Vuonna 1978 luonnollisen kielen sanat välitettiin Arpa-verkon kautta, ja kuusi vuotta myöhemmin ensimmäiset mikrotietokonekäännösohjelmat ilmestyivät Yhdysvaltoihin.

Euroopan yhteisöjen komissio ostaa 1970-luvulla Systran-tietokonekääntäjän englannin-ranskan version, tilaamalla myös ranskan-englannin ja italia-englannin versiot sekä Yhdysvaltain puolustusvoimien venäjästä englantiin käännösjärjestelmän. Näin luotiin EUROTRA-hankkeen perusta.

Konekäännösten elpymisestä 70-80-luvulla. seuraavat tosiasiat todistavat: Euroopan yhteisöjen komissio (CEC) ostaa Systranin englannin-ranskalaisen version sekä käännösjärjestelmän venäjän kielestä englanniksi (jälkimmäinen kehitettiin ALPAC-raportin jälkeen ja jota edelleen käyttää US Air Force ja NASA); lisäksi CEC tilaa ranska-englannin ja italia-englannin versioiden kehittämisen. Samanaikaisesti konekäännöstoiminta laajenee nopeasti Japanissa; Yhdysvalloissa Pan American Health Organization (PAHO) määrää espanjalais-englantilaisen suunnan (SPANAM-järjestelmä) kehittämisen; Yhdysvaltain ilmavoimat rahoittavat konekäännösjärjestelmän kehittämistä Teksasin yliopiston lingvistisessä tutkimuskeskuksessa Austinissa; Kanadalainen TAUM-ryhmä edistyy huomattavasti METEO-järjestelmän (meteorological translation) kehittämisessä. Useita projekteja aloitettiin 70- ja 80-luvuilla. kehittyi sittemmin täysimittaisiksi kaupallisiksi järjestelmiksi.

Vuosina 1978-1993 konekäännösalan tutkimukseen käytettiin Yhdysvalloissa 20 miljoonaa dollaria, Euroopassa 70 miljoonaa ja Japanissa 200 miljoonaa dollaria.

Yksi uusista kehityssuunnista on TM (käännösmuisti) -tekniikka, joka toimii akkumulaatioperiaatteella: käännösprosessin aikana alkuperäinen segmentti (lause) ja sen käännös tallennetaan, jolloin muodostuu kielellinen tietokanta; Jos äskettäin käännetystä tekstistä löytyy identtinen tai samankaltainen segmentti, se näytetään käännöksen ja osuvuuden prosenttiosuuden kanssa. Tämän jälkeen kääntäjä tekee päätöksen (muokata, hylätä tai hyväksyä käännös), jonka tulos tallennetaan järjestelmään, joten samaa lausetta ei tarvitse kääntää kahdesti. TRADOS-järjestelmä (perustettu 1984) kehittää tällä hetkellä hyvin tunnettua kaupallista TM-teknologiaan perustuvaa järjestelmää.

Tällä hetkellä useat kymmenet yritykset kehittävät kaupallisia konekäännösjärjestelmiä, mukaan lukien: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Ohjelmistot; Linguistica b.v. ja muut Nyt voit käyttää automaattisten kääntäjien palveluita suoraan Webissä: alphaWorks; PROMT:n online-kääntäjä, LogoMedia.net, AltaVistan Babel Fish -käännöspalvelu; InfiniT.com; Internetin kääntäminen.

Kaupallisesti tehokkaat käännösjärjestelmät ilmestyivät 80-luvun jälkipuoliskolla myös maahan. Konekäännösten käsite on laajentunut (se alkoi sisältää "lukuisten automaattisten ja automatisoitujen järjestelmien ja laitteiden luomisen, jotka automaattisesti tai puoliautomaattisesti suorittavat koko käännössyklin tai yksittäisiä tehtäviä vuoropuhelussa henkilön kanssa") ja valtion määrärahat alan kehittämiseen ovat kasvaneet.

Venäjä, englanti, saksa, ranska ja japani tulivat kotimaisten käännösjärjestelmien pääkieliksi. All-Union Translation Center (VTsP) kehitti järjestelmän englannista ja saksasta venäjäksi kääntämiseen tietokoneella ES-1035-ANRAP. Se koostui kolmesta sanakirjasta - englannin ja saksan syöttö sekä venäjän kieli - yhden ohjelmiston alla. Siellä oli useita vaihdettavia erikoissanakirjoja - tietotekniikkaa, ohjelmointia, radioelektroniikkaa, koneenrakennusta, maataloutta, metallurgiaa varten. Järjestelmä voisi toimia kahdessa tilassa - automaattinen ja interaktiivinen, jolloin näytöllä näkyi lähdeteksti ja käännös lausekohtaisesti, jota henkilö voi muokata. Tekstin kääntämisen nopeus ANRAP-muotoon (kirjoituksen alusta tulostuksen loppuun) oli noin 100 sivua tunnissa.

Vuonna 1989 luotiin SPRINT-tyyppisten kaupallisten kääntäjien perhe, joka työskenteli venäjän, englannin, saksan ja japanin kanssa. Niiden tärkein etu oli niiden yhteensopivuus IBM PC:n kanssa - siten kotimaiset konekäännösjärjestelmät saavuttivat kansainvälisen laatutason. Samaan aikaan kehitetään konekäännösjärjestelmää ranskasta venäjäksi FRAP, joka sisältää 4 tekstianalyysin vaihetta: grafemaattinen, morfologinen, syntaktinen ja semanttinen. LGPI:ssä niitä. Herzen, työskentely oli käynnissä nelikielisellä (englanti, ranska, espanja, venäjä) SILOD-MP-järjestelmällä (englannin-venäläisiä ja ranska-venäläisiä sanakirjoja käytettiin teollisessa tilassa.

Sähkötekniikan tekstien erikoiskäännöksiä varten oli olemassa ETAP-2-järjestelmä. Siinä syötetyn tekstin analyysi suoritettiin kahdella tasolla - morfologisella ja syntaktisella tasolla. ETAP-2-sanakirja sisälsi noin 4 tuhatta sanaa; tekstin muunnosvaihe - noin 1000 sääntöä (96 yleistä, 342 yksityistä, loput ovat sanakirjoja). Kaikki tämä varmisti käännösten tyydyttävän laadun (esim. patentin nimi "Optinen vaiheverkkojärjestely ja kytkentälaite, jolla on tällainen järjestely" käännettiin "Optinen vaiheverkkolaite ja liitoslaite, jossa on tällainen laite" - huolimatta tautologia, merkitys säilyy).

Minskin vieraiden kielten pedagogisessa instituutissa englannin-venäläisen sanamuotojen ja ilmaisujen sanakirjan perusteella keksittiin järjestelmä nimikkeiden konekääntämiseksi, Tiedeakatemian itämaisen tutkimuksen instituutissa - käännösjärjestelmä. japanista venäjäksi. Ensimmäinen automaattinen laskennan ja ohjelmoinnin sanasto- ja terminologiapalvelu (SLOTHERM), joka on luotu Moskovan automaatiojärjestelmien tutkimuslaitoksessa, sisälsi noin 20 000 termiä selittävässä sanakirjassa ja kielitutkimuksen erikoissanakirjoissa.

Konekäännösjärjestelmiä alettiin vähitellen käyttää paitsi aiottuun tarkoitukseen, myös tärkeänä osana automaattisia oppimisjärjestelmiä (käännösten opettamiseen, oikeinkirjoituksen ja kielioppitietojen tarkistamiseen).

90-luku toi mukanaan PC-markkinoiden (pöytäkoneista taskuihin) ja tietotekniikan nopean kehityksen, Internetin (josta on tulossa kansainvälisempi ja monikielisempi) laajan käytön. Kaikki tämä teki automatisoitujen käännösjärjestelmien jatkokehityksestä kysyntää. 1990-luvun alusta lähtien Myös kotimaiset kehittäjät ovat tulossa PC-järjestelmien markkinoille.

Heinäkuussa 1990 Venäjän ensimmäinen kaupallinen konekäännösjärjestelmä nimeltä PROMT (PROgrammer's Machine Translation) esiteltiin PC-foorumissa Moskovassa. Vuonna 1991 ZAO [!!! Liittovaltion lain-99 5.5.2014 mukaisesti tämä lomake korvattiin ei-julkisella osakeyhtiöllä] "Project MT", ja jo vuonna 1992 PROMT-yhtiö voitti NASA-kilpailun MP-järjestelmien toimittamisesta (PROMT oli ainoa ei-amerikkalainen yritys tässä kilpailussa). koko systeemiperhe uudella nimellä STYLUS englannin, saksan, ranskan, italian ja espanjan kielestä venäjäksi ja venäjästä englanniksi kääntämiseen, ja vuonna 1993 luotiin maailman ensimmäinen konekäännösjärjestelmä Windowsille STYLUSin pohjalta STYLUS 2.0 Windows 3.X/95/NT julkaistiin, ja vuosina 1995-1996 esiteltiin kolmannen sukupolven konekäännösjärjestelmiä, täysin 32-bittinen STYLUS 3.0 Windows 95/NT:lle, samalla kun kehitettiin täysin uusi, maailman ensimmäinen venäjä-saksa ja venäjä-ranska konekäännösjärjestelmä.

Vuonna 1997 allekirjoitettiin sopimus ranskalaisen Softissimo-yhtiön kanssa käännösjärjestelmien luomisesta ranskasta saksaksi ja englanniksi ja päinvastoin, ja tämän vuoden joulukuussa julkaistiin maailman ensimmäinen saksalais-ranskalainen käännösjärjestelmä. Samana vuonna PROMT-yhtiö julkaisi Gigant-teknologialla toteutetun järjestelmän, joka tukee useita kielisuuntia yhdessä kuoressa, sekä erityisen kääntäjän Internet-WebTranSite-työskentelyä varten.

Vuonna 1998 julkaistiin koko joukko ohjelmia uudella nimellä PROMT 98. Vuotta myöhemmin PROMT julkaisi kaksi uutta tuotetta: ainutlaatuisen ohjelmistopaketin Internet-työskentelyyn - PROMT Internet ja kääntäjän yritysten sähköpostijärjestelmiin - PROMT Mail Kääntäjä. Marraskuussa 1999 PROMT tunnustettiin parhaaksi ranskalaisen PC Expert -lehden testaamaksi konekäännösjärjestelmäksi, joka ylitti kilpailijansa 30 prosentilla. Yritysasiakkaille on kehitetty myös erikoispalvelinratkaisuja - yrityskäännöspalvelin PROMT Translation Server (PTS) ja Internet-ratkaisu PROMT Internet Translation Server (PITS). Vuonna 2000 PROMT päivitti koko ohjelmistotuotevalikoimansa julkaisemalla uuden sukupolven MT-järjestelmiä: PROMT Translation Office 2000, PROMT Internet 2000 ja Magic Gooddy 2000.

PROMT-järjestelmän tuella tehtyä online-käännöstä käytetään useilla kotimaisilla ja ulkomaisilla sivustoilla: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos jne. sekä eri profiilien laitoksissa yritysasiakirjojen kääntämiseen, artikkeleita ja kirjeitä (Outlook Expressiin ja muihin sähköpostiohjelmiin on rakennettu suoraan käännösjärjestelmiä).

Nykyään syntyy uusia konekäännöstekniikoita, jotka perustuvat tekoälyjärjestelmien ja tilastollisten menetelmien käyttöön. Tietoja jälkimmäisestä - seuraavassa osiossa.

2.2 Ylimääräinenkieltenoppimisen menetelmiä

Kielellisten ilmiöiden tutkimiseen kvantitatiivisen matematiikan menetelmiä käyttäen kiinnitetään nykyaikaisessa kielitieteessä huomattavaa huomiota. Kvantitatiivinen data auttaa usein ymmärtämään tarkemmin tutkittavia ilmiöitä, niiden paikkaa ja roolia niihin liittyvien ilmiöiden järjestelmässä. Vastaus kysymykseen "kuinka paljon" auttaa vastaamaan kysymyksiin "mitä", "miten", "miksi" - sellainen on kvantitatiivisen ominaisuuden heuristinen potentiaali.

Tilastollisilla menetelmillä on merkittävä rooli konekäännösjärjestelmien kehittämisessä (ks. kohta 2.1). Tilastollisessa lähestymistavassa käännösongelmaa tarkastellaan kohinaisen kanavan kannalta. Kuvittele, että meidän on käännettävä lause englannista venäjäksi. Meluisen kanavan periaate tarjoaa meille seuraavan selityksen englannin ja venäjän lauseen suhteesta: englanninkielinen lause ei ole mitään muuta kuin jonkinlaisen kohinan vääristynyt venäläinen lause. Alkuperäisen venäläisen lauseen palauttamiseksi meidän on tiedettävä, mitä ihmiset yleensä sanovat venäjäksi ja kuinka venäläiset lauseet vääristyvät englanniksi. Käännös suoritetaan etsimällä sellaista venäjänkielistä lausetta, joka maksimoi venäjänkielisen lauseen ehdottoman todennäköisyyden ja englanninkielisen lauseen (alkuperäisen) todennäköisyyden tulot annetulla venäläisellä lauseella. Bayesin lauseen mukaan tämä venäjänkielinen lause on todennäköisin englanninkielinen käännös:

jossa e on käännöslause ja f on alkuperäinen lause

Tarvitsemme siis lähdemallin ja kanavamallin tai kielimallin ja käännösmallin. Kielimallin on annettava todennäköisyyspisteet mille tahansa kohdekielelle (tässä tapauksessa venäjälle) olevalle lauseelle ja käännösmalli alkuperäiselle lauseelle. (katso taulukko 1)

Yleensä konekäännösjärjestelmä toimii kahdessa tilassa:

1. Järjestelmäharjoittelu: otetaan rinnakkaisten tekstien koulutuskorpus ja lineaarista ohjelmointia käyttäen etsitään sellaisia ​​käännösvastaavuustaulukoiden arvoja, jotka maksimoivat (esimerkiksi) korpuksen venäjän osan todennäköisyyden käytettävissä olevan englannin kielen kanssa. valittuun käännösmalliin. Venäjän kielen malli on rakennettu saman korpusuksen venäjän puolelle.

2. Hyödyntäminen: tuntemattomasta englanninkielisestä lauseesta saatujen tietojen perusteella etsitään venäjää, joka maksimoi kielimallin ja käännösmallin määräämien todennäköisyyksien tulon. Tällaiseen hakuun käytettyä ohjelmaa kutsutaan dekooderiksi.

Yksinkertaisin tilastollinen käännösmalli on kirjaimellinen käännösmalli. Tämä malli olettaa, että lauseen kääntämiseksi kielestä toiselle riittää, että kaikki sanat käännetään (luoda "sanapussi"), ja malli tarjoaa niiden sijoittelun oikeaan järjestykseen. a, f | e) P(a | e , f), ts. tietyn tasauksen todennäköisyydet lauseparilla, jokainen todennäköisyys P(a, f | e) normalisoidaan tietyn lauseparin kaikkien tasausten todennäköisyyksien summalla:

Viterbi-algoritmin toteutus mallin #1 harjoittamiseen on seuraava:

1. Koko käännösvastaavuuden todennäköisyystaulukko on täytetty samoilla arvoilla.

2. Kaikille mahdollisille sanojen pariyhteyksien muunnelmille lasketaan todennäköisyys P(a, f | e):

3. P(a, f | e) arvot normalisoidaan P(a | e, f) arvojen saamiseksi.

4. Lasketaan kunkin käännösparin taajuus painotettuna kunkin kohdistusvaihtoehdon todennäköisyydellä.

5. Tuloksena saadut painotetut taajuudet normalisoidaan ja muodostavat uuden käännösvastaavuustodennäköisyyksien taulukon

6. Algoritmi toistetaan vaiheesta 2 alkaen.

Tarkastellaan esimerkkinä samanlaisen mallin harjoittelua kahden lauseparin rungossa (kuva 2):

Valkoinen talo

Suuren iteraatiomäärän jälkeen saamme taulukon (Taulukko 2), joka osoittaa, että käännös on suoritettu suurella tarkkuudella.

Myös tilastollisia menetelmiä käytetään laajasti sanaston, morfologian, syntaksin ja tyylin tutkimuksessa. Permin osavaltion yliopiston tutkijat suorittivat tutkimuksen, joka perustui väitteeseen, että stereotyyppiset lauseet ovat tärkeä tekstin "rakennusmateriaali". Nämä lauseet koostuvat "ydin" toistuvista sanoista ja riippuvaisista sanamäärittelijöistä ja niillä on selkeä tyylillinen väritys.

Tieteellisessä tyylissä "ydin" sanoja voidaan kutsua: tutkimus, tutkimus, tehtävä, ongelma, kysymys, ilmiö, tosiasia, havainto, analyysi jne. Journalismissa muut sanat ovat "ydin", joilla on lisääntynyt arvo erityisesti sanomalehden tekstille: aika, henkilö, voima, liiketoiminta, toiminta, laki, elämä, historia, paikka jne. (yhteensä 29)

Kielitieteilijöitä kiinnostaa erityisesti myös kansalliskielen ammatillinen erottuminen, sanaston ja kieliopin käytön omaperäisyys ammattityypistä riippuen. Tiedetään, että ammatillisessa puheessa kuljettajat käyttävät muotoa w noin fer, lääkärit sanovat k noin klubi cocktailin sijaan Yu sh - tällaisia ​​esimerkkejä voidaan antaa. Tilastojen tehtävänä on seurata ääntämisen vaihtelua ja kielinormin muutosta.

Ammatilliset erot johtavat eroihin paitsi kieliopillisiin, myös leksillisiin eroihin. Yakut State University on nimetty M.K. Ammosov, 50 kyselylomaketta analysoitiin yleisimmillä reaktioilla tiettyihin sanoihin lääkäreiden ja rakentajien keskuudessa (taulukko 3).

Rakentajat

ihmisen

potilas (10), persoonallisuus (5)

mies (5)

hyvä

apua (8), apua (7)

paha (16)

elämää

kuolema (10)

ihana (5)

kuolema

ruumis (8)

elämä (6)

tuli

kuume (8), polta (6)

tulipalo (7)

sormi

käsi (14), panaritium (5)

iso (7), indeksi (6)

silmät

näkö (6), oppilas, silmälääkäri (5 kpl)

ruskea (10), iso (6)

pää

mieli (14), aivot (5)

iso (9), älykäs (8), älykäs (6)

menettää

tietoisuus, elämä (4 kpl)

rahaa (5), löytää (4)

Voidaan todeta, että lääkärit kuin rakentajat antavat useammin ammatilliseen toimintaansa liittyviä yhdistyksiä, koska kyselyssä annetut sanat liittyvät enemmän heidän ammattiinsa kuin rakentajan ammattiin.

Kielen tilastollisia säännönmukaisuuksia käytetään luomaan taajuussanakirjoja - sanakirjoja, jotka tarjoavat numeeriset ominaisuudet minkä tahansa kielen sanojen (sanamuotojen, lauseiden) esiintymistiheydestä - kirjoittajan kielestä, minkä tahansa teoksen jne. esiintymistiheydestä. sanaa käytetään käytön ominaisuutena tietyn volyymin tekstissä

Puheen havaintomalli on mahdoton ilman sanakirjaa sen olennaisena osana. Puheen havainnoinnin perustoiminnallinen yksikkö on sana. Tästä seuraa erityisesti, että havaitun tekstin jokainen sana on tunnistettava kuuntelijan (tai lukijan) sisäisen sanaston vastaavaan yksikköön. On luonnollista olettaa, että haku rajoittuu alusta alkaen joihinkin sanakirjan aliverkkotunnuksiin. Useimpien nykyaikaisten puhehavaintoteorioiden mukaan kuulostavan tekstin varsinainen foneettinen analyysi antaa tyypillisessä tapauksessa vain osittaista tietoa sanan mahdollisesta fonologisesta ulkonäöstä, ja tällainen tieto ei vastaa yhtä, vaan tiettyä MONIA sanaa. sanakirjasta; Tästä syystä syntyy kaksi ongelmaa:

a) valitse sopiva sarja tiettyjen parametrien mukaan;

(b) hahmotellun joukon rajoissa (jos se on varattu riittävästi) "eliminoimaan" kaikki sanat, paitsi ainoa, joka parhaiten vastaa tunnistetun tekstin annettua sanaa. Yksi "pudotus"-strategioista on sulkea pois matalataajuuksiset sanat. Tästä seuraa, että puheen havaitsemisen sanasto on taajuussanakirja. Esitellyn projektin lähtökohtana on venäjän kielen taajuussanakirjan tietokoneversion luominen.

Venäjän kielen materiaalin perusteella on olemassa 5 taajuussanakirjaa (haarasanakirjoja lukuun ottamatta). Huomattakoon vain muutamia yleisiä puutteita olemassa olevista sanakirjoista.

Kaikki tunnetut venäjän kielen taajuussanakirjat perustuvat kirjoitettujen (painettujen) tekstien käsittelyyn. Osittain tästä syystä, kun sanan identiteetti perustuu suurelta osin muodolliseen, graafiseen sattumaan, semantiikkaa ei oteta riittävästi huomioon. Tämän seurauksena myös taajuusominaisuudet siirtyvät, vääristyvät; Esimerkiksi, jos taajuussanakirjan kääntäjä sisällyttää sanan "ystävä" yleiseen käyttötilastoihin sanoja yhdistelmästä "toinen", niin tämä tuskin on perusteltua: semantiikka huomioon ottaen on myönnettävä, että nämä ovat jo eri sanoja, tai pikemminkin, että itsenäinen sanakirjayksikkö on vain yhdistelmä kokonaisuutena.

Myös kaikissa olemassa olevissa sanakirjoissa sanat sijoitetaan vain perusmuotoihinsa: substantiivit yksikkömuodossa, nimitystapaus, verbit infinitiivimuodossa jne. Osa sanakirjoista antaa tietoa sanamuotojen esiintymistiheydestä, mutta yleensä ne eivät tee sitä riittävän johdonmukaisesti, ei tyhjentävästi. Saman sanan eri sanamuotojen taajuudet eivät ilmeisesti täsmää. Puheen havaintomallin kehittäjän on otettava huomioon, että todellisessa havaintoprosessissa tunnistettavana on nimenomaan tietty tekstiin "upotettu" sanamuoto: eksponentin alkuosan analyysin perusteella. sanamuoto, muodostuu joukko sanoja, joilla on identtinen alku, eikä sanamuodon alkuosa välttämättä ole identtinen sanakirjamuodon alkuosan kanssa. Juuri sanamuodolla on erityinen rytminen rakenne, joka on myös erittäin tärkeä parametri sanojen havaintovalinnalle. Lopuksi tunnistetun lausunnon lopullisessa esityksessä sanoja edustavat jälleen vastaavat sanamuodot.

On monia teoksia, jotka osoittavat taajuuden merkityksen puhehavaintoprosessissa. Mutta emme ole tietoisia teoksista, joissa sanamuotojen taajuutta käytettäisiin - päinvastoin, kaikki kirjoittajat jättävät käytännössä huomiotta yksittäisten sanamuotojen tiheyden viitaten yksinomaan lekseemeihin. Jos heidän saamiaan tuloksia ei pidetä artefakteina, on oletettava, että äidinkielenään puhujalla on jotenkin pääsy tietoon sanamuotojen ja sanakirjamuotojen, eli itse asiassa lekseemien, taajuuksien suhteesta. Lisäksi tällaista siirtymistä sanamuodosta lekseemiin ei tietenkään voida selittää vastaavan paradigman luonnollisella tiedolla, koska taajuusinformaatiota on käytettävä ennen sanan lopullista tunnistamista, muuten se yksinkertaisesti menettää merkityksensä.

Ensisijaisten tilastollisten ominaisuuksien mukaan voidaan tietyllä suhteellisella virheellä määrittää se osa sanakirjasta, joka sisältää usein esiintyviä sanoja, riippumatta tekstin tyypistä. Ottamalla sanakirjaan vaiheittaisen järjestyksen käyttöön on myös mahdollista saada sarja sanakirjoja, jotka kattavat ensimmäiset 100, 1000, 5000 jne. usein toistuvia sanoja. Sanakirjan tilastolliset ominaisuudet kiinnostavat sanaston semanttisen analyysin yhteydessä. Subjekti-ideologisten ryhmien ja semanttisten kenttien tutkimus osoittaa, että leksikaalisia assosiaatioita tukevat semanttiset linkit, jotka keskittyvät yleisimmän merkityksen omaavien lekseemien ympärille. Leksikosemanttisen kentän merkityksien kuvaus voidaan suorittaa tunnistamalla sanat, joilla on merkitykseltään kaikkein abstrakteimpia lekseemejä. Ilmeisesti "tyhjät" (nominatiivisten voimakkuuksien näkökulmasta) sanakirjayksiköt muodostavat tilastollisesti homogeenisen kerroksen.

Yksittäisten genrejen sanastot eivät ole yhtä arvokkaita. Niiden samankaltaisuuden mittaa ja tilastollisten jakaumien luonnetta tutkimalla saadaan mielenkiintoista tietoa sanaston laadullisesta kerrostumisesta puheenkäyttöalueittain.

Suurtaajuisten sanakirjojen laatiminen vaatii tietotekniikan käyttöä. Osittainen mekanisoinnin ja automatisoinnin TULO sanakirjan työskentelyprosessiin on kiinnostava kokeilu eri tekstien sanakirjojen koneellisessa käsittelyssä. Tällainen sanakirja vaatii tiukemman järjestelmän sanaston käsittelyyn ja keräämiseen. Pienoismallina tämä on tiedonhakujärjestelmä, joka pystyy tarjoamaan tietoa tekstin ja sanaston eri puolista. Joitakin peruspyyntöjä tälle järjestelmälle suunnitellaan alusta alkaen: inventaarisanojen kokonaismäärä, yksittäisen sanan ja kokonaisten sanakirjojen tilastolliset ominaisuudet, sanakirjan toistuvien ja harvinaisten vyöhykkeiden järjestys jne. Konekorttitiedosto mahdollistaa luoda automaattisesti käänteisiä sanakirjoja yksittäisille genreille ja lähteille. Monia muita hyödyllisiä tilastotietoja kielestä poimitaan kertyneestä tietojoukosta. Tietokonetaajuussanakirja luo kokeellisen pohjan siirtymiselle sanastotyön laajempaan automatisointiin.

Taajuussanakirjojen tilastotietoja voidaan käyttää laajasti myös muiden kielellisten ongelmien ratkaisemisessa - esimerkiksi nykyvenäjän kielen aktiivisten sananmuodostuskeinojen analysoinnissa ja määrittämisessä, grafiikan ja oikeinkirjoituksen parantamiseen liittyvien kysymysten ratkaisemisessa, jotka liittyvät kielitaidon ottamiseen. ottaa huomioon tilastotietoa sanastosta (kaiken tämän kanssa on tärkeää ottaa huomioon grafeemiyhdistelmien todennäköisyysominaisuudet, sanoissa toteutettujen kirjainyhdistelmien tyypit), käytännön transkriptio ja translitterointi. Sanakirjan tilastolliset parametrit ovat hyödyllisiä myös kirjaimellisen tekstin kirjoittamisen, tunnistuksen ja automaattisen lukemisen automatisoinnin ongelmien ratkaisemisessa.

Nykyaikaiset venäjän kielen selittävät sanakirjat ja kieliopit rakentuvat pääasiassa kirjallisten ja taiteellisten tekstien pohjalta. A.S.:n kielestä on olemassa taajuussanakirjoja. Pushkin, A.S. Griboedova, F.M. Dostojevski, V.V. Vysotsky ja monet muut kirjailijat. Smolenskin osavaltion kirjallisuuden historian ja teorian laitoksella. Pedagoginen yliopisto on työskennellyt useiden vuosien ajan runo- ja proosatekstien taajuussanakirjojen kokoamiseksi. Tätä tutkimusta varten valittiin taajuussanakirjat kaikista Pushkinin sanoituksista ja kahdesta muusta kulta-ajan runoilijasta - Gribojedovin "Voi nokkeluudesta" ja koko Lermontovin runoudesta; Pasternak ja viisi muuta hopeakauden runoilijaa - Balmont 1894-1903, Blokin "Runot kauniista naisesta", Mandelstamin "Stone", Gumilyovin "Tulipylväs", Akhmatovan "Anno Domini MCMXXI" ja "Siskot" Elämäni" Pasternakilta ja neljältä muulta rautakauden runoilijalta - "Juri Živagon runot", "Kun se selkiytyy", koko M. Petrovin sanoituskokoelma, "Tie on kaukana", "Tuulilasi", "Jäähyväiset lumelle" ja "Hevosenkengät" Mezhirov, "Antimirov" Voznesensky ja "Snezhnitsa » Rylenkova.

On huomattava, että nämä sanakirjat ovat luonteeltaan erilaisia: jotkut edustavat yhden dramaattisen teoksen sanastoa, toiset - sanoituskirjoja tai useita kirjoja tai runoilijan runojen koko aineistoa. Tässä artikkelissa esitettyjen analyysien tuloksiin tulee suhtautua varoen, niitä ei voi pitää absoluuttisina. Samalla voidaan erityistoimenpiteiden avulla vähentää tekstien ontologisen luonteen eroa jossain määrin.

Viime vuosina puhekielen ja kirjapuheen vastakkainasettelu on tullut yhä selvemmin ilmi. Tästä aiheesta keskustellaan erityisen voimakkaasti metodologien keskuudessa, jotka vaativat opetuksessa käännettä puhutun kielen suuntaan. Samaan aikaan puhekielen erityispiirteet jäävät edelleen selittämättä.

Sanakirjoja käsiteltiin luomalla käyttäjäsovellus EXCEL97-toimistoohjelman ympäristöön. Sovellus sisältää neljä EXCEL-kirjan laskentataulukkoa - "Title Sheet", "Dictionaries" -arkki alkutiedoilla, "Läheisyydet" ja "Etäisyydet" tuloksilla sekä joukko makroja.

Alkutiedot syötetään "Sanakirjat" -sivulle. Tutkittujen tekstien sanakirjat kirjoitetaan EXCEL-soluihin, viimeinen sarake S muodostuu saaduista tuloksista ja on yhtä suuri kuin muista sanakirjoista löytynyt määrä sanoja. Taulukoissa "Läheisyys" ja "Etäisyydet" on laskettu läheisyys M, korrelaatio R ja etäisyys D.

Sovellusmakrot ovat tapahtumapohjaisia ​​ohjelmointiproseduureja, jotka on kirjoitettu Visual Basic for Application (VBA) -ohjelmalla. Toimenpiteet perustuvat VBA-kirjastoobjekteihin ja niiden käsittelymenetelmiin. Joten sovelluksen laskentataulukoiden kanssa tehtävissä toimissa käytetään avainobjektia Työtaulukko (työtaulukko) ja vastaavaa menetelmää arkin aktivoimiseksi Aktivoi (aktivoi). Analysoitujen lähdetietojen alueen asettaminen Sanakirja-arkkiin suoritetaan Range-objektin (alue) Select-menetelmällä ja sanojen siirto arvoina muuttujiin suoritetaan saman alueen Arvo-ominaisuudena (arvona). esine.

Huolimatta siitä, että rankkorrelaatioanalyysi tekee meidät varovaisiksi aiheiden riippuvuuden suhteen eri tekstien välillä, useimmilla kunkin tekstin yleisimmillä sanoilla on osumia yhdessä tai useammassa muussa tekstissä. Sarake S näyttää tällaisten sanojen lukumäärän kunkin kirjoittajan 15 yleisimmän sanan joukossa. Lihavoidut sanat esiintyvät vain yhden runoilijan sanoissa taulukossamme. Blokilla, Akhmatovalla ja Petrovilla ei ole korostettuja sanoja ollenkaan, heillä on S = 15. Näillä kolmella runoilijalla on samat 15 yleisintä sanaa, ne eroavat vain listan paikasta. Mutta jopa Pushkinilla, jonka sanasto on omaperäisin, on S = 8, ja siinä on 7 korostettua sanaa.

Tulokset osoittavat, että on olemassa tietty kerros sanastoa, joka keskittyy runouden pääteemoja. Nämä sanat ovat pääsääntöisesti lyhyitä: yksitavuisten 88, kaksitavuisten 127, kolmitavuisten 10 sanankäyttöjen kokonaismäärästä (225). Usein nämä sanat edustavat päämytologeemeja ja voivat jakaa pareittain: yö - päivä, maa - taivas (aurinko), Jumala - ihminen (ihmiset), elämä - kuolema, ruumis - sielu, Rooma - maailma(Mandelstamissa); voidaan yhdistää korkeamman tason mytologeemeiksi: taivas, tähti, aurinko, maa; ihmisessä yleensä vartalo, sydän, veri, käsivarsi, jalka, poski, silmät erottuvat. Ihmistiloista etusija annetaan unelle ja rakkaudelle. Talo ja kaupungit kuuluvat ihmisten maailmaan - Moskova, Rooma, Pariisi. Luovuutta edustavat lekseemit sana ja laulu.

Gribojedovilla ja Lermontovilla ei ole juuri lainkaan luontoa kuvaavia sanoja yleisimpien sanojen joukossa. Heillä on kolme kertaa enemmän sanoja, jotka kuvaavat henkilöä, hänen ruumiinsa osia, hänen henkimaailmansa elementtejä. Pushkin ja 1900-luvun runoilijat. Ihmisen ja luonnon nimitykset ovat suunnilleen samat. Tässä tärkeässä aiheen osassa voimme sanoa, että 1900-luku. seurasi Pushkinia.

Minimaalinen teema bisnes yleisimpien sanojen joukossa se löytyy vain Gribojedovista ja Pushkinista. Lermontov ja 1900-luvun runoilijat. se väistyy minimaaliselle teemalle sana. Sana ei sulje pois tekoja (aiheen raamatullinen tulkinta: Uudessa testamentissa kaikkia Jeesuksen Kristuksen opetuksia pidetään Jumalan sanana tai Jeesuksen sanana, ja apostolit kutsuvat itseään toisinaan Sanan palvelijoiksi). Lekseemasanan pyhä merkitys ilmenee vakuuttavasti esimerkiksi Pasternakin säkeessä "Ja maailman kuva, joka ilmestyy Sanassa". Lekseemin pyhä merkitys sana inhimillisten asioiden yhteydessä ja vastakohtana se ilmenee vakuuttavasti Gumiljovin samannimisessä runossa.

Vain yhdestä tekstistä löytyvät merkit kuvaavat tietyn kirjan tai kirjakokoelman omaperäisyyttä. Esimerkiksi sana "mieli" on yleisin Gribojedovin komediassa "Voi nokkeluudesta" - mutta se ei esiinny muiden tekstien taajuussanojen joukossa. Mielen teema on komedian ylivoimaisesti merkittävin. Tämä lekseema liittyy Chatskyn kuvaan, ja Chatskyn nimi on yleisin komediassa. Niinpä teos yhdistää orgaanisesti yleisimmän yhteisen substantiivin yleisimpään erisnimeen.

Suurin korrelaatiokerroin yhdistää Gumilyovin traagisten kirjojen "Tulipylväs" ja Ahmatovan "Anno Domini MCMXXI" teemat. 15 yleisimmän substantiivin joukossa on 10 yleistä, mukaan lukien veri, sydän, sielu, rakkaus, sana, taivas. Muista, että Akhmatovan kirja sisälsi miniatyyrin "Et ole elossa ...", joka kirjoitettiin Gumiljovin pidätyksen ja hänen teloituksensa välillä.

Tutkitun materiaalin kynttilän ja väkijoukon teemat löytyvät vain "Yuri Zhivagon runoista". Kynttilän teemalla romaanin säkeissä on monia kontekstuaalisia merkityksiä: se liittyy Jeesuksen Kristuksen kuvaan, teemoihin usko, kuolemattomuus, luovuus, rakkaustreffit. Kynttilä on tärkein valonlähde romaanin keskeisissä kohtauksissa. Väkijoukon teema kehittyy romaanin pääidean yhteydessä, jossa ihmisen yksityinen elämä horjumattomineen arvoineen vastustaa uuden valtion moraalittomuutta, joka on rakennettu yleisön miellyttämisen periaatteille. .

Työ sisältää myös kolmannen vaiheen, joka näkyy myös ohjelmassa, - tämä on kahden sanakirjan yhteisten sanojen järjestyslukujen eron ja kahden sanakirjan samojen sanojen keskimääräisen etäisyyden laskeminen. Tämä vaihe mahdollistaa siirtymisen tilastojen avulla tunnistetuista sanakirjojen vuorovaikutuksen yleisistä suuntauksista tekstiä lähestyvälle tasolle. Esimerkiksi Gumiljovin ja Akhmatovan kirjat korreloivat tilastollisesti merkitsevästi. Tarkastelemme, mitkä sanat osoittautuivat yleisiksi heidän sanakirjoissaan, ja valitsemme ensin ne, joiden sarjanumerot eroavat minimaalisesti tai ovat nolla. Juuri näillä sanoilla on sama arvonumero, ja näin ollen juuri nämä minimaaliset teemat näiden kahden runoilijan mielessä ovat yhtä tärkeitä. Seuraavaksi sinun tulee siirtyä tekstien ja kontekstien tasolle.

Kvantitatiiviset menetelmät auttavat myös tutkimaan kansojen - äidinkielenään puhuvien - ominaisuuksia. Sanotaan, että venäjäksi on 6 tapausta, englannin kielellä ei tapauksia, ja joillakin Dagestanin kansojen kielillä tapausten määrä on 40. L. Perlovsky artikkelissaan "Tietoisuus, kieli ja kulttuuri" korreloi näitä ominaisuudet kansojen taipumuksen kanssa individualismiin tai kollektivismiin, asioiden ja ilmiöiden havaitsemiseen erikseen tai yhdessä muiden kanssa. Loppujen lopuksi juuri englanninkielisessä maailmassa (ei tapauksia - asia havaitaan "itsestään") ilmestyi sellaiset käsitteet kuin yksilön vapaus, liberalismi ja demokratia (huomaan, että käytän näitä käsitteitä vain kieli ilman arvioivia ominaisuuksia). Huolimatta siitä, että tällaiset arvaukset ovat edelleen vain rohkeiden tieteellisten hypoteesien tasolla, ne auttavat katsomaan jo tuttuja ilmiöitä uudella tavalla.

Kuten näemme, kvantitatiivisia ominaisuuksia voidaan soveltaa aivan eri kielitieteen aloilla, mikä hämärtää yhä enemmän rajoja "tarkkojen" ja "humanitaaristen" menetelmien välillä. Kielitiede turvautuu yhä useammin paitsi matematiikan, myös tietotekniikan apuun ratkaistakseen ongelmiaan.

2.3 Oppiminen Ikieli formaalilogiikan menetelmillä

Ei-kvantitatiivisten matematiikan menetelmien kanssa, erityisesti logiikan kanssa, nykyaikainen teoreettinen kielitiede on vuorovaikutuksessa yhtä hedelmällisesti kuin kvantitatiivisten menetelmien kanssa. Tietotekniikan nopea kehitys ja niiden roolin kasvu nykymaailmassa vaativat uudistamista kielen ja logiikan vuorovaikutukseen yleensä.

Logiikkamenetelmiä käytetään laajalti formalisoitujen kielten, erityisesti ohjelmointikielten, kehittämisessä, joiden elementtejä ovat jotkin symbolit (kuten matemaattinen), valittu (tai rakennettu aiemmin valituista symboleista) ja tulkittu tietyllä tavalla, assosioituneet. ilman "perinteistä" käyttöä, ymmärrystä ja ymmärtämistä. samojen symbolien toimintoja muissa yhteyksissä. Ohjelmoija käsittelee työssään jatkuvasti logiikkaa. Ohjelmoinnin tarkoitus on vain opettaa tietokone järkeilemään (sanan laajimmassa merkityksessä). Samaan aikaan "päättelyn" menetelmät osoittautuvat hyvin erilaisiksi. Jokainen ohjelmoija viettää tietyn ajan etsiessään vikoja omasta ja muiden ihmisten ohjelmista. Eli etsimään virheitä päättelystä, logiikasta. Ja tämäkin jättää jälkensä. Logiikkavirheiden havaitseminen tavallisessa puheessa on paljon helpompaa. Logiikkojen tutkimien kielten suhteellinen yksinkertaisuus antaa heille mahdollisuuden selvittää näiden kielten rakenteita selkeämmin kuin yksinomaan monimutkaisia ​​luonnollisia kieliä analysoivat lingvistit pystyvät saavuttamaan. Koska logiikkojen tutkimat kielet käyttävät luonnollisista kielistä kopioituja suhteita, loogikot voivat antaa merkittävän panoksen yleiseen kieliteoriaan. Tilanne on tässä samanlainen kuin fysiikassa: fyysikko muotoilee myös lauseita ihanteellisesti yksinkertaistettuihin tapauksiin, joita ei esiinny luonnossa ollenkaan - hän muotoilee lakeja ihanteellisille kaasuille, ihanteellisille nesteille, puhuu liikkeestä kitkan puuttuessa, jne. Näille idealisoiduille tapauksille voidaan vahvistaa yksinkertaisia ​​lakeja, jotka auttaisivat suuresti ymmärtämään, mitä todellisuudessa tapahtuu ja mikä jää todennäköisesti fysiikalle tuntemattomaksi, jos se yrittäisi tarkastella todellisuutta suoraan kaikessa monimutkaisuudessaan.

Luonnollisten kielten tutkimuksessa käytetään loogisia menetelmiä, jotta kieltenoppijat eivät voi typerästi "muistaa" niin monta sanaa kuin mahdollista, vaan ymmärtävät paremmin sen rakennetta. L. Shcherba käytti myös luennoissaan esimerkkiä venäjän kielen lakien mukaan rakennetusta lauseesta: "Hilkuva kuzdra shteko tökseli bokraa ja kiharsi bokraa" ja kysyi sitten opiskelijoilta, mitä tämä tarkoittaa. Huolimatta siitä, että lauseen sanojen merkitys jäi epäselväksi (niitä ei yksinkertaisesti ole venäjäksi), oli mahdollista vastata selkeästi: "kuzdra" on subjekti, feminiininen substantiivi, yksikössä, nimitystapauksessa " bokr” on animoitu jne. Lausun käännös osoittautuu kutakuinkin tältä: "Jokin feminiininen teki kerralla jotain jonkinlaiselle miespuoliselle olennolle ja alkoi sitten tehdä jotain tällaista pitkään, vähitellen pentunsa kanssa." Samanlainen esimerkki tekstistä (taiteellisesta) olemattomista sanoista, joka on rakennettu kokonaan kielen lakien mukaan, on Lewis Carrollin Jabberwock (Liisa Ihmemaassa Carroll selittää hahmonsa Humpty Dumptyn kautta hänen sanojensa merkityksen keksitty: "keitetty" - kello kahdeksan illalla, kun on aika valmistaa illallinen, "chlivky" - hauras ja taitava, "shorek" - fretin, mäyrän ja korkkiruuvin risteys, "sukellus" - ​​hyppy, sukeltaa, pyörähtää, "nava" - ruoho aurinkokellon alla (ulottuu hieman oikealle, hieman vasemmalle ja hieman taaksepäin), "grunt" - murina ja nauraa, "zelyuk" - vihreä kalkkuna, "myumzik" - lintu; sen höyhenet ovat epäsiistit ja työntyvät kaikkiin suuntiin, kuten luuta, "mova" - kaukana kotoa) .

Yksi modernin logiikan ja teoreettisen kielitieteen pääkonsepteista, jota käytetään tutkittaessa erilaisten loogisten ja matemaattisten laskelmien kieliä, luonnollisia kieliä, kuvaamaan eri "tasoisten" kielten välistä suhdetta ja luonnehtimaan kielten välistä suhdetta. kielet ja niiden avulla kuvatut aihealueet, on metakielen käsite. Metakieli on kieli, jota käytetään ilmaisemaan tuomioita toisesta kielestä, kieliobjektista. Metakielen avulla he tutkivat kieli-objektin merkkiyhdistelmien (ilmaisujen) rakennetta, todistavat lauseita sen ilmaisuominaisuuksista, sen suhteesta muihin kieliin jne. Opistettavaa kieltä kutsutaan myös ainekieleksi. suhteessa tähän metakieleen. Sekä ainekieli että metakieli voivat olla tavallisia (luonnollisia) kieliä. Metakieli voi poiketa objektikielestä (esim. venäläisten englanninkielisessä oppikirjassa venäjä on metakieli ja englanti objektikieli), mutta se voi myös yhtyä sen kanssa tai erota vain osittain, esimerkiksi erikoisterminologiassa. (Venäjän kielellinen terminologia on osa metakieltä kuvaamaan venäjän kieltä, ns. semanttiset tekijät ovat osa metakieltä luonnollisten kielten semantiikan kuvaamiseksi).

Käsitteestä "metallingage" on tullut erittäin hedelmällinen matemaattisen logiikan puitteissa rakennettujen formalisoitujen kielten tutkimuksen yhteydessä. Toisin kuin formalisoidut ainekielet, tässä tapauksessa metakieli, jonka avulla metateoria muotoillaan (tutkimalla ainekielellä muotoillun subjektiteorian ominaisuuksia), on pääsääntöisesti tavallinen luonnollinen kieli, jollain erityisellä tavalla tietyllä tavalla rajoitettu luonnollisen kielen fragmentti, joka ei sisällä minkäänlaista moniselitteisyyttä. , metaforia, "metafyysisiä" käsitteitä jne. tavallisen kielen elementtejä, jotka estävät sen käytön tarkan tieteellisen tutkimuksen välineenä. Samalla metakieli itsessään voidaan formalisoida ja (sitä huolimatta) tulla metakielen avulla tehtävän tutkimuksen kohteeksi, ja tällainen sarja voidaan "ajatella" kasvavaksi loputtomiin.

Logiikka opettaa meille hedelmällisen eron kieli-objektin ja metakielen välillä. Kieli-objekti on loogisen tutkimuksen aihe, ja metakieli on se väistämättä keinotekoinen kieli, jolla tällaista tutkimusta tehdään. Looginen ajattelu on vain todellisen kielen (objektikielen) suhteiden ja rakenteen muotoilemista symbolien kielellä (metakieli).

Metakielen tulee joka tapauksessa olla "ei köyhempi" kuin sen objektiivinen kieli (ts. jokaiselle viimeksi mainitun ilmaisulle metakielessä on oltava sen nimi, "käännös") - muuten, jos nämä vaatimukset eivät täyty (mikä varmasti vaatii paikka luonnollisissa kielissä, ellei erityissopimuksissa toisin määrätä) syntyy semanttisia paradokseja (antinomioita).

Kun uusia ohjelmointikieliä syntyi yhä enemmän, ohjelmointikääntäjien ongelman yhteydessä oli kiireellinen tarve luoda metakieliä. Tällä hetkellä Backus-Naur-muodon metakieli (lyhennetty BNF) on yleisimmin käytetty kuvaamaan ohjelmointikielten syntaksia. Se on kompakti muoto joidenkin matemaattisten kaavojen muodossa. Jokaiselle kielen käsitteelle on ainutlaatuinen metakaava (normaalikaava). Se koostuu vasemmasta ja oikeasta osasta. Vasen puoli määrittelee määriteltävän käsitteen ja oikea puoli määrittelee joukon hyväksyttäviä kielirakenteita, jotka yhdistetään tähän käsitteeseen. Kaava käyttää erityisiä metamerkkejä kulmasuluissa, jotka sisältävät määriteltävän käsitteen (kaavan vasemmalla puolella) tai aiemmin määritellyn käsitteen (sen oikealla puolella), ja vasemman ja oikean osan erottelu on osoitettu "::="-metamerkillä, jonka merkitys vastaa sanoja "määritelmän mukaan on". Metalingvistiset kaavat on upotettu kääntäjiin jossain muodossa; heidän avullaan tarkistetaan ohjelmoijan käyttämien konstruktien muodollinen yhteensopivuus minkä tahansa tällä kielellä syntaktisesti kelvollisen konstruktin kanssa. Eri tieteissä on myös erillisiä metakieliä - siis tieto on olemassa eri metakielinä.

Loogiset menetelmät toimivat myös perustana konnektionismin käsitteeseen perustuvien tekoälyjärjestelmien luomiselle. Connectionismi on erityinen suuntaus filosofisessa tieteessä, jonka aiheena ovat tiedon kysymykset. Tämän suuntauksen puitteissa ihmisen älyllisiä kykyjä yritetään selittää keinotekoisten hermoverkkojen avulla. Neuraaliverkot koostuvat suuresta määrästä hermosolujen kaltaisia ​​rakenneyksiköitä, joissa jokaiselle elementille on määritetty paino, joka määrittää yhteyden vahvuuden muihin elementteihin, ja ne ovat yksinkertaistettuja malleja ihmisen aivoista. Kokeet tällaisten hermoverkkojen kanssa ovat osoittaneet niiden kyvyn oppia suorittamaan tehtäviä, kuten hahmontunnistusta, lukemista ja yksinkertaisten kieliopillisten rakenteiden tunnistamista.

Filosofit alkoivat kiinnostua konnektionismista, koska konnektionistinen lähestymistapa lupasi tarjota vaihtoehdon klassiselle mielen teorialle ja tässä teoriassa laajalti vallitsevalle ajatukselle, että mielen toiminta on samanlaista kuin digitaalisen symbolisen kielen käsittely. tietokone. Tämä käsite on erittäin kiistanalainen, mutta viime vuosina se on löytänyt yhä enemmän kannattajia.

Looginen kielentutkimus jatkaa Saussuren käsitystä kielestä järjestelmänä. Se tosiasia, että se jatkuu jatkuvasti, vahvistaa jälleen kerran viime vuosisadan alun tieteellisten oletusten rohkeuden. Omistan työstäni viimeisen osan kielitieteen matemaattisten menetelmien kehitysnäkymille nykyään.

2.4 Matemaattisten menetelmien soveltamisen mahdollisuudet kielitieteessä

Tietotekniikan aikakaudella matemaattisen kielitieteen menetelmät ovat saaneet uudenlaisen kehityksen näkökulman. Ratkaisujen etsiminen lingvistisen analyysin ongelmiin toteutetaan nykyään yhä enemmän tietojärjestelmien tasolla. Samalla kieliaineiston käsittelyprosessin automatisointi, joka tarjoaa tutkijalle merkittäviä mahdollisuuksia ja etuja, asettaa hänelle väistämättä uusia vaatimuksia ja tehtäviä.

"Täsmällisen" ja "humanitaarisen" tiedon yhdistelmästä on tullut hedelmällinen maaperä uusille löydöille kielitieteen, tietojenkäsittelytieteen ja filosofian alalla.

Konekäännös kielestä toiseen on edelleen nopeasti kasvava tietotekniikan ala. Huolimatta siitä, että tietokoneavusteista käännöstä ei voi koskaan verrata laadultaan ihmisen käännökseen (etenkin kirjallisten tekstien osalta), koneesta on tullut korvaamaton apu suuria tekstimääriä kääntäjälle. Lähitulevaisuudessa uskotaan luovan kehittyneempiä käännösjärjestelmiä, jotka perustuvat ensisijaisesti tekstin semanttiseen analyysiin.

Yhtä lupaava alue on kielitieteen ja logiikan vuorovaikutus, joka toimii filosofisena perustana tietotekniikan ja ns. "virtuaalitodellisuuden" ymmärtämiselle. Lähitulevaisuudessa työtä tekoälyjärjestelmien luomiseksi jatketaan – vaikka se taas ei tule koskaan olemaan kykyjensä vertaa ihmisen kanssa. Tällainen kilpailu on merkityksetöntä: meidän aikanamme koneesta ei pitäisi tulla (ja siitä tulee) ei kilpailija, vaan ihmisen apulainen, ei jotain fantasiamaailmasta, vaan osa todellista maailmaa.

Kielen tutkiminen tilastollisilla menetelmillä jatkuu, mikä mahdollistaa sen laadullisten ominaisuuksien tarkemman määrittämisen. On tärkeää, että rohkeimmat kieltä koskevat hypoteesit löytävät matemaattisen ja siten loogisen todisteensa.

Merkittävintä on se, että matematiikan eri kielitieteen soveltamishaarat, aiemmin varsin eristyksissä olleet, ovat viime vuosina korreloineet keskenään ja yhdistyneet yhtenäiseksi järjestelmäksi, analogisesti Ferdinand de Saussuren vuosisata sitten löytämän kielijärjestelmän kanssa. ja Yvan Baudouin de Courtenay. Tämä on tieteellisen tiedon jatkuvuutta.

Kielitieteen nykymaailmassa on tullut perusta tietotekniikan kehitykselle. Niin kauan kuin tietojenkäsittelytiede pysyy nopeasti kehittyvänä ihmisen toiminnan alana, matematiikan ja kielitieteen liitto jatkaa rooliaan tieteen kehityksessä.

Johtopäätös

1900-luvun aikana tietotekniikka on edennyt pitkän tien - sotilaallisesta rauhanomaiseen käyttöön, kapeasta tavoitteesta tunkeutumiseen kaikille ihmiselämän aloille. Matematiikka tieteenä sai yhä uuden käytännön merkityksen tietotekniikan kehityksen myötä. Tämä prosessi jatkuu tänään.

Aikaisemmin käsittämättömästä "fyysikkojen" ja "lyriikkojen" "tandemista" on tullut todellisuutta. Matematiikan ja tietojenkäsittelytieteen täydellistä vuorovaikutusta varten humanististen tieteiden kanssa tarvittiin päteviä asiantuntijoita molemmilta puolilta. Tietojenkäsittelytieteilijät tarvitsevat yhä enemmän systemaattista humanitaarista tietoa (kielellistä, kulttuurista, filosofista) ymmärtääkseen muutoksia heitä ympäröivässä todellisuudessa, ihmisen ja tekniikan vuorovaikutuksessa, kehittääkseen yhä enemmän uusia kielellisiä ja mentaalisia käsitteitä, kirjoittaakseen ohjelmia, niin kaikkien meidän aikamme "humanististen tieteiden" on ammatillisen kasvunsa vuoksi hallittava ainakin tietokoneen kanssa työskentelyn perusteet.

Matematiikka, joka liittyy läheisesti informatiikkaan, kehittyy ja vuorovaikutuksessa luonnontieteiden ja humanististen tieteiden kanssa. Uudella vuosisadalla suuntaus kohti tieteen matematisointia ei heikkene, vaan päinvastoin lisääntyy. Kvantitatiivisen tiedon perusteella ymmärretään kielen kehityksen lait, sen historialliset ja filosofiset ominaisuudet.

Matemaattinen formalismi sopii parhaiten kuvaamaan kielitieteen malleja (kuten myös muissa tieteissä - sekä humanistisissa että luonnontieteissä). Tilanne kehittyy joskus tieteessä niin, että ilman sopivaa matemaattista kieltä on mahdotonta ymmärtää fysikaalisten, kemiallisten jne. prosessi ei ole mahdollista. Luomassa atomin planeettamallia, kuuluisa englantilainen XX vuosisadan fyysikko. E. Rutherford koki matemaattisia vaikeuksia. Aluksi hänen teoriaansa ei hyväksytty: se ei kuulostanut vakuuttavalta, ja syynä tähän oli Rutherfordin tietämättömyys todennäköisyysteoriasta, jonka mekanismin perusteella oli mahdollista ymmärtää vain atomivuorovaikutusten malliesitys. Tämän ymmärtäessään jo tuolloin erinomainen tiedemies, Nobel-palkinnon haltija, ilmoittautui matemaatikko professori Lambin seminaariin ja osallistui kahden vuoden ajan opiskelijoiden kanssa kurssille ja teki työpajan todennäköisyysteoriasta. . Sen perusteella Rutherford pystyi kuvaamaan elektronin käyttäytymistä, mikä antoi rakennemallilleen vakuuttavan tarkkuuden ja tunnustusta. Sama on kielitieteen kanssa.

Tämä herättää kysymyksen, mikä objektiivisissa ilmiöissä on niin matemaattista, jonka ansiosta ne voidaan kuvata matematiikan kielellä, kvantitatiivisten ominaisuuksien kielellä? Nämä ovat homogeenisiä aineen yksiköitä, jotka ovat jakautuneet tilassa ja ajassa. Ne tieteet, jotka ovat menneet muita pidemmälle homogeenisuuden eristämiseen ja osoittautuvat niissä paremmin matematiikan käyttöön.

1990-luvulla nopeasti kehittynyt Internet kokosi yhteen eri maiden, kansojen ja kulttuurien edustajat. Huolimatta siitä, että englanti on edelleen kansainvälisen viestinnän pääkieli, Internetistä on tullut monikielinen meidän aikanamme. Tämä johti kaupallisesti menestyneiden konekäännösjärjestelmien kehittämiseen, joita käytetään laajasti ihmisen toiminnan eri aloilla.

Tietokoneverkoista on tullut filosofisen pohdinnan kohde - yhä enemmän on luotu uusia kielellisiä, loogisia, maailmankatsomuksia, jotka auttavat ymmärtämään "virtuaalitodellisuutta". Monissa taideteoksissa luotiin skenaarioita - useammin pessimistisiä - koneiden ylivallasta ihmiseen ja virtuaalitodellisuudesta ulkomaailmaan. Sellaiset ennusteet eivät suinkaan aina osoittautuneet merkityksettömiksi. Tietotekniikka ei ole vain lupaava toimiala inhimillisen tiedon sijoittamiseen, vaan se on myös tapa hallita tietoa ja siten myös ihmisen ajattelua.

Tällä ilmiöllä on sekä negatiivinen että positiivinen puoli. Negatiivinen - koska tiedon hallinta on vastoin luovuttamatonta ihmisoikeutta saada se vapaasti. Positiivinen - koska tämän hallinnan puute voi johtaa katastrofaalisiin seurauksiin ihmiskunnalle. Riittää, kun muistetaan yksi viime vuosikymmenen viisaimmista elokuvista - Wim Wendersin "When the World Ends" -elokuva, jonka hahmot uppoavat täysin tietokoneelle tallennettuun omien unelmiensa "virtuaalitodellisuuteen". Samaan aikaan ei yksikään tiedemies eikä yksikään taiteilija voi antaa yksiselitteistä vastausta kysymykseen: mikä odottaa tiedettä ja teknologiaa tulevaisuudessa.

Keskittyminen "tulevaisuuteen", joskus näyttäen fantastiselta, oli tieteen erottuva piirre 1900-luvun puolivälissä, jolloin keksijät pyrkivät luomaan täydellisiä teknologiamalleja, jotka voisivat toimia ilman ihmisen väliintuloa. Aika on osoittanut tällaisen tutkimuksen utopistisen luonteen. Samalla olisi tarpeetonta tuomita tiedemiehiä tästä - ilman heidän innostustaan ​​1950-60-luvuilla tietotekniikka ei olisi tehnyt niin voimakasta harppausta 90-luvulla, eikä meillä olisi sitä mitä meillä on nyt.

1900-luvun viimeiset vuosikymmenet muuttivat tieteen painopisteitä - tutkimus, kekseliäs paatos väistyi kaupalliselle mielenkiinnolle. Jälleen kerran, tämä ei ole hyvä eikä huono. Tämä on todellisuutta, jossa tiede integroituu yhä enemmän jokapäiväiseen elämään.

2000-luku on jatkanut tätä kehitystä, ja meidän aikanamme keksintöjen takana ei ole vain maine ja tunnustus, vaan ennen kaikkea raha. Tästä syystä on myös tärkeää varmistaa, että tieteen ja teknologian uusimmat saavutukset eivät joudu terroristiryhmien tai diktatuurien käsiin. Tehtävä on mahdottomuuteen asti vaikea; sen toteuttaminen mahdollisimman paljon on koko maailmanyhteisön tehtävä.

Tieto on ase, ja aseet eivät ole yhtä vaarallisia kuin ydin- tai kemialliset aseet - vain se ei toimi fyysisesti, vaan pikemminkin psyykkisesti. Ihmiskunnan täytyy miettiä, mikä on sille tässä tapauksessa tärkeämpää - vapaus vai valvonta.

Uusimmat tietotekniikan kehitykseen liittyvät filosofiset käsitteet ja pyrkimys ymmärtää niitä ovat osoittaneet sekä 1800- ja 1900-luvun alkupuolella vallinneen luonnontieteellisen materialismin että aineellisen maailman merkityksen kieltävän ääriidealismin rajoitukset. . Modernin ajattelun, erityisesti lännen ajattelun on tärkeää voittaa tämä ajattelun kaksinaisuus, kun ympäröivä maailma on selkeästi jaettu aineelliseen ja ideaaliseen. Polku tähän on kulttuurien vuoropuhelu, erilaisten näkökulmien vertailu ympäröivään ilmiöön.

Paradoksaalisesti tietotekniikalla voi olla tärkeä rooli tässä prosessissa. Tietokoneverkot ja varsinkin Internet eivät ole vain viihteen ja voimakkaan kaupallisen toiminnan resurssi, vaan ne ovat myös väline mielekkääseen, kiistanalaiseen viestintään nykymaailman eri sivilisaatioiden edustajien välillä sekä vuoropuheluun menneisyyden ja nykyisyyttä. Voimme sanoa, että Internet työntää tilallisia ja ajallisia rajoja.

Ja kulttuurien vuoropuhelussa tietotekniikan kautta kielen rooli vanhimpana yleismaailmallisena viestintävälineenä on edelleen tärkeä. Tästä syystä kielitiede vuorovaikutuksessa matematiikan, filosofian ja tietojenkäsittelytieteen kanssa on kokenut toisen syntymänsä ja kehittyy edelleen. Nykyajan trendi jatkuu myös tulevaisuudessa - "maailman loppuun asti", kuten 15 vuotta sitten sama V. Wenders ennusti. Totta, ei tiedetä milloin tämä loppu tulee - mutta onko sillä nyt merkitystä, koska tulevaisuudesta tulee joka tapauksessa ennemmin tai myöhemmin nykyhetki.

Liite 1

Ferdinand de Saussure

Sveitsiläistä kielitieteilijää Ferdinand de Saussurea (1857-1913) pidetään laajalti modernin kielitieteen perustajana pyrkiessään kuvaamaan kielen rakennetta tiettyjen kielten ja kielimuotojen historian sijaan. Itse asiassa strukturalismin menetelmä lingvistiikassa ja kirjallisuudentutkimuksessa sekä merkittävä semiotiikan haara löytävät tärkeimmän lähtökohtansa hänen työssään 1900-luvun vaihteessa. On jopa väitetty, että strategioiden ja käsitysten kokonaisuus, jota on alettu kutsua "poststrukturalismiksi" - Jacques Derridan, Michel Foucault'n, Jacques Lacanin, Julia Kristevan, Roland Barthesin ja muiden työ - ehdottaa Saussuren työ. kielitieteessä ja latinalaisen runouden anagrammaattisissa lukemissa kirjallisesta modernismista psykoanalyysiin ja filosofiaan 1900-luvun alussa. Kuten Algirdas Julien Greimas ja Joseph Courtes väittävät teoksessa Semiotic and Language: An Analytic Dictionary, otsikon "Tulkinta" alla, 1900-luvun alussa syntyi uusi tulkintatapa, jonka he identifioivat Saussurean kielitieteen, Husserlilaisen fenomenologian ja Freudilaisen psykoanalyysin kanssa. Tässä muodossa "tulkinnalla ei ole enää kysymys tietyn sisällön liittämisestä sellaiseen muotoon, josta sellainen muuten puuttuisi, vaan se on parafraasi, joka muotoilee toisella tavalla merkitsevän elementin vastaavan sisällön tietyssä semioottisessa järjestelmässä" ( 159). tässä "tulkinnan" ymmärtämisessä muoto ja sisältö eivät ole erillisiä; pikemminkin jokainen "muoto" on vaihtoehtoisesti myös semanttinen "sisältö", "merkittävä muoto", joten tulkinta tarjoaa analogisen parafraasin jostakin, joka jo merkitsee jossain muussa merkintäjärjestelmässä.

Tällainen muodon ja ymmärryksen uudelleentulkinta - jota Claude Levi-Strauss kuvaa yhdessä strukturalismin käsitteen ohjelmallisimmista artikulaatioista teoksessa "Rakenne ja muoto: Pohdintoja Vladimir Proppin teoksesta" - sisältyy implisiittisesti Saussuren postuumikurssiin. in General Linguistics (1916, käännös, 1959, 1983). Elämänsä aikana Saussure julkaisi suhteellisen vähän, ja hänen pääteoksensa, Course, oli hänen opiskelijoidensa transkriptio useista yleisen kielitieteen kursseista, joita hän tarjosi vuosina 1907–1911. Kurssissa Saussure vaati kielen "tieteellistä" tutkimusta vastakohtana 1800-luvulla tehdylle historiallisen kielitieteen työlle. Tämä työ on yksi länsimaisen älyn suurista saavutuksista: tiettyjen sanojen ottaminen kielen rakennuspalikoihin. kieli, historiallinen (tai "diakrooninen") kielitiede jäljitti länsimaisten kielten alkuperän ja kehityksen oletetusta yhteisen kielen lähteestä, ensin "indoeurooppalaisesta" kielestä ja sitten aikaisemmasta "p" roto-indoeurooppalainen" kieli.

Saussure kyseenalaisti nimenomaan tämän sanojen ainutlaatuisten esiintymien tutkimuksen, jossa oletetaan, että kielen perus"yksikkö" on itse asiassa näiden "sanaelementtien" myönteinen olemassaolo. Hänen työnsä oli yritys supistaa kielen tosiasioiden massa, jota historiallinen kielitiede on tutkinut niin tarkasti, hallittavaan määrään ehdotuksia. 1800-luvun filologian "vertaileva koulukunta", Saussure sanoo Kurssissa, "ei onnistunut luomaan todellista kielitieteen tiedettä", koska "se ei onnistunut löytämään tutkimuskohteensa luonnetta" (3). Tuo "luonne", hän väittää, ei löydy pelkästään kielen sisältämistä "elementaarisista" sanoista - kielen näennäisistä "positiivisista" faktoista (tai "aineista"), vaan muodollisista suhteista, jotka synnyttävät niitä. "aineet".

Saussuren systemaattinen kielen uudelleentarkastelu perustuu kolmeen olettamukseen. Ensimmäinen on se, että kielen tieteellisen tutkimuksen on kehitettävä ja tutkittava pikemminkin järjestelmää kuin kielellisten ilmiöiden historiaa. Tästä syystä hän erottaa kielen yksittäiset esiintymät - sen erityiset "puhetapahtumat", joita hän nimittää ehdonalaiseksi - ja varsinainen kielitieteen kohde, niitä tapahtumia hallitseva järjestelmä (tai "koodi"), jonka hän nimittää kieleksi. Tällainen systemaattinen tutkimus vaatii lisäksi "synkronista" käsitys kielen elementtien välisestä suhteesta tietyllä hetkellä, eikä "diakroonista" tutkimusta kielen kehityksestä historian kautta.

Tämä olettamus sai aikaan sen, mitä Roman Jakobson vuonna 1929 kutsui "strukturalismiksi", jossa "kaikkia nykytieteen tutkimia ilmiöitä ei käsitellä mekaanisena kasautumana, vaan rakenteellisena kokonaisuutena, mekaaninen prosessikäsitys antaa kysymyksen. niiden tehtävästä" ("Romantic" 711). Tässä kohdassa Jakobson ilmaisee Saussuren aikomusta määritellä kielitiede tieteelliseksi järjestelmäksi yksinkertaisen, "mekaanisen" historiallisten onnettomuuksien kirjaamisen sijaan. Tämän lisäksi Jakobson kuvailee myös toista Saussurean perusolettamaa - voimme kutsutaan sitä nyt "rakenteelliseksi" - lingvistiikaksi: että kielen peruselementtejä voidaan tutkia vain suhteessa niiden tehtäviin eikä suhteessa niiden syihin. Eurooppalaiset "sanat"), näiden tapahtumien ja kokonaisuuksien on sijaittava systeemisessä kehyksessä jossa ne liittyvät muihin niin kutsuttuihin tapahtumiin ja entiteeteihin. Tämä on radikaali uudelleensuuntautuminen kokemuksen ja ilmiöiden käsityksessä, jonka merkitystä filosofi Ernst Cassirer on vertannut "uuteen Galileon tieteeseen, joka 1700-luvulla muutti koko meidän fyysisen maailman käsite" (viitattu julkaisussa Culler, Pursuit 2 neljä). Tämä muutos, kuten Greimas ja Courtes huomauttavat, omaksuu "tulkinnan" ja siten omaksua itsensä selityksen ja ymmärtämisen. Sen sijaan, että selittäisivät "ilmiön syiden termillä niin, että se "vaikutuksena" on jollain tapaa alisteinen syilleen, selitys tässä tarkoittaa ilmiön alistamista sen tulevaisuuteen suuntautuneelle "toiminnalleen" tai "tarkoitus." Selitys ei ole enää riippumaton inhimillisistä aikomuksista tai tavoitteista (vaikka nuo aikomukset voivat olla persoonattomia, yhteisöllisiä tai Freudin termein "tajuntamattomia").

Kielitieteissään Saussure suorittaa tämän muutoksen nimenomaan määrittelemällä uudelleen kielellisen "sanan", jota hän kuvailee kielelliseksi "merkiksi" ja määrittelee funktionalistisin termein. Hän väittää, että merkki on "käsitteen ja äänikuvan" liitto, jota hän kutsui "merkittyksi ja merkitsijäksi" (66-67; Roy Harrisin vuoden 1983 käännös tarjoaa termit "signification" ja "signal"). Niiden "yhdistelmän" luonne on "toiminnallinen" siinä mielessä, että sen kumpikaan ei ole merkitsitty eikä merkitsejä ole toisen "syy", vaan "kumpikin arvonsa toisesta" (8). kielen elementti, merkki , suhteellisesti ja tekee historiallisen kielitieteen perusoletuksen, nimittäin kielen ja merkitsemisen elementtiyksiköiden (eli "sanojen") identiteetin, tiukan analyysin alaisena. sana "puu" "samana" sanana ei johdu siitä, että sana määritellään luontaisilla ominaisuuksilla - se ei ole tällaisten ominaisuuksien "mekaaninen ryhmittymä" - vaan koska se on määritelty järjestelmän elementiksi, kielen "rakenteelliseksi kokonaisuudeksi".

Tällainen relaatio- (tai "diakriittinen") kokonaisuuden määritelmä hallitsee kielen kaikkien elementtien käsitystä rakennelingvistiikassa. Tämä näkyy selkeimmin Saussurean kielitieteen vaikuttavimmassa saavutuksessa, kielen "foneemien" ja "erottelevien piirteiden" käsitteiden kehittämisessä. Foneemit ovat kielen pienimpiä artikuloituja ja merkitseviä yksiköitä. Ne eivät ole kielessä esiintyviä ääniä, vaan Saussuren mainitsemia "äänikuvia", jotka puhujat ymmärtävät - ilmiömäisesti omaksuttuina - merkityksen välittävinä. (Elmar Holenstein kuvailee siis Jakobsonin kielitiedettä, joka seuraa Saussurea tärkeillä tavoilla, "fenomenologiseksi strukturalismiksi".) Tästä syystä Prahan School Structuralismin johtava tiedottaja Jan Mukarovsky totesi vuonna 1937, että "rakenne . . . on fenomenologinen eikä empiirinen todellisuus; se ei ole itse teos, vaan joukko toiminnallisia suhteita, jotka sijaitsevat kollektiivin tietoisuudessa (sukupolvi, miljöö jne.)" (viitattu Galan 35:ssä). Samoin Levi-Strauss, ranskalaisen strukturalismin johtava puhuja , totesi vuonna 1960, että "rakenteella ei ole erillistä sisältöä; se on itse sisältö, ja looginen organisaatio, jossa se pidätetään, pidetään todellisen omaisuutena" (167; katso myös Jakobson, Fundamentals 27-28).

Foneemit, kielen pienimmät havaittavissa olevat elementit, eivät siis ole positiivisia esineitä, vaan "fenomenologinen todellisuus". Esimerkiksi englannin kielessä foneemi /t/ voidaan lausua monella eri tavalla, mutta joka tapauksessa englanninkielinen tunnistaa sen toimivan /t/:nä. Aspiroitu t (eli t, joka lausutaan h:n kaltaisella hengityksellä sen jälkeen), korkea tai matala t-ääni, pidennetty t-ääni ja niin edelleen, toimivat kaikki samalla tavalla erottaessaan merkityksen "to" ja "do" englanniksi. Lisäksi kielten väliset erot ovat sellaisia, että yhden kielen fonologiset vaihtelut voivat muodostaa erillisiä foneemia toisessa; näin ollen englanti erottaa /l/:n ja /r/:n, kun taas muut kielet ovat niin rakenteellisia, että näitä artikulaatioita pidetään saman foneemin muunnelmina (kuten englannin aspirated ja unaspirated t). Jokaisessa luonnollisessa kielessä suuri määrä mahdollisia sanoja on yhdistelmä pienestä määrästä foneemia. Esimerkiksi englannin kielellä on alle 40 foneemia, jotka muodostavat yhdessä yli miljoona eri sanaa.

Kielen foneemit ovat itsessään systemaattisesti järjestettyjä piirteiden rakenteita. 1920- ja 1930-luvuilla Saussuren johdolla Jakobson ja N. S. Trubetzkoy erottivat foneemien "erottelevat piirteet". Nämä piirteet perustuvat puheelinten fysiologiseen rakenteeseen - kieleen, hampaisiin, äänihuuliin ja niin edelleen. Saussure mainitsee Kurssissa ja jonka Harris kuvailee "fysiologiseksi fonetiikaksi" (39; Baskinin aikaisempi käännös käyttää termiä "fonologia" [(1959) 38]) - ja ne yhdistyvät "kimpuiksi" binääriopositiota muodostaen foneemia. Esimerkiksi englannin kielessä ero /t/:n ja /d/:n välillä on "äänen" olemassaolo tai puuttuminen (äänen sointujen sitoutuminen), ja äänestyksen tasolla nämä foneemit määrittelevät toistensa vastavuoroisesti. Tällä tavalla fonologia on erityinen esimerkki Saussuren kuvaamasta yleisestä kielen säännöstä: Kielessä on vain eroja. vielä tärkeämpää: ero tarkoittaa yleensä myönteisiä termejä, joiden välille ero muodostuu; mutta kielessä on vain eroja ilman myönteisiä termejä. Otetaanpa sitten merkitsevä tai merkitsijä, kielellä ei ole ideoita eikä ääniä, jotka olivat olemassa ennen kielijärjestelmää. ( 120)

Tässä kehyksessä kielelliset identiteetit eivät ole luontaisten ominaisuuksien, vaan systeemisten ("rakenteellisten") suhteiden määräämiä.

Olen sanonut, että fonologia "seurasi Saussuren johtoa", koska vaikka hänen analyysiään kielen tuotannon fysiologiasta "täytyisi nykyään", kuten Harris sanoo, "kutsuttaisiin "fyysiseksi" vastakohtana joko "psykologiseksi" tai "toiminnalliseksi". "" (Lukema 49), näin ollen Kurssilla hän muotoili kielen toiminnallisen analyysin suunnan ja ääriviivat. Samoin hänen ainoa laajennettu julkaistu teoksensa Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Muistokirja indoeurooppalaisten kielten primitiivisestä vokaalijärjestelmästä), joka ilmestyi vuonna 1878, sijoittui täysin 18. vuosisadan historiallinen kielitiede. Kuitenkin tässä työssä, kuten Jonathan Culler on väittänyt, Saussure osoitti "kielen ajattelun hedelmällisyyden puhtaasti suhteellisten kohteiden järjestelmänä, jopa silloin, kun hän työskentelee historiallisen jälleenrakennuksen tehtävänä" (Saussure 66). Analysoimalla foneemien välisiä systemaattisia rakenteellisia suhteita olemassa olevien indoeurooppalaisten kielten vokaalien vuorottelumallien huomioon ottamiseksi Saussure ehdotti, että useiden eri foneemien /a/ lisäksi on täytynyt olla toinenkin foneemi, joka voitaisiin kuvata muodollisesti. "Mikä tekee Saussuren työstä niin vaikuttavan", Culler päättelee, "on se tosiasia, että lähes viisikymmentä vuotta myöhemmin, kun nuolenkielinen heettiläinen sana löydettiin ja salattiin, sen havaittiin sisältävän foneemin, kirjoitettuna h, joka käyttäytyi kuten Saussure oli ennustanut. . Hän oli havainnut puhtaasti muodollisen analyysin avulla, mitä nykyään tunnetaan indoeurooppalaisen kurkunpäänä" (66).

Tämä käsitys merkittävyyden elementtien suhteellisesta tai diakriittisestä määrittelystä, joka on sekä implisiittinen että eksplisiittinen Kurssissa, ehdottaa kolmannen oletuksen, joka hallitsee rakenteellista lingvistiikkaa, mitä Saussure kutsuu "merkin mielivaltaiseksi luonteeksi". Tällä hän tarkoittaa sitä, että merkitsijän ja merkityn välinen suhde kielessä ei ole koskaan välttämätön (tai "motivoitunut"): yhtä helposti voitaisiin löytää äänimerkittäjä arbre kuin merkitsijäpuu, joka yhdistyy käsitteeseen "puu". Mutta enemmän kuin tämä, se tarkoittaa, että myös ilmaistu on mielivaltaista: käsite "puu" voidaan määritellä yhtä helposti sen puumaisen laadun (joka sulkee pois palmut) kuin koon (joka sulkee pois "matalat puumaiset kasvit") perusteella. kutsu pensaat). Tämän pitäisi tehdä selväksi, että esittämäni olettamusten numerointi ei edusta tärkeysjärjestystä: jokainen oletus - merkitsemisen systeeminen luonne (parhaiten ymmärrettävä tutkimalla kieltä "synkronisesti"), elementtien suhteellinen tai "diakriittinen" luonne. Merkinnän mielivaltaisuus, merkkien mielivaltaisuus - saa arvonsa muista.

Toisin sanoen Saussurean kielitiede on ilmiöitä, joita se tutkii kielen yleisissä yhdistelmä- ja kontrastisuhteissa. Tässä käsityksessä kieli on sekä merkityksen artikulointiprosessi (signifikaatio) että sen tuote (viestintä), eivätkä nämä kaksi kielen toimintoa ole identtisiä eivätkä täysin yhteneviä (ks. Schleifer, "Dekonstruktio"). Tässä nähdään Greimasin ja Courtesin modernistisessa tulkinnassa kuvaama muodon ja sisällön vuorottelu: kieli esittää vastakohtia, jotka määrittelevät muodollisesti sen yksiköt, ja nämä yksiköt yhdistyvät seuraavilla tasoilla muodostaen merkitsevän sisällön. Koska kielen elementit ovat mielivaltaisia, ei myöskään kontrastia tai yhdistelmää voida sanoa perustavanlaatuisiksi. Siten kielen erityispiirteet yhdistyvät muodostamaan vastakkaisia ​​foneemeja toisella käsitystasolla, foneemit yhdistyvät muodostamaan vastakkaisia ​​morfeemeja, morfeemit yhdistyvät muodostamaan sanoja, sanat muodostavat lauseita ja niin edelleen. Kussakin tapauksessa koko foneemi, sana tai lause ja niin edelleen on suurempi kuin osiensa summa (kuten vesi, H2O, Saussuren esimerkissä [(1959) 103] on enemmän kuin mekaaninen agglomeraatio vedystä ja hapesta).

Yleisen kielitieteen kurssin kolme oletusta sai Saussuren vaatimaan uutta 1900-luvun tiedettä, joka menisi kielitieteen lisäksi tutkimaan "merkkien elämää yhteiskunnassa". Saussure antoi tälle tieteelle nimen "semiologia (kreikan sanasta semeion "merkki")" (16). Semiotiikan "tiede", jota alettiin harjoittaa Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näiden rakenteiden muodostamiin (tai artikuloituihin) kirjallisiin esineisiin. Lisäksi Saussure suoritti koko uransa loppuosan, vaikka hän tarjosi yleisen kielitieteen kursseja, omaa "semioottista" myöhäisen latinalaisen runouden analyysiään yrittääkseen löytää tarkoituksella piilotettuja erisnimien anagrammeja. Tutkimusmenetelmä oli monella tapaa hänen kielellisten analyysiensa funktionaalisen rationalismin vastakohta: se yritti, kuten Saussure mainitsee yhdessä 99 muistikirjasta, joissa hän jatkoi tätä tutkimusta, tutkia systemaattisesti "sattuman" ongelmaa, joka " tulee kaiken väistämättömäksi perustaksi" (viitattu Starobinskissa 101). Tällainen tutkimus, kuten Saussure itse sanoo, keskittyy sattuman ja merkityksen "aineelliseen tosiasiaan" (mainittu 101), joten "teema-sana", jonka anagrammia Saussure etsii, kuten Jean Starobinski väittää, "on runoilijalle , väline, ei runon elintärkeä alkio. Runon tulee käyttää uudelleen teemasanan äänimateriaalia" (45). Tässä analyysissä Starobinski sanoo: "Saussure ei eksynyt etsiessään piilotettuja merkityksiä." Sen sijaan hänen työnsä näyttää osoittavan halua kiertää kaikki tietoisuudesta nousevat ongelmat: "Koska runous ei vain toteudu sanoissa, vaan se on jotain, joka syntyy sanoista, se välttyy mielivaltaisen tietoisuuden hallinnan kautta ollakseen riippuvainen vain eräänlaisesta kielellisestä laillisuudesta. "(121).

Toisin sanoen Saussuren yritys löytää erisnimet myöhään latinalaisesta runoudesta - mitä Tzvetan Todorov kutsuu "sanan vähentämiseksi". . . sen merkitsijälle" (266) - korostaa yhtä hänen kielellistä analyysiään ohjaavista elementeistä, merkin mielivaltaista luonnetta. (Se korostaa myös Saussurelaisen kielitieteen muodollista luonnetta - "Kieli", hän väittää, "on muoto eikä ei substanssi" - joka eliminoi tehokkaasti semantiikan tärkeimpänä analyysikohteena.) Kuten Todorov päättelee, Saussuren työ näyttää nykyään huomattavan homogeeniselta kieltäytyessään hyväksymästä symbolisia ilmiöitä. . . . Anagrammeja tutkiessaan hän kiinnittää huomiota vain toiston ilmiöihin, ei mieleen herättämiseen. . . . Nibelungeja koskevissa tutkimuksissaan hän tunnistaa symbolit vain voidakseen liittää ne virheellisiin lukemiin: koska ne eivät ole tarkoituksellisia, symboleja ei ole olemassa. Lopuksi yleiskielitieteen kursseilla hän pohtii semiologian ja siten muidenkin kuin kielellisten merkkien olemassaoloa; mutta tätä vahvistusta rajoittaa heti se tosiasia, että semiologia on omistettu yhden tyyppiselle merkille: niille, jotka ovat mielivaltaisia. (269-70)

Jos tämä on totta, se johtuu siitä, että Saussure ei voinut käsittää "aikomusta" ilman subjektia; hän ei voinut aivan paeta muodon ja sisällön vastakohtaa hänen työnsä teki niin paljon kyseenalaiseksi. Sen sijaan hän turvautui "kieliseen laillisuuteen". Sijaitsee toisaalta 1800-luvun historiakäsitysten, subjektiivisuuden ja näiden käsitysten hallitseman kausaalisen tulkinnan tavan ja toisaalta 1900-luvun "strukturalististen" käsitysten välissä siitä, mitä Levi-Strauss kutsui "kantialismiksi ilman" transsendenttinen subjekti" (mainittu Connertonissa 23) - käsitteitä, jotka poistavat muodon ja sisällön (tai subjektin ja objektin) vastakohdan sekä etualan ja taustan hierarkian täydellisessä strukturalismissa, psykoanalyysissä ja jopa kvanttimekaniikassa - Ferdinandin työ de Saussure kielitieteessä ja semiotiikassa rajaa signaalihetken merkityksen ja kulttuurin tutkimuksessa.

Ronald Schleifer

Liite 2

Ferdinand de Saussure (käännös)

Sveitsiläistä kielitieteilijää Ferdinand de Saussurea (1857-1913) pidetään modernin kielitieteen perustajana - kiitos hänen yrityksistään kuvata kielen rakennetta yksittäisten kielten ja sanamuotojen historian sijaan. Yleisesti ottaen kielitieteen ja kirjallisuuskritiikin rakenteellisten menetelmien ja suurelta osin semiotiikan perusta luotiin hänen teoksiinsa 1900-luvun alussa. On todistettu, että Jacques Derridan, Michel Foucault'n, Jacques Lacanin, Julia Kristevan, Roland Barthesin ja muiden teoksissa kehitetyt niin kutsutun "poststrukturalismin" menetelmät ja käsitteet juontavat juurensa Saussuren ja muiden kielitieteellisiin teoksiin. myöhäisroomalaisen runouden anagrammaattisia lukemia. On huomattava, että Saussuren kielitieteen ja kielellisen tulkinnan työ auttaa yhdistämään laajan valikoiman älyllisiä tieteenaloja - fysiikasta kirjallisiin innovaatioihin, psykoanalyysiin ja 1900-luvun alun filosofiaan. A. J. Greimas ja J. Kurte kirjoittavat teoksessa Semiotics and Language: "Analyyttinen sanakirja, jonka otsikko on "Tulkinta" uudenlaisena tulkintana, ilmestyi 1900-luvun alussa Saussuren kielitieteen, Husserlin fenomenologian ja psykoanalyysin ohella. Freudista. Tällaisessa tapauksessa "tulkinta ei ole tietyn sisällön liittämistä muotoon, josta sellainen muuten puuttuisi, vaan se on parafraasi, joka muotoilee toisella tavalla tietyn semioottisen järjestelmän merkittävän elementin saman sisällön" (159). ). Tässä "tulkinnan" ymmärtämisessä muoto ja sisältö ovat erottamattomat; päinvastoin, jokainen muoto on täynnä semanttista merkitystä ("merkittävä muoto"), joten tulkinta tarjoaa uuden, samanlaisen uudelleenkerronta jotain merkityksellistä toisessa merkkijärjestelmässä.

Samanlainen käsitys muodosta ja sisällöstä, jonka Claude Lévi-Strauss esitti yhdessä strukturalismin ohjelmallisessa teoksessa ("Rakenne ja muoto: Pohdintoja Vladimir Proppin teoksista"), on nähtävissä Saussuren postuumikirjassa A Course in Yleinen kielitiede (1916, käännös, 1959, 1983). Elämänsä aikana Saussure julkaisi vähän, "Course" - hänen pääteoksensa - kerättiin opiskelijoiden muistiinpanoista, jotka osallistuivat hänen yleisen kielitieteen luentoihin vuosina 1907-1911. Kurssissa Saussure vaati "tieteellistä" kielen tutkimusta ja asetti sen vastakkain 1800-luvun vertailevan historiallisen kielitieteen kanssa. Tätä teosta voidaan pitää yhtenä länsimaisen ajattelun suurimmista saavutuksista: yksittäisten sanojen perustana kielen rakenneelementteinä historiallinen (tai "diakrooninen") kielitiede osoitti Länsi-Euroopan kielten alkuperän ja kehityksen. yhteinen, indoeurooppalainen kieli - ja aikaisempi protoindoeurooppalainen kieli.

Saussure kyseenalaisti juuri tämän sanojen ainutlaatuisten esiintymien tutkimuksen, jossa oletetaan, että kielen perus"yksikkö" on itse asiassa näiden "sanaelementtien" positiivinen olemassaolo. Hänen työnsä oli yritys supistaa vertailevan kielitieteen satunnaisesti tutkimat monet kielen tosiasiat pieneen määrään lauseita. 1800-luvun vertaileva filologinen koulukunta, kirjoittaa Saussure, "ei onnistunut luomaan todellista kielitieteen koulukuntaa", koska "se ei ymmärtänyt tutkimuksen kohteen olemusta" (3). Tämä "olemus", hän väittää, ei piile vain yksittäisissä sanoissa - kielen "positiivisissa substansseissa" - vaan myös muodollisissa yhteyksissä, jotka auttavat näitä aineita olemaan olemassa.

Saussuren kielen "testi" perustuu kolmeen oletukseen. Ensinnäkin kielen tieteellinen ymmärtäminen ei perustu historialliseen, vaan rakenteelliseen ilmiöön. Siksi hän erotti kielen yksittäiset ilmiöt - "puhetapahtumat", jotka hän määrittelee "ehdonalaisiksi" - ja hänen mielestään varsinaisen kielitieteen tutkimuskohteen, järjestelmän (koodin, rakenteen), joka hallitsee näitä tapahtumia ( "kieli"). Tällainen systemaattinen tutkimus vaatii lisäksi "synkronista" käsitystä kielen elementtien välisestä suhteesta tietyllä hetkellä, eikä "diakroonista" tutkimusta kielen kehityksestä sen historian kautta.

Tämä hypoteesi oli edelläkävijä sille, mitä Roman Jakobson kutsui vuonna 1929 "strukturalismiksi" - teoriaksi, jossa "kaikkia nykyajan tieteen tutkimia ilmiöitä ei pidetä mekaanisena kertymänä, vaan rakenteellisena kokonaisuutena, jossa rakentava komponentti korreloi toiminto" ("Romanttinen "711). Tässä kohdassa Jakobson muotoili Saussuren ajatuksen kielen määrittelemisestä rakenteeksi, toisin kuin historiallisten tapahtumien "mekaaninen" luettelointi. Lisäksi Jakobson kehittää toisen saussurelaisen oletuksen, josta tuli rakennekielitieteen edelläkävijä: kielen peruselementtejä tulee tutkia ei niinkään syiden, vaan toimintojen yhteydessä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa. Tämä oli radikaali käänne ilmiöiden vertailussa ympäröivään todellisuuteen, jonka merkitystä filosofi Ernst Cassirer vertasi "Galileon tieteeseen, joka 1600-luvulla kumosi käsitykset aineellisesta maailmasta", siis itse selityksiin. Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa siihen vaikutukseen, joka niillä voi olla nykyisyydessä ja tulevaisuudessa. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tajuton" sanan freudilaisessa merkityksessä).

Saussure osoittaa kielitieteessään erityisesti tämän käänteen sanan käsitteen muutoksessa kielitieteessä, jonka hän määrittelee merkiksi ja kuvailee sen toimintojen perusteella. Hänelle merkki on äänen ja merkityksen yhdistelmä, "merkitty ja nimitys" (66-67; Roy Harrisin englanninkielisessä käännöksessä 1983 - "signification" ja "signal"). Tämän yhdisteen luonne on "toiminnallinen" (kumpikaan tai toinen alkuaine ei voi olla olemassa ilman toisiaan); lisäksi "toinen lainaa ominaisuuksia toiselta" (8). Siten Saussure määrittelee kielen päärakenneelementin - merkin - ja tekee historiallisen kielitieteen perustaksi merkkien identiteetin sanoihin, mikä vaatii erityisen tiukkaa analyysiä. Siksi voimme ymmärtää esimerkiksi saman sanan "puu" erilaisia ​​merkityksiä - ei siksi, että sana on vain joukko tiettyjä ominaisuuksia, vaan koska se on määritelty elementiksi merkkijärjestelmässä, "rakenteellisessa kokonaisuudessa". kielessä.

Tällainen suhteellinen ("diakriittinen") yhtenäisyyden käsite on rakenteellisen lingvistiikan kielen kaikkien elementtien käsitteen taustalla. Tämä näkyy erityisen selvästi Saussurean kielitieteen alkuperäisimmässä löydössä, "foneemien" ja kielen "erottelevien piirteiden" käsitteen kehittämisessä. Foneemit ovat pienimmät puhutuista ja merkityksellisistä kielen yksiköistä. Ne eivät ole vain kielessä esiintyviä ääniä, vaan "äänikuvia", toteaa Saussure, joilla äidinkielenään puhujat pitävät merkitystä. (On huomattava, että Elmar Holenstein kutsuu Jakobsonin kielitiedettä, joka jatkaa Saussuren ajatuksia ja käsitteitä pääsäännöissään, "fenomenologiseksi strukturalismiksi"). Siksi Prahan strukturalismin koulun johtava puhuja Jan Mukarowski huomautti vuonna 1937, että "rakenne. . . ei empiirinen, vaan fenomenologinen käsite; se ei ole itse tulos, vaan joukko merkittäviä kollektiivisen tietoisuuden suhteita (sukupolvi, muut jne.)”. Samanlaisen ajatuksen ilmaisi vuonna 1960 ranskalaisen strukturalismin johtaja Lévi-Strauss: "Rakenteella ei ole määrättyä sisältöä; se on merkityksellinen sinänsä, ja looginen rakenne, johon se on suljettu, on todellisuuden jälki.

Foneemit puolestaan ​​pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä kiinteää "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Imetetty, nostettu tai laskettu, pitkä "t"-ääni jne. erottavat yhtä hyvin sanojen "to" ja "do" merkitykset. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla ja ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Kielen äänet ovat systemaattisesti järjestetty joukko ominaisuuksia. 1920-1930-luvuilla, Saussuren jälkeen, Jacobson ja N.S. Trubetskoy korostivat foneemien "erottuvat piirteet". Nämä ominaisuudet perustuvat puheelinten rakenteeseen - kieli, hampaat, äänihuulet - Saussure huomaa tämän "Yleisen kielitieteen kurssissa", ja Harris kutsuu sitä "fysiologiseksi fonetiikaksi" (Baskinin aikaisemmassa käännöksessä termi "fonologia" " käytetään) - ne yhdistetään "solmuiksi » durg ystävää vastaan ​​saadakseen ääniä. Esimerkiksi englannin kielessä ero "t":n ja "d":n välillä on "äänen" olemassaolo tai puuttuminen (äänihuulien jännitys) ja äänen taso, joka erottaa yhden foneemin toisesta. Näin ollen fonologiaa voidaan pitää esimerkkinä Saussuren kuvaamasta yleisestä kielisäännöstä: "Kielessä on vain eroja." Vielä tärkeämpää ei ole tämä: ero tarkoittaa yleensä tarkat olosuhteet, joiden välillä se sijaitsee; mutta kielessä on vain eroja ilman tarkkoja ehtoja. Tarkastellaanpa sitten "nimeämistä" tai "merkittyä" - kielessä ei ole käsitteitä eikä ääniä, jotka olisivat olleet olemassa ennen kielijärjestelmän kehitystä.

Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Olen jo maininnut, että fonologia nojautui kehityksessään Saussuren ideoihin. Vaikka Harris sanoo, että hänen nykyaikaisen kielifysiologian analyysiään "kutsuttaisiin "fysikaaliseksi" vastakohtana "psykologiseksi" tai "toiminnalliseksi", hän ilmaisi Kurssissa selvästi kielen toiminnallisen analyysin suunnan ja perusperiaatteet. Hänen ainoa hänen elinaikanaan julkaistu teoksensa Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Huomautuksia indoeurooppalaisten kielten alkuperäisestä vokaalijärjestelmästä), joka julkaistiin vuonna 1878, oli täysin sopusoinnussa vertailevan historiallisen kielitieteen kanssa. 1800-luvulla. Kuitenkin tässä työssä, sanoo Jonathan Culler, Saussure osoitti "kielen idean hedelmällisyyden toisiinsa liittyvien ilmiöiden järjestelmänä, jopa sen historiallisen rekonstruoinnin kanssa". Analysoidessaan foneemien välistä suhdetta, selittäessään vokaalien vuorottelua indoeurooppalaisen ryhmän nykykielissä, Saussure ehdotti, että useiden eri äänten "a" lisäksi on oltava muita muodollisesti kuvattuja foneemia. "Erityisen vaikutuksen Saussuren teoksessa tekee", Kaller päättää, "että melkein 50 vuotta myöhemmin, kun heettiläinen nuolenpääkirja löydettiin ja purettiin, löydettiin foneemi, joka on merkitty kirjaimella "h", joka käyttäytyi Saussuren ennustamalla tavalla. Muodollisen analyysin avulla hän löysi sen, mikä tunnetaan nykyään indoeurooppalaisten kielten gutturaalina.

Merkkien suhteellisen (diakriittisen) määritelmän käsitteessä, sekä eksplisiittisessä että implisiittisessä Kurssissa, on rakenteellisen lingvistiikan kolmas keskeinen oletus, jota Saussure kutsuu "merkin mielivaltaiseksi luonteeksi". Tällä tarkoitetaan, että kielen äänen ja merkityksen suhdetta ei motivoi mikään: yhtä helposti voidaan yhdistää sana "arbre" ja sana "puu" käsitteeseen "puu". Lisäksi tämä tarkoittaa, että ääni on myös mielivaltainen: "puun" käsite voidaan määritellä kuoren läsnäolon (paitsi palmuja) ja koon mukaan (paitsi "matalat puumaiset kasvit" - pensaat). Tästä pitäisi olla selvää, että kaikkia esittämiäni oletuksia ei ole jaettu enemmän ja vähemmän tärkeisiin: jokainen niistä - merkkien systeeminen luonne (ymmärrettävin kielen "synkronisessa" tutkimuksessa), niiden suhteellinen (diakriittinen) olemus , merkkien mielivaltainen luonne - tulee muusta.

Näin ollen Saussurean kielitieteessä tutkittu ilmiö ymmärretään kielen vertailujen ja vastakohtien joukkona. Kieli on sekä sanojen merkityksen (nimitys) että niiden tuloksen (viestintä) ilmaisu - eivätkä nämä kaksi toimintoa koskaan kohtaa (katso Shleiferin "Kielen dekonstruktio"). Näemme Greimasin ja Kurten kuvaaman muodon ja sisällön vuorottelun uusimmassa tulkintaversiossa: kielelliset kontrastit määrittelevät sen rakenneyksiköt, ja nämä yksiköt vuorovaikuttavat peräkkäisillä tasoilla luodakseen tietyn merkityksellisen sisällön. Koska kielen elementit ovat satunnaisia, ei kontrasti tai yhdistelmä voi olla perusta. Tämä tarkoittaa, että kielessä tunnusmerkit muodostavat foneettisen kontrastin eri ymmärrystasolla, foneemit yhdistetään vastakkaisiin morfeemeihin, morfeemit - sanoiksi, sanat - lauseiksi jne. Joka tapauksessa kokonainen foneemi, sana, lause jne. on enemmän kuin osiensa summa (kuten vesi, Saussuren esimerkissä, on enemmän kuin vedyn ja hapen yhdistelmä).

"Yleisen kielitieteen kurssin" kolme oletusta johtivat Saussuren ajatukseen 1900-luvun uudesta tieteestä, joka on erillinen kielitieteestä ja joka tutkii "merkkien elämää yhteiskunnassa". Saussure kutsui tätä tiedettä semiologiaksi (kreikan sanasta "semeion" - merkki). Semiotiikan "tiede", joka kehittyi Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näillä rakenteilla valmistetuiksi (tai muotoilluiksi) kirjallisiksi löydöksiksi. Lisäksi uransa hämärässä, yleisen kielitieteen kurssin ohella, Saussure harjoitti myöhäisroomalaisen runouden "semioottista" analyysiä yrittäen löytää tarkoituksella laadittuja erisnimien anagrammeja. Tämä menetelmä oli monella tapaa rationalismin vastakohta lingvistisessä analyysissään: se oli yritys, kuten Saussure kirjoittaa yhdessä 99 muistikirjasta, tutkia järjestelmässä "todennäköisyyden" ongelmaa, josta "tulee kaiken perusta". " Tällainen tutkimus, Saussure itse väittää, auttaa keskittymään todennäköisyyden "todelliseen puoleen"; ”Avainsana”, jolle Saussure etsii anagrammia, on Jean Starobinskyn mukaan ”runoilijan työkalu, ei runon elämän lähde. Runo toimii käänteisenä avainsanan äänet. Starobinskyn mukaan tässä analyysissä "Saussure ei syvenny piilotettujen merkityksien etsimiseen". Päinvastoin, hänen teoksissaan on havaittavissa halu välttää tietoisuuteen liittyviä kysymyksiä: "koska runous ilmaistaan ​​paitsi sanoissa, myös siinä, mitä nämä sanat synnyttävät, se menee tietoisuuden hallinnan ulkopuolelle ja riippuu vain kielen lakeja."

Saussuren yritys tutkia erisnimiä myöhäisroomalaisessa runoudessa (Tsvetan Todorov kutsui tätä lyhenteeksi "sanasta ... vain ennen kuin se on kirjoitettu") korostaa yhtä hänen kielellisen analyysinsä komponenteista - merkkien mielivaltaista luonnetta sekä Saussurelaisen kielitieteen muodollinen olemus ("Kieli", hän väittää, "muodon olemus, ei ilmiö"), mikä sulkee pois mahdollisuuden analysoida merkitystä. Todorov päättelee, että nykyään Saussuren kirjoitukset näyttävät erittäin johdonmukaisilta haluttomuudessaan tutkia symboleja [ilmiöitä, joilla on hyvin määritelty merkitys]. . . . Anagrammeja tutkiessaan Saussure kiinnittää huomiota vain toistoon, mutta ei aikaisempiin vaihtoehtoihin. . . . Nibelungia tutkiessaan hän määrittelee symbolit vain liittääkseen ne virheellisiin lukemiin: jos ne ovat tahattomia, symboleja ei ole olemassa. Loppujen lopuksi hän tekee yleisen kielitieteen kirjoituksissaan oletuksen semiologian olemassaolosta, joka ei kuvaa vain kielellisiä merkkejä; mutta tätä oletusta rajoittaa se tosiasia, että semiologia voi kuvata vain satunnaisia, mielivaltaisia ​​merkkejä.

Jos tämä todella on niin, se johtuu vain siitä, että hän ei voinut kuvitella "aikomusta" ilman esinettä; hän ei kyennyt täysin kuromaan umpeen muodon ja sisällön välistä kuilua - hänen kirjoituksissaan tämä muuttui kysymykseksi. Sen sijaan hän kääntyi "kieliseen legitiimiyteen". Toisaalta 1800-luvun historiaan ja subjektiivisiin olettamuksiin perustuvien käsitteiden ja näihin käsitteisiin perustuvien satunnaisten tulkintamenetelmien ja toisaalta strukturalististen käsitteiden välillä, joita Lévi-Strauss kutsui "kantialismiksi ilman transsendenttia". näyttelijä" - pyyhkimällä pois muodon ja sisällön (subjektin ja objektin), merkityksen ja alkuperän vastakkainasettelun strukturalismista, psykoanalyysistä ja jopa kvanttimekaniikasta - Ferlinand de Saussuren lingvistiikkaa ja semiotiikkaa käsittelevät teokset merkitsevät käännekohtaa kielen ja merkityksen tutkimuksessa. kulttuuri.

Ronald Shleifer

Kirjallisuus

1. Admoni V.G. Kieliopin perusteet / V.G. Admoni; Neuvostoliiton tiedeakatemia.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Kielitieteen matemaattiset menetelmät. M., 1974.

4. Arnold I.V. Sanan semanttinen rakenne modernissa englannissa ja sen tutkimusmenetelmät. /I.V. Arnold-L .: Koulutus, 1966. - 187 s.

6. Bašlykov A.M. Automaattinen käännösjärjestelmä. / OLEN. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7. Baudouin de Courtenay: Teoreettinen perintö ja nykyaika: Tiivistelmät kansainvälisen tieteellisen konferenssin raporteista / Ed.I.G. Kondratjev. - Kazan: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Kieli ja tilastot. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoreettinen ja soveltava kielitiede. / V.A. Zvegintsev - M., 1969. - 143 s.

11. Kasevich, V.B. Semantiikka. Syntaksi. Morfologia. // V.B. Kasevich - M., 1988. - 292 s.

12. Lekomtsev Yu.K. JOHDANTO kielitieteen muodolliseen kieleen / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. Baudouin de Courtenayn kielellinen perintö 1900-luvun lopulla: Kansainvälisen tieteellisen ja käytännön konferenssin tiivistelmät 15.-18. maaliskuuta 2000. - Krasnojarsk, 2000. - 125 s.

Matveeva G.G. Piilotetut kieliopilliset merkitykset ja puhujan sosiaalisen henkilön ("muotokuva") tunnistaminen / G.G. Matveev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Kokemus kielellisten mallien rakentamisesta "Meaning<-->Teksti". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Käännös ja soveltava kielitiede / L.L. Nelyubin. - M.: Higher School, 1983. - 207 s.

16. Tarkoista kielentutkimuksen menetelmistä: ns. "matemaattisesta lingvistiikasta" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva ja muut - M., 1961. - 162 s.

17. Piotrovsky L.G. Matemaattinen kielitiede: oppikirja / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Higher School, 1977. - 160 s.

18. Hän on. Teksti, kone, henkilö. - L., 1975. - 213 s.

19. Hän on. Soveltava kielitiede / Toim. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. kielimalleja. M., 1963. Revzin, I.I. Nykyaikainen rakennelingvistiikka. Ongelmat ja menetelmät. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Yleisen ja konekääntämisen perusteet / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. F. de Saussuren teoria modernin kielitieteen valossa / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Pöllö, L.Z. Analyyttinen kielitiede / L.Z. Pöllö - M., 1970. - 192 s.

24. Saussure F. de. Huomautuksia yleisestä kielitieteestä / F. de Saussure; Per. alkaen fr. - M.: Progress, 2000. - 187 s.

25. Hän on. Yleiskielitieteen kurssi / Per. alkaen fr. - Jekaterinburg, 1999. -426 s.

26. Puhetilastot ja automaattinen tekstianalyysi / Toim. toim. R.G. Piotrovsky. L., 1980. - 223 s.

27. Stoll, P. Sarjat. Logiikka. Aksiomaattiset teoriat / R. Stoll; Per. englannista. - M., 1968. - 180 s.

28. Tenier, L. Rakenteellisen syntaksin perusteet. M., 1988.

29. Ubin I.I. Käännöstoiminnan automatisointi Neuvostoliitossa / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Käsitteellisen tiedon käsittely. M., 1980.

32. Shikhanovich, Yu.A. JOHDANTO moderniin matematiikkaan (alkukäsitteet). M., 1965

33. Shcherba L.V. Venäjän vokaalit laadullisesti ja kvantitatiivisesti / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Maailman kansalainen // Spark - 1996. - Nro 5. - s.13

35. V.A. Uspensky. Alustava "Uuden kirjallisuuskatsauksen" lukijoille Andrei Nikolajevitš Kolmogorovin semioottisiin viesteihin. - Uusi kirjallisuuskatsaus. -1997. - Nro 24. - S. 18-23

36. Perlovsky L. Tietoisuus, kieli ja kulttuuri. - Tieto on valtaa. -2000. №4 - S. 20-33

Johdanto? Luento Käännösteoria

Viime vuosisadan aikana kielitiede on aina ollut esimerkkinä tieteestä, joka kehittyi nopeasti ja saavutti metodologisen kypsyyden. Jo viime vuosisadan puolivälissä nuori tiede otti luottavaisesti paikkansa tieteiden joukossa, joilla oli tuhatvuotinen perinne, ja yksi sen merkittävimmistä edustajista - A. Schleicher - uskalsi uskoa teoksillaan oli jo summannut viimeisen rivin.<113>Kielitieteen historia on kuitenkin osoittanut, että tällainen mielipide oli liian hätäinen ja perusteeton. Vuosisadan lopulla kielitiede koki ensimmäisen suuren shokin, joka liittyi uuskielisten periaatteiden kritiikkiin, jota seurasi muut. On huomattava, että kaikki kriisit, jotka voimme paljastaa kielitieteen historiassa, eivät pääsääntöisesti horjuttaneet sen perustaa, vaan päinvastoin, myötävaikuttivat vahvistumiseen ja toivat viime kädessä mukanaan jalostusta ja parannusta. kielitieteellisen tutkimuksen menetelmistä, laajeneen teemojen ja tieteellisten kysymysten mukana.

Mutta kielitieteen ohella myös muut tieteet elivät ja kehittyivät, mukaan lukien suuri joukko uusia. Fysikaaliset, kemialliset ja tekniset (ns. "tarkat") tieteet ovat kehittyneet aikamme erityisen nopeasti, ja niiden teoreettinen perusta, matematiikka, on hallinnut niitä kaikkia. Tarkat tieteet eivät ole pelkästään painaneet kaikkia humanistisia tieteitä, vaan ne tällä hetkellä pyrkivät "saamaan ne uskoonsa", alistamaan ne tapoilleen, pakottamaan niille tutkimusmenetelmänsä. Nykytilanteessa japanilaisella ilmaisulla voidaan sanoa, että nyt kielitieteilijät-filologit saastuttavat maton reunaa, jossa eksaktitieteet matematiikan johdolla sijoittuvat voitokkaasti ja vapaasti.

Eikö yleisten tieteellisten intressien kannalta olisi tarkoituksenmukaisempaa antautua matematiikalle, antautua kokonaan sen menetelmien valtaan, jolle jotkut äänet avoimesti kutsuvat 59 , ja siten kenties saada uutta voimaa? Vastataksemme näihin kysymyksiin on ensin tarkasteltava, mitä matematiikka väittää tässä tapauksessa, millä kielitieteen alueella matemaattiset menetelmät löytävät sovelluksensa, missä määrin ne ovat yhdenmukaisia ​​kielimateriaalin erityispiirteiden kanssa ja pystyvätkö ne antamaan tai jopa vain ehdottaa vastauksia noihin kysymyksiin.kielen tieteen asettamat.

Heti alusta alkaen on huomattava, että kielitieteen uuden, matemaattisen suuntauksen harrastajien keskuudessa<114>Staattisessa tutkimuksessa sen tavoitteista ja päämääristä ei ole yksimielisyyttä. Acad. A. A. Markov, joka sovelsi ensimmäisenä matemaattisia menetelmiä kieleen, Boldrini, Yul, Mariotti pitävät kielen elementtejä sopivana havainnollistavana materiaalina kvantitatiivisten menetelmien rakentamiseen tai tilastollisiin teoreemoihin ilman, että ihmettelevät, ovatko tällaisen tutkimuksen tulokset kiinnostavia kielitieteilijöille 6 0 . Ross uskoo, että todennäköisyysteoria ja matemaattiset tilastot tarjoavat työkalun tai, kuten ne nykyään haluavat sanoa, matemaattisen mallin testata ja vahvistaa niitä kielellisiä johtopäätöksiä, jotka mahdollistavat numeerisen tulkinnan. Matemaattisia menetelmiä pidetään siis vain kielellisen tutkimuksen apuvälineinä 6 1 . Paljon enemmän väittää Herdan, joka kirjassaan ei vain tiivistänyt ja systematisoi kaikki kieliongelmien matemaattisen tutkimuksen yritykset, vaan yritti myös antaa niille selkeän suuntauksen jatkotyöhön. Hän keskittyy kirjansa koko materiaalin esittelyyn "kirjallisuuden tilastojen ymmärtämiseen (kuten hän kutsuu tekstien tutkimista matemaattisten tilastojen menetelmillä". KLO 3.) kiinteänä osana kielitiedettä” 6 2 ja muotoilee tämän uuden kielitieteen osan olemuksen ja tehtävät seuraavasti: ”Kirjallisuustilasto kvantitatiivisena kielifilosofiana soveltuu kaikille kielitieteen aloille. Mielestämme kirjallisuustilasto on kvantitatiivisen tieteen tai kvantitatiivisen filosofian tasolle nostettua rakennekielitiedettä. Näin ollen on yhtä väärin määritellä sen tulokset soveltamisalan ulkopuolelle<115>kielitiede tai käsitellä sitä tutkimuksen apuvälineenä” 6 3 .

On tuskin suotavaa mennä teoretisoimaan, onko tässä tapauksessa oikeutettua puhua uuden kielitieteen haaran syntymisestä ja ratkaista sen väitteiden kysymys viittaamatta ensin siihen, mitä tässä on tosiasiallisesti tehty. 6 4 . Tämä auttaa meitä ymmärtämään mielipide-erot.

Matemaattisten (tai tarkemmin sanottuna tilastollisten) kriteerien käyttö kieliongelmien ratkaisemiseksi ei ole millään tavalla uutta kielitieteelle, ja kielitieteilijät ovat tavalla tai toisella käyttäneet sitä jo pitkään. Loppujen lopuksi sellaiset perinteiset kielitieteen käsitteet kuin foneettinen laki (ja siihen liittyvät<116>nee sen kanssa - poikkeus lakiin), kieliopillisten elementtien tuottavuus (esim. johdannaisliitteet) tai jopa kriteerit kielten välisille sukulaisille suhteille perustuvat jossain määrin suhteellisiin tilastollisiin piirteisiin. Loppujen lopuksi mitä terävämpi ja selkeämpi tilastollinen vastakohta havaitut tapaukset ovat, sitä enemmän on syytä puhua tuottavista ja tuottamattomista jälkiliitteistä, foneettisesta laista ja sen poikkeuksista, kielten välisen sukulaisuuden olemassaolosta tai puuttumisesta. Mutta jos tällaisissa tapauksissa tilastollista periaatetta käytettiin enemmän tai vähemmän spontaanisti, niin tulevaisuudessa sitä alettiin soveltaa tietoisesti ja jo tietyllä tavoitteella. Joten meidän aikanamme niin sanotut yksittäisten kielten sanaston ja ilmaisujen taajuussanakirjat 6 5 tai jopa monikielisten sanojen merkitykset, joissa on "yleinen todellisuuteen keskittyvä" 6 6, ovat yleistyneet. Näiden sanakirjojen tiedoista laaditaan vieraiden kielten oppikirjoja (jonka tekstit rakentuvat yleisimmin käytetylle sanastolle) ja vähimmäissanakirjoja. Tilastolaskennassa löydettiin erityinen kielellinen käyttö M. Swadeshin leksikostatistiikan tai glottokronologian menetelmässä, jossa tilastollisten kaavojen perusteella, jotka ottavat huomioon tapaukset, joissa sanoja katoaa päärahaston kielistä, on mahdollista määrittää kieliperheiden jaon absoluuttinen kronologia 6 7 .

Viime vuosina tapaukset, joissa matemaattisia menetelmiä sovelletaan kielelliseen materiaaliin, ovat lisääntyneet merkittävästi, ja tällaisten yritysten massassa on hahmoteltu enemmän tai vähemmän määrättyjä suuntauksia. Käännytään<117>peräkkäiseen tarkasteluun menemättä yksityiskohtiin.

Aloitetaan suunnasta, jolle on annettu nimi stylostistics. Tässä tapauksessa puhutaan yksittäisten teosten tai tekijöiden tyylipiirteiden määrittelystä ja karakterisoinnista käytettävien kielellisten elementtien kvantitatiivisten suhteiden kautta. Tilastollinen lähestymistapa tyyliilmiöiden tutkimukseen perustuu kirjallisen tyylin ymmärtämiseen yksilöllisenä tapana hallita kielen välineitä. Samanaikaisesti tutkija on täysin hajamielinen kysymyksestä laskettavien kielellisten elementtien laadullisesta merkityksestä keskittyen kaiken huomionsa vain kvantitatiiviseen puoleen; tutkittujen kieliyksiköiden semanttinen puoli, emotionaalinen ja ilmaisullinen kuormitus sekä osuus taideteoksen kudoksesta - kaikki tämä jää huomiotta, viittaa ns. redundanttisiin ilmiöihin. Siten taideteos esiintyy mekaanisena aggregaatin muodossa, jonka rakenteen spesifisyys ilmaistaan ​​vain sen elementtien numeeristen suhteiden kautta. Stylostatistiikan edustajat eivät ummista silmiään kaikista todetuista olosuhteista vastustaen perinteisen stilistiikan menetelmiä, jotka epäilemättä sisältävät subjektiivisuuden elementtejä, yhdellä matemaattisen menetelmän laadulla, joka heidän mielestään kompensoi kaikki sen puutteet - saavutettujen tulosten objektiivisuus. "Pyrimme", kirjoittaa esimerkiksi V. Fuchs, "... karakterisoimaan kielellisen ilmaisun tyyliä matemaattisin keinoin. Tätä tarkoitusta varten tulisi luoda menetelmiä, joiden tulosten tulee olla yhtä objektiivisia kuin eksaktien tieteiden tuloksilla ... Tämä viittaa siihen, että ainakin aluksi käsittelemme vain muodollisia rakenteellisia ominaisuuksia, emme semanttisia kielellisten ilmaisujen sisältö . Tällä tavalla saamme järjestyssuhteiden järjestelmän, joka kokonaisuutena tulee olemaan matemaattisen tyyliteorian perusta ja lähtökohta” 6 8 .<118>

Yksinkertaisin tilastollinen lähestymistapa kirjailijoiden tai yksittäisten teosten kielen tutkimiseen on käytettyjen sanojen laskeminen, koska sanakirjan rikkauden pitäisi ilmeisesti luonnehtia tekijää itseään tietyllä tavalla. Tällaisten laskelmien tulokset antavat kuitenkin tässä suhteessa hieman odottamattomia tuloksia eivätkä edistä millään tavalla kirjallisen teoksen esteettistä tietämystä ja arviointia, mikä ei ole vähiten yksi stilistiikan tehtävistä. Tässä on joitain tietoja useissa teoksissa käytettyjen sanojen kokonaismäärästä:

Raamattu (latinaksi). . . . . . . . . . 5649 sanaa

Raamattu (heprea). . . . 5642 sanaa

Demosthenes (puhe). . . . . . . . . . . . 4972 sanaa

Sallust. . . . . . . . . . . . . . . . . 3394 sanaa

Horace. . . . . . . . . . . . . . . . . . . .6084 sanaa

Dante (jumalallinen näytelmä) 5860 sanaa

(tämä sisältää 1615 erisnimeä ja maantieteellistä nimeä)

Tasso (Furious Orland). . . . 8474 sanaa

Milton. . . . . . . . . . . . . . . . . . . . .8000 sanaa (noin annettu)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 sanaa

(muiden lähteiden mukaan noin 20 000 sanaa)

O. Jespersen huomauttaa, että Zolan, Kiplingin ja Jack Londonin sanakirja ylittää merkittävästi Miltonin sanakirjan, eli luku on 8000 6 9 . Yhdysvaltain presidentin W. Wilsonin puhesanakirjan laskelma totesi, että se on rikkaampi kuin Shakespearen. Tähän pitäisi lisätä psykologien tiedot. Niinpä Terman havaitsi useiden tapausten havaintojen perusteella, että keskimääräisen lapsen sanavarasto on noin 3600 sanaa ja 14-vuotiaana jo 9000 sanaa. Keskimääräinen aikuinen käyttää 11700 sanaa, ja henkilö "lisääntynyt" älykkyys" 13500 7 0 asti. Tällaiset numeeriset tiedot eivät siis sinänsä anna perusteita teosten tyyliominaisuuksien tunnistamiselle ja vain "objektiivisesti"<119>ne kertovat eri kirjoittajien käyttäneen eri määrän sanoja, mikä, kuten yllä olevat laskelmat osoittavat, ei liity heidän teostensa suhteelliseen taiteelliseen arvoon.

Laskelmat yksittäisten tekijöiden suhteellisesta sanankäytön tiheydestä on rakennettu hieman eri tavalla. Tässä tapauksessa ei oteta huomioon vain sanojen kokonaismäärää, vaan myös yksittäisten sanojen käyttötiheyttä. Tällä tavalla saadun aineiston tilastollinen käsittely koostuu siitä, että yhtä usein käytetyt sanat ryhmitellään luokkiin (tai riveihin), mikä johtaa kaikkien tietyn kirjoittajan käyttämien sanojen esiintymistiheysjakauman määrittämiseen. Tämänkaltaisen laskennan erikoistapaus on erikoissanojen suhteellisen tiheyden määrittäminen (esim. romaaninen sanasto Chaucerin teoksissa, kuten Mersand 7 1 teki). Kirjoittajien käyttämien sanojen suhteellinen esiintymistiheys sisältää saman objektiivisen tiedon yksittäisten tekijöiden tyylistä kuin yllä olevat kokonaislaskelmat, sillä ainoalla erolla, että tuloksena saadaan tarkempaa numeerista tietoa. Mutta sitä käytetään myös saman tekijän yksittäisten teosten päivämäärään perustuen alustavaan laskelmaan hänen sanankäytön suhteellisesta tiheydestä hänen eri elämänvaiheissaan (tekijän itsensä päivättyjen teosten mukaan). Toinen tällaisten laskelmien tietojen käyttötapa on sellaisten teosten aitouden toteaminen, joiden osalta tämä kysymys vaikuttaa epäilyttävältä 7 2 . Tässä viimeisessä tapauksessa kaikki perustuu tilastollisten kaavojen vertailuun käyttötiheydelle aidoissa ja kiistanalaisissa teoksissa. Ei tarvitse puhua sellaisilla menetelmillä saatujen tulosten erittäin suuresta suhteellisuudesta ja likimääräisyydestä. Loppujen lopuksi suhteellinen käyttötiheys ei muutu vain tekijän iän mukaan, vaan myös riippuen teoksen genrestä, juonesta ja myös teoksen toiminnan historiallisesta ympäristöstä (vertaa esimerkiksi "Leipä" ja "Pietari" I" kirjoittanut A. Tolstoi).<120>

Yllä kuvattua menetelmää syventämällä stylostatistiikka tyyliominaisuutena alkoi turvautua yleisimmin käytettyjen sanojen suhteellisen tiheyden stabiilisuuden kriteeriin. Tässä tapauksessa käytettyä menetelmää voidaan havainnollistaa Pushkinin tarinan "Kapteenin tytär" tilastollisella käsittelyllä, jonka Esselson ja Epstein ovat Detroitin yliopiston (USA) slaavilaisten kielten instituutissa 7 3 . Kyselyyn tehtiin koko tarinan teksti (noin 30 000 sanaa) ja sen jälkeen kohdat, joissa oli noin 10 000 ja 5 000 esiintymää. Lisäksi sanojen käytön suhteellisen tiheyden stabiiliuden määrittämiseksi verrattiin 102 yleisimmin käytettyä sanaa (taajuudella 1160 kertaa 35) laskettuun suhteelliseen esiintymistiheyteen (tehty valikoivien kohtien perusteella) varsinaisen kanssa. Esimerkiksi liittoa "ja" käytettiin 1 160 kertaa koko tarinan ajan. Kohdassa, joka sisältää 5 000 esiintymää kaikista sanoista, tätä konjunktiota pitäisi käyttää 5 000 x 1 160: 30 000 tai pyöristettynä ylöspäin 193 kertaa ja 10 000 esiintymää sisältävässä osassa sitä käytetään 10 000 x 1, 160 : 30 000 tai 386 kertaa. Tällaisilla laskelmilla saatujen tietojen vertailu todellisiin tietoihin osoittaa hyvin pientä poikkeamaa (5 prosentin sisällä). Tällaisten laskelmien perusteella havaittiin, että tässä Pushkinin tarinassa prepositiota "k" käytetään kaksi kertaa useammin kuin "y" ja pronominia "sinä" käytetään kolme kertaa useammin kuin "he" jne. , huolimatta juonen kaikista mutkista, niin koko tarinan kuin sen yksittäisissä osissa, sanojen käytön suhteellinen tiheys on vakaa. Joidenkin (yleisimpien) sanojen suhteen havaittu pätee oletettavasti kaikkiin teoksessa käytettyihin sanoihin. Tästä seuraa, että kirjoittajan tyyliä voidaan luonnehtia tietyllä sanan keskimääräisen käyttötiheyden vaihtelusuhteella tietyn kielen yleiseen tiheyteen.<121>sen käytön tiheys. Tätä suhdetta pidetään tekijän tyylin objektiivisena määrällisenä ominaisuutena.

Muita kielen rakenteen muodollisia elementtejä tutkitaan samalla tavalla. Joten esimerkiksi V. Fuchs alisti Goethen, Rilken, Caesarin, Sallustin jne. teosten metriset piirteet vertailevalle-tilastolliselle tarkastelulle.

Sanankäytön suhteellisen tiheyden stabiilisuuden kriteeri selventää tyylin kvantitatiivisen karakterisoinnin tekniikkaa, mutta se ei tuo mitään perustavanlaatuista uutta verrattuna edellä analysoituihin primitiivisempiin menetelmiin. Kaikki stylostatistiikan menetelmät tuottavat lopulta yhtä kiihkeitä "objektiivisia" tuloksia, jotka liukuvat kielen pinnalla ja takertuvat vain puhtaasti ulkoisiin merkkeihin. Kvantitatiiviset menetelmät eivät ilmeisesti pysty keskittymään tutkittavan aineiston laadullisiin eroihin ja itse asiassa tasoittamaan kaikkia tutkittavia kohteita.

Jos vaaditaan enimmäismäärittelyä, tarjotaan yleisimmät kriteerit. laadulliset ominaisuudet ilmaistaan ​​määrän kielellä. Tämä ei ole vain looginen ristiriita, vaan myös erimielisyys asioiden luonteen kanssa. Todellakin, mitä tapahtuu, jos yritämme saada Aleksanteri Gerasimovin ja Rembrandtin teoksille vertailevan tyylillisen (eli siis laadullisen) ominaisuuden, joka perustuu punaisen ja mustan maalin määrälliseen suhteeseen heidän kankaissaan? Se näyttää olevan ehdotonta hölynpölyä. Missä määrin täysin "objektiivinen" kvantitatiivinen tieto henkilön fyysisistä tiedoista voi antaa meille käsityksen kaikesta, mikä kuvaa henkilöä ja muodostaa hänen todellisen olemuksensa? Ilmeisesti ei yhtään. Ne voivat toimia vain yksilöllisenä merkkinä, joka erottaa henkilön toisesta, kuten käänteiden jälki peukalossa. Tilanne on samanlainen kirjallisen tyylin määrällisten ominaisuuksien kanssa. Jos katsot tarkasti, ne tarjoavat aivan yhtä niukkaa tietoa todellisen tyylin arvioimiseksi<122>tekijän kielen ominaisuudet sekä kuvaus sormen käänteistä ihmisen psykologian tutkimista varten.

Kaikkeen sanottuun on lisättävä, että aiemmin niin sanotussa kirjallisuuskritiikin muodollisessa koulukunnassa yritettiin jo kvantitatiivisesti tutkia kirjailijoiden tyyliä, jolloin epiteetit, metaforat ja rytmis-melodiset elementit jakeesta laskettiin. Tätä yritystä ei kuitenkaan kehitetty enempää.

Toinen matemaattisten menetelmien sovellusalue kielellisten ilmiöiden tutkimiseen voidaan ryhmitellä kielitilastojen nimeen. Se pyrkii tunkeutumaan kieliteorian peruskysymyksiin ja siten saamaan kutsumuksen oikealle kielelle. Tutustuaksesi tähän suuntaan, on parasta kääntyä jo mainitun Herdanin työn puoleen, yhden sen monista arvioijista sanoin "hirvittävän vaatimaton kirja" 7 5 , sai kuitenkin laajan vastaanoton kielitieteilijöiden keskuudessa 7 6 . Ottaen huomioon sen tosiasian, että Kherdan (kuten jo edellä mainittiin) pyrki koomaan kirjaansa kaiken merkittävimmän matemaattisten menetelmien soveltamisen alalla kielellisiin ongelmiin, hänen kirjassaan emme itse asiassa käsittele niinkään Kherdania vaan kokonaisuutta. trendi. Kuten jo kirjan otsikko "Kieli valintana ja todennäköisyytenä" osoittaa, sen pääpaino on selventää, mikä kielessä on jätetty puhujan vapaalle valinnalle ja mikä johtuu kielen immanentista rakenteesta, kuten määritettäessä ensimmäisen ja toisen kertaluvun elementtien määrällinen suhde. Kherdanin kirja tarjoaa lähes tyhjentäviä tietoja kaikesta eri erikoisalojen edustajien tällä alalla tekemästä työstä.<123>(filosofit, lingvistit, matemaatikot, teknikot), mutta ei rajoitu tähän ja sisältää monia alkuperäisiä havaintoja, pohdintoja ja johtopäätöksiä itse kirjoittajalta. Yhteenvetotyönä se antaa hyvän käsityksen käytetyistä kvantitatiivisista menetelmistä ja niiden avulla saavutetuista tuloksista. Kysymyksiä, jotka ehdollisesti yhdistämme kielitilastojen osioon, käsitellään kirjan toisessa ja neljännessä osassa.

Monista tapauksista, joissa matemaattisten tilastojen menetelmiä sovelletaan kielellisten kysymysten tutkimiseen, keskitymme yleisimpiin, joita voidaan samalla pitää tyypillisimpänä. Muiden kirjoittajien tietojen käyttö - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 ja muut, sekä lainaa omia tutkimuksiaan, jotka määrittävät foneemien, kirjainten ja sanan pituuden suhteellisen esiintymistiheyden (kirjainten ja tavujen lukumäärällä mitattuna) , kieliopilliset muodot ja metriset elementit latinan ja kreikan heksametrissä, Herdan vahvistaa kielellisten elementtien suhteellisen tiheyden vakauden olevan kaikkien kielellisten rakenteiden yhteinen piirre. Hän johdattaa seuraavan säännön: "Kielellisen koodauksen jollekin tasolle tai alaan kuuluvien kielellisten elementtien - fonologian, kieliopin, metriikan - suhteet pysyvät suunnilleen vakioina tietylle kielelle, sen tietyllä kehitysjaksolla ja sen sisällä. riittävän laajojen ja puolueettomasti suoritettujen havaintojen rajat. » 8 2 . Tätä sääntöä, jota Herdan kutsuu kielen peruslakiksi, hän pyrkii tulkitsemaan ja laajentamaan tietyllä tavalla. "Hän", Herdan kirjoittaa tästä laista, "on ilmentymä siitä tosiasiasta, että täälläkin, missä ihmisen tahto ja valinnanvapaus on taattu<124>laajin viitekehys, jossa tietoinen valinta ja huoleton leikki elävästi vuorottelevat keskenään, yleisesti ottaen on huomattavaa vakautta... kielioppissa, mutta myös suhteessa tiettyjen foneemien, leksikaalisten yksiköiden (sanojen) ja kieliopillisten foneemien käyttötiheyteen ja rakenteet; toisin sanoen samankaltaisuus ei ole vain siinä, mitä käytetään, vaan myös kuinka usein sitä käytetään” 8 3 . Tämä tilanne johtuu ymmärrettävistä syistä, mutta tämä antaa aihetta uusiin johtopäätöksiin. Esimerkiksi tietyn kielen eri tekstejä tai osia tarkasteltaessa havaitaan, että tietyn foneemin (tai muiden puheelementtien) suhteelliset käyttötaajuudet eri ihmisissä pysyvät periaatteessa samoina. Tämä johtaa yksittäisten puhemuotojen tulkintaan joinakin vaihteluina tarkasteltavan foneemin jatkuvassa käyttötodennäköisyydessä tietyllä kielellä. Siten käy ilmi, että puhetoiminnassaan henkilö on tiettyjen todennäköisyyslakien alainen suhteessa käytettyjen kielellisten elementtien määrään. Ja sitten, kun havaitsemme valtavan määrän kielellisiä elementtejä suuressa joukossa tekstejä tai puhesegmenttejä, saamme vaikutelman kausaalisesta riippuvuudesta siinä mielessä, että tässä tapauksessa on myös määrätietoisuutta tiettyjen kielellisten elementtien käytön suhteen. Toisin sanoen osoittautuu hyväksyttäväksi väittää, että se, mikä näyttää intuitiivisesta näkökulmasta syy-suhteelta, on kvantitatiivisesti todennäköisyys 8 4 . On selvää, että mitä suurempi kokonaismäärä<125>tutkittavien tekstien tai puheosien spesifisyys, sitä selvemmin kielellisten elementtien suhteellisen käyttötaajuuden vakaus ilmenee myös yksittäisessä käytössä (suurten lukujen laki). Tästä tehdään uusi yleinen johtopäätös, että kieli on massailmiö ja sitä tulee sellaisena käsitellä.

Näitä johtopäätöksiä, jotka on tehty foneettisten elementtien, sanojen ja kieliopillisten muotojen, jotka yhdessä muodostavat kielen, taajuuslaskelmien perusteella, sovelletaan sitten "tilastolliseen tulkintaan" Saussuren jaosta "kieleksi" (lalangue) ja "puheeksi" (laparole). ). Saussuren mukaan "kieli" on joukko kielellisiä tapoja, jotka mahdollistavat kommunikoinnin tietyn kieliyhteisön jäsenten välillä. Tämä on sosiaalinen todellisuus, "massailmiö", pakollinen kaikille tätä kieltä puhuville ihmisille. Kuten mainittiin, Herdan todistaa, että yhden kieliyhteisön jäsenet ovat samankaltaisia ​​toistensa kanssa, ei ainoastaan ​​siinä, että he käyttävät samoja foneemeja, leksikaalisia yksiköitä ja kieliopillisia muotoja, vaan myös siinä, että kaikkia näitä elementtejä käytetään samalla tiheydellä. Siten hänen tilastollinen "kielen" määritelmänsä saa seuraavan muodon: "kieli" (lalangue) on yhteisten kielellisten elementtien kokonaisuus plus niiden suhteellinen käyttötodennäköisyys.

Tämä "kielen" määritelmä on myös lähtökohta vastaavalle "puheen" tilastolliselle tulkinnalle, joka Saussuren mukaan on yksilöllinen lausuma. Vertailemalla "kieltä" sosiaalisena ilmiönä "puheen" yksilönä ilmiönä Saussure kirjoitti: "Puhe on yksilöllinen tahdon ja ymmärryksen teko, jossa on tarpeen erottaa: 1. yhdistelmät, joiden kanssa puhuva subjekti käyttää kieltä koodia henkilökohtaisen ajatuksensa ilmaisemiseksi; 2. psykofyysinen mekanismi, jonka avulla hän voi objektivisoida nämä yhdistelmät” 8 5 . Koska "kieltä" kielitilastoissa pidetään elementtien joukkona, jolla on tietty sukulainen<126>tietty todennäköisyys niiden käyttöön, sikäli kuin se sisältää tilastollisen kokonaisuuden tai kokonaisuuden (populaation) olennaisimpana ominaisuutena ja sitä voidaan tarkastella tältä osin. Tämän mukaisesti "puhe" muuttuu erilliseksi näytteeksi, joka on otettu "kielestä" tilastollisena aggregaattina. Todennäköisyys tässä tapauksessa määräytyy "puheen" ja "kielen" suhteen (heidän "kvantitatiivisessa" ymmärryksessään), ja kielen eri elementtien käytön suhteellisen tiheyden jakauma tulkitaan tuloksena kollektiivinen "valinta" (valinta) kielen olemassaolon tietyllä kronologisella ajanjaksolla. Ymmärtäessään, että tällainen tulkinta "kielen" ja "puheen" eroista on kuitenkin rakennettu täysin eri syistä kuin Saussuren, Herdan kirjoittaa tästä: "Tällä ilmeisen pienellä Saussuren käsitteen muutoksella on se tärkeä seuraus, että "kieli" ( lalangue ) saa nyt olennaisen ominaisuuden tilasto-aggregaatin (populaation) muodossa. Tälle populaatiolle on ominaista tietyt suhteelliset taajuudet tai vaihteluiden todennäköisyydet, mikä tarkoittaa, että jokainen kielellinen elementti kuuluu tietylle kielelliselle tasolle. Tässä tapauksessa "puhe" (laparole) osoittautuu merkityksensä mukaisesti termiksi "kielestä" otettujen tilastollisten näytteiden määrittelemiseksi tilastollisena populaationa. On ilmeistä, että valinta (valinta) esiintyy tässä "puheen" ja "kielen" suhteen muodossa, joka on satunnaisesti otetun näytteen suhde tilastolliseen aggregaattiin (populaatioon). Itse taajuusjakauman järjestys, joka on kieliyhteisön puhetoiminnan tallettama vuosisatojen aikana, on valinnan (valinta), mutta ei yksilöllisen valinnan, kuten tyylin, vaan kollektiivisen valinnan elementti. Metaforaa käyttäen voidaan tässä puhua kielen hengen tekemästä valinnasta, jos tällä ymmärretään kielellisen viestinnän periaatteet, jotka ovat sopusoinnussa tietyn kieliyhteisön jäsenten mentaalisen datan kompleksin kanssa. Sarjojen stabiilius on todennäköisyyden (sattuman) tulos» 8 6 .

Erityistapaus mainitun periaatteen soveltamisesta<127>pa on normatiivisten ilmiöiden rajaaminen kielellä "poikkeuksista" (poikkeamista). Kielitilastoissa todetaan, että tilastollinen menetelmä mahdollistaa tässä asiassa vallitsevan epäselvyyden poistamisen ja selkeät kriteerit näiden ilmiöiden erottamiseksi toisistaan. Jos normi ymmärretään tilastollisena perusjoukona (edellä mainitussa merkityksessä) ja poikkeus (tai virhe) on poikkeama tilastollisen perusjoukon osoittamista frekvensseistä, niin kysymyksen kvantitatiivinen ratkaisu ehdottaa itseään. Kaikki tiivistyy tilastolliseen suhteeseen "populaation" ja "outlier" välillä. Jos yksittäisessä otoksessa havaitut todennäköisyydet poikkeavat tilastollisen perusjoukon todennäköisyyksistä enemmän kuin otoslaskennan sarja määrittää, on syytä päätellä, että "sama" (normi) ja "ei" välinen rajaviiva sama" (poikkeus) on rikottu.

"Kielen" ja "puheen" välisiä kvantitatiivisia eroja käytetään myös erottamaan kahden tyyppiset kielelliset elementit: kieliopilliset ja leksikaaliset. Tämän usein kielellisesti suuria vaikeuksia aiheuttavan ongelman ratkaisun lähtökohtana on oletus, että kieliopillisten elementtien tiheysaste on erilainen kuin leksikaalisten yksiköiden. Tämä väitetään liittyvän kielioppielementtien "yleistämiseen", miten ne eroavat leksikaalisten yksiköiden vahvistamista käsitteistä. Lisäksi kielioppielementtien oletetaan olevan pääsääntöisesti paljon pienempiä: itsenäisinä sanoina (sisältävät pronominit, prepositiot, konjunktiot ja apusanat) ne koostuvat yleensä pienestä määrästä foneemia ja "yhdistettyjen muotojen" muodossa. " - yhdestä tai kahdesta foneemista 8 7 . Mitä pienempi kielellinen elementti on, sitä vähemmän sen "pituus" (kvantitatiivinen momentti) voi toimia määrittävänä ominaisuutena, ja sitä tärkeämpää on foneemien "laatu" tätä tarkoitusta varten. Mitä menetelmiä ehdotetaan käsiteltävän ongelman ratkaisemiseksi? Se ratkaistaan ​​viittaamalla puhtaasti kvantitatiiviseen kieliopin käsitteeseen<128>kuorma, "oletetaan", Herdan kirjoittaa tässä yhteydessä, "että olemme kiinnostuneita kahden kielen vertailusta tässä suhteessa. Kuinka määritämme tietyllä objektiivisuuden asteella kielen kantaman "kieliopin kuorman"? On selvää, että tämä kuormitus riippuu kieliopin sanastosta erottavan rajaviivan sijainnista. Ensimmäinen ajatus, joka saattaa tulla mieleemme, on määrittää, kuinka "monimutkainen" tietyn kielen kielioppi on. Loppujen lopuksi "monimutkaisuus" on laadullinen ominaisuus, ja käsite "kielioppikuorma" on määrällinen ominaisuus. Totta, kuormitus riippuu jossain määrin monimutkaisuudesta, mutta ei kokonaan. Kieli voidaan palkita äärimmäisen monimutkaisella kielioppilla, mutta vain suhteellisen pieni osa siitä käytetään kielen toiminnassa. Määrittelemme "kielioppikuormituksen" kieliopin kokonaisuudeksi, jota kieli kantaa toimiessaan, mikä tuo ongelmamme välittömästi rakennelingvistiikan piiriin siinä mielessä, jossa tieteenalan Saussure määritteli. Seuraavassa esityksessä käytetään kvantitatiivisia menetelmiä kielten välisen eron määrittämiseen sen mukaan, missä raja on, erottaen kieliopin sanastosta” 8 8 . Toisin sanoen kielierot tulisi tässä tapauksessa pelkistää eroiksi kieliopillisten ja leksikaalisten elementtien numeerisissa suhteissa.

Käytössämme olevat materiaalit maalaavat seuraavan kuvan. Englannissa (vain "kielioppisanat" otettiin huomioon: pronominit tai, kuten niitä kutsutaan myös "korvikkeet", prepositiot, konjunktiot ja apuverbit), segmentissä, joka sisältää 78633 tapausta kaikkien sanojen käytöstä (1027 eri sanat), 53 102 kielioppielementtien tai tarkemmin sanottuna "kielioppisanojen" (149 eri sanaa), mikä on 67,53 % ja 15,8 % eri sanoja. Sellaisia ​​ovat Dewayn 8 9 tiedot. Muut tiedot osoittavat eri prosentin<129>suhde: 57,1 % ja 5,4 % eri sanoja 9 0 . Tämä merkittävä ero selittyy kirjoitetun ja puhutun kielen erolla. Kielen kirjalliset muodot (ensimmäiset tiedot) käyttävät oletettavasti enemmän kieliopillisia elementtejä kuin suulliset (toinen tapaus). Danten jumalaisessa komediassa (italialaisen alkuperäisen tekstin jälkeen) Mariotti totesi 54,4 % "kielioppisanojen" esiintymisistä.

Toinen ja ilmeisesti täydellisempi tapa määrittää kielen kieliopillinen kuormitus on laskea kielioppielementteihin sisältyvät foneemit. Tässä tapauksessa ei oteta huomioon vain itsenäisiä kieliopillisia sanoja, vaan myös niihin liittyviä muotoja. Täällä on erilaisia ​​vaihtoehtoja. Esimerkiksi yksittäisten konsonanttifoneemien käytön suhteellisen tiheyden määrittäminen kieliopillisissa elementeissä ja niiden vertaaminen näiden samojen foneemien kokonaiskäyttötiheyteen (sellaisen suhteen lopulliset tiedot englanniksi antavat osuuden 99,9 %:sta 100 000:een - kokonaiskäyttö); tai vastaava konsonanttien vertailu erillisten luokitusryhmien mukaan (labiaali-, palataal-, velaari- ja muut foneemit). Lopullinen suhde muodostuu tässä suhteessa 56,47 %:sta (kielioppielementeissä) 60,25 %:iin (kokonaiskäytössä); tai sama alkukonsonanttifoneemien vertailu (tässä tapauksessa suhde oli 100,2 % kieliopin sanoissa ja 99,95 kokonaiskäytössä). Myös muut monimutkaisemmat tilastolliset operaatiot ovat mahdollisia, jotka kuitenkin johtavat tutkittavan ongelman samanlaisiin kvantitatiivisiin ilmaisuihin.

Annetut määrälliset tiedot toimivat pohjana yleiselle johtopäätökselle. Se tiivistyy siihen tosiasiaan, että foneemien jakauma kieliopillisissa elementeissä määrää foneemien jakautumisen luonteen (tietysti numeerisesti) koko kielessä. Ja tämä puolestaan ​​antaa meille mahdollisuuden päätellä, että kieliopillisten elementtien käyttö riippuu vähiten yksilöllisestä valinnasta ja muodostaa sen osan kielellistä ilmaisua, jota todennäköisyydet ohjaavat.<130>ness. Tämän spekulatiivisen päätelmän vahvistaa Esselsonin 9 1 tekemä venäjän kielen kieliopillisten muotojen laskelma. Tutkimukseen kohdistui 46 896 sanaa, jotka oli otettu II lähteistä (Griboedovin, Dostojevskin, Goncharovin, Saltykov-Shchedrinin, Garshinin, Belinskyn, Amfiteatrovin, Gusev-Orenburgskyn, Ehrenburgin, Simonovin ja N. Ostrovskin teokset). Ne jaettiin puhekieleen (17 756 sanaa eli 37,9 %) ja ei-puhekieleen (29 140 sanaa eli 62,1 %). Sitten koko sanajoukko jaettiin 4 ryhmään niiden kieliopillisen luonteen mukaan: 1. ryhmään kuuluivat substantiivit, adjektiivit, substantiivien funktiona olevat adjektiivit, pronominit ja taivutetut numerot; toisessa ryhmässä - verbit; 3. ryhmässä - sanalliset partisiipit, adjektiivien ja substantiivien funktiona olevat partisiipit ja gerundit; 4. ryhmässä - adverbien, prepositioiden, konjunktioiden ja partikkelien muuttumattomat muodot. Yhteenvetotulokset (myös taulukot, joissa on yksittäisten kirjoittajien tiedot) antavat seuraavan suhteen:

1. ryhmä

2. ryhmä

3. ryhmä

4. ryhmä

puhekielen

vähäpuheinen

Herdan luonnehtii näin saadun kvantitatiivisen tiedon tarkastelua seuraavin sanoin: ”Ne oikeuttavat sen johtopäätöksen, että kieliopillisia elementtejä tulee pitää tekijänä, joka määrää kielellisen ilmaisun todennäköisyyden. Tällaisella päätelmällä vältetään jokaisen käytetyn sanan raskas määrittely. On selvää, että koska kielioppia ja sanastoa ei ole tallennettu vesitiiviisiin kuoriin, se ei myöskään ole puhdasta "valintaa" tai puhdasta "sattumaa". Sekä kielioppi että sanasto sisältävät molemmat elementit, vaikkakin huomattavasti vaihtelevissa suhteissa” 9 2 .<131>

Suuri osa Herdanin kirjasta on omistettu kielen kaksinaisuuden tai kaksinaisuuden tutkimukselle, ja itse kaksinaisuuden käsite perustuu matemaattisiin ominaisuuksiin.

Projektiivisen geometrian lauseet voidaan siis järjestää kahteen sarjaan siten, että yhden sarjan jokainen lause voidaan saada jostain toisen sarjan lauseesta korvaamalla sanat piste ja suoraan. Jos esimerkiksi annetaan lause: "kaikki eri pisteet kuuluvat yhdelle ja vain yhdelle riville", voimme johtaa siitä vastaavan lauseen: "mikä tahansa kaksi erilaista suoraa kuuluvat yhteen ja vain yhteen pisteeseen." Toinen tapa kaksinaisuuden määrittämiseksi on piirtää tutkittavan ilmiön eri tasot abskissaa ja ordinaatteja pitkin. Joten, kuten esimerkiksi Yul 9 3 tekee, abskissa-akselia pitkin lasketaan erilaisia ​​käyttötaajuuksia ja ordinaatta-akselia pitkin lasketaan leksikaalisten yksiköiden lukumäärä, joiden taajuus määräytyy jne..

Tällä tavalla määritellyn kaksinaisuuden käsitteen alle, jolla on kaikissa tapauksissa itse asiassa binäärikoodin luonne ja jota pidetään myös kielellisen rakenteen oleellisimpana piirteenä, tuodaan esiin laadultaan äärimmäisen erilaisia ​​ilmiöitä, jotka mahdollistavat vastakkaisuuden kahdella tasolla. : sanankäytön jakautuminen leksikaalisten yksiköiden luonteen mukaan ja leksikaalisten yksiköiden jakautuminen frekvenssin mukaan sanojen käyttö; kirjoitetut ja puhutut puhemuodot; leksikaaliset ja kieliopilliset elementit; synonyymit ja antonyymit; foneemi ja sen graafinen esitys; määriteltävissä oleva ja määrittelevä (Saussuren merkitsevä ja merkitsevä) jne.

Yhden tai toisen tietyn, kielellisen ilmiön tai rajoitetun "tekstin" kaksinaisuuden kvantitatiivisen tutkimuksen jälkeen pääsääntöisesti tehdään johtopäätös, johon kielellisen universaalisuuden ominaisuudet liitetään. Tällaisten päätelmien luonne ja niiden perustelut voidaan nähdä esimerkissä<132>tutkimuksia sanan ja käsitteen kaksinaisuudesta (itse asiassa puhumme sanan pituuden ja käsitteen tilavuuden suhteesta - on pidettävä mielessä, että kielellisten ja muiden termien äärimmäisen vapaa käyttö tällaiset teokset tekevät ymmärtämisen usein erittäin vaikeaksi). On tärkeää huomata, että materiaalina, joka toimi tämän tyyppisen kielellisen kaksinaisuuden havaintojen lähteenä, käytettiin kansainvälistä tautien nimikkeistöä (noin 1000 nimeä) ja Englannin ja Wellsin yleistä tautirekisteriä vuodelta 1949. Tässä tapauksessa tehdään seuraava yleinen johtopäätös: "Jokaisella yleistä ideaa ilmaisevalla käsitteellä on mitä voidaan kutsua "palloksi" tai "tilavuudeksi". Se sallii välineensä kautta ajatella monia esineitä tai muita käsitteitä, jotka ovat sen "sfäärissä". Toisaalta kaikki käsitteen määrittelemiseen tarvittavat asiat muodostavat sen "sisällön". Volyymi ja sisältö korreloivat keskenään - mitä pienempi sisältö ja vastaavasti mitä abstraktimpi käsite, sitä suurempi sen laajuus tai volyymi, eli sitä enemmän esineitä tuodaan sen alle. Tämä voidaan nähdä analogiana (käsitteellisellä alueella) koodauksen periaatteisiin, joiden mukaan symbolin pituus ja käyttötaajuus ovat toisistaan ​​riippuvaisia” 9 4 .

Kaksinaisuuden periaate pätee myös erityisongelmiin. Esimerkiksi määritettäessä kahden eri kielen sanojen merkitysten vastaavuutta. Muret-Zandersin Englanti-saksa-sanakirjaa matemaattisella iteraatiomenetelmällä tarkastelun tuloksena pääteltiin, että todennäköisyys käyttää englanninkielistä sanaa, jolla on yksi tai useampi merkitys saksankielisessä käännöksessä, pysyy vakiona jokaiselle alkukirjaimelle koko sanakirjassa 9 5. Sanajärjestyksen tarkastelu kiinalaisissa sanakirjoissa johtaa johtopäätökseen, että se on luonteeltaan taksonominen, koska merkin vetojen määrä osoittaa sen paikan (itsenäisenä radikaalina tai tietyn radikaalin alisteisena alaluokkana). Taksonomia on eläintieteessä ja kasvitieteessä käytetty luokittelun alaperiaate. Kherdan väittää niin<133>Kiinan leksikografian perusteet rakentuvat myös taksonomian periaatteille 9 6 jne.

Yleisesti arvioitaessa tätä matemaattisten menetelmien soveltamisaluetta kielellisten ongelmien (eli kielitilastojen) tutkimiseen, on ilmeisesti lähdettävä Ettingerin muotoilemasta kannasta: "Matematiikkaa voidaan käyttää tehokkaasti kielitieteen palveluksessa vain silloin, kun kielitieteilijöillä on selvät sen soveltamisen todelliset rajat sekä käytettävien matemaattisten mallien mahdollisuudet” 9 7 . Toisin sanoen matemaattisesta lingvistiikasta voidaan puhua silloin, kun matemaattiset menetelmät osoittavat soveltuvuuden niiden varsinaisten kieliongelmien ratkaisemiseen, jotka kokonaisuutena muodostavat kielitieteen. Jos näin ei ole, vaikka tämä saattaa avata uusia näkökulmia tieteelliseen tutkimukseen, niin tässä tapauksessa voimme puhua mistä tahansa, mutta ei kielitiedosta - tässä tapauksessa emme tarkoita erityyppisiä sovellettavia kielitiedettä (puhumme se myöhemmin). Puhe alla), mutta tieteellinen tai teoreettinen kielitiede. Tämän kannan perusteella on huomattava, että kielitieteilijän näkökulmasta kielitilastoissa paljon on kyseenalaista ja jopa hämmentävää.

Siirrytään vain kahden esimerkin analyysiin (jotta esitys ei sotkeudu) edellyttäen, että jokaista niistä voidaan esittää erittäin merkittäviä vastalauseita. Tässä meillä on määrällinen ero kieliopillisten ja leksikaalisten yksiköiden välillä. Osoittautuu, että tällaisen eron tekemiseksi on jo etukäteen tiedettävä, mikä kuuluu kieliopin alaan ja mikä sanastoon, koska kielen "kielinen kuorma" (eli kielioppielementtien kokonaisuus) käytetään puheessa), kuten edellä lainattiin, "riippuu rajaviivasta, joka erottaa sanaston kielioppista". Sen vuoksi on mahdotonta tehdä osoitettua eroa tietämättä missä tämä raja on. Mitä sitten tarkoittaa kvantitatiivinen menetelmä erottaa leksikaali kielioppista?<134>matic? Herdanin osalta hän ei kuitenkaan erityisemmin ajattele tätä asiaa ja luokittelee rohkeasti kielellisiä elementtejä viitaten kieliopillisiin elementteihin "liittyvät muodot", jotka esityksen perusteella tulisi ymmärtää ulkoisiksi taivutuksiksi, ja "kielioppisanoja". jotka sisältävät prepositiot , konjunktiot, apuverbit ja pronominit - jälkimmäiset sen vuoksi, että ne ovat "korvikkeita". Mutta jos puhumme vain tästä pronominien laadusta ja suhteutamme ne tällä perusteella kieliopillisiin elementteihin, niin on selvää, että sellaiset sanat kuin "edellä mainittu", "nimetty", "annettu" jne., pitäisi liittää niihin, joten kuinka he myös toimivat kansanedustajina. Kielitilastoissa käytetyn kieliopillisten elementtien erottelumenetelmän yhteydessä herää luonnollisesti kysymys, miten tässä tapauksessa tulisi käsitellä sellaisia ​​"epämuodollisia" kieliopillisia ilmiöitä kuten sanajärjestys, sävyt, nollamorfeemit, paradigmaattiset suhteet (jotkut näistä ilmiöistä muuten löytää reflektio niillä kielillä, joita tutkitaan matemaattisilla menetelmillä)? Kuinka tehdä ero kielissä, joissa on rikas sisäinen taivutus (kuten esimerkiksi seemiläisissä kielissä), joissa se ei vain muokkaa juurta (radikaali) kieliopillisesti, vaan myös antaa sille leksikaalista olemassaoloa, koska juuri ilman permutaatioita on eikö kielellä ole todellista olemassaoloa? Mitä kielen kieliopillisen monimutkaisuuden tulisi ymmärtää, millä kriteereillä se määräytyy? Jos kvantitatiivinen seikka, jota tässä tapauksessa korostetaan kaikin mahdollisin tavoin, niin yksi kieliopillisesti vaikeimmista kielistä on englanti, jolla on sellaisia ​​​​rakenteita kuin Ishallhavebeencalling tai Hewouldhavebeencalling. Näissä lauseissa vain kutsu voidaan luokitella leksikaaliseksi, ja kaikki muu on siksi katsottava kielioppiksi. Millä perusteilla kieliopillisten elementtien käyttötiheys yhdistetään kielioppisanojen merkityksen yleisyyteen tai abstraktisuuteen? Loppujen lopuksi on aivan ilmeistä, että kielioppielementtien suhteellisen suuri käyttötaajuus määräytyy niiden funktion perusteella lauseiden rakentamisessa, ja mitä tulee merkityksien abstraktisuuteen, on erittäin helppo löytää suuri<135>leksikaalisten elementtien määrä, jotka voivat helposti kilpailla kieliopillisten elementtien kanssa tässä suhteessa, koska ne ovat taajuudeltaan suurelta osin niitä huonompia (esim. oleminen, olemassaolo, laajennus, tila, substanssi jne).

Samankaltainen absurdisuus nousee eteen myös sanan ja käsitteen kaksinaisuuden (kaksinaisuuden) määritelmän yhteydessä. Kielen rakenteellisen olemuksen äärimmäisen erikoinen ymmärrys on välttämätöntä, jotta se voidaan tutkia sairauksien nimikkeistön ja sairaalan sairausrekisterin avulla, joka, kuten edellä todettiin, toimi lähdemateriaalina erittäin tärkeälle kielelle. johtopäätöksiä. Käsittelemättä täysin hämärää sellaisten termien käyttöä, joilla ei ole kielellistä olemassaoloa, kuten käsitteen ala, tilavuus ja sisältö (muuten sanan leksikaalinen merkitys ja tieteellisellä termillä merkitty käsite ovat törkeitä hämmentynyt), siirrytään tässä tapauksessa tehtyyn johtopäätökseen. Kuten edellä todettiin, kyse on väitteestä, jonka mukaan "laajuus ja sisältö korreloivat keskenään." Koko päättely, joka antaa perusteita tällaiselle johtopäätökselle, sekä menetelmä kielellisten tosiseikkojen matemaattiselle operaatiolle osoittaa selvästi, että tässä tapauksessa yksi kielen erittäin olennainen ominaisuus jätetään täysin huomiotta, mikä järkyttää kaikki suoritettavat laskelmat. : kyky ilmaista samaa "sisältöä" eri "volyymin" kielellisillä yksiköillä, joilla on epäilemättä erilainen suhteellinen käyttötaajuus. Voimme siis nimetä saman henkilön Petroviksi, tuttavani, hän, moskovilainen, nuori mies, yliopiston työntekijä, vaimoni veli, mies, jonka tapasimme sillalla jne. Tällaisten tosiasioiden valossa ovat epäilemättä vain yksityisiä johtopäätöksiä, joille, kuten huomautettiin, on kuitenkin yleismaailmallinen merkitys, mutta myös itse kvantitatiivisten menetelmien tarkoituksenmukaisuus soveltaa tällaisiin kielellisiin ongelmiin.

Mutta joskus kielitieteilijöille tarjotaan johtopäätöksiä, joiden oikeellisuudesta ei ole epäilystäkään. Tämä on "kielen peruslaki", joka koostuu siitä, että kielessä on tietty stabiilisuus sen elementeillä ja niiden mainitsemisen suhteellisella tiheydellä.<136>kulutus. Tällaisten löydösten ongelmana on kuitenkin se, että ne ovat olleet kielitieteilijöiden tiedossa pitkään. Onhan aivan ilmeistä, että jos kielellä ei olisi tiettyä vakautta ja jokainen tietyn kieliyhteisön jäsen vaihteli vapaasti kielen elementtejä, keskinäinen kommunikointi ei olisi mahdollista ja kielen olemassaolo muuttuisi merkityksettömäksi. . Mitä tulee kielen yksittäisten elementtien käytön suhteellisen tiheyden jakautumiseen, se on saanut ilmaisunsa kielitieteessä passiivisen ja aktiivisen sanaston ja kieliopin kategorioiden jakamisen muodossa, joihin L. V. Shcherba kiinnitti niin paljon huomiota. Tässä tapauksessa tilastolliset menetelmät voivat auttaa kielitieteilijöitä vain tiettyjen kielellisten elementtien jakamisessa niiden suhteellisen käyttötiheyden luokkien mukaan, mutta heillä ei ole mitään syytä väittää löytävänsä uusia teoreettisen kielitieteen kannalta arvokkaita malleja.

Toisaalta kielitilastot tarjoavat joukon todella "alkuperäisiä" johtopäätöksiä, jotka ovat erittäin osoitus sen kannattajien tieteellisen ajattelun luonteesta. Näin ollen Churchillin, Benesin, Halifaxin, Stresemannin ja muiden teosten "poliittista sanastoa" tutkitaan monimutkaisin tilastollisin menetelmin, ja heidän teostensa käännöksiä englanniksi käytetään laskelmissa ei-englanninkielisten kirjoittajien osalta. Laskentatulokset esitetään lukuisten taulukoiden, matemaattisten kaavojen ja yhtälöiden muodossa. Kvantitatiivisen tiedon kielellinen tulkinta tässä tapauksessa rajoittuu siihen, että Churchillin "poliittisen sanaston" käyttö on tyypillisintä (?) tälle kirjailijaryhmälle ja että Churchillin sanankäyttö tapauksissa, joissa hän käsittelee poliittisia kysymyksiä, on tyypillistä. englanninkielisen puheryhmän 9 8 .

Toisessa tapauksessa asianmukaisten tilastollisten manipulointien jälkeen päätellään, että Hitler loukkasi "kielen" ja "puheen" kaksinaisuutta näiden termien määrällisessä merkityksessä natsi-Saksan käytössä. Erityinen tapaus tämän kaksinaisuuden tuhoutumisesta on kirjaimellinen ymmärrys<137>metaforiset käännökset (esimerkiksi "kaada suolaa avoimiin haavoihin"). Natsi-Saksa leimaili itsensä niin monilla epäinhimillisillä teoilla, että on tuskin tarvetta tuomita sitä tästä kielellisestä julmuudesta 9 9 . Kherdanin mukaan Marxin määritelmä kielestä ajatuksen välittömänä todellisuutena johtaa myös kielellisen kaksinaisuuden rikkomiseen, ja dialektiikan laki ilmiön siirtymisestä vastakohtaan on hänen mielestään kaksinaisuuden väärinymmärretty kielellinen laki. kielestä. Tällaiset tulkinnat puhuvat puolestaan.

Lopuksi, yhteinen puute, joka on luontainen kaikissa edellä mainituissa tapauksissa kvantitatiivisessa kieliaineiston tutkimisen ja siten metodologisen luonteen hankkimismenetelmässä, on lähestymistapa kielellisiin elementteihin mekaanisena tosiasiallisena kokonaisuutena, joka on täysin riippumaton toisistaan ​​ja jonka mukaan, jos sellainen on olemassa. tai malleja, ne viittaavat vain autonomisten tosiasioiden jakautumisen numeerisiin suhteisiin niiden systeemisten riippuvuuksien ulkopuolella. Totta, J. Watmou yrittää kaikin mahdollisin tavoin vakuuttaa, että matematiikka on parempi kuin mikä tahansa kielellinen rakenneanalyysi, joka pystyy paljastamaan kielen rakenteelliset piirteet. "Nykyaikainen matematiikka", hän kirjoittaa, "ei käsittele mittausta ja laskemista, joiden tarkkuutta rajoittaa niiden luonne, vaan ensisijaisesti rakenne. Tästä syystä matematiikka edistää erittäin kieltenoppimisen tarkkuutta - siinä määrin, että erillinen kuvaus, luonteeltaan vielä rajoitetumpi, ei pysty... Aivan kuten fysiikassa, matemaattisia elementtejä käytetään kuvaamaan fyysistä maailmaa, koska niiden oletetaan vastaavan fyysisen maailman elementtejä, niin matemaattisessa lingvistiikassa matemaattisten elementtien oletetaan vastaavan puhemaailman elementtejä” 101 . Mutta tällainen kysymyksen muotoilu ei suinkaan pelasta tilannetta, sillä parhaimmillaan se voi<138>antaa analyysin kielestä joko fyysisenä rakenteena, joka ei ole vielä kaukana riittävästä kielelle, ja joka on loppujen lopuksi edelleen luonteeltaan samaa mekanistista, tai loogis-matemaattisena rakenteena, joka siirtää kielen eri tasolle, ja monessa suhteessa vieras. Ei ole tarpeetonta todeta, että Watmow näkee matemaattisen kielitieteen menestymisen vasta tulevaisuudessa, ja mitä tulee niiden todellisiin tuloksiin, hän arvioi niitä seuraavin sanoin: "... melkein kaikki Herdanin, Zipfin tähän mennessä tekemä työ, Yul, Giro (Guiraux) ja muut, eivät suinkaan jää kielitieteen ja matematiikan kritiikin ulkopuolelle; hän haisee suuressa määrin amatöörimäisyydeltä” 103 . Jos emme siis yritä ennustaa matemaattisten menetelmien tulevaisuutta kielitieteellisessä tutkimuksessa, vaan yritämme arvostaa sitä, mitä meillä on tänään, meidän on myönnettävä, että matematiikka on itse asiassa rajoittunut kielitieteen alalla vain "mittaukseen ja laskemiseen". ”, enkä voinut antaa kielen laadullista analyysiä sen rakenteeseen syventyessä.<139>

Yritetään olla mahdollisimman objektiivisia. Tietyssä osassa kvantitatiivista dataa ilmeisesti voidaan käyttää kielitieteessä, mutta vain apuvälineenä ja pääasiassa ongelmissa, joilla on käytännön suuntaa. Mitä tulee useimpiin yksittäisten kielellisten ilmiöiden tutkimiseen käytettäviin kvantitatiivisiin menetelmiin, R. Brownin yleinen johtopäätös on epäilemättä perusteltu: "Niitä voidaan pitää sellaisina kuin Kherdan niitä pitää, mutta mitä tällä kaikella on?" 104 . Kuvitellaan, että kysymme: "Mitä puita tässä puutarhassa on?". Ja vastauksena saamme: "Tässä puutarhassa on sata puuta." Onko tämä vastaus kysymykseemme, ja onko siinä todella järkeä? Mutta moniin kielellisiin kysymyksiin matemaattiset menetelmät antavat juuri sellaisia ​​vastauksia.

Pääosin matemaattisia menetelmiä ja samalla kielelliseen aineistoon suuntautuvaa tutkimustoimintaa on kuitenkin laaja, jossa tällaisen yhdistelmän tarkoituksenmukaisuus on kiistaton. Tämän tutkimustoiminnan "merkitys", sen merkitys määräytyy tavoitteista, joihin se pyrkii. Se on jo käytännössä testattu. Tässä tapauksessa puhumme ongelmista, jotka liittyvät tietokoneiden luomiseen, kirjoitettujen tieteellisten tekstien konekääntämisrakenteisiin, suullisen puheen kääntämisen automatisoimiseen kielestä toiseen ja moniin yhdistettäviin tehtäviin. kybernetiikan kielikysymyksissä. Tällaisten ongelmien koko joukko annetaan yleensä yleisnimeksi soveltava kielitiede. Siten se eroaa ns. matemaattisesta lingvistiikasta, joka sisältää ne työalueet, jotka on edellä nimetty stylostitiikaksi ja kielistatistiikaksi, vaikka se ei suinkaan vältä kieliaineiston tilastollista käsittelyä. Ehkä tärkein soveltavan kielitieteen piirre, joka erottaa sen matemaattisesta lingvistiikasta, kuten edellä on esitetty, on se, että ensimmäisellä on päinvastainen suunta: ei matematiikkaa kielitiedettä varten, vaan kielitiede.<140>(matemaattisilla menetelmillä formalisoitu) monenlaisia ​​käytännön ongelmia varten.

Ei ole tarpeen paljastaa yksittäisten ongelmien sisältöä, jotka nyt sisältyvät erittäin laajaan soveltavan kielitieteen alueeseen. Toisin kuin matemaattinen kielitiede, näistä ongelmista keskustellaan aktiivisesti Neuvostoliiton kielitieteellisessä kirjallisuudessa, ja niillä alkaa oikeutetusti olla yhä näkyvämpi paikka tutkimuslaitosten tieteellisissä ongelmissa 105 . Siten ne ovat jo hyvin tuttuja kieliyhteisöllemme. Tämä seikka ei kuitenkaan vapauta meitä tarpeesta alistaa ne pohdiskelemaan erityisesti kielitieteen periaatteiden näkökulmasta. Tämä auttaa epäilemättä poistamaan väärinkäsityksiä, joita syntyy yhä useammin toisistaan ​​hyvin etäällä olevien tieteiden edustajien välillä, jotka osallistuvat soveltavan kielitieteen ongelmia käsittelevään työhön, ja hahmottelee toisaalta keinoja niiden lähentämiseen. ja toisaalta tutkimusalueiden rajaaminen. On sanomattakin selvää, että seuraavat pohdinnat edustavat kielitieteilijän näkemystä, ja on välttämätöntä, että matemaatikot eivät vain yritä omaksua sitä, vaan esittävät heille esitettyjen kysymysten yhteydessä tulkintansa.

Kieli-teoreetikko ei voi millään tavalla tyytyä siihen, että kaikissa tapauksissa<141>kieli soveltavan kielitieteen asettamiin tarkoituksiin, niiden perustana on matemaattinen malli. Tämän mukaisesti havainnot kielen ilmiöistä ja tällä tavalla saadut tulokset ilmaistaan ​​matematiikan termeillä ja käsitteillä eli matemaattisten yhtälöiden ja kaavojen kautta. Katsotaanpa esimerkkiä selvyyden vuoksi. Condon 1 06 ja Zipf 1 07 totesivat, että taajuuden logaritmit ( f) suuren tekstin sanojen esiintymät sijaitsevat lähes suorassa linjassa, jos ne korreloivat kaaviossa arvo- tai arvologaritmien kanssa ( r) näistä sanoista. Yhtälö f=c:r, missä Kanssa on vakio heijastaa tätä suhdetta rajoitetussa mielessä c:r asetettua arvoa varten r toistaa havaitun taajuuden suurella approksimaatiolla. Suhde f ja r, ilmaistaan ​​matemaattisella kaavalla, on malli havaittujen käyttötiheyden arvojen ja sanojen järjestyksen tai järjestyksen välisestä suhteesta. Tämä on yksi matemaattisen mallintamisen tapauksista. 

Koko tiedon teoria perustuu täysin C. Shannonin kehittämään kommunikaatioprosessin matemaattiseen malliin 108 . Se määritellään "matemaattiseksi tieteenalaksi, joka on omistettu minkä tahansa datan sisältämän tiedon määrän laskemis- ja arviointimenetelmille sekä tiedon tallennus- ja siirtoprosessien tutkimiselle" (TSB, osa 51, s. 128). Näin ollen informaatioteorian peruskäsitteet saavat matemaattisen lausekkeen Tietoa mitataan biniteissä tai binääriyksiköissä (kieleen verrattu koodi kahdella ehdollisella yhtä todennäköisellä signaalilla lähettää yhden binääriyksikön informaatiota kunkin merkin lähetyksen aikana -joko koodi ja keskimääräinen siirretyn tiedon määrä<142>muodostelmia. Redundanssi ilmaistaan ​​prosenttiosuutena koodin kokonaislähetyskyvystä”, 1 09 jne. Samalla tavalla konekäännös edellyttää kielen kartoituselementtien algoritmista kehittämistä toiseen jne. 1 10 . Nämä ovat muita mallintamisen tapauksia.

Mielettömien mallien käyttö voi olla erittäin merkittävä apu erityisesti mitä todennäköisimmin soveltavan kielitieteen itselleen asettamien ongelmien ratkaisemisessa. Teoreettisen kielitieteen kannalta on kuitenkin erittäin tärkeää, että abstrakti malli ei pääsääntöisesti toista todellisen ilmiön kaikkia piirteitä, kaikkia sen toiminnallisia ominaisuuksia. Joten arkkitehti voi ennen talon rakentamista luoda mallinsa, joka toistaa suunniteltavan talon kaikissa pienimmässä yksityiskohdassa, ja tämä auttaa häntä ratkaisemaan useita käytännön kysymyksiä, jotka liittyvät itse talon rakentamiseen. Mutta tällaisesta talon mallista riippumatta siitä, kuinka tarkka se on, ei ole sitä "toimintoa" ja tarkoitusta, jota varten kaikki talot yleensä rakennetaan - se ei pysty tarjoamaan ihmiselle asuntoa. Tilanne on samanlainen kielen kanssa, jossa malli ei aina pysty toistamaan kaikkia ominaisuuksiaan. Tässä tapauksessa asiaa mutkistaa entisestään se, että mallin rakentamisessa ei käytetä kielellisiä, vaan matemaattisia kriteerejä. "Matemaattisilla malleilla... - kirjoittaa A. Ettinger - on äärimmäisen tärkeä rooli kaikilla tekniikan aloilla, mutta koska ne ovat synteesin työkaluja, niiden merkitys kielitieteelle, joka on ensisijaisesti historiallinen ja kuvaileva tieteenala, on luonnollisesti rajallinen. ”111.<143>

Kielen matemaattinen mallintaminen on itse asiassa sovellettavissa vain sen staattiseen tilaan, joka on kielitieteilijälle ehdollinen ja itse asiassa on suorassa ristiriidassa kielen peruslaadun kanssa, jonka olemassaolon muoto on kehitys. Sanomattakin on selvää, että kielen staattista opiskelua ei suinkaan suljeta pois kielitieteestä ja se on perusta normatiivisten kielioppien ja sanakirjojen, kuvailevien kielioppien, käytännön kielioppien ja sanakirjojen laatimiselle, jotka toimivat oppaana vieraiden kielten käytännön opiskeluun jne. Kaikissa tällaisissa pääasiassa luonnossa sovellettavissa teoksissa kielitieteilijät kuitenkin tietoisesti rajoittavat tutkimusalaa eivätkä suinkaan sulje silmiään kielen muilta osilta 1 12 . Kielen staattisella tarkastelulla katoavat kokonaan kielen sellaiset sen dynaamiseen luonteeseen liittyvät ominaisuudet, kuten tuottavuus, riippuvuus ajattelun muodoista ja laaja vuorovaikutus kulttuuristen, sosiaalisten, poliittisten, historiallisten ja muiden tekijöiden kanssa. tutkijan näkökenttä. Vain synkronisella tasolla kieltä voidaan pitää tavanomaisten merkkien tai koodien järjestelmänä, joka kuitenkin osoittautuu täysin perusteettomaksi heti, kun omaksumme kielelle sopivamman dynaamisen näkökulman. Kehitysprosesseissa ovat kielen ominaisuudet, kuten motivaatio, sellaisten sanojen polysemia, joilla ei ole vakaita rajoja, sanan ja sen äänikuoren merkityksen epäautonomia sekä kontekstiin liittyvä sanan luova potentiaali. ilmentyy, ja kaikki tämä on jyrkässä ristiriidassa koodin tai merkin pääominaisuuksien kanssa 1 13 . Ilmeisesti sovelletussa lingvistiikassa voidaan ajatella myös kaikkia näitä kielen ominaisuuksia ja käytännön syistä tyytyä niin sanotusti kielen "otoskuvaan", joka pystyy vielä antamaan melko likimääräisen käsityksen sen toimintamekanismista.<144>nirovaniya. Jokainen tällainen "snapshot", jos sitä pidetään kielen tosiasiana eikä tavanomaisten koodien järjestelmän tosiasiana, on kuitenkin sisällytettävä siihen loputtomaan liikeprosessiin, jossa kieli on aina olemassa 1 14 . Sitä ei voida tutkia näiden erityisolosuhteiden ulkopuolella, jotka ovat ominaisia ​​tälle liikkeelle, joka jättää jälkensä tiettyyn kielen tilaan ja määrittää sen jatkokehitysmahdollisuudet. Tässä on sama ero kuin hetkellisen henkilön valokuvan ja hänen siveltimellä todellisen taiteilijan muotokuvansa välillä. Taiteilijan työssä meillä on edessämme yleistävä kuva ihmisestä hänen fyysisen ulkonäönsä lisäksi hänen sisäisessä henkisessä sisällössään. Taiteellisesta muotokuvasta voimme myös lukea siinä kuvatun henkilön menneisyyden ja määrittää, mihin hän toiminnassaan pystyy. Ja vaikka tilannekuva pystyy antamaan tarkemman kuvan alkuperäisen ulkonäöstä, se puuttuu näistä ominaisuuksista ja kuvaa usein sekä vahingossa nenään hyppääneen näppylän että<145>täysin epätyypillinen asento tai ilme, joka lopulta johtaa alkuperäisen vääristymiseen.

On huomattava, että "snapshots"-menetelmää voidaan tietysti soveltaa kielen kehityksen tosiasioihin. Mutta tässä tapauksessa olemme itse asiassa tekemisissä vain erillisten kielen tilojen kanssa, jotka kvantitatiivisessa karakterisoinnissaan osoittautuvat vain eri kielten vertailevaksi kvantitatiiviseksi luonnehdinnaksi. Tällainen kvantitatiivinen "dynamiikka" ei sisällä mitään orgaanista, ja kielen yksittäisten tilojen välinen yhteys lepää vain numeeristen suhteiden vertailussa. Jos tässäkin tapauksessa turvaudutaan analogiaan, voimme viitata lapsen kasvuun. Hänen kehitystään voidaan tietysti esittää numeeristen tietojen dynamiikassa hänen painostaan, pituudestaan, hänen ruumiinsa osien tilavuuden muuttuvista suhteista, mutta kaikki nämä tiedot ovat täysin erillään kaikesta, mikä ensisijaisesti muodostaa yksilöllisen olemuksen. ihmisen luonteesta, taipumuksista, tottumuksista, makuista jne.

Toinen kielen matemaattisen "mallintamisen" negatiivinen puoli on se, että se ei voi toimia yleisperiaatteena, jonka pohjalta voidaan tehdä kattava ja kattava - systemaattinen kielen kuvaus. Vain matemaattinen lähestymistapa kielen ilmiöihin esimerkiksi ei anna mahdollisuutta vastata edes sellaisiin perustavanlaatuisiin kysymyksiin (joita ilman kielitieteen olemassaolo on mahdotonta ajatella), kuten: mitä on kieli, mitä ilmiöitä pitäisi olla. luokitellaan oikeaksi kielelliseksi, miten sana tai lause määritellään, mitkä ovat kielen peruskäsitteet ja -kategoriat jne. Ennen kuin siirrytään kielen opiskelun matemaattisiin menetelmiin, on vastattava valmiiksi (jopa työskentelyn muodossa). hypoteesi) kaikkiin näihin kysymyksiin etukäteen. Ei tarvitse ummistaa silmiään siltä, ​​että kaikissa meille tunnetuissa tapauksissa kielellisten ilmiöiden matemaattisilla menetelmillä tutkimisesta kaikki nämä käsitteet ja kategoriat jouduttiin väistämättä hyväksymään sellaisina kuin ne määrittelivät perinteiset tai suhteellisesti sanottuna laadullisia menetelmiä.

Tämän matemaattisten menetelmien ominaisuuden niiden kielellisissä sovelluksissa havaitsi Spang-Hanssen, kun pi<146>sal: "Tulisi pitää mielessä, että havaituilla faktoilla, jotka saavat kvantitatiivisen ilmaisun... ei ole arvoa, jos ne eivät ole osa kuvausta, ja kielellisistä syistä sen tulisi olla systemaattinen kuvaus, joka liittyy läheisesti kvalitatiiviseen kieleen. kuvaus ja teoria” 1 15 . Eräässä toisessa Spang-Hanssenin puheessa löydämme selvennyksen tälle ajatukselle: "Kunnes kvantitatiivisen järjestelmän rakentamisen mahdollisuus on todistettu ja niin kauan kuin tietylle tutkimusalalle on yleisesti hyväksytty kvalitatiivinen järjestelmä, taajuuslaskelmat ja muut numeerisilla ominaisuuksilla ei ole kielellisestä näkökulmasta mitään järkeä" 1 16 . Uldall ilmaisee samankaltaisia ​​ajatuksia yhdistäen ne hieman odottamattomasti glossematiikan yleisten teoreettisten perusteiden kehitykseen: "Kun kielitieteilijä tarkastelee tai mittaa kaikkea, mitä hän harkitsee ja mittaa, se ei itse määräydy kvantitatiivisesti; esimerkiksi sanat, kun ne lasketaan, määritellään, jos niitä ollenkaan määritellään, aivan eri termein.<147>

Siten käy ilmi, että sekä teoreettisesti että käytännön soveltamisessaan matemaattiset menetelmät ovat suoraan riippuvaisia ​​kielellisistä käsitteistä ja kategorioista, jotka määritellään perinteisillä, filologisilla tai, kuten edellä mainittiin, kvalitatiivisilla menetelmillä. Sovellettavan kielitieteen kannalta on tärkeää ymmärtää tämä riippuvuus ja siten tutustua perinteisen kielitieteen pääkategorioiden kokonaisuuteen.

Ei tosin ole mitään syytä moittia soveltavan kielitieteen alalla työskenteleviä eksaktien tieteiden edustajia siitä, että he eivät käytä modernin kielitieteen dataa. Tämä ei vastaa asioiden todellista tilaa. He eivät vain tunne täydellisesti, vaan käyttävät työssään laajalti kielitieteilijöiden luomia eri kielille tyypillisiä eropiirteiden järjestelmiä, kielellisten elementtien jakautumista ja järjestelyä tietyissä kielijärjestelmissä, akustisen fonetiikan saavutuksia jne. tässä tapauksessa erittäin merkittävä varaus on tarpeen. Itse asiassa eksaktien tieteiden edustajat käyttävät kielitieteen vain yhden suunnan - niin sanotun deskriptiivisen lingvistiikan - aineistoa, joka tarkoituksella erottui teoreettisen kielitieteen perinteisistä ongelmista, kaukana koko kielentutkimuksen kentästä, vaan oikeasta. kielellisestä näkökulmasta siinä on merkittäviä metodologisia puutteita, jotka johtivat sen äskettäin paljastettuun kriisiin 1 18 , ja lisäksi sillä on puhtaasti käytännöllinen suuntaus, joka vastaa soveltavan kielitieteen etuja. Kaikki edellä esitetyt varaukset ja moitteet kielen staattista pohdintaa vastaan ​​soveltuvat kuvailevaan lingvistiikkaan. Sellainen yksipuolinen deskriptiivisen lingvistiikan lähestymistapa voi, tutkija<148>Sitä voidaan kuitenkin perustella vain soveltavan kielitieteen itselleen asettamilla tehtävillä, mutta se ei suinkaan tyhjennä kielitieteen koko sisältöä.

Sovellettavan kielitieteen kysymysten kehittämisprosessissa uusia teoreettisia ongelmia voi syntyä ja itse asiassa on jo syntynyt. Jotkut näistä ongelmista liittyvät läheisesti soveltavan kielitieteen erityistehtäviin ja niillä pyritään voittamaan näiden ongelmien ratkaisemisessa ilmenevät vaikeudet. Muut ongelmat liittyvät suoraan teoreettiseen kielitieteeseen, mikä mahdollistaa uuden näkökulman perinteisiin ajatuksiin tai avaa uusia kielitieteellisen tutkimuksen alueita, uusia käsitteitä ja teorioita. Näihin jälkimmäisiin kuuluu esimerkiksi "konekielen" (tai välikielen) luomisen ongelma, joka liittyy läheisimmin monimutkaiseen joukkoon sellaisia ​​teoreettisen kielitieteen kardinaalikysymyksiä kuin käsitteiden ja leksikaalisten merkityksien suhde, logiikka ja kielioppi, diakronia ja synkronia, kielen merkkiluonne, kielellisen merkityksen ydin, keinotekoisten kielten rakentamisen periaatteet jne. 1 19 . Tässä tapauksessa on erityisen tärkeää luoda keskinäinen ymmärrys ja yhteisöllisyys kielitieteen ja eksaktien tieteiden edustajien yhteisessä työssä. Mitä tulee kielelliseen puoleen, niin tässä tapauksessa ei ilmeisesti pitäisi puhua jo etukäteen esimerkiksi käännöskoneiden suunnittelijoiden ponnistelujen rajoittamisesta” ja tällaisten koneiden toimintakyvyn yrittämisestä N:n säkeillä. Gribatšov tai V. Kochetovin proosa 1 20 . Kone itse löytää kykyjensä rajat ja kannattavuus - käytön rajat. Mutta kielitieteilijöiden panoksensa yhteiseen asiaan on tuotava tietonsa kielen rakenteen ominaisuuksista, sen monipuolisuudesta, sen elementtien sisäisistä risteävistä suhteista sekä kielen laajoista ja monenvälisistä yhteyksistä fyysisiin, fysiologisiin yhteyksiin. , henkistä ja loogista<149>mi-ilmiöitä, kielen erityisiä toiminta- ja kehitysmalleja. Tämän tiedon kokonaisuus on tarpeen vastaavien koneiden suunnittelijoille, jotta ne eivät eksyisi vääriin suuntiin, vaan tekisivät etsimisestä tarkoituksenmukaista ja selkeästi suuntautunutta. Jopa hyvin lyhyt katsaus tapauksista, joissa matemaattisia menetelmiä sovelletaan kielellisiin ongelmiin, joka tehtiin tässä esseessä, vakuuttaa, että tällainen tieto ei suinkaan ole turhaa eksaktien tieteiden edustajille.

Kaikkien yllä olevien näkökohtien perusteella voidaan selvästikin tehdä joitakin yleisiä johtopäätöksiä.

Siis matemaattinen kielitiede? Jos tämä tarkoittaa matemaattisten menetelmien käyttöä yleisenä pääavaimena kaikkien kielellisten ongelmien ratkaisemiseen, tällaiset väitteet on tunnustettava ehdottoman perusteettomiksi. Kaikki, mitä tähän suuntaan on tehty, on tähän mennessä ratkaissut kielitieteen perinteisiä ongelmia hyvin vähän tai ei ollenkaan. Pahimmillaan matemaattisten menetelmien soveltamiseen liittyy ilmeisiä absurdeja tai se on kielelliseltä kannalta täysin merkityksetöntä. Parhaimmillaan matemaattisia menetelmiä voidaan käyttää kielitieteellisen tutkimuksen apumenetelminä, jotka asetetaan tiettyjen ja rajoitettujen kielellisten ongelmien palvelukseen. Tässä tapauksessa ei voi olla kysymys mistään "kvantitatiivisesta kielenfilosofiasta". Fysiikka, psykologia, fysiologia, logiikka, sosiologia ja etnologia loukkasivat aikanaan kielitieteen riippumattomuutta, mutta ne eivät voineet alistaa kielitiedettä. Päinvastoin tapahtui - kielitiede hyödynsi näiden tieteiden saavutuksia ja alkoi siinä määrin kuin itselleen tarpeellista käyttää niiden apua rikastaen siten tutkimusmenetelmiensä arsenaalia. Nyt on ilmeisesti matematiikan vuoro. On toivottavaa, että tämä uusi yhteisö myötävaikuttaa myös kielitieteen vahvistumiseen, sen työmenetelmien parantamiseen ja monimuotoisuuden lisääntymiseen. Siksi on yhtä laillista puhua matemaattisesta lingvistiikasta kuin fysikaalisesta lingvistiikasta, fysiologisesta lingvistiikasta, loogisesta lingvistiikasta, psykologisesta lingvistiikasta ja<150>jne. Sellaista kielitiedettä ei ole olemassa, on vain yksi kielitiede, joka käyttää hyödyllisesti muiden tieteiden aineistoa apututkimuksen välineinä. Näin ollen ei ole mitään syytä vetäytyä uuden tieteen hyökkäysten edessä ja luovuttaa sille helposti saamansa asemat. Tässä on erittäin sopivaa palauttaa mieleen A. Martinet'n sanat: ”Ehkä on houkuttelevaa liittyä yhteen tai toiseen suureen ajatusliikkeeseen käyttämällä muutamaa hyvin valittua termiä tai julistaa jollain matemaattisella kaavalla oman päättelynsä ankaruutta. Kielitieteilijöiden on kuitenkin aika oivaltaa tieteensä riippumattomuus ja vapautua siitä alemmuuskompleksista, joka saa heidät yhdistämään toimintansa yhteen tai toiseen yleiseen tieteelliseen periaatteeseen, jonka seurauksena todellisuuden ääriviivat aina muuttuvat. vain epämääräisempi sen sijaan, että se tulisi selvemmäksi 21 .

Siksi matematiikka itsessään ja kielitiede itsessään. Tämä ei suinkaan sulje pois heidän keskinäistä apuaan tai ystävällistä tapaamista yhteisten ongelmien parissa. Tällainen näiden kahden tieteen yhteisten ponnistelujen sovelluspaikka on kaikki sovelletun kielitieteen osa-alueet, joilla on suuri kansantaloudellinen merkitys. Pitäisi vain toivoa, että molemmat tieteet osoittivat yhteisessä työssään maksimaalista keskinäistä ymmärrystä, mikä epäilemättä myötävaikuttaisi myös yhteistyön maksimaaliseen tuloksellisuuteen.<151>

Kuinka paljon paperin kirjoittaminen maksaa?

Valitse työn tyyppi Opinnäytetyö (kandidaatti / asiantuntija) Osa opinnäytetyötä Maisterin tutkinto Työselostus käytännön kanssa Kurssi teoria Essee Essee Tenttitehtävät Todistustyö (VAR / WQR) Liiketoimintasuunnitelma Tenttikysymykset MBA-tutkinto (opisto / teknillinen korkeakoulu) Muut tapaukset Laboratoriotyöt , RGR Online-apu Harjoitusraportti Tiedonhaku Esittely PowerPointissa Jatkotutkinnon tiivistelmä Tutkinnon liitemateriaali Artikkeli Koepiirustukset lisää »

Kiitos, sinulle on lähetetty sähköposti. Tarkista postisi.

Haluatko 15 % alennuskoodin?

Vastaanota tekstiviestejä
promokoodilla

Onnistuneesti!

?Kerro tarjouskoodi keskustelun aikana esimiehen kanssa.
Tarjouskoodia voi käyttää vain kerran ensimmäisessä tilauksessa.
Tarjouskoodin tyyppi - " jatkotyötä".

Matematiikan ja kielitieteen vuorovaikutus


Johdanto

Luku 1. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1. Rakennekielitieteen muodostuminen 1800-1900-luvun vaihteessa

1.2. Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1. Konekäännös

2.2.Tilastolliset menetelmät kieltenoppimisessa

2.3. Kielen oppiminen muodollisen logiikan menetelmillä

2.4. Matemaattisten menetelmien soveltamisen mahdollisuudet kielitieteessä

Johtopäätös

Kirjallisuus

Liite 1. Ronald Schleifer. Ferdinand de Saussure

Liite 2. Ferdinand de Saussure (käännös)

Johdanto


1900-luvulla on jatkunut suuntaus eri tiedonalojen vuorovaikutukseen ja tunkeutumiseen. Yksittäisten tieteiden väliset rajat hämärtyvät vähitellen; on yhä enemmän henkisen toiminnan aloja, jotka ovat humanitaarisen, teknisen ja luonnontieteellisen tiedon "risteyksessä".

Toinen nykyaikaisuuden ilmeinen piirre on halu tutkia rakenteita ja niiden osatekijöitä. Siksi matematiikalle annetaan yhä suurempi paikka sekä tieteellisessä teoriassa että käytännössä. Matematiikka tunkeutuu yhä syvemmälle ja syvemmälle niille alueille, joita pidettiin pitkään puhtaina. "humanitaarinen", laajentamalla heidän heuristista potentiaaliaan (vastaus kysymykseen "kuinka paljon" auttaa usein vastaamaan kysymyksiin "mitä" ja "miten"). Kielitiede ei ollut poikkeus.

Kurssityöni tarkoituksena on tuoda lyhyesti esille matematiikan ja sellaisen kielitieteen haaran kuin kielitieteen välinen yhteys. 1950-luvulta lähtien matematiikkaa on käytetty kielitieteessä luomaan teoreettinen laite kielten (sekä luonnollisten että keinotekoisten) rakenteen kuvaamiseen. On kuitenkin sanottava, että se ei heti löytänyt tällaista käytännön sovellusta itselleen. Aluksi kielitieteen matemaattisia menetelmiä alettiin käyttää kielitieteen peruskäsitteiden selkiyttämiseen, mutta tietotekniikan kehittymisen myötä tällainen teoreettinen lähtökohta alkoi löytää käyttöä käytännössä. Sellaisten tehtävien, kuten konekääntämisen, koneellisen tiedonhaun, automaattisen tekstinkäsittelyn, ratkaiseminen vaati täysin uutta lähestymistapaa kieleen. Kielitieteilijät kohtasivat kysymyksen: kuinka oppia esittämään kielellisiä malleja siinä muodossa, jossa niitä voidaan soveltaa suoraan tekniikkaan. Aikamme suosittu termi "matemaattinen kielitiede" viittaa kaikkeen kielitieteelliseen tutkimukseen, jossa käytetään eksakteja menetelmiä (ja eksaktien menetelmien käsite liittyy aina läheisesti matematiikkaan). Jotkut viime vuosien tiedemiehet uskovat, että itse ilmaisua ei voi nostaa termin arvoon, koska se ei tarkoita mitään erityistä "kielitiedettä", vaan vain uutta suuntaa, joka keskittyy kielen tutkimusmenetelmien parantamiseen, tarkkuuden ja luotettavuuden lisäämiseen. . Kielitiede käyttää sekä kvantitatiivisia (algebrallisia) että ei-kvantitatiivisia menetelmiä, mikä tuo sen lähemmäksi matemaattista logiikkaa ja siten myös filosofiaa ja jopa psykologiaa. Jopa Schlegel pani merkille kielen ja tietoisuuden vuorovaikutuksen, ja 1900-luvun alun tunnettu kielitieteilijä Ferdinand de Saussure (kerron hänen vaikutuksestaan ​​kielitieteen matemaattisten menetelmien kehitykseen myöhemmin) yhdisti kielen rakenteen sen kuulumiseen. kansalle. Nykytutkija L. Perlovsky menee pidemmälle tunnistamalla kielen kvantitatiiviset ominaisuudet (esimerkiksi sukupuolten lukumäärät, tapaukset) kansallisen mentaliteetin erityispiirteisiin (tästä lisää luvussa 2.2, "Kielitieteen tilastolliset menetelmät").

Matematiikan ja kielitieteen vuorovaikutus on monitahoinen aihe, enkä käsittele työssäni kaikkea, vaan ennen kaikkea sen soveltavia puolia.

Luku I. Matemaattisten menetelmien soveltamisen historia kielitieteessä


1.1 Rakennekielitieteen muodostuminen XIX - XX vuosisatojen vaihteessa


Kielen matemaattinen kuvaus perustuu ajatukseen kielestä mekanismina, joka juontaa juurensa 1900-luvun alun kuuluisaan sveitsiläiseen kielitieteilijään Ferdinand de Saussureen.

Hänen käsitteensä alkulinkki on teoria kielestä järjestelmänä, joka koostuu kolmesta osasta (itse kieli - kieli, puhe - ehdonalainen ja puhetoiminta - kieli), jossa jokaista sanaa (järjestelmän jäsentä) ei pidetä sellaisenaan , mutta muiden jäsenten yhteydessä. Kuten toinen merkittävä kielitieteilijä, tanskalainen Louis Hjelmslev, myöhemmin huomautti, Saussure "oli ensimmäinen, joka vaati rakenteellista lähestymistapaa kieleen, toisin sanoen kielen tieteellistä kuvausta kirjaamalla yksiköiden väliset suhteet".

Saussure, joka ymmärsi kielen hierarkkisena rakenteena, esitti ensimmäisenä ongelman kielellisten yksiköiden arvosta ja merkityksestä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa.

Saussuren kielen rakenneyksikkö piti sanaa "merkki", jossa ääni ja merkitys yhdistettiin. Mikään näistä elementeistä ei ole olemassa ilman toisiaan: siksi äidinkielenään puhuva ymmärtää polysemanttisen sanan merkityksen eri sävyt erillisenä elementtinä rakenteellisessa kokonaisuudessa, kielessä.

Näin ollen F. de Saussuren teoriassa voidaan nähdä kielitieteen vuorovaikutusta toisaalta sosiologian ja sosiaalipsykologian kanssa (on huomattava, että samaan aikaan kehittyvät Husserlin fenomenologia, Freudin psykoanalyysi, Einsteinin suhteellisuusteoria , kirjallisuudessa, musiikissa ja kuvataiteessa tehdään muoto- ja sisältökokeita, toisaalta matematiikan kanssa (konsistenssin käsite vastaa algebrallista kielen käsitettä). Tällainen käsite muutti kielellisen tulkinnan käsitettä sellaisenaan: Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa nykyhetkeen ja tulevaisuuteen. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tietoisia" sanan freudilaisessa merkityksessä).

Kielellisen mekanismin toiminta ilmenee äidinkielenään puhuvien puhetoiminnan kautta. Puheen tuloksena ovat niin sanotut "oikeat tekstit" - puheyksiköiden sekvenssit, jotka noudattavat tiettyjä kaavoja, joista monet mahdollistavat matemaattisen kuvauksen. Syntaktisen rakenteen kuvaustapojen teoria käsittelee oikeiden tekstien (ensisijaisesti lauseiden) matemaattisen kuvauksen menetelmiä. Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Lännessä Saussuren ajatuksia kehittävät suuren sveitsiläisen kielitieteilijän nuoremmat aikalaiset: Tanskassa - jo mainitsemani L. Hjelmslev, joka synnytti teoksessaan "Kieliteorian perusteet" algebrallisen kieliteorian. USA - E. Sapir, L. Bloomfield, C. Harris, Tšekin tasavallassa - venäläinen tiedemies-emigrantti N. Trubetskoy.

Tilastollisia säännönmukaisuuksia kielentutkimuksessa alkoi käsitellä ei kukaan muu kuin genetiikan perustaja Georg Mendel. Vasta vuonna 1968 filologit havaitsivat, että hänen elämänsä viimeisinä vuosina hän kiehtoi kielellisten ilmiöiden tutkimista matematiikan menetelmiä käyttäen. Mendel toi tämän menetelmän kielitieteeseen biologiasta; 1990-luvulla vain rohkeimmat lingvistit ja biologit väittivät tällaisen analyysin toteutettavuuden. Pyhän Pietarin luostarin arkistossa. Brnon Tomaszista, jonka apotti oli Mendel, löydettiin arkkeja, joissa oli sukunimien sarakkeita, jotka päättyivät "mann", "bauer", "mayer", ja joissa oli murto-osia ja laskelmia. Yrittääkseen löytää sukunimien alkuperän muodolliset lait Mendel tekee monimutkaisia ​​laskelmia, joissa hän ottaa huomioon saksan kielen vokaalien ja konsonanttien määrän, harkitsemiensa sanojen kokonaismäärän, sukunimien lukumäärän, jne.

Maamme rakennekielitiede alkoi kehittyä suunnilleen samaan aikaan kuin lännessä - 1800-1900-luvun vaihteessa. Samanaikaisesti F. de Saussuren kanssa Kazanin yliopiston professorit F.F. kehittivät töissään kielen käsitteen järjestelmänä. Fortunatov ja I.A. Baudouin de Courtenay. Jälkimmäinen vastasi pitkään de Saussuren kanssa, vastaavasti Geneven ja Kazanin kielitieteen koulut tekivät yhteistyötä keskenään. Jos Saussurea voidaan kutsua kielitieteen "tarkkojen" menetelmien ideologiksi, niin Baudouin de Courtenay loi käytännön perustan niiden soveltamiselle. Hän erotti ensimmäisenä kielitieteen (tilastollisia menetelmiä ja toiminnallista riippuvuutta käyttävänä eksaktitieteenä) filologiasta (humanitaaristen tieteenalojen yhteisö, joka tutkii henkistä kulttuuria kielen ja puheen kautta). Tiedemies itse uskoi, että "kielitiede voi olla hyödyllistä lähitulevaisuudessa, vain vapautettuna pakollisesta liitosta filologian ja kirjallisuuden historian kanssa". Fonologiasta tuli "koekenttä" matemaattisten menetelmien käyttöönotolle kielitieteeseen - äänet kielijärjestelmän "atomeina", joilla oli rajoitettu määrä helposti mitattavissa olevia ominaisuuksia, olivat kätevintä materiaalia muodollisille, tiukoille kuvausmenetelmille. Fonologia kiistää äänen merkityksen olemassaolon, joten "ihminen" tekijä eliminoitiin tutkimuksissa. Tässä mielessä foneemit ovat kuin fyysisiä tai biologisia esineitä.

Foneemit pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä sfääriä, erillistä "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Tärkeintä on, että foneemi suorittaa päätehtävänsä. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla tai ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Kielen äänet ovat systemaattisesti järjestetty joukko ominaisuuksia. 1920-1930-luvulla, Saussuren jälkeen, Jacobson ja N.S. Trubetskoy korostivat foneemien "erottuvat piirteet". Nämä ominaisuudet perustuvat puheelinten rakenteeseen - kieli, hampaat, äänihuulet. Esimerkiksi englannin kielessä ero "t":n ja "d":n välillä on "äänen" olemassaolo tai puuttuminen (äänihuulien jännitys) ja äänen taso, joka erottaa yhden foneemin toisesta. Näin ollen fonologiaa voidaan pitää esimerkkinä Saussuren kuvaamasta yleisestä kielisäännöstä: "Kielessä on vain eroja". Vielä tärkeämpää ei ole tämä: ero tarkoittaa yleensä tarkat olosuhteet, joiden välillä se sijaitsee; mutta kielessä on vain eroja ilman tarkkoja ehtoja. Tarkastellaanpa sitten "nimeämistä" tai "merkittyä" - kielessä ei ole käsitteitä eikä ääniä, jotka olisivat olleet olemassa ennen kielijärjestelmän kehitystä.

Näin ollen Saussurean kielitieteessä tutkittu ilmiö ymmärretään kielen vertailujen ja vastakohtien joukkona. Kieli on sekä sanojen merkityksen ilmaus että viestintäväline, eivätkä nämä kaksi toimintoa koskaan kohtaa. Voimme havaita muodon ja sisällön vuorottelua: kielelliset kontrastit määrittelevät sen rakenneyksiköt, ja nämä yksiköt muodostavat vuorovaikutuksessa tietyn merkityksellisen sisällön. Koska kielen elementit ovat satunnaisia, ei kontrasti tai yhdistelmä voi olla perusta. Tämä tarkoittaa, että kielessä tunnusmerkit muodostavat foneettisen kontrastin eri ymmärrystasolla, foneemit yhdistetään morfeemiksi, morfeemit sanoiksi, sanat lauseiksi jne. Joka tapauksessa kokonainen foneemi, sana, lause jne. on enemmän kuin vain osiensa summa.

Saussure ehdotti ajatusta uudesta 1900-luvun tieteestä, joka on erillinen kielitieteestä, joka tutkii merkkien roolia yhteiskunnassa. Saussure kutsui tätä tiedettä semiologiaksi (kreikan sanasta "semeon" - merkki). Semiotiikan "tiede", joka kehittyi Itä-Euroopassa 1920-1930-luvuilla ja Pariisissa 1950-1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näiden rakenteiden pohjalta muodostetuiksi (tai artikuloiduiksi) kirjallisiksi löydöksiksi. Lisäksi uransa hämärässä, yleisen kielitieteen kurssin ohella, Saussure harjoitti myöhäisroomalaisen runouden "semioottista" analyysiä yrittäen löytää tarkoituksella laadittuja erisnimien anagrammeja. Tämä menetelmä oli monella tapaa rationalismin vastakohta lingvistisessä analyysissään: se oli yritys tutkia järjestelmässä kielen "todennäköisyyden" ongelmaa. Tällainen tutkimus auttaa keskittymään todennäköisyyden "todelliseen puoleen"; "avainsana", jolle Saussure etsii anagrammia, on Jean Starobinskyn mukaan "runoilijan työkalu, ei runon elämän lähde". Runon tarkoitus on vaihtaa avainsanan äänet. Starobinskyn mukaan tässä analyysissä "Saussure ei syvenny piilotettujen merkityksien etsimiseen". Päinvastoin, hänen teoksissaan on havaittavissa halu välttää tietoisuuteen liittyviä kysymyksiä: "koska runous ilmaistaan ​​paitsi sanoissa, myös siinä, mitä nämä sanat synnyttävät, se menee tietoisuuden hallinnan ulkopuolelle ja riippuu vain kielen lait” (katso . Liite 1).

Saussuren yritys tutkia erisnimiä myöhäisroomalaisessa runoudessa korostaa yhtä hänen kielellisen analyysinsä komponenteista - merkkien mielivaltaista luonnetta sekä Saussuren kielitieteen muodollista olemusta, joka sulkee pois mahdollisuuden analysoida merkitystä. Todorov päättelee, että nykyään Saussuren teokset näyttävät olevan erittäin johdonmukaisia ​​haluttomuudessaan tutkia ilmiön symboleja, joilla on selkeä merkitys [Liite 1]. Anagrammeja tutkiessaan Saussure kiinnittää huomiota vain toistoon, mutta ei aikaisempiin vaihtoehtoihin. . . . Nibelungia tutkiessaan hän määrittelee symbolit vain liittääkseen ne virheellisiin lukemiin: jos ne ovat tahattomia, symboleja ei ole olemassa. Loppujen lopuksi hän tekee yleisen kielitieteen kirjoituksissaan oletuksen semiologian olemassaolosta, joka ei kuvaa vain kielellisiä merkkejä; mutta tätä oletusta rajoittaa se tosiasia, että semiologia voi kuvata vain satunnaisia, mielivaltaisia ​​merkkejä.

Jos tämä todella on niin, se johtuu vain siitä, että hän ei voinut kuvitella "aikomusta" ilman esinettä; hän ei kyennyt täysin kuromaan umpeen muodon ja sisällön välistä kuilua - hänen kirjoituksissaan tämä muuttui kysymykseksi. Sen sijaan hän kääntyi "kieliseen legitiimiyteen". Toisaalta historiaan ja subjektiivisiin olettamuksiin perustuvien 1800-luvun käsitteiden ja näihin käsitteisiin perustuvien satunnaisen tulkintamenetelmien ja toisaalta muodon ja sisällön (subjektin ja objektin) vastakohtaisuutta pyyhkivien strukturalististen käsitteiden välillä, merkitys ja alkuperä strukturalismissa, psykoanalyysissä ja jopa kvanttimekaniikassa, Ferdinand de Saussuren kielitieteen ja semiotiikan kirjoitukset merkitsevät käännekohtaa kielen ja kulttuurin merkityksien tutkimuksessa.

Venäläiset tiedemiehet olivat myös edustettuina ensimmäisessä kansainvälisessä kielitieteilijöiden kongressissa Haagissa vuonna 1928. S. Kartsevsky, R. Yakobson ja N. Trubetskoy tekivät raportin, jossa tarkasteltiin kielen hierarkkista rakennetta - viime vuosisadan alun nykyaikaisimpien ideoiden hengessä. Jakobson kehitti kirjoituksissaan Saussuren ajatuksia siitä, että kielen peruselementtejä tulisi tutkia ennen kaikkea niiden toimintojen, ei niiden esiintymisen syiden yhteydessä.

Valitettavasti Stalinin tultua valtaan vuonna 1924 venäläinen kielitiede, kuten monet muutkin tieteet, heitetään takaisin. Monet lahjakkaat tiedemiehet pakotettiin muuttamaan maasta, heidät karkotettiin maasta tai kuoli leireillä. Tietty teorioiden moniarvoisuus tuli mahdolliseksi vasta 1950-luvun puolivälissä – siitä lisää luvussa 1.2.


1.2 Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla


1900-luvun puoliväliin mennessä oli muodostunut neljä maailman kielellistä koulukuntaa, joista jokainen osoittautui tietyn "tarkan" menetelmän esi-isäksi. Leningradin fonologinen koulu (sen esi-isä oli Baudouin de Courtenay L. V. Shcherban opiskelija) käytti äidinkielenään puhujien puheen analysointiin perustuvaa psykolingvististä koetta pääkriteerinä äänen yleistämiselle foneemin muodossa.

Prahan kielitieteellisen piirin tutkijat, erityisesti sen perustaja N.S. Venäjältä muuttanut Trubetskoy kehitti oppositioteorian - kielen semanttista rakennetta kuvailivat ryhmänä oppositioon rakennettuja semanttisia yksiköitä - Sem. Tätä teoriaa sovellettiin paitsi kielen, myös taiteellisen kulttuurin tutkimuksessa.

Amerikkalaisen deskriptivismin ideologit olivat lingvistit L. Bloomfield ja E. Sapir. Kieli esitettiin deskriptivisteille joukkona puhelauseita, jotka olivat heidän tutkimuksensa pääkohteena. Heidän painopisteensä oli tekstien tieteellisen kuvauksen (siis nimen) säännöissä: niiden elementtien organisoinnin, järjestelyn ja luokittelun tutkimisessa. Analyyttisten menettelyjen formalisointi fonologian ja morfologian alalla (kielen tutkimisen periaatteiden kehittäminen eri tasoilla, distributiivinen analyysi, suorien ainesosien menetelmä jne.) johti yleisten kielellisen mallinnuksen kysymysten muotoiluun. Välinpitämättömyys kielen sisältösuunnitelmaan ja kielen paradigmaattiseen puoleen ei antanut deskriptivistien tulkita kieltä riittävän täysin järjestelmänä.

1960-luvulla kehittyi muodollisten kielioppien teoria, joka syntyi pääasiassa amerikkalaisen filosofin ja kielitieteilijän N. Chomskyn työn ansiosta. Häntä pidetään oikeutetusti yhtenä kuuluisimmista nykyajan tiedemiehistä ja julkisuuden henkilöistä, hänelle on omistettu monia artikkeleita, monografioita ja jopa täyspitkä dokumentti. Chomskyn keksimän syntaktisen rakenteen perustavanlaatuisen uuden tavan - generatiivisen (generatiivisen) kieliopin - nimellä vastaavaa kielitieteen suuntausta kutsuttiin generativismiksi.

Chomsky, Venäjältä tulleiden maahanmuuttajien jälkeläinen, opiskeli kielitiedettä, matematiikkaa ja filosofiaa Pennsylvanian yliopistossa vuodesta 1945 lähtien vahvasti opettajansa Zelig Harrisin vaikutuksesta – kuten Harris, Chomsky piti ja pitää poliittisia näkemyksiään lähellä anarkismia (hän ​​on edelleen tunnetaan Yhdysvaltain nykyisen poliittisen järjestelmän kriitikkona ja yhtenä antiglobalismin henkisistä johtajista).

Chomskyn ensimmäinen suuri tieteellinen työ, hänen diplomityönsä Morphology of Modern Hebrew (1951), jäi julkaisematta. Chomsky väitteli tohtoriksi Pennsylvanian yliopistosta vuonna 1955, mutta suuri osa hänen väitöskirjansa (julkaistu kokonaisuudessaan vasta vuonna 1975 otsikolla The Logical Structure of Linguistic Theory) ja hänen ensimmäisen monografiansa Syntactic Structures (1957, Rus. trans. 1962), esitettiin Harvardin yliopistossa vuosina 1951-1955. Samana vuonna 1955 tiedemies muutti Massachusetts Institute of Technologyyn, jossa hänestä tuli professori vuonna 1962.

Chomskyn teoria on käynyt läpi useita kehitysvaiheita.

Ensimmäisessä monografiassa "Syntaktiset rakenteet" tiedemies esitteli kielen mekanismina, jolla luodaan ääretön joukko lauseita käyttämällä rajallista joukkoa kieliopillisia keinoja. Kielellisten ominaisuuksien kuvaamiseksi hän ehdotti käsitteitä syvä (piilotettu suoralta havainnolta ja generoitu rekursiivisten eli toistuvasti sovellettavien sääntöjen) ja pinnan (suoraan havaittujen) kieliopillisten rakenteiden käsitteitä sekä muunnoksia, jotka kuvaavat siirtymää. syvistä rakenteista pintarakenteisiin. Useat pintarakenteet voivat vastata yhtä syvärakennetta (esim. passiivirakenne Presidentin allekirjoittama asetus on johdettu samasta syvärakenteesta kuin aktiivinen rakenne, jonka presidentti allekirjoittaa asetuksen) ja päinvastoin (esimerkiksi epäselvyys Äiti rakastaa tytärtä kuvataan kahden eri syvälle ulottuvien pintarakenteiden yhteensattuman tuloksena, joista toisessa äiti on se, joka rakastaa tytärtä, ja toisessa se, jota tytär rakastaa).

Chomskyn standarditeoriaa pidetään "Aspects"-mallina, joka on esitetty Chomskyn kirjassa "Aspects of the Theory of Syntax". Tässä mallissa ensimmäistä kertaa muodolliseen teoriaan otettiin käyttöön semanttisen tulkinnan säännöt, jotka antavat merkityksen syville rakenteille. Aspektissa kielellinen kompetenssi vastustetaan kielen käyttöä (suorituskykyä), omaksutaan ns. Katz-Postal-hypoteesi merkityksen säilymisestä muunnoksen aikana, jonka yhteydessä valinnaisen muunnoksen käsite suljetaan pois, ja laitteisto Leksikaalista yhteensopivuutta kuvaavat syntaktiset ominaisuudet otetaan käyttöön.

1970-luvulla Chomsky työskenteli hallinnon ja sitomisen teorian parissa (GB-teoria - sanoista hallitus ja sitova) - yleisempää kuin edellinen. Siinä tiedemies hylkäsi erityiset säännöt, jotka kuvaavat tiettyjen kielten syntaktisia rakenteita. Kaikki muunnokset on korvattu yhdellä universaalilla siirtomuunnolla. GB-teorian puitteissa on myös yksityisiä moduuleja, joista jokainen vastaa omasta kielioppinsa osasta.

Jo äskettäin, vuonna 1995, Chomsky esitti minimalistisen ohjelman, jossa ihmisen kieltä kuvataan konekielenä. Se on vain ohjelma, ei malli tai teoria. Siinä Chomsky tunnistaa kaksi ihmisen kielilaitteen pääosajärjestelmää: sanaston ja laskentajärjestelmän sekä kaksi rajapintaa - foneettisen ja loogisen.

Chomskyn muodollisista kieliopeista on tullut klassisia paitsi luonnollisten, myös keinotekoisten kielten - erityisesti ohjelmointikielten - kuvaamiseen. Rakennekielitieteen kehitystä 1900-luvun jälkipuoliskolla voidaan perustellusti pitää "chomskilaisena vallankumouksena".

Moskovan fonologinen koulu, jonka edustajat olivat A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov käytti samanlaista teoriaa fonetiikan tutkimiseen. Pikkuhiljaa "tarkkoja" menetelmiä aletaan soveltaa paitsi fonetiikassa myös syntaksissa. Sekä kielitieteilijät että matemaatikot, niin kotimaassa kuin ulkomaillakin, alkavat tutkia kielen rakennetta. 1950- ja 60-luvuilla Neuvostoliitossa alkoi uusi vaihe matematiikan ja kielitieteen vuorovaikutuksessa, joka liittyi konekäännösjärjestelmien kehittämiseen.

Sysäyksenä näiden töiden aloittamiselle maassamme oli ensimmäinen kehitys konekäännösalalla Yhdysvalloissa (vaikka P. P. Smirnov-Troyanskyn ensimmäinen mekaaninen käännöslaite keksittiin Neuvostoliitossa vuonna 1933, koska se oli primitiivistä, ei yleistynyt). Vuonna 1947 A. Butt ja D. Britten keksivät koodin sana kerrallaan kääntämiseen tietokoneella, ja vuotta myöhemmin R. Richens ehdotti sääntöä sanojen jakamisesta varsiksi ja päätteiksi konekäännöksissä. Ne vuodet olivat aivan erilaisia ​​kuin nykyään. Nämä olivat erittäin suuria ja kalliita koneita, jotka veivät kokonaisia ​​huoneita ja vaativat suuren henkilöstön insinöörejä, käyttäjiä ja ohjelmoijia ylläpitämään niitä. Pohjimmiltaan näitä tietokoneita käytettiin matemaattisten laskelmien suorittamiseen sotilaslaitosten tarpeisiin - matematiikassa, fysiikassa ja tekniikassa uusi palveli ennen kaikkea sotilasasioita. MP:n kehitystä tuki alkuvaiheessa aktiivisesti armeija, kun taas (kylmän sodan olosuhteissa) venäläis-englannin suunta kehittyi USA:ssa ja anglo-venäläinen suunta Neuvostoliitossa.

Tammikuussa 1954 Georgetown Experiment, ensimmäinen julkinen demonstraatio käännöksestä venäjästä englanniksi IBM-701-koneella, pidettiin Massachusettsin teknisessä yliopistossa. Tiivistelmä viestistä kokeen onnistumisesta, laati D.Yu. Panov, ilmestyi RJ "Mathematics", 1954, nro 10: "Käännös kielestä toiseen koneella: raportti ensimmäisestä onnistuneesta testistä."

D. Yu. Panov (silloin tieteellisen tiedon instituutin (INI, myöhemmin VINITI) johtaja) otti mukaan I. K. Belskajan, joka johti myöhemmin konekäännösryhmää Neuvostoliiton tiedeakatemian tarkan matematiikan ja tietokonetekniikan instituutissa. konekäännöstyötä. Vuoden 1955 lopussa ensimmäinen kokemus kääntämisestä englannista venäjäksi BESM-koneen avulla juontaa juurensa. BESM:n ohjelmat on koonnut N.P. Trifonov ja L.N. Korolev, jonka väitöskirja oli omistettu konekäännössanakirjojen rakentamismenetelmille.

Samanaikaisesti konekäännöstyötä tehtiin Neuvostoliiton tiedeakatemian matemaattisen instituutin soveltavan matematiikan osastolla (nykyinen Venäjän tiedeakatemian M.V. Keldyshin soveltavan matematiikan instituutti). Matemaatikko A.A. Ljapunov. Hän osallistui O.S. Kulagin ja hänen oppilaansa T.D. Wentzel ja N.N. Ricco. Ljapunovin ja Kulaginan ajatukset mahdollisuudesta käyttää teknologiaa kääntämään kielestä toiseen julkaistiin Nature-lehdessä, 1955, nro 8. Vuoden 1955 lopusta lähtien T.N. Moloshnaya, joka aloitti sitten itsenäisen työn englannin-venäläisen käännösalgoritmin parissa.

R. Frumkina, joka tuolloin harjoitti espanjan kielen käännösalgoritmia, muistelee, että työn tässä vaiheessa oli vaikea ottaa johdonmukaisia ​​askeleita. Paljon useammin minun piti seurata heuristista kokemusta - omaa tai kollegoideni.

Ensimmäisen sukupolven konekäännösjärjestelmät olivat kuitenkin erittäin epätäydellisiä. Ne kaikki perustuivat peräkkäisiin käännösalgoritmeihin "sana sanalta", "fraasi lauseelta" - sanojen ja lauseiden välisiä semanttisia yhteyksiä ei otettu millään tavalla huomioon. Voimme esimerkiksi lainata lauseita: ”John etsi lelulaatikkoaan. Lopulta hän löysi sen. Laatikko oli kynässä. John oli hyvin onnellinen. (John etsi lelulaatikkoaan. Lopulta hän löysi sen. Laatikko oli leikkikehässä. John oli hyvin iloinen.)” "Kynä" ei ole tässä yhteydessä "kynä" (kirjoitustyökalu), vaan "leikkikehä" (leikkikynä). Synonyymien, antonyymien ja kuvaannollisten merkityksien tuntemus on vaikea syöttää tietokoneeseen. Lupaava suunta oli ihmiskääntäjän käyttöön keskittyneiden tietokonejärjestelmien kehittäminen.

Ajan myötä suorat käännösjärjestelmät korvattiin T-järjestelmillä (englannin sanasta "siirto" - muunnos), joissa käännös suoritettiin syntaktisten rakenteiden tasolla. T-järjestelmien algoritmit käyttivät mekanismia, joka mahdollisti syntaktisen rakenteen rakentamisen syöttölauseen kielen kielioppisääntöjen mukaan (samalla tavalla kuin lukiossa opetetaan vierasta kieltä) ja sitten syntetisoi ulostulolause. muuttamalla syntaktista rakennetta ja korvaamalla tarvittavat sanat sanakirjasta.

Ljapunov puhui kääntämisestä poimimalla käännetyn tekstin merkityksen ja esittämällä sen toisella kielellä. Täydellisimpana pidetään edelleen lähestymistapaa konekäännösjärjestelmien rakentamiseen, joka perustuu syöttölauseen semanttisen esityksen saamiseen semanttisella analyysillä ja syöttölauseen syntetisoinnilla saadun semanttisen esityksen mukaisesti. Tällaisia ​​järjestelmiä kutsutaan I-järjestelmiksi (sanasta "interlingua"). Niiden luomistehtävää, joka ajoittui 50-luvun lopulle ja 60-luvun alkupuolelle, ei kuitenkaan ole toistaiseksi täysin ratkaistu, huolimatta IFIP:n kansainvälisen tiedeyhteisön, tiedonkäsittelyn alan tiedeyhteisön, pyrkimyksistä.

Tutkijat miettivät, kuinka formalisoida ja rakentaa algoritmeja tekstien kanssa työskentelyyn, mitä sanakirjoja koneeseen tulisi syöttää, mitä kielellisiä malleja tulisi käyttää konekäännöksissä. Perinteisellä kielitieteellä ei ollut tällaisia ​​ideoita - ei vain semantiikan, vaan myös syntaksin suhteen. Tuolloin minkään kielen syntaktisista rakenteista ei ollut luetteloita, niiden yhteensopivuuden ja vaihdettavuuden ehtoja ei tutkittu, sääntöjä suurten syntaktisen rakenteen yksiköiden rakentamiselle pienemmistä osaelementeistä ei kehitetty.

Tarve luoda konekääntämisen teoreettinen perusta johti matemaattisen kielitieteen muodostumiseen ja kehittymiseen. Johtava rooli tässä asiassa Neuvostoliitossa oli matemaatikoilla A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, kielitieteilijät V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginan väitöskirja oli omistettu kielioppien muodollisen teorian tutkimukselle (samanaikaisesti N. Khomskyn kanssa USA:ssa), Kuznetsov esitti kielitieteen aksiomatisoinnin tehtäväksi, joka juontaa juurensa F. F.:n töihin. Fortunatov.

6. toukokuuta 1960 hyväksyttiin Neuvostoliiton tiedeakatemian puheenjohtajiston asetus "Kielen tutkimuksen rakenteellisten ja matemaattisten menetelmien kehittämisestä", ja vastaavat jaostot perustettiin kielitieteen instituuttiin ja instituuttiin. venäjän kieli. Vuodesta 1960 lähtien maan johtavissa humanitaarisissa yliopistoissa - Moskovan valtionyliopiston filologisessa tiedekunnassa, Leninradissa, Novosibirskin yliopistoissa, Moskovan valtion vieraiden kielten instituutissa - aloitettiin koulutus automaattisen tekstinkäsittelyn alalla.

Tämän ajanjakson "klassisiksi" kutsutut konekäännöstyöt kiinnostavat kuitenkin enemmän teoreettista kuin käytännöllistä. Kustannustehokkaita konekäännösjärjestelmiä alettiin luoda vasta viime vuosisadan 80-luvulla. Puhun tästä myöhemmin osiossa 2.1, Konekäännös.

1960-70-luvuilla on syvällistä teoreettista kehitystä käyttäen joukkoteorian ja matemaattisen logiikan menetelmiä, kuten kenttäteoriaa ja sumea joukkoteoria.

Kielitieteen kenttäteorian kirjoittaja oli Neuvostoliiton runoilija, kääntäjä ja kielitieteilijä V.G. Admoni. Hän kehitti teoriansa alun perin saksan kielen pohjalta. Admonin kohdalla käsite "kenttä" tarkoittaa mielivaltaista ei-tyhjää kielellisten elementtien joukkoa (esimerkiksi "leksikaalinen kenttä", "semanttinen kenttä").

Kentän rakenne on heterogeeninen: se koostuu ytimestä, jonka elementeillä on täydellinen joukko joukon määritteleviä ominaisuuksia, ja reunasta, jonka elementeillä voi olla sekä tietyn joukon ominaisuuksia (ei kaikkia) ja naapurit. Annan esimerkin, joka havainnollistaa tätä lausuntoa: esimerkiksi englannin kielessä yhdistelmäsanojen kenttä ("day-dream" - "dream" on vaikea erottaa lausekentästä ("tear gas" - "tear gas") .

Jo edellä mainittu sumeiden joukkojen teoria liittyy läheisesti kenttäteoriaan. Neuvostoliitossa kielitieteilijät V.G. Admoni, I.P. Ivanova, G.G. Pochentsov sen esi-isä oli kuitenkin amerikkalainen matemaatikko L. Zadeh, joka julkaisi vuonna 1965 artikkelin "Fuzzy Logic". Antaessaan matemaattisen perustelun sumeiden joukkojen teorialle Zade käsitteli niitä kielellisen materiaalin perusteella.

Tässä teoriassa ei puhuta niinkään elementtien kuulumisesta tiettyyn joukkoon (АОа), vaan tämän kuuluvuuden asteesta (mАОа), koska reunaelementit voivat kuulua useaan kenttään tavalla tai toisella. Zade (Lofti-zade) oli kotoisin Azerbaidžanista, 12-vuotiaaksi asti hänellä oli käytäntö kommunikoida neljällä kielellä - azerbaidžanilla, venäjällä, englanniksi ja persiaksi - ja hän käytti kolmea eri aakkoset: kyrillinen, latina, arabia. Kun tiedemieheltä kysytään, mikä on yhteistä sumeiden joukkojen teorian ja kielitieteen välillä, hän ei kiellä tätä yhteyttä, mutta selventää: ”En ole varma, että näiden kielten tutkimisella olisi ollut suuri vaikutus ajatteluuni. Jos näin oli, niin vain alitajuisesti. Nuoruudessaan Zadeh opiskeli presbyteerikoulussa Teheranissa, ja toisen maailmansodan jälkeen hän muutti Yhdysvaltoihin. "Kysymys ei ole siitä, olenko amerikkalainen, venäläinen, azerbaidžanilainen vai mikä tahansa", hän sanoi.

Samanlaisia ​​abstrakteja:

Kieli ja puhe yhtenä tyylitieteen perusongelmista. Foneemin käsite ja fonologinen taso. Kielen käsite järjestelmänä ja kielijärjestelmän tasot. Morfeemien käsite ja niiden tyypit. Lause tekstin syntaktisena yksikkönä. Kielijärjestelmän merkkejä.

Johdanto

Luku 1. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1. Rakennekielitieteen muodostuminen 1800-1900-luvun vaihteessa

1.2. Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1. Konekäännös

2.2.Tilastolliset menetelmät kieltenoppimisessa

2.3. Kielen oppiminen muodollisen logiikan menetelmillä

2.4. Matemaattisten menetelmien soveltamisen mahdollisuudet kielitieteessä

Johtopäätös

Kirjallisuus

Liite 1. Ronald Schleifer. Ferdinand de Saussure

Liite 2. Ferdinand de Saussure (käännös)

Johdanto

1900-luvulla on jatkunut suuntaus eri tiedonalojen vuorovaikutukseen ja tunkeutumiseen. Yksittäisten tieteiden väliset rajat hämärtyvät vähitellen; on yhä enemmän henkisen toiminnan aloja, jotka ovat humanitaarisen, teknisen ja luonnontieteellisen tiedon "risteyksessä".

Toinen nykyaikaisuuden ilmeinen piirre on halu tutkia rakenteita ja niiden osatekijöitä. Siksi matematiikalle annetaan yhä suurempi paikka sekä tieteellisessä teoriassa että käytännössä. Matematiikka tunkeutuu yhä syvemmälle ja syvemmälle niille alueille, joita pidettiin pitkään puhtaina. "humanitaarinen", laajentamalla heidän heuristista potentiaaliaan (vastaus kysymykseen "kuinka paljon" auttaa usein vastaamaan kysymyksiin "mitä" ja "miten"). Kielitiede ei ollut poikkeus.

Kurssityöni tarkoituksena on tuoda lyhyesti esille matematiikan ja sellaisen kielitieteen haaran kuin kielitieteen välinen yhteys. 1950-luvulta lähtien matematiikkaa on käytetty kielitieteessä luomaan teoreettinen laite kielten (sekä luonnollisten että keinotekoisten) rakenteen kuvaamiseen. On kuitenkin sanottava, että se ei heti löytänyt tällaista käytännön sovellusta itselleen. Aluksi kielitieteen matemaattisia menetelmiä alettiin käyttää kielitieteen peruskäsitteiden selkiyttämiseen, mutta tietotekniikan kehittymisen myötä tällainen teoreettinen lähtökohta alkoi löytää käyttöä käytännössä. Sellaisten tehtävien, kuten konekääntämisen, koneellisen tiedonhaun, automaattisen tekstinkäsittelyn, ratkaiseminen vaati täysin uutta lähestymistapaa kieleen. Kielitieteilijät kohtasivat kysymyksen: kuinka oppia esittämään kielellisiä malleja siinä muodossa, jossa niitä voidaan soveltaa suoraan tekniikkaan. Aikamme suosittu termi "matemaattinen kielitiede" viittaa kaikkeen kielitieteelliseen tutkimukseen, jossa käytetään eksakteja menetelmiä (ja eksaktien menetelmien käsite liittyy aina läheisesti matematiikkaan). Jotkut viime vuosien tiedemiehet uskovat, että itse ilmaisua ei voi nostaa termin arvoon, koska se ei tarkoita mitään erityistä "kielitiedettä", vaan vain uutta suuntaa, joka keskittyy kielen tutkimusmenetelmien parantamiseen, tarkkuuden ja luotettavuuden lisäämiseen. . Kielitiede käyttää sekä kvantitatiivisia (algebrallisia) että ei-kvantitatiivisia menetelmiä, mikä tuo sen lähemmäksi matemaattista logiikkaa ja siten myös filosofiaa ja jopa psykologiaa. Jopa Schlegel pani merkille kielen ja tietoisuuden vuorovaikutuksen, ja 1900-luvun alun tunnettu kielitieteilijä Ferdinand de Saussure (kerron hänen vaikutuksestaan ​​kielitieteen matemaattisten menetelmien kehitykseen myöhemmin) yhdisti kielen rakenteen sen kuulumiseen. kansalle. Nykytutkija L. Perlovsky menee pidemmälle tunnistamalla kielen kvantitatiiviset ominaisuudet (esimerkiksi sukupuolten lukumäärät, tapaukset) kansallisen mentaliteetin erityispiirteisiin (tästä lisää luvussa 2.2, "Kielitieteen tilastolliset menetelmät").

Matematiikan ja kielitieteen vuorovaikutus on monitahoinen aihe, enkä käsittele työssäni kaikkea, vaan ennen kaikkea sen soveltavia puolia.

Luku I. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1 Rakennekielitieteen muodostuminen XIX - XX vuosisatojen vaihteessa

Kielen matemaattinen kuvaus perustuu ajatukseen kielestä mekanismina, joka juontaa juurensa 1900-luvun alun kuuluisaan sveitsiläiseen kielitieteilijään Ferdinand de Saussureen.

Hänen käsityksensä alkulinkki on teoria kielestä järjestelmänä, joka koostuu kolmesta osasta (kieli itsessään on Kieli, puhe - Salasana, ja puhetoiminta - Kieli), jossa jokaista sanaa (järjestelmän jäsentä) ei pidetä sellaisenaan, vaan muiden jäsenten yhteydessä. Kuten toinen merkittävä kielitieteilijä, tanskalainen Louis Hjelmslev, myöhemmin huomautti, Saussure "oli ensimmäinen, joka vaati rakenteellista lähestymistapaa kieleen, toisin sanoen kielen tieteellistä kuvausta kirjaamalla yksiköiden väliset suhteet".

Saussure, joka ymmärsi kielen hierarkkisena rakenteena, esitti ensimmäisenä ongelman kielellisten yksiköiden arvosta ja merkityksestä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa.

Saussuren kielen rakenneyksikkö piti sanaa "merkki", jossa ääni ja merkitys yhdistettiin. Mikään näistä elementeistä ei ole olemassa ilman toisiaan: siksi äidinkielenään puhuva ymmärtää polysemanttisen sanan merkityksen eri sävyt erillisenä elementtinä rakenteellisessa kokonaisuudessa, kielessä.

Näin ollen F. de Saussuren teoriassa voidaan nähdä kielitieteen vuorovaikutusta toisaalta sosiologian ja sosiaalipsykologian kanssa (on huomattava, että samaan aikaan kehittyvät Husserlin fenomenologia, Freudin psykoanalyysi, Einsteinin suhteellisuusteoria , kirjallisuudessa, musiikissa ja kuvataiteessa tehdään muoto- ja sisältökokeita, toisaalta matematiikan kanssa (konsistenssin käsite vastaa algebrallista kielen käsitettä). Tällainen käsite muutti kielellisen tulkinnan käsitettä sellaisenaan: Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa nykyhetkeen ja tulevaisuuteen. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tietoisia" sanan freudilaisessa merkityksessä).

Kielellisen mekanismin toiminta ilmenee äidinkielenään puhuvien puhetoiminnan kautta. Puheen tuloksena ovat niin sanotut "oikeat tekstit" - puheyksiköiden sekvenssit, jotka noudattavat tiettyjä kaavoja, joista monet mahdollistavat matemaattisen kuvauksen. Syntaktisen rakenteen kuvaustapojen teoria käsittelee oikeiden tekstien (ensisijaisesti lauseiden) matemaattisen kuvauksen menetelmiä. Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Lännessä Saussuren ajatuksia kehittävät suuren sveitsiläisen kielitieteilijän nuoremmat aikalaiset: Tanskassa - jo mainitsemani L. Hjelmslev, joka synnytti teoksessaan "Kieliteorian perusteet" algebrallisen kieliteorian. USA - E. Sapir, L. Bloomfield, C. Harris, Tšekin tasavallassa - venäläinen tiedemies-emigrantti N. Trubetskoy.

Tilastollisia säännönmukaisuuksia kielentutkimuksessa alkoi käsitellä ei kukaan muu kuin genetiikan perustaja Georg Mendel. Vasta vuonna 1968 filologit havaitsivat, että hänen elämänsä viimeisinä vuosina hän kiehtoi kielellisten ilmiöiden tutkimista matematiikan menetelmiä käyttäen. Mendel toi tämän menetelmän kielitieteeseen biologiasta; 1990-luvulla vain rohkeimmat lingvistit ja biologit väittivät tällaisen analyysin toteutettavuuden. Pyhän Pietarin luostarin arkistossa. Brnon Tomaszista, jonka apotti oli Mendel, löydettiin arkkeja, joissa oli sukunimien sarakkeita, jotka päättyivät "mann", "bauer", "mayer", ja joissa oli murto-osia ja laskelmia. Yrittääkseen löytää sukunimien alkuperän muodolliset lait Mendel tekee monimutkaisia ​​laskelmia, joissa hän ottaa huomioon saksan kielen vokaalien ja konsonanttien määrän, harkitsemiensa sanojen kokonaismäärän, sukunimien lukumäärän, jne.

Maamme rakennekielitiede alkoi kehittyä suunnilleen samaan aikaan kuin lännessä - 1800-1900-luvun vaihteessa. Samanaikaisesti F. de Saussuren kanssa Kazanin yliopiston professorit F.F. kehittivät töissään kielen käsitteen järjestelmänä. Fortunatov ja I.A. Baudouin de Courtenay. Jälkimmäinen vastasi pitkään de Saussuren kanssa, vastaavasti Geneven ja Kazanin kielitieteen koulut tekivät yhteistyötä keskenään. Jos Saussurea voidaan kutsua kielitieteen "tarkkojen" menetelmien ideologiksi, niin Baudouin de Courtenay loi käytännön perustan niiden soveltamiselle. Hän oli ensimmäinen, joka erotti kielitieteen (esim tarkka tilastollisia menetelmiä ja toiminnallista riippuvuutta käyttävä tiede) filologiasta (humanitaaristen tieteenalojen yhteisö, joka tutkii henkistä kulttuuria kielen ja puheen kautta). Tiedemies itse uskoi, että "kielitiede voi olla hyödyllistä lähitulevaisuudessa, vain vapautettuna pakollisesta liitosta filologian ja kirjallisuuden historian kanssa". Fonologiasta tuli "koekenttä" matemaattisten menetelmien käyttöönotolle kielitieteeseen - äänet kielijärjestelmän "atomeina", joilla oli rajoitettu määrä helposti mitattavissa olevia ominaisuuksia, olivat kätevintä materiaalia muodollisille, tiukoille kuvausmenetelmille. Fonologia kiistää äänen merkityksen olemassaolon, joten "ihminen" tekijä eliminoitiin tutkimuksissa. Tässä mielessä foneemit ovat kuin fyysisiä tai biologisia esineitä.

Foneemit pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä sfääriä, erillistä "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Tärkeintä on, että foneemi suorittaa päätehtävänsä. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla tai ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Johdanto

Luku 1. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1. Rakennekielitieteen muodostuminen 1800-1900-luvun vaihteessa

1.2. Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1. Konekäännös

2.2.Tilastolliset menetelmät kieltenoppimisessa

2.3. Kielen oppiminen muodollisen logiikan menetelmillä

2.4. Matemaattisten menetelmien soveltamisen mahdollisuudet kielitieteessä

Johtopäätös

Kirjallisuus

Liite 1. Ronald Schleifer. Ferdinand de Saussure

Liite 2. Ferdinand de Saussure (käännös)

Johdanto

1900-luvulla on jatkunut suuntaus eri tiedonalojen vuorovaikutukseen ja tunkeutumiseen. Yksittäisten tieteiden väliset rajat hämärtyvät vähitellen; on yhä enemmän henkisen toiminnan aloja, jotka ovat humanitaarisen, teknisen ja luonnontieteellisen tiedon "risteyksessä".

Toinen nykyaikaisuuden ilmeinen piirre on halu tutkia rakenteita ja niiden osatekijöitä. Siksi matematiikalle annetaan yhä suurempi paikka sekä tieteellisessä teoriassa että käytännössä. Matematiikka tunkeutuu yhä syvemmälle ja syvemmälle niille alueille, joita pidettiin pitkään puhtaina. "humanitaarinen", laajentamalla heidän heuristista potentiaaliaan (vastaus kysymykseen "kuinka paljon" auttaa usein vastaamaan kysymyksiin "mitä" ja "miten"). Kielitiede ei ollut poikkeus.

Kurssityöni tarkoituksena on tuoda lyhyesti esille matematiikan ja sellaisen kielitieteen haaran kuin kielitieteen välinen yhteys. 1950-luvulta lähtien matematiikkaa on käytetty kielitieteessä luomaan teoreettinen laite kielten (sekä luonnollisten että keinotekoisten) rakenteen kuvaamiseen. On kuitenkin sanottava, että se ei heti löytänyt tällaista käytännön sovellusta itselleen. Aluksi kielitieteen matemaattisia menetelmiä alettiin käyttää kielitieteen peruskäsitteiden selkiyttämiseen, mutta tietotekniikan kehittymisen myötä tällainen teoreettinen lähtökohta alkoi löytää käyttöä käytännössä. Sellaisten tehtävien, kuten konekääntämisen, koneellisen tiedonhaun, automaattisen tekstinkäsittelyn, ratkaiseminen vaati täysin uutta lähestymistapaa kieleen. Kielitieteilijät kohtasivat kysymyksen: kuinka oppia esittämään kielellisiä malleja siinä muodossa, jossa niitä voidaan soveltaa suoraan tekniikkaan. Aikamme suosittu termi "matemaattinen kielitiede" viittaa kaikkeen kielitieteelliseen tutkimukseen, jossa käytetään eksakteja menetelmiä (ja eksaktien menetelmien käsite liittyy aina läheisesti matematiikkaan). Jotkut viime vuosien tiedemiehet uskovat, että itse ilmaisua ei voi nostaa termin arvoon, koska se ei tarkoita mitään erityistä "kielitiedettä", vaan vain uutta suuntaa, joka keskittyy kielen tutkimusmenetelmien parantamiseen, tarkkuuden ja luotettavuuden lisäämiseen. . Kielitiede käyttää sekä kvantitatiivisia (algebrallisia) että ei-kvantitatiivisia menetelmiä, mikä tuo sen lähemmäksi matemaattista logiikkaa ja siten myös filosofiaa ja jopa psykologiaa. Jopa Schlegel pani merkille kielen ja tietoisuuden vuorovaikutuksen, ja 1900-luvun alun tunnettu kielitieteilijä Ferdinand de Saussure (kerron hänen vaikutuksestaan ​​kielitieteen matemaattisten menetelmien kehitykseen myöhemmin) yhdisti kielen rakenteen sen kuulumiseen. kansalle. Nykytutkija L. Perlovsky menee pidemmälle tunnistamalla kielen kvantitatiiviset ominaisuudet (esimerkiksi sukupuolten lukumäärät, tapaukset) kansallisen mentaliteetin erityispiirteisiin (tästä lisää luvussa 2.2, "Kielitieteen tilastolliset menetelmät").

Matematiikan ja kielitieteen vuorovaikutus on monitahoinen aihe, enkä käsittele työssäni kaikkea, vaan ennen kaikkea sen soveltavia puolia.

Luku I. Matemaattisten menetelmien soveltamisen historia kielitieteessä

1.1 Rakennekielitieteen muodostuminen XIX - XX vuosisatojen vaihteessa

Kielen matemaattinen kuvaus perustuu ajatukseen kielestä mekanismina, joka juontaa juurensa 1900-luvun alun kuuluisaan sveitsiläiseen kielitieteilijään Ferdinand de Saussureen.

Hänen käsityksensä alkulinkki on teoria kielestä järjestelmänä, joka koostuu kolmesta osasta (kieli itsessään on Kieli, puhe - Salasana, ja puhetoiminta - Kieli), jossa jokaista sanaa (järjestelmän jäsentä) ei pidetä sellaisenaan, vaan muiden jäsenten yhteydessä. Kuten toinen merkittävä kielitieteilijä, tanskalainen Louis Hjelmslev, myöhemmin huomautti, Saussure "oli ensimmäinen, joka vaati rakenteellista lähestymistapaa kieleen, toisin sanoen kielen tieteellistä kuvausta kirjaamalla yksiköiden väliset suhteet".

Saussure, joka ymmärsi kielen hierarkkisena rakenteena, esitti ensimmäisenä ongelman kielellisten yksiköiden arvosta ja merkityksestä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa.

Saussuren kielen rakenneyksikkö piti sanaa "merkki", jossa ääni ja merkitys yhdistettiin. Mikään näistä elementeistä ei ole olemassa ilman toisiaan: siksi äidinkielenään puhuva ymmärtää polysemanttisen sanan merkityksen eri sävyt erillisenä elementtinä rakenteellisessa kokonaisuudessa, kielessä.

Näin ollen F. de Saussuren teoriassa voidaan nähdä kielitieteen vuorovaikutusta toisaalta sosiologian ja sosiaalipsykologian kanssa (on huomattava, että samaan aikaan kehittyvät Husserlin fenomenologia, Freudin psykoanalyysi, Einsteinin suhteellisuusteoria , kirjallisuudessa, musiikissa ja kuvataiteessa tehdään muoto- ja sisältökokeita, toisaalta matematiikan kanssa (systeemisyyden käsite vastaa algebrallista kielen käsitettä). Tällainen käsite muutti kielellisen tulkinnan käsitettä sellaisenaan: Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa nykyhetkeen ja tulevaisuuteen. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tietoisia" sanan freudilaisessa merkityksessä).

Kielellisen mekanismin toiminta ilmenee äidinkielenään puhuvien puhetoiminnan kautta. Puheen tuloksena ovat niin sanotut "oikeat tekstit" - puheyksiköiden sekvenssit, jotka noudattavat tiettyjä kuvioita, joista monet mahdollistavat matemaattisen kuvauksen. Syntaktisen rakenteen kuvaustapojen teoria käsittelee oikeiden tekstien (ensisijaisesti lauseiden) matemaattisen kuvauksen menetelmiä. Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Lännessä Saussuren ajatuksia kehittävät suuren sveitsiläisen kielitieteilijän nuoremmat aikalaiset: Tanskassa - jo mainitsemani L. Hjelmslev, joka synnytti teoksessaan "Kieliteorian perusteet" algebrallisen kieliteorian. USA - E. Sapir, L. Bloomfield, C. Harris, Tšekin tasavallassa - venäläinen emigranttitieteilijä N. Trubetskoy.

Tilastollisia säännönmukaisuuksia kielentutkimuksessa alkoi käsitellä ei kukaan muu kuin genetiikan perustaja Georg Mendel. Vasta vuonna 1968 filologit havaitsivat, että hänen elämänsä viimeisinä vuosina hän kiehtoi kielellisten ilmiöiden tutkimista matematiikan menetelmiä käyttäen. Mendel toi tämän menetelmän kielitieteeseen biologiasta; 1990-luvulla vain rohkeimmat lingvistit ja biologit väittivät tällaisen analyysin toteutettavuuden. Pyhän Pietarin luostarin arkistossa. Brnon Tomaszista, jonka apotti oli Mendel, löydettiin arkkeja, joissa oli sukunimien sarakkeita, jotka päättyivät "mann", "bauer", "mayer", ja joissa oli murto-osia ja laskelmia. Yrittääkseen löytää sukunimien alkuperän muodolliset lait Mendel tekee monimutkaisia ​​laskelmia, joissa hän ottaa huomioon saksan kielen vokaalien ja konsonanttien määrän, harkitsemiensa sanojen kokonaismäärän, sukunimien lukumäärän, jne.

Maamme rakennekielitiede alkoi kehittyä suunnilleen samaan aikaan kuin lännessä - 1800-1900-luvun vaihteessa. Samanaikaisesti F. de Saussuren kanssa Kazanin yliopiston professorit F.F. kehittivät töissään kielen käsitteen järjestelmänä. Fortunatov ja I.A. Baudouin de Courtenay. Jälkimmäinen vastasi pitkään de Saussuren kanssa, vastaavasti Geneven ja Kazanin kielitieteen koulut tekivät yhteistyötä keskenään. Jos Saussurea voidaan kutsua kielitieteen "tarkkojen" menetelmien ideologiksi, niin Baudouin de Courtenay loi käytännön perustan niiden soveltamiselle. Hän oli ensimmäinen, joka erotti kielitieteen (esim tarkka tilastollisia menetelmiä ja toiminnallista riippuvuutta käyttävä tiede) filologiasta (humanitaaristen tieteenalojen yhteisö, joka tutkii henkistä kulttuuria kielen ja puheen kautta). Tiedemies itse uskoi, että "kielitiede voi olla hyödyllistä lähitulevaisuudessa, vain vapautettuna pakollisesta liitosta filologian ja kirjallisuuden historian kanssa". Fonologiasta tuli "koekenttä" matemaattisten menetelmien käyttöönotolle kielitieteeseen - äänet kielijärjestelmän "atomeina", joilla oli rajoitettu määrä helposti mitattavissa olevia ominaisuuksia, olivat kätevintä materiaalia muodollisille, tiukoille kuvausmenetelmille. Fonologia kiistää äänen merkityksen olemassaolon, joten "ihminen" tekijä eliminoitiin tutkimuksissa. Tässä mielessä foneemit ovat kuin fyysisiä tai biologisia esineitä.

Foneemit pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä sfääriä, erillistä "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Tärkeintä on, että foneemi suorittaa päätehtävänsä. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla tai ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Kielen äänet ovat systemaattisesti järjestetty joukko ominaisuuksia. 1920-1930-luvuilla, Saussuren jälkeen, Jacobson ja N.S. Trubetskoy korostivat foneemien "erottuvat piirteet". Nämä ominaisuudet perustuvat puheelinten rakenteeseen - kieli, hampaat, äänihuulet. Esimerkiksi englannin kielessä ero "t":n ja "d":n välillä on "äänen" olemassaolo tai puuttuminen (äänihuulien jännitys) ja äänen taso, joka erottaa yhden foneemin toisesta. Näin ollen fonologiaa voidaan pitää esimerkkinä Saussuren kuvaamasta yleisestä kielisäännöstä: "Kielessä on vain eroja". Vielä tärkeämpää ei ole tämä: ero tarkoittaa yleensä tarkat olosuhteet, joiden välillä se sijaitsee; mutta kielessä on vain eroja ilman tarkkoja ehtoja. Tarkastellaanpa sitten "nimeämistä" tai "merkittyä" - kielessä ei ole käsitteitä eikä ääniä, jotka olisivat olleet olemassa ennen kielijärjestelmän kehitystä.

Näin ollen Saussurean kielitieteessä tutkittu ilmiö ymmärretään kielen vertailujen ja vastakohtien joukkona. Kieli on sekä sanojen merkityksen ilmaus että viestintäväline, eivätkä nämä kaksi toimintoa koskaan kohtaa. Voimme havaita muodon ja sisällön vuorottelua: kielelliset kontrastit määrittelevät sen rakenneyksiköt, ja nämä yksiköt muodostavat vuorovaikutuksessa tietyn merkityksellisen sisällön. Koska kielen elementit ovat satunnaisia, ei kontrasti tai yhdistelmä voi olla perusta. Tämä tarkoittaa, että kielessä tunnusmerkit muodostavat foneettisen kontrastin eri ymmärrystasolla, foneemit yhdistetään morfeemiksi, morfeemit - sanoiksi, sanat - lauseiksi jne. Joka tapauksessa kokonainen foneemi, sana, lause jne. on enemmän kuin vain osiensa summa.

Saussure ehdotti ajatusta uudesta 1900-luvun tieteestä, joka on erillinen kielitieteestä, joka tutkii merkkien roolia yhteiskunnassa. Saussure kutsui tätä tiedettä semiologiaksi (kreikan sanasta "semeîon" - merkki). Semiotiikan "tiede", joka kehittyi Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näiden rakenteiden perusteella muodostetuiksi (tai artikuloiduiksi) kirjallisiksi löydöksiksi. Lisäksi uransa hämärässä, yleisen kielitieteen kurssin ohella, Saussure harjoitti myöhäisroomalaisen runouden "semioottista" analyysiä yrittäen löytää tarkoituksella laadittuja erisnimien anagrammeja. Tämä menetelmä oli monella tapaa rationalismin vastakohta lingvistisessä analyysissään: se oli yritys tutkia järjestelmässä kielen "todennäköisyyden" ongelmaa. Tällainen tutkimus auttaa keskittymään todennäköisyyden "todelliseen puoleen"; "avainsana", jolle Saussure etsii anagrammia, on Jean Starobinskyn mukaan "runoilijan työkalu, ei runon elämän lähde". Runon tarkoitus on vaihtaa avainsanan äänet. Starobinskyn mukaan tässä analyysissä "Saussure ei syvenny piilotettujen merkityksien etsimiseen". Päinvastoin, hänen teoksissaan on havaittavissa halu välttää tietoisuuteen liittyviä kysymyksiä: "koska runous ilmaistaan ​​paitsi sanoissa, myös siinä, mitä nämä sanat synnyttävät, se menee tietoisuuden hallinnan ulkopuolelle ja riippuu vain kielen lait” (katso . Liite 1).

Saussuren yritys tutkia erisnimiä myöhäisroomalaisessa runoudessa korostaa yhtä hänen kielellisen analyysinsä komponenteista - merkkien mielivaltaista luonnetta sekä Saussuren kielitieteen muodollista olemusta, joka sulkee pois mahdollisuuden analysoida merkitystä. Todorov päättelee, että nykyään Saussuren teokset näyttävät olevan erittäin johdonmukaisia ​​haluttomuudessaan tutkia ilmiön symboleja, joilla on selkeä merkitys [Liite 1]. Anagrammeja tutkiessaan Saussure kiinnittää huomiota vain toistoon, mutta ei aikaisempiin vaihtoehtoihin. . . . Nibelungia tutkiessaan hän määrittelee symbolit vain liittääkseen ne virheellisiin lukemiin: jos ne ovat tahattomia, symboleja ei ole olemassa. Loppujen lopuksi hän tekee yleisen kielitieteen kirjoituksissaan oletuksen semiologian olemassaolosta, joka ei kuvaa vain kielellisiä merkkejä; mutta tätä oletusta rajoittaa se tosiasia, että semiologia voi kuvata vain satunnaisia, mielivaltaisia ​​merkkejä.

Jos tämä todella on niin, se johtuu vain siitä, että hän ei voinut kuvitella "aikomusta" ilman esinettä; hän ei kyennyt täysin kuromaan umpeen muodon ja sisällön välistä kuilua - hänen kirjoituksissaan tämä muuttui kysymykseksi. Sen sijaan hän kääntyi "kieliseen legitiimiyteen". Toisaalta 1800-luvun historiaan ja subjektiivisiin olettamuksiin perustuvien käsitteiden ja näihin käsitteisiin perustuvien satunnaisen tulkintamenetelmien ja toisaalta muodon ja sisällön (subjektin ja objektin) vastakohtaisuutta pyyhkivien strukturalististen käsitteiden välillä, merkitys ja alkuperä strukturalismissa, psykoanalyysissä ja jopa kvanttimekaniikassa - Ferdinand de Saussuren kirjoitukset lingvistiikasta ja semiotiikasta merkitsevät käännekohtaa kielen ja kulttuurin merkityksien tutkimuksessa.

Venäläiset tiedemiehet olivat myös edustettuina ensimmäisessä kansainvälisessä kielitieteilijöiden kongressissa Haagissa vuonna 1928. S. Kartsevsky, R. Yakobson ja N. Trubetskoy tekivät raportin, jossa tarkasteltiin kielen hierarkkista rakennetta - viime vuosisadan alun nykyaikaisimpien ideoiden hengessä. Jakobson kehitti kirjoituksissaan Saussuren ajatuksia siitä, että kielen peruselementtejä tulisi tutkia ennen kaikkea niiden toimintojen, ei niiden esiintymisen syiden yhteydessä.

Valitettavasti Stalinin tultua valtaan vuonna 1924 venäläinen kielitiede, kuten monet muutkin tieteet, heitetään takaisin. Monet lahjakkaat tiedemiehet pakotettiin muuttamaan maasta, heidät karkotettiin maasta tai kuoli leireillä. Vasta 1950-luvun puolivälistä lähtien tietty teorioiden moniarvoisuus on tullut mahdolliseksi - tästä lisää luvussa 1.2.

1.2 Matemaattisten menetelmien soveltaminen kielitieteessä 1900-luvun jälkipuoliskolla

1900-luvun puoliväliin mennessä oli muodostunut neljä maailman kielellistä koulukuntaa, joista jokainen osoittautui tietyn "tarkan" menetelmän esi-isäksi. Leningradin fonologinen koulu(sen esi-isä oli Baudouin de Courtenay L.V. Shcherban oppilas) käytti äidinkielenään puhujien puheen analysointiin perustuvaa psykolingvististä koetta pääkriteerinä äänen yleistämiseksi foneemin muodossa.

Tiedemiehet Prahan kielitieteellinen ympyrä, erityisesti - sen perustaja N.S. Venäjältä muuttanut Trubetskoy kehitti oppositioteorian - kielen semanttista rakennetta kuvailivat ryhmänä oppositioon rakennettuja semanttisia yksiköitä - Sem. Tätä teoriaa sovellettiin paitsi kielen, myös taiteellisen kulttuurin tutkimuksessa.

Ideologit Amerikkalainen deskriptivismi olivat kielitieteilijät L. Bloomfield ja E. Sapir. Kieli esitettiin deskriptivisteille joukkona puhelauseita, jotka olivat heidän tutkimuksensa pääkohteena. Heidän painopisteensä oli tekstien tieteellisen kuvauksen (siis nimen) säännöissä: niiden elementtien organisoinnin, järjestelyn ja luokittelun tutkimisessa. Analyyttisten menettelyjen formalisointi fonologian ja morfologian alalla (kielen tutkimisen periaatteiden kehittäminen eri tasoilla, distributiivinen analyysi, suorien ainesosien menetelmä jne.) johti yleisten kielellisen mallinnuksen kysymysten muotoiluun. Välinpitämättömyys kielen sisältösuunnitelmaan ja kielen paradigmaattiseen puoleen ei antanut deskriptivistien tulkita kieltä riittävän täysin järjestelmänä.

1960-luvulla kehittyi muodollisten kielioppien teoria, joka syntyi pääasiassa amerikkalaisen filosofin ja kielitieteilijän N. Chomskyn työn ansiosta. Häntä pidetään oikeutetusti yhtenä kuuluisimmista nykyajan tiedemiehistä ja julkisuuden henkilöistä, hänelle on omistettu monia artikkeleita, monografioita ja jopa täyspitkä dokumentti. Chomskyn keksimän, perustavanlaatuisen uuden tavan kuvailla syntaktista rakennetta - generatiivista (generatiivista) kielioppia - nimitettiin vastaava kielitieteen suuntaus ns. generatiivisuus.

Chomsky, Venäjältä tulleiden maahanmuuttajien jälkeläinen, opiskeli kielitiedettä, matematiikkaa ja filosofiaa Pennsylvanian yliopistossa vuodesta 1945 lähtien vahvasti opettajansa Zelig Harrisin vaikutuksesta – kuten Harris, Chomsky piti ja pitää poliittisia näkemyksiään lähellä anarkismia (hän ​​on edelleen tunnetaan Yhdysvaltain nykyisen poliittisen järjestelmän kriitikkona ja yhtenä antiglobalismin henkisistä johtajista).

Chomskyn ensimmäinen suuri tieteellinen työ, pro gradu -työ "Modernin heprean morfologia » (1951) on jäänyt julkaisematta. Chomsky väitteli tohtoriksi Pennsylvanian yliopistosta vuonna 1955, mutta suuri osa hänen väitöskirjansa (julkaistu kokonaisuudessaan vasta vuonna 1975 otsikolla The Logical Structure of Linguistic Theory) ja hänen ensimmäisen monografiansa Syntactic Structures (1957, Rus. trans. 1962), esitettiin Harvardin yliopistossa vuosina 1951-1955. Samana vuonna 1955 tiedemies muutti Massachusetts Institute of Technologyyn, jossa hänestä tuli professori vuonna 1962.

Chomskyn teoria on käynyt läpi useita kehitysvaiheita.

Ensimmäisessä monografiassa "Syntaktiset rakenteet" tiedemies esitteli kielen mekanismina, jolla luodaan ääretön joukko lauseita käyttämällä rajallista joukkoa kieliopillisia keinoja. Kielellisten ominaisuuksien kuvaamiseksi hän ehdotti käsitteitä syvä (piilotettu suoralta havainnolta ja generoitu rekursiivisten eli toistuvasti sovellettavien sääntöjen) ja pinnan (suoraan havaittujen) kieliopillisten rakenteiden käsitteitä sekä muunnoksia, jotka kuvaavat siirtymää. syvistä rakenteista pintarakenteisiin. Useat pintarakenteet voivat vastata yhtä syvärakennetta (esimerkiksi passiivirakennetta Asetuksen allekirjoittaa presidentti johdettu samasta syvärakenteesta kuin aktiivinen konstruktio Presidentti allekirjoittaa asetuksen) ja päinvastoin (siis epäselvyys äiti rakastaa tytärtään kuvataan kahden eri syvän pintarakenteiden yhteensattuman tuloksena, joista toisessa äiti on se, joka rakastaa tytärtä, ja toisessa se, jota tytär rakastaa).

Chomskyn standarditeoriaa pidetään "Aspects"-mallina, joka on esitetty Chomskyn kirjassa "Aspects of the Theory of Syntax". Tässä mallissa ensimmäistä kertaa muodolliseen teoriaan otettiin käyttöön semanttisen tulkinnan säännöt, jotka antavat merkityksen syville rakenteille. Aspektissa kielellinen kompetenssi vastustetaan kielen käyttöä (suorituskykyä), omaksutaan ns. Katz-Postal-hypoteesi merkityksen säilymisestä muunnoksen aikana, jonka yhteydessä valinnaisen muunnoksen käsite suljetaan pois, ja laitteisto Leksikaalista yhteensopivuutta kuvaavat syntaktiset ominaisuudet otetaan käyttöön.

1970-luvulla Chomsky työskenteli ohjauksen ja sitomisen teorian parissa (GB-teoria - sanoista hallitus ja sitova) on yleisempi kuin edellinen. Siinä tiedemies hylkäsi erityiset säännöt, jotka kuvaavat tiettyjen kielten syntaktisia rakenteita. Kaikki muunnokset on korvattu yhdellä universaalilla siirtomuunnolla. GB-teorian puitteissa on myös yksityisiä moduuleja, joista jokainen vastaa omasta kielioppinsa osasta.

Jo äskettäin, vuonna 1995, Chomsky esitti minimalistisen ohjelman, jossa ihmisen kieltä kuvataan konekielenä. Tämä on vain ohjelma – ei malli tai teoria. Siinä Chomsky tunnistaa kaksi ihmisen kielilaitteen pääosajärjestelmää: sanaston ja laskentajärjestelmän sekä kaksi rajapintaa - foneettisen ja loogisen.

Chomskyn muodollisista kieliopeista on tullut klassisia paitsi luonnollisten, myös keinotekoisten kielten - erityisesti ohjelmointikielten - kuvaamiseen. Rakennekielitieteen kehitystä 1900-luvun jälkipuoliskolla voidaan perustellusti pitää "chomskilaisena vallankumouksena".

Moskovan fonologinen koulu, jonka edustajat olivat A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov käytti samanlaista teoriaa fonetiikan tutkimiseen. Pikkuhiljaa "tarkkoja" menetelmiä aletaan soveltaa paitsi fonetiikassa myös syntaksissa. Sekä kielitieteilijät että matemaatikot, niin kotimaassa kuin ulkomaillakin, alkavat tutkia kielen rakennetta. 1950- ja 60-luvuilla Neuvostoliitossa alkoi uusi vaihe matematiikan ja kielitieteen vuorovaikutuksessa, joka liittyi konekäännösjärjestelmien kehittämiseen.

Sysäyksenä näiden töiden aloittamiselle maassamme oli ensimmäinen kehitys konekäännösalalla Yhdysvalloissa (vaikka P. P. Smirnov-Troyanskyn ensimmäinen mekaaninen käännöslaite keksittiin Neuvostoliitossa vuonna 1933, koska se oli primitiivistä, ei yleistynyt). Vuonna 1947 A. Butt ja D. Britten keksivät koodin sana kerrallaan kääntämiseen tietokoneella, ja vuotta myöhemmin R. Richens ehdotti sääntöä sanojen jakamisesta varsiksi ja päätteiksi konekäännöksissä. Ne vuodet olivat aivan erilaisia ​​kuin nykyään. Nämä olivat erittäin suuria ja kalliita koneita, jotka veivät kokonaisia ​​huoneita ja vaativat suuren henkilöstön insinöörejä, käyttäjiä ja ohjelmoijia ylläpitämään niitä. Pohjimmiltaan näitä tietokoneita käytettiin matemaattisten laskelmien suorittamiseen sotilaslaitosten tarpeisiin - matematiikassa, fysiikassa ja tekniikassa uusi palveli ennen kaikkea sotilasasioita. MP:n kehitystä tuki alkuvaiheessa aktiivisesti armeija, kun taas (kylmän sodan olosuhteissa) venäläis-englannin suunta kehittyi USA:ssa ja anglo-venäläinen suunta Neuvostoliitossa.

Tammikuussa 1954 "Georgetown Experiment" tapahtui Massachusettsin teknisessä yliopistossa - ensimmäinen julkinen esittely käännöksestä venäjän kielestä englanniksi IBM-701-koneella. Tiivistelmä viestistä kokeen onnistumisesta, laati D.Yu. Panov, ilmestyi RJ "Mathematics", 1954, nro 10: "Käännös kielestä toiseen koneella: raportti ensimmäisestä onnistuneesta testistä."

D. Yu. Panov (tuohon aikaan tieteellisen tiedon instituutin - INI, myöhemmin VINITI - johtaja) houkutteli I. K. Belskajan, joka johti myöhemmin konekäännösryhmää Neuvostoliiton tiedeakatemian tarkan matematiikan ja tietokonetekniikan instituutissa. konekäännöstyötä. Vuoden 1955 lopussa ensimmäinen kokemus kääntämisestä englannista venäjäksi BESM-koneen avulla juontaa juurensa. BESM:n ohjelmat on koonnut N.P. Trifonov ja L.N. Korolev, jonka väitöskirja oli omistettu konekäännössanakirjojen rakentamismenetelmille.

Samanaikaisesti konekäännöstyötä tehtiin Neuvostoliiton tiedeakatemian matemaattisen instituutin soveltavan matematiikan osastolla (nykyinen Venäjän tiedeakatemian M.V. Keldyshin soveltavan matematiikan instituutti). Matemaatikko A.A. Ljapunov. Hän osallistui O.S. Kulagin ja hänen oppilaansa T.D. Wentzel ja N.N. Ricco. Ljapunovin ja Kulaginan ajatukset mahdollisuudesta käyttää teknologiaa kääntämään kielestä toiseen julkaistiin Nature-lehdessä, 1955, nro 8. Vuoden 1955 lopusta lähtien T.N. Moloshnaya, joka aloitti sitten itsenäisen työn englannin-venäläisen käännösalgoritmin parissa.

R. Frumkina, joka tuolloin harjoitti espanjan kielen käännösalgoritmia, muistelee, että työn tässä vaiheessa oli vaikea ottaa johdonmukaisia ​​askeleita. Paljon useammin minun piti seurata heuristista kokemusta - omaa tai kollegoideni.

Ensimmäisen sukupolven konekäännösjärjestelmät olivat kuitenkin erittäin epätäydellisiä. Ne kaikki perustuivat peräkkäisiin käännösalgoritmeihin "sana sanalta", "lause fraasilta" - sanojen ja lauseiden välisiä semanttisia yhteyksiä ei otettu millään tavalla huomioon. Esimerkiksi lauseet ovat: John etsi lelulaatikkoaan.Lopulta hän löysi sen. Laatikko oli kynässä.John oli hyvin onnellinen. (John etsi lelulaatikkoaan. Lopulta hän löysi sen. Laatikko oli leikkikehässä. John oli hyvin iloinen.)” "Kynä" ei ole tässä yhteydessä "kynä" (kirjoitustyökalu), vaan "leikkikehä" ( leikkikehä). Synonyymien, antonyymien ja kuvaannollisten merkityksien tuntemus on vaikea syöttää tietokoneeseen. Lupaava suunta oli ihmiskääntäjän käyttöön keskittyneiden tietokonejärjestelmien kehittäminen.

Ajan myötä suorat käännösjärjestelmät korvattiin T-järjestelmillä (englannin sanasta "siirto" - muunnos), joissa käännös suoritettiin syntaktisten rakenteiden tasolla. T-järjestelmien algoritmit käyttivät mekanismia, joka mahdollisti syntaktisen rakenteen rakentamisen syöttölauseen kielen kielioppisääntöjen mukaan (samalla tavalla kuin lukiossa opetetaan vierasta kieltä) ja sitten syntetisoi ulostulolause. muuttamalla syntaktista rakennetta ja korvaamalla tarvittavat sanat sanakirjasta.

Ljapunov puhui kääntämisestä poimimalla käännetyn tekstin merkityksen ja esittämällä sen toisella kielellä. Täydellisimpana pidetään edelleen lähestymistapaa konekäännösjärjestelmien rakentamiseen, joka perustuu syöttölauseen semanttisen esityksen saamiseen semanttisella analyysillä ja syöttölauseen syntetisoinnilla saadun semanttisen esityksen mukaisesti. Tällaisia ​​järjestelmiä kutsutaan I-järjestelmiksi (sanasta "interlingua"). Niiden luomistehtävää, joka ajoittui 50-luvun lopulle ja 60-luvun alkupuolelle, ei kuitenkaan ole toistaiseksi täysin ratkaistu, huolimatta kansainvälisen IFIP-liiton - tiedonkäsittelyn alan tiedeyhteisön - ponnisteluista.

Tutkijat miettivät, kuinka formalisoida ja rakentaa algoritmeja tekstien kanssa työskentelyyn, mitä sanakirjoja koneeseen tulisi syöttää, mitä kielellisiä malleja tulisi käyttää konekäännöksissä. Perinteisellä kielitieteellä ei ollut tällaisia ​​ideoita - ei vain semantiikan, vaan myös syntaksin suhteen. Tuolloin minkään kielen syntaktisista rakenteista ei ollut luetteloita, niiden yhteensopivuuden ja vaihdettavuuden ehtoja ei tutkittu, sääntöjä suurten syntaktisen rakenteen yksiköiden rakentamiselle pienemmistä osaelementeistä ei kehitetty.

Tarve luoda konekääntämisen teoreettinen perusta johti matemaattisen kielitieteen muodostumiseen ja kehittymiseen. Johtava rooli tässä asiassa Neuvostoliitossa oli matemaatikoilla A.A. Ljapunov, O.S. Kulagina, V.A. Uspensky, kielitieteilijät V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginan väitöskirja oli omistettu kielioppien muodollisen teorian tutkimukselle (samanaikaisesti N. Khomskyn kanssa USA:ssa), Kuznetsov esitti kielitieteen aksiomatisoinnin tehtäväksi, joka juontaa juurensa F. F.:n töihin. Fortunatov.

6. toukokuuta 1960 hyväksyttiin Neuvostoliiton tiedeakatemian puheenjohtajiston asetus "Kielen tutkimuksen rakenteellisten ja matemaattisten menetelmien kehittämisestä", ja vastaavat jaostot perustettiin kielitieteen instituuttiin ja instituuttiin. venäjän kieli. Vuodesta 1960 lähtien maan johtavat humanitaariset yliopistot - Moskovan valtionyliopiston filologinen tiedekunta, Leninrad, Novosibirskin yliopistot, Moskovan valtion vieraiden kielten instituutti - alkoivat kouluttaa henkilöstöä automaattisen tekstinkäsittelyn alalla.

Tämän ajanjakson "klassisiksi" kutsutut konekäännöstyöt kiinnostavat kuitenkin enemmän teoreettista kuin käytännöllistä. Kustannustehokkaita konekäännösjärjestelmiä alettiin luoda vasta viime vuosisadan 80-luvulla. Puhun tästä myöhemmin osiossa 2.1, Konekäännös.

1960-70-luvuilla on syvällistä teoreettista kehitystä käyttäen joukkoteorian ja matemaattisen logiikan menetelmiä, kuten kenttäteoriaa ja sumea joukkoteoria.

Kielitieteen kenttäteorian kirjoittaja oli Neuvostoliiton runoilija, kääntäjä ja kielitieteilijä V.G. Admoni. Hän kehitti teoriansa alun perin saksan kielen pohjalta. Admonin kohdalla käsite "kenttä" tarkoittaa mielivaltaista ei-tyhjää kielellisten elementtien joukkoa (esimerkiksi "leksikaalinen kenttä", "semanttinen kenttä").

Kentän rakenne on heterogeeninen: se koostuu ytimestä, jonka elementeillä on täydellinen joukko joukon määritteleviä ominaisuuksia, ja reunasta, jonka elementeillä voi olla sekä tietyn joukon ominaisuuksia (ei kaikkia) ja naapurit. Annan esimerkin, joka havainnollistaa tätä lausuntoa: esimerkiksi englannin kielessä yhdistelmäsanojen kenttä ("day-dream" - "dream" on vaikea erottaa lausekentästä ("tear gas" - "tear gas") .

Jo edellä mainittu sumeiden joukkojen teoria liittyy läheisesti kenttäteoriaan. Neuvostoliitossa kielitieteilijät V.G. Admoni, I.P. Ivanova, G.G. Pochentsov sen esi-isä oli kuitenkin amerikkalainen matemaatikko L. Zadeh, joka julkaisi vuonna 1965 artikkelin "Fuzzy Logic". Antaessaan matemaattisen perustelun sumeiden joukkojen teorialle Zade käsitteli niitä kielellisen materiaalin perusteella.

Tässä teoriassa ei puhuta niinkään elementtien kuulumisesta tiettyyn joukkoon (АОа), vaan tämän jäsenyyden asteesta (mАОа), koska reunaelementit voivat kuulua useaan kenttään tavalla tai toisella. Zade (Lofti-zade) oli kotoisin Azerbaidžanista, 12-vuotiaaksi asti hänellä oli käytäntö kommunikoida neljällä kielellä - azerbaidžanilla, venäjällä, englanniksi ja persiaksi - ja hän käytti kolmea eri aakkoset: kyrillinen, latina, arabia. Kun tiedemieheltä kysytään, mikä on yhteistä sumeiden joukkojen teorian ja kielitieteen välillä, hän ei kiellä tätä yhteyttä, mutta selventää: ”En ole varma, että näiden kielten tutkimisella olisi ollut suuri vaikutus ajatteluuni. Jos näin oli, niin vain alitajuisesti. Nuoruudessaan Zadeh opiskeli presbyteerikoulussa Teheranissa, ja toisen maailmansodan jälkeen hän muutti Yhdysvaltoihin. "Kysymys ei ole siitä, olenko amerikkalainen, venäläinen, azerbaidžanilainen vai joku muu", hän sanoi eräässä keskustelussa. "Minua ovat muokanneet kaikki nämä kulttuurit ja kansat ja viihdyn heidän keskellään. Näissä sanoissa on jotain samanlaista kuin sumeiden joukkojen teorialle - poikkeaminen yksiselitteisistä määritelmistä ja terävistä kategorioista.

Maassamme 70-luvulla käännettiin ja tutkittiin 1900-luvun länsimaisten kielitieteilijöiden teoksia. I.A. Melchuk käänsi N. Chomskyn teokset venäjäksi. PÄÄLLÄ. Slyusareva kirjassaan "F. de Saussuren teoria modernin kielitieteen valossa" yhdistää Saussuren opetuksen postulaatit 70-luvun varsinaisiin kielitieteen ongelmiin. Kielitieteen matematisointia on edelleen taipumus. Johtavat kotimaiset yliopistot kouluttavat henkilöstöä erikoisalalla "Matemaattinen (teoreettinen, soveltava) kielitiede". Samaan aikaan lännessä tietotekniikan kehityksessä tapahtuu jyrkkä harppaus, joka vaatii yhä enemmän uusia kielellisiä perusteita.

1980-luvulla tiedeakatemian itämaisen tutkimuksen instituutin professori Yu.K. Lekomtsev, joka analysoi kielitieteen kieltä analysoimalla kaavioita, taulukoita ja muita kielellisissä kuvauksissa käytettyjä merkintöjä, pitää matemaattisia järjestelmiä sopivina näihin tarkoituksiin (pääasiassa matriisialgebran järjestelmiä).

Niinpä koko 1900-luvun ajan eksakti- ja humanistiset tieteet lähentyivät. Matematiikan ja kielitieteen vuorovaikutus löysi yhä enemmän käytännön sovelluksia. Tästä lisää seuraavassa luvussa.

Luku 2. Esimerkkejä matematiikan käytöstä kielitieteessä

2.1 Konekäännös

Ajatus kääntää kielestä toiseen yleismaailmallisen mekanismin avulla syntyi useita vuosisatoja ennen tämän alueen ensimmäisen kehityksen alkamista - jo vuonna 1649 Rene Descartes ehdotti ajatusta kielestä, jossa vastaavat ajatukset eri kieliä ilmaistaisiin yhdellä symbolilla. Ensimmäiset yritykset toteuttaa tämä ajatus 1930-40-luvuilla, teoreettisen kehityksen alku vuosisadan puolivälissä, käännösjärjestelmien parantaminen tekniikan avulla 1970-80-luvuilla, käännöstekniikan nopea kehitys viime vuosina. vuosikymmen - nämä ovat konekääntämisen alan kehitysvaiheita. Konekäännöstöistä johtuen tietokonelingvistiikka tieteenä on kasvanut.

Tietotekniikan kehittyessä 70-luvun lopulla ja 80-luvun alussa tutkijat asettivat itselleen realistisempia ja kustannustehokkaampia tavoitteita - koneesta ei tullut kilpailijaa (kuten aiemmin oletettiin), vaan ihmiskääntäjän apulainen. Konekäännös lakkaa palvelemasta yksinomaan sotilaallisia tehtäviä (kaikki Neuvostoliiton ja Amerikan keksinnöt ja tutkimus, jotka keskittyivät ensisijaisesti venäjäksi ja englanniksi, vaikuttivat tavalla tai toisella kylmään sotaan). Vuonna 1978 luonnollisen kielen sanat välitettiin Arpa-verkon kautta, ja kuusi vuotta myöhemmin ensimmäiset mikrotietokonekäännösohjelmat ilmestyivät Yhdysvaltoihin.

Euroopan yhteisöjen komissio ostaa 1970-luvulla Systran-tietokonekääntäjän englannin-ranskan version, tilaamalla myös ranskan-englannin ja italia-englannin versiot sekä Yhdysvaltain puolustusvoimien venäjästä englantiin käännösjärjestelmän. Näin luotiin EUROTRA-hankkeen perusta.

Konekäännösten elpymisestä 70-80-luvulla. seuraavat tosiasiat todistavat: Euroopan yhteisöjen komissio (CEC) ostaa Systranin englannin-ranskalaisen version sekä käännösjärjestelmän venäjän kielestä englanniksi (jälkimmäinen kehitettiin ALPAC-raportin jälkeen ja jota edelleen käyttää US Air Force ja NASA); lisäksi CEC tilaa ranska-englannin ja italia-englannin versioiden kehittämisen. Samanaikaisesti konekäännöstoiminta laajenee nopeasti Japanissa; Yhdysvalloissa Pan American Health Organization (PAHO) määrää espanjalais-englantilaisen suunnan (SPANAM-järjestelmä) kehittämisen; Yhdysvaltain ilmavoimat rahoittavat konekäännösjärjestelmän kehittämistä Teksasin yliopiston lingvistisessä tutkimuskeskuksessa Austinissa; Kanadalainen TAUM-ryhmä edistyy huomattavasti METEO-järjestelmän (meteorological translation) kehittämisessä. Useita projekteja aloitettiin 70- ja 80-luvuilla. kehittyi sittemmin täysimittaisiksi kaupallisiksi järjestelmiksi.

Vuosina 1978-1993 konekäännösalan tutkimukseen käytettiin Yhdysvalloissa 20 miljoonaa dollaria, Euroopassa 70 miljoonaa ja Japanissa 200 miljoonaa dollaria.

Yksi uusista kehityssuunnista on TM (käännösmuisti) -tekniikka, joka toimii akkumulaatioperiaatteella: käännösprosessin aikana alkuperäinen segmentti (lause) ja sen käännös tallennetaan, jolloin muodostuu kielellinen tietokanta; Jos äskettäin käännetystä tekstistä löytyy identtinen tai samankaltainen segmentti, se näytetään käännöksen ja osuvuuden prosenttiosuuden kanssa. Tämän jälkeen kääntäjä tekee päätöksen (muokata, hylätä tai hyväksyä käännös), jonka tulos tallennetaan järjestelmään, joten samaa lausetta ei tarvitse kääntää kahdesti. TRADOS-järjestelmä (perustettu 1984) kehittää tällä hetkellä hyvin tunnettua kaupallista TM-teknologiaan perustuvaa järjestelmää.

Tällä hetkellä useat kymmenet yritykset kehittävät kaupallisia konekäännösjärjestelmiä, mukaan lukien: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Ohjelmistot; Linguistica b.v. ja muut Nyt voit käyttää automaattisten kääntäjien palveluita suoraan Webissä: alphaWorks; PROMT:n online-kääntäjä, LogoMedia.net, AltaVistan Babel Fish -käännöspalvelu; InfiniT.com; Internetin kääntäminen.

Kaupallisesti tehokkaat käännösjärjestelmät ilmestyivät 80-luvun jälkipuoliskolla myös maahan. Konekäännösten käsite on laajentunut (se alkoi sisältää "lukuisten automaattisten ja automatisoitujen järjestelmien ja laitteiden luomisen, jotka automaattisesti tai puoliautomaattisesti suorittavat koko käännössyklin tai yksittäisiä tehtäviä vuoropuhelussa henkilön kanssa") ja valtion määrärahat alan kehittämiseen ovat kasvaneet.

Venäjä, englanti, saksa, ranska ja japani tulivat kotimaisten käännösjärjestelmien pääkieliksi. All-Union Translation Center (VTsP) kehitti järjestelmän englannista ja saksasta venäjäksi kääntämiseen tietokoneella ES-1035-ANRAP. Se koostui kolmesta sanakirjasta - englannin ja saksan syöttö sekä venäjän kieli - yhden ohjelmiston alla. Siellä oli useita vaihdettavia erikoissanakirjoja - tietotekniikkaa, ohjelmointia, radioelektroniikkaa, koneenrakennusta, maataloutta, metallurgiaa varten. Järjestelmä voisi toimia kahdessa tilassa - automaattinen ja interaktiivinen, jolloin näytöllä näkyi lähdeteksti ja käännös lausekohtaisesti, jota henkilö voi muokata. Tekstin kääntämisen nopeus ANRAP-muotoon (kirjoituksen alusta tulostuksen loppuun) oli noin 100 sivua tunnissa.

Vuonna 1989 luotiin SPRINT-tyyppisten kaupallisten kääntäjien perhe, joka työskenteli venäjän, englannin, saksan ja japanin kanssa. Niiden tärkein etu oli niiden yhteensopivuus IBM PC:n kanssa - siten kotimaiset konekäännösjärjestelmät saavuttivat kansainvälisen laatutason. Samaan aikaan kehitetään konekäännösjärjestelmää ranskasta venäjäksi FRAP, joka sisältää 4 tekstianalyysin vaihetta: grafemaattinen, morfologinen, syntaktinen ja semanttinen. LGPI:ssä niitä. Herzen, työskentely oli käynnissä nelikielisellä (englanti, ranska, espanja, venäjä) SILOD-MP-järjestelmällä (englannin-venäläisiä ja ranska-venäläisiä sanakirjoja käytettiin teollisessa tilassa.

Sähkötekniikan tekstien erikoiskäännöksiä varten oli olemassa ETAP-2-järjestelmä. Siinä syötetyn tekstin analyysi suoritettiin kahdella tasolla - morfologisella ja syntaktisella tasolla. ETAP-2-sanakirja sisälsi noin 4 tuhatta sanaa; tekstin muunnosvaihe - noin 1000 sääntöä (96 yleistä, 342 yksityistä, loput ovat sanakirjoja). Kaikki tämä varmisti käännösten tyydyttävän laadun (esim. patentin nimi "Optinen vaiheverkkojärjestely ja kytkentälaite, jolla on tällainen järjestely" käännettiin "Optinen vaiheverkkolaite ja liitoslaite, jossa on tällainen laite" - huolimatta tautologia, merkitys säilyy).

Minskin vieraiden kielten pedagogisessa instituutissa englannin-venäläisen sanamuotojen ja ilmaisujen sanakirjan perusteella keksittiin järjestelmä nimikkeiden konekääntämiseksi, Tiedeakatemian itämaisen tutkimuksen instituutissa - käännösjärjestelmä. japanista venäjäksi. Ensimmäinen automaattinen laskennan ja ohjelmoinnin sanasto- ja terminologiapalvelu (SLOTHERM), joka on luotu Moskovan automaatiojärjestelmien tutkimuslaitoksessa, sisälsi noin 20 000 termiä selittävässä sanakirjassa ja kielitutkimuksen erikoissanakirjoissa.

Konekäännösjärjestelmiä alettiin vähitellen käyttää paitsi aiottuun tarkoitukseen, myös tärkeänä osana automaattisia oppimisjärjestelmiä (käännösten opettamiseen, oikeinkirjoituksen ja kielioppitietojen tarkistamiseen).

90-luku toi mukanaan PC-markkinoiden (pöytäkoneista taskuihin) ja tietotekniikan nopean kehityksen, Internetin (josta on tulossa kansainvälisempi ja monikielisempi) laajan käytön. Kaikki tämä teki automatisoitujen käännösjärjestelmien jatkokehityksestä kysyntää. 1990-luvun alusta lähtien Myös kotimaiset kehittäjät ovat tulossa PC-järjestelmien markkinoille.

Moskovassa PC Forumissa esiteltiin ensimmäinen kaupallinen konekäännösjärjestelmä Venäjällä PROMT (PROgrammer's Machine Translation) heinäkuussa 1990. PROMT voitti NASAn MP-järjestelmien toimittamisen tarjouskilpailun (PROMT oli tässä ainoa ei-amerikkalainen yritys). Vuonna 1992 PROMT julkaisi koko järjestelmän uudella nimellä STYLUS käännösten englannista, saksasta, ranskasta, italiasta ja espanjasta venäjäksi ja venäjästä englanniksi, ja maailman ensimmäinen konekäännösjärjestelmä Windowsille luotiin Vuonna 1994 STYLUS 2.0 julkaistiin Windows 3.X/95/NT:lle ja vuosina 1995-1996 konekäännösjärjestelmien kolmas sukupolvi, täysin 32-bittinen STYLUS 3.0 Windows 95/NT:lle. täysin uusien, maailman ensimmäisten venäjä-saksa- ja venäjä-ranska-konekäännösjärjestelmien kehitys saatiin onnistuneesti päätökseen.

Vuonna 1997 allekirjoitettiin sopimus ranskalaisen Softissimo-yhtiön kanssa käännösjärjestelmien luomisesta ranskasta saksaksi ja englanniksi ja päinvastoin, ja tämän vuoden joulukuussa julkaistiin maailman ensimmäinen saksalais-ranskalainen käännösjärjestelmä. Samana vuonna PROMT-yhtiö julkaisi Gigant-teknologialla toteutetun järjestelmän, joka tukee useita kielisuuntia yhdessä kuoressa, sekä erityisen kääntäjän Internet-WebTranSite-työskentelyä varten.

Vuonna 1998 julkaistiin koko joukko ohjelmia uudella nimellä PROMT 98. Vuotta myöhemmin PROMT julkaisi kaksi uutta tuotetta: ainutlaatuisen ohjelmistopaketin Internet-työskentelyyn - PROMT Internet ja kääntäjän yritysten sähköpostijärjestelmiin - PROMT Mail Kääntäjä. Marraskuussa 1999 PROMT tunnustettiin parhaaksi ranskalaisen PC Expert -lehden testaamaksi konekäännösjärjestelmäksi, joka ylitti kilpailijansa 30 prosentilla. Yritysasiakkaille on kehitetty myös erikoispalvelinratkaisuja - yrityskäännöspalvelin PROMT Translation Server (PTS) ja Internet-ratkaisu PROMT Internet Translation Server (PITS). Vuonna 2000 PROMT päivitti koko ohjelmistotuotevalikoimansa julkaisemalla uuden sukupolven MT-järjestelmiä: PROMT Translation Office 2000, PROMT Internet 2000 ja Magic Gooddy 2000.

PROMT-järjestelmän tuella tehtyä online-käännöstä käytetään useilla kotimaisilla ja ulkomaisilla sivustoilla: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos jne. sekä eri profiilien laitoksissa yritysasiakirjojen kääntämiseen, artikkeleita ja kirjeitä (Outlook Expressiin ja muihin sähköpostiohjelmiin on rakennettu suoraan käännösjärjestelmiä).

Nykyään syntyy uusia konekäännöstekniikoita, jotka perustuvat tekoälyjärjestelmien ja tilastollisten menetelmien käyttöön. Tietoja jälkimmäisestä - seuraavassa osiossa.

2.2 Tilastolliset menetelmät kieltenoppimisessa

Kielellisten ilmiöiden tutkimiseen kvantitatiivisen matematiikan menetelmiä käyttäen kiinnitetään nykyaikaisessa kielitieteessä huomattavaa huomiota. Kvantitatiivinen data auttaa usein ymmärtämään tarkemmin tutkittavia ilmiöitä, niiden paikkaa ja roolia niihin liittyvien ilmiöiden järjestelmässä. Vastaus kysymykseen "kuinka paljon" auttaa vastaamaan kysymyksiin "mitä", "miten", "miksi" - sellainen on kvantitatiivisen ominaisuuden heuristinen potentiaali.

Tilastollisilla menetelmillä on merkittävä rooli konekäännösjärjestelmien kehittämisessä (ks. kohta 2.1). Tilastollisessa lähestymistavassa käännösongelmaa tarkastellaan kohinaisen kanavan kannalta. Kuvittele, että meidän on käännettävä lause englannista venäjäksi. Meluisen kanavan periaate tarjoaa meille seuraavan selityksen englannin ja venäjän lauseen suhteesta: englanninkielinen lause ei ole mitään muuta kuin jonkinlaisen kohinan vääristynyt venäläinen lause. Alkuperäisen venäläisen lauseen palauttamiseksi meidän on tiedettävä, mitä ihmiset yleensä sanovat venäjäksi ja kuinka venäläiset lauseet vääristyvät englanniksi. Käännös suoritetaan etsimällä sellaista venäjänkielistä lausetta, joka maksimoi venäjänkielisen lauseen ehdottoman todennäköisyyden ja englanninkielisen lauseen (alkuperäisen) todennäköisyyden tulot annetulla venäläisellä lauseella. Bayesin lauseen mukaan tämä venäjänkielinen lause on todennäköisin englanninkielinen käännös:

jossa e on käännöslause ja f on alkuperäinen lause

Tarvitsemme siis lähdemallin ja kanavamallin tai kielimallin ja käännösmallin. Kielimallin on annettava todennäköisyyspisteet mille tahansa kohdekielelle (tässä tapauksessa venäjälle) olevalle lauseelle ja käännösmalli alkuperäiselle lauseelle. (katso taulukko 1)

Yleensä konekäännösjärjestelmä toimii kahdessa tilassa:

1. Järjestelmäharjoittelu: otetaan rinnakkaisten tekstien koulutuskorpus ja lineaarista ohjelmointia käyttäen etsitään sellaisia ​​käännösvastaavuustaulukoiden arvoja, jotka maksimoivat (esimerkiksi) korpuksen venäjän osan todennäköisyyden käytettävissä olevan englannin kielen kanssa. valittuun käännösmalliin. Venäjän kielen malli on rakennettu saman korpusuksen venäjän puolelle.

2. Hyödyntäminen: tuntemattomasta englanninkielisestä lauseesta saatujen tietojen perusteella etsitään venäjää, joka maksimoi kielimallin ja käännösmallin määräämien todennäköisyyksien tulon. Tällaiseen hakuun käytettyä ohjelmaa kutsutaan dekooderiksi.

Yksinkertaisin tilastollinen käännösmalli on kirjaimellinen käännösmalli. Tämä malli olettaa, että lauseen kääntämiseksi kielestä toiselle riittää, että kaikki sanat käännetään (luoda "sanapussi"), ja malli tarjoaa niiden sijoittelun oikeaan järjestykseen. a, f | e) P(a | e , f), ts. tietyn tasauksen todennäköisyydet lauseparilla, jokainen todennäköisyys P(a, f | e) normalisoidaan tietyn lauseparin kaikkien tasausten todennäköisyyksien summalla:

Viterbi-algoritmin toteutus mallin #1 harjoittamiseen on seuraava:

1. Koko käännösvastaavuuden todennäköisyystaulukko on täytetty samoilla arvoilla.

2. Kaikille mahdollisille sanojen pariyhteyksien muunnelmille lasketaan todennäköisyys P(a, f | e):

3. P(a, f | e) arvot normalisoidaan P(a | e, f) arvojen saamiseksi.

4. Lasketaan kunkin käännösparin taajuus painotettuna kunkin kohdistusvaihtoehdon todennäköisyydellä.

5. Tuloksena saadut painotetut taajuudet normalisoidaan ja muodostavat uuden käännösvastaavuustodennäköisyyksien taulukon

6. Algoritmi toistetaan vaiheesta 2 alkaen.

Tarkastellaan esimerkkinä samanlaisen mallin harjoittelua kahden lauseparin rungossa (kuva 2):

Valkoinen talo

  • Talo/talo

Suuren iteraatiomäärän jälkeen saamme taulukon (Taulukko 2), joka osoittaa, että käännös on suoritettu suurella tarkkuudella.

Myös tilastollisia menetelmiä käytetään laajasti sanaston, morfologian, syntaksin ja tyylin tutkimuksessa. Permin osavaltion yliopiston tutkijat suorittivat tutkimuksen, joka perustui väitteeseen, että stereotyyppiset lauseet ovat tärkeä tekstin "rakennusmateriaali". Nämä lauseet koostuvat "ydin" toistuvista sanoista ja riippuvaisista sanamäärittelijöistä ja niillä on selkeä tyylillinen väritys.

Tieteellisessä tyylissä "ydin" sanoja voidaan kutsua: tutkimus, tutkimus, tehtävä, ongelma, kysymys, ilmiö, tosiasia, havainto, analyysi jne. Journalismissa muut sanat ovat "ydin", joilla on lisääntynyt arvo erityisesti sanomalehden tekstille: aika, henkilö, voima, liiketoiminta, toiminta, laki, elämä, historia, paikka jne. (yhteensä 29)

Kielitieteilijöitä kiinnostaa erityisesti myös kansalliskielen ammatillinen erottuminen, sanaston ja kieliopin käytön omaperäisyys ammattityypistä riippuen. Tiedetään, että ammatillisessa puheessa kuljettajat käyttävät muotoa w noin fer, lääkärit sanovat k noin klubi cocktailin sijaan Yu sh - tällaisia ​​esimerkkejä voidaan antaa. Tilastojen tehtävänä on seurata ääntämisen vaihtelua ja kielinormin muutosta.

Ammatilliset erot johtavat eroihin paitsi kieliopillisiin, myös leksillisiin eroihin. Yakut State University on nimetty M.K. Ammosov, 50 kyselylomaketta analysoitiin yleisimmillä reaktioilla tiettyihin sanoihin lääkäreiden ja rakentajien keskuudessa (taulukko 3).

Rakentajat

ihmisen

potilas (10), persoonallisuus (5)

mies (5)

hyvä

apua (8), apua (7)

paha (16)

elämää

kuolema (10)

ihana (5)

kuolema

ruumis (8)

elämä (6)

tuli

kuume (8), polta (6)

tulipalo (7)

sormi

käsi (14), panaritium (5)

iso (7), indeksi (6)

silmät

näkö (6), oppilas, silmälääkäri (5 kpl)

ruskea (10), iso (6)

pää

mieli (14), aivot (5)

iso (9), älykäs (8), älykäs (6)

menettää

tietoisuus, elämä (4 kpl)

rahaa (5), löytää (4)

Voidaan todeta, että lääkärit kuin rakentajat antavat useammin ammatilliseen toimintaansa liittyviä yhdistyksiä, koska kyselyssä annetut sanat liittyvät enemmän heidän ammattiinsa kuin rakentajan ammattiin.

Kielen tilastollisia säännönmukaisuuksia käytetään luomaan taajuussanakirjoja - sanakirjoja, jotka tarjoavat numeeriset ominaisuudet minkä tahansa kielen sanojen (sanamuotojen, lauseiden) esiintymistiheydestä - kirjoittajan kielestä, minkä tahansa teoksen jne. esiintymistiheydestä. sanaa käytetään käytön ominaisuutena tietyn volyymin tekstissä

Puheen havaintomalli on mahdoton ilman sanakirjaa sen olennaisena osana. Puheen havainnoinnin perustoiminnallinen yksikkö on sana. Tästä seuraa erityisesti, että havaitun tekstin jokainen sana on tunnistettava kuuntelijan (tai lukijan) sisäisen sanaston vastaavaan yksikköön. On luonnollista olettaa, että haku rajoittuu alusta alkaen joihinkin sanakirjan aliverkkotunnuksiin. Useimpien nykyaikaisten puhehavaintoteorioiden mukaan kuulostavan tekstin varsinainen foneettinen analyysi antaa tyypillisessä tapauksessa vain osittaista tietoa sanan mahdollisesta fonologisesta ulkonäöstä, ja tällainen tieto ei vastaa yhtä, vaan tiettyä MONIA sanaa. sanakirjasta; Tästä syystä syntyy kaksi ongelmaa:

a) valitse sopiva sarja tiettyjen parametrien mukaan;

(b) hahmotellun joukon rajoissa (jos se on varattu riittävästi) "eliminoimaan" kaikki sanat, paitsi ainoa, joka parhaiten vastaa tunnistetun tekstin annettua sanaa. Yksi "pudotus"-strategioista on sulkea pois matalataajuuksiset sanat. Tästä seuraa, että puheen havaitsemisen sanasto on taajuussanakirja. Esitellyn projektin lähtökohtana on venäjän kielen taajuussanakirjan tietokoneversion luominen.

Venäjän kielen materiaalin perusteella on olemassa 5 taajuussanakirjaa (haarasanakirjoja lukuun ottamatta). Huomattakoon vain muutamia yleisiä puutteita olemassa olevista sanakirjoista.

Kaikki tunnetut venäjän kielen taajuussanakirjat perustuvat kirjoitettujen (painettujen) tekstien käsittelyyn. Osittain tästä syystä, kun sanan identiteetti perustuu suurelta osin muodolliseen, graafiseen sattumaan, semantiikkaa ei oteta riittävästi huomioon. Tämän seurauksena myös taajuusominaisuudet siirtyvät, vääristyvät; Esimerkiksi, jos taajuussanakirjan kääntäjä sisällyttää sanan "ystävä" yleiseen käyttötilastoihin sanoja yhdistelmästä "toinen", niin tämä tuskin on perusteltua: semantiikka huomioon ottaen on myönnettävä, että nämä ovat jo eri sanoja, tai pikemminkin, että itsenäinen sanakirjayksikkö on vain yhdistelmä kokonaisuutena.

Myös kaikissa olemassa olevissa sanakirjoissa sanat sijoitetaan vain perusmuotoihinsa: substantiivit yksikkömuodossa, nimitystapaus, verbit infinitiivimuodossa jne. Osa sanakirjoista antaa tietoa sanamuotojen esiintymistiheydestä, mutta yleensä ne eivät tee sitä riittävän johdonmukaisesti, ei tyhjentävästi. Saman sanan eri sanamuotojen taajuudet eivät ilmeisesti täsmää. Puheen havaintomallin kehittäjän on otettava huomioon, että todellisessa havaintoprosessissa tunnistettavana on nimenomaan tietty tekstiin "upotettu" sanamuoto: eksponentin alkuosan analyysin perusteella. sanamuoto, muodostuu joukko sanoja, joilla on identtinen alku, eikä sanamuodon alkuosa välttämättä ole identtinen sanakirjamuodon alkuosan kanssa. Juuri sanamuodolla on erityinen rytminen rakenne, joka on myös erittäin tärkeä parametri sanojen havaintovalinnalle. Lopuksi tunnistetun lausunnon lopullisessa esityksessä sanoja edustavat jälleen vastaavat sanamuodot.

On monia teoksia, jotka osoittavat taajuuden merkityksen puhehavaintoprosessissa. Mutta emme ole tietoisia teoksista, joissa sanamuotojen taajuutta käytettäisiin - päinvastoin, kaikki kirjoittajat jättävät käytännössä huomiotta yksittäisten sanamuotojen tiheyden viitaten yksinomaan lekseemeihin. Jos heidän saamiaan tuloksia ei pidetä artefakteina, on oletettava, että äidinkielenään puhujalla on jotenkin pääsy tietoon sanamuotojen ja sanakirjamuotojen, eli itse asiassa lekseemien, taajuuksien suhteesta. Lisäksi tällaista siirtymistä sanamuodosta lekseemiin ei tietenkään voida selittää vastaavan paradigman luonnollisella tiedolla, koska taajuusinformaatiota on käytettävä ennen sanan lopullista tunnistamista, muuten se yksinkertaisesti menettää merkityksensä.

Ensisijaisten tilastollisten ominaisuuksien mukaan voidaan tietyllä suhteellisella virheellä määrittää se osa sanakirjasta, joka sisältää usein esiintyviä sanoja, riippumatta tekstin tyypistä. Ottamalla sanakirjaan vaiheittaisen järjestyksen käyttöön on myös mahdollista saada sarja sanakirjoja, jotka kattavat ensimmäiset 100, 1000, 5000 jne. usein toistuvia sanoja. Sanakirjan tilastolliset ominaisuudet kiinnostavat sanaston semanttisen analyysin yhteydessä. Subjekti-ideologisten ryhmien ja semanttisten kenttien tutkimus osoittaa, että leksikaalisia assosiaatioita tukevat semanttiset linkit, jotka keskittyvät yleisimmän merkityksen omaavien lekseemien ympärille. Leksikosemanttisen kentän merkityksien kuvaus voidaan suorittaa tunnistamalla sanat, joilla on merkitykseltään kaikkein abstrakteimpia lekseemejä. Ilmeisesti "tyhjät" (nominatiivisten voimakkuuksien näkökulmasta) sanakirjayksiköt muodostavat tilastollisesti homogeenisen kerroksen.

Yksittäisten genrejen sanastot eivät ole yhtä arvokkaita. Niiden samankaltaisuuden mittaa ja tilastollisten jakaumien luonnetta tutkimalla saadaan mielenkiintoista tietoa sanaston laadullisesta kerrostumisesta puheenkäyttöalueittain.

Suurtaajuisten sanakirjojen laatiminen vaatii tietotekniikan käyttöä. Osittainen mekanisoinnin ja automatisoinnin käyttöönotto sanakirjan työstöprosessissa on kiinnostava kokeilu eri tekstien sanakirjojen koneellisessa käsittelyssä. Tällainen sanakirja vaatii tiukemman järjestelmän sanaston käsittelyyn ja keräämiseen. Pienoismallina tämä on tiedonhakujärjestelmä, joka pystyy tarjoamaan tietoa tekstin ja sanaston eri puolista. Joitakin peruspyyntöjä tälle järjestelmälle suunnitellaan alusta alkaen: inventaarisanojen kokonaismäärä, yksittäisen sanan ja kokonaisten sanakirjojen tilastolliset ominaisuudet, sanakirjan toistuvien ja harvinaisten vyöhykkeiden järjestys jne. Konekorttitiedosto mahdollistaa luoda automaattisesti käänteisiä sanakirjoja yksittäisille genreille ja lähteille. Monia muita hyödyllisiä tilastotietoja kielestä poimitaan kertyneestä tietojoukosta. Tietokonetaajuussanakirja luo kokeellisen pohjan siirtymiselle sanastotyön laajempaan automatisointiin.

Taajuussanakirjojen tilastotietoja voidaan käyttää laajalti myös muiden kielellisten ongelmien ratkaisemisessa - esimerkiksi analysoitaessa ja määritettäessä nykyvenälän kielen aktiivisia sananmuodostuskeinoja, ratkaistaessa grafiikan ja oikeinkirjoituksen parantamiseen liittyviä kysymyksiä, jotka liittyvät kielellisten ongelmien ratkaisemiseen. ottaa huomioon tilastotietoa sanastosta (on tärkeää ottaa huomioon grafeemiyhdistelmien todennäköisyysominaisuudet, sanoissa toteutettujen kirjainyhdistelmien tyypit), käytännön transkriptio ja translitterointi. Sanakirjan tilastolliset parametrit ovat hyödyllisiä myös kirjaimellisen tekstin kirjoittamisen, tunnistuksen ja automaattisen lukemisen automatisoinnin ongelmien ratkaisemisessa.

Nykyaikaiset venäjän kielen selittävät sanakirjat ja kieliopit rakentuvat pääasiassa kirjallisten ja taiteellisten tekstien pohjalta. A.S.:n kielestä on olemassa taajuussanakirjoja. Pushkin, A.S. Griboedova, F.M. Dostojevski, V.V. Vysotsky ja monet muut kirjailijat. Smolenskin osavaltion kirjallisuuden historian ja teorian laitoksella. Pedagoginen yliopisto on työskennellyt useiden vuosien ajan runo- ja proosatekstien taajuussanakirjojen kokoamiseksi. Tätä tutkimusta varten valittiin taajuussanakirjat kaikista Pushkinin sanoituksista ja kahdesta muusta kulta-ajan runoilijasta - Gribojedovin "Voi nokkeluudesta" ja koko Lermontovin runoudesta; Pasternak ja viisi muuta hopeakauden runoilijaa - Balmont 1894-1903, Blokin "Runot kauniista naisesta", Mandelstamin "Stone", Gumilyovin "Tulipylväs", Akhmatovan "Anno Domini MCMXXI" ja "Siskot" Elämäni" Pasternakilta ja neljältä muulta rautakauden runoilijalta - "Juri Živagon runot", "Kun se selkiytyy", koko M. Petrovin sanoituskokoelma, "Tie on kaukana", "Tuulilasi", "Jäähyväiset lumelle" ja "Hevosenkengät" Mezhirov, "Antimirov" Voznesensky ja "Snezhnitsa » Rylenkova.

On huomattava, että nämä sanakirjat ovat luonteeltaan erilaisia: jotkut edustavat yhden dramaattisen teoksen sanastoa, toiset - sanoituskirjoja tai useita kirjoja tai runoilijan runojen koko aineistoa. Tässä artikkelissa esitettyjen analyysien tuloksiin tulee suhtautua varoen, niitä ei voi pitää absoluuttisina. Erikoistoimenpiteiden avulla tekstien ontologisen luonteen eroa voidaan kuitenkin pienentää jossain määrin.

Viime vuosina puhekielen ja kirjapuheen vastakkainasettelu on tullut yhä selvemmin ilmi. Tästä aiheesta keskustellaan erityisen voimakkaasti metodologien keskuudessa, jotka vaativat opetuksessa käännettä puhutun kielen suuntaan. Puheen kielen erityispiirteet ovat kuitenkin edelleen selittämättömiä.

Sanakirjoja käsiteltiin luomalla käyttäjäsovellus EXCEL97-toimistoohjelman ympäristöön. Sovellus sisältää neljä EXCEL-kirjan laskentataulukkoa - "Title Sheet", "Dictionaries" -arkki alkutiedoilla, "Läheisyydet" ja "Etäisyydet" tuloksilla sekä joukko makroja.

Alkutiedot syötetään "Sanakirjat" -sivulle. Tutkittujen tekstien sanakirjat kirjoitetaan EXCEL-soluihin, viimeinen sarake S muodostuu saaduista tuloksista ja on yhtä suuri kuin muista sanakirjoista löytynyt määrä sanoja. Taulukoissa "Läheisyys" ja "Etäisyydet" on laskettu läheisyys M, korrelaatio R ja etäisyys D.

Sovellusmakrot ovat tapahtumapohjaisia ​​ohjelmointiproseduureja, jotka on kirjoitettu Visual Basic for Application (VBA) -ohjelmalla. Toimenpiteet perustuvat VBA-kirjastoobjekteihin ja niiden käsittelymenetelmiin. Joten sovelluksen laskentataulukoiden kanssa tehtävissä toimissa käytetään avainobjektia Työtaulukko (työtaulukko) ja vastaavaa menetelmää arkin aktivoimiseksi Aktivoi (aktivoi). Analysoitujen lähdetietojen alueen asettaminen Sanakirja-arkkiin suoritetaan Range-objektin (alue) Select-menetelmällä ja sanojen siirto arvoina muuttujiin suoritetaan saman alueen Arvo-ominaisuudena (arvona). esine.

Huolimatta siitä, että rankkorrelaatioanalyysi tekee meidät varovaisiksi aiheiden riippuvuuden suhteen eri tekstien välillä, useimmilla kunkin tekstin yleisimmillä sanoilla on osumia yhdessä tai useammassa muussa tekstissä. Sarake S näyttää tällaisten sanojen lukumäärän kunkin kirjoittajan 15 yleisimmän sanan joukossa. Lihavoidut sanat esiintyvät vain yhden runoilijan sanoissa taulukossamme. Blokilla, Akhmatovalla ja Petrovilla ei ole korostettuja sanoja ollenkaan, heillä on S = 15. Näillä kolmella runoilijalla on samat 15 yleisintä sanaa, ne eroavat vain listan paikasta. Mutta jopa Pushkinilla, jonka sanasto on omaperäisin, on S = 8, ja siinä on 7 korostettua sanaa.

Tulokset osoittavat, että on olemassa tietty kerros sanastoa, joka keskittyy runouden pääteemoja. Nämä sanat ovat pääsääntöisesti lyhyitä: yksitavuisten 88, kaksitavuisten 127, kolmitavuisten 10 sanankäyttöjen kokonaismäärästä (225). Usein nämä sanat edustavat päämytologeemeja ja voivat jakaa pareittain: yö - päivä, maa - taivas (aurinko), Jumala - ihminen (ihmiset), elämä - kuolema, ruumis - sielu, Rooma - maailma(Mandelstamissa); voidaan yhdistää korkeamman tason mytologeemeiksi: taivas, tähti, aurinko, maa; ihmisessä yleensä vartalo, sydän, veri, käsivarsi, jalka, poski, silmät erottuvat. Ihmistiloista etusija annetaan unelle ja rakkaudelle. Talo ja kaupungit kuuluvat ihmisten maailmaan - Moskova, Rooma, Pariisi. Luovuutta edustavat lekseemit sana ja laulu.

Gribojedovilla ja Lermontovilla ei ole juuri lainkaan luontoa kuvaavia sanoja yleisimpien sanojen joukossa. Heillä on kolme kertaa enemmän sanoja, jotka kuvaavat henkilöä, hänen ruumiinsa osia, hänen henkimaailmansa elementtejä. Pushkin ja 1900-luvun runoilijat. Ihmisen ja luonnon nimitykset ovat suunnilleen samat. Tässä tärkeässä aiheen osassa voimme sanoa, että 1900-luku. seurasi Pushkinia.

Minimaalinen teema bisnes yleisimpien sanojen joukossa se löytyy vain Gribojedovista ja Pushkinista. Lermontov ja 1900-luvun runoilijat. se väistyy minimaaliselle teemalle sana. Sana ei sulje pois tekoja (aiheen raamatullinen tulkinta: Uudessa testamentissa kaikkia Jeesuksen Kristuksen opetuksia pidetään Jumalan sanana tai Jeesuksen sanana, ja apostolit kutsuvat itseään toisinaan Sanan palvelijoiksi). Lekseemasanan pyhä merkitys ilmenee vakuuttavasti esimerkiksi Pasternakin säkeessä "Ja maailman kuva, joka ilmestyy Sanassa". Lekseemin pyhä merkitys sana inhimillisten asioiden yhteydessä ja vastakohtana se ilmenee vakuuttavasti Gumiljovin samannimisessä runossa.

Vain yhdestä tekstistä löytyvät merkit kuvaavat tietyn kirjan tai kirjakokoelman omaperäisyyttä. Esimerkiksi sana "mieli" on yleisin Gribojedovin komediassa "Voi nokkeluudesta" - mutta se ei esiinny muiden tekstien taajuussanojen joukossa. Mielen teema on komedian ylivoimaisesti merkittävin. Tämä lekseema liittyy Chatskyn kuvaan, ja Chatskyn nimi on yleisin komediassa. Niinpä teos yhdistää orgaanisesti yleisimmän yhteisen substantiivin yleisimpään erisnimeen.

Suurin korrelaatiokerroin yhdistää Gumilyovin traagisten kirjojen "Tulipylväs" ja Ahmatovan "Anno Domini MCMXXI" teemat. 15 yleisimmän substantiivin joukossa on 10 yleistä, mukaan lukien veri, sydän, sielu, rakkaus, sana, taivas. Muista, että Akhmatovan kirja sisälsi miniatyyrin "Et ole elossa ...", joka kirjoitettiin Gumiljovin pidätyksen ja hänen teloituksensa välillä.

Tutkitun materiaalin kynttilän ja väkijoukon teemat löytyvät vain "Yuri Zhivagon runoista". Kynttilän teemalla romaanin säkeissä on monia kontekstuaalisia merkityksiä: se liittyy Jeesuksen Kristuksen kuvaan, teemoihin usko, kuolemattomuus, luovuus, rakkaustreffit. Kynttilä on tärkein valonlähde romaanin keskeisissä kohtauksissa. Väkijoukon teema kehittyy romaanin pääidean yhteydessä, jossa ihmisen yksityinen elämä horjumattomineen arvoineen vastustaa uuden valtion moraalittomuutta, joka on rakennettu yleisön miellyttämisen periaatteille. .

Työ sisältää myös kolmannen vaiheen, joka näkyy myös ohjelmassa, - tämä on kahden sanakirjan yhteisten sanojen järjestyslukujen eron ja kahden sanakirjan samojen sanojen keskimääräisen etäisyyden laskeminen. Tämä vaihe mahdollistaa siirtymisen tilastojen avulla tunnistetuista sanakirjojen vuorovaikutuksen yleisistä suuntauksista tekstiä lähestyvälle tasolle. Esimerkiksi Gumiljovin ja Akhmatovan kirjat korreloivat tilastollisesti merkitsevästi. Tarkastelemme, mitkä sanat osoittautuivat yleisiksi heidän sanakirjoissaan, ja valitsemme ensin ne, joiden sarjanumerot eroavat minimaalisesti tai ovat nolla. Juuri näillä sanoilla on sama arvonumero, ja näin ollen juuri nämä minimaaliset teemat näiden kahden runoilijan mielessä ovat yhtä tärkeitä. Seuraavaksi sinun tulee siirtyä tekstien ja kontekstien tasolle.

Kvantitatiiviset menetelmät auttavat myös tutkimaan kansojen - äidinkielenään puhuvien - ominaisuuksia. Sanotaan, että venäjäksi on 6 tapausta, englannin kielellä ei tapauksia, ja joillakin Dagestanin kansojen kielillä tapausten määrä on 40. L. Perlovsky artikkelissaan "Tietoisuus, kieli ja kulttuuri" korreloi näitä ominaisuudet kansojen taipumuksen kanssa individualismiin tai kollektivismiin, asioiden ja ilmiöiden havaitsemiseen erikseen tai yhdessä muiden kanssa. Loppujen lopuksi juuri englanninkielisessä maailmassa (ei tapauksia - asia havaitaan "itsestään") ilmestyi sellaiset käsitteet kuin yksilön vapaus, liberalismi ja demokratia (huomaan, että käytän näitä käsitteitä vain kieli ilman arvioivia ominaisuuksia). Huolimatta siitä, että tällaiset arvaukset ovat edelleen vain rohkeiden tieteellisten hypoteesien tasolla, ne auttavat katsomaan jo tuttuja ilmiöitä uudella tavalla.

Kuten näemme, kvantitatiivisia ominaisuuksia voidaan soveltaa aivan eri kielitieteen aloilla, mikä hämärtää yhä enemmän rajoja "tarkkojen" ja "humanitaaristen" menetelmien välillä. Kielitiede turvautuu yhä useammin paitsi matematiikan, myös tietotekniikan apuun ratkaistakseen ongelmiaan.

2.3 Kielen oppiminen muodollisen logiikan menetelmin

Ei-kvantitatiivisten matematiikan menetelmien kanssa, erityisesti logiikan kanssa, nykyaikainen teoreettinen kielitiede on vuorovaikutuksessa yhtä hedelmällisesti kuin kvantitatiivisten menetelmien kanssa. Tietotekniikan nopea kehitys ja niiden roolin kasvu nykymaailmassa vaativat uudistamista kielen ja logiikan vuorovaikutukseen yleensä.

Logiikkamenetelmiä käytetään laajalti formalisoitujen kielten, erityisesti ohjelmointikielten, kehittämisessä, joiden elementtejä ovat jotkin symbolit (kuten matemaattinen), valittu (tai rakennettu aiemmin valituista symboleista) ja tulkittu tietyllä tavalla, assosioituneet. ilman "perinteistä" käyttöä, ymmärrystä ja ymmärtämistä. samojen symbolien toimintoja muissa yhteyksissä. Ohjelmoija käsittelee työssään jatkuvasti logiikkaa. Ohjelmoinnin tarkoitus on vain opettaa tietokone järkeilemään (sanan laajimmassa merkityksessä). Samaan aikaan "päättelyn" menetelmät osoittautuvat hyvin erilaisiksi. Jokainen ohjelmoija viettää tietyn ajan etsiessään vikoja omasta ja muiden ihmisten ohjelmista. Eli etsimään virheitä päättelystä, logiikasta. Ja tämäkin jättää jälkensä. Logiikkavirheiden havaitseminen tavallisessa puheessa on paljon helpompaa. Logiikkojen tutkimien kielten suhteellinen yksinkertaisuus antaa heille mahdollisuuden selvittää näiden kielten rakenteita selkeämmin kuin yksinomaan monimutkaisia ​​luonnollisia kieliä analysoivat lingvistit pystyvät saavuttamaan. Koska logiikkojen tutkimat kielet käyttävät luonnollisista kielistä kopioituja suhteita, loogikot voivat antaa merkittävän panoksen yleiseen kieliteoriaan. Tilanne on tässä samanlainen kuin fysiikassa: fyysikko muotoilee myös lauseita ihanteellisesti yksinkertaistettuihin tapauksiin, joita ei esiinny luonnossa ollenkaan - hän muotoilee lakeja ihanteellisille kaasuille, ihanteellisille nesteille, puhuu liikkeestä kitkan puuttuessa, jne. Näille idealisoiduille tapauksille voidaan vahvistaa yksinkertaisia ​​lakeja, jotka auttaisivat suuresti ymmärtämään, mitä todellisuudessa tapahtuu ja mikä jää todennäköisesti fysiikalle tuntemattomaksi, jos se yrittäisi tarkastella todellisuutta suoraan kaikessa monimutkaisuudessaan.

Luonnollisten kielten tutkimuksessa käytetään loogisia menetelmiä, jotta kieltenoppijat eivät voi typerästi "muistaa" niin monta sanaa kuin mahdollista, vaan ymmärtävät paremmin sen rakennetta. L. Shcherba käytti myös luennoissaan esimerkkiä venäjän kielen lakien mukaan rakennetusta lauseesta: "Hilkuva kuzdra shteko tökseli bokraa ja kiharsi bokraa" ja kysyi sitten opiskelijoilta, mitä tämä tarkoittaa. Huolimatta siitä, että lauseen sanojen merkitys jäi epäselväksi (niitä ei yksinkertaisesti ole venäjäksi), oli mahdollista vastata selkeästi: "kuzdra" on subjekti, feminiininen substantiivi, yksikössä, nimitystapauksessa " bokr” on animoitu jne. Lausun käännös osoittautuu kutakuinkin tältä: "Jokin feminiininen teki kerralla jotain jonkinlaiselle miespuoliselle olennolle ja alkoi sitten tehdä jotain tällaista pitkään, vähitellen pentunsa kanssa." Samanlainen esimerkki tekstistä (taiteellisesta) olemattomista sanoista, joka on rakennettu kokonaan kielen lakien mukaan, on Lewis Carrollin Jabberwock (Liisa Ihmemaassa Carroll selittää hahmonsa Humpty Dumptyn kautta hänen sanojensa merkityksen keksitty: "keitetty" - kello kahdeksan illalla, kun on aika valmistaa illallinen, "chlivky" - hauras ja taitava, "shorek" - fretin, mäyrän ja korkkiruuvin risteys, "sukellus" - ​​hyppy, sukeltaa, pyörähtää, "nava" - ruoho aurinkokellon alla (ulottuu hieman oikealle, hieman vasemmalle ja hieman taaksepäin), "grunt" - murina ja nauraa, "zelyuk" - vihreä kalkkuna, "myumzik" - lintu; sen höyhenet ovat epäsiistit ja työntyvät kaikkiin suuntiin, kuten luuta, "mova" - kaukana kotoa) .

Yksi modernin logiikan ja teoreettisen kielitieteen pääkonsepteista, jota käytetään tutkittaessa erilaisten loogisten ja matemaattisten laskelmien kieliä, luonnollisia kieliä, kuvaamaan eri "tasoisten" kielten välistä suhdetta ja luonnehtimaan kielten välistä suhdetta. kielet ja niiden avulla kuvatut aihealueet, on metakielen käsite. Metakieli on kieli, jota käytetään ilmaisemaan tuomioita toisesta kielestä, kieliobjektista. Metakielen avulla he tutkivat kieli-objektin merkkiyhdistelmien (ilmaisujen) rakennetta, todistavat lauseita sen ilmaisuominaisuuksista, sen suhteesta muihin kieliin jne. Opistettavaa kieltä kutsutaan myös ainekieleksi. suhteessa tähän metakieleen. Sekä ainekieli että metakieli voivat olla tavallisia (luonnollisia) kieliä. Metakieli voi poiketa objektikielestä (esim. venäläisten englanninkielisessä oppikirjassa venäjä on metakieli ja englanti objektikieli), mutta se voi myös yhtyä sen kanssa tai erota vain osittain, esimerkiksi erikoisterminologiassa. (Venäjän kielellinen terminologia on osa metakieltä kuvaamaan venäjän kieltä, ns. semanttiset tekijät ovat osa metakieltä luonnollisten kielten semantiikan kuvaamiseksi).

Käsitteestä "metallingage" on tullut erittäin hedelmällinen matemaattisen logiikan puitteissa rakennettujen formalisoitujen kielten tutkimuksen yhteydessä. Toisin kuin formalisoidut ainekielet, tässä tapauksessa metakieli, jonka avulla metateoria muotoillaan (tutkimalla ainekielellä muotoillun subjektiteorian ominaisuuksia), on pääsääntöisesti tavallinen luonnollinen kieli, jollain erityisellä tavalla tietyllä tavalla rajoitettu luonnollisen kielen fragmentti, joka ei sisällä minkäänlaista moniselitteisyyttä. , metaforia, "metafyysisiä" käsitteitä jne. tavallisen kielen elementtejä, jotka estävät sen käytön tarkan tieteellisen tutkimuksen välineenä. Samalla metakieli itsessään voidaan formalisoida ja (sitä huolimatta) tulla metakielen avulla tehtävän tutkimuksen kohteeksi, ja tällainen sarja voidaan "ajatella" kasvavaksi loputtomiin.

Logiikka opettaa meille hedelmällisen eron kieli-objektin ja metakielen välillä. Kieli-objekti on loogisen tutkimuksen aihe, ja metakieli on se väistämättä keinotekoinen kieli, jolla tällaista tutkimusta tehdään. Looginen ajattelu on vain todellisen kielen (objektikielen) suhteiden ja rakenteen muotoilemista symbolien kielellä (metakieli).

Metakielen tulee joka tapauksessa olla "ei köyhempi" kuin sen objektiivinen kieli (ts. jokaiselle viimeksi mainitun ilmaisulle metakielessä on oltava sen nimi, "käännös") - muuten, jos nämä vaatimukset eivät täyty (mikä varmasti vaatii paikka luonnollisissa kielissä, ellei erityissopimuksissa toisin määrätä) syntyy semanttisia paradokseja (antinomioita).

Kun uusia ohjelmointikieliä syntyi yhä enemmän, ohjelmointikääntäjien ongelman yhteydessä oli kiireellinen tarve luoda metakieliä. Tällä hetkellä Backus-Naur-muodon metakieli (lyhennetty BNF) on yleisimmin käytetty kuvaamaan ohjelmointikielten syntaksia. Se on kompakti muoto joidenkin matemaattisten kaavojen muodossa. Jokaiselle kielen käsitteelle on ainutlaatuinen metakaava (normaalikaava). Se koostuu vasemmasta ja oikeasta osasta. Vasen puoli määrittelee määriteltävän käsitteen ja oikea puoli määrittelee joukon hyväksyttäviä kielirakenteita, jotka yhdistetään tähän käsitteeseen. Kaava käyttää erityisiä metamerkkejä kulmasuluissa, jotka sisältävät määriteltävän käsitteen (kaavan vasemmalla puolella) tai aiemmin määritellyn käsitteen (sen oikealla puolella), ja vasemman ja oikean osan erottelu on osoitettu "::="-metamerkillä, jonka merkitys vastaa sanoja "määritelmän mukaan on". Metalingvistiset kaavat on upotettu kääntäjiin jossain muodossa; heidän avullaan tarkistetaan ohjelmoijan käyttämien konstruktien muodollinen yhteensopivuus minkä tahansa tällä kielellä syntaktisesti kelvollisen konstruktin kanssa. Eri tieteissä on myös erillisiä metakieliä - siis tieto on olemassa eri metakielinä.

Loogiset menetelmät toimivat myös perustana konnektionismin käsitteeseen perustuvien tekoälyjärjestelmien luomiselle. Connectionismi on erityinen suuntaus filosofisessa tieteessä, jonka aiheena ovat tiedon kysymykset. Tämän suuntauksen puitteissa ihmisen älyllisiä kykyjä yritetään selittää keinotekoisten hermoverkkojen avulla. Neuraaliverkot koostuvat suuresta määrästä hermosolujen kaltaisia ​​rakenneyksiköitä, joissa jokaiselle elementille on määritetty paino, joka määrittää yhteyden vahvuuden muihin elementteihin, ja ne ovat yksinkertaistettuja malleja ihmisen aivoista. Kokeet tällaisten hermoverkkojen kanssa ovat osoittaneet niiden kyvyn oppia suorittamaan tehtäviä, kuten hahmontunnistusta, lukemista ja yksinkertaisten kieliopillisten rakenteiden tunnistamista.

Filosofit alkoivat kiinnostua konnektionismista, koska konnektionistinen lähestymistapa lupasi tarjota vaihtoehdon klassiselle mielen teorialle ja tässä teoriassa laajalti vallitsevalle ajatukselle, että mielen toiminta on samanlaista kuin digitaalisen symbolisen kielen käsittely. tietokone. Tämä käsite on erittäin kiistanalainen, mutta viime vuosina se on löytänyt yhä enemmän kannattajia.

Looginen kielentutkimus jatkaa Saussuren käsitystä kielestä järjestelmänä. Se tosiasia, että se jatkuu jatkuvasti, vahvistaa jälleen kerran viime vuosisadan alun tieteellisten oletusten rohkeuden. Omistan työstäni viimeisen osan kielitieteen matemaattisten menetelmien kehitysnäkymille nykyään.

2.4 Matemaattisten menetelmien soveltamisnäkymät kielitieteessä

Tietotekniikan aikakaudella matemaattisen kielitieteen menetelmät ovat saaneet uudenlaisen kehityksen näkökulman. Ratkaisujen etsiminen lingvistisen analyysin ongelmiin toteutetaan nykyään yhä enemmän tietojärjestelmien tasolla. Samalla kieliaineiston käsittelyprosessin automatisointi, joka tarjoaa tutkijalle merkittäviä mahdollisuuksia ja etuja, asettaa hänelle väistämättä uusia vaatimuksia ja tehtäviä.

"Täsmällisen" ja "humanitaarisen" tiedon yhdistelmästä on tullut hedelmällinen maaperä uusille löydöille kielitieteen, tietojenkäsittelytieteen ja filosofian alalla.

Konekäännös kielestä toiseen on edelleen nopeasti kasvava tietotekniikan ala. Huolimatta siitä, että tietokoneavusteista käännöstä ei voi koskaan verrata laadultaan ihmisen käännökseen (etenkin kirjallisten tekstien osalta), koneesta on tullut korvaamaton apu suuria tekstimääriä kääntäjälle. Lähitulevaisuudessa uskotaan luovan kehittyneempiä käännösjärjestelmiä, jotka perustuvat ensisijaisesti tekstin semanttiseen analyysiin.

Yhtä lupaava alue on kielitieteen ja logiikan vuorovaikutus, joka toimii filosofisena perustana tietotekniikan ja ns. "virtuaalitodellisuuden" ymmärtämiselle. Lähitulevaisuudessa työtä tekoälyjärjestelmien luomiseksi jatketaan – vaikka se taas ei tule koskaan olemaan kykyjensä vertaa ihmisen kanssa. Tällainen kilpailu on merkityksetöntä: meidän aikanamme koneesta ei pitäisi tulla (ja siitä tulee) ei kilpailija, vaan ihmisen apulainen, ei jotain fantasiamaailmasta, vaan osa todellista maailmaa.

Kielen tutkiminen tilastollisilla menetelmillä jatkuu, mikä mahdollistaa sen laadullisten ominaisuuksien tarkemman määrittämisen. On tärkeää, että rohkeimmat kieltä koskevat hypoteesit löytävät matemaattisen ja siten loogisen todisteensa.

Merkittävintä on se, että matematiikan eri kielitieteen soveltamishaarat, aiemmin varsin eristyksissä olleet, ovat viime vuosina korreloineet keskenään ja yhdistyneet yhtenäiseksi järjestelmäksi, analogisesti Ferdinand de Saussuren vuosisata sitten löytämän kielijärjestelmän kanssa. ja Yvan Baudouin de Courtenay. Tämä on tieteellisen tiedon jatkuvuutta.

Kielitieteen nykymaailmassa on tullut perusta tietotekniikan kehitykselle. Niin kauan kuin tietojenkäsittelytiede pysyy nopeasti kehittyvänä ihmisen toiminnan alana, matematiikan ja kielitieteen liitto jatkaa rooliaan tieteen kehityksessä.

Johtopäätös

1900-luvun aikana tietotekniikka on edennyt pitkän tien - sotilaallisesta rauhanomaiseen käyttöön, kapeasta tavoitteesta tunkeutumiseen kaikille ihmiselämän aloille. Matematiikka tieteenä sai yhä uuden käytännön merkityksen tietotekniikan kehityksen myötä. Tämä prosessi jatkuu tänään.

Aikaisemmin käsittämättömästä "fyysikkojen" ja "lyriikkojen" "tandemista" on tullut todellisuutta. Matematiikan ja tietojenkäsittelytieteen täydellistä vuorovaikutusta varten humanististen tieteiden kanssa tarvittiin päteviä asiantuntijoita molemmilta puolilta. Tietojenkäsittelytieteilijät tarvitsevat yhä enemmän systemaattista humanitaarista tietoa (kielellistä, kulttuurista, filosofista) ymmärtääkseen muutoksia heitä ympäröivässä todellisuudessa, ihmisen ja tekniikan vuorovaikutuksessa, kehittääkseen yhä enemmän uusia kielellisiä ja mentaalisia käsitteitä, kirjoittaakseen ohjelmia, niin kaikkien meidän aikamme "humanististen tieteiden" on ammatillisen kasvunsa vuoksi hallittava ainakin tietokoneen kanssa työskentelyn perusteet.

Matematiikka, joka liittyy läheisesti informatiikkaan, kehittyy ja vuorovaikutuksessa luonnontieteiden ja humanististen tieteiden kanssa. Uudella vuosisadalla suuntaus kohti tieteen matematisointia ei heikkene, vaan päinvastoin lisääntyy. Kvantitatiivisen tiedon perusteella ymmärretään kielen kehityksen lait, sen historialliset ja filosofiset ominaisuudet.

Matemaattinen formalismi sopii parhaiten kuvaamaan kielitieteen malleja (kuten myös muissa tieteissä - sekä humanistisissa että luonnontieteissä). Tilanne kehittyy joskus tieteessä niin, että ilman sopivaa matemaattista kieltä on mahdotonta ymmärtää fysikaalisten, kemiallisten jne. prosessi ei ole mahdollista. Luomassa atomin planeettamallia, kuuluisa englantilainen XX vuosisadan fyysikko. E. Rutherford koki matemaattisia vaikeuksia. Aluksi hänen teoriaansa ei hyväksytty: se ei kuulostanut vakuuttavalta, ja syynä tähän oli Rutherfordin tietämättömyys todennäköisyysteoriasta, jonka mekanismin perusteella oli mahdollista ymmärtää vain atomivuorovaikutusten malliesitys. Tämän ymmärtäessään jo tuolloin erinomainen tiedemies, Nobel-palkinnon haltija, ilmoittautui matemaatikko professori Lambin seminaariin ja osallistui kahden vuoden ajan opiskelijoiden kanssa kurssille ja teki työpajan todennäköisyysteoriasta. . Sen perusteella Rutherford pystyi kuvaamaan elektronin käyttäytymistä, mikä antoi rakennemallilleen vakuuttavan tarkkuuden ja tunnustusta. Sama on kielitieteen kanssa.

Tämä herättää kysymyksen, mikä objektiivisissa ilmiöissä on niin matemaattista, jonka ansiosta ne voidaan kuvata matematiikan kielellä, kvantitatiivisten ominaisuuksien kielellä? Nämä ovat homogeenisiä aineen yksiköitä, jotka ovat jakautuneet tilassa ja ajassa. Ne tieteet, jotka ovat menneet muita pidemmälle homogeenisuuden eristämiseen ja osoittautuvat niissä paremmin matematiikan käyttöön.

1990-luvulla nopeasti kehittynyt Internet kokosi yhteen eri maiden, kansojen ja kulttuurien edustajat. Huolimatta siitä, että englanti on edelleen kansainvälisen viestinnän pääkieli, Internetistä on tullut monikielinen meidän aikanamme. Tämä johti kaupallisesti menestyneiden konekäännösjärjestelmien kehittämiseen, joita käytetään laajasti ihmisen toiminnan eri aloilla.

Tietokoneverkoista on tullut filosofisen pohdinnan kohde - yhä enemmän on luotu uusia kielellisiä, loogisia, maailmankatsomuksia, jotka auttavat ymmärtämään "virtuaalitodellisuutta". Monissa taideteoksissa luotiin skenaarioita - useammin pessimistisiä - koneiden ylivallasta ihmiseen ja virtuaalitodellisuudesta ulkomaailmaan. Sellaiset ennusteet eivät suinkaan aina osoittautuneet merkityksettömiksi. Tietotekniikka ei ole vain lupaava toimiala inhimillisen tiedon sijoittamiseen, vaan se on myös tapa hallita tietoa ja siten myös ihmisen ajattelua.

Tällä ilmiöllä on sekä negatiivinen että positiivinen puoli. Negatiivinen - koska tiedon hallinta on vastoin luovuttamatonta ihmisoikeutta saada se vapaasti. Positiivinen - koska tämän hallinnan puute voi johtaa katastrofaalisiin seurauksiin ihmiskunnalle. Riittää, kun muistetaan yksi viime vuosikymmenen viisaimmista elokuvista - Wim Wendersin "When the World Ends" -elokuva, jonka hahmot uppoavat täysin tietokoneelle tallennettuun omien unelmiensa "virtuaalitodellisuuteen". Yksikään tiedemies ja yksikään taiteilija ei kuitenkaan voi antaa yksiselitteistä vastausta kysymykseen: mitä tiedettä ja teknologiaa odottaa tulevaisuudessa.

Keskittyminen "tulevaisuuteen", joskus näyttäen fantastiselta, oli tieteen erottuva piirre 1900-luvun puolivälissä, jolloin keksijät pyrkivät luomaan täydellisiä teknologiamalleja, jotka voisivat toimia ilman ihmisen väliintuloa. Aika on osoittanut tällaisen tutkimuksen utopistisen luonteen. Olisi kuitenkin tarpeetonta tuomita tiedemiehiä tästä - ilman heidän innostustaan ​​1950-60-luvuilla tietotekniikka ei olisi tehnyt niin voimakasta harppausta 90-luvulla, eikä meillä olisi sitä mitä meillä on nyt.

1900-luvun viimeiset vuosikymmenet muuttivat tieteen painopisteitä - tutkimus, kekseliäs paatos väistyi kaupalliselle mielenkiinnolle. Jälleen kerran, tämä ei ole hyvä eikä huono. Tämä on todellisuutta, jossa tiede integroituu yhä enemmän jokapäiväiseen elämään.

2000-luku on jatkanut tätä kehitystä, ja meidän aikanamme keksintöjen takana ei ole vain maine ja tunnustus, vaan ennen kaikkea raha. Tästä syystä on myös tärkeää varmistaa, että tieteen ja teknologian uusimmat saavutukset eivät joudu terroristiryhmien tai diktatuurien käsiin. Tehtävä on mahdottomuuteen asti vaikea; sen toteuttaminen mahdollisimman paljon on koko maailmanyhteisön tehtävä.

Tieto on ase, ja aseet eivät ole yhtä vaarallisia kuin ydin- tai kemialliset aseet - vain se ei toimi fyysisesti, vaan pikemminkin psyykkisesti. Ihmiskunnan täytyy miettiä, mikä on sille tässä tapauksessa tärkeämpää - vapaus vai valvonta.

Uusimmat tietotekniikan kehitykseen liittyvät filosofiset käsitteet ja pyrkimys ymmärtää niitä ovat osoittaneet sekä 1800- ja 1900-luvun alkupuolella vallinneen luonnontieteellisen materialismin että aineellisen maailman merkityksen kieltävän ääriidealismin rajoitukset. . Modernin ajattelun, erityisesti lännen ajattelun on tärkeää voittaa tämä ajattelun kaksinaisuus, kun ympäröivä maailma on selkeästi jaettu aineelliseen ja ideaaliseen. Polku tähän on kulttuurien vuoropuhelu, erilaisten näkökulmien vertailu ympäröivään ilmiöön.

Paradoksaalisesti tietotekniikalla voi olla tärkeä rooli tässä prosessissa. Tietokoneverkot ja varsinkin Internet eivät ole vain viihteen ja voimakkaan kaupallisen toiminnan resurssi, vaan ne ovat myös väline mielekkääseen, kiistanalaiseen viestintään nykymaailman eri sivilisaatioiden edustajien välillä sekä vuoropuheluun menneisyyden ja nykyisyyttä. Voimme sanoa, että Internet työntää tilallisia ja ajallisia rajoja.

Ja kulttuurien vuoropuhelussa tietotekniikan kautta kielen rooli vanhimpana yleismaailmallisena viestintävälineenä on edelleen tärkeä. Tästä syystä kielitiede vuorovaikutuksessa matematiikan, filosofian ja tietojenkäsittelytieteen kanssa on kokenut toisen syntymänsä ja kehittyy edelleen. Nykyajan trendi jatkuu myös tulevaisuudessa - "maailman loppuun asti", kuten 15 vuotta sitten sama V. Wenders ennusti. Totta, ei tiedetä milloin tämä loppu tulee - mutta onko sillä nyt merkitystä, koska tulevaisuudesta tulee joka tapauksessa ennemmin tai myöhemmin nykyhetki.

Liite 1

Ferdinand de Saussure

Sveitsiläistä kielitieteilijää Ferdinand de Saussurea (1857-1913) pidetään laajalti modernin kielitieteen perustajana pyrkiessään kuvaamaan kielen rakennetta tiettyjen kielten ja kielimuotojen historian sijaan. Itse asiassa strukturalismin menetelmä lingvistiikassa ja kirjallisuudentutkimuksessa sekä merkittävä semiotiikan haara löytävät tärkeimmän lähtökohtansa hänen työssään 1900-luvun vaihteessa. On jopa väitetty, että strategioiden ja käsitysten kokonaisuus, jota on alettu kutsua "poststrukturalismiksi" - Jacques Derridan, Michel Foucault'n, Jacques Lacanin, Julia Kristevan, Roland Barthesin ja muiden työ - ehdottaa Saussuren työ. kielitieteessä ja latinalaisen runouden anagrammaattisissa lukemissa kirjallisesta modernismista psykoanalyysiin ja filosofiaan 1900-luvun alussa. Kuten Algirdas Julien Greimas ja Joseph Courtés väittävät teoksessa Semiotic and Language: An Analytic Dictionary, otsikon "Tulkinta" alla, 1900-luvun alussa syntyi uusi tulkintatapa, jonka he identifioivat Saussurean kielitieteen, Husserlilaisen fenomenologian ja Freudilaisen psykoanalyysin kanssa. Tässä muodossa "tulkinnalla ei ole enää kysymys tietyn sisällön liittämisestä sellaiseen muotoon, josta sellainen muuten puuttuisi, vaan se on parafraasi, joka muotoilee toisella tavalla merkitsevän elementin vastaavan sisällön tietyssä semioottisessa järjestelmässä" ( 159). tässä "tulkinnan" ymmärtämisessä muoto ja sisältö eivät ole erillisiä; pikemminkin jokainen "muoto" on vaihtoehtoisesti myös semanttinen "sisältö", "merkittävä muoto", joten tulkinta tarjoaa analogisen parafraasin jostakin, joka jo merkitsee jossain muussa merkintäjärjestelmässä.

Tällainen muodon ja ymmärryksen uudelleentulkinta - jota Claude Lévi-Strauss kuvaa yhdessä strukturalismin käsitteen ohjelmallisimmista artikulaatioista teoksessa "Rakenne ja muoto: Pohdintoja Vladimir Proppin teoksesta" - sisältyy implisiittisesti Saussuren postuumikurssiin. in General Linguistics (1916, käännös, 1959, 1983). Elämänsä aikana Saussure julkaisi suhteellisen vähän, ja hänen pääteoksensa, Course, oli hänen opiskelijoidensa transkriptio useista yleisen kielitieteen kursseista, joita hän tarjosi vuosina 1907–1911. Kurssissa Saussure vaati kielen "tieteellistä" tutkimusta vastakohtana 1800-luvulla tehdylle historiallisen kielitieteen työlle. Tämä työ on yksi länsimaisen älyn suurista saavutuksista: tiettyjen sanojen ottaminen kielen rakennuspalikoihin. kieli, historiallinen (tai "diakrooninen") kielitiede jäljitti länsimaisten kielten alkuperän ja kehityksen oletetusta yhteisen kielen lähteestä, ensin "indoeurooppalaisesta" kielestä ja sitten aikaisemmasta "p" roto-indoeurooppalainen" kieli.

Saussure kyseenalaisti nimenomaan tämän sanojen ainutlaatuisten esiintymien tutkimuksen, jossa oletetaan, että kielen perus"yksikkö" on itse asiassa näiden "sanaelementtien" myönteinen olemassaolo. Hänen työnsä oli yritys supistaa kielen tosiasioiden massa, jota historiallinen kielitiede on tutkinut niin tarkasti, hallittavaan määrään ehdotuksia. 1800-luvun filologian "vertaileva koulukunta", Saussure sanoo Kurssissa, "ei onnistunut luomaan todellista kielitieteen tiedettä", koska "se ei onnistunut löytämään tutkimuskohteensa luonnetta" (3). Tuo "luonne", hän väittää, ei löydy pelkästään kielen sisältämistä "elementaarisista" sanoista - kielen näennäisistä "positiivisista" faktoista (tai "aineista"), vaan muodollisista suhteista, jotka synnyttävät niitä. "aineet".

Saussuren systemaattinen kielen uudelleentarkastelu perustuu kolmeen olettamukseen. Ensimmäinen on se, että kielen tieteellisen tutkimuksen on kehitettävä ja tutkittava pikemminkin järjestelmää kuin kielellisten ilmiöiden historiaa. Tästä syystä hän erottaa kielen yksittäiset esiintymät - sen erityiset "puhetapahtumat", joita hän nimittää ehdonalaiseksi - ja varsinainen kielitieteen kohde, niitä tapahtumia hallitseva järjestelmä (tai "koodi"), jonka hän nimittää kieleksi. Tällainen systemaattinen tutkimus vaatii lisäksi "synkronista" käsitys kielen elementtien välisestä suhteesta tietyllä hetkellä, eikä "diakroonista" tutkimusta kielen kehityksestä historian kautta.

Tämä olettamus sai aikaan sen, mitä Roman Jakobson vuonna 1929 kutsui "strukturalismiksi", jossa "kaikkia nykytieteen tutkimia ilmiöitä ei käsitellä mekaanisena kasautumana, vaan rakenteellisena kokonaisuutena, mekaaninen prosessikäsitys antaa kysymyksen. niiden tehtävästä" ("Romantic" 711). Tässä kohdassa Jakobson ilmaisee Saussuren aikomusta määritellä kielitiede tieteelliseksi järjestelmäksi yksinkertaisen, "mekaanisen" historiallisten onnettomuuksien kirjaamisen sijaan. Tämän lisäksi Jakobson kuvailee myös toista Saussurean perusolettamaa - voimme kutsutaan sitä nyt "rakenteelliseksi" - lingvistiikaksi: että kielen peruselementtejä voidaan tutkia vain suhteessa niiden tehtäviin eikä suhteessa niiden syihin. Eurooppalaiset "sanat"), näiden tapahtumien ja kokonaisuuksien on sijaittava systeemisessä kehyksessä jossa ne liittyvät muihin niin kutsuttuihin tapahtumiin ja entiteeteihin. Tämä on radikaali uudelleensuuntautuminen kokemuksen ja ilmiöiden käsityksessä, jonka merkitystä filosofi Ernst Cassirer on vertannut "uuteen Galileon tieteeseen, joka 1700-luvulla muutti koko meidän fyysisen maailman käsite" (viitattu julkaisussa Culler, Pursuit 2 neljä). Tämä muutos, kuten Greimas ja Courtés huomauttavat, omaksuu "tulkinnan" ja siten omaksua itsensä selityksen ja ymmärtämisen. Sen sijaan, että selittäisivät "ilmiön syiden termillä niin, että se "vaikutuksena" on jollain tapaa alisteinen syilleen, selitys tässä tarkoittaa ilmiön alistamista sen tulevaisuuteen suuntautuneelle "toiminnalleen" tai "tarkoitus." Selitys ei ole enää riippumaton inhimillisistä aikomuksista tai tavoitteista (vaikka nuo aikomukset voivat olla persoonattomia, yhteisöllisiä tai Freudin termein "tajuntamattomia").

Kielitieteissään Saussure suorittaa tämän muutoksen nimenomaan määrittelemällä uudelleen kielellisen "sanan", jota hän kuvailee kielelliseksi "merkiksi" ja määrittelee funktionalistisin termein. Hän väittää, että merkki on "käsitteen ja äänikuvan" liitto, jota hän kutsui "merkittyksi ja merkitsijäksi" (66-67; Roy Harrisin vuoden 1983 käännös tarjoaa termit "signification" ja "signal"). Niiden "yhdistelmän" luonne on "toiminnallinen" siinä mielessä, että sen kumpikaan ei ole merkitsitty eikä merkitsejä ole toisen "syy", vaan "kumpikin arvonsa toisesta" (8). kielen elementti, merkki , suhteellisesti ja tekee historiallisen kielitieteen perusoletuksen, nimittäin kielen ja merkitsemisen elementtiyksiköiden (eli "sanojen") identiteetin, tiukan analyysin alaisena. sana "puu" "samana" sanana ei johdu siitä, että sana määritellään luontaisilla ominaisuuksilla - se ei ole tällaisten ominaisuuksien "mekaaninen ryhmittymä" - vaan koska se on määritelty järjestelmän elementiksi, kielen "rakenteelliseksi kokonaisuudeksi".

Tällainen relaatio- (tai "diakriittinen") kokonaisuuden määritelmä hallitsee kielen kaikkien elementtien käsitystä rakennelingvistiikassa. Tämä näkyy selkeimmin Saussurean kielitieteen vaikuttavimmassa saavutuksessa, kielen "foneemien" ja "erottelevien piirteiden" käsitteiden kehittämisessä. Foneemit ovat kielen pienimpiä artikuloituja ja merkitseviä yksiköitä. Ne eivät ole kielessä esiintyviä ääniä, vaan Saussuren mainitsemia "äänikuvia", jotka puhujat ymmärtävät - ilmiömäisesti omaksuttuina - merkityksen välittävinä. (Elmar Holenstein kuvailee siis Jakobsonin kielitiedettä, joka seuraa Saussurea tärkeillä tavoilla, "fenomenologiseksi strukturalismiksi".) Tästä syystä Prahan School Structuralismin johtava tiedottaja Jan Mukarovsky totesi vuonna 1937, että "rakenne . . . on fenomenologinen eikä empiirinen todellisuus; se ei ole itse teos, vaan joukko toiminnallisia suhteita, jotka sijaitsevat kollektiivin tietoisuudessa (sukupolvi, miljöö jne.)" (viitattu Galan 35:ssä). Samoin Lévi-Strauss, ranskalaisen strukturalismin johtava edustaja , totesi vuonna 1960, että "rakenteella ei ole erillistä sisältöä; se on itse sisältö, ja looginen organisaatio, jossa se pidätetään, pidetään todellisen omaisuutena" (167; katso myös Jakobson, Fundamentals 27-28).

Foneemit, kielen pienimmät havaittavissa olevat elementit, eivät siis ole positiivisia esineitä, vaan "fenomenologinen todellisuus". Esimerkiksi englannin kielessä foneemi /t/ voidaan lausua monella eri tavalla, mutta joka tapauksessa englanninkielinen tunnistaa sen toimivan /t/:nä. Aspiroitu t (eli t, joka lausutaan h:n kaltaisella hengityksellä sen jälkeen), korkea tai matala t-ääni, pidennetty t-ääni ja niin edelleen, toimivat kaikki samalla tavalla erottaessaan merkityksen "to" ja "do" englanniksi. Lisäksi kielten väliset erot ovat sellaisia, että yhden kielen fonologiset vaihtelut voivat muodostaa erillisiä foneemia toisessa; näin ollen englanti erottaa /l/:n ja /r/:n, kun taas muut kielet ovat niin rakenteellisia, että näitä artikulaatioita pidetään saman foneemin muunnelmina (kuten englannin aspirated ja unaspirated t). Jokaisessa luonnollisessa kielessä suuri määrä mahdollisia sanoja on yhdistelmä pienestä määrästä foneemia. Esimerkiksi englannin kielellä on alle 40 foneemia, jotka muodostavat yhdessä yli miljoona eri sanaa.

Kielen foneemit ovat itsessään systemaattisesti järjestettyjä piirteiden rakenteita. 1920- ja 1930-luvuilla Saussuren johdolla Jakobson ja N. S. Trubetzkoy erottivat foneemien "erottelevat piirteet". Nämä piirteet perustuvat puheelinten fysiologiseen rakenteeseen - kieleen, hampaisiin, äänihuuliin ja niin edelleen. Saussure mainitsee Kurssissa ja jonka Harris kuvailee "fysiologiseksi fonetiikaksi" (39; Baskinin aikaisempi käännös käyttää termiä "fonologia" [(1959) 38]) - ja ne yhdistyvät "kimpuiksi" binääriopositiota muodostaen foneemia. Esimerkiksi englannin kielessä ero /t/:n ja /d/:n välillä on "äänen" olemassaolo tai puuttuminen (äänen sointujen sitoutuminen), ja äänestyksen tasolla nämä foneemit määrittelevät toistensa vastavuoroisesti. Tällä tavalla fonologia on erityinen esimerkki Saussuren kuvaamasta yleisestä kielen säännöstä: Kielessä on vain eroja. vielä tärkeämpää: ero tarkoittaa yleensä myönteisiä termejä, joiden välille ero muodostuu; mutta kielessä on vain eroja ilman myönteisiä termejä. Otetaanpa sitten merkitsevä tai merkitsijä, kielellä ei ole ideoita eikä ääniä, jotka olivat olemassa ennen kielijärjestelmää. ( 120)

Tässä kehyksessä kielelliset identiteetit eivät ole luontaisten ominaisuuksien, vaan systeemisten ("rakenteellisten") suhteiden määräämiä.

Olen sanonut, että fonologia "seurasi Saussuren johtoa", koska vaikka hänen analyysiään kielen tuotannon fysiologiasta "täytyisi nykyään", kuten Harris sanoo, "kutsuttaisiin "fyysiseksi" vastakohtana joko "psykologiseksi" tai "toiminnalliseksi". "" (Lukema 49), näin ollen Kurssilla hän muotoili kielen toiminnallisen analyysin suunnan ja ääriviivat. Samoin hänen ainoa laajennettu julkaistu teoksensa Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Muistokirja indoeurooppalaisten kielten primitiivisestä vokaalijärjestelmästä), joka ilmestyi vuonna 1878, sijoittui täysin 18. vuosisadan historiallinen kielitiede. Kuitenkin tässä työssä, kuten Jonathan Culler on väittänyt, Saussure osoitti "kielen ajattelun hedelmällisyyden puhtaasti suhteellisten kohteiden järjestelmänä, jopa silloin, kun hän työskentelee historiallisen jälleenrakennuksen tehtävänä" (Saussure 66). Analysoimalla foneemien välisiä systemaattisia rakenteellisia suhteita olemassa olevien indoeurooppalaisten kielten vokaalien vuorottelumallien huomioon ottamiseksi Saussure ehdotti, että useiden eri foneemien /a/ lisäksi on täytynyt olla toinenkin foneemi, joka voitaisiin kuvata muodollisesti. "Mikä tekee Saussuren työstä niin vaikuttavan", Culler päättelee, "on se tosiasia, että lähes viisikymmentä vuotta myöhemmin, kun nuolenkielinen heettiläinen sana löydettiin ja salattiin, sen havaittiin sisältävän foneemin, kirjoitettuna h, joka käyttäytyi kuten Saussure oli ennustanut. . Hän oli havainnut puhtaasti muodollisen analyysin avulla, mitä nykyään tunnetaan indoeurooppalaisen kurkunpäänä" (66).

Tämä käsitys merkittävyyden elementtien suhteellisesta tai diakriittisestä määrittelystä, joka on sekä implisiittinen että eksplisiittinen Kurssissa, ehdottaa kolmannen oletuksen, joka hallitsee rakenteellista lingvistiikkaa, mitä Saussure kutsuu "merkin mielivaltaiseksi luonteeksi". Tällä hän tarkoittaa sitä, että merkitsijän ja merkityn välinen suhde kielessä ei ole koskaan välttämätön (tai "motivoitunut"): yhtä helposti voitaisiin löytää äänimerkittäjä arbre kuin merkitsijäpuu, joka yhdistyy käsitteeseen "puu". Mutta enemmän kuin tämä, se tarkoittaa, että myös ilmaistu on mielivaltaista: käsite "puu" voidaan määritellä yhtä helposti sen puumaisen laadun (joka sulkee pois palmut) kuin koon (joka sulkee pois "matalat puumaiset kasvit") perusteella. kutsu pensaat). Tämän pitäisi tehdä selväksi, että esittämäni olettamusten numerointi ei edusta tärkeysjärjestystä: jokainen oletus - merkitsemisen systeeminen luonne (parhaiten ymmärrettävä tutkimalla kieltä "synkronisesti"), elementtien suhteellinen tai "diakriittinen" luonne. Merkinnän mielivaltaisuus, merkkien mielivaltaisuus - saa arvonsa muista.

Toisin sanoen Saussurean kielitiede on ilmiöitä, joita se tutkii kielen yleisissä yhdistelmä- ja kontrastisuhteissa. Tässä käsityksessä kieli on sekä merkityksen artikulointiprosessi (signifikaatio) että sen tuote (viestintä), eivätkä nämä kaksi kielen toimintoa ole identtisiä eivätkä täysin yhteneviä (ks. Schleifer, "Dekonstruktio"). Tässä nähdään Greimasin ja Courtésin modernistisessa tulkinnassa kuvaama muodon ja sisällön vuorottelu: kieli esittää vastakohtia, jotka määrittelevät muodollisesti sen yksiköt, ja nämä yksiköt yhdistyvät seuraavilla tasoilla muodostaen merkitsevän sisällön. Koska kielen elementit ovat mielivaltaisia, ei myöskään kontrastia tai yhdistelmää voida sanoa perustavanlaatuisiksi. Siten kielen erityispiirteet yhdistyvät muodostamaan vastakkaisia ​​foneemeja toisella käsitystasolla, foneemit yhdistyvät muodostamaan vastakkaisia ​​morfeemeja, morfeemit yhdistyvät muodostamaan sanoja, sanat muodostavat lauseita ja niin edelleen. Kussakin tapauksessa koko foneemi, sana tai lause ja niin edelleen on suurempi kuin osiensa summa (kuten vesi, H2O, Saussuren esimerkissä [(1959) 103] on enemmän kuin mekaaninen agglomeraatio vedystä ja hapesta).

Yleisen kielitieteen kurssin kolme oletusta sai Saussuren vaatimaan uutta 1900-luvun tiedettä, joka menisi kielitieteen lisäksi tutkimaan "merkkien elämää yhteiskunnassa". Saussure antoi tälle tieteelle nimen "semiologia (kreikan sanasta semeîon "merkki")" (16). Semiotiikan "tiede", jota alettiin harjoittaa Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näiden rakenteiden muodostamiin (tai artikuloituihin) kirjallisiin esineisiin. Lisäksi Saussure suoritti koko uransa loppuosan, vaikka hän tarjosi yleisen kielitieteen kursseja, omaa "semioottista" myöhäisen latinalaisen runouden analyysiään yrittääkseen löytää tarkoituksella piilotettuja erisnimien anagrammeja. Tutkimusmenetelmä oli monella tapaa hänen kielellisten analyysiensa funktionaalisen rationalismin vastakohta: se yritti, kuten Saussure mainitsee yhdessä 99 muistikirjasta, joissa hän jatkoi tätä tutkimusta, tutkia systemaattisesti "sattuman" ongelmaa, joka " tulee kaiken väistämättömäksi perustaksi" (viitattu Starobinskissa 101). Tällainen tutkimus, kuten Saussure itse sanoo, keskittyy sattuman ja merkityksen "aineelliseen tosiasiaan" (mainittu 101), joten "teema-sana", jonka anagrammia Saussure etsii, kuten Jean Starobinski väittää, "on runoilijalle , väline, ei runon elintärkeä alkio. Runon tulee käyttää uudelleen teemasanan äänimateriaalia" (45). Tässä analyysissä Starobinski sanoo: "Saussure ei eksynyt etsiessään piilotettuja merkityksiä." Sen sijaan hänen työnsä näyttää osoittavan halua kiertää kaikki tietoisuudesta nousevat ongelmat: "Koska runous ei vain toteudu sanoissa, vaan se on jotain, joka syntyy sanoista, se välttyy mielivaltaisen tietoisuuden hallinnan kautta ollakseen riippuvainen vain eräänlaisesta kielellisestä laillisuudesta. "(121).

Toisin sanoen Saussuren yritys löytää erisnimet myöhään latinalaisesta runoudesta - mitä Tzvetan Todorov kutsuu "sanan vähentämiseksi". . . sen merkitsijälle" (266) - korostaa yhtä hänen kielellistä analyysiään ohjaavista elementeistä, merkin mielivaltaista luonnetta. (Se korostaa myös Saussurelaisen kielitieteen muodollista luonnetta - "Kieli", hän väittää, "on muoto eikä ei substanssi" - joka eliminoi tehokkaasti semantiikan tärkeimpänä analyysikohteena.) Kuten Todorov päättelee, Saussuren työ näyttää nykyään huomattavan homogeeniselta kieltäytyessään hyväksymästä symbolisia ilmiöitä. . . . Anagrammeja tutkiessaan hän kiinnittää huomiota vain toiston ilmiöihin, ei mieleen herättämiseen. . . . Nibelungeja koskevissa tutkimuksissaan hän tunnistaa symbolit vain voidakseen liittää ne virheellisiin lukemiin: koska ne eivät ole tarkoituksellisia, symboleja ei ole olemassa. Lopuksi yleiskielitieteen kursseilla hän pohtii semiologian ja siten muidenkin kuin kielellisten merkkien olemassaoloa; mutta tätä vahvistusta rajoittaa heti se tosiasia, että semiologia on omistettu yhden tyyppiselle merkille: niille, jotka ovat mielivaltaisia. (269-70)

Jos tämä on totta, se johtuu siitä, että Saussure ei voinut käsittää "aikomusta" ilman subjektia; hän ei voinut aivan paeta muodon ja sisällön vastakohtaa hänen työnsä teki niin paljon kyseenalaiseksi. Sen sijaan hän turvautui "kieliseen laillisuuteen". Sijaitsee toisaalta 1800-luvun historiakäsitysten, subjektiivisuuden ja näiden käsitysten hallitseman kausaalisen tulkinnan tavan ja toisaalta 1900-luvun "strukturalististen" käsitysten välissä siitä, mitä Lévi-Strauss kutsui "kantianismia ilman. transsendenttinen subjekti" (mainittu Connertonissa 23) - käsitteitä, jotka poistavat muodon ja sisällön (tai subjektin ja objektin) vastakohdan sekä etualan ja taustan hierarkian täydellisessä strukturalismissa, psykoanalyysissä ja jopa kvanttimekaniikassa - Ferdinandin työ de Saussure kielitieteessä ja semiotiikassa rajaa signaalihetken merkityksen ja kulttuurin tutkimuksessa.

Ronald Schleifer

Liite 2

Ferdinand de Saussure (käännös)

Sveitsiläistä kielitieteilijää Ferdinand de Saussurea (1857-1913) pidetään modernin kielitieteen perustajana - kiitos hänen yrityksistään kuvata kielen rakennetta yksittäisten kielten ja sanamuotojen historian sijaan. Yleisesti ottaen kielitieteen ja kirjallisuuskritiikin rakenteellisten menetelmien ja suurelta osin semiotiikan perusta luotiin hänen teoksiinsa 1900-luvun alussa. On todistettu, että Jacques Derridan, Michel Foucault'n, Jacques Lacanin, Julia Kristevan, Roland Barthesin ja muiden teoksissa kehitetyt niin kutsutun "poststrukturalismin" menetelmät ja käsitteet juontavat juurensa Saussuren ja muiden kielitieteellisiin teoksiin. myöhäisroomalaisen runouden anagrammaattisia lukemia. On huomattava, että Saussuren kielitieteen ja kielellisen tulkinnan työ auttaa yhdistämään laajan valikoiman älyllisiä tieteenaloja - fysiikasta kirjallisiin innovaatioihin, psykoanalyysiin ja 1900-luvun alun filosofiaan. A. J. Greimas ja J. Kurte kirjoittavat teoksessa Semiotics and Language: "Analyyttinen sanakirja, jonka otsikko on "Tulkinta" uudenlaisena tulkintana, ilmestyi 1900-luvun alussa Saussuren kielitieteen, Husserlin fenomenologian ja psykoanalyysin ohella. Freudista. Tällaisessa tapauksessa "tulkinta ei ole tietyn sisällön liittämistä muotoon, josta sellainen muuten puuttuisi, vaan se on parafraasi, joka muotoilee toisella tavalla tietyn semioottisen järjestelmän merkittävän elementin saman sisällön" (159). ). Tässä "tulkinnan" ymmärtämisessä muoto ja sisältö ovat erottamattomat; päinvastoin, jokainen muoto on täynnä semanttista merkitystä ("merkittävä muoto"), joten tulkinta tarjoaa uuden, samanlaisen uudelleenkerronta jotain merkityksellistä toisessa merkkijärjestelmässä.

Samanlainen käsitys muodosta ja sisällöstä, jonka Claude Lévi-Strauss esitti yhdessä strukturalismin ohjelmallisessa teoksessa ("Rakenne ja muoto: Pohdintoja Vladimir Proppin teoksista"), on nähtävissä Saussuren postuumikirjassa A Course in Yleinen kielitiede (1916, käännös, 1959, 1983). Elämänsä aikana Saussure julkaisi vähän, "Course" - hänen pääteoksensa - kerättiin opiskelijoiden muistiinpanoista, jotka osallistuivat hänen yleisen kielitieteen luentoihin vuosina 1907-1911. Kurssissa Saussure vaati "tieteellistä" kielen tutkimusta ja asetti sen vastakkain 1800-luvun vertailevan historiallisen kielitieteen kanssa. Tätä teosta voidaan pitää yhtenä länsimaisen ajattelun suurimmista saavutuksista: yksittäisten sanojen perustana kielen rakenneelementteinä historiallinen (tai "diakrooninen") kielitiede osoitti Länsi-Euroopan kielten alkuperän ja kehityksen. yhteinen, indoeurooppalainen kieli - ja aikaisempi protoindoeurooppalainen kieli.

Saussure kyseenalaisti juuri tämän sanojen ainutlaatuisten esiintymien tutkimuksen, jossa oletetaan, että kielen perus"yksikkö" on itse asiassa näiden "sanaelementtien" positiivinen olemassaolo. Hänen työnsä oli yritys supistaa vertailevan kielitieteen satunnaisesti tutkimat monet kielen tosiasiat pieneen määrään lauseita. 1800-luvun vertaileva filologinen koulukunta, kirjoittaa Saussure, "ei onnistunut luomaan todellista kielitieteen koulukuntaa", koska "se ei ymmärtänyt tutkimuksen kohteen olemusta" (3). Tämä "olemus", hän väittää, ei piile vain yksittäisissä sanoissa - kielen "positiivisissa substansseissa" - vaan myös muodollisissa yhteyksissä, jotka auttavat näitä aineita olemaan olemassa.

Saussuren kielen "testi" perustuu kolmeen oletukseen. Ensinnäkin kielen tieteellinen ymmärtäminen ei perustu historialliseen, vaan rakenteelliseen ilmiöön. Siksi hän erotti kielen yksittäiset ilmiöt - "puhetapahtumat", jotka hän määrittelee "ehdonalaisiksi" - ja hänen mielestään varsinaisen kielitieteen tutkimuskohteen, järjestelmän (koodin, rakenteen), joka hallitsee näitä tapahtumia ( "kieli"). Tällainen systemaattinen tutkimus vaatii lisäksi "synkronista" käsitystä kielen elementtien välisestä suhteesta tietyllä hetkellä, eikä "diakroonista" tutkimusta kielen kehityksestä sen historian kautta.

Tämä hypoteesi oli edelläkävijä sille, mitä Roman Jakobson kutsui vuonna 1929 "strukturalismiksi" - teoriaksi, jossa "kaikkia nykyajan tieteen tutkimia ilmiöitä ei pidetä mekaanisena kertymänä, vaan rakenteellisena kokonaisuutena, jossa rakentava komponentti korreloi toiminto" ("Romanttinen "711). Tässä kohdassa Jakobson muotoili Saussuren ajatuksen kielen määrittelemisestä rakenteeksi, toisin kuin historiallisten tapahtumien "mekaaninen" luettelointi. Lisäksi Jakobson kehittää toisen saussurelaisen oletuksen, josta tuli rakennekielitieteen edelläkävijä: kielen peruselementtejä tulee tutkia ei niinkään syiden, vaan toimintojen yhteydessä. Erillisiä ilmiöitä ja tapahtumia (esimerkiksi yksittäisten indoeurooppalaisten sanojen alkuperähistoriaa) ei tulisi tutkia itsestään, vaan järjestelmässä, jossa ne korreloivat samanlaisten komponenttien kanssa. Tämä oli radikaali käänne ilmiöiden vertailussa ympäröivään todellisuuteen, jonka merkitystä filosofi Ernst Cassirer vertasi "Galileon tieteeseen, joka 1600-luvulla kumosi käsitykset aineellisesta maailmasta", siis itse selityksiin. Ilmiöitä alettiin tulkita ei suhteessa niiden esiintymisen syihin, vaan suhteessa siihen vaikutukseen, joka niillä voi olla nykyisyydessä ja tulevaisuudessa. Tulkinta lakkasi olemasta riippumaton henkilön aikeista (huolimatta siitä, että aikomukset voivat olla persoonattomia, "tajuton" sanan freudilaisessa merkityksessä).

Saussure osoittaa kielitieteessään erityisesti tämän käänteen sanan käsitteen muutoksessa kielitieteessä, jonka hän määrittelee merkiksi ja kuvailee sen toimintojen perusteella. Hänelle merkki on äänen ja merkityksen yhdistelmä, "merkitty ja nimitys" (66-67; Roy Harrisin englanninkielisessä käännöksessä 1983 - "signification" ja "signal"). Tämän yhdisteen luonne on "toiminnallinen" (kumpikaan tai toinen alkuaine ei voi olla olemassa ilman toisiaan); lisäksi "toinen lainaa ominaisuuksia toiselta" (8). Siten Saussure määrittelee kielen päärakenneelementin - merkin - ja tekee historiallisen kielitieteen perustaksi merkkien identiteetin sanoihin, mikä vaatii erityisen tiukkaa analyysiä. Siksi voimme ymmärtää esimerkiksi saman sanan "puu" erilaisia ​​merkityksiä - ei siksi, että sana on vain joukko tiettyjä ominaisuuksia, vaan koska se on määritelty elementiksi merkkijärjestelmässä, "rakenteellisessa kokonaisuudessa". kielessä.

Tällainen suhteellinen ("diakriittinen") yhtenäisyyden käsite on rakenteellisen lingvistiikan kielen kaikkien elementtien käsitteen taustalla. Tämä näkyy erityisen selvästi Saussurean kielitieteen alkuperäisimmässä löydössä, "foneemien" ja kielen "erottelevien piirteiden" käsitteen kehittämisessä. Foneemit ovat pienimmät puhutuista ja merkityksellisistä kielen yksiköistä. Ne eivät ole vain kielessä esiintyviä ääniä, vaan "äänikuvia", toteaa Saussure, joilla äidinkielenään puhujat pitävät merkitystä. (On huomattava, että Elmar Holenstein kutsuu Jakobsonin kielitiedettä, joka jatkaa Saussuren ajatuksia ja käsitteitä pääsäännöissään, "fenomenologiseksi strukturalismiksi"). Siksi Prahan strukturalismin koulun johtava puhuja Jan Mukarowski huomautti vuonna 1937, että "rakenne. . . ei empiirinen, vaan fenomenologinen käsite; se ei ole itse tulos, vaan joukko merkittäviä kollektiivisen tietoisuuden suhteita (sukupolvi, muut jne.)”. Samanlaisen ajatuksen ilmaisi vuonna 1960 ranskalaisen strukturalismin johtaja Lévi-Strauss: "Rakenteella ei ole määrättyä sisältöä; se on merkityksellinen sinänsä, ja looginen rakenne, johon se on suljettu, on todellisuuden jälki.

Foneemit puolestaan ​​pienimpinä havainnointiin hyväksyttävinä kielellisinä elementteinä edustavat erillistä kiinteää "fenomenologista todellisuutta". Esimerkiksi englanniksi ääni "t" voidaan lausua eri tavalla, mutta kaikissa tapauksissa englantia puhuva henkilö havaitsee sen "t". Imetetty, nostettu tai laskettu, pitkä "t"-ääni jne. erottavat yhtä hyvin sanojen "to" ja "do" merkitykset. Lisäksi kielten väliset erot ovat sellaisia, että yhden äänen muunnelmat yhdellä kielellä voivat vastata eri foneemeja toisessa; esimerkiksi "l" ja "r" englanniksi ovat erilaisia, kun taas muilla kielillä ne ovat saman foneemin lajikkeita (kuten englantilainen "t", lausutaan aspiraatiolla ja ilman). Minkä tahansa luonnollisen kielen laaja sanasto on joukko paljon pienemmän määrän foneemien yhdistelmiä. Esimerkiksi englanniksi vain 40 foneemia käytetään noin miljoonan sanan ääntämiseen ja kirjoittamiseen.

Kielen äänet ovat systemaattisesti järjestetty joukko ominaisuuksia. 1920-1930-luvuilla, Saussuren jälkeen, Jacobson ja N.S. Trubetskoy korostivat foneemien "erottuvat piirteet". Nämä ominaisuudet perustuvat puheelinten rakenteeseen - kieli, hampaat, äänihuulet - Saussure huomaa tämän "Yleisen kielitieteen kurssissa", ja Harris kutsuu sitä "fysiologiseksi fonetiikaksi" (Baskinin aikaisemmassa käännöksessä termi "fonologia" " käytetään) - ne yhdistetään "solmuiksi » durg ystävää vastaan ​​saadakseen ääniä. Esimerkiksi englannin kielessä ero "t":n ja "d":n välillä on "äänen" olemassaolo tai puuttuminen (äänihuulien jännitys) ja äänen taso, joka erottaa yhden foneemin toisesta. Näin ollen fonologiaa voidaan pitää esimerkkinä Saussuren kuvaamasta yleisestä kielisäännöstä: "Kielessä on vain eroja." Vielä tärkeämpää ei ole tämä: ero tarkoittaa yleensä tarkat olosuhteet, joiden välillä se sijaitsee; mutta kielessä on vain eroja ilman tarkkoja ehtoja. Tarkastellaanpa sitten "nimeämistä" tai "merkittyä" - kielessä ei ole käsitteitä eikä ääniä, jotka olisivat olleet olemassa ennen kielijärjestelmän kehitystä.

Tällaisessa rakenteessa kielellisiä analogioita ei määritellä niiden luontaisten ominaisuuksien avulla, vaan järjestelmällisten ("rakenteellisten") suhteiden avulla.

Olen jo maininnut, että fonologia nojautui kehityksessään Saussuren ideoihin. Vaikka Harris sanoo, että hänen nykyaikaisen kielifysiologian analyysiään "kutsuttaisiin "fysikaaliseksi" vastakohtana "psykologiseksi" tai "toiminnalliseksi", hän ilmaisi Kurssissa selvästi kielen toiminnallisen analyysin suunnan ja perusperiaatteet. Hänen ainoa julkaistu teoksensa hänen elinaikanaan Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Huomautuksia indoeurooppalaisten kielten alkuperäisestä vokaalijärjestelmästä), joka julkaistiin vuonna 1878, oli täysin sopusoinnussa vertailevan historiallisen kielitieteen kanssa. 1800-luvulla. Kuitenkin tässä työssä, sanoo Jonathan Culler, Saussure osoitti "kielen idean hedelmällisyyden toisiinsa liittyvien ilmiöiden järjestelmänä, jopa sen historiallisen rekonstruoinnin kanssa". Analysoidessaan foneemien välistä suhdetta, selittäessään vokaalien vuorottelua indoeurooppalaisen ryhmän nykykielissä, Saussure ehdotti, että useiden eri äänten "a" lisäksi on oltava muita muodollisesti kuvattuja foneemia. "Erityisen vaikutuksen Saussuren teoksessa tekee", Kaller päättää, "että melkein 50 vuotta myöhemmin, kun heettiläinen nuolenpääkirja löydettiin ja purettiin, löydettiin foneemi, joka on merkitty kirjaimella "h", joka käyttäytyi Saussuren ennustamalla tavalla. Muodollisen analyysin avulla hän löysi sen, mikä tunnetaan nykyään indoeurooppalaisten kielten gutturaalina.

Merkkien suhteellisen (diakriittisen) määritelmän käsitteessä, sekä eksplisiittisessä että implisiittisessä Kurssissa, on rakenteellisen lingvistiikan kolmas keskeinen oletus, jota Saussure kutsuu "merkin mielivaltaiseksi luonteeksi". Tällä tarkoitetaan, että kielen äänen ja merkityksen suhdetta ei motivoi mikään: yhtä helposti voidaan yhdistää sana "arbre" ja sana "puu" käsitteeseen "puu". Lisäksi tämä tarkoittaa, että ääni on myös mielivaltainen: "puun" käsite voidaan määritellä kuoren läsnäolon (paitsi palmuja) ja koon mukaan (paitsi "matalat puumaiset kasvit" - pensaat). Tästä pitäisi olla selvää, että kaikkia esittämiäni oletuksia ei ole jaettu enemmän ja vähemmän tärkeisiin: jokainen niistä - merkkien systeeminen luonne (ymmärrettävin kielen "synkronisessa" tutkimuksessa), niiden suhteellinen (diakriittinen) olemus , merkkien mielivaltainen luonne - tulee muusta.

Näin ollen Saussurean kielitieteessä tutkittu ilmiö ymmärretään kielen vertailujen ja vastakohtien joukkona. Kieli on sekä sanojen merkityksen (nimitys) että niiden tuloksen (viestintä) ilmaisu - eivätkä nämä kaksi toimintoa koskaan kohtaa (katso Shleiferin "Kielen dekonstruktio"). Näemme Greimasin ja Kurten kuvaaman muodon ja sisällön vuorottelun uusimmassa tulkintaversiossa: kielelliset kontrastit määrittelevät sen rakenneyksiköt, ja nämä yksiköt vuorovaikuttavat peräkkäisillä tasoilla luodakseen tietyn merkityksellisen sisällön. Koska kielen elementit ovat satunnaisia, ei kontrasti tai yhdistelmä voi olla perusta. Tämä tarkoittaa, että kielessä tunnusmerkit muodostavat foneettisen kontrastin eri ymmärrystasolla, foneemit yhdistetään vastakkaisiin morfeemeihin, morfeemit - sanoiksi, sanat - lauseiksi jne. Joka tapauksessa kokonainen foneemi, sana, lause jne. on enemmän kuin osiensa summa (kuten vesi, Saussuren esimerkissä, on enemmän kuin vedyn ja hapen yhdistelmä).

"Yleisen kielitieteen kurssin" kolme oletusta johtivat Saussuren ajatukseen 1900-luvun uudesta tieteestä, joka on erillinen kielitieteestä ja joka tutkii "merkkien elämää yhteiskunnassa". Saussure kutsui tätä tiedettä semiologiaksi (kreikan sanasta "semeîon" - merkki). Semiotiikan "tiede", joka kehittyi Itä-Euroopassa 1920- ja 1930-luvuilla ja Pariisissa 1950- ja 1960-luvuilla, laajensi kielen ja kielellisten rakenteiden tutkimuksen näillä rakenteilla valmistetuiksi (tai muotoilluiksi) kirjallisiksi löydöksiksi. Lisäksi uransa hämärässä, yleisen kielitieteen kurssin ohella, Saussure harjoitti myöhäisroomalaisen runouden "semioottista" analyysiä yrittäen löytää tarkoituksella laadittuja erisnimien anagrammeja. Tämä menetelmä oli monella tapaa rationalismin vastakohta lingvistisessä analyysissään: se oli yritys, kuten Saussure kirjoittaa yhdessä 99 muistikirjasta, tutkia järjestelmässä "todennäköisyyden" ongelmaa, josta "tulee kaiken perusta". " Tällainen tutkimus, Saussure itse väittää, auttaa keskittymään todennäköisyyden "todelliseen puoleen"; ”Avainsana”, jolle Saussure etsii anagrammia, on Jean Starobinskyn mukaan ”runoilijan työkalu, ei runon elämän lähde. Runo toimii käänteisenä avainsanan äänet. Starobinskyn mukaan tässä analyysissä "Saussure ei syvenny piilotettujen merkityksien etsimiseen". Päinvastoin, hänen teoksissaan on havaittavissa halu välttää tietoisuuteen liittyviä kysymyksiä: "koska runous ilmaistaan ​​paitsi sanoissa, myös siinä, mitä nämä sanat synnyttävät, se menee tietoisuuden hallinnan ulkopuolelle ja riippuu vain kielen lakeja."

Saussuren yritys tutkia erisnimiä myöhäisroomalaisessa runoudessa (Tsvetan Todorov kutsui tätä lyhenteeksi "sanasta ... vain ennen kuin se on kirjoitettu") korostaa yhtä hänen kielellisen analyysinsä komponenteista - merkkien mielivaltaista luonnetta sekä Saussurelaisen kielitieteen muodollinen olemus ("Kieli", hän väittää, "muodon olemus, ei ilmiö"), mikä sulkee pois mahdollisuuden analysoida merkitystä. Todorov päättelee, että nykyään Saussuren kirjoitukset näyttävät erittäin johdonmukaisilta haluttomuudessaan tutkia symboleja [ilmiöitä, joilla on hyvin määritelty merkitys]. . . . Anagrammeja tutkiessaan Saussure kiinnittää huomiota vain toistoon, mutta ei aikaisempiin vaihtoehtoihin. . . . Nibelungia tutkiessaan hän määrittelee symbolit vain liittääkseen ne virheellisiin lukemiin: jos ne ovat tahattomia, symboleja ei ole olemassa. Loppujen lopuksi hän tekee yleisen kielitieteen kirjoituksissaan oletuksen semiologian olemassaolosta, joka ei kuvaa vain kielellisiä merkkejä; mutta tätä oletusta rajoittaa se tosiasia, että semiologia voi kuvata vain satunnaisia, mielivaltaisia ​​merkkejä.

Jos tämä todella on niin, se johtuu vain siitä, että hän ei voinut kuvitella "aikomusta" ilman esinettä; hän ei kyennyt täysin kuromaan umpeen muodon ja sisällön välistä kuilua - hänen kirjoituksissaan tämä muuttui kysymykseksi. Sen sijaan hän kääntyi "kieliseen legitiimiyteen". Toisaalta 1800-luvun historiaan ja subjektiivisiin olettamuksiin perustuvien käsitteiden ja näihin käsitteisiin perustuvien satunnaisten tulkintamenetelmien ja toisaalta strukturalististen käsitteiden välillä, joita Lévi-Strauss kutsui "kantialismiksi ilman transsendenttia". näyttelijä" - pyyhkimällä pois muodon ja sisällön (subjektin ja objektin), merkityksen ja alkuperän vastakkainasettelun strukturalismista, psykoanalyysistä ja jopa kvanttimekaniikasta - Ferlinand de Saussuren lingvistiikkaa ja semiotiikkaa käsittelevät teokset merkitsevät käännekohtaa kielen ja merkityksen tutkimuksessa. kulttuuri.

Ronald Shleifer

Kirjallisuus

1. Admoni V.G. Kieliopin perusteet / V.G. Admoni; Neuvostoliiton tiedeakatemia.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Kielitieteen matemaattiset menetelmät. M., 1974.

4. Arnold I.V. Sanan semanttinen rakenne modernissa englannissa ja sen tutkimusmenetelmät. /I.V. Arnold-L .: Koulutus, 1966. - 187 s.

6. Bašlykov A.M. Automaattinen käännösjärjestelmä. / OLEN. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7. Baudouin de Courtenay: Teoreettinen perintö ja nykyaika: Tiivistelmät kansainvälisen tieteellisen konferenssin raporteista / Ed.I.G. Kondratjev. - Kazan: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Kieli ja tilastot. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoreettinen ja soveltava kielitiede. / V.A. Zvegintsev - M., 1969. - 143 s.

11. Kasevich, V.B. Semantiikka. Syntaksi. Morfologia. // V.B. Kasevich - M., 1988. - 292 s.

12. Lekomtsev Yu.K. Johdatus kielitieteen muodolliseen kieleen / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. Baudouin de Courtenayn kielellinen perintö 1900-luvun lopulla: Kansainvälisen tieteellisen ja käytännön konferenssin tiivistelmät 15.-18. maaliskuuta 2000. - Krasnojarsk, 2000. - 125 s.

Matveeva G.G. Piilotetut kieliopilliset merkitykset ja puhujan sosiaalisen henkilön ("muotokuva") tunnistaminen / G.G. Matveev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Kokemus kielellisten mallien rakentamisesta "Meaning Text"./ I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Käännös ja soveltava kielitiede / L.L. Nelyubin. - M.: Higher School, 1983. - 207 s.

16. Tarkoista kielentutkimuksen menetelmistä: ns. "matemaattisesta lingvistiikasta" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva ja muut - M., 1961. - 162 s.

17. Piotrovsky L.G. Matemaattinen kielitiede: oppikirja / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Higher School, 1977. - 160 s.

18. Hän on. Teksti, kone, henkilö. - L., 1975. - 213 s.

19. Hän on. Soveltava kielitiede / Toim. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. kielimalleja. M., 1963. Revzin, I.I. Nykyaikainen rakennelingvistiikka. Ongelmat ja menetelmät. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Yleisen ja konekääntämisen perusteet / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. F. de Saussuren teoria modernin kielitieteen valossa / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Pöllö, L.Z. Analyyttinen kielitiede / L.Z. Pöllö - M., 1970. - 192 s.

24. Saussure F. de. Huomautuksia yleisestä kielitieteestä / F. de Saussure; Per. alkaen fr. - M.: Progress, 2000. - 187 s.

25. Hän on. Yleiskielitieteen kurssi / Per. alkaen fr. - Jekaterinburg, 1999. -426 s.

26. Puhetilastot ja automaattinen tekstianalyysi / Toim. toim. R.G. Piotrovsky. L., 1980. - 223 s.

27. Stoll, P. Sarjat. Logiikka. Aksiomaattiset teoriat / R. Stoll; Per. englannista. - M., 1968. - 180 s.

28. Tenier, L. Rakenteellisen syntaksin perusteet. M., 1988.

29. Ubin I.I. Käännöstoiminnan automatisointi Neuvostoliitossa / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Käsitteellisen tiedon käsittely. M., 1980.

32. Shikhanovich, Yu.A. Johdatus nykyaikaiseen matematiikkaan (alkukäsitteet). M., 1965

33. Shcherba L.V. Venäjän vokaalit laadullisesti ja kvantitatiivisesti / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Maailman kansalainen // Spark - 1996. - Nro 5. - s.13

35. V.A. Uspensky. Alustava "Uuden kirjallisuuskatsauksen" lukijoille Andrei Nikolajevitš Kolmogorovin semioottisiin viesteihin. - Uusi kirjallisuuskatsaus. -1997. - Nro 24. - S. 18-23

36. Perlovsky L. Tietoisuus, kieli ja kulttuuri. - Tieto on valtaa. -2000. №4 - S. 20-33

37. Frumkina R.M. Meistä - vinosti. // Venäjän lehti. - 2000. - Nro 1. - s. 12

38. Fitialov, S.Ya. Syntaksimallintamisesta rakennelingvistiikassa // Rakennekielitieteen ongelmat. M., 1962.

39. Hän on. NN-kieliopin ja riippuvuuskieliopin vastaavuudesta // Rakennekielitieteen ongelmat. M., 1967.

40. Chomsky, N. Kieliteorian loogiset perusteet // Uutta kielitieteessä. Ongelma. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. paina. jhu.ru

46. ​​en.wikipedia.org