Kamus ensiklopedis linguistik. Metode Matematika dalam Linguistik Perbandingan

Terbentuknya Linguistik Struktural pada Pergantian Abad 19 – 20. Metode statistik dalam pembelajaran bahasa. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh. Belajar bahasa dengan metode logika formal. Fitur terjemahan mesin.

PENGANTAR

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Terbentuknya Linguistik Struktural pada Pergantian Abad 19 - 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinand de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

PENGANTAR

Pada abad ke-20, telah terjadi kecenderungan yang berkelanjutan terhadap interaksi dan interpenetrasi berbagai bidang ilmu pengetahuan. Batas-batas antara ilmu-ilmu individu secara bertahap kabur; semakin banyak cabang aktivitas mental yang "di persimpangan" pengetahuan kemanusiaan, teknis, dan ilmu alam.

Ciri lain yang jelas dari modernitas adalah keinginan untuk mempelajari struktur dan elemen-elemen penyusunnya. Oleh karena itu, tempat yang meningkat, baik dalam teori ilmiah maupun dalam praktik, diberikan kepada matematika. Datang ke dalam kontak, di satu sisi, dengan logika dan filsafat, di sisi lain, dengan statistik (dan, akibatnya, dengan ilmu-ilmu sosial), matematika menembus lebih dalam dan lebih dalam ke daerah-daerah yang untuk waktu yang lama dianggap murni "kemanusiaan", memperluas potensi heuristik mereka (jawaban atas pertanyaan "berapa banyak" akan sering membantu menjawab pertanyaan "apa" dan "bagaimana"). Linguistik tidak terkecuali.

Tujuan dari pekerjaan kursus saya adalah untuk secara singkat menyoroti hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat perangkat teoretis untuk menggambarkan struktur bahasa (baik alami maupun buatan). Pada saat yang sama, harus dikatakan bahwa ia tidak segera menemukan aplikasi praktis seperti itu untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun, dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan aplikasi dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan baru yang mendasar terhadap bahasa tersebut. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar untuk mewakili pola linguistik dalam bentuk di mana mereka dapat diterapkan secara langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, mengacu pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan pada tahun-tahun terakhir percaya bahwa ekspresi itu sendiri tidak dapat dinaikkan ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan, akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka dari awal abad kedua puluh (saya akan menceritakan tentang pengaruhnya pada pengembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan miliknya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang beragam, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab ISejarah penerapan metode matematika dalam linguistik

1.1 Pembentukan linguistik strukturalpada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.

Kaitan awal dari konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri adalah) bahasa, pidato - kata sandi, dan aktivitas bicara - bahasa), di mana setiap kata (anggota sistem) dianggap tidak dalam dirinya sendiri, tetapi dalam hubungannya dengan anggota lainnya. Sebagai ahli bahasa terkemuka lainnya, Dane Louis Hjelmslev, kemudian mencatat, Saussure "adalah orang pertama yang menuntut pendekatan struktural untuk bahasa, yaitu deskripsi ilmiah bahasa dengan merekam hubungan antar unit."

Memahami bahasa sebagai struktur hierarkis, Saussure adalah orang pertama yang mengajukan masalah nilai dan signifikansi unit linguistik. Fenomena dan peristiwa yang terpisah (misalnya, sejarah asal usul kata-kata Indo-Eropa individu) harus dipelajari tidak sendiri, tetapi dalam sistem di mana mereka berkorelasi dengan komponen serupa.

Unit struktural bahasa Saussure menganggap kata, "tanda", di mana suara dan makna digabungkan. Tak satu pun dari elemen ini ada tanpa satu sama lain: oleh karena itu, penutur asli memahami berbagai nuansa makna kata polisemantik sebagai elemen terpisah dalam keseluruhan struktural, dalam bahasa.

Dengan demikian, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama, fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein adalah berkembang, eksperimen terjadi pada bentuk dan konten dalam sastra, musik dan seni rupa), di sisi lain, dengan matematika (konsep sistemikitas sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti: Fenomena mulai ditafsirkan tidak dalam kaitannya dengan penyebab terjadinya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi berhenti menjadi independen dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

Berfungsinya mekanisme kebahasaan diwujudkan melalui aktivitas tutur penutur asli. Hasil ucapan adalah apa yang disebut "teks yang benar" - urutan unit ucapan yang mematuhi pola tertentu, banyak di antaranya memungkinkan deskripsi matematis. Teori cara untuk menggambarkan struktur sintaksis berkaitan dengan studi tentang metode untuk deskripsi matematis dari teks yang benar (terutama kalimat). Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Di Barat, ide-ide Saussure dikembangkan oleh ahli bahasa Swiss yang lebih muda sezaman: di Denmark - L. Hjelmslev, yang telah saya sebutkan, yang memunculkan teori bahasa aljabar dalam karyanya "Fundamentals of Linguistic Theory", di Amerika Serikat - E. Sapir, L. Bloomfield, C. Harris, di Republik Ceko - ilmuwan emigran Rusia N. Trubetskoy.

Keteraturan statistik dalam studi bahasa mulai ditangani tidak lain oleh pendiri genetika, Georg Mendel. Baru pada tahun 1968 para filolog menemukan bahwa, pada tahun-tahun terakhir hidupnya, ia terpesona oleh studi fenomena linguistik menggunakan metode matematika. Mendel membawa metode ini ke linguistik dari biologi; pada 1990-an, hanya ahli bahasa dan biologi paling berani yang mengklaim kelayakan analisis semacam itu. Di arsip biara St. Tomasz di Brno, yang kepala biaranya adalah Mendel, ditemukan lembaran dengan kolom nama keluarga yang diakhiri dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan perhitungan. Dalam upaya untuk menemukan hukum formal asal usul nama keluarga, Mendel membuat perhitungan yang rumit, di mana ia memperhitungkan jumlah vokal dan konsonan dalam bahasa Jerman, jumlah kata yang ia pertimbangkan, jumlah nama keluarga, dll.

Di negara kita, linguistik struktural mulai berkembang pada waktu yang hampir bersamaan dengan di Barat - pada pergantian abad ke-19-20. Bersamaan dengan F. de Saussure, konsep bahasa sebagai sistem dikembangkan dalam karya-karya mereka oleh profesor Universitas Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berhubungan untuk waktu yang lama dengan de Saussure, masing-masing, sekolah linguistik Jenewa dan Kazan berkolaborasi satu sama lain. Jika Saussure dapat disebut sebagai ideologis metode "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan dasar praktis untuk penerapannya. Dia adalah orang pertama yang memisahkan linguistik (sebagai tepat ilmu yang menggunakan metode statistik dan ketergantungan fungsional) dari filologi (komunitas disiplin ilmu kemanusiaan yang mempelajari budaya spiritual melalui bahasa dan ucapan). Ilmuwan itu sendiri percaya bahwa "linguistik dapat berguna dalam waktu dekat, hanya dibebaskan dari penyatuan wajib dengan filologi dan sejarah sastra" . Fonologi menjadi "tempat pengujian" untuk pengenalan metode matematika ke dalam linguistik - suara sebagai "atom" dari sistem bahasa, memiliki sejumlah sifat yang mudah diukur, adalah bahan yang paling nyaman untuk metode deskripsi formal dan ketat. Fonologi menyangkal keberadaan makna dalam suara, sehingga faktor "manusia" dihilangkan dalam penelitian. Dalam pengertian ini, fonem seperti objek fisik atau biologis.

Fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili bidang yang terpisah, "realitas fenomenologis" yang terpisah. Misalnya, dalam bahasa Inggris, suara "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, seseorang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Hal utama adalah bahwa fonem akan melakukan fungsi utamanya - bermakna -. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga varietas satu suara dalam satu bahasa dapat sesuai dengan fonem yang berbeda dalam bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain mereka adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan atau tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah seperangkat kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi suatu bahasa adalah seperangkat fitur yang terorganisir secara sistematis. Pada 1920-an hingga 1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Fitur-fitur ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara. Misalnya, dalam bahasa Inggris perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara) dan tingkat suara yang membedakan satu fonem dengan fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa". Bahkan yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa kondisi yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dengan demikian, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai seperangkat perbandingan dan oposisi bahasa. Bahasa adalah ekspresi makna kata dan sarana komunikasi, dan kedua fungsi ini tidak pernah bersamaan. Kita dapat melihat pergantian bentuk dan isi: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Ini berarti bahwa dalam suatu bahasa, ciri-ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari sekedar jumlah bagian-bagiannya.

Saussure mengusulkan gagasan tentang ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut ilmu ini sebagai semiologi (dari bahasa Yunani "semeion" - sebuah tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada 1920-an dan 1930-an dan di Paris pada 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan sastra yang disusun (atau dirumuskan) dengan bantuan struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya dalam linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama-nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: metode ini merupakan upaya untuk mempelajari dalam suatu sistem masalah "probabilitas" dalam bahasa. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang Saussure cari anagramnya, menurut Jean Starobinsky, adalah "alat bagi penyair, bukan sumber kehidupan puisi." Puisi berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran terlihat: “karena puisi diungkapkan tidak hanya dalam kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat. Lampiran 1).

Upaya Saussure untuk mempelajari nama diri dalam puisi Romawi akhir menekankan salah satu komponen analisis linguistiknya - sifat tanda yang arbitrer, serta esensi formal linguistik Saussure, yang mengesampingkan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa saat ini karya-karya Saussure tampak sangat konsisten dalam keengganannya untuk mempelajari simbol-simbol dari suatu fenomena yang memiliki makna yang terdefinisi dengan jelas [Lampiran 1]. Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, ia mendefinisikan simbol hanya untuk menetapkan mereka untuk pembacaan yang salah: jika mereka tidak disengaja, simbol tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang menggambarkan tidak hanya tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semiologi hanya dapat menggambarkan tanda-tanda acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak bisa membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya ini berubah menjadi sebuah pertanyaan. Sebaliknya, ia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas berdasarkan sejarah dan dugaan subjektif, dan metode interpretasi acak berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang menghapus pertentangan antara bentuk dan konten (subjek dan objek) , makna dan asal-usul dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum - tulisan-tulisan Ferdinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi makna dalam bahasa dan budaya.

Ilmuwan Rusia juga diwakili di Kongres Internasional Pertama Linguist di Den Haag pada tahun 1928. S. Kartsevsky, R. Yakobson dan N. Trubetskoy membuat laporan yang meneliti struktur hierarkis bahasa - dalam semangat gagasan paling modern untuk awal abad terakhir. Jakobson dalam tulisannya mengembangkan gagasan Saussure bahwa unsur-unsur dasar suatu bahasa harus dipelajari, pertama-tama, sehubungan dengan fungsinya, dan bukan dengan alasan kemunculannya.

Sayangnya, setelah Stalin berkuasa pada tahun 1924, linguistik Rusia, seperti banyak ilmu lainnya, terlempar ke belakang. Banyak ilmuwan berbakat terpaksa beremigrasi, diusir dari negara itu atau meninggal di kamp. Hanya sejak pertengahan 1950-an pluralisme teori tertentu menjadi mungkin - lebih lanjut tentang ini di Bagian 1.2.

1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Pada pertengahan abad kedua puluh, empat sekolah linguistik dunia telah terbentuk, yang masing-masing ternyata menjadi nenek moyang dari metode "tepat" tertentu. Sekolah Fonologi Leningrad(nenek moyangnya adalah mahasiswa Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis ucapan penutur asli sebagai kriteria utama untuk menggeneralisasi suara dalam bentuk fonem.

Ilmuwan Linguistik Praha, khususnya - pendirinya N.S. Trubetskoy, yang beremigrasi dari Rusia, mengembangkan teori oposisi - struktur semantik bahasa itu digambarkan oleh mereka sebagai satu set unit semantik yang dibangun secara oposisi - Sem. Teori ini diterapkan dalam studi tidak hanya bahasa, tetapi juga seni budaya.

Ideolog Deskriptivisme Amerika adalah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa disajikan kepada deskriptivis sebagai seperangkat pernyataan pidato, yang merupakan objek utama studi mereka. Fokus mereka adalah pada aturan deskripsi ilmiah (maka nama) teks: studi tentang organisasi, pengaturan dan klasifikasi elemen mereka. Formalisasi prosedur analitis di bidang fonologi dan morfologi (pengembangan prinsip-prinsip untuk studi bahasa pada tingkat yang berbeda, analisis distributif, metode konstituen langsung, dll) menyebabkan perumusan pertanyaan umum pemodelan linguistik. Kurangnya perhatian terhadap rencana isi bahasa, serta sisi paradigmatik bahasa, tidak memungkinkan para deskriptivis memaknai bahasa sebagai suatu sistem secara utuh.

Pada 1960-an, teori tata bahasa formal berkembang, yang muncul terutama karena karya filsuf dan ahli bahasa Amerika N. Chomsky. Dia dianggap sebagai salah satu ilmuwan dan tokoh masyarakat modern paling terkenal, banyak artikel, monografi, dan bahkan film dokumenter lengkap dipersembahkan untuknya. Dengan nama cara baru yang fundamental untuk menggambarkan struktur sintaksis yang ditemukan oleh Chomsky - tata bahasa generatif (generatif) - tren yang sesuai dalam linguistik disebut generativisme.

Chomsky, keturunan imigran dari Rusia, belajar linguistik, matematika dan filsafat di University of Pennsylvania sejak 1945, sangat dipengaruhi oleh gurunya Zelig Harris - seperti Harris, Chomsky menganggap dan masih menganggap pandangan politiknya dekat dengan anarkisme (dia masih dikenal sebagai kritikus sistem politik AS yang ada dan sebagai salah satu pemimpin spiritual anti-globalisme).

Karya ilmiah besar pertama Chomsky, tesis master "Morfologi Bahasa Ibrani Modern » (1951) tetap tidak dipublikasikan. Chomsky menerima gelar doktor dari University of Pennsylvania pada tahun 1955, tetapi banyak penelitian yang mendasari disertasinya (diterbitkan secara penuh hanya pada tahun 1975 dengan judul The Logical Structure of Linguistic Theory) dan monografi pertamanya, Syntactic Structures (1957, Rus. trans . 1962), dilakukan di Universitas Harvard pada tahun 1951-1955. Pada tahun 1955 yang sama, ilmuwan pindah ke Massachusetts Institute of Technology, di mana ia menjadi profesor pada tahun 1962.

Teori Chomsky telah melalui beberapa tahap dalam perkembangannya.

Dalam monografi pertama "Struktur Sintaksis", ilmuwan menyajikan bahasa sebagai mekanisme untuk menghasilkan rangkaian kalimat yang tak terbatas menggunakan seperangkat sarana tata bahasa yang terbatas. Untuk menggambarkan sifat-sifat linguistik, ia mengusulkan konsep kedalaman (tersembunyi dari persepsi langsung dan dihasilkan oleh sistem rekursif, yaitu, dapat diterapkan berulang kali, aturan) dan struktur gramatikal permukaan (dirasakan secara langsung), serta transformasi yang menggambarkan transisi dari struktur dalam ke struktur permukaan. Beberapa struktur permukaan dapat berhubungan dengan satu struktur dalam (misalnya, struktur pasif Keputusan tersebut ditandatangani oleh Presiden berasal dari Struktur Dalam yang sama dengan konstruksi aktif Presiden menandatangani dekrit) dan sebaliknya (dengan demikian, ambiguitas ibu mencintai anak perempuan digambarkan sebagai hasil kebetulan struktur permukaan yang kembali ke dua yang dalam yang berbeda, di salah satu ibu adalah orang yang mencintai anak perempuan, dan yang lain, orang yang dicintai oleh anak perempuan).

Teori standar Chomsky dianggap sebagai model "Aspek" yang ditetapkan dalam buku Chomsky "Aspek Teori Sintaks". Dalam model ini, untuk pertama kalinya, aturan interpretasi semantik diperkenalkan ke dalam teori formal, menghubungkan makna dengan struktur yang dalam. Dalam Aspek, kompetensi linguistik bertentangan dengan penggunaan bahasa (pertunjukan), yang disebut hipotesis Katz-Postal tentang pelestarian makna selama transformasi diadopsi, sehubungan dengan itu konsep transformasi opsional dikecualikan, dan aparatus fitur sintaksis yang menjelaskan kompatibilitas leksikal diperkenalkan.

Pada 1970-an, Chomsky mengerjakan teori kontrol dan pengikatan (teori GB - dari kata-kata pemerintah dan mengikat) lebih umum dari yang sebelumnya. Di dalamnya, ilmuwan meninggalkan aturan khusus yang menggambarkan struktur sintaksis bahasa tertentu. Semua transformasi telah diganti dengan satu transformasi gerakan universal. Dalam kerangka teori GB, ada juga modul pribadi, yang masing-masing bertanggung jawab atas bagian tata bahasanya sendiri.

Baru-baru ini, pada tahun 1995, Chomsky mengajukan program minimalis, di mana bahasa manusia digambarkan seperti bahasa mesin. Ini hanya sebuah program - bukan model atau teori. Di dalamnya, Chomsky mengidentifikasi dua subsistem utama perangkat bahasa manusia: leksikon dan sistem komputasi, serta dua antarmuka - fonetik dan logis.

Tata bahasa formal Chomsky telah menjadi klasik untuk menggambarkan tidak hanya bahasa alami tetapi juga bahasa buatan - khususnya, bahasa pemrograman. Perkembangan linguistik struktural pada paruh kedua abad ke-20 dapat dianggap sebagai "revolusi Chomskian".

Sekolah Fonologi Moskow, yang perwakilannya adalah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori serupa untuk mempelajari fonetik. Lambat laun, metode-metode "tepat" mulai diterapkan tidak hanya berkaitan dengan fonetik, tetapi juga sintaksis. Baik ahli bahasa maupun matematikawan, baik di dalam maupun di luar negeri, mulai mempelajari struktur bahasa. Pada 1950-an dan 60-an, tahap baru dalam interaksi antara matematika dan linguistik dimulai di Uni Soviet, terkait dengan pengembangan sistem terjemahan mesin.

Dorongan untuk permulaan karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (walaupun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, itu, menjadi primitif , tidak meluas). Pada tahun 1947, A. Butt dan D. Britten datang dengan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk memisahkan kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dari hari ini. Ini adalah mesin yang sangat besar dan mahal yang memenuhi seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan perhitungan matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP secara aktif didukung oleh militer, dengan semua ini (dalam kondisi Perang Dingin), arah Rusia-Inggris dikembangkan di AS, dan arah Anglo-Rusia di Uni Soviet.

Pada Januari 1954, "Eksperimen Georgetown" berlangsung di Massachusetts Technical University - demonstrasi publik pertama terjemahan dari bahasa Rusia ke bahasa Inggris di mesin IBM-701. Abstrak pesan tentang keberhasilan percobaan, dibuat oleh D.Yu. Panov, muncul di RJ "Matematika", 1954, No. 10: "Terjemahan dari satu bahasa ke bahasa lain menggunakan mesin: laporan tes pertama yang berhasil."

D. Yu. Panov (saat itu direktur Institut Informasi Ilmiah - INI, kemudian VINITI) menarik I. K. Belskaya, yang kemudian mengepalai kelompok penerjemahan mesin di Institut Matematika dan Teknik Komputer Akademi Ilmu Pengetahuan Uni Soviet, untuk bekerja pada terjemahan mesin. Pada akhir tahun 1955, pengalaman pertama menerjemahkan dari bahasa Inggris ke bahasa Rusia dengan bantuan mesin BESM sudah ada sejak dulu. Program untuk BESM disusun oleh N.P. Trifonov dan L.N. Korolev, yang tesis PhD-nya dikhususkan untuk metode pembuatan kamus untuk terjemahan mesin.

Secara paralel, pekerjaan terjemahan mesin dilakukan di Departemen Matematika Terapan Institut Matematika Akademi Ilmu Pengetahuan Uni Soviet (sekarang Institut Matematika Terapan M.V. Keldysh dari Akademi Ilmu Pengetahuan Rusia). Atas inisiatif matematikawan A.A. Lyapunov. Dia melibatkan O.S. Kulagin dan murid-muridnya T.D. Wentzel dan N.N. Riko. Gagasan Lyapunov dan Kulagina tentang kemungkinan penggunaan teknologi untuk menerjemahkan dari satu bahasa ke bahasa lain diterbitkan dalam jurnal Nature, 1955, No. 8. Sejak akhir tahun 1955, T.N. Moloshnaya, yang kemudian memulai pekerjaan independen pada algoritme terjemahan Inggris-Rusia.

R. Frumkina, yang pada waktu itu terlibat dalam algoritme terjemahan dari bahasa Spanyol, mengingat bahwa pada tahap pekerjaan ini sulit untuk mengambil langkah yang konsisten. Jauh lebih sering saya harus mengikuti pengalaman heuristik - saya sendiri atau rekan kerja.

Pada saat yang sama, generasi pertama dari sistem terjemahan mesin sangat tidak sempurna. Semuanya didasarkan pada algoritma terjemahan sekuensial "kata demi kata", "frase demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan dengan cara apa pun. Contoh kalimatnya adalah: John sedang mencari kotak mainannya.Akhirnya dia menemukannya. Kotak itu ada di dalam pena.John sangat senang. (John sedang mencari kotak mainannya. Akhirnya dia menemukannya. Kotak itu ada di playpen. John sangat senang.).” "Pena" dalam konteks ini bukanlah "pena" (alat tulis), tetapi "playpen" ( boks). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Seiring waktu, sistem terjemahan langsung digantikan oleh sistem-T (dari kata bahasa Inggris "transfer" - transformasi), di mana terjemahan dilakukan pada tingkat struktur sintaksis. Algoritme sistem-T menggunakan mekanisme yang memungkinkan untuk membangun struktur sintaksis sesuai dengan aturan tata bahasa dari bahasa kalimat input (mirip dengan bagaimana bahasa asing diajarkan di sekolah menengah), dan kemudian mensintesis kalimat output dengan mengubah struktur sintaksis dan mengganti kata-kata yang diperlukan dari kamus.

Lyapunov berbicara tentang terjemahan dengan mengekstraksi makna dari teks yang diterjemahkan dan menyajikannya dalam bahasa lain. Pendekatan membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Pada saat yang sama, tugas menciptakannya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya diselesaikan, terlepas dari upaya Federasi Internasional IFIP - komunitas ilmuwan dunia di bidang pemrosesan informasi. .

Para ilmuwan berpikir tentang bagaimana memformalkan dan membangun algoritma untuk bekerja dengan teks, kamus apa yang harus dimasukkan ke dalam mesin, pola linguistik apa yang harus digunakan dalam terjemahan mesin. Linguistik tradisional tidak memiliki gagasan seperti itu - tidak hanya dalam hal semantik, tetapi juga dalam hal sintaksis. Pada saat itu, tidak ada daftar konstruksi sintaksis untuk bahasa apa pun, kondisi kompatibilitas dan pertukarannya tidak dipelajari, aturan untuk membangun unit besar struktur sintaksis dari elemen penyusun yang lebih kecil tidak dikembangkan.

Kebutuhan untuk menciptakan dasar-dasar teoretis terjemahan mesin mengarah pada pembentukan dan pengembangan linguistik matematika. Peran utama dalam masalah ini di Uni Soviet dimainkan oleh matematikawan A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, ahli bahasa V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Disertasi Kulagina dikhususkan untuk mempelajari teori formal tata bahasa (bersamaan dengan N. Khomsky di AS), Kuznetsov mengajukan tugas aksiomatisasi linguistik, yang kembali ke karya-karya F.F. beruntung.

Pada 6 Mei 1960, Keputusan Presidium Akademi Ilmu Pengetahuan Uni Soviet "Tentang pengembangan metode struktural dan matematika untuk studi bahasa" diadopsi, dan divisi yang sesuai dibuat di Institut Linguistik dan Institut bahasa Rusia. Sejak 1960, universitas kemanusiaan terkemuka di negara itu - Fakultas Filologi Universitas Negeri Moskow, Leninrad, Universitas Novosibirsk, Institut Bahasa Asing Negeri Moskow - mulai melatih personel di bidang pemrosesan teks otomatis.

Pada saat yang sama, karya-karya terjemahan mesin pada periode ini, yang disebut "klasik", lebih bersifat teoritis daripada praktis. Sistem terjemahan mesin yang hemat biaya mulai dibuat hanya pada tahun delapan puluhan abad terakhir. Saya akan membicarakan ini nanti di Bagian 2.1, Terjemahan Mesin.

Tahun 1960-an - 70-an mencakup perkembangan teoretis yang mendalam menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan kabur.

Penulis teori medan dalam linguistik adalah penyair, penerjemah, dan ahli bahasa Soviet V.G. admoni. Dia awalnya mengembangkan teorinya berdasarkan bahasa Jerman. Bagi Admoni, konsep "bidang" menunjukkan serangkaian elemen linguistik yang tidak kosong (misalnya, "bidang leksikal", "bidang semantik").

Struktur bidang adalah heterogen: terdiri dari inti, elemen yang memiliki seperangkat fitur lengkap yang mendefinisikan suatu himpunan, dan pinggiran, elemen yang dapat memiliki kedua fitur dari himpunan yang diberikan (tidak semua) dan tetangga. Saya akan memberikan contoh yang menggambarkan pernyataan ini: misalnya, dalam bahasa Inggris, bidang kata majemuk ("mimpi siang" - "mimpi" sulit dipisahkan dari bidang frasa ("gas air mata" - "gas air mata") .

Teori himpunan fuzzy yang telah disebutkan di atas berkaitan erat dengan teori medan. Di Uni Soviet, ahli bahasa V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, bagaimanapun, nenek moyangnya adalah ahli matematika Amerika L. Zadeh, yang pada tahun 1965 menerbitkan artikel "Fuzzy Logic". Memberikan pembenaran matematis untuk teori himpunan kabur, Zade mempertimbangkannya berdasarkan materi linguistik.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen pada himpunan tertentu (Aa), tetapi tentang derajat keanggotaan ini (Aa), karena elemen periferal dapat dimiliki oleh beberapa bidang hingga derajat tertentu. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, sampai usia 12 ia berlatih berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris dan Persia - dan menggunakan tiga huruf yang berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan kabur dan linguistik, dia tidak menyangkal hubungan ini, tetapi menjelaskan: “Saya tidak yakin bahwa studi bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika ini masalahnya, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II ia beremigrasi ke Amerika Serikat. “Pertanyaannya bukanlah apakah saya orang Amerika, Rusia, Azerbaijan atau orang lain,” katanya dalam salah satu percakapan, “Saya dibentuk oleh semua budaya dan masyarakat ini dan merasa cukup nyaman di antara mereka masing-masing.” Dalam kata-kata ini ada sesuatu yang mirip dengan apa yang menjadi ciri teori himpunan kabur - penyimpangan dari definisi yang tidak ambigu dan kategori yang tajam.

Di negara kita, pada tahun 70-an, karya-karya ahli bahasa Barat abad kedua puluh diterjemahkan dan dipelajari. I.A. Melchuk menerjemahkan karya-karya N. Chomsky ke dalam bahasa Rusia. PADA. Slyusareva dalam bukunya "The Theory of F. de Saussure dalam Terang Linguistik Modern" menghubungkan postulat pengajaran Saussure dengan masalah linguistik aktual tahun 70-an. Ada kecenderungan ke arah matematisasi linguistik lebih lanjut. Universitas-universitas domestik terkemuka sedang melatih personel dalam "linguistik matematika (teoretis, terapan) khusus". Pada saat yang sama di Barat terjadi lompatan tajam dalam perkembangan teknologi komputer, yang membutuhkan semakin banyak landasan linguistik baru.

Pada 1980-an, Profesor Institut Studi Oriental dari Akademi Ilmu Pengetahuan Yu.K. Lekomtsev, ketika menganalisis bahasa linguistik melalui analisis skema, tabel, dan jenis notasi lain yang digunakan dalam deskripsi linguistik, menganggap sistem matematika cocok untuk tujuan ini (terutama sistem aljabar matriks).

Jadi, sepanjang abad kedua puluh, ada konvergensi eksak dan humaniora. Interaksi matematika dengan linguistik semakin banyak ditemukan aplikasi praktisnya. Lebih lanjut tentang ini di bab berikutnya.

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1 Terjemahan mesin

Gagasan untuk menerjemahkan dari satu bahasa ke bahasa lain dengan bantuan mekanisme universal muncul beberapa abad sebelum perkembangan pertama di bidang ini dimulai - pada tahun 1649, Rene Descartes mengusulkan gagasan tentang bahasa di mana gagasan yang setara bahasa yang berbeda akan diungkapkan oleh satu simbol. Upaya pertama untuk mengimplementasikan ide ini pada tahun 1930-an-40-an, awal perkembangan teoritis di pertengahan abad, perbaikan sistem penerjemahan dengan bantuan teknologi pada 1970-an-80-an, perkembangan pesat teknologi penerjemahan di akhir tahun. dekade - ini adalah tahapan dalam pengembangan terjemahan mesin sebagai sebuah industri. Dari karya-karya terjemahan mesin linguistik komputer sebagai ilmu telah berkembang.

Dengan perkembangan teknologi komputer di akhir 70-an dan awal 80-an, para peneliti menetapkan sendiri tujuan yang lebih realistis dan hemat biaya - mesin tidak menjadi pesaing (seperti yang diasumsikan sebelumnya), tetapi asisten penerjemah manusia. Terjemahan mesin berhenti melayani tugas-tugas militer secara eksklusif (semua penemuan dan penelitian Soviet dan Amerika, yang difokuskan terutama pada bahasa Rusia dan Inggris, berkontribusi pada Perang Dingin dalam satu atau lain cara). Pada tahun 1978, kata-kata bahasa alami ditransmisikan melalui jaringan interkoneksi Arpa, dan enam tahun kemudian, program terjemahan komputer mikro pertama muncul di Amerika Serikat.

Pada tahun 70-an, Komisi Komunitas Eropa membeli penerjemah komputer Systran versi Inggris-Prancis, memesan juga versi Prancis-Inggris dan Italia-Inggris, dan sistem terjemahan Rusia ke Inggris yang digunakan oleh Angkatan Bersenjata AS. Inilah bagaimana fondasi proyek EUROTRA diletakkan.

Tentang kebangkitan terjemahan mesin di tahun 70-80an. Fakta-fakta berikut bersaksi: Komisi Komunitas Eropa (CEC) membeli Systran versi Inggris-Prancis, serta sistem terjemahan dari Rusia ke Inggris (yang terakhir dikembangkan setelah laporan ALPAC dan terus digunakan oleh US Air Angkatan dan NASA); selain itu, CEC memerintahkan pengembangan versi Prancis-Inggris dan Italia-Inggris. Bersamaan dengan itu, ada ekspansi yang cepat dari aktivitas penerjemahan mesin di Jepang; di AS, Pan American Health Organization (PAHO) memerintahkan pengembangan arah bahasa Spanyol-Inggris (sistem SPANAM); Angkatan Udara AS mendanai pengembangan sistem terjemahan mesin di Pusat Penelitian Linguistik di Universitas Texas di Austin; Grup TAUM di Kanada membuat kemajuan penting dalam mengembangkan sistem METEO (terjemahan meteorologi) mereka. Sejumlah proyek dimulai pada tahun 70-an dan 80-an. kemudian berkembang menjadi sistem komersial penuh.

Selama periode 1978-93, 20 juta dolar dihabiskan untuk penelitian di bidang terjemahan mesin di AS, 70 juta di Eropa, dan 200 juta di Jepang.

Salah satu perkembangan baru adalah teknologi TM (translation memory), yang bekerja berdasarkan prinsip akumulasi: selama proses penerjemahan, segmen asli (kalimat) dan terjemahannya disimpan, sehingga terbentuk database linguistik; jika segmen yang identik atau serupa ditemukan dalam teks yang baru diterjemahkan, itu akan ditampilkan bersama dengan terjemahan dan indikasi kecocokan persentase. Penerjemah kemudian membuat keputusan (mengedit, menolak atau menerima terjemahan), yang hasilnya disimpan oleh sistem, sehingga tidak perlu menerjemahkan kalimat yang sama dua kali. Sebuah sistem komersial terkenal berdasarkan teknologi TM saat ini dikembangkan oleh sistem TRADOS (didirikan pada tahun 1984).

Saat ini, beberapa lusin perusahaan sedang mengembangkan sistem terjemahan mesin komersial, termasuk: Systran, IBM, L&H (Lernout & Hauspie), Bahasa Transparan, Lintas Bahasa, Perangkat Lunak Trident, Atril, Trados, Caterpillar Co., LingoWare; Perangkat Lunak Ata; Linguistik bv dan lain-lain Sekarang Anda dapat menggunakan layanan penerjemah otomatis langsung di Web: alphaWorks; Penerjemah Online PROMT; LogoMedia.net; Layanan Terjemahan Babel Fish dari AltaVista; InfiniT.com; Menerjemahkan Internet.

Sistem terjemahan yang efektif secara komersial muncul di paruh kedua tahun 80-an di negara kita juga. Konsep terjemahan mesin telah berkembang (mulai mencakup "pembuatan sejumlah sistem dan perangkat otomatis dan otomatis yang secara otomatis atau semi-otomatis melakukan seluruh siklus terjemahan atau tugas individu dalam dialog dengan seseorang"), dan alokasi pemerintah untuk pengembangan industri ini telah meningkat.

Rusia, Inggris, Jerman, Prancis, dan Jepang menjadi bahasa utama sistem terjemahan domestik. All-Union Translation Center (VTsP) mengembangkan sistem untuk menerjemahkan dari bahasa Inggris dan Jerman ke bahasa Rusia di komputer ES-1035-ANRAP. Ini terdiri dari tiga kamus - masukan bahasa Inggris dan Jerman dan keluaran Rusia - di bawah satu perangkat lunak. Ada beberapa kamus khusus yang dapat dipertukarkan - untuk teknologi komputer, pemrograman, elektronik radio, teknik mesin, pertanian, metalurgi. Sistem dapat bekerja dalam dua mode - otomatis dan interaktif, ketika layar menampilkan teks sumber dan terjemahan per frasa, yang dapat diedit oleh seseorang. Kecepatan menerjemahkan teks ke dalam ANRAP (dari awal pengetikan hingga akhir pencetakan) kurang lebih 100 halaman per jam.

Pada tahun 1989, sebuah keluarga penerjemah komersial jenis SPRINT dibuat, bekerja dengan bahasa Rusia, Inggris, Jerman, dan Jepang. Keuntungan utama mereka adalah kompatibilitasnya dengan PC IBM - dengan demikian, sistem terjemahan mesin domestik mencapai tingkat kualitas internasional. Pada saat yang sama, sistem terjemahan mesin dari bahasa Prancis ke FRAP Rusia sedang dikembangkan, yang mencakup 4 tahap analisis teks: grafik, morfologi, sintaksis, dan semantik. Di LGPI mereka. Herzen, pekerjaan sedang berlangsung pada sistem SILOD-MP empat bahasa (Inggris, Prancis, Spanyol, Rusia) (kamus Inggris-Rusia dan Prancis-Rusia digunakan dalam mode industri.

Untuk terjemahan khusus teks-teks tentang teknik elektro, sistem ETAP-2 ada. Analisis teks masukan di dalamnya dilakukan pada dua tingkat - morfologis dan sintaksis. Kamus ETAP-2 berisi sekitar 4 ribu entri; tahap transformasi teks - sekitar 1000 aturan (96 umum, 342 pribadi, sisanya adalah kamus). Semua ini memastikan kualitas terjemahan yang memuaskan (katakanlah, judul paten "Pengaturan grid fase optik dan perangkat kopling yang memiliki pengaturan seperti itu" diterjemahkan sebagai "Perangkat grid fase optik dan perangkat penghubung dengan perangkat semacam itu" - terlepas dari tautologi, artinya dipertahankan).

Di Institut Pedagogis Bahasa Asing Minsk, berdasarkan kamus bentuk kata dan frasa bahasa Inggris-Rusia, sebuah sistem untuk terjemahan mesin judul ditemukan, di Institut Studi Oriental dari Akademi Ilmu Pengetahuan - sebuah sistem untuk menerjemahkan dari bahasa Jepang ke bahasa Rusia. Layanan kosakata dan terminologi otomatis pertama (SLOTHERM) untuk komputasi dan pemrograman, dibuat di Institut Penelitian Sistem Otomasi Moskow, berisi sekitar 20.000 istilah dalam kamus penjelasan dan kamus khusus untuk penelitian linguistik.

Sistem terjemahan mesin secara bertahap mulai digunakan tidak hanya untuk tujuan yang dimaksudkan, tetapi juga sebagai komponen penting dari sistem pembelajaran otomatis (untuk mengajar terjemahan, memeriksa ejaan dan pengetahuan tata bahasa).

Tahun 90-an membawa serta perkembangan pesat pasar PC (dari desktop ke saku) dan teknologi informasi, meluasnya penggunaan Internet (yang menjadi lebih internasional dan multibahasa). Semua ini membuat pengembangan lebih lanjut dari sistem terjemahan otomatis diminati. Sejak awal 1990-an Pengembang dalam negeri juga memasuki pasar sistem PC.

Pada bulan Juli 1990, sistem terjemahan mesin komersial pertama di Rusia yang disebut PROMT (Programmer's Machine Translation) dipresentasikan di Forum PC di Moskow.Pada tahun 1991, ZAO [!!! Sesuai dengan Undang-Undang Federal-99 05.05.2014, formulir ini digantikan oleh perusahaan saham gabungan non-publik] "Proyek MT", dan sudah pada tahun 1992, perusahaan PROMT memenangkan kompetisi NASA untuk pasokan sistem MP (PROMT adalah satu-satunya perusahaan non-Amerika dalam kompetisi ini). seluruh keluarga sistem dengan nama baru STYLUS untuk menerjemahkan dari bahasa Inggris, Jerman, Prancis, Italia, dan Spanyol ke Rusia dan dari Rusia ke Inggris, dan pada tahun 1993, berdasarkan STYLUS, sistem terjemahan mesin pertama di dunia untuk Windows telah dibuat. untuk Windows 3.X/95/NT dirilis, dan pada 1995-1996 generasi ketiga sistem terjemahan mesin, STYLUS 3.0 32-bit sepenuhnya untuk Windows 95/NT, diperkenalkan, pada saat yang sama, pengembangan sepenuhnya baru, sistem terjemahan mesin Rusia-Jerman dan Rusia-Prancis pertama di dunia.

Pada tahun 1997, sebuah perjanjian ditandatangani dengan perusahaan Prancis Softissimo tentang pembuatan sistem terjemahan dari bahasa Prancis ke bahasa Jerman dan Inggris dan sebaliknya, dan pada bulan Desember tahun ini, sistem terjemahan Jerman-Prancis pertama di dunia dirilis. Pada tahun yang sama, perusahaan PROMT merilis sistem yang diimplementasikan menggunakan teknologi Gigant, yang mendukung beberapa arah bahasa dalam satu cangkang, serta penerjemah khusus untuk bekerja di WebTranSite Internet.

Pada tahun 1998, seluruh konstelasi program dirilis dengan nama baru PROMT 98. Setahun kemudian, PROMT merilis dua produk baru: paket perangkat lunak unik untuk bekerja di Internet - Internet PROMT, dan penerjemah untuk sistem surat perusahaan - Surat PROMT Penerjemah. Pada bulan November 1999, PROMT diakui sebagai sistem terjemahan mesin terbaik yang diuji oleh majalah Prancis PC Expert, mengungguli pesaingnya sebesar 30 persen. Solusi server khusus juga telah dikembangkan untuk klien korporat - server terjemahan korporat PROMT Translation Server (PTS) dan solusi Internet PROMT Internet Translation Server (PITS). Pada tahun 2000, PROMT memperbarui seluruh lini produk perangkat lunaknya dengan merilis generasi baru sistem MT: PROMT Translation Office 2000, PROMT Internet 2000 dan Magic Gooddy 2000.

Terjemahan online dengan dukungan sistem PROMT digunakan di sejumlah situs domestik dan asing: Penerjemah Online PROMT, InfiniT.com, Translate.Ru, Lycos, dll., serta di lembaga berbagai profil untuk menerjemahkan dokumen bisnis, artikel dan surat (ada sistem terjemahan yang dibangun langsung ke Outlook Express dan klien email lainnya).

Saat ini, teknologi terjemahan mesin baru muncul berdasarkan penggunaan sistem kecerdasan buatan dan metode statistik. Tentang yang terakhir - di bagian selanjutnya.

2.2 Ekstrametode ical dalam pembelajaran bahasa

Perhatian yang cukup besar dalam linguistik modern diberikan pada studi fenomena linguistik dengan menggunakan metode matematika kuantitatif. Data kuantitatif sering membantu untuk lebih memahami fenomena yang diteliti, tempat dan perannya dalam sistem fenomena terkait. Jawaban atas pertanyaan "seberapa banyak" membantu menjawab pertanyaan "apa", "bagaimana", "mengapa" - itulah potensi heuristik dari karakteristik kuantitatif.

Metode statistik memainkan peran penting dalam pengembangan sistem terjemahan mesin (lihat bagian 2.1). Dalam pendekatan statistik, masalah translasi dianggap sebagai saluran yang bising. Bayangkan kita perlu menerjemahkan kalimat dari bahasa Inggris ke bahasa Rusia. Prinsip saluran bising memberi kita penjelasan berikut tentang hubungan antara kalimat bahasa Inggris dan bahasa Rusia: kalimat bahasa Inggris tidak lain adalah kalimat bahasa Rusia yang terdistorsi oleh semacam kebisingan. Untuk memulihkan kalimat asli bahasa Rusia, kita perlu mengetahui apa yang biasanya diucapkan orang dalam bahasa Rusia dan bagaimana frasa bahasa Rusia terdistorsi ke dalam bahasa Inggris. Penerjemahan dilakukan dengan mencari kalimat Rusia seperti itu yang memaksimalkan produk dari probabilitas tanpa syarat dari kalimat Rusia dan probabilitas kalimat bahasa Inggris (asli) yang diberikan kalimat Rusia yang diberikan. Menurut teorema Bayes, kalimat bahasa Rusia ini adalah terjemahan bahasa Inggris yang paling mungkin:

di mana e adalah kalimat terjemahan dan f adalah kalimat aslinya

Jadi kita membutuhkan model sumber dan model saluran, atau model bahasa dan model terjemahan. Model bahasa harus menetapkan skor probabilitas untuk setiap kalimat dalam bahasa target (dalam kasus kami, Rusia), dan model terjemahan ke kalimat aslinya. (lihat tabel 1)

Secara umum, sistem terjemahan mesin beroperasi dalam dua mode:

1. Pelatihan sistem: korpus pelatihan teks paralel diambil, dan menggunakan pemrograman linier, nilai-nilai tabel korespondensi terjemahan seperti itu dicari yang memaksimalkan kemungkinan (misalnya) bagian korpus Rusia dengan bahasa Inggris yang tersedia sesuai ke model terjemahan yang dipilih. Model bahasa Rusia dibangun di bagian Rusia dari korpus yang sama.

2. Eksploitasi: berdasarkan data yang diperoleh untuk kalimat bahasa Inggris yang tidak dikenal, bahasa Rusia dicari yang memaksimalkan produk dari probabilitas yang ditetapkan oleh model bahasa dan model terjemahan. Program yang digunakan untuk pencarian semacam itu disebut dekoder.

Model terjemahan statistik yang paling sederhana adalah model terjemahan literal. Dalam model ini, diasumsikan bahwa untuk menerjemahkan kalimat dari satu bahasa ke bahasa lain, cukup untuk menerjemahkan semua kata (membuat "kantong kata"), dan model akan memberikan penempatannya dalam urutan yang benar. P(a, f | e) ke P(a | e , f), mis. probabilitas keselarasan yang diberikan diberikan sepasang kalimat, setiap probabilitas P(a, f | e) dinormalisasi dengan jumlah dari probabilitas semua kesejajaran dari pasangan kalimat yang diberikan:

Implementasi dari algoritma Viterbi yang digunakan untuk melatih Model #1 adalah sebagai berikut:

1. Seluruh tabel probabilitas korespondensi translasi diisi dengan nilai yang sama.

2. Untuk semua kemungkinan varian hubungan berpasangan kata, probabilitas P(a, f | e) dihitung:

3. Nilai P(a, f | e) dinormalisasi untuk mendapatkan nilai P(a | e, f).

4. Frekuensi setiap pasangan terjemahan dihitung, dibobot dengan probabilitas setiap opsi penyelarasan.

5. Frekuensi tertimbang yang dihasilkan dinormalisasi dan membentuk tabel baru probabilitas korespondensi terjemahan

6. Algoritma diulang dari langkah 2.

Pertimbangkan, sebagai contoh, pelatihan model serupa pada korpus dua pasang kalimat (Gbr. 2):

Gedung Putih

Setelah banyak iterasi, kita akan mendapatkan tabel (Tabel 2), yang menunjukkan bahwa terjemahan dilakukan dengan akurasi tinggi.

Juga, metode statistik banyak digunakan dalam studi kosa kata, morfologi, sintaksis, dan gaya. Para ilmuwan dari Perm State University melakukan penelitian berdasarkan pernyataan bahwa frase stereotip adalah "bahan bangunan" penting dari teks. Frasa ini terdiri dari kata berulang "nuklir" dan penentu kata dependen dan memiliki pewarnaan gaya yang jelas.

Dalam gaya ilmiah, kata-kata "nuklir" dapat disebut: penelitian, studi, tugas, masalah, pertanyaan, fenomena, fakta, observasi, analisis dll. Dalam jurnalisme, kata lain adalah “nuklir”, yang memiliki nilai tambah khusus untuk teks surat kabar: waktu, orang, kekuatan, bisnis, tindakan, hukum, kehidupan, sejarah, tempat" dll. (jumlah 29)

Yang menarik bagi ahli bahasa juga adalah diferensiasi profesional bahasa nasional, orisinalitas penggunaan kosa kata dan tata bahasa, tergantung pada jenis pekerjaan. Diketahui bahwa pengemudi dalam pidato profesional menggunakan formulir w tentang fer, petugas medis mengatakan k tentang klub bukannya koktail Yu sh - contoh seperti itu dapat diberikan. Tugas statistik adalah melacak keragaman pengucapan dan perubahan norma bahasa.

Perbedaan profesional menyebabkan perbedaan tidak hanya gramatikal, tetapi juga leksikal. Universitas Negeri Yakut dinamai MK Ammosov, 50 kuesioner dianalisis dengan reaksi paling umum terhadap kata-kata tertentu di antara dokter dan pembangun (Tabel 3).

		pembangun
Manusia	pasien (10), kepribadian (5)	pria (5)
bagus	bantuan (8), bantuan (7)	jahat (16)
kehidupan	kematian (10)	indah (5)
kematian	mayat (8)	hidup (6)
api	panas (8), terbakar (6)	api (7)
jari	tangan (14), panaritium (5)	besar (7), indeks (6)
mata	penglihatan (6), murid, dokter mata (5 masing-masing)	coklat (10), besar (6)
kepala	pikiran (14), otak (5)	besar (9), pintar (8), pintar (6)
kehilangan	kesadaran, kehidupan (masing-masing 4)	uang (5), temukan (4)

Dapat dicatat bahwa dokter lebih sering daripada pembangun memberikan asosiasi yang berkaitan dengan kegiatan profesional mereka, karena kata-kata stimulus yang diberikan dalam kuesioner lebih berkaitan dengan profesi mereka daripada dengan profesi pembangun.

Keteraturan statistik dalam suatu bahasa digunakan untuk membuat kamus frekuensi - kamus yang memberikan karakteristik numerik dari frekuensi kata (bentuk kata, frasa) dari bahasa apa pun - bahasa penulis, karya apa pun, dll. Biasanya, frekuensi kemunculan kata digunakan sebagai ciri frekuensi kemunculan kata dalam teks volume tertentu

Model persepsi bicara tidak mungkin tanpa kamus sebagai komponen esensialnya. Dalam persepsi bicara, unit operasional dasar adalah kata. Dari sini dapat disimpulkan, khususnya, bahwa setiap kata dari teks yang dirasakan harus diidentifikasi dengan unit yang sesuai dari kosakata internal pendengar (atau pembaca). Wajar untuk berasumsi bahwa sejak awal pencarian terbatas pada beberapa subdomain kamus. Menurut sebagian besar teori persepsi ucapan modern, analisis fonetik aktual dari teks yang terdengar dalam kasus yang khas hanya memberikan beberapa informasi parsial tentang kemungkinan penampilan fonologis kata tersebut, dan informasi semacam ini tidak sesuai dengan satu, tetapi BANYAK kata tertentu. dari kamus; Oleh karena itu, muncul dua masalah:

(a) pilih set yang sesuai menurut parameter tertentu;

(b) dalam batas-batas set yang diuraikan (jika dialokasikan secara memadai) untuk "menghilangkan" semua kata, kecuali satu-satunya yang paling sesuai dengan kata tertentu dari teks yang dikenali. Salah satu strategi "putus" adalah mengecualikan kata-kata berfrekuensi rendah. Oleh karena itu, kosakata untuk persepsi bicara adalah kamus frekuensi. Ini adalah pembuatan versi komputer dari kamus frekuensi bahasa Rusia yang merupakan tugas awal dari proyek yang disajikan.

Berdasarkan materi bahasa Rusia, ada 5 kamus frekuensi (tidak termasuk kamus cabang). Mari kita perhatikan hanya beberapa kekurangan umum dari kamus yang ada.

Semua kamus frekuensi yang diketahui dari bahasa Rusia didasarkan pada susunan pemrosesan teks tertulis (tercetak). Sebagian karena alasan ini, ketika identitas sebuah kata sebagian besar didasarkan pada kebetulan grafis formal, semantik tidak cukup diperhitungkan. Akibatnya, karakteristik frekuensi juga bergeser, terdistorsi; misalnya, jika penyusun kamus frekuensi memasukkan kata-kata dari kombinasi "satu sama lain" dalam statistik umum penggunaan kata "teman", maka ini hampir tidak dapat dibenarkan: mengingat semantik, kita harus mengakui bahwa ini sudah kata-kata yang berbeda, atau lebih tepatnya, bahwa unit kamus independen hanyalah kombinasi secara keseluruhan.

Juga, di semua kamus yang ada, kata-kata ditempatkan hanya dalam bentuk dasarnya: kata benda dalam bentuk tunggal, kasus nominatif, kata kerja dalam bentuk infinitif, dll. Beberapa kamus memberikan informasi tentang frekuensi bentuk kata, tetapi biasanya mereka tidak melakukannya dengan cukup konsisten, tidak secara menyeluruh. Frekuensi bentuk kata yang berbeda dari kata yang sama jelas tidak cocok. Pengembang model persepsi ucapan harus memperhitungkan bahwa dalam proses persepsi nyata, justru bentuk kata tertentu yang "dibenamkan" dalam teks yang dapat dikenali: berdasarkan analisis bagian awal eksponen Dari bentuk kata, satu set kata dengan awal yang identik terbentuk, dan bagian awal dari bentuk kata tidak harus identik dengan bagian awal dari bentuk kamus. Ini adalah bentuk kata yang memiliki struktur ritmik tertentu, yang juga merupakan parameter yang sangat penting untuk pemilihan persepsi kata. Akhirnya, dalam representasi akhir dari ucapan yang dikenali, sekali lagi, kata-kata diwakili oleh bentuk kata yang sesuai.

Ada banyak karya yang menunjukkan pentingnya frekuensi dalam proses persepsi bicara. Tetapi kami tidak mengetahui karya-karya di mana frekuensi bentuk kata akan digunakan - sebaliknya, semua penulis praktis mengabaikan frekuensi bentuk kata individu, merujuk secara eksklusif pada leksem. Jika hasil yang diperoleh mereka tidak dianggap artefak, kita harus berasumsi bahwa penutur asli entah bagaimana memiliki akses ke informasi tentang rasio frekuensi bentuk kata dan bentuk kamus, yaitu, pada kenyataannya, leksem. Selain itu, transisi seperti itu dari bentuk kata ke leksem, tentu saja, tidak dapat dijelaskan dengan pengetahuan alami dari paradigma yang sesuai, karena informasi frekuensi harus digunakan sebelum identifikasi akhir kata, jika tidak maka akan kehilangan maknanya.

Menurut karakteristik statistik utama, adalah mungkin untuk menentukan dengan kesalahan relatif yang diberikan bagian dari kosa kata, yang mencakup kata-kata dengan frekuensi kemunculan yang tinggi, terlepas dari jenis teksnya. Juga dimungkinkan, dengan memasukkan urutan bertahap ke dalam kamus, untuk memperoleh serangkaian kamus yang mencakup 100, 1000, 5000, dst. dari kata-kata yang sering muncul. Karakteristik statistik kamus menarik sehubungan dengan analisis semantik kosa kata. Kajian kelompok subjek-ideologis dan bidang semantik menunjukkan bahwa asosiasi leksikal didukung oleh tautan semantik yang terkonsentrasi di sekitar leksem dengan makna yang paling umum. Penggambaran makna dalam bidang leksiko-semantik dapat dilakukan dengan mengidentifikasi kata-kata dengan leksem yang paling abstrak maknanya. Rupanya, unit kamus "kosong" (dari sudut pandang potensi nominatif) merupakan lapisan yang homogen secara statistik.

Kosakata untuk genre individu tidak kalah berharganya. Mempelajari ukuran kesamaan mereka dan sifat distribusi statistik akan memberikan informasi menarik tentang stratifikasi kualitatif kosa kata tergantung pada lingkup penggunaan ucapan.

Penyusunan kamus frekuensi besar membutuhkan penggunaan teknologi komputer. MEMPERKENALKAN mekanisasi parsial dan otomatisasi ke dalam proses pengerjaan kamus menarik sebagai eksperimen dalam pemrosesan mesin kamus untuk teks yang berbeda. Kamus semacam itu membutuhkan sistem yang lebih ketat untuk memproses dan mengumpulkan materi kosa kata. Secara miniatur, ini merupakan sistem temu kembali informasi yang mampu memberikan informasi tentang berbagai aspek teks dan kosa kata. Beberapa permintaan dasar ke sistem ini direncanakan sejak awal: jumlah total kata inventaris, karakteristik statistik dari satu kata dan seluruh kamus, urutan zona kamus yang sering dan jarang, dll. File kartu mesin memungkinkan Anda untuk secara otomatis membuat kamus terbalik untuk genre dan sumber individual. Banyak informasi statistik berguna lainnya tentang bahasa akan diekstraksi dari kumpulan informasi yang terakumulasi. Kamus frekuensi komputer menciptakan dasar eksperimental untuk transisi ke otomatisasi pekerjaan kosakata yang lebih ekstensif.

Data statistik kamus frekuensi juga dapat digunakan secara luas dalam memecahkan masalah linguistik lainnya - misalnya, dalam menganalisis dan menentukan cara aktif pembentukan kata bahasa Rusia modern, memecahkan masalah peningkatan grafik dan ejaan, yang terkait dengan mempertimbangkan memperhitungkan informasi statistik tentang kosa kata (dengan semua ini, penting untuk mempertimbangkan karakteristik probabilistik kombinasi grafem, jenis kombinasi huruf yang diwujudkan dalam kata-kata), transkripsi praktis dan transliterasi. Parameter statistik kamus juga akan berguna dalam memecahkan masalah pengetikan otomatis, pengenalan dan pembacaan otomatis teks literal.

Kamus penjelasan modern dan tata bahasa bahasa Rusia sebagian besar dibangun berdasarkan teks sastra dan seni. Ada kamus frekuensi bahasa A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky dan banyak penulis lainnya. Di Departemen Sejarah dan Teori Sastra Negara Smolensk. Universitas Pedagogis telah bekerja selama beberapa tahun untuk menyusun kamus frekuensi teks puitis dan prosa. Untuk penelitian ini, kamus frekuensi semua lirik Pushkin dan dua penyair lagi dari zaman keemasan - "Celakalah dari Kecerdasan" oleh Griboyedov dan semua puisi Lermontov dipilih; Pasternak dan lima penyair Zaman Perak lainnya - Balmont 1894-1903, "Puisi tentang Wanita Cantik" oleh Blok, "Batu" oleh Mandelstam, "Pilar Api" oleh Gumilyov, "Anno Domini MCMXXI" oleh Akhmatova dan "Sisters of My Life" oleh Pasternak dan empat penyair lagi dari Zaman Besi - "Puisi oleh Yuri Zhivago", "When it clear up", seluruh kumpulan lirik oleh M. Petrovs, "Jalannya jauh", "Windscreen", "Perpisahan dengan salju" dan "Sepatu Kuda" oleh Mezhirov, "Antimirov" oleh Voznesensky dan "Bola Salju » Rylenkova.

Perlu dicatat bahwa kamus ini berbeda sifatnya: beberapa mewakili kosakata satu karya dramatis, yang lain - buku lirik, atau beberapa buku, atau seluruh kumpulan puisi penyair. Hasil analisis yang disajikan dalam makalah ini harus diambil dengan hati-hati, mereka tidak dapat dianggap sebagai sesuatu yang mutlak. Pada saat yang sama, dengan bantuan langkah-langkah khusus, perbedaan sifat ontologis teks dapat dikurangi sampai batas tertentu.

Dalam beberapa tahun terakhir, pertentangan antara bahasa sehari-hari dan pidato buku menjadi semakin jelas. Masalah ini secara khusus didiskusikan dengan tajam di antara para ahli metodologi yang menuntut pergantian pengajaran ke bahasa lisan. Pada saat yang sama, kekhususan pidato sehari-hari masih belum dapat dijelaskan.

Kamus diproses dengan membuat aplikasi pengguna di lingkungan program perkantoran EXCEL97. Aplikasi ini mencakup empat lembar kerja buku EXCEL - "Lembar Judul", lembar "Kamus" dengan data awal, "Kedekatan" dan "Jarak" dengan hasil, serta satu set makro.

Informasi awal dimasukkan pada lembar "Kamus". Kamus teks yang dipelajari ditulis ke dalam sel EXCEL, kolom terakhir S dibentuk dari hasil yang diperoleh dan sama dengan jumlah kata yang ditemukan di kamus lain. Tabel "Kedekatan" dan "Jarak" berisi ukuran yang dihitung dari kedekatan M, korelasi R dan jarak D.

Makro aplikasi adalah prosedur pemrograman berbasis peristiwa yang ditulis dalam Visual Basic for Application (VBA). Prosedur didasarkan pada objek perpustakaan VBA dan metode pemrosesannya. Jadi, untuk operasi dengan lembar kerja aplikasi, objek kunci Lembar kerja (lembar kerja) dan metode yang sesuai untuk mengaktifkan lembar Aktifkan (aktifkan) digunakan. Pengaturan rentang data sumber yang dianalisis pada lembar Kamus dilakukan dengan metode Pilih objek Rentang (rentang), dan transfer kata sebagai nilai ke variabel dilakukan sebagai properti Nilai (nilai) dari Rentang yang sama obyek.

Terlepas dari kenyataan bahwa analisis korelasi peringkat membuat kita berhati-hati tentang ketergantungan topik antara teks yang berbeda, sebagian besar kata yang paling sering dalam setiap teks memiliki kecocokan dalam satu atau lebih teks lainnya. Kolom S menunjukkan jumlah kata tersebut di antara 15 kata yang paling sering digunakan untuk setiap penulis. Kata-kata yang dicetak tebal hanya muncul dalam satu kata penyair di tabel kita. Blok, Akhmatova dan Petrovs tidak memiliki kata yang disorot sama sekali, mereka memiliki S = 15. Ketiga penyair ini memiliki 15 kata yang paling sering sama, mereka hanya berbeda di tempat dalam daftar. Tetapi bahkan Pushkin, yang kosakatanya paling orisinal, memiliki S = 8, dan ada 7 kata yang disorot.

Hasil penelitian menunjukkan bahwa ada lapisan kosakata tertentu yang mengkonsentrasikan tema-tema utama puisi. Biasanya, kata-kata ini pendek: dari jumlah total (225) penggunaan kata satu suku kata 88, dua suku kata 127, tiga suku kata 10. Seringkali kata-kata ini mewakili mitologi utama dan dapat berpasangan: malam - siang, bumi - langit (matahari), Tuhan - manusia (manusia), hidup - mati, tubuh - jiwa, Roma - dunia(di Mandelstam); dapat digabungkan menjadi mitologi tingkat yang lebih tinggi: langit, bintang, matahari, bumi; pada seseorang, sebagai aturan, tubuh, jantung, darah, lengan, kaki, pipi, mata menonjol. Dari keadaan manusia, preferensi diberikan untuk tidur dan cinta. Rumah dan kota milik dunia manusia - Moskow, Roma, Paris. Kreativitas diwakili oleh leksem kata dan lagu.

Griboedov dan Lermontov hampir tidak memiliki kata yang menunjukkan alam di antara kata-kata yang paling sering digunakan. Mereka memiliki tiga kali lebih banyak kata yang menunjukkan seseorang, bagian tubuhnya, elemen dunia spiritualnya. Pushkin dan penyair abad kedua puluh. sebutan manusia dan alam kira-kira sama. Dalam aspek penting dari subjek ini, kita dapat mengatakan bahwa abad kedua puluh. mengikuti Pushkin.

Tema Minimal kasus di antara kata-kata yang paling sering, itu hanya ditemukan di Griboyedov dan Pushkin. Lermontov dan penyair abad kedua puluh. itu memberi jalan ke tema minimal kata. Kata tidak mengecualikan perbuatan (interpretasi alkitabiah dari topik: dalam Perjanjian Baru, semua ajaran Yesus Kristus dianggap sebagai firman Allah atau firman Yesus, dan para rasul kadang-kadang menyebut diri mereka pelayan Firman). Makna suci dari kata leksem dimanifestasikan secara meyakinkan, misalnya, dalam ayat Pasternak "Dan gambar dunia, terungkap dalam Firman." Makna sakral dari leksem kata dalam hubungannya dengan dan kontras dengan urusan manusia, itu dimanifestasikan secara meyakinkan dalam puisi dengan nama yang sama oleh Gumilyov.

Token yang ditemukan hanya dalam satu teks mencirikan orisinalitas buku atau koleksi buku tertentu. Misalnya, kata "pikiran" adalah yang paling sering muncul dalam komedi Griboedov "Celakalah dari Kecerdasan" - tetapi kata itu tidak muncul di antara kata-kata frekuensi dari teks lain. Tema pikiran sejauh ini adalah yang paling penting dalam komedi. Leksem ini menyertai citra Chatsky, dan nama Chatsky adalah yang paling sering muncul dalam komedi. Dengan demikian, karya tersebut secara organik menggabungkan kata benda umum yang paling sering muncul dengan nama diri yang paling sering.

Koefisien korelasi tertinggi menghubungkan tema-tema buku tragis karya Gumilyov "The Pillar of Fire" dan "Anno Domini MCMXXI" karya Akhmatova. Di antara 15 kata benda yang paling sering, ada 10 kata benda yang umum, termasuk darah, hati, jiwa, cinta, kata, langit. Ingatlah bahwa buku Akhmatova termasuk miniatur "Kamu tidak akan hidup ...", yang ditulis di antara penangkapan Gumilyov dan eksekusinya.

Tema lilin dan kerumunan dalam materi yang dipelajari hanya ditemukan dalam "Puisi Yuri Zhivago". Tema lilin dalam ayat-ayat dari novel memiliki banyak makna kontekstual: dikaitkan dengan gambar Yesus Kristus, dengan tema iman, keabadian, kreativitas, tanggal cinta. Lilin adalah sumber cahaya terpenting dalam adegan sentral novel. Tema kerumunan berkembang sehubungan dengan ide utama novel, di mana kehidupan pribadi seseorang dengan nilai-nilainya yang tak tergoyahkan bertentangan dengan amoralitas negara baru, yang dibangun di atas prinsip-prinsip menyenangkan orang banyak. .

Pekerjaan ini juga melibatkan tahap ketiga, yang juga tercermin dalam program - ini adalah perhitungan perbedaan jumlah urut kata yang umum untuk dua kamus dan jarak rata-rata antara kata yang sama dari dua kamus. Tahap ini memungkinkan perpindahan dari tren umum dalam interaksi kamus yang diidentifikasi dengan bantuan statistik ke tingkat yang mendekati teks. Misalnya, buku Gumilyov dan Akhmatova berkorelasi secara statistik secara signifikan. Kami melihat kata-kata mana yang ternyata umum untuk kamus mereka, dan pertama-tama kami memilih kata-kata yang nomor serinya berbeda minimal atau sama dengan nol. Kata-kata inilah yang memiliki nomor rangking yang sama dan, oleh karena itu, tema minimal di benak kedua penyair inilah yang sama pentingnya. Selanjutnya, Anda harus pindah ke tingkat teks dan konteks.

Metode kuantitatif juga membantu mempelajari karakteristik masyarakat - penutur asli. Katakanlah, ada 6 kasus dalam bahasa Rusia, tidak ada kasus dalam bahasa Inggris, dan dalam beberapa bahasa masyarakat Dagestan, jumlah kasus mencapai 40. L. Perlovsky dalam artikelnya "Kesadaran, bahasa dan budaya" menghubungkan ini karakteristik dengan kecenderungan orang untuk individualisme atau kolektivisme, dengan persepsi hal-hal dan fenomena secara terpisah atau sehubungan dengan orang lain. Lagi pula, di dunia berbahasa Inggris (tidak ada kasus - hal itu dirasakan "dengan sendirinya") bahwa konsep-konsep seperti kebebasan individu, liberalisme dan demokrasi muncul (saya perhatikan bahwa saya menggunakan konsep-konsep ini hanya sehubungan dengan bahasa, tanpa karakteristik evaluatif). Terlepas dari kenyataan bahwa tebakan semacam itu masih tetap hanya pada tingkat hipotesis ilmiah yang berani, mereka membantu untuk melihat fenomena yang sudah dikenal dengan cara baru.

Seperti yang dapat kita lihat, karakteristik kuantitatif dapat diterapkan dalam bidang linguistik yang sama sekali berbeda, yang semakin mengaburkan batas antara metode "tepat" dan "kemanusiaan". Linguistik semakin menggunakan bantuan tidak hanya matematika, tetapi juga teknologi komputer untuk memecahkan masalahnya.

2.3 Belajar Ibahasa dengan metode logika formal

Dengan metode matematika non-kuantitatif, khususnya, dengan logika, linguistik teoretis modern berinteraksi tidak kurang bermanfaat dibandingkan dengan metode kuantitatif. Pesatnya perkembangan teknologi komputer dan pertumbuhan perannya di dunia modern menuntut adanya revisi terhadap pendekatan interaksi bahasa dan logika secara umum.

Metode logika banyak digunakan dalam pengembangan bahasa formal, khususnya bahasa pemrograman, yang unsur-unsurnya adalah beberapa simbol (mirip dengan matematika), dipilih (atau dibangun dari simbol yang dipilih sebelumnya) dan ditafsirkan dengan cara tertentu, terkait untuk setiap penggunaan, pemahaman, dan pemahaman "tradisional" fungsi simbol yang sama dalam konteks lain. Seorang programmer terus-menerus berurusan dengan logika dalam pekerjaannya. Arti dari pemrograman hanyalah untuk mengajarkan komputer untuk bernalar (dalam arti kata yang paling luas). Pada saat yang sama, metode "penalaran" ternyata sangat berbeda. Setiap programmer menghabiskan sejumlah waktu untuk mencari bug di program mereka sendiri dan program orang lain. Artinya, untuk mencari kesalahan dalam penalaran, dalam logika. Dan ini juga meninggalkan bekasnya. Jauh lebih mudah untuk mendeteksi kesalahan logis dalam pidato biasa. Kesederhanaan relatif dari bahasa yang dipelajari oleh ahli logika memungkinkan mereka untuk menjelaskan struktur bahasa ini lebih jelas daripada yang dapat dicapai oleh ahli bahasa yang menganalisis bahasa alami yang kompleks secara eksklusif. Mengingat fakta bahwa bahasa yang dipelajari oleh ahli logika menggunakan hubungan yang disalin dari bahasa alami, ahli logika dapat memberikan kontribusi signifikan pada teori umum bahasa. Situasi di sini mirip dengan yang terjadi dalam fisika: fisikawan juga merumuskan teorema untuk kasus ideal yang disederhanakan yang tidak terjadi di alam sama sekali - ia merumuskan hukum untuk gas ideal, cairan ideal, berbicara tentang gerak tanpa adanya gesekan, dll. Untuk kasus-kasus ideal ini, hukum-hukum sederhana dapat dibuat yang akan sangat berkontribusi pada pemahaman tentang apa yang sebenarnya terjadi dan apa yang mungkin tetap tidak diketahui oleh fisika jika ia mencoba mempertimbangkan realitas secara langsung, dalam segala kerumitannya.

Dalam studi bahasa alami, metode logis digunakan agar pembelajar bahasa tidak dapat dengan bodohnya "menghafal" kata-kata sebanyak mungkin, tetapi lebih memahami strukturnya. L. Shcherba juga menggunakan dalam kuliahnya contoh kalimat yang dibangun menurut hukum bahasa Rusia: “Kuzdra shteko yang bermasalah membuat bokra dan menggulung bokra,” dan kemudian bertanya kepada para siswa apa artinya ini. Terlepas dari kenyataan bahwa arti kata-kata dalam kalimat itu tetap tidak jelas (mereka tidak ada dalam bahasa Rusia), dimungkinkan untuk menjawab dengan jelas: "kuzdra" adalah subjek, kata benda feminin, dalam kasus tunggal, nominatif, " bokr” dianimasikan, dan lain-lain. Terjemahan frasa tersebut ternyata menjadi seperti ini: "Sesuatu yang feminin sekaligus melakukan sesuatu terhadap beberapa jenis makhluk jantan, dan kemudian mulai melakukan sesuatu yang lama, bertahap dengan anaknya." Contoh serupa dari teks (artistik) dari kata-kata yang tidak ada, dibangun sepenuhnya menurut hukum bahasa, adalah Jabberwock karya Lewis Carroll (dalam Alice in Wonderland, Carroll, melalui mulut karakternya Humpty Dumpty, menjelaskan arti dari kata-kata yang dia ciptakan: "dimasak" - jam delapan malam, ketika tiba waktunya untuk memasak makan malam, "chlivky" - tipis dan cekatan, "shorek" - persilangan antara musang, musang, dan pembuka botol, "menyelam " - melompat, menyelam, berputar, "nava" - rumput di bawah jam matahari (memanjang sedikit ke kanan , sedikit ke kiri dan sedikit ke belakang), "mendengus" - mendengus dan tertawa, "zelyuk" - a kalkun hijau, "myumzik" - seekor burung; bulunya acak-acakan dan mencuat ke segala arah, seperti sapu, "mova" - jauh dari rumah) .

Salah satu konsep utama logika modern dan linguistik teoretis, yang digunakan dalam studi bahasa dari berbagai kalkulus logika-matematis, bahasa alami, untuk menggambarkan hubungan antara bahasa dari "tingkat" yang berbeda dan untuk mengkarakterisasi hubungan antara bahasa yang sedang dipertimbangkan dan bidang subjek yang dijelaskan dengan bantuan mereka, adalah konsep metabahasa. Sebuah bahasa meta adalah bahasa yang digunakan untuk mengekspresikan penilaian tentang bahasa lain, bahasa-objek. Dengan bantuan bahasa meta, mereka mempelajari struktur kombinasi karakter (ekspresi) bahasa-objek, membuktikan teorema tentang sifat ekspresifnya, tentang hubungannya dengan bahasa lain, dll. Bahasa yang dipelajari juga disebut bahasa subjek dalam bahasa Inggris. kaitannya dengan bahasa meta ini. Baik bahasa subjek maupun bahasa meta dapat berupa bahasa biasa (alami). Metabahasa mungkin berbeda dari bahasa objek (misalnya, dalam buku teks bahasa Inggris untuk bahasa Rusia, bahasa Rusia adalah bahasa meta, dan bahasa Inggris adalah bahasa objek), tetapi mungkin juga bertepatan dengannya atau hanya berbeda sebagian, misalnya, dalam terminologi khusus. (Terminologi linguistik Rusia adalah elemen metabahasa untuk menggambarkan bahasa Rusia, yang disebut faktor semantik adalah bagian dari metabahasa untuk menggambarkan semantik bahasa alami).

Konsep "metalinguage" telah menjadi sangat bermanfaat sehubungan dengan studi bahasa formal yang dibangun dalam kerangka logika matematika. Tidak seperti bahasa subjek yang diformalkan, dalam hal ini bahasa meta, yang dengannya metateori dirumuskan (mempelajari sifat-sifat teori subjek yang dirumuskan dalam bahasa subjek), biasanya merupakan bahasa alami biasa, dalam beberapa cara khusus. fragmen terbatas dari bahasa alami yang tidak mengandung ambiguitas apa pun. , metafora, konsep "metafisik", dll. elemen bahasa biasa yang mencegah penggunaannya sebagai alat untuk penelitian ilmiah yang akurat. Pada saat yang sama, metabahasa itu sendiri dapat diformalkan dan (terlepas dari ini) menjadi subjek penelitian yang dilakukan melalui bahasa metameta, dan rangkaian semacam itu dapat "dianggap" berkembang tanpa batas.

Logika mengajarkan kita perbedaan yang bermanfaat antara objek bahasa dan bahasa meta. Objek bahasa adalah subjek penelitian logis, dan bahasa meta adalah bahasa buatan yang tak terhindarkan di mana penelitian semacam itu dilakukan. Berpikir logis hanya terdiri dari merumuskan hubungan dan struktur bahasa nyata (bahasa objek) dalam bahasa simbol (metabahasa).

Dalam hal apa pun bahasa meta harus "tidak lebih buruk" daripada bahasa objektifnya (yaitu, untuk setiap ekspresi yang terakhir dalam bahasa meta harus ada namanya, "terjemahan") - jika tidak, jika persyaratan ini tidak terpenuhi (yang tentu saja terjadi dalam bahasa alami, jika perjanjian khusus tidak memberikan sebaliknya) paradoks semantik (antinomi) muncul.

Karena semakin banyak bahasa pemrograman baru dibuat, sehubungan dengan masalah penerjemah pemrograman, ada kebutuhan mendesak untuk membuat bahasa meta. Saat ini, bentuk metabahasa Backus-Naur (disingkat BNF) adalah yang paling umum digunakan untuk menggambarkan sintaks bahasa pemrograman. Ini adalah bentuk kompak dalam bentuk beberapa rumus yang mirip dengan matematika. Untuk setiap konsep bahasa ada metaformula yang unik (rumus normal). Terdiri dari bagian kiri dan kanan. Sisi kiri menentukan konsep yang sedang didefinisikan, dan sisi kanan menentukan kumpulan konstruksi bahasa yang dapat diterima yang digabungkan ke dalam konsep ini. Rumus tersebut menggunakan metakarakter khusus dalam bentuk kurung sudut, yang berisi konsep yang telah ditentukan (di sisi kiri rumus) atau konsep yang telah ditentukan sebelumnya (di sisi kanannya), dan pemisahan bagian kiri dan kanan ditunjukkan oleh metakarakter "::=" yang artinya setara dengan kata "menurut definisi ada". Rumus metalinguistik tertanam dalam penerjemah dalam beberapa bentuk; dengan bantuan mereka, konstruksi yang digunakan oleh programmer diperiksa untuk kepatuhan formal dengan salah satu konstruksi yang valid secara sintaksis dalam bahasa ini. Ada juga bahasa meta yang terpisah dari berbagai ilmu - dengan demikian, pengetahuan ada dalam bentuk berbagai bahasa meta.

Metode logis juga menjadi dasar penciptaan sistem kecerdasan buatan berdasarkan konsep koneksionisme. Koneksionisme adalah tren khusus dalam ilmu filsafat, yang subjeknya adalah pertanyaan tentang pengetahuan. Dalam kerangka tren ini, upaya sedang dilakukan untuk menjelaskan kemampuan intelektual seseorang yang menggunakan jaringan saraf tiruan. Terdiri dari sejumlah besar unit struktural yang mirip dengan neuron, dengan bobot yang ditetapkan untuk setiap elemen yang menentukan kekuatan koneksi dengan elemen lain, jaringan saraf adalah model otak manusia yang disederhanakan. Eksperimen dengan jaringan saraf semacam ini telah menunjukkan kemampuan mereka untuk belajar melakukan tugas-tugas seperti pengenalan pola, membaca, dan mengidentifikasi struktur tata bahasa sederhana.

Para filsuf mulai tertarik pada koneksionisme, karena pendekatan koneksionis berjanji untuk memberikan alternatif bagi teori klasik tentang pikiran dan gagasan yang dipegang secara luas dalam teori ini bahwa cara kerja pikiran serupa dengan pemrosesan bahasa simbolik oleh perangkat digital. komputer. Konsep ini sangat kontroversial, tetapi dalam beberapa tahun terakhir telah menemukan semakin banyak pendukung.

Studi logis tentang bahasa melanjutkan konsep bahasa Saussure sebagai suatu sistem. Fakta bahwa itu terus berlanjut menegaskan sekali lagi keberanian dugaan ilmiah dari awal abad terakhir. Saya akan mencurahkan bagian terakhir dari pekerjaan saya untuk prospek pengembangan metode matematika dalam linguistik hari ini.

2.4 Prospek penerapan metode matematika dalam linguistik

Di era teknologi komputer, metode linguistik matematika telah menerima perspektif perkembangan baru. Pencarian pemecahan masalah analisis linguistik kini semakin banyak diterapkan pada tataran sistem informasi. Pada saat yang sama, otomatisasi proses pemrosesan materi linguistik, yang memberi peneliti peluang dan keuntungan yang signifikan, tak terhindarkan mengajukan persyaratan dan tugas baru untuknya.

Perpaduan antara pengetahuan "tepat" dan "kemanusiaan" telah menjadi lahan subur bagi penemuan-penemuan baru di bidang linguistik, ilmu komputer, dan filsafat.

Terjemahan mesin dari satu bahasa ke bahasa lain tetap menjadi cabang teknologi informasi yang berkembang pesat. Terlepas dari kenyataan bahwa terjemahan dengan bantuan komputer tidak pernah dapat dibandingkan kualitasnya dengan terjemahan manusia (terutama untuk teks-teks sastra), mesin telah menjadi asisten yang sangat diperlukan bagi seseorang dalam menerjemahkan teks dalam jumlah besar. Diyakini bahwa dalam waktu dekat sistem terjemahan yang lebih maju akan dibuat, terutama berdasarkan analisis semantik teks.

Arah yang sama menjanjikannya adalah interaksi linguistik dan logika, yang berfungsi sebagai landasan filosofis untuk memahami teknologi informasi dan apa yang disebut "realitas virtual". Dalam waktu dekat, pekerjaan akan berlanjut pada penciptaan sistem kecerdasan buatan - meskipun, sekali lagi, itu tidak akan pernah setara dengan manusia dalam kemampuannya. Persaingan seperti itu tidak ada artinya: di zaman kita, mesin harus menjadi (dan menjadi) bukan saingan, tetapi asisten manusia, bukan sesuatu dari dunia fantasi, tetapi bagian dari dunia nyata.

Studi bahasa dengan metode statistik berlanjut, yang memungkinkan untuk lebih akurat menentukan sifat kualitatifnya. Adalah penting bahwa hipotesis yang paling berani tentang bahasa menemukan bukti matematisnya, dan karena itu logis.

Hal yang paling signifikan adalah bahwa berbagai cabang penerapan matematika dalam linguistik, yang sebelumnya cukup terisolasi, dalam beberapa tahun terakhir telah dikorelasikan satu sama lain, terhubung ke dalam sistem yang koheren, dengan analogi dengan sistem bahasa yang ditemukan seabad yang lalu oleh Ferdinand de Saussure. dan Yvan Baudouin de Courtenay. Ini adalah kelanjutan dari pengetahuan ilmiah.

Linguistik di dunia modern telah menjadi landasan bagi perkembangan teknologi informasi. Selama ilmu komputer tetap menjadi cabang aktivitas manusia yang berkembang pesat, penyatuan matematika dan linguistik akan terus memainkan perannya dalam pengembangan ilmu pengetahuan.

Kesimpulan

Selama abad ke-20, teknologi komputer telah berkembang pesat - dari militer hingga penggunaan damai, dari jangkauan tujuan yang sempit hingga penetrasi ke semua cabang kehidupan manusia. Matematika sebagai ilmu menemukan signifikansi praktis baru dengan perkembangan teknologi komputer. Proses ini berlanjut hari ini.

"Tandem" "fisikawan" dan "penulis lirik" yang sebelumnya tidak terpikirkan telah menjadi kenyataan. Untuk interaksi penuh matematika dan ilmu komputer dengan humaniora, spesialis yang memenuhi syarat diperlukan dari kedua belah pihak. Sementara ilmuwan komputer semakin membutuhkan pengetahuan kemanusiaan yang sistematis (linguistik, budaya, filosofis) untuk memahami perubahan realitas di sekitar mereka, dalam interaksi manusia dan teknologi, untuk mengembangkan lebih banyak konsep linguistik dan mental baru, untuk menulis. program, maka setiap "Kemanusiaan" di zaman kita untuk pertumbuhan profesional mereka harus menguasai setidaknya dasar-dasar bekerja dengan komputer.

Matematika yang erat hubungannya dengan informatika terus berkembang dan berinteraksi dengan ilmu-ilmu alam dan humaniora. Di abad baru, kecenderungan matematisasi sains tidak melemah, tetapi justru meningkat. Berdasarkan data kuantitatif, hukum perkembangan bahasa, karakteristik historis dan filosofisnya dipahami.

Formalisme matematika paling cocok untuk menggambarkan pola dalam linguistik (seperti, memang, dalam ilmu lain - baik humaniora maupun alam). Situasi terkadang berkembang dalam sains sedemikian rupa sehingga tanpa penggunaan bahasa matematika yang tepat, tidak mungkin untuk memahami sifat fisik, kimia, dll. proses tidak mungkin. Menciptakan model atom planet, fisikawan Inggris terkenal abad XX. E. Rutherford mengalami kesulitan matematika. Pada awalnya, teorinya tidak diterima: itu tidak terdengar meyakinkan, dan alasannya adalah ketidaktahuan Rutherford tentang teori probabilitas, berdasarkan mekanisme yang hanya mungkin untuk memahami representasi model interaksi atom. Menyadari hal ini, sudah pada saat itu seorang ilmuwan luar biasa, pemilik Hadiah Nobel, terdaftar dalam seminar matematika Profesor Lamb dan selama dua tahun, bersama dengan para siswa, menghadiri kursus dan mengerjakan lokakarya tentang teori probabilitas. . Berdasarkan itu, Rutherford mampu menggambarkan perilaku elektron, memberikan model strukturalnya akurasi yang meyakinkan dan mendapatkan pengakuan. Begitu pula dengan linguistik.

Ini menimbulkan pertanyaan, apa yang begitu matematis dalam fenomena objektif, berkat itu mereka dapat dijelaskan dalam bahasa matematika, dalam bahasa karakteristik kuantitatif? Ini adalah unit materi homogen yang didistribusikan dalam ruang dan waktu. Ilmu-ilmu yang telah melangkah lebih jauh dari yang lain menuju isolasi homogenitas, dan ternyata lebih cocok untuk penggunaan matematika di dalamnya.

Internet, yang berkembang pesat pada 1990-an, menyatukan perwakilan dari berbagai negara, masyarakat, dan budaya. Terlepas dari kenyataan bahwa bahasa Inggris terus menjadi bahasa utama komunikasi internasional, Internet telah menjadi multibahasa di zaman kita. Hal ini menyebabkan pengembangan sistem terjemahan mesin yang sukses secara komersial yang banyak digunakan di berbagai bidang aktivitas manusia.

Jaringan komputer telah menjadi objek refleksi filosofis - semakin banyak konsep linguistik, logis, pandangan dunia baru telah dibuat yang membantu untuk memahami "realitas virtual". Dalam banyak karya seni, skenario diciptakan - lebih sering pesimistis - tentang dominasi mesin atas seseorang, dan realitas virtual - atas dunia luar. Jauh dari biasanya, ramalan seperti itu ternyata tidak ada artinya. Teknologi informasi tidak hanya merupakan industri yang menjanjikan untuk menginvestasikan pengetahuan manusia, tetapi juga merupakan cara untuk mengontrol informasi, dan, akibatnya, atas pemikiran manusia.

Fenomena ini memiliki sisi negatif dan positif. Negatif - karena kontrol atas informasi bertentangan dengan hak asasi manusia yang tidak dapat dicabut untuk mengaksesnya secara bebas. Positif - karena kurangnya kontrol ini dapat menyebabkan konsekuensi bencana bagi umat manusia. Cukuplah untuk mengingat salah satu film paling bijaksana dalam dekade terakhir - "When the World Ends" oleh Wim Wenders, yang karakternya benar-benar tenggelam dalam "realitas virtual" dari mimpi mereka sendiri yang direkam di komputer. Pada saat yang sama, tidak seorang ilmuwan dan seniman pun tidak dapat memberikan jawaban yang jelas untuk pertanyaan: apa yang menunggu sains dan teknologi di masa depan.

Berfokus pada "masa depan", terkadang tampak fantastis, adalah ciri khas sains pada pertengahan abad kedua puluh, ketika para penemu berusaha menciptakan model teknologi yang sempurna yang dapat bekerja tanpa campur tangan manusia. Waktu telah menunjukkan sifat utopis dari penelitian semacam itu. Pada saat yang sama, akan berlebihan untuk mengutuk para ilmuwan untuk ini - tanpa antusiasme mereka di tahun 1950-an - 60-an, teknologi informasi tidak akan membuat lompatan yang begitu kuat di tahun 90-an, dan kita tidak akan memiliki apa yang kita miliki sekarang.

Dekade terakhir abad kedua puluh mengubah prioritas sains - penelitian, pathos inventif memberi jalan kepada kepentingan komersial. Sekali lagi, ini tidak baik atau buruk. Ini adalah kenyataan di mana sains semakin terintegrasi ke dalam kehidupan sehari-hari.

Abad ke-21 telah melanjutkan tren ini, dan di zaman kita di balik penemuan tidak hanya ketenaran dan pengakuan, tetapi, pertama-tama, uang. Inilah juga mengapa penting untuk memastikan bahwa pencapaian ilmu pengetahuan dan teknologi terkini tidak jatuh ke tangan kelompok teroris atau rezim diktator. Tugasnya sulit sampai pada titik ketidakmungkinan; mewujudkannya semaksimal mungkin adalah tugas seluruh masyarakat dunia.

Informasi adalah senjata, dan senjata tidak kalah berbahayanya dengan senjata nuklir atau kimia - hanya saja informasi itu tidak bertindak secara fisik, melainkan secara psikologis. Kemanusiaan perlu memikirkan apa yang lebih penting dalam hal ini - kebebasan atau kontrol.

Konsep filosofis terbaru yang berkaitan dengan perkembangan teknologi informasi dan upaya untuk memahaminya telah menunjukkan keterbatasan materialisme ilmu alam, yang mendominasi selama abad ke-19 dan awal abad ke-20, dan idealisme ekstrem, yang menyangkal pentingnya dunia material. . Penting bagi pemikiran modern, khususnya pemikiran Barat, untuk mengatasi dualisme pemikiran ini, ketika dunia sekitarnya secara jelas terbagi menjadi material dan ideal. Jalan menuju ini adalah dialog budaya, perbandingan sudut pandang yang berbeda tentang fenomena di sekitarnya.

Paradoksnya, teknologi informasi dapat memainkan peran penting dalam proses ini. Jaringan komputer, dan khususnya Internet, tidak hanya sebagai sumber hiburan dan aktivitas komersial yang kuat, tetapi juga merupakan sarana komunikasi yang bermakna dan kontroversial antara perwakilan berbagai peradaban di dunia modern, serta untuk dialog antara masa lalu dan saat ini. Kita dapat mengatakan bahwa Internet mendorong batas-batas spasial dan temporal.

Dan dalam dialog budaya melalui teknologi informasi, peran bahasa sebagai alat komunikasi universal tertua masih tetap penting. Itulah sebabnya linguistik, dalam interaksinya dengan matematika, filsafat, dan ilmu komputer, telah mengalami kelahiran keduanya dan terus berkembang hingga saat ini. Tren saat ini akan berlanjut di masa depan - "sampai akhir dunia", seperti yang diprediksi oleh V. Wenders 15 tahun yang lalu. Benar, tidak diketahui kapan akhir ini akan terjadi - tetapi apakah itu penting sekarang, karena masa depan cepat atau lambat akan menjadi masa kini.

Lampiran 1

Ferdinand de Saussure

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) secara luas dianggap sebagai pendiri linguistik modern dalam upayanya untuk menggambarkan struktur bahasa daripada sejarah bahasa dan bentuk bahasa tertentu. Bahkan, metode Strukturalisme dalam linguistik dan studi sastra dan cabang penting Semiotika menemukan titik awal utama mereka dalam karyanya pada pergantian abad kedua puluh. Bahkan telah diperdebatkan bahwa kompleks strategi dan konsepsi yang kemudian disebut "poststrukturalisme" - karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, dan lain-lain - disarankan oleh karya Saussure dalam linguistik dan pembacaan anagram dari puisi Latin akhir, modernisme sastra hingga psikoanalisis dan filsafat pada awal abad kedua puluh. Seperti yang dikemukakan oleh Algirdas Julien Greimas dan Joseph Courtes dalam Semiotics and Language: An Analytic Dictionary, di bawah judul "Interpretation," mode interpretasi baru muncul pada awal abad kedua puluh yang mereka identifikasikan dengan linguistik Saussurean, Fenomenologi Husserlian, dan psikoanalisis Freudian. Dalam mode ini, "interpretasi tidak lagi menjadi masalah menghubungkan konten tertentu dengan bentuk yang tidak memilikinya; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang setara dari elemen penanda dalam sistem semiotik yang diberikan" ( 159). dalam pengertian "penafsiran" ini, bentuk dan isi tidaklah berbeda; sebaliknya, setiap "bentuk" adalah, sebagai alternatif, "isi" semantik juga, "bentuk penanda", sehingga interpretasi menawarkan parafrase analogis dari sesuatu yang sudah menandakan dalam beberapa sistem penandaan lainnya.

Penafsiran ulang bentuk dan pemahaman seperti itu - yang dijelaskan Claude Levi-Strauss dalam salah satu artikulasinya yang paling terprogram tentang konsep strukturalisme, dalam "Struktur dan Bentuk: Refleksi pada Karya oleh Vladimir Propp" - tersirat dalam Kursus anumerta Saussure dalam Linguistik Umum (1916, trans., 1959, 1983). Dalam masa hidupnya, Saussure menerbitkan relatif sedikit, dan karya utamanya, Kursus, adalah transkripsi oleh murid-muridnya dari beberapa kursus linguistik umum yang dia tawarkan pada tahun 1907-11. Dalam Kursus Saussure menyerukan studi "ilmiah" bahasa yang bertentangan dengan pekerjaan dalam linguistik historis yang telah dilakukan pada abad kesembilan belas. Karya itu adalah salah satu pencapaian besar intelek Barat: mengambil kata-kata tertentu sebagai blok bangunan dari bahasa, linguistik historis (atau "diakronis") menelusuri asal dan perkembangan bahasa Barat dari sumber bahasa umum yang diduga, pertama bahasa "Indo-Eropa" dan kemudian "p bahasa roto-Indo-Eropa".

Justru studi tentang kemunculan kata-kata yang unik ini, dengan asumsi yang bersamaan bahwa "unit" dasar bahasa, pada kenyataannya, adalah keberadaan positif dari "elemen-elemen kata" ini, yang dipertanyakan oleh Saussure. Karyanya merupakan upaya untuk mereduksi massa fakta tentang bahasa, yang dipelajari dengan cermat oleh linguistik historis, menjadi sejumlah proposisi yang dapat dikelola. "Sekolah perbandingan" Filologi abad kesembilan belas, Saussure mengatakan dalam Kursus, "tidak berhasil mendirikan ilmu linguistik yang sebenarnya" karena "gagal mencari sifat objek studinya" (3). "Sifat" itu, menurutnya, dapat ditemukan tidak hanya dalam kata-kata "elemental" yang terdiri dari suatu bahasa - fakta (atau "substansi") bahasa yang tampak "positif" - tetapi dalam hubungan formal yang memunculkannya. "zat."

Pemeriksaan ulang sistematis bahasa Saussure didasarkan pada tiga asumsi. Yang pertama adalah bahwa studi ilmiah bahasa perlu mengembangkan dan mempelajari sistem daripada sejarah fenomena linguistik. Untuk alasan ini, ia membedakan antara kejadian khusus bahasa - "peristiwa-ucapan" khususnya, yang ia sebut sebagai pembebasan bersyarat - dan objek linguistik yang tepat, sistem (atau "kode") yang mengatur peristiwa-peristiwa itu, yang ia sebut sebagai langue. Selain itu, studi sistematis semacam itu membutuhkan " konsepsi sinkronis" tentang hubungan di antara unsur-unsur bahasa pada saat tertentu daripada studi "diakronis" tentang perkembangan bahasa melalui sejarah.

Asumsi ini memunculkan apa yang oleh Roman Jakobson pada tahun 1929 disebut sebagai "strukturalisme," di mana "seperangkat fenomena yang diperiksa oleh sains kontemporer diperlakukan bukan sebagai aglomerasi mekanis tetapi sebagai keseluruhan struktural, konsepsi mekanis proses menghasilkan pertanyaan fungsi mereka" ("Romantis" 711). Dalam bagian ini Jakobson mengartikulasikan niat Saussure untuk mendefinisikan linguistik sebagai sistem ilmiah yang bertentangan dengan perhitungan "mekanis" sederhana dari kecelakaan sejarah. Selain itu, Jakobson juga menggambarkan asumsi dasar kedua dalam bahasa Saussurean - kita dapat sekarang menyebutnya "struktural" - linguistik: bahwa elemen dasar bahasa hanya dapat dipelajari dalam kaitannya dengan fungsinya daripada dalam kaitannya dengan penyebabnya. "Kata-kata" Eropa, peristiwa dan entitas itu harus ditempatkan dalam kerangka sistemik di mana mereka terkait dengan apa yang disebut peristiwa dan entitas lain. Ini adalah reorientasi radikal dalam memahami pengalaman dan fenomena, yang dianggap penting oleh filsuf Ernst Cassirer dibandingkan dengan "ilmu baru Galileo yang pada abad ketujuh belas mengubah seluruh kita konsep dunia fisik" (dikutip dalam Culler, Pursuit 2 4). Perubahan ini, sebagaimana dicatat oleh Greimas dan Courtes, mengkonsepsikan kembali "interpretasi" dan dengan demikian memahami kembali penjelasan dan pemahaman itu sendiri. Alih-alih penjelasan "berada dalam hal penyebab fenomena", sehingga, sebagai "akibat", dalam beberapa hal lebih rendah dari penyebabnya, penjelasan di sini terdiri dari mensubordinasikan fenomena ke "fungsi" berorientasi masa depan atau "tujuan." Penjelasan tidak lagi terlepas dari maksud atau tujuan manusia (walaupun niat itu bisa bersifat impersonal, komunal, atau, dalam istilah Freudian, "tidak sadar").

Dalam linguistiknya, Saussure menyelesaikan transformasi ini secara khusus dalam redefinisi "kata" linguistik, yang ia gambarkan sebagai "tanda" linguistik dan didefinisikan dalam istilah fungsionalis. Tanda, menurutnya, adalah penyatuan "sebuah konsep dan citra suara," yang disebutnya "petanda dan penanda" (66-67; terjemahan Roy Harris 1983 menawarkan istilah "penandaan" dan "sinyal"). Sifat "kombinasi" mereka adalah "fungsional" di mana baik penanda maupun penanda bukanlah "penyebab" dari yang lain; melainkan, "masing-masing nilainya dari yang lain" (8). elemen bahasa, tanda , secara relasional dan membuat asumsi dasar linguistik historis, yaitu, identitas unit unsur bahasa dan makna (yaitu, "kata"), tunduk pada analisis yang ketat. kata "pohon" sebagai kata "sama" bukan karena kata didefinisikan oleh kualitas yang melekat - itu bukan "penggabungan mekanis" dari kualitas seperti itu - tetapi karena itu didefinisikan sebagai elemen dalam suatu sistem, "keseluruhan struktural" , "bahasa.

Definisi relasional (atau "diakritik") dari suatu entitas mengatur konsepsi semua elemen bahasa dalam linguistik struktural. Ini paling jelas dalam pencapaian linguistik Saussurean yang paling mengesankan, pengembangan konsep "fonem" dan "fitur khas" bahasa. Fonem adalah unit terkecil yang diartikulasikan dan menandakan bahasa. Itu bukan suara yang muncul dalam bahasa tetapi "gambaran suara" yang disebutkan Saussure, yang ditangkap oleh pembicara - ditangkap secara fenomenal - sebagai pembawa makna. (Dengan demikian, Elmar Holenstein menggambarkan linguistik Jakobson, yang mengikuti Saussure dengan cara yang penting, sebagai "strukturalisme fenomenologis.") Karena alasan inilah juru bicara terkemuka untuk Strukturalisme Sekolah Praha, Jan Mukarovsky, mencatat pada tahun 1937 bahwa "struktur . . . merupakan realitas fenomenologis dan bukan empiris; itu bukan pekerjaan itu sendiri, tetapi seperangkat hubungan fungsional yang terletak dalam kesadaran kolektif (generasi, lingkungan, dll.)" (dikutip dalam Galan 35). Demikian pula, Levi-Strauss, juru bicara terkemuka strukturalisme Prancis , mencatat pada tahun 1960 bahwa "struktur tidak memiliki konten yang berbeda; itu adalah konten itu sendiri, dan organisasi logis di mana ia ditangkap dipahami sebagai milik yang nyata" (167; lihat juga Jakobson, Fundamentals 27-28).

Oleh karena itu, fonem, elemen terkecil dari bahasa, bukanlah objek positif, melainkan "realitas fenomenologis". Dalam bahasa Inggris, misalnya, fonem /t/ dapat diucapkan dengan berbagai cara, tetapi dalam semua kasus, penutur bahasa Inggris akan mengenalinya sebagai berfungsi sebagai /t/. Sebuah t yang disedot (yaitu, t diucapkan dengan nafas seperti h setelahnya), suara t bernada tinggi atau bernada rendah, suara t diperpanjang, dan seterusnya, semuanya akan berfungsi dengan cara yang sama dalam membedakan arti dari "untuk" dan "melakukan" dalam bahasa Inggris. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi fonologis dalam satu bahasa dapat membentuk fonem yang berbeda dalam bahasa lain; jadi, bahasa Inggris membedakan antara /l/ dan /r/, sedangkan bahasa lain begitu terstruktur sehingga artikulasi ini dianggap variasi dari fonem yang sama (seperti t aspirated dan unaspirated dalam bahasa Inggris). Dalam setiap bahasa alami, sejumlah besar kemungkinan kata merupakan kombinasi dari sejumlah kecil fonem. Bahasa Inggris, misalnya, memiliki kurang dari 40 fonem yang digabungkan untuk membentuk lebih dari satu juta kata yang berbeda.

Fonem-fonem bahasa itu sendiri merupakan struktur ciri-ciri yang terorganisir secara sistematis. Pada 1920-an dan 1930-an, mengikuti jejak Saussure, Jakobson dan N. S. Trubetzkoy mengisolasi "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur fisiologis organ bicara - lidah, gigi, pita suara, dan seterusnya - yang Saussure menyebutkan dalam Kursus dan yang digambarkan Harris sebagai "fonetik fisiologis" ( 39; terjemahan sebelumnya Baskin menggunakan istilah "fonologi" [(1959) 38]) - dan mereka bergabung dalam "kumpulan" oposisi biner untuk membentuk fonem. Misalnya, dalam bahasa Inggris perbedaan antara /t/ dan /d/ adalah ada atau tidak adanya "suara" (pertunangan pita suara), dan pada tingkat menyuarakan fonem-fonem ini secara timbal balik mendefinisikan satu sama lain. Dengan cara ini, fonologi adalah contoh khusus dari aturan umum bahasa yang dijelaskan oleh Saussure: Dalam bahasa hanya ada perbedaan. bahkan lebih penting: perbedaan umumnya menyiratkan istilah positif di mana perbedaan itu diatur; tetapi dalam bahasa hanya ada perbedaan tanpa istilah positif. Apakah kita mengambil petanda atau penanda, bahasa tidak memiliki ide atau suara yang ada sebelum sistem linguistik. ( 120)

Dalam kerangka ini, identitas linguistik ditentukan bukan oleh kualitas yang melekat tetapi oleh hubungan sistemik ("struktural").

Saya telah mengatakan bahwa fonologi "mengikuti jejak" Saussure, karena meskipun analisisnya tentang fisiologi produksi bahasa "sekarang ini," seperti yang dikatakan Harris, "disebut "fisik," sebagai lawan dari "psikologis" atau "fungsional". "" (Membaca 49), akibatnya dalam Kursus ia mengartikulasikan arah dan garis besar analisis fungsional bahasa. Demikian pula, satu-satunya karyanya yang diterbitkan diperpanjang, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir pada sistem primitif vokal dalam bahasa Indo-Eropa), yang muncul pada tahun 1878, sepenuhnya terletak dalam proyek kesembilan belas- linguistik sejarah abad. Namun demikian, dalam karya ini, seperti yang dikatakan Jonathan Culler, Saussure menunjukkan "kesuburan pemikiran bahasa sebagai sistem item relasional murni, bahkan ketika bekerja pada tugas rekonstruksi sejarah" (Saussure 66). Dengan menganalisis hubungan struktural yang sistematis di antara fonem untuk menjelaskan pola pergantian vokal dalam bahasa Indo-Eropa yang ada, Saussure menyarankan bahwa selain beberapa fonem /a/ yang berbeda, pasti ada fonem lain yang dapat dijelaskan secara formal. "Apa yang membuat karya Saussure sangat mengesankan," Culler menyimpulkan, "adalah kenyataan bahwa hampir lima puluh tahun kemudian, ketika Het berhuruf paku ditemukan dan diuraikan, ditemukan mengandung fonem, ditulis h, yang berperilaku seperti yang telah diprediksi Saussure. . Dia telah menemukan, dengan analisis yang murni formal, apa yang sekarang dikenal sebagai laring Indo-Eropa" (66).

Konsepsi tentang penentuan relasional atau diakritik dari unsur-unsur penandaan, yang tersirat dan tersurat dalam Kursus ini, menyarankan asumsi ketiga yang mengatur linguistik struktural, yang disebut Saussure sebagai "sifat tanda yang arbitrer." Dengan ini dia bermaksud bahwa hubungan antara penanda dan petanda dalam bahasa tidak pernah diperlukan (atau "dimotivasi"): seseorang dapat dengan mudah menemukan penanda suara arbre seperti pohon penanda untuk bersatu dengan konsep "pohon". Tetapi lebih dari itu, ini berarti bahwa petandanya juga bersifat arbitrer: orang dapat dengan mudah mendefinisikan konsep "pohon" dari kualitas kayunya (yang akan mengecualikan pohon palem) maupun ukurannya (yang mengecualikan "tanaman berkayu rendah" yang kita sebut semak). Ini harus memperjelas bahwa penomoran asumsi yang telah saya sajikan tidak mewakili urutan prioritas: setiap asumsi - sifat sistemik penandaan (paling baik dipahami dengan mempelajari bahasa "secara serempak"), sifat relasional atau "diakritik" dari elemen-elemen penandaan, sifat tanda yang arbitrer - memperoleh nilainya dari yang lain.

Artinya, linguistik Saussurean fenomena yang dipelajarinya dalam hubungan menyeluruh kombinasi dan kontras dalam bahasa. Dalam konsepsi ini, bahasa adalah proses mengartikulasikan makna (signifikasi) dan produknya (komunikasi), dan kedua fungsi bahasa ini tidak identik atau sepenuhnya kongruen (lihat Schleifer, "Dekonstruksi"). Di sini, kita dapat melihat pergantian antara bentuk dan isi yang digambarkan oleh Greimas dan Courtes dalam interpretasi modernis: bahasa menghadirkan kontras yang secara formal mendefinisikan unit-unitnya, dan unit-unit ini bergabung pada tingkat yang berurutan untuk menciptakan konten yang menandakan. Karena unsur-unsur bahasa bersifat arbitrer, maka kontras maupun kombinasi tidak dapat dikatakan dasar. Jadi, dalam ciri-ciri khas bahasa bergabung membentuk fonem-fonem kontras pada tingkat pemahaman yang lain, fonem-fonem bergabung membentuk morfem-morfem kontras, morfem-morfem bergabung membentuk kata, kata-kata bergabung membentuk kalimat, dan seterusnya. Dalam setiap contoh, seluruh fonem, atau kata, atau kalimat, dan seterusnya, lebih besar daripada jumlah bagian-bagiannya (seperti air, H2O, dalam contoh Saussure [(1959) 103] lebih dari aglomerasi mekanis hidrogen dan oksigen).

Tiga asumsi Kursus Linguistik Umum membuat Saussure menyerukan ilmu baru abad kedua puluh yang akan melampaui ilmu linguistik untuk mempelajari "kehidupan tanda-tanda dalam masyarakat." Saussure menamakan ilmu ini "semiologi (dari bahasa Yunani semeion "tanda")" (16). "Ilmu" semiotika, seperti yang dipraktikkan di Eropa Timur pada 1920-an dan 1930-an dan Paris pada 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik ke artefak sastra yang dibentuk (atau diartikulasikan) oleh struktur tersebut. Sepanjang bagian akhir karirnya, apalagi, bahkan ketika dia menawarkan kursus linguistik umum, Saussure melakukan analisis "semiotik" sendiri atas puisi Latin akhir dalam upaya untuk menemukan anagram yang sengaja disembunyikan dari nama-nama diri. Metode studi dalam banyak hal berlawanan dengan rasionalisme fungsional dari analisis linguistiknya: metode ini mencoba, seperti yang disebutkan Saussure dalam salah satu dari 99 buku catatan di mana dia melakukan studi ini, untuk memeriksa secara sistematis masalah "kebetulan", yang " menjadi dasar yang tak terelakkan dari segalanya" (dikutip dalam Starobinski 101). Studi semacam itu, seperti yang dikatakan Saussure sendiri, berfokus pada "fakta material" dari peluang dan makna (dikutip 101), sehingga "kata-tema" yang anagram Saussure cari, seperti yang dikatakan Jean Starobinski, "adalah, untuk penyair , instrumen, dan bukan benih vital puisi. Puisi itu diperlukan untuk menggunakan kembali materi fonetik dari kata tema" (45). Dalam analisis ini, Starobinski mengatakan, "Saussure tidak kehilangan dirinya dalam pencarian makna tersembunyi." Sebaliknya, karyanya tampaknya menunjukkan keinginan untuk menghindari semua masalah yang timbul dari kesadaran: "Karena puisi tidak hanya diwujudkan dalam kata-kata tetapi adalah sesuatu yang lahir dari kata-kata, ia lolos dari kontrol kesadaran yang sewenang-wenang untuk hanya bergantung pada semacam legalitas linguistik. "(121).

Yaitu, upaya Saussure untuk menemukan nama-nama diri dalam puisi Latin akhir - yang oleh Tzvetan Todorov disebut pengurangan "kata . . . to its signifier" (266) - menekankan salah satu elemen yang mengatur analisis linguistiknya, sifat tanda yang arbitrer. (Ini juga menekankan sifat formal linguistik Saussurean - "Bahasa," ia menegaskan, "adalah bentuk dan bukan substansi" - yang menghilangkan semantik secara efektif sebagai objek analisis utama.) Seperti yang disimpulkan Todorov, karya Saussure hari ini tampak sangat homogen dalam penolakannya untuk menerima fenomena simbolis . . . . Dalam penelitiannya tentang anagram, ia hanya memperhatikan fenomena pengulangan, bukan fenomena pembangkitan. . . . Dalam studinya tentang Nibelungen, ia mengenali simbol hanya untuk menghubungkannya dengan pembacaan yang salah: karena mereka tidak disengaja, simbol tidak ada. Akhirnya dalam kursusnya tentang linguistik umum, ia merenungkan keberadaan semiologi, dan dengan demikian tanda-tanda selain yang linguistik; tetapi penegasan ini sekaligus dibatasi oleh fakta bahwa semiologi dikhususkan untuk satu jenis tanda: tanda yang arbitrer. (269-70)

Jika ini benar, itu karena Saussure tidak dapat membayangkan "niat" tanpa subjek; dia tidak bisa lepas dari pertentangan antara bentuk dan isi, karyanya begitu banyak dipertanyakan. Sebaliknya, ia menggunakan "legalitas linguistik". Terletak di antara, di satu sisi, konsepsi abad kesembilan belas tentang sejarah, subjektivitas, dan cara interpretasi kausal yang diatur oleh konsep-konsep ini dan, di sisi lain, konsepsi "strukturalis" abad kedua puluh tentang apa yang disebut Levi-Strauss "Kantianisme tanpa subjek transendental" (dikutip dalam Connerton 23) - konsep yang menghapus pertentangan antara bentuk dan konten (atau subjek dan objek) dan hierarki latar depan dan latar belakang dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum yang besar - karya Ferdinand de Saussure dalam linguistik dan semiotika membatasi momen sinyal dalam studi makna dan budaya.

Ronald Schleifer

Lampiran 2

Ferdinand de Saussure (terjemahan)

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) dianggap sebagai pendiri linguistik modern - berkat usahanya untuk menggambarkan struktur bahasa, dan bukan sejarah bahasa individu dan bentuk kata. Pada umumnya, dasar-dasar metode struktural dalam linguistik dan kritik sastra dan, sebagian besar, semiotika diletakkan dalam karya-karyanya pada awal abad kedua puluh. Terbukti bahwa metode dan konsep yang disebut "pasca-strukturalisme", yang dikembangkan dalam karya-karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, dan lainnya, kembali ke karya-karya linguistik Saussure dan pembacaan anagram dari puisi Romawi akhir. Perlu dicatat bahwa karya Saussure tentang linguistik dan interpretasi linguistik membantu menghubungkan berbagai disiplin intelektual - dari fisika hingga inovasi sastra, psikoanalisis, dan filsafat awal abad kedua puluh. A. J. Greimas dan J. Kurte menulis dalam Semiotics and Language: “Sebuah kamus analitik dengan judul “Interpretation” sebagai jenis interpretasi baru muncul pada awal abad ke-20 bersama dengan linguistik Saussure, fenomenologi Husserl dan psikoanalisis dari Freud. Dalam kasus seperti itu, "interpretasi bukanlah atribusi konten yang diberikan ke bentuk yang tidak memilikinya; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang sama dari elemen signifikan dalam sistem semiotik yang diberikan" (159 ). Dalam pengertian "penafsiran" ini, bentuk dan isi tidak dapat dipisahkan; sebaliknya, setiap bentuk diisi dengan makna semantik (“bentuk yang bermakna”), sehingga interpretasi menawarkan penceritaan kembali yang baru dan serupa tentang sesuatu yang bermakna dalam sistem tanda lain.

Pemahaman serupa tentang bentuk dan isi, disajikan oleh Claude Lévi-Strauss dalam salah satu karya programatik strukturalisme, ("Struktur dan Bentuk: Refleksi pada Karya Vladimir Propp"), dapat dilihat dalam buku Saussure yang diterbitkan secara anumerta, A Course in Linguistik Umum (1916, trans., 1959, 1983). Selama masa hidupnya, Saussure menerbitkan sedikit, "Kursus" - karya utamanya - dikumpulkan dari catatan mahasiswa yang menghadiri kuliahnya tentang linguistik umum pada tahun 1907-11. Dalam Kursus, Saussure menyerukan studi bahasa "ilmiah", membandingkannya dengan linguistik komparatif-historis abad kesembilan belas. Karya ini dapat dianggap sebagai salah satu pencapaian terbesar pemikiran Barat: mengambil kata-kata individu sebagai elemen struktural bahasa sebagai dasar, linguistik historis (atau "diakronis") membuktikan asal dan perkembangan bahasa Eropa Barat dari a umum, bahasa Indo-Eropa - dan bahasa Proto-Indo-Eropa sebelumnya.

Justru studi tentang kemunculan kata-kata yang unik ini, dengan asumsi yang bersamaan bahwa "unit" dasar bahasa, pada kenyataannya, adalah keberadaan positif dari "elemen-elemen kata" ini yang dipertanyakan oleh Saussure. Karyanya merupakan upaya untuk mereduksi banyak fakta tentang bahasa yang dipelajari dengan santai oleh linguistik komparatif menjadi sejumlah kecil teorema. Sekolah filologi komparatif abad ke-19, tulis Saussure, "tidak berhasil menciptakan sekolah linguistik yang nyata" karena "tidak memahami esensi objek studi" (3). "Esensi" ini, menurutnya, tidak hanya terletak pada kata-kata individu - "substansi positif" bahasa - tetapi juga dalam hubungan formal yang membantu substansi ini ada.

"Tes" bahasa Saussure didasarkan pada tiga asumsi. Pertama, pemahaman ilmiah tentang bahasa tidak didasarkan pada sejarah, tetapi pada fenomena struktural. Oleh karena itu, ia membedakan antara fenomena individu bahasa - "peristiwa bicara", yang ia definisikan sebagai "pembebasan bersyarat" - dan objek studi linguistik yang tepat, menurut pendapatnya, sistem (kode, struktur) yang mengontrol peristiwa ini. ("bahasa"). Studi sistematis seperti itu, apalagi, membutuhkan konsepsi "sinkron" tentang hubungan antara unsur-unsur bahasa pada saat tertentu, daripada studi "diakronis" tentang perkembangan bahasa melalui sejarahnya.

Hipotesis ini merupakan cikal bakal dari apa yang disebut Roman Jakobson pada tahun 1929 sebagai "strukturalisme" - sebuah teori di mana "seperangkat fenomena yang diselidiki oleh sains modern tidak dianggap sebagai akumulasi mekanis, tetapi sebagai keseluruhan struktural di mana komponen konstruktif dikorelasikan dengan fungsi" ("Romantis "711). Dalam bagian ini, Jakobson merumuskan gagasan Saussure tentang mendefinisikan bahasa sebagai struktur, sebagai lawan dari enumerasi "mekanis" dari peristiwa sejarah. Selain itu, Jakobson mengembangkan asumsi Saussurean lain, yang menjadi cikal bakal linguistik struktural: unsur-unsur dasar bahasa harus dipelajari tidak begitu banyak hubungannya dengan penyebabnya, tetapi dengan fungsinya. Fenomena dan peristiwa yang terpisah (misalnya, sejarah asal usul kata-kata Indo-Eropa individu) harus dipelajari tidak sendiri, tetapi dalam sistem di mana mereka berkorelasi dengan komponen serupa. Ini adalah perubahan radikal dalam perbandingan fenomena dengan realitas di sekitarnya, yang signifikansinya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu Galileo, yang mengubah ide-ide tentang dunia material pada abad ketujuh belas". , seperti yang dicatat Greimas dan Kurthe, mengubah gagasan "interpretasi", akibatnya, penjelasan itu sendiri. Fenomena mulai ditafsirkan tidak dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan efek yang dapat ditimbulkannya dalam sekarang dan masa depan Interpretasi berhenti menjadi independen dari niat seseorang (terlepas dari fakta bahwa niat bisa menjadi impersonal, "tidak sadar" dalam arti kata Freudian).

Dalam linguistiknya, Saussure secara khusus menunjukkan pergantian konsep kata dalam linguistik, yang ia definisikan sebagai tanda dan deskripsikan dari segi fungsinya. Sebuah tanda baginya adalah kombinasi dari suara dan makna, "petanda dan penunjukan" (66-67; dalam terjemahan bahasa Inggris tahun 1983 oleh Roy Harris - "signification" dan "signal"). Sifat senyawa ini adalah "fungsional" (tidak satu pun atau unsur lainnya dapat ada tanpa satu sama lain); apalagi, "yang satu meminjam kualitas dari yang lain" (8). Jadi, Saussure mendefinisikan elemen struktural utama bahasa - tanda - dan menjadikan dasar linguistik historis sebagai identitas tanda menjadi kata-kata, yang memerlukan analisis yang sangat teliti. Oleh karena itu, kita dapat memahami arti yang berbeda dari, katakanlah, kata "pohon" yang sama - bukan karena kata itu hanya seperangkat kualitas tertentu, tetapi karena itu didefinisikan sebagai elemen dalam sistem tanda, dalam "keseluruhan struktural", dalam bahasa.

Konsep kesatuan yang relatif ("diakritik") seperti itu mendasari konsep semua elemen bahasa dalam linguistik struktural. Ini sangat jelas dalam penemuan linguistik Saussurean yang paling orisinal, dalam pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah yang terkecil dari unit bahasa lisan dan bermakna. Mereka tidak hanya suara yang muncul dalam bahasa, tetapi "gambar suara", catat Saussure, yang dirasakan oleh penutur asli memiliki makna. (Perlu dicatat bahwa Elmar Holenstein menyebut linguistik Jakobson, yang melanjutkan gagasan dan konsep Saussure dalam ketentuan utamanya, "strukturalisme fenomenologis"). Itulah sebabnya pembicara terkemuka Sekolah Strukturalisme Praha, Jan Mukarowski, mengamati pada tahun 1937 bahwa “struktur. . . bukan empiris, tetapi konsep fenomenologis; itu bukan hasil itu sendiri, tetapi serangkaian hubungan signifikan dari kesadaran kolektif (generasi, orang lain, dll.)”. Pemikiran serupa diungkapkan pada tahun 1960 oleh Lévi-Strauss, pemimpin strukturalisme Prancis: “Struktur tidak memiliki konten yang pasti; itu bermakna dalam dirinya sendiri, dan konstruksi logis di mana ia terlampir adalah jejak realitas.

Pada gilirannya, fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili "realitas fenomenologis" integral yang terpisah. Misalnya, dalam bahasa Inggris, suara "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, seseorang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Disedot, dinaikkan atau diturunkan, bunyi "t" yang panjang, dll. akan sama-sama membedakan arti kata "to" dan "do". Selain itu, perbedaan antar bahasa sedemikian rupa sehingga varietas satu suara dalam satu bahasa dapat sesuai dengan fonem yang berbeda dalam bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain mereka adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan dan tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah seperangkat kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi suatu bahasa adalah seperangkat fitur yang terorganisir secara sistematis. Pada 1920-an hingga 1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Fitur-fitur ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara - Saussure memperhatikan ini dalam "Kursus Linguistik Umum", dan Harris menyebutnya "fonetik fisiologis" (dalam terjemahan Baskin sebelumnya, istilah "fonologi). " digunakan) - mereka terhubung dalam "simpul » durg melawan teman untuk membuat suara. Misalnya, dalam bahasa Inggris, perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara), dan tingkat suara yang membedakan satu fonem dengan fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa." Bahkan yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa kondisi yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Telah saya sebutkan bahwa fonologi dalam perkembangannya bertumpu pada ide-ide Saussure. Meskipun analisisnya tentang fisiologi linguistik di zaman modern, Harris mengatakan, "akan disebut 'fisik', sebagai lawan dari 'psikologis' atau 'fungsional', dalam The Course ia dengan jelas mengartikulasikan arah dan prinsip dasar analisis fungsional bahasa. Satu-satunya karyanya yang diterbitkan selama masa hidupnya, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Catatan tentang sistem vokal asli dalam bahasa Indo-Eropa), diterbitkan pada tahun 1878, sepenuhnya sejalan dengan linguistik historis komparatif dari abad ke-19. Namun demikian, dalam karya ini, kata Jonathan Culler, Saussure menunjukkan "keberhasilan gagasan bahasa sebagai sistem fenomena yang saling berhubungan, bahkan dengan rekonstruksi historisnya." Menganalisis hubungan antara fonem, menjelaskan pergantian vokal dalam bahasa modern kelompok Indo-Eropa, Saussure menyarankan bahwa selain beberapa suara "a" yang berbeda, harus ada fonem lain yang dijelaskan secara formal. “Apa yang membuat karya Saussure sangat mengesankan,” Kaller menyimpulkan, “adalah bahwa hampir 50 tahun kemudian, ketika paku Het ditemukan dan diuraikan, sebuah fonem ditemukan, secara tertulis dilambangkan dengan “h”, yang berperilaku seperti yang diprediksi Saussure. Melalui analisis formal, ia menemukan apa yang sekarang dikenal sebagai suara parau dalam bahasa-bahasa Indo-Eropa.

Dalam konsep definisi relatif (diakritik) tanda, baik eksplisit maupun tersirat dalam Kursus, ada asumsi kunci ketiga dari linguistik struktural, yang disebut oleh Saussure sebagai "sifat arbitrer dari tanda." Dengan ini dimaksudkan bahwa hubungan antara bunyi dan makna dalam bahasa tidak dimotivasi oleh apa pun: orang dapat dengan mudah menghubungkan kata "arbre" dan kata "pohon" dengan konsep "pohon". Selain itu, ini berarti bahwa suaranya juga sewenang-wenang: Anda dapat mendefinisikan konsep "pohon" dengan keberadaan kulitnya (kecuali pohon palem) dan ukurannya (kecuali untuk "tanaman berkayu rendah" - semak). Dari sini harus jelas bahwa semua asumsi yang saya sajikan tidak dibagi menjadi lebih dan kurang penting: masing-masing - sifat sistemik tanda (paling dapat dipahami dalam studi bahasa "sinkron"), relatif mereka (diakritik) esensi, sifat tanda yang sewenang-wenang - berasal dari yang lain.

Dengan demikian, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai seperangkat perbandingan dan oposisi bahasa. Bahasa adalah ekspresi makna kata (penunjukan) dan hasilnya (komunikasi) - dan kedua fungsi ini tidak pernah bertepatan (lihat "Dekonstruksi Bahasa" Shleifer). Kita dapat melihat pergantian bentuk dan isi yang dijelaskan Greimas dan Kurte dalam versi interpretasi terbaru: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi pada tingkat yang berurutan untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Ini berarti bahwa dalam suatu bahasa, ciri-ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem yang kontras, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari jumlah bagian-bagiannya (seperti air, dalam contoh Saussure, lebih dari kombinasi hidrogen dan oksigen).

Tiga asumsi "Kursus Linguistik Umum" membawa Saussure ke gagasan tentang ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari "kehidupan tanda dalam masyarakat." Saussure menyebut ilmu ini sebagai semiologi (dari bahasa Yunani "semeion" - sebuah tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada 1920-an dan 1930-an dan di Paris pada 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik ke dalam penemuan-penemuan sastra yang disusun (atau dirumuskan) dalam kerangka struktur-struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya dalam linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama-nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini merupakan upaya, seperti yang ditulis Saussure di salah satu dari 99 buku catatan, untuk mempelajari dalam sistem masalah "probabilitas", yang "menjadi dasar dari segalanya. " Penyelidikan semacam itu, menurut Saussure sendiri, membantu memusatkan perhatian pada "sisi nyata" dari kemungkinan; "Kata kunci" yang Saussure cari anagramnya, menurut Jean Starobinsky, adalah "alat bagi penyair, dan bukan sumber kehidupan puisi. Puisi berfungsi untuk membalikkan bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran terlihat: “karena puisi diungkapkan tidak hanya dalam kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa.”

Upaya Saussure untuk mempelajari nama diri dalam puisi Romawi akhir (Tsvetan Todorov menyebutnya sebagai singkatan dari "sebuah kata ... hanya sebelum itu ditulis") menekankan salah satu komponen analisis linguistiknya - sifat tanda yang arbitrer, serta esensi formal linguistik Saussurean ("Bahasa," klaim dia, "esensi bentuk, bukan fenomena"), yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa tulisan-tulisan Saussure saat ini tampak sangat konsisten dalam keengganan mereka untuk mempelajari simbol [fenomena yang memiliki makna yang terdefinisi dengan baik]. . . . Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, ia mendefinisikan simbol hanya untuk menetapkan mereka untuk pembacaan yang salah: jika mereka tidak disengaja, simbol tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang menggambarkan tidak hanya tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semilogi hanya dapat menggambarkan tanda-tanda acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak bisa membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya ini berubah menjadi sebuah pertanyaan. Sebaliknya, ia beralih ke "legitimasi linguistik". Berdiri di antara, di satu sisi, konsep abad kesembilan belas berdasarkan sejarah dan dugaan subjektif, dan metode interpretasi kebetulan berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis, yang oleh Lévi-Strauss disebut "Kantianisme tanpa aktor transenden " - menghapus pertentangan antara bentuk dan isi (subjek dan objek), makna dan asal dalam strukturalisme, psikoanalisis dan bahkan mekanika kuantum, tulisan Ferlinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi makna dalam bahasa dan budaya.

Ronald Shleifer

literatur

1. Admoni V.G. Dasar-dasar teori tata bahasa / V.G. Admoni; Akademi Ilmu Pengetahuan Uni Soviet.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metode matematika dalam linguistik. M., 1974.

4. Arnold I.V. Struktur semantik kata dalam bahasa Inggris modern dan metodologi untuk studinya. /I.V. Arnold-L.: Pendidikan, 1966. - 187 hal.

6.Bashlykov A.M. Sistem terjemahan otomatis. / SAYA. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 hal.

7.Baudouin de Courtenay: Warisan teoretis dan modernitas: Abstrak laporan konferensi ilmiah internasional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 hal.

8. A. V. Gladkiy, Unsur Linguistik Matematika. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 hal.

9. Golovin, B.N. Bahasa dan statistik. /B.N. Golovin - M., 1971. - 210 hal.

10. Zvegintsev, V.A. Linguistik teoretis dan terapan. / V.A. Zvegintsev - M., 1969. - 143 hal.

11. Kasevich, V.B. Semantik. Sintaksis. Morfologi. // V.B. Kasevich - M., 1988. - 292 hal.

12. Lekomtsev Yu.K. PENGANTAR bahasa formal linguistik / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 hal., sakit.

13. Warisan linguistik Baudouin de Courtenay pada akhir abad kedua puluh: Abstrak laporan konferensi ilmiah dan praktis internasional 15-18 Maret 2000. - Krasnoyarsk, 2000. - 125 hal.

Matveeva G.G. Makna tata bahasa tersembunyi dan identifikasi orang sosial (“potret”) pembicara / G.G. Matveev. - Rostov, 1999. - 174 hal.

14. Melchuk, I.A. Pengalaman dalam membangun model linguistik "Makna"<-->Teks". / I.A. Melchuk. - M., 1974. - 145 hal.

15. Nelyubin L.L. Terjemahan dan linguistik terapan / L.L. Nelyubin. - M.: Sekolah Tinggi, 1983. - 207 hal.

16. Tentang metode penelitian bahasa yang tepat: pada apa yang disebut "linguistik matematika" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva dan lainnya - M., 1961. - 162 hal.

17. Piotrovsky L.G. Linguistik Matematika: Buku Teks / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Sekolah Tinggi, 1977. - 160 hal.

18. Dia. Teks, mesin, orang. - L., 1975. - 213 hal.

19. Dia. Linguistik Terapan / Ed. A.S. Gerda. - L., 1986. - 176 hal.

20. Revzin, I.I. model bahasa. M., 1963. Revzin, I.I. Linguistik struktural modern. Masalah dan metode. M., 1977. - 239 hal.

21. Revzin, II, Rozentsveig, V.Yu. Dasar-dasar terjemahan umum dan mesin / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 hal.

22. Slyusareva N.A. Teori F. de Saussure dalam terang linguistik modern / N.A. Slyusareva. - M.: Nauka, 1975. - 156 hal.

23. Burung Hantu, L.Z. Linguistik analitik / L.Z. Burung Hantu - M., 1970. - 192 hal.

24. Saussure F. de. Catatan tentang Linguistik Umum / F. de Saussure; Per. dari fr. - M.: Kemajuan, 2000. - 187 hal.

25. Dia. Kursus Linguistik Umum / Per. dari fr. - Yekaterinburg, 1999. -426 hal.

26. Statistik pidato dan analisis teks otomatis / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 hal.

27. Stoll, P. Set. Logika. Teori aksiomatik / R. Stoll; Per. dari bahasa Inggris. - M., 1968. - 180 hal.

28. Tenier, L. Dasar-dasar sintaksis struktural. M., 1988.

29. Ubin I.I. Otomatisasi kegiatan penerjemahan di USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 hal.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematika Modern. M, 1966.

31. Shenk, R. Pemrosesan informasi konseptual. M, 1980.

32. Shikhanovich, Yu.A. PENGANTAR matematika modern (konsep awal). M., 1965

33. Shcherba L.V. Vokal Rusia dalam istilah kualitatif dan kuantitatif / L.V. Shcherba - L.: Nauka, 1983. - 159 hal.

34. Abdullah-zade F. Warga dunia // Spark - 1996. - No. 5. - hal.13

35. V.A. Uspensky. Pendahuluan untuk pembaca "Tinjauan Sastra Baru" untuk pesan semiotik Andrei Nikolaevich Kolmogorov. - Ulasan Sastra Baru. -1997. - No. 24. - S. 18-23

36. Perlovsky L. Kesadaran, bahasa dan budaya. - Pengetahuan adalah kekuatan. -2000. 4 - S. 20-33

Pengantar? Teori Penerjemahan Kuliah

Selama abad terakhir, linguistik selalu dikutip sebagai contoh ilmu yang berkembang pesat dan sangat cepat mencapai kematangan metodologis. Sudah di pertengahan abad terakhir, sains muda dengan percaya diri mengambil tempatnya di lingkaran sains yang memiliki tradisi seribu tahun, dan salah satu perwakilannya yang paling menonjol - A. Schleicher - memiliki keberanian untuk percaya bahwa dengan karyanya ia sudah menyimpulkan baris terakhir.<113>Namun, sejarah linguistik telah menunjukkan bahwa pendapat seperti itu terlalu tergesa-gesa dan tidak dapat dibenarkan. Pada akhir abad, linguistik mengalami kejutan besar pertama yang terkait dengan kritik terhadap prinsip-prinsip neo-tata bahasa, diikuti oleh yang lain. Perlu dicatat bahwa semua krisis yang dapat kita temukan dalam sejarah ilmu bahasa, sebagai suatu peraturan, tidak menggoyahkan fondasinya, tetapi, sebaliknya, berkontribusi pada penguatan dan pada akhirnya membawa serta perbaikan dan peningkatan. metode penelitian linguistik, berkembang seiring dengan tema dan masalah ilmiah.

Tetapi di samping linguistik, ilmu-ilmu lain juga hidup dan berkembang, termasuk sejumlah besar ilmu baru. Ilmu fisika, kimia, dan teknis (yang disebut "persis") telah menerima perkembangan yang sangat pesat di zaman kita, dan dasar teoretisnya, matematika, telah menguasai semuanya. Ilmu-ilmu eksakta tidak hanya sangat menekan semua humaniora, tetapi saat ini mereka berusaha untuk "membawa mereka ke dalam iman mereka", untuk menundukkan mereka pada kebiasaan mereka, untuk memaksakan metode penelitian mereka pada mereka. Dalam situasi saat ini, dengan menggunakan ekspresi Jepang, orang dapat mengatakan bahwa sekarang ahli bahasa-filolog sedang mengotori tepi tikar, di mana ilmu eksakta, dipimpin oleh matematika, berada dengan penuh kemenangan dan bebas.

Bukankah lebih bijaksana, dari sudut pandang kepentingan ilmiah umum, untuk menyerah pada matematika, untuk menyerah sepenuhnya pada kekuatan metodenya, yang oleh beberapa suara secara terbuka disebut 59 , dan dengan demikian, mungkin, mendapatkan kekuatan baru ? Untuk menjawab pertanyaan-pertanyaan ini, pertama-tama kita harus melihat apa klaim matematika dalam kasus ini, di bidang apa metode matematika linguistik menemukan aplikasinya, sejauh mana mereka konsisten dengan kekhususan materi bahasa dan apakah mereka mampu memberikan atau bahkan hanya menyarankan jawaban atas pertanyaan-pertanyaan itu.ditetapkan oleh ilmu bahasa.

Sejak awal, perlu dicatat bahwa di antara para penggemar tren matematika baru dalam linguistik<114>Tidak ada kebulatan pendapat mengenai tujuan dan sasarannya dalam penelitian statis. akad. A. A. Markov, yang pertama kali menerapkan metode matematika ke bahasa, Boldrini, Yul, Mariotti menganggap elemen bahasa sebagai bahan ilustratif yang cocok untuk membangun metode kuantitatif, atau untuk teorema statistik, tanpa bertanya-tanya apakah hasil studi semacam itu menarik. untuk ahli bahasa 6 0 . Ross percaya bahwa teori probabilitas dan statistik matematika menyediakan alat atau, seperti yang sekarang mereka lebih suka katakan, model matematika untuk menguji dan mengkonfirmasi kesimpulan linguistik yang memungkinkan interpretasi numerik. Jadi, metode matematika dipahami hanya sebagai alat bantu penelitian linguistik 6 1 . Lebih banyak lagi yang diklaim oleh Herdan, yang dalam bukunya tidak hanya merangkum dan mensistematisasikan semua upaya studi matematika masalah bahasa, tetapi juga mencoba memberi mereka orientasi yang jelas dalam kaitannya dengan pekerjaan lebih lanjut. Dia memfokuskan presentasi seluruh materi bukunya pada "memahami statistik sastra (seperti yang dia sebut studi teks dengan metode statistik matematika. - DI 3.) sebagai bagian integral dari linguistik” 6 2 , dan merumuskan esensi dan tugas bagian baru dalam linguistik ini dengan kata-kata berikut: “Statistik sastra sebagai filsafat kuantitatif bahasa berlaku untuk semua cabang linguistik. Menurut pendapat kami, statistik sastra adalah linguistik struktural yang diangkat ke tingkat ilmu kuantitatif atau filsafat kuantitatif. Jadi, sama-sama salah untuk mendefinisikan hasilnya sebagai di luar cakupan<115>linguistik atau memperlakukannya sebagai alat bantu untuk penelitian” 6 3 .

Hampir tidak disarankan untuk berteori tentang apakah sah dalam kasus ini untuk berbicara tentang munculnya cabang baru linguistik dan untuk menyelesaikan masalah klaimnya, tanpa terlebih dahulu mengacu pada pertimbangan apa yang sebenarnya telah dilakukan di area ini, dan untuk mengklarifikasi ke arah mana penerapan metode baru 6 4 . Ini akan membantu kita memahami perbedaan pendapat.

Penggunaan kriteria matematika (atau, lebih tepatnya, statistik) untuk memecahkan masalah linguistik sama sekali bukan hal baru bagi ilmu bahasa dan, sampai taraf tertentu, telah lama digunakan oleh para ahli bahasa. Lagi pula, pada kenyataannya, konsep linguistik tradisional seperti hukum fonetik (dan terkait<116>nee with it - pengecualian terhadap hukum), produktivitas elemen tata bahasa (misalnya, sufiks turunan), atau bahkan kriteria untuk hubungan terkait antar bahasa, sampai batas tertentu, didasarkan pada fitur statistik relatif. Lagi pula, semakin tajam dan lebih jelas pertentangan statistik dari kasus-kasus yang diamati, semakin banyak alasan kita harus berbicara tentang sufiks produktif dan tidak produktif, tentang hukum fonetik dan pengecualiannya, tentang ada tidaknya kekerabatan antar bahasa. Tetapi jika dalam kasus seperti itu prinsip statistik digunakan lebih atau kurang secara spontan, maka di masa depan itu mulai diterapkan secara sadar dan sudah dengan penetapan tujuan tertentu. Jadi, di zaman kita, apa yang disebut kamus frekuensi kosa kata dan ekspresi bahasa individu 6 5 atau bahkan arti kata-kata multibahasa dengan "fokus umum pada kenyataan" 6 6 telah menjadi sangat luas. Data kamus-kamus ini digunakan untuk menyusun buku teks bahasa asing (teks yang dibangun di atas kosakata yang paling umum digunakan) dan kamus minimum. Kalkulus statistik menemukan penggunaan linguistik khusus dalam metode leksikostatistik atau glottokronologi oleh M. Swadesh, di mana, berdasarkan rumus statistik yang memperhitungkan kasus-kasus penghilangan dari bahasa kata-kata dana utama, itu adalah mungkin untuk menetapkan kronologi absolut dari pemotongan keluarga bahasa 6 7 .

Dalam beberapa tahun terakhir, kasus penerapan metode matematika untuk materi linguistik telah meningkat secara signifikan, dan dalam banyak upaya semacam itu, arah yang kurang lebih pasti telah digariskan. Ayo putar<117>untuk pertimbangan berurutan mereka, tanpa masuk ke rincian.

Mari kita mulai dengan arah yang diberi nama stilostatistika. Dalam hal ini, kita berbicara tentang definisi dan karakterisasi fitur gaya karya individu atau penulis melalui hubungan kuantitatif elemen linguistik yang digunakan. Dasar pendekatan statistik untuk mempelajari fenomena stilistika adalah pemahaman gaya sastra sebagai cara individu untuk menguasai sarana bahasa. Pada saat yang sama, peneliti benar-benar teralihkan dari pertanyaan tentang signifikansi kualitatif dari unsur-unsur linguistik yang dapat dihitung, memusatkan semua perhatiannya hanya pada sisi kuantitatif; sisi semantik unit bahasa yang dipelajari, beban emosional dan ekspresifnya, serta bagiannya dalam jalinan karya seni - semua ini tetap tidak diperhitungkan, mengacu pada apa yang disebut fenomena berlebihan. Dengan demikian, sebuah karya seni muncul dalam bentuk agregat mekanis, kekhususan konstruksi yang menemukan ekspresinya hanya melalui hubungan numerik elemen-elemennya. Perwakilan stylostatistik tidak menutup mata terhadap semua keadaan yang dicatat, menentang metode stilistika tradisional, yang tidak diragukan lagi mencakup elemen subjektivitas, dengan satu kualitas metode matematika, yang, menurut pendapat mereka, mengkompensasi semua kekurangannya - objektivitas hasil yang dicapai. "Kami berusaha," tulis, misalnya, V. Fuchs, "... untuk mengkarakterisasi gaya ekspresi linguistik dengan cara matematis. Untuk tujuan ini, metode harus dibuat, yang hasilnya harus seobjektif dengan hasil ilmu eksakta... Ini menunjukkan bahwa, setidaknya pada awalnya, kita hanya akan berurusan dengan kualitas struktural formal, dan bukan dengan konten semantik. ekspresi linguistik. . Dengan cara ini kita akan memperoleh sistem hubungan ordinal, yang secara keseluruhan akan menjadi dasar dan titik awal teori matematika gaya” 6 8 .<118>

Jenis pendekatan statistik yang paling sederhana untuk mempelajari bahasa penulis atau karya individu adalah menghitung kata-kata yang digunakan, karena kekayaan kamus, tampaknya, juga harus mencirikan penulis itu sendiri dengan cara tertentu. Namun, hasil perhitungan tersebut memberikan hasil yang agak tidak terduga dalam hal ini dan sama sekali tidak berkontribusi pada pengetahuan estetika dan evaluasi karya sastra, yang tidak sedikit merupakan salah satu tugas stilistika. Berikut adalah beberapa data jumlah kata yang digunakan dalam sejumlah karya:

Alkitab (Latin). . . . . . . . . . 5649 kata

Alkitab (Ibrani). . . . 5642 kata

Demosthenes (ucapan). . . . . . . . . . . . 4972 kata

Sallust. . . . . . . . . . . . . . . . . 3394 kata

Horace. . . . . . . . . . . . . . . . . . . .6084 kata

Dante (Komedi Ilahi) 5860 kata

(ini termasuk 1615 nama diri dan nama geografis)

Tasso (Orlandia Furious). . . . 8474 kata

Milton. . . . . . . . . . . . . . . . . . . . .8000 kata (perkiraan diberikan)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 kata

(kurang lebih, menurut sumber lain 20.000 kata)

O. Jespersen menunjukkan bahwa kamus Zola, Kipling dan Jack London secara signifikan melebihi kamus Milton, yaitu jumlahnya 8000 6 9 . Perhitungan kamus pidato Presiden AS W. Wilson menemukan bahwa itu lebih kaya daripada Shakespeare. Untuk ini harus ditambahkan data psikolog. Jadi, Terman, berdasarkan pengamatan sejumlah besar kasus, menemukan bahwa kosakata anak rata-rata adalah sekitar 3600 kata, dan pada usia 14 - sudah 9000. Rata-rata orang dewasa menggunakan 11700 kata, dan seseorang "bertambah kecerdasan" hingga 13500 7 0 . Dengan demikian, data numerik seperti itu sendiri tidak memberikan alasan apa pun untuk mengidentifikasi kualitas gaya karya dan hanya "objektif" con<119>mereka menyatakan penggunaan jumlah kata yang berbeda oleh penulis yang berbeda, yang, seperti yang ditunjukkan oleh perhitungan di atas, tidak terkait dengan nilai artistik relatif dari karya mereka.

Perhitungan frekuensi relatif penggunaan kata-kata oleh masing-masing penulis disusun agak berbeda. Dalam hal ini, tidak hanya jumlah total kata yang diperhitungkan, tetapi juga frekuensi penggunaan kata-kata individual. Pemrosesan statistik bahan yang diperoleh dengan cara ini terdiri dari fakta bahwa kata-kata dengan frekuensi penggunaan yang sama dikelompokkan ke dalam kelas (atau peringkat), yang mengarah pada pembentukan distribusi frekuensi semua kata yang digunakan oleh penulis tertentu. Kasus khusus dari perhitungan semacam ini adalah penentuan frekuensi relatif kata-kata khusus (misalnya, kosakata Roman dalam karya Chaucer, seperti yang dilakukan oleh Mersand 71). Frekuensi relatif dari kata-kata yang digunakan oleh penulis mengandung informasi objektif yang sama tentang gaya masing-masing penulis seperti perhitungan total di atas, dengan satu-satunya perbedaan bahwa hasilnya adalah data numerik yang lebih akurat. Tetapi juga digunakan untuk memberi tanggal pada karya individu dari penulis yang sama berdasarkan perhitungan awal dari frekuensi relatif penggunaan kata-katanya dalam periode yang berbeda dalam hidupnya (menurut karya yang diberi tanggal oleh penulis sendiri). Jenis lain dari penggunaan data dari perhitungan tersebut adalah untuk menetapkan keaslian kepengarangan karya yang masalah ini tampaknya meragukan 7 2 . Dalam kasus terakhir ini, semuanya didasarkan pada perbandingan formula statistik untuk frekuensi penggunaan dalam karya asli dan kontroversial. Tidak perlu berbicara tentang relativitas yang sangat besar dan perkiraan hasil yang diperoleh dengan metode tersebut. Lagi pula, frekuensi relatif penggunaan bervariasi tidak hanya dengan usia penulis, tetapi juga tergantung pada genre, plot, dan lingkungan historis dari karya tersebut (lih., misalnya, "Roti" dan "Peter I" oleh A .Tolstoy).<120>

Memperdalam metode yang dijelaskan di atas, stylostatistics sebagai karakteristik gaya mulai menggunakan kriteria stabilitas frekuensi relatif dari kata-kata yang paling umum digunakan. Metode yang digunakan dalam kasus ini dapat diilustrasikan dengan pemrosesan statistik cerita Pushkin "Putri Kapten" oleh Esselson dan Epstein di Institut Bahasa Slavonik di Universitas Detroit (AS) 7 3 . Seluruh teks cerita (sekitar 30.000 kemunculan kata-kata) menjadi sasaran survei, dan kemudian bagian-bagian yang berisi sekitar 10.000 dan 5.000 kemunculan. Selanjutnya, untuk menentukan stabilitas frekuensi relatif penggunaan kata, 102 kata yang paling umum (dengan frekuensi 1160 kali hingga 35) dibandingkan dengan frekuensi relatif yang dihitung (dibuat berdasarkan bagian selektif) dengan yang sebenarnya. Misalnya, gabungan "dan" digunakan 1.160 kali sepanjang cerita. Dalam bagian yang berisi 5.000 kemunculan semua kata, konjungsi ini diharapkan digunakan 5.000 x 1.160:30.000, atau dibulatkan 193 kali, dan di bagian yang berisi 10.000 kemunculan semua kata, diharapkan digunakan 10.000 x 1.160: 30.000, atau 386 kali. Perbandingan data yang diperoleh dengan perhitungan semacam ini dengan data sebenarnya menunjukkan penyimpangan yang sangat kecil (dalam 5%). Berdasarkan perhitungan tersebut, ditemukan bahwa dalam cerita Pushkin ini, kata depan "k" digunakan dua kali lebih sering daripada "y", dan kata ganti "kamu" digunakan tiga kali lebih sering daripada "mereka", dll. , terlepas dari semua perubahan plot, baik di sepanjang cerita maupun di bagian-bagiannya masing-masing, ada stabilitas dalam frekuensi relatif penggunaan kata-kata. Apa yang diamati dalam kaitannya dengan beberapa kata (paling umum) mungkin berlaku untuk semua kata yang digunakan dalam karya tersebut. Oleh karena itu, gaya pengarang dapat dicirikan oleh rasio tertentu dari variabilitas frekuensi rata-rata penggunaan kata dengan frekuensi umum untuk bahasa tertentu.<121>frekuensi penggunaannya. Rasio ini dianggap sebagai karakteristik kuantitatif objektif dari gaya penulis.

Unsur-unsur formal lain dari struktur bahasa dipelajari dengan cara yang sama. Jadi, misalnya, V. Fuchs menjadikan ciri-ciri metrik dari karya-karya Goethe, Rilke, Caesar, Sallust, dll. dengan pertimbangan statistik-komparatif.7 4

Kriteria stabilitas frekuensi relatif penggunaan kata-kata, sementara mengklarifikasi teknik karakterisasi kuantitatif gaya, tidak memperkenalkan sesuatu yang baru secara fundamental dibandingkan dengan metode yang lebih primitif yang dianalisis di atas. Semua metode stylostatistics pada akhirnya memberikan hasil "objektif" tanpa perasaan yang sama, meluncur di atas permukaan bahasa dan hanya berpegang teguh pada tanda-tanda eksternal murni. Metode kuantitatif tampaknya tidak mampu memusatkan perhatian pada perbedaan kualitatif dalam materi yang diteliti dan pada kenyataannya meratakan semua objek yang diteliti.

Dimana spesifikasi maksimum diperlukan, kriteria yang paling umum ditawarkan; karakteristik kualitatif dinyatakan dalam bahasa kuantitas. Ini bukan hanya kontradiksi logis, tetapi juga ketidaksepakatan dengan sifat segala sesuatu. Memang, apa yang terjadi jika kita mencoba untuk mendapatkan karakteristik stilistika komparatif (yaitu, kualitatif) dari karya Alexander Gerasimov dan Rembrandt berdasarkan rasio kuantitatif cat merah dan hitam di kanvas mereka? Tampaknya menjadi omong kosong mutlak. Sejauh mana informasi kuantitatif "objektif" sepenuhnya tentang data fisik seseorang dapat memberi kita gambaran tentang segala sesuatu yang menjadi ciri seseorang dan merupakan esensi sejatinya? Jelas tidak ada. Mereka hanya dapat berfungsi sebagai tanda individu yang membedakan satu orang dari yang lain, seperti jejak lilitan pada ibu jari. Situasi ini mirip dengan karakteristik kuantitatif gaya sastra. Jika Anda melihat lebih dekat, mereka hanya menyediakan sedikit data untuk menilai gaya yang sebenarnya<122>kualitas bahasa penulis, serta deskripsi lilitan di jari untuk studi psikologi manusia.

Untuk semua yang telah dikatakan, harus ditambahkan bahwa di masa lalu, dalam apa yang disebut sekolah formal kritik sastra, upaya telah dilakukan untuk melakukan studi kuantitatif tentang gaya penulis, ketika julukan, metafora, dan ritme -elemen melodi dari sajak dihitung. Namun, upaya ini tidak dikembangkan lebih lanjut.

Bidang lain penerapan metode matematika untuk mempelajari fenomena linguistik dapat dikelompokkan dengan nama statistik linguistik. Ia berusaha untuk menyusup ke dalam pertanyaan-pertanyaan mendasar dari teori bahasa, dan dengan demikian memperoleh panggilan di bidang linguistik itu sendiri. Untuk berkenalan dengan arah ini, yang terbaik adalah beralih ke karya Herdan yang telah disebutkan, dalam kata-kata salah satu dari banyak pengulasnya, "sebuah buku yang sangat megah" 7 5 , menerima, bagaimanapun, respon yang luas di antara ahli bahasa 7 6 . Mengingat fakta bahwa Herdan (sebagaimana telah disebutkan di atas) berusaha untuk mengumpulkan dalam bukunya segala sesuatu yang paling signifikan di bidang penerapan metode matematika untuk masalah linguistik, dalam bukunya kita sebenarnya tidak berurusan dengan Herdan secara keseluruhan. kecenderungan. Seperti yang ditunjukkan oleh judul buku, Language as Choice and Probability, fokus utamanya adalah mengklarifikasi apa yang tersisa dalam bahasa untuk pilihan bebas pembicara dan apa yang disebabkan oleh struktur imanen bahasa, sebagaimana adanya. tentang menentukan rasio kuantitatif unsur-unsur orde pertama dan kedua. Buku Kherdan memberikan informasi yang hampir lengkap tentang semua pekerjaan di bidang ini yang dilakukan oleh perwakilan dari berbagai spesialisasi.<123>(filsuf, ahli bahasa, matematikawan, teknisi), tetapi tidak terbatas pada ini dan mencakup banyak pengamatan, pertimbangan, dan kesimpulan asli dari penulis sendiri. Sebagai pekerjaan meringkas, ini memberikan gambaran yang baik tentang metode kuantitatif yang digunakan, dan hasil yang dicapai dengan bantuan mereka. Pertanyaan-pertanyaan yang kami gabungkan secara kondisional ke dalam bagian statistik linguistik dibahas di bagian kedua dan keempat buku ini.

Dari banyak kasus penerapan metode statistik matematika untuk mempelajari masalah linguistik, kami akan fokus pada yang paling umum, yang juga dapat dianggap sebagai yang paling umum. Menggunakan data dari penulis lain - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 dan lain-lain, serta mengutip penelitiannya sendiri yang menentukan frekuensi relatif distribusi fonem, huruf, panjang kata (diukur dengan jumlah huruf dan suku kata) , bentuk tata bahasa dan elemen metrik dalam heksameter Latin dan Yunani, Herdan menetapkan fakta stabilitas frekuensi relatif elemen linguistik sebagai karakteristik umum dari semua struktur linguistik. Dia memperoleh aturan berikut: “Proporsi unsur-unsur linguistik yang termasuk dalam satu atau beberapa tingkat atau lingkup pengkodean linguistik - fonologi, tata bahasa, metrik - tetap kurang lebih konstan untuk bahasa tertentu, dalam periode perkembangan tertentu dan dalam periode waktu tertentu. batas pengamatan yang cukup luas dan dilakukan secara tidak memihak. » 8 2 . Aturan ini, yang disebut Herdan sebagai hukum dasar bahasa, ia berusaha untuk menafsirkan dan memperluas dengan cara tertentu. “Dia,” Herdan menulis tentang hukum ini, “adalah ekspresi dari fakta bahwa bahkan di sini, di mana kehendak manusia dan kebebasan memilih diberikan<124>kerangka terluas, di mana pilihan sadar dan permainan tanpa beban bergantian satu sama lain, ada stabilitas yang cukup besar secara keseluruhan ... dalam tata bahasa, tetapi juga dalam kaitannya dengan frekuensi penggunaan fonem tertentu, unit leksikal (kata) dan fonem tata bahasa dan konstruksi; dengan kata lain kesamaan tidak hanya pada apa yang digunakan, tetapi juga pada seberapa sering digunakan” 8 3 . Situasi ini karena alasan yang dapat dimengerti, tetapi ini menimbulkan kesimpulan baru. Ketika memeriksa teks atau segmen yang berbeda dari bahasa tertentu, misalnya, ditemukan bahwa frekuensi relatif dari penggunaan fonem tertentu (atau elemen bicara lainnya) oleh orang yang berbeda pada dasarnya tetap sama. Ini mengarah pada interpretasi bentuk-bentuk ucapan individu sebagai beberapa fluktuasi dalam kemungkinan konstan menggunakan fonem yang dipertimbangkan dalam bahasa tertentu. Dengan demikian, ternyata dalam kegiatan bertuturnya seseorang tunduk pada hukum-hukum probabilitas tertentu dalam kaitannya dengan banyaknya unsur kebahasaan yang digunakan. Dan kemudian, ketika kita mengamati sejumlah besar unsur-unsur linguistik dalam satu set besar teks atau segmen pidato, kita mendapatkan kesan ketergantungan kausal dalam arti bahwa dalam hal ini juga ada penentuan dalam kaitannya dengan penggunaan unsur-unsur linguistik tertentu. . Dengan kata lain, ternyata dapat diterima untuk menyatakan bahwa apa yang tampak sebagai hubungan sebab akibat dari sudut pandang intuitif, secara kuantitatif adalah probabilitas 8 4 . Jelas bahwa semakin besar total<125>kekhususan teks atau segmen tutur yang diperiksa, maka semakin jelas pula kestabilan frekuensi relatif penggunaan unsur kebahasaan juga akan terwujud dalam penggunaan individu (hukum bilangan besar). Dari sini, kesimpulan umum baru ditarik bahwa bahasa adalah fenomena massa dan harus diperlakukan seperti itu.

Kesimpulan-kesimpulan ini, yang dicapai berdasarkan perhitungan frekuensi unsur-unsur fonetik, kata-kata dan bentuk-bentuk gramatikal, yang bersama-sama membentuk suatu bahasa, kemudian diterapkan pada "interpretasi statistik" pembagian Saussure menjadi "bahasa" (lalangue) dan "ucapan" (laparole). ). Menurut Saussure, "bahasa" adalah seperangkat kebiasaan linguistik yang memungkinkan komunikasi antara anggota komunitas linguistik tertentu. Ini adalah realitas sosial, "fenomena massa", wajib bagi semua orang yang berbicara bahasa ini. Herdan, sebagaimana ditunjukkan, membuktikan bahwa anggota-anggota komunitas bahasa yang satu itu mirip satu sama lain tidak hanya dalam hal mereka menggunakan fonem, satuan leksikal, dan bentuk gramatikal yang sama, tetapi juga dalam kenyataan bahwa semua elemen ini digunakan dengan frekuensi yang sama. . Jadi, definisi statistiknya tentang "bahasa" mengambil bentuk berikut: "bahasa" (lalangue) adalah totalitas elemen linguistik umum ditambah kemungkinan relatifnya untuk digunakan.

Definisi "bahasa" ini juga merupakan titik awal untuk interpretasi statistik yang sesuai dari "ucapan", yang menurut Saussure, adalah ucapan individu. Membandingkan "bahasa" sebagai fenomena sosial "ucapan" sebagai fenomena individu, Saussure menulis: "Ucapan adalah tindakan kehendak dan pemahaman individu, di mana perlu untuk membedakan: 1. kombinasi dengan subjek yang berbicara menggunakan bahasa kode untuk mengungkapkan pemikiran pribadinya; 2. mekanisme psikofisik yang memungkinkan dia untuk mengobjektifikasi kombinasi ini” 8 5 . Karena "bahasa" dalam statistik linguistik dianggap sebagai seperangkat elemen dengan kerabat tertentu<126>probabilitas tertentu penggunaannya, sejauh mencakup totalitas statistik atau ensemble (populasi) sebagai karakteristik yang paling penting dan dapat dipertimbangkan dalam aspek ini. Sesuai dengan ini, "ucapan" berubah menjadi sampel terpisah yang diambil dari "bahasa" sebagai agregat statistik. Probabilitas dalam hal ini ditentukan oleh rasio "ucapan" terhadap "bahasa" (dalam pemahaman "kuantitatif"), dan distribusi frekuensi relatif penggunaan elemen bahasa yang berbeda ditafsirkan sebagai hasil dari “pilihan” kolektif (choice) dalam suatu periode kronologis tertentu dari keberadaan bahasa tersebut. Memahami bahwa interpretasi perbedaan antara "bahasa" dan "ucapan" semacam itu dibangun di atas dasar yang sama sekali berbeda dari interpretasi Saussure, Herdan menulis dalam hal ini: "Modifikasi kecil konsep Saussure ini memiliki konsekuensi penting bahwa "bahasa" ( lalangue ) sekarang memperoleh karakteristik penting dalam bentuk agregat statistik (penduduk). Populasi ini dicirikan oleh frekuensi relatif tertentu atau probabilitas fluktuasi, artinya setiap unsur kebahasaan termasuk ke dalam tingkat kebahasaan tertentu. Dalam hal ini, “ucapan” (laparole), sesuai dengan artinya, ternyata menjadi istilah untuk mendefinisikan sampel statistik yang diambil dari “bahasa” sebagai populasi statistik. Menjadi jelas bahwa pilihan (choice) muncul di sini dalam bentuk rasio "ucapan" dengan "bahasa", menjadi rasio sampel yang diambil secara acak dengan agregat statistik (populasi). Urutan distribusi frekuensi itu sendiri, sebagai simpanan aktivitas bicara komunitas linguistik selama berabad-abad, adalah elemen pilihan (pilihan), tetapi bukan pilihan individu, seperti dalam gaya, tetapi pilihan kolektif. Dengan menggunakan metafora, kita dapat berbicara di sini tentang pilihan yang dibuat oleh semangat bahasa, jika kita memahami prinsip-prinsip komunikasi linguistik ini, yang sesuai dengan kompleks data mental anggota komunitas linguistik tertentu. Kestabilan deret adalah hasil dari peluang (peluang)» 8 6 .

Kasus khusus penerapan prinsip yang dinyatakan<127>pa adalah batasan dalam bahasa fenomena normatif dari "pengecualian" (deviasi). Statistik linguistik menyatakan bahwa metode statistik memungkinkan untuk menghilangkan ketidakjelasan yang ada dalam masalah ini dan menetapkan kriteria yang jelas untuk membedakan antara fenomena ini. Jika norma dipahami sebagai populasi statistik (dalam pengertian di atas), dan pengecualian (atau kesalahan) adalah penyimpangan dari frekuensi yang ditunjukkan oleh populasi statistik, maka solusi kuantitatif dari pertanyaan itu sendiri. Semuanya bermuara pada hubungan statistik antara "populasi" dan "pencilan". Jika frekuensi yang diamati dalam sampel individu menyimpang dari probabilitas karena populasi statistik lebih dari yang ditentukan oleh serangkaian jumlah sampel, maka kami memiliki alasan untuk menyimpulkan bahwa garis demarkasi antara "sama" (norma) dan "tidak sama" (pengecualian) dilanggar.

Perbedaan kuantitatif antara "bahasa" dan "ucapan" juga digunakan untuk membedakan dua jenis elemen linguistik: gramatikal dan leksikal. Titik awal untuk memecahkan masalah ini, yang sering menimbulkan kesulitan besar dari sudut pandang linguistik, adalah asumsi bahwa tingkat frekuensi elemen gramatikal berbeda dari unit leksikal. Ini diduga terkait dengan "generalisasi" elemen gramatikal, bagaimana mereka berbeda dari konsep yang ditetapkan oleh unit leksikal. Selain itu, elemen tata bahasa dianggap, sebagai suatu peraturan, volumenya jauh lebih kecil: sebagai kata-kata independen (termasuk kata ganti, preposisi, konjungsi, dan kata-kata bantu) mereka biasanya terdiri dari sejumlah kecil fonem, dan dalam bentuk "bentuk-bentuk yang terhubung". " - dari satu atau dua fonem 8 7 . Semakin kecil elemen linguistiknya, semakin kecil "panjang" (momen kuantitatif)-nya untuk berfungsi sebagai karakteristik yang menentukan, dan semakin penting "kualitas" fonem yang diperoleh untuk tujuan ini. Metode apa yang diusulkan untuk memecahkan masalah yang sedang dipertimbangkan? Ini diselesaikan dengan mengacu pada konsep gramatikal murni kuantitatif<128>memuat, “Misalkan,” tulis Herdan sehubungan dengan ini, “bahwa kami tertarik untuk membandingkan dua bahasa dalam hal ini. Bagaimana kita menentukan dengan tingkat objektivitas tertentu "beban gramatikal" yang dibawa oleh suatu bahasa? Jelas bahwa beban ini akan tergantung pada posisi garis demarkasi yang memisahkan tata bahasa dari kosa kata. Pertimbangan pertama yang mungkin muncul di benak kita adalah untuk menentukan seberapa "kompleks" tata bahasa suatu bahasa. Bagaimanapun, "kompleksitas" adalah karakteristik kualitatif, dan konsep "beban gramatikal" adalah karakteristik kuantitatif. Benar, beban sampai batas tertentu tergantung pada kerumitannya, tetapi tidak sepenuhnya. Suatu bahasa mungkin dihargai dengan tata bahasa yang sangat kompleks, tetapi hanya sebagian kecil yang digunakan dalam aktivitas bahasa tersebut. Kami mendefinisikan "beban gramatikal" sebagai totalitas tata bahasa yang dibawa oleh suatu bahasa ketika sedang beraksi, yang segera membawa masalah kami ke ranah linguistik struktural dalam arti di mana disiplin itu didefinisikan oleh Saussure. Dalam penyajian berikut, metode kuantitatif digunakan untuk menentukan perbedaan antar bahasa, tergantung di mana letak batasnya, memisahkan tata bahasa dari kosa kata” 8 8 . Dengan kata lain, perbedaan bahasa dalam hal ini harus direduksi menjadi perbedaan hubungan numerik antara unsur gramatikal dan leksikal.

Bahan-bahan yang kami miliki mengecat gambar berikut. Dalam bahasa Inggris (hanya "kata tata bahasa" yang diperhitungkan: kata ganti, atau, sebagaimana mereka juga disebut, "pengganti", preposisi, konjungsi, dan kata kerja bantu), dalam segmen yang mencakup 78633 kasus penggunaan semua kata (1027 kata berbeda), 53.102 kasus penggunaan unsur gramatikal, atau lebih tepatnya "kata gramatikal" (149 kata berbeda), yaitu 67,53% dengan 15,8% kata berbeda. Demikian data Deway 8 9 . Data lain menunjukkan persentase yang berbeda<129>rasio: 57,1% dengan 5,4% kata berbeda 9 0 . Perbedaan yang signifikan ini dijelaskan oleh perbedaan antara bahasa tertulis dan lisan. Bentuk bahasa tertulis (data pertama) diduga menggunakan lebih banyak unsur gramatikal daripada lisan (kasus kedua). Dalam Divine Comedy Dante (setelah asli Italia), Mariotti menetapkan 54,4% kemunculan "kata-kata gramatikal".

Cara lain dan tampaknya lebih sempurna untuk menentukan beban gramatikal suatu bahasa adalah dengan menghitung fonem-fonem yang termasuk dalam unsur-unsur gramatikal. Dalam hal ini, tidak hanya kata-kata tata bahasa independen yang diperhitungkan, tetapi juga bentuk-bentuk terkait. Ada berbagai pilihan di sini. Misalnya, menentukan frekuensi relatif penggunaan fonem konsonan individu dalam elemen tata bahasa dan membandingkannya dengan frekuensi penggunaan total fonem yang sama ini (data akhir dari rasio semacam itu dalam bahasa Inggris memberikan proporsi 99,9% hingga 100.000 - penggunaan total); atau perbandingan konsonan serupa menurut kelompok klasifikasi terpisah (labial, palatal, velar, dan fonem lainnya). Rasio akhir di sini berbentuk proporsi 56,47% (dalam elemen tata bahasa) hingga 60,25% (dalam penggunaan total); atau perbandingan yang sama dari fonem konsonan awal (dalam hal ini, kami mendapatkan rasio 100,2% dalam kata-kata tata bahasa dengan 99,95 dalam penggunaan total). Operasi statistik lain yang lebih kompleks juga dimungkinkan, yang, bagaimanapun, menghasilkan ekspresi kuantitatif serupa dari masalah yang diteliti.

Data kuantitatif yang diberikan berfungsi sebagai dasar untuk kesimpulan umum. Ini bermuara pada fakta bahwa distribusi fonem dalam unsur-unsur gramatikal menentukan sifat distribusi (dalam istilah numerik, tentu saja) fonem dalam bahasa secara keseluruhan. Dan ini, pada gilirannya, memungkinkan kita untuk menyimpulkan bahwa penggunaan elemen gramatikal pada tingkat paling rendah tergantung pada pilihan individu dan merupakan bagian dari ekspresi linguistik yang dikendalikan oleh probabilitas.<130>ness. Kesimpulan spekulatif ini dikonfirmasi oleh perhitungan bentuk tata bahasa dalam bahasa Rusia, yang dibuat oleh Esselson 9 1 . Penelitian ini menggunakan 46896 kata yang diambil dari sumber II (karya Griboyedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov dan N. Ostrovsky). Mereka dibagi menjadi kata-kata sehari-hari (17.756 kata atau 37,9%) dan non-bahasa sehari-hari (29140 kata atau 62,1%). Kemudian seluruh rangkaian kata tersebut dibagi menjadi 4 kelompok tergantung pada sifat gramatikalnya: kelompok pertama termasuk kata benda, kata sifat, kata sifat dalam fungsi kata benda, kata ganti dan angka infleksi; di grup ke-2 - kata kerja; di kelompok ke-3 - participle verbal, participle dalam fungsi kata sifat dan kata benda dan gerund; dalam kelompok ke-4 - bentuk kata keterangan, preposisi, konjungsi, dan partikel yang tidak berubah-ubah. Hasil ringkasan (juga tabel dengan data untuk masing-masing penulis diberikan) memberikan rasio berikut:

kelompok 1

grup ke-2

kelompok ke-3

kelompok ke-4

bahasa sehari-hari

pendiam

Herdan mencirikan pertimbangan data kuantitatif yang diperoleh dengan kata-kata berikut: “Mereka membenarkan kesimpulan bahwa elemen tata bahasa harus dipertimbangkan sebagai faktor yang menentukan kemungkinan ekspresi linguistik. Kesimpulan seperti itu menghindari kualifikasi yang memberatkan dari setiap kata yang digunakan. Jelas bahwa, karena tata bahasa dan kosa kata tidak disimpan dalam cangkang kedap air, tidak juga "pilihan" murni atau "kebetulan" murni. Baik tata bahasa maupun kosa kata mengandung kedua unsur tersebut, meskipun dalam proporsi yang sangat bervariasi” 9 2 .<131>

Sebagian besar buku Herdan dikhususkan untuk studi dualitas atau dualitas dalam bahasa, dan konsep dualitas didasarkan pada karakteristik matematika.

Dengan demikian, teorema dalam geometri proyektif dapat disusun dalam dua deret, sehingga setiap teorema dari satu deret dapat diperoleh dari beberapa teorema deret lainnya dengan mengganti kata dot dan lurus. Misalnya, jika pernyataan diberikan: "setiap titik yang berbeda milik satu dan hanya satu garis," maka kita dapat menurunkan pernyataan yang sesuai: "dua garis yang berbeda milik satu dan hanya satu titik." Metode lain untuk menentukan dualitas adalah dengan memplot bidang yang berbeda dari fenomena yang diteliti di sepanjang absis dan ordinat. Jadi, seperti yang dilakukan Yul 9 3, misalnya, frekuensi penggunaan yang berbeda dihitung di sepanjang absis, dan jumlah unit leksikal yang frekuensinya ditentukan, dll., dihitung di sepanjang ordinat.penelitian linguistik.

Di bawah konsep dualitas yang didefinisikan dengan cara ini, yang dalam semua kasus sebenarnya memiliki karakter kode biner dan yang juga dianggap sebagai fitur paling esensial dari struktur linguistik, fenomena kualitas yang sangat berbeda dibawa, memungkinkan oposisi di sepanjang dua bidang. : pembagian penggunaan kata menurut sifat satuan leksikal dan pembagian satuan leksikal menurut frekuensi penggunaan kata; bentuk pidato tertulis dan lisan; elemen leksikal dan gramatikal; Sinonim dan antonim; fonem dan representasi grafisnya; didefinisikan dan didefinisikan (Saussure's signifiant dan signifiy), dll.

Setelah studi kuantitatif tentang dualitas satu atau lain fenomena linguistik tertentu atau "teks" terbatas, sebagai suatu peraturan, sebuah kesimpulan ditarik, yang dikaitkan dengan kualitas universalitas linguistik. Sifat kesimpulan tersebut dan cara mereka dibenarkan dapat dilihat pada contoh<132>studi tentang dualitas kata dan konsep (sebenarnya, kita berbicara tentang rasio panjang kata dan volume konsep - harus diingat bahwa penggunaan linguistik dan istilah lain yang sangat bebas dalam pekerjaan seperti itu sering membuat pemahaman menjadi sangat sulit). Penting untuk dicatat di sini bahwa nomenklatur penyakit internasional (sekitar 1000 nama) dan daftar umum penyakit di Inggris dan Wells untuk tahun 1949 digunakan sebagai sumber pengamatan jenis dualitas linguistik ini. kesimpulan dibuat: “ Setiap konsep yang menunjukkan ide umum memiliki apa yang dapat disebut "bola" atau "volume." Hal ini memungkinkan melalui media untuk berpikir tentang banyak objek atau konsep lain yang berada dalam "lingkupnya". Di sisi lain, semua item yang diperlukan untuk mendefinisikan sebuah konsep merupakan apa yang disebut "isi" -nya. Volume dan konten saling berkorelasi - semakin kecil konten dan, karenanya, semakin abstrak konsepnya, semakin besar ruang lingkup atau volumenya, yaitu, semakin banyak objek yang dibawa di bawahnya. Ini dapat dilihat sebagai analogi (dalam lingkup konseptual) dengan prinsip-prinsip pengkodean, yang menurutnya panjang simbol dan frekuensi penggunaan saling bergantung” 9 4 .

Prinsip dualitas juga berlaku untuk masalah tertentu. Misalnya, ketika menetapkan kesetaraan makna kata dalam dua bahasa yang berbeda. Sebagai hasil dari mempelajari kamus bahasa Inggris-Jerman Muret-Zanders menggunakan metode matematika iterasi, disimpulkan bahwa probabilitas menggunakan kata bahasa Inggris dengan satu atau lebih arti dalam terjemahan bahasa Jerman tetap konstan untuk setiap huruf awal di seluruh kamus. 9 5 . Pertimbangan urutan kata dalam kamus Cina mengarah pada kesimpulan bahwa itu bersifat taksonomi, karena jumlah guratan dalam karakter menunjukkan tempatnya (sebagai radikal independen atau subkelas tertentu yang lebih rendah dari radikal). Taksonomi adalah prinsip klasifikasi bawahan yang digunakan dalam zoologi dan botani. Kherdan mengklaim bahwa<133>dasar-dasar leksikografi Cina juga dibangun di atas prinsip-prinsip taksonomi 9 6, dll.

Membuat penilaian umum bidang penerapan metode matematika ini untuk mempelajari masalah linguistik (yaitu, statistik linguistik), tampaknya perlu untuk melanjutkan dari posisi yang dirumuskan oleh Ettinger: “Matematika dapat digunakan secara efektif dalam pelayanan linguistik hanya ketika ahli bahasa jelas batas nyata penerapannya, serta kemungkinan model matematika yang digunakan” 9 7 . Dengan kata lain, kita dapat berbicara tentang linguistik matematis ketika metode matematika membuktikan kesesuaiannya untuk memecahkan masalah linguistik yang tepat, yang secara keseluruhan merupakan ilmu bahasa. Jika tidak demikian, meskipun ini dapat membuka aspek baru dari penelitian ilmiah, maka dalam hal ini kita dapat berbicara tentang apa saja, tetapi bukan tentang linguistik - dalam hal ini, yang kita maksudkan bukanlah jenis linguistik terapan yang berbeda (kita akan berbicara tentang nanti) pidato di bawah), tetapi ilmiah, atau teoretis, linguistik. Berdasarkan posisi ini, perlu dicatat bahwa dari sudut pandang ahli bahasa, banyak statistik linguistik yang meragukan dan bahkan membingungkan.

Mari kita beralih ke analisis hanya dua contoh (agar tidak mengacaukan presentasi), menetapkan bahwa keberatan yang sangat signifikan dapat dibuat untuk masing-masing dari mereka. Di sini kita memiliki perbedaan kuantitatif antara unit gramatikal dan leksikal. Ternyata untuk membuat perbedaan seperti itu, perlu diketahui terlebih dahulu apa yang termasuk dalam bidang tata bahasa, dan apa yang termasuk dalam kosa kata, karena "beban gramatikal" bahasa (yaitu, totalitas elemen tata bahasa digunakan dalam pidato), seperti yang ditunjukkan dalam kutipan di atas, "tergantung pada garis demarkasi yang memisahkan kosa kata dari tata bahasa." Tanpa mengetahui di mana letak garis ini, karena itu tidak mungkin untuk menarik perbedaan yang ditunjukkan. Lalu apa arti metode kuantitatif dalam membedakan leksikal dari tata bahasa?<134>matic? Namun, bagi Herdan, dia tidak terlalu memikirkan masalah ini dan dengan berani mengklasifikasikan elemen linguistik, merujuk pada elemen tata bahasa "bentuk terkait", yang, dilihat dari penyajiannya, harus dipahami sebagai infleksi eksternal, dan "kata-kata gramatikal", yang termasuk preposisi , konjungsi, kata kerja bantu dan kata ganti - yang terakhir berdasarkan fakta bahwa mereka adalah "pengganti". Tetapi jika kita hanya berbicara tentang kualitas kata ganti ini dan atas dasar ini menghubungkannya dengan elemen tata bahasa, maka, tentu saja, kata-kata seperti "disebutkan sebelumnya", "dinamai", "diberikan", dll., Juga harus dikaitkan dengan mereka, jadi bagaimana mereka juga bertindak sebagai deputi. Sehubungan dengan metode pemisahan unsur-unsur gramatikal yang digunakan dalam statistik linguistik, secara alami muncul pertanyaan tentang bagaimana menangani dalam kasus ini dengan fenomena tata bahasa "non-formal" seperti urutan kata, nada, nol morfem, hubungan paradigmatik (beberapa dari fenomena ini , omong-omong, temukan refleksi dalam bahasa-bahasa yang dipelajari dengan metode matematika)? Cara menggambar perbedaan dalam bahasa dengan infleksi internal yang kaya (seperti, misalnya, dalam bahasa Semit), di mana tidak hanya secara gramatikal mengubah akar (radikal), tetapi juga memberinya keberadaan leksikal, karena akar tanpa permutasi memiliki tidak ada keberadaan nyata dalam bahasa? Apa yang harus dipahami oleh kompleksitas gramatikal suatu bahasa, dengan kriteria apa itu ditentukan? Jika poin kuantitatif, yang dalam hal ini ditekankan dengan segala cara yang mungkin, maka salah satu bahasa yang paling sulit secara tata bahasa adalah bahasa Inggris, yang memiliki konstruksi seperti Ishallhavebeencalling atau Hewouldhavebeencalling. Dalam kalimat-kalimat ini, hanya panggilan yang dapat diklasifikasikan sebagai leksikal, dan yang lainnya, oleh karena itu, harus dianggap gramatikal. Alasan apa yang ada untuk menghubungkan frekuensi penggunaan unsur-unsur gramatikal dengan keumuman atau keabstrakan makna kata-kata gramatikal? Lagi pula, cukup jelas bahwa frekuensi penggunaan unsur-unsur gramatikal yang relatif besar ditentukan oleh fungsinya dalam konstruksi kalimat, dan untuk keabstrakan makna, sangat mudah untuk menemukan<135>jumlah elemen leksikal yang dapat dengan mudah bersaing dengan elemen gramatikal dalam hal ini, sebagian besar lebih rendah daripada mereka dalam frekuensi (misalnya, keberadaan, keberadaan, perluasan, ruang, substansi dll).

Jenis absurditas serupa muncul di hadapan kita dalam hal definisi dualitas (dualitas) kata dan konsep. Penting untuk memiliki pemahaman yang sangat khusus tentang esensi struktural bahasa agar dapat digunakan untuk penelitian dengan menggunakan tata nama penyakit dan daftar penyakit di rumah sakit, yang, sebagaimana ditunjukkan di atas, berfungsi sebagai bahan sumber untuk linguistik yang sangat penting. kesimpulan. Tanpa memikirkan penggunaan istilah-istilah yang sama sekali tidak jelas yang tidak memiliki keberadaan linguistik, seperti lingkup, volume, dan isi suatu konsep (omong-omong, makna leksikal kata dan konsep yang dilambangkan dengan istilah ilmiah sangat bingung), mari kita beralih ke kesimpulan yang dibuat dalam kasus ini. Sebagaimana dinyatakan di atas, kita berurusan dengan pernyataan bahwa "ruang lingkup dan konten saling berkorelasi." Seluruh rangkaian penalaran yang memberikan alasan untuk kesimpulan seperti itu, serta metode operasi matematika dari fakta-fakta linguistik, dengan jelas menunjukkan bahwa dalam kasus ini satu kualitas bahasa yang sangat penting diabaikan sepenuhnya, yang mengganggu semua perhitungan yang dilakukan. : kemampuan untuk mengekspresikan " konten" yang sama oleh unit linguistik dari "volume" yang berbeda, yang tidak diragukan lagi memiliki frekuensi penggunaan relatif yang berbeda. Jadi, kita dapat menunjuk orang yang sama dengan Petrov, kenalan saya, dia, seorang Moskow, seorang pemuda, seorang karyawan universitas, saudara laki-laki istri saya, seorang pria yang kami temui di jembatan, dll. Berdasarkan fakta-fakta seperti itu, ada tidak diragukan hanya kesimpulan pribadi, yang, bagaimanapun, seperti yang ditunjukkan, signifikansi universal dilampirkan, tetapi juga kelayakan menerapkan metode kuantitatif itu sendiri untuk masalah linguistik seperti itu.

Tetapi terkadang ahli bahasa ditawari kesimpulan, yang validitasnya tidak diragukan. Ini adalah "hukum dasar bahasa", yang terdiri dari fakta bahwa dalam bahasa ada stabilitas tertentu dari elemen-elemennya dan frekuensi relatif penyebutannya.<136>konsumsi. Masalah dengan penemuan semacam ini, bagaimanapun, adalah bahwa mereka telah lama dikenal oleh ahli bahasa. Lagi pula, sangat jelas bahwa jika bahasa tidak memiliki stabilitas tertentu dan setiap anggota komunitas linguistik tertentu secara bebas memvariasikan unsur-unsur bahasa, maka komunikasi timbal balik tidak akan mungkin dan keberadaan bahasa itu sendiri akan menjadi tidak berarti. . Adapun distribusi frekuensi relatif penggunaan unsur-unsur individu bahasa, telah ditemukan ekspresinya dalam linguistik dalam bentuk alokasi kategori kosa kata dan tata bahasa pasif dan aktif, yang sangat diperhatikan L. V. Shcherba. Dalam hal ini, metode statistik hanya dapat membantu ahli bahasa dalam distribusi unsur-unsur linguistik tertentu menurut kategori frekuensi relatif penggunaannya, tetapi mereka tidak memiliki alasan untuk mengklaim menemukan pola baru yang bernilai bagi linguistik teoretis.

Di sisi lain, statistik linguistik menawarkan sejumlah kesimpulan yang benar-benar "asli" yang sangat menunjukkan sifat pemikiran ilmiah para penganutnya. Dengan demikian, "kosa kata politik" dalam karya-karya Churchill, Benes, Halifax, Stresemann, dan lainnya dipelajari dengan metode statistik yang kompleks, dan terjemahan karya-karya mereka ke dalam bahasa Inggris digunakan dalam perhitungan untuk penulis yang tidak berbahasa Inggris. Hasil perhitungan disajikan dalam bentuk berbagai tabel, rumus matematika dan persamaan. Interpretasi linguistik dari data kuantitatif dalam kasus ini bermuara pada fakta bahwa penggunaan "kosa kata politik" oleh Churchill adalah yang paling khas (?) untuk kelompok penulis ini dan bahwa penggunaan kata-kata Churchill dalam kasus-kasus di mana ia berurusan dengan masalah politik adalah tipikal kelompok pidato bahasa Inggris 9 8 .

Dalam kasus lain, setelah manipulasi statistik yang tepat, disimpulkan bahwa Hitler melanggar dualitas antara "bahasa" dan "ucapan" dalam arti kuantitatif istilah-istilah ini dalam penggunaan Nazi Jerman. Kasus khusus penghancuran dualitas ini adalah pemahaman literal<137>belokan metaforis (misalnya, "tuangkan garam ke luka terbuka"). Nazi Jerman mencap dirinya dengan begitu banyak tindakan tidak manusiawi sehingga hampir tidak ada kebutuhan untuk menghukumnya atas kekejaman linguistik ini 9 9 . Menurut Kherdan, definisi Marx tentang bahasa sebagai realitas langsung pemikiran juga mengarah pada pelanggaran dualitas linguistik, dan hukum dialektika tentang transisi suatu fenomena ke kebalikannya, menurut pendapatnya, adalah hukum linguistik dualitas yang disalahpahami. bahasa. Penafsiran seperti itu berbicara sendiri.

Akhirnya, kelemahan umum yang melekat dalam semua kasus di atas dari metode kuantitatif mempelajari materi linguistik dan dengan demikian memperoleh karakter metodologis adalah pendekatan elemen linguistik sebagai seperangkat fakta mekanis yang benar-benar independen satu sama lain, yang sesuai dengannya, jika ada. atau pola, mereka hanya mengacu pada hubungan numerik dari distribusi fakta otonom, di luar ketergantungan sistemik mereka. Benar, J. Watmou mencoba dengan segala cara yang mungkin untuk memastikan bahwa matematikalah yang lebih baik daripada jenis analisis struktural linguistik apa pun, yang mampu mengungkapkan fitur struktural suatu bahasa. “Matematika modern,” tulisnya, “tidak berurusan dengan pengukuran dan kalkulus, yang akurasinya dibatasi oleh sifatnya, tetapi terutama dengan struktur. Inilah sebabnya mengapa matematika sangat kondusif untuk akurasi pembelajaran bahasa - sejauh deskripsi terpisah, bahkan lebih terbatas di alam, tidak mampu ... Sama seperti dalam fisika, elemen matematika digunakan untuk menggambarkan dunia fisik, karena mereka dianggap bersesuaian dengan unsur-unsur dunia fisik, maka dalam linguistik matematika unsur-unsur matematika dianggap sesuai dengan unsur-unsur dunia bicara” 101 . Tetapi rumusan pertanyaan seperti itu sama sekali tidak menyelamatkan situasi, karena yang terbaik bisa<138>memberikan analisis bahasa baik sebagai struktur fisik, yang masih jauh dari memadai untuk suatu bahasa, dan pada analisis terakhir masih bersifat mekanistik yang sama, atau sebagai struktur logis-matematis, dan ini mentransfer bahasa ke bahasa yang berbeda. pesawat, dan dalam banyak hal asing baginya. Tidak berlebihan untuk dicatat bahwa Watmow meramalkan keberhasilan linguistik matematika hanya di masa depan, dan untuk hasil nyata mereka, ia mengevaluasi mereka dengan kata-kata berikut: "... hampir semua pekerjaan yang dilakukan hingga saat ini oleh Herdan, Zipf, Yul, Giro (Guiraux) dan lain-lain, sama sekali tidak berada di luar lingkup kritik baik dari linguistik maupun matematika; dia sangat amatir” 103 . Jadi, jika kita tidak mencoba untuk memprediksi masa depan metode matematika dalam penelitian linguistik, tetapi mencoba untuk menghargai apa yang kita miliki saat ini, maka, tentu saja, kita harus mengakui bahwa, pada kenyataannya, matematika sejauh ini terbatas dalam bidang linguistik hanya untuk "pengukuran dan perhitungan", dan saya tidak bisa memberikan analisis kualitatif bahasa, menyelidiki strukturnya.<139>

Mari kita berusaha seobjektif mungkin. Pada bagian tertentu, data kuantitatif tampaknya dapat digunakan oleh linguistik, tetapi hanya sebagai pelengkap dan terutama dalam masalah yang berorientasi praktis. Sehubungan dengan sebagian besar metode kuantitatif untuk mempelajari fenomena linguistik individu, kesimpulan umum R. Brown tidak diragukan lagi dapat dibenarkan: "Mereka dapat dianggap seperti yang dianggap Kherdan, tetapi apa arti dari semua ini?" 104 . Mari kita bayangkan bahwa kita mengajukan pertanyaan: "Apa pohon-pohon di taman ini?". Dan sebagai tanggapan kita mendapatkan: "Ada seratus pohon di taman ini." Apakah ini jawaban untuk pertanyaan kami, dan apakah itu benar-benar masuk akal? Tetapi sehubungan dengan banyak pertanyaan linguistik, metode matematika memberikan jawaban seperti itu.

Namun, ada bidang kegiatan penelitian yang luas, terutama menggunakan metode matematika dan pada saat yang sama mengarahkannya ke materi linguistik, di mana kelayakan kombinasi semacam itu tidak diragukan lagi. “Makna” dari kegiatan penelitian ini, signifikansinya ditentukan oleh tujuan yang dicita-citakan. Itu sudah diuji dalam praktik. Dalam hal ini, kita berbicara tentang masalah yang terkait dengan pembuatan mesin informasi, struktur untuk mesin terjemahan teks ilmiah tertulis, otomatisasi terjemahan ucapan lisan dari satu bahasa ke bahasa lain, dan dengan seluruh rentang tugas yang digabungkan. dalam masalah linguistik sibernetika. Seluruh rangkaian masalah seperti itu biasanya diberi nama umum linguistik terapan. Dengan demikian, ia dibedakan dari apa yang disebut linguistik matematika, yang mencakup bidang-bidang pekerjaan yang telah ditetapkan di atas sebagai stilostatistika dan statistik linguistik, meskipun tidak berarti menghindari pemrosesan statistik bahan linguistik. Mungkin fitur paling penting dari linguistik terapan, yang memisahkannya dari linguistik matematika, seperti diuraikan di atas, adalah bahwa yang pertama memiliki arah yang berlawanan: bukan matematika untuk linguistik, tetapi linguistik.<140>(diformalkan dengan metode matematika) untuk berbagai masalah praktis.

Tidak perlu mengungkapkan isi masalah individu yang sekarang termasuk dalam wilayah linguistik terapan yang sangat luas. Berbeda dengan linguistik matematika, masalah ini dibahas secara aktif dalam literatur linguistik Soviet dan mulai menempati tempat yang semakin menonjol dalam masalah ilmiah lembaga penelitian 105 . Dengan demikian, mereka sudah dikenal baik oleh komunitas linguistik kita. Namun, keadaan ini tidak membebaskan kita dari kebutuhan untuk menjadikan mereka refleksi, khususnya, dari sudut pandang prinsip-prinsip ilmu bahasa. Ini tidak diragukan lagi akan membantu menghilangkan kesalahpahaman yang semakin sering muncul antara perwakilan ilmu yang sangat jauh satu sama lain dan mengambil bagian dalam pekerjaan tentang masalah linguistik terapan, dan akan menguraikan cara untuk konvergensi mereka, di satu sisi , dan delimitasi bidang penelitian, di sisi lain. Tak perlu dikatakan bahwa pertimbangan berikut akan mewakili sudut pandang ahli bahasa, dan matematikawan perlu tidak hanya mencoba mengasimilasinya, tetapi, sehubungan dengan pertanyaan yang diajukan, memberi mereka interpretasi mereka.

Ahli teori linguistik sama sekali tidak bisa puas dengan fakta bahwa dalam semua kasus<141>bahasa untuk tujuan yang ditetapkan oleh linguistik terapan, dasar mereka adalah model matematika. Sesuai dengan ini, pengamatan terhadap fenomena bahasa dan hasil yang diperoleh dengan cara ini dinyatakan dalam istilah dan konsep matematika, yaitu melalui persamaan dan rumus matematika. Mari kita lihat contoh untuk kejelasan. Condon 1 06 dan Zipf 1 07 menetapkan bahwa logaritma frekuensi ( f) kemunculan kata-kata dalam teks besar terletak hampir dalam satu garis lurus, jika dikorelasikan dalam diagram dengan logaritma pangkat atau pangkat ( r) dari kata-kata ini. persamaan f=c:r, di mana dengan adalah konstanta mencerminkan hubungan ini dalam arti terbatas bahwa c:r untuk nilai yang ditetapkan r mereproduksi frekuensi yang diamati dengan pendekatan yang bagus. Hubungan antara f dan r, dinyatakan dengan rumus matematika, adalah model untuk hubungan antara nilai yang diamati dari frekuensi penggunaan dan peringkat, atau peringkat, kata-kata. Ini adalah salah satu kasus pemodelan matematika.

Seluruh teori informasi sepenuhnya didasarkan pada model matematis dari proses komunikasi yang dikembangkan oleh C. Shannon 108 . Ini didefinisikan sebagai "disiplin matematika yang ditujukan untuk metode penghitungan dan perkiraan jumlah informasi yang terkandung dalam data apa pun, dan studi tentang proses penyimpanan dan pengiriman informasi" (TSB, vol. 51, hlm. 128). Dengan demikian, konsep dasar teori informasi menerima ekspresi matematis.Informasi diukur dalam bit atau unit biner (kode, yang bahasanya disamakan, dengan dua sinyal kemungkinan yang sama bersyarat mentransmisikan satu unit biner informasi selama transmisi setiap karakter ). -kode dan jumlah rata-rata informasi yang dikirimkan<142>formasi. Redundansi dinyatakan sebagai persentase dari total kemampuan transmisi kode”, 1 09 dst. Dengan cara yang sama, terjemahan mesin memerlukan pengembangan algoritmik elemen pemetaan dari satu bahasa ke bahasa lain, dll. 1 10 . Ini adalah kasus pemodelan lainnya.

Penggunaan model tanpa makna bisa sangat membantu, khususnya, kemungkinan besar, dalam memecahkan masalah yang ditetapkan oleh linguistik terapan itu sendiri. Namun, untuk linguistik teoretis, sangat penting bahwa model abstrak, sebagai suatu peraturan, tidak mereproduksi semua fitur dari fenomena nyata, semua kualitas fungsionalnya. Jadi, seorang arsitek, sebelum membangun rumah, dapat membuat modelnya, yang mereproduksi rumah yang sedang dirancang dalam semua detail terkecil, dan ini membantunya memecahkan sejumlah masalah praktis yang berkaitan dengan pembangunan rumah itu sendiri. Tetapi model rumah seperti itu, tidak peduli seberapa akuratnya itu, tidak memiliki "fungsi" itu dan tujuan dari semua rumah yang dibangun secara umum - tidak mampu menyediakan perumahan bagi seseorang. Situasinya mirip dengan bahasa, di mana model tidak selalu dapat mereproduksi semua kualitasnya. Dalam hal ini, masalahnya semakin rumit oleh fakta bahwa bukan linguistik, tetapi kriteria matematis yang digunakan untuk membangun model. "Model matematika ... - tulis A. Ettinger, - memainkan peran yang sangat penting dalam semua bidang teknologi, tetapi karena mereka adalah alat untuk sintesis, signifikansi mereka untuk linguistik, yang terutama merupakan disiplin sejarah dan deskriptif, secara alami terbatas ” 1 11 .<143>

Pemodelan matematis suatu bahasa sebenarnya hanya dapat diterapkan pada keadaan statisnya, yang bersyarat bagi seorang ahli bahasa dan pada kenyataannya bertentangan langsung dengan kualitas dasar suatu bahasa, yang wujud keberadaannya adalah perkembangan. Tak perlu dikatakan bahwa studi statis suatu bahasa sama sekali tidak dikecualikan dari linguistik dan merupakan dasar untuk menyusun tata bahasa dan kamus normatif, tata bahasa deskriptif, tata bahasa praktis dan kamus yang berfungsi sebagai panduan untuk studi praktis bahasa asing, dll. Namun, dalam semua karya semacam itu, yang sebagian besar diterapkan di alam, para ahli bahasa secara sadar membatasi bidang penelitian dan sama sekali tidak menutup mata terhadap aspek-aspek lain dari bahasa tersebut 1 12 . Dengan pemeriksaan statis bahasa, khususnya, kualitas bahasa yang terkait dengan sifatnya yang dinamis, seperti produktivitas, ketergantungan pada bentuk pemikiran, dan interaksi ekstensif dengan faktor budaya, sosial, politik, sejarah, dan lainnya, hilang sama sekali dari bidang pandang peneliti. Hanya pada bidang sinkronis bahasa dapat dianggap sebagai sistem tanda atau kode konvensional, yang, bagaimanapun, ternyata sama sekali tidak dapat dibenarkan segera setelah kita mengadopsi sudut pandang dinamis yang lebih cocok untuk bahasa. Dalam proses perkembangan itulah kualitas-kualitas bahasa seperti motivasi, polisemi kata yang tidak memiliki batas-batas yang stabil, non-otonomi makna kata dan cangkang suaranya, dan potensi kreatif sebuah kata yang terkait dengan konteksnya. dimanifestasikan, dan semua ini sangat bertentangan dengan karakteristik utama kode atau tanda 1 13 . Jelas, dalam linguistik terapan, seseorang juga dapat memikirkan semua kualitas bahasa ini dan, untuk tujuan praktis, puas dengan, sehingga dapat dikatakan, "snapshot" bahasa, yang masih mampu memberikan gambaran yang cukup perkiraan tentang mekanisme fungsinya.<144>nirovaniya. Namun, setiap "snapshot" semacam itu, jika dianggap sebagai fakta bahasa, dan bukan sebagai fakta sistem kode konvensional, harus dimasukkan dalam proses pergerakan tanpa akhir di mana bahasa selalu ada 1 14 . Ia tidak dapat dipelajari di luar kondisi-kondisi khusus yang mencirikan gerakan ini, yang meninggalkan jejaknya pada keadaan bahasa tertentu dan menentukan potensi perkembangannya lebih lanjut. Di sini ada perbedaan yang sama seperti antara foto sesaat seseorang dan potretnya yang dilukis dengan kuas seorang seniman sejati. Dalam karya seniman, kita memiliki gambaran umum seseorang dalam semua orisinalitas tidak hanya penampilan fisiknya, tetapi juga konten spiritual batinnya. Dari potret artistik, kita juga dapat membaca masa lalu orang yang tergambar di dalamnya dan menentukan apa yang mampu dia lakukan dalam tindakannya. Dan sebuah snapshot, meskipun mampu memberikan gambaran yang lebih akurat tentang penampilan aslinya, tidak memiliki kualitas ini dan sering kali menangkap jerawat yang muncul secara tidak sengaja di hidung dan<145>pose atau ekspresi yang sama sekali tidak seperti biasanya, yang pada akhirnya mengarah pada distorsi dari aslinya.

Perlu dicatat bahwa metode "snapshots" tentu saja dapat diterapkan pada fakta perkembangan bahasa. Tetapi dalam kasus ini, kita sebenarnya hanya akan berurusan dengan keadaan bahasa yang terpisah, yang, dalam karakterisasi kuantitatifnya, ternyata terhubung tidak lebih dari karakterisasi kuantitatif komparatif dari bahasa yang berbeda. "Dinamika" kuantitatif semacam ini tidak akan mengandung sesuatu yang organik, dan hubungan antara keadaan-keadaan individual bahasa hanya akan bertumpu pada perbandingan hubungan-hubungan numerik. Jika dalam kasus ini juga menggunakan analogi, maka kita dapat merujuk pada pertumbuhan anak. Perkembangannya, tentu saja, dapat direpresentasikan dalam bentuk dinamika data numerik tentang berat, tinggi, rasio perubahan volume bagian-bagian tubuhnya, tetapi semua data ini benar-benar terlepas dari segala sesuatu yang terutama merupakan esensi individu. seseorang - karakternya, kecenderungannya, kebiasaannya. , rasa, dll.

Sisi negatif lain dari "pemodelan" matematis bahasa adalah kenyataan bahwa itu tidak dapat berfungsi sebagai prinsip umum, yang atas dasar itu dimungkinkan untuk melakukan deskripsi bahasa yang komprehensif dan komprehensif - sistematis. Hanya pendekatan matematis terhadap fenomena bahasa, misalnya, yang tidak akan memungkinkan untuk menjawab bahkan pertanyaan mendasar seperti itu (yang tanpanya keberadaan ilmu bahasa tidak dapat dipikirkan), seperti: apa itu bahasa, fenomena apa yang seharusnya terjadi. dikaitkan dengan yang linguistik yang tepat, bagaimana kata atau kalimat didefinisikan, apa konsep dasar dan kategori bahasa, dll Sebelum beralih ke metode matematika belajar bahasa, perlu sudah memiliki jawaban (bahkan dalam bentuk hipotesis kerja) untuk semua pertanyaan ini sebelumnya. Tidak perlu menutup mata terhadap fakta bahwa dalam semua kasus yang kita ketahui tentang studi fenomena linguistik dengan metode matematika, semua konsep dan kategori ini mau tidak mau harus diterima sebagaimana didefinisikan oleh tradisional atau, secara relatif, metode kualitatif.

Fitur metode matematika dalam aplikasi linguistik mereka dicatat oleh Spang-Hanssen ketika pi<146>sal: “Harus diingat bahwa fakta-fakta yang diamati yang menerima ekspresi kuantitatif ... tidak memiliki nilai jika mereka tidak membentuk bagian dari deskripsi, dan untuk tujuan linguistik itu harus deskripsi sistematis, terkait erat dengan linguistik kualitatif deskripsi dan teori” 1 15 . Dalam pidato lain oleh Spang-Hanssen, kami menemukan klarifikasi dari gagasan ini: “Sampai kemungkinan membangun sistem kuantitatif terbukti, dan selama ada sistem kualitatif yang diterima secara umum untuk bidang studi tertentu, perhitungan frekuensi dan lainnya. karakteristik numerik dari sudut pandang linguistik penglihatan tidak masuk akal" 1 16 . Ide-ide serupa diungkapkan oleh Uldall, agak secara tak terduga menghubungkannya dengan pengembangan landasan teoretis umum glossematics: “Ketika seorang ahli bahasa menghitung atau mengukur segala sesuatu yang dia hitung dan ukur, dengan sendirinya tidak ditentukan secara kuantitatif; misalnya, kata-kata, ketika dihitung, didefinisikan, jika didefinisikan sama sekali, dalam istilah yang sangat berbeda.<147>

Jadi, ternyata baik secara teoritis maupun dalam aplikasi praktisnya, metode matematika secara langsung bergantung pada konsep dan kategori linguistik yang ditentukan oleh metode tradisional, filologis, atau, sebagaimana disebutkan di atas, metode kualitatif. Dalam hal linguistik terapan, penting untuk menyadari ketergantungan ini, dan, sebagai akibatnya, berkenalan dengan totalitas kategori utama linguistik tradisional.

Benar, tidak ada alasan untuk mencela perwakilan dari ilmu eksakta yang bekerja di bidang linguistik terapan karena tidak menggunakan data linguistik modern. Ini tidak sesuai dengan keadaan sebenarnya. Mereka tidak hanya mengetahui dengan baik, tetapi juga secara luas menggunakan dalam pekerjaan mereka sistem fitur diferensial yang ditetapkan oleh ahli bahasa yang menjadi ciri khas bahasa yang berbeda, distribusi dan pengaturan elemen linguistik dalam sistem bahasa tertentu, pencapaian fonetik akustik, dll. Tetapi dalam hal ini, diperlukan reservasi yang sangat signifikan. . Faktanya, perwakilan ilmu eksakta menggunakan data hanya satu arah dalam linguistik - yang disebut linguistik deskriptif, yang dengan sengaja membedakan dirinya dari masalah tradisional linguistik teoretis, jauh dari mencakup seluruh bidang penelitian linguistik, dari pendekatan yang tepat. sudut pandang linguistik, ia memiliki kekurangan metodologis yang signifikan, yang membawanya ke krisis yang baru-baru ini terungkap 1 18 , dan, terlebih lagi, memiliki orientasi praktis murni, sesuai dengan kepentingan linguistik terapan. Semua keberatan dan celaan yang dibuat di atas terhadap pertimbangan statis bahasa berlaku untuk linguistik deskriptif. Pendekatan linguistik deskriptif sepihak seperti itu dapat,<148>Namun, itu hanya dapat dibenarkan oleh tugas-tugas yang ditetapkan oleh linguistik terapan itu sendiri, tetapi jauh dari menghabiskan seluruh isi ilmu bahasa.

Dalam proses pengembangan pertanyaan linguistik terapan, masalah teoretis baru mungkin muncul, dan pada kenyataannya telah muncul. Beberapa masalah tersebut berkaitan erat dengan tugas khusus linguistik terapan dan ditujukan untuk mengatasi kesulitan-kesulitan yang muncul dalam menyelesaikan masalah-masalah tersebut. Masalah lain terkait langsung dengan linguistik teoretis, memungkinkan perspektif baru tentang ide-ide tradisional atau membuka area baru penelitian linguistik, konsep dan teori baru. Di antara yang terakhir ini, misalnya, adalah masalah menciptakan bahasa "mesin" (atau bahasa perantara), yang paling erat kaitannya dengan serangkaian masalah utama linguistik teoretis seperti hubungan konsep dan makna leksikal, logika dan tata bahasa, diakroni dan sinkroni, sifat tanda bahasa, esensi makna linguistik, prinsip membangun bahasa buatan, dll. 1 19 . Dalam hal ini, sangat penting untuk membangun saling pengertian dan persemakmuran dalam karya bersama perwakilan disiplin linguistik dan ilmu eksakta. Adapun sisi linguistik, dalam hal ini, tampaknya, kita tidak boleh berbicara tentang membatasi upaya, misalnya, perancang mesin terjemahan terlebih dahulu” dan mencoba membangun kemampuan kerja mesin tersebut menggunakan puisi N. Gribachev atau V Prosa Kochetov 1 20 . Mesin itu sendiri akan menemukan batas kemampuannya, dan profitabilitas - batas penggunaannya. Tetapi ahli bahasa, sebagai kontribusi mereka untuk tujuan bersama, harus membawa pengetahuan mereka tentang fitur-fitur struktur bahasa, keserbagunaannya, hubungan interseksi internal dari elemen-elemennya, serta hubungan bahasa yang luas dan multilateral dengan fisik, fisiologis. , mental dan logis<149>fenomena mi, pola khusus fungsi dan perkembangan bahasa. Totalitas pengetahuan ini diperlukan untuk perancang mesin yang sesuai agar tidak tersesat ke arah yang salah, tetapi untuk membuat pencarian terarah dan berorientasi dengan jelas. Bahkan tinjauan yang sangat singkat tentang kasus penerapan metode matematika untuk masalah linguistik, yang dibuat dalam esai ini, meyakinkan bahwa pengetahuan seperti itu tidak akan berlebihan untuk perwakilan ilmu pasti.

Berdasarkan semua pertimbangan di atas, orang dapat dengan jelas sampai pada beberapa kesimpulan umum.

Jadi, linguistik matematika? Jika ini berarti penggunaan metode matematika sebagai kunci utama universal untuk memecahkan semua masalah linguistik, maka klaim tersebut harus diakui sebagai benar-benar tidak dapat dibenarkan. Segala sesuatu yang telah dilakukan dalam arah ini sejauh ini telah dilakukan sangat sedikit atau bahkan tidak sama sekali untuk memecahkan masalah-masalah tradisional ilmu bahasa. Paling buruk, penerapan metode matematika disertai dengan absurditas yang jelas atau, dari sudut pandang linguistik, sama sekali tidak berarti. Paling-paling, metode matematika dapat digunakan sebagai metode tambahan untuk penelitian linguistik, ditempatkan untuk melayani tugas-tugas linguistik yang spesifik dan terbatas. Tidak ada pertanyaan tentang "filsafat bahasa kuantitatif" dalam kasus ini. Fisika, psikologi, fisiologi, logika, sosiologi, dan etnologi pada masanya merambah kemandirian ilmu bahasa, tetapi tidak dapat menundukkan linguistik. Yang terjadi sebaliknya - linguistik mengambil keuntungan dari pencapaian ilmu-ilmu ini dan, sejauh yang diperlukan untuk dirinya sendiri, mulai menggunakan bantuan mereka, sehingga memperkaya gudang metode penelitiannya. Sekarang, rupanya, giliran matematika. Komunitas baru ini juga diharapkan dapat berkontribusi pada penguatan ilmu bahasa, peningkatan metode kerjanya, dan peningkatan keanekaragamannya. Oleh karena itu, sama sahnya untuk berbicara tentang linguistik matematika seperti halnya linguistik fisik, linguistik fisiologis, linguistik logis, linguistik psikologis, dan linguistik psikologis.<150>dll. Tidak ada linguistik seperti itu, hanya ada satu linguistik, yang secara menguntungkan menggunakan data ilmu-ilmu lain sebagai alat penelitian tambahan. Jadi, tidak ada alasan untuk mundur sebelum serangan ilmu baru dan dengan mudah menyerah padanya posisi yang telah dimenangkannya. Di sini sangat tepat untuk mengingat kata-kata A. Martinet: “Mungkin tergoda untuk menggabungkan satu atau beberapa gerakan pemikiran utama dengan menggunakan beberapa istilah yang dipilih dengan baik, atau untuk menyatakan dengan beberapa rumus matematika ketelitian penalaran seseorang. Namun, sudah tiba waktunya bagi para ahli bahasa untuk menyadari kemandirian ilmunya dan membebaskan diri dari rasa rendah diri yang membuat mereka mengasosiasikan setiap tindakannya dengan satu atau lain prinsip ilmiah umum, sehingga kontur realitas selalu menjadi kenyataan. hanya semakin samar, bukannya semakin jelas.

Oleh karena itu, matematika itu sendiri dan linguistik itu sendiri. Ini sama sekali tidak mengecualikan bantuan timbal balik mereka atau pertemuan persahabatan dalam kerja bersama untuk masalah-masalah bersama. Tempat penerapan upaya bersama dari dua ilmu semacam ini adalah seluruh rentang masalah yang luas yang merupakan bagian dari linguistik terapan dan memiliki kepentingan ekonomi nasional yang besar. Orang seharusnya hanya berharap bahwa dalam kerja sama mereka kedua ilmu menunjukkan saling pengertian yang maksimal, yang, tidak diragukan lagi, juga akan berkontribusi pada hasil maksimal dari kerja sama mereka.<151>

Interaksi matematika dan linguistik

pengantar

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Terbentuknya Linguistik Struktural pada Pergantian Abad 19 – 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinand de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

pengantar

Tujuan dari pekerjaan kursus saya adalah untuk secara singkat menyoroti hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat perangkat teoretis untuk menggambarkan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis seperti itu untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun, dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan aplikasi dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan baru yang mendasar terhadap bahasa tersebut. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar untuk mewakili pola linguistik dalam bentuk di mana mereka dapat diterapkan secara langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, mengacu pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan pada tahun-tahun terakhir percaya bahwa ekspresi itu sendiri tidak dapat dinaikkan ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan, akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka dari awal abad kedua puluh (saya akan menceritakan tentang pengaruhnya pada pengembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan miliknya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang beragam, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik

1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.

Kaitan awal dari konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri - langue, pidato - parole, dan aktivitas bicara - langage), di mana setiap kata (anggota sistem) dianggap tidak dalam dirinya sendiri. , tetapi sehubungan dengan anggota lain. Sebagai ahli bahasa terkemuka lainnya, Dane Louis Hjelmslev, kemudian mencatat, Saussure "adalah orang pertama yang menuntut pendekatan struktural untuk bahasa, yaitu deskripsi ilmiah bahasa dengan merekam hubungan antar unit."

Dengan demikian, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama, fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein adalah berkembang, eksperimen terjadi pada bentuk dan konten dalam sastra, musik, dan seni rupa), di sisi lain, dengan matematika (konsep konsistensi sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti: Fenomena mulai ditafsirkan tidak dalam kaitannya dengan penyebab terjadinya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi berhenti menjadi independen dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

Gagasan Saussure dikembangkan di Barat oleh ahli bahasa Swiss yang lebih muda sezaman: di Denmark - L. Hjelmslev, yang telah saya sebutkan, yang memunculkan teori bahasa aljabar dalam karyanya "Fundamentals of Linguistic Theory", di AS - E. Sapir, L. Bloomfield, C. Harris, di Republik Ceko - ilmuwan-emigran Rusia N. Trubetskoy.

Di negara kita, linguistik struktural mulai berkembang pada waktu yang hampir bersamaan dengan di Barat - pada pergantian abad ke-19-20. Bersamaan dengan F. de Saussure, konsep bahasa sebagai sistem dikembangkan dalam karya-karya mereka oleh profesor Universitas Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berhubungan untuk waktu yang lama dengan de Saussure, masing-masing, sekolah linguistik Jenewa dan Kazan berkolaborasi satu sama lain. Jika Saussure dapat disebut sebagai ideologis metode "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan dasar praktis untuk penerapannya. Dia adalah orang pertama yang memisahkan linguistik (sebagai ilmu pasti yang menggunakan metode statistik dan ketergantungan fungsional) dari filologi (komunitas disiplin kemanusiaan yang mempelajari budaya spiritual melalui bahasa dan ucapan). Ilmuwan itu sendiri percaya bahwa "linguistik dapat berguna dalam waktu dekat, hanya dibebaskan dari penyatuan wajib dengan filologi dan sejarah sastra" . Fonologi menjadi "tempat pengujian" untuk pengenalan metode matematika ke dalam linguistik - suara sebagai "atom" dari sistem bahasa, memiliki sejumlah sifat yang mudah diukur, adalah bahan yang paling nyaman untuk metode deskripsi formal dan ketat. Fonologi menyangkal keberadaan makna dalam suara, sehingga faktor "manusia" dihilangkan dalam penelitian. Dalam pengertian ini, fonem seperti objek fisik atau biologis.

Bunyi suatu bahasa adalah seperangkat fitur yang terorganisir secara sistematis. Pada 1920-an-1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih “ciri khas” fonem. Fitur-fitur ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara. Misalnya, dalam bahasa Inggris perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara) dan tingkat suara yang membedakan satu fonem dengan fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa". Bahkan yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa kondisi yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dengan demikian, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai seperangkat perbandingan dan oposisi bahasa. Bahasa adalah ekspresi makna kata dan sarana komunikasi, dan kedua fungsi ini tidak pernah bersamaan. Kita dapat melihat pergantian bentuk dan isi: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Ini berarti bahwa dalam suatu bahasa, ciri-ciri pembeda membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem, morfem menjadi kata, kata menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari sekedar jumlah bagian-bagiannya.

Saussure mengusulkan gagasan tentang ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut ilmu ini sebagai semiologi (dari bahasa Yunani "semeon" - sebuah tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada 1920-an-1930-an dan di Paris pada 1950-an-1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan sastra yang disusun (atau dirumuskan) dengan bantuan struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya dalam linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama-nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: metode ini merupakan upaya untuk mempelajari dalam suatu sistem masalah "probabilitas" dalam bahasa. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang Saussure cari anagramnya, menurut Jean Starobinsky, adalah "alat bagi penyair, bukan sumber kehidupan puisi." Puisi berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran terlihat: “karena puisi diungkapkan tidak hanya dalam kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat. Lampiran 1).

Jika memang demikian, itu hanya karena dia tidak bisa membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya ini berubah menjadi sebuah pertanyaan. Sebaliknya, ia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas berdasarkan sejarah dan dugaan subjektif, dan metode interpretasi acak berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang menghapus pertentangan antara bentuk dan konten (subjek dan objek) , makna dan asal-usul dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum, tulisan-tulisan Ferdinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi makna dalam bahasa dan budaya.

Sayangnya, setelah Stalin berkuasa pada tahun 1924, linguistik Rusia, seperti banyak ilmu lainnya, terlempar ke belakang. Banyak ilmuwan berbakat terpaksa beremigrasi, diusir dari negara itu atau meninggal di kamp. Baru pada pertengahan 1950-an pluralisme teori tertentu menjadi mungkin—lebih lanjut tentang itu di Bagian 1.2.

1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Pada pertengahan abad kedua puluh, empat sekolah linguistik dunia telah terbentuk, yang masing-masing ternyata menjadi nenek moyang dari metode "tepat" tertentu. Sekolah fonologi Leningrad (nenek moyangnya adalah siswa Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis ucapan penutur asli sebagai kriteria utama untuk menggeneralisasi suara dalam bentuk fonem.

Para ilmuwan dari Linguistik Linguistik Praha, khususnya, pendirinya N.S. Trubetskoy, yang beremigrasi dari Rusia, mengembangkan teori oposisi - struktur semantik bahasa digambarkan oleh mereka sebagai satu set unit semantik yang dibangun secara oposisi - Sem. Teori ini diterapkan dalam studi tidak hanya bahasa, tetapi juga seni budaya.

Ideolog descriptivisme Amerika adalah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa disajikan kepada deskriptivis sebagai seperangkat pernyataan pidato, yang merupakan objek utama studi mereka. Fokus mereka adalah pada aturan deskripsi ilmiah (maka nama) teks: studi tentang organisasi, pengaturan dan klasifikasi elemen mereka. Formalisasi prosedur analitis di bidang fonologi dan morfologi (pengembangan prinsip-prinsip untuk studi bahasa pada tingkat yang berbeda, analisis distributif, metode konstituen langsung, dll) menyebabkan perumusan pertanyaan umum pemodelan linguistik. Kurangnya perhatian terhadap rencana isi bahasa, serta sisi paradigmatik bahasa, tidak memungkinkan para deskriptivis memaknai bahasa sebagai suatu sistem secara utuh.

Karya ilmiah besar pertama Chomsky, tesis masternya Morfologi Bahasa Ibrani Modern (1951), tetap tidak diterbitkan. Chomsky menerima gelar doktor dari University of Pennsylvania pada tahun 1955, tetapi banyak penelitian yang mendasari disertasinya (diterbitkan secara penuh hanya pada tahun 1975 dengan judul The Logical Structure of Linguistic Theory) dan monografi pertamanya, Syntactic Structures (1957, Rus. trans . 1962), dilakukan di Universitas Harvard pada tahun 1951-1955. Pada tahun 1955 yang sama, ilmuwan pindah ke Massachusetts Institute of Technology, di mana ia menjadi profesor pada tahun 1962.

Teori Chomsky telah melalui beberapa tahap dalam perkembangannya.

Dalam monografi pertama "Struktur Sintaksis", ilmuwan menyajikan bahasa sebagai mekanisme untuk menghasilkan rangkaian kalimat yang tak terbatas menggunakan seperangkat sarana tata bahasa yang terbatas. Untuk menggambarkan sifat-sifat linguistik, ia mengusulkan konsep kedalaman (tersembunyi dari persepsi langsung dan dihasilkan oleh sistem rekursif, yaitu, dapat diterapkan berulang kali, aturan) dan struktur gramatikal permukaan (dirasakan secara langsung), serta transformasi yang menggambarkan transisi dari struktur dalam ke struktur permukaan. Beberapa struktur permukaan dapat sesuai dengan satu struktur dalam (misalnya, konstruksi pasif Keputusan ditandatangani oleh presiden berasal dari struktur dalam yang sama dengan konstruksi aktif Presiden menandatangani keputusan tersebut) dan sebaliknya (misalnya, ambiguitas Ibu mencintai anak perempuan digambarkan sebagai hasil kebetulan struktur permukaan yang kembali ke dua kedalaman yang berbeda, di mana ibu adalah orang yang mencintai anak perempuan, dan yang lain, orang yang mencintai anak perempuan).

Pada 1970-an, Chomsky mengerjakan teori governance and binding (GB-theory - dari kata government and binding) - lebih umum dari yang sebelumnya. Di dalamnya, ilmuwan meninggalkan aturan khusus yang menggambarkan struktur sintaksis bahasa tertentu. Semua transformasi telah diganti dengan satu transformasi gerakan universal. Dalam kerangka teori GB, ada juga modul pribadi, yang masing-masing bertanggung jawab atas bagian tata bahasanya sendiri.

Baru-baru ini, pada tahun 1995, Chomsky mengajukan program minimalis, di mana bahasa manusia digambarkan seperti bahasa mesin. Ini hanya sebuah program, bukan model atau teori. Di dalamnya, Chomsky mengidentifikasi dua subsistem utama perangkat bahasa manusia: leksikon dan sistem komputasi, serta dua antarmuka - fonetik dan logis.

Sekolah Fonologi Moskow, yang perwakilannya adalah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori serupa untuk mempelajari fonetik. Lambat laun, metode-metode "tepat" mulai diterapkan tidak hanya berkaitan dengan fonetik, tetapi juga sintaksis. Baik ahli bahasa maupun matematikawan, baik di dalam maupun di luar negeri, mulai mempelajari struktur bahasa. Pada 1950-an dan 60-an, tahap baru dalam interaksi antara matematika dan linguistik dimulai di Uni Soviet, terkait dengan pengembangan sistem terjemahan mesin.

Dorongan untuk permulaan karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (walaupun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, itu, menjadi primitif , tidak meluas). Pada tahun 1947, A. Butt dan D. Britten datang dengan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk memisahkan kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dari hari ini. Ini adalah mesin yang sangat besar dan mahal yang memenuhi seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan perhitungan matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP secara aktif didukung oleh militer, sementara (dalam kondisi Perang Dingin) arah Rusia-Inggris dikembangkan di AS, dan arah Anglo-Rusia di Uni Soviet.

Pada Januari 1954, Eksperimen Georgetown, demonstrasi publik pertama terjemahan dari bahasa Rusia ke bahasa Inggris di mesin IBM-701, berlangsung di Universitas Teknik Massachusetts. Abstrak pesan tentang keberhasilan percobaan, dibuat oleh D.Yu. Panov, muncul di RJ "Matematika", 1954, No. 10: "Terjemahan dari satu bahasa ke bahasa lain menggunakan mesin: laporan tes pertama yang berhasil."

Namun, generasi pertama dari sistem terjemahan mesin sangat tidak sempurna. Semuanya didasarkan pada algoritma terjemahan sekuensial "kata demi kata", "frase demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan dengan cara apa pun. Misalnya, kita dapat mengutip kalimat: “John sedang mencari kotak mainannya. Akhirnya dia menemukannya. Kotak itu ada di dalam pena. Yohanes sangat senang. (John sedang mencari kotak mainannya. Akhirnya dia menemukannya. Kotak itu ada di playpen. John sangat senang.).” "Pena" dalam konteks ini bukanlah "pena" (alat tulis), tetapi "playpen" (pena bermain). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Lyapunov berbicara tentang terjemahan dengan mengekstraksi makna dari teks yang diterjemahkan dan menyajikannya dalam bahasa lain. Pendekatan membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Namun, tugas menciptakannya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya terselesaikan, terlepas dari upaya Federasi Internasional IFIP, komunitas ilmuwan dunia di bidang pemrosesan informasi.

Pada 6 Mei 1960, Keputusan Presidium Akademi Ilmu Pengetahuan Uni Soviet "Tentang pengembangan metode struktural dan matematika untuk studi bahasa" diadopsi, dan divisi yang sesuai dibuat di Institut Linguistik dan Institut bahasa Rusia. Sejak 1960, di universitas kemanusiaan terkemuka di negara itu - fakultas filologi Universitas Negeri Moskow, Leninrad, universitas Novosibirsk, Institut Bahasa Asing Negeri Moskow - memulai pelatihan di bidang pemrosesan teks otomatis.

Namun, karya terjemahan mesin pada periode ini, yang disebut "klasik", lebih bersifat teoritis daripada kepentingan praktis. Sistem terjemahan mesin yang hemat biaya mulai dibuat hanya pada tahun delapan puluhan abad terakhir. Saya akan membicarakan ini nanti di Bagian 2.1, Terjemahan Mesin.

Tahun 1960-an - 70-an mencakup perkembangan teoretis yang mendalam menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan kabur.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen pada himpunan tertentu (АОа), tetapi tentang tingkat kepemilikan ini (mАОа), karena elemen periferal dapat dimiliki oleh beberapa bidang hingga derajat tertentu. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, sampai usia 12 ia berlatih berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris dan Persia - dan menggunakan tiga huruf yang berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan kabur dan linguistik, dia tidak menyangkal hubungan ini, tetapi menjelaskan: “Saya tidak yakin bahwa studi bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika ini masalahnya, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II ia beremigrasi ke Amerika Serikat. “Pertanyaannya bukan apakah saya orang Amerika, Rusia, Azerbaijan atau apa pun,” katanya.

Abstrak serupa:

Bahasa dan ucapan sebagai salah satu masalah mendasar dalam stilistika. Konsep fonem dan tingkat fonologis. Konsep bahasa sebagai sistem dan tataran sistem bahasa. Pengertian morfem dan jenis-jenisnya. Sebuah kalimat sebagai unit sintaksis dari sebuah teks. Tanda-tanda sistem bahasa.

pengantar

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Terbentuknya Linguistik Struktural pada Pergantian Abad 19 – 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinand de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

pengantar

Tujuan dari pekerjaan kursus saya adalah untuk secara singkat menyoroti hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat perangkat teoretis untuk menggambarkan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis seperti itu untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun, dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan aplikasi dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan baru yang mendasar terhadap bahasa tersebut. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar untuk mewakili pola linguistik dalam bentuk di mana mereka dapat diterapkan secara langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, mengacu pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan pada tahun-tahun terakhir percaya bahwa ekspresi itu sendiri tidak dapat dinaikkan ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan, akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka dari awal abad kedua puluh (saya akan menceritakan tentang pengaruhnya pada pengembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan miliknya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang beragam, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik

1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.

Dengan demikian, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama, fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein adalah berkembang, eksperimen terjadi pada bentuk dan konten dalam sastra, musik, dan seni rupa), di sisi lain, dengan matematika (konsep konsistensi sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti: Fenomena mulai ditafsirkan tidak dalam kaitannya dengan penyebab terjadinya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi berhenti menjadi independen dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

pengantar

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Terbentuknya Linguistik Struktural pada Pergantian Abad 19 - 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinand de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

pengantar

Tujuan dari pekerjaan kursus saya adalah untuk secara singkat menyoroti hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat perangkat teoretis untuk menggambarkan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis seperti itu untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun, dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan aplikasi dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan baru yang mendasar terhadap bahasa tersebut. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar untuk mewakili pola linguistik dalam bentuk di mana mereka dapat diterapkan secara langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, mengacu pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan pada tahun-tahun terakhir percaya bahwa ekspresi itu sendiri tidak dapat dinaikkan ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan, akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka dari awal abad kedua puluh (saya akan menceritakan tentang pengaruhnya pada pengembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan miliknya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang beragam, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik

1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss yang terkenal pada awal abad kedua puluh, Ferdinand de Saussure.

Saussure mengusulkan gagasan tentang ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut ilmu ini sebagai semiologi (dari bahasa Yunani "semeîon" - sebuah tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada 1920-an dan 1930-an dan di Paris pada 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan sastra yang disusun (atau dirumuskan) dengan bantuan struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya dalam linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama-nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: metode ini merupakan upaya untuk mempelajari dalam suatu sistem masalah "probabilitas" dalam bahasa. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang Saussure cari anagramnya, menurut Jean Starobinsky, adalah "alat bagi penyair, bukan sumber kehidupan puisi." Puisi berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran terlihat: “karena puisi diungkapkan tidak hanya dalam kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat. Lampiran 1).

1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Teori Chomsky telah melalui beberapa tahap dalam perkembangannya.

Dorongan untuk permulaan karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (walaupun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, itu, menjadi primitif , tidak meluas). Pada tahun 1947, A. Butt dan D. Britten datang dengan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk memisahkan kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dari hari ini. Ini adalah mesin yang sangat besar dan mahal yang memenuhi seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan perhitungan matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP secara aktif didukung oleh militer, sementara (dalam kondisi Perang Dingin) arah Rusia-Inggris dikembangkan di AS, dan arah Anglo-Rusia di Uni Soviet.

Namun, generasi pertama dari sistem terjemahan mesin sangat tidak sempurna. Semuanya didasarkan pada algoritma terjemahan sekuensial "kata demi kata", "frase demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan dengan cara apa pun. Contoh kalimatnya adalah: John sedang mencari kotak mainannya.Akhirnya dia menemukannya. Kotak itu ada di dalam pena.John sangat senang. (John sedang mencari kotak mainannya. Akhirnya dia menemukannya. Kotak itu ada di playpen. John sangat senang.).” "Pena" dalam konteks ini bukanlah "pena" (alat tulis), tetapi "playpen" ( boks). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Lyapunov berbicara tentang terjemahan dengan mengekstraksi makna dari teks yang diterjemahkan dan menyajikannya dalam bahasa lain. Pendekatan membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Namun, tugas menciptakannya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya diselesaikan, terlepas dari upaya Federasi Internasional IFIP - komunitas ilmuwan dunia di bidang pemrosesan informasi.

Tahun 1960-an - 70-an mencakup perkembangan teoretis yang mendalam menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan kabur.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen pada himpunan tertentu (АОа), tetapi tentang derajat keanggotaan ini (mАОа), karena elemen periferal dapat dimiliki oleh beberapa bidang hingga derajat tertentu. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, sampai usia 12 ia berlatih berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris dan Persia - dan menggunakan tiga huruf yang berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan kabur dan linguistik, dia tidak menyangkal hubungan ini, tetapi menjelaskan: “Saya tidak yakin bahwa studi bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika ini masalahnya, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II ia beremigrasi ke Amerika Serikat. “Pertanyaannya bukanlah apakah saya orang Amerika, Rusia, Azerbaijan atau orang lain,” katanya dalam salah satu percakapan, “Saya dibentuk oleh semua budaya dan masyarakat ini dan merasa cukup nyaman di antara mereka masing-masing.” Dalam kata-kata ini ada sesuatu yang mirip dengan apa yang menjadi ciri teori himpunan kabur - penyimpangan dari definisi yang tidak ambigu dan kategori yang tajam.

Jadi, sepanjang abad kedua puluh, ada konvergensi eksak dan humaniora. Interaksi matematika dengan linguistik semakin banyak ditemukan aplikasi praktisnya. Lebih lanjut tentang ini di bab berikutnya.

Bab 2. Contoh terpilih penggunaan matematika dalam linguistik

2.1 Terjemahan mesin

Selama periode 1978-93, 20 juta dolar dihabiskan untuk penelitian di bidang terjemahan mesin di AS, 70 juta di Eropa, dan 200 juta di Jepang.

Pada bulan Juli 1990, sistem terjemahan mesin komersial pertama di Rusia yang disebut PROMT (Programmer's Machine Translation) dipresentasikan di Forum PC di Moskow.PROMT memenangkan kompetisi NASA untuk penyediaan sistem MP (PROMT adalah satu-satunya perusahaan non-Amerika dalam hal ini kompetisi).Pada tahun 1992, PROMT merilis seluruh keluarga sistem dengan nama baru STYLUS untuk terjemahan dari bahasa Inggris, Jerman, Prancis, Italia, dan Spanyol ke Rusia dan dari Rusia ke Inggris, dan sistem terjemahan mesin pertama di dunia untuk Windows dibuat pada dasar STYLUS pada tahun 1993. Pada tahun 1994, STYLUS 2.0 dirilis untuk Windows 3.X/95/NT, dan pada tahun 1995-1996 sistem terjemahan mesin generasi ketiga, STYLUS 3.0 32-bit sepenuhnya untuk Windows 95/NT, sementara pengembangan sistem terjemahan mesin Rusia-Jerman dan Rusia-Prancis yang benar-benar baru pertama di dunia berhasil diselesaikan.

Saat ini, teknologi terjemahan mesin baru muncul berdasarkan penggunaan sistem kecerdasan buatan dan metode statistik. Tentang yang terakhir - di bagian selanjutnya.

2.2 Metode statistik dalam pembelajaran bahasa