Métodos matemáticos em linguística comparada.

Introdução

Capítulo 1. A história da aplicação de métodos matemáticos em linguística

1.1. A formação da linguística estrutural na virada dos séculos XIX-XX

1.2. Aplicação de métodos matemáticos em linguística na segunda metade do século XX.

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1. Tradução automática

2.2. Métodos estatísticos na aprendizagem de línguas

2.3. Aprender uma língua por métodos de lógica formal

2.4. Perspectivas para a aplicação de métodos matemáticos em linguística

Conclusão

Literatura

Apêndice 1. Ronald Schleifer. Fernando de Saussure

Apêndice 2. Ferdinand de Saussure (tradução)

Introdução

No século XX, houve uma tendência contínua para a interação e interpenetração de vários campos do conhecimento. As fronteiras entre as ciências individuais são gradualmente borradas; há cada vez mais ramos da atividade mental que estão "na junção" do conhecimento humanitário, técnico e das ciências naturais.

Outra característica óbvia da modernidade é o desejo de estudar as estruturas e seus elementos constituintes. Portanto, um lugar crescente, tanto na teoria científica quanto na prática, é dado à matemática. Entrando em contato, por um lado, com a lógica e a filosofia, por outro, com a estatística (e, consequentemente, com as ciências sociais), a matemática penetra cada vez mais profundamente naquelas áreas que por muito tempo foram consideradas puramente “humanitários”, ampliando seu potencial heurístico (a resposta à pergunta “quanto” muitas vezes ajudará a responder às perguntas “o quê” e “como”). A linguística não foi exceção.

O objetivo do meu trabalho de curso é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Desde a década de 1950, a matemática tem sido usada na linguística para criar um aparato teórico para descrever a estrutura das línguas (naturais e artificiais). No entanto, deve-se dizer que não encontrou imediatamente essa aplicação prática para si. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a encontrar aplicação na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Os linguistas enfrentaram a questão: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). Alguns cientistas dos últimos anos acreditam que a expressão em si não pode ser elevada à categoria de termo, pois não significa nenhuma “linguística” especial, mas apenas um novo direcionamento voltado para o aprimoramento, aumento da precisão e confiabilidade dos métodos de pesquisa linguística . A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. Até mesmo Schlegel notou a interação da linguagem e da consciência, e Ferdinand de Saussure, um linguista proeminente do início do século XX (falarei sobre sua influência no desenvolvimento de métodos matemáticos em linguística mais tarde), conectou a estrutura da linguagem com seu pertencimento. ao povo. O pesquisador moderno L. Perlovsky vai além, identificando as características quantitativas da língua (por exemplo, o número de gêneros, casos) com as peculiaridades da mentalidade nacional (mais sobre isso na Seção 2.2, "Métodos Estatísticos em Lingüística").

A interação da matemática e da linguística é um tema multifacetado, e em meu trabalho não me deterei em tudo, mas, antes de tudo, em seus aspectos aplicados.

Capítulo I. História da Aplicação de Métodos Matemáticos em Lingüística

1.1 A formação da linguística estrutural na virada dos séculos XIX-XX

A descrição matemática da linguagem é baseada na ideia de linguagem como mecanismo, que remonta ao famoso linguista suíço do início do século XX, Ferdinand de Saussure.

O elo inicial de seu conceito é a teoria da linguagem como um sistema composto por três partes (a própria linguagem é Língua, Fala - senha, e atividade de fala - Língua), em que cada palavra (membro do sistema) é considerada não em si mesma, mas em conexão com outros membros. Como outro linguista proeminente, o dinamarquês Louis Hjelmslev, observou mais tarde, Saussure "foi o primeiro a exigir uma abordagem estrutural da linguagem, isto é, uma descrição científica da linguagem registrando as relações entre as unidades".

Compreendendo a linguagem como uma estrutura hierárquica, Saussure foi o primeiro a colocar o problema do valor e do significado das unidades linguísticas. Fenômenos e eventos separados (digamos, a história da origem de palavras indo-européias individuais) devem ser estudados não por si mesmos, mas em um sistema no qual são correlacionados com componentes semelhantes.

A unidade estrutural da linguagem de Saussure considerava a palavra, "signo", na qual se combinavam som e significado. Nenhum desses elementos existe um sem o outro: portanto, o falante nativo entende os vários matizes do significado de uma palavra polissemântica como um elemento separado no todo estrutural, na língua.

Assim, na teoria de F. de Saussure pode-se ver a interação da linguística, por um lado, com a sociologia e a psicologia social (note-se que, ao mesmo tempo, a fenomenologia de Husserl, a psicanálise de Freud, a teoria da relatividade de Einstein eram desenvolvendo, experimentavam-se a forma e o conteúdo na literatura, na música e nas artes plásticas), por outro lado, com a matemática (o conceito de consistência corresponde ao conceito algébrico de linguagem). Tal conceito mudou o conceito de interpretação linguística como tal: os fenômenos passaram a ser interpretados não em relação às causas de sua ocorrência, mas em relação ao presente e ao futuro. A interpretação deixou de ser independente das intenções de uma pessoa (apesar do fato de que as intenções podem ser impessoais, "inconscientes" no sentido freudiano da palavra).

O funcionamento do mecanismo linguístico se manifesta através da atividade de fala dos falantes nativos. O resultado da fala são os chamados "textos corretos" - sequências de unidades de fala que obedecem a determinados padrões, muitos dos quais permitem a descrição matemática. A teoria das formas de descrever a estrutura sintática trata do estudo de métodos para a descrição matemática de textos corretos (principalmente sentenças). Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

As ideias de Saussure foram desenvolvidas no Ocidente pelos contemporâneos mais jovens do grande linguista suíço: na Dinamarca - L. Hjelmslev, já mencionado por mim, que deu origem à teoria algébrica da linguagem em sua obra "Fundamentos da Teoria Linguística", no EUA - E. Sapir, L. Bloomfield, C. Harris, na República Tcheca - cientista-emigrante russo N. Trubetskoy.

As regularidades estatísticas no estudo da linguagem começaram a ser tratadas por ninguém menos que o fundador da genética, Georg Mendel. Foi somente em 1968 que os filólogos descobriram que, nos últimos anos de sua vida, ele era fascinado pelo estudo dos fenômenos linguísticos usando os métodos da matemática. Mendel trouxe esse método para a linguística da biologia; na década de 1990, apenas os linguistas e biólogos mais ousados afirmavam a viabilidade de tal análise. Nos arquivos do mosteiro de S. Tomasz em Brno, cujo abade era Mendel, foram encontradas folhas com colunas de sobrenomes terminadas em "mann", "bauer", "mayer", e com algumas frações e cálculos. Em um esforço para descobrir as leis formais da origem dos nomes de família, Mendel faz cálculos complexos, nos quais leva em conta o número de vogais e consoantes na língua alemã, o número total de palavras que considera, o número de sobrenomes, etc.

Em nosso país, a linguística estrutural começou a se desenvolver mais ou menos na mesma época que no Ocidente - na virada dos séculos 19 para 20. Simultaneamente com F. de Saussure, o conceito de linguagem como sistema foi desenvolvido em seus trabalhos por professores da Universidade de Kazan F.F. Fortunatov e I.A. Baudouin de Courtenay. Este último correspondeu por muito tempo com de Saussure, respectivamente, as escolas de linguística de Genebra e Kazan colaboraram entre si. Se Saussure pode ser chamado de ideólogo dos métodos "exatos" em linguística, então Baudouin de Courtenay lançou as bases práticas para sua aplicação. Ele foi o primeiro a separar a linguística (como exato uma ciência que usa métodos estatísticos e dependência funcional) da filologia (uma comunidade de disciplinas humanitárias que estudam a cultura espiritual através da linguagem e da fala). O próprio cientista acreditava que "a linguística pode ser útil em um futuro próximo, apenas libertada da união obrigatória com a filologia e a história literária" . A fonologia tornou-se o "campo de testes" para a introdução de métodos matemáticos na linguística - os sons como "átomos" do sistema linguístico, tendo um número limitado de propriedades facilmente mensuráveis, eram o material mais conveniente para métodos formais e rigorosos de descrição. A fonologia nega a existência de significado no som, de modo que o fator "humano" foi eliminado nos estudos. Nesse sentido, os fonemas são como objetos físicos ou biológicos.

Os fonemas, como os menores elementos linguísticos aceitáveis para a percepção, representam uma esfera separada, uma "realidade fenomenológica" separada. Por exemplo, em inglês, o som "t" pode ser pronunciado de maneira diferente, mas em todos os casos, uma pessoa que fala inglês o perceberá como "t". O principal é que o fonema desempenhará sua função principal - significativa. Além disso, as diferenças entre as línguas são tais que variedades de um som em uma língua podem corresponder a diferentes fonemas em outra; por exemplo, "l" e "r" em inglês são diferentes, enquanto em outros idiomas são variedades do mesmo fonema (como o inglês "t", pronunciado com ou sem aspiração). O vasto vocabulário de qualquer língua natural é um conjunto de combinações de um número muito menor de fonemas. Em inglês, por exemplo, apenas 40 fonemas são usados para pronunciar e escrever cerca de um milhão de palavras.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nos anos 1920-1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as “características distintivas” dos fonemas. Esses recursos são baseados na estrutura dos órgãos da fala - língua, dentes, cordas vocais. Por exemplo, em inglês a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras e um meio de comunicação, e essas duas funções nunca coincidem. Podemos notar a alternância de forma e conteúdo: contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que em uma língua, traços distintivos formam um contraste fonético em um nível diferente de compreensão, fonemas são combinados em morfemas, morfemas em palavras, palavras em frases, etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que apenas a soma de suas partes.

Saussure propôs a ideia de uma nova ciência do século XX, separada da linguística, estudando o papel dos signos na sociedade. Saussure chamou essa ciência de semiologia (do grego "semeîon" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nos anos 1920-1930 e em Paris nos anos 1950-1960, expandiu o estudo da linguagem e das estruturas linguísticas em descobertas literárias compostas (ou formuladas) com a ajuda dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era, em muitos aspectos, o oposto do racionalismo em sua análise linguística: era uma tentativa de estudar em um sistema o problema da "probabilidade" na linguagem. Tal pesquisa ajuda a focalizar o "lado real" da probabilidade; a "palavra-chave" para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, "uma ferramenta para o poeta, não a fonte da vida do poema". O poema serve para trocar os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela ultrapassa o controle da consciência e depende apenas de as leis da linguagem” (ver . Apêndice 1).

A tentativa de Saussure de estudar os nomes próprios na poesia romana tardia enfatiza um dos componentes de sua análise linguística - a natureza arbitrária dos signos, bem como a essência formal da linguística de Saussure, que exclui a possibilidade de analisar o significado. Todorov conclui que hoje as obras de Saussure parecem ser extremamente consistentes em sua relutância em estudar os símbolos de um fenômeno que tem um significado claramente definido [Apêndice 1]. Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação aleatória baseados nesses conceitos, e, por outro lado, conceitos estruturalistas que apagam a oposição entre forma e conteúdo (sujeito e objeto) , significado e origens no estruturalismo, na psicanálise e até na mecânica quântica, os escritos de Ferdinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Cientistas russos também foram representados no Primeiro Congresso Internacional de Linguistas em Haia em 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy fizeram um relatório que examinou a estrutura hierárquica da linguagem - no espírito das ideias mais modernas para o início do século passado. Jakobson em seus escritos desenvolveu as ideias de Saussure de que os elementos básicos de uma língua devem ser estudados, antes de tudo, em relação às suas funções, e não às razões de sua ocorrência.

Infelizmente, depois que Stalin chegou ao poder em 1924, a linguística russa, como muitas outras ciências, foi rechaçada. Muitos cientistas talentosos foram forçados a emigrar, foram expulsos do país ou morreram em campos. Foi somente em meados da década de 1950 que um certo pluralismo de teorias se tornou possível – mais sobre isso na Seção 1.2.

1.2 Aplicação de métodos matemáticos em linguística na segunda metade do século XX

Em meados do século XX, quatro escolas linguísticas mundiais se formaram, cada uma das quais acabou sendo o ancestral de um certo método “exato”. Escola Fonológica de Leningrado(seu ancestral foi aluno de Baudouin de Courtenay L.V. Shcherba) usou um experimento psicolinguístico baseado na análise da fala de falantes nativos como o principal critério para generalizar o som na forma de um fonema.

Cientistas Círculo Linguístico de Praga, em particular, seu fundador N.S. Trubetskoy, que emigrou da Rússia, desenvolveu a teoria das oposições - a estrutura semântica da língua foi descrita por eles como um conjunto de unidades semânticas construídas opositivamente - Sem. Essa teoria foi aplicada no estudo não apenas da linguagem, mas também da cultura artística.

Ideólogos Descritivismo americano foram os linguistas L. Bloomfield e E. Sapir. A linguagem foi apresentada aos descritivistas como um conjunto de enunciados de fala, objeto principal de seu estudo. Seu foco estava nas regras de descrição científica (daí o nome) dos textos: o estudo da organização, disposição e classificação de seus elementos. A formalização de procedimentos analíticos no campo da fonologia e da morfologia (desenvolvimento de princípios para o estudo da linguagem em diferentes níveis, análise distributiva, método dos constituintes diretos etc.) levou à formulação de questões gerais de modelagem linguística. A desatenção ao plano do conteúdo da linguagem, bem como ao lado paradigmático da linguagem, não permitiu que os descritivistas interpretassem a linguagem como um sistema suficientemente completo.

Na década de 1960, desenvolveu-se a teoria das gramáticas formais, que surgiu principalmente devido ao trabalho do filósofo e linguista americano N. Chomsky. Ele é legitimamente considerado um dos mais famosos cientistas modernos e figuras públicas, muitos artigos, monografias e até mesmo um documentário completo são dedicados a ele. Com o nome de uma maneira fundamentalmente nova de descrever a estrutura sintática inventada por Chomsky - gramática generativa (generativa) - a tendência correspondente na linguística foi chamada gerativismo.

Chomsky, descendente de imigrantes da Rússia, estudou linguística, matemática e filosofia na Universidade da Pensilvânia desde 1945, sendo fortemente influenciado por seu professor Zelig Harris - assim como Harris, Chomsky considerou e ainda considera suas visões políticas próximas ao anarquismo (ele ainda é conhecido como crítico do sistema político dos EUA existente e como um dos líderes espirituais do anti-globalismo).

Primeiro grande trabalho científico de Chomsky, tese de mestrado "Morfologia do hebraico moderno » (1951) permaneceu inédito. Chomsky recebeu seu doutorado da Universidade da Pensilvânia em 1955, mas grande parte da pesquisa subjacente à sua dissertação (publicada na íntegra apenas em 1975 sob o título The Logical Structure of Linguistic Theory) e sua primeira monografia, Syntactic Structures (1957, Rus. trans. . 1962), foi realizado na Universidade de Harvard em 1951-1955. No mesmo ano de 1955, o cientista mudou-se para o Massachusetts Institute of Technology, onde se tornou professor em 1962.

A teoria de Chomsky passou por vários estágios em seu desenvolvimento.

Na primeira monografia "Estruturas sintáticas", o cientista apresentou a linguagem como um mecanismo de geração de um conjunto infinito de frases usando um conjunto finito de meios gramaticais. Para descrever as propriedades linguísticas, ele propôs os conceitos de estruturas gramaticais profundas (ocultas da percepção direta e geradas por um sistema de regras recursivas, ou seja, podem ser aplicadas repetidamente) e superficiais (diretamente percebidas), bem como transformações que descrevem a transição desde estruturas profundas até estruturas superficiais. Várias estruturas de superfície podem corresponder a uma estrutura profunda (por exemplo, uma estrutura passiva O decreto é assinado pelo presidente derivado da mesma Estrutura Profunda que a construção ativa O presidente assina o decreto) e vice-versa (assim, a ambiguidade mãe ama filha descrito como resultado de uma coincidência de estruturas superficiais que remontam a duas profundezas diferentes, em uma das quais a mãe é quem ama a filha, e na outra, a que é amada pela filha).

A teoria padrão de Chomsky é considerada o modelo de "Aspectos" estabelecido no livro de Chomsky "Aspectos da Teoria da Sintaxe". Nesse modelo, pela primeira vez, regras de interpretação semântica foram introduzidas na teoria formal, atribuindo significado a estruturas profundas. Em Aspectos, a competência linguística se opõe ao uso da linguagem (performance), adota-se a chamada hipótese Katz-Postal sobre a preservação do sentido durante a transformação, em relação à qual se exclui o conceito de transformação opcional, e um aparato de recursos sintáticos que descrevem a compatibilidade léxica são introduzidos.

Na década de 1970, Chomsky trabalhou na teoria do controle e vinculação (teoria GB - das palavras governo e vinculativo) é mais geral que o anterior. Nele, o cientista abandonou as regras específicas que descrevem as estruturas sintáticas de linguagens específicas. Todas as transformações foram substituídas por uma transformação de movimento universal. Dentro da estrutura da teoria GB, existem também módulos privados, cada um responsável por sua própria parte da gramática.

Já recentemente, em 1995, Chomsky apresentou um programa minimalista, onde a linguagem humana é descrita como linguagem de máquina. É apenas um programa, não um modelo ou uma teoria. Nele, Chomsky identifica dois subsistemas principais do aparato da linguagem humana: o léxico e o sistema computacional, além de duas interfaces - fonética e lógica.

As gramáticas formais de Chomsky tornaram-se clássicas por descrever não apenas linguagens naturais, mas também linguagens artificiais - em particular, linguagens de programação. O desenvolvimento da linguística estrutural na segunda metade do século XX pode ser justamente considerado uma "revolução chomskiana".

Escola Fonológica de Moscou, cujos representantes eram A.A. Reformatsky, V. N. Sidorov, P. S. Kuznetsov, A. M. Sukhotin, R.I. Avanesov, usou uma teoria semelhante para estudar fonética. Gradualmente, métodos "exatos" estão começando a ser aplicados não apenas em fonética, mas também em sintaxe. Tanto linguistas quanto matemáticos, tanto aqui quanto no exterior, estão começando a estudar a estrutura da língua. Nas décadas de 1950 e 1960, iniciou-se na URSS uma nova etapa na interação entre matemática e linguística, associada ao desenvolvimento de sistemas de tradução automática.

O impulso para o início desses trabalhos em nosso país foram os primeiros desenvolvimentos no campo da tradução automática nos Estados Unidos (embora o primeiro dispositivo de tradução mecanizada de P.P. Smirnov-Troyansky tenha sido inventado na URSS em 1933, sendo primitivo, não se difundiu). Em 1947, A. Butt e D. Britten criaram um código para tradução palavra por palavra usando um computador, um ano depois, R. Richens propôs uma regra para dividir palavras em radicais e terminações na tradução automática. Aqueles anos eram bem diferentes de hoje. Eram máquinas muito grandes e caras que ocupavam salas inteiras e exigiam uma grande equipe de engenheiros, operadores e programadores para mantê-las. Basicamente, esses computadores foram usados para realizar cálculos matemáticos para as necessidades das instituições militares - o novo em matemática, física e tecnologia serviu, antes de tudo, aos assuntos militares. Nos estágios iniciais, o desenvolvimento do MP foi ativamente apoiado pelos militares, enquanto (nas condições da Guerra Fria) a direção russo-inglesa se desenvolveu nos EUA e a direção anglo-russa na URSS.

Em janeiro de 1954, o Experimento Georgetown, a primeira demonstração pública de tradução do russo para o inglês na máquina IBM-701, ocorreu na Universidade Técnica de Massachusetts. Resumo da mensagem sobre a passagem bem sucedida do experimento, feita por D.Yu. Panov, apareceu no RJ "Matemática", 1954, nº 10: "Tradução de um idioma para outro usando uma máquina: um relatório sobre o primeiro teste bem-sucedido".

D. Yu. Panov (na época diretor do Instituto de Informação Científica - INI, mais tarde VINITI) atraiu I. K. Belskaya, que mais tarde chefiou o grupo de tradução automática do Instituto de Matemática Precisa e Engenharia da Computação da Academia de Ciências da URSS, para trabalhar na tradução automática. No final de 1955, data a primeira experiência de tradução do inglês para o russo com a ajuda da máquina BESM. Programas para BESM foram compilados por N.P. Trifonov e L. N. Korolev, cuja tese de doutorado foi dedicada a métodos de construção de dicionários para tradução automática.

Paralelamente, o trabalho de tradução automática foi realizado no Departamento de Matemática Aplicada do Instituto de Matemática da Academia de Ciências da URSS (agora o Instituto M.V. Keldysh de Matemática Aplicada da Academia Russa de Ciências). Por iniciativa do matemático A.A. Lyapunov. Ele envolveu O.S. Kulagin e seus alunos T.D. Wentzel e N. N. Rico. As ideias de Lyapunov e Kulagina sobre a possibilidade de usar a tecnologia para traduzir de um idioma para outro foram publicadas na revista Nature, 1955, nº 8. A partir do final de 1955, T.N. Moloshnaya, que então começou a trabalhar de forma independente no algoritmo de tradução inglês-russo.

R. Frumkina, que na época trabalhava no algoritmo de tradução do espanhol, lembra que nessa fase do trabalho era difícil dar passos consistentes. Com muito mais frequência, tive que seguir a experiência heurística - minha ou de colegas.

No entanto, a primeira geração de sistemas de tradução automática era muito imperfeita. Todos eles foram baseados em algoritmos de tradução sequencial "palavra por palavra", "frase por frase" - as conexões semânticas entre palavras e frases não foram levadas em consideração de forma alguma. Por exemplo, as frases são: John estava procurando sua caixa de brinquedos.Finalmente ele encontrou. A caixa estava na caneta.João ficou muito feliz. (John estava procurando sua caixa de brinquedos. Finalmente a encontrou. A caixa estava no cercadinho. John estava muito feliz.).” "Caneta" neste contexto não é uma "caneta" (ferramenta de escrita), mas um "cercadinho" ( caneta de brincar). O conhecimento de sinônimos, antônimos e significados figurativos é difícil de entrar em um computador. Uma direção promissora foi o desenvolvimento de sistemas computacionais focados no uso de um tradutor humano.

Com o tempo, os sistemas de tradução direta foram substituídos por sistemas T (da palavra inglesa "transfer" - transformação), nos quais a tradução era realizada no nível das estruturas sintáticas. Os algoritmos de T-systems usaram um mecanismo que possibilitou construir uma estrutura sintática de acordo com as regras gramaticais do idioma da sentença de entrada (semelhante a como uma língua estrangeira é ensinada no ensino médio) e, em seguida, sintetizar a sentença de saída transformando a estrutura sintática e substituindo as palavras necessárias do dicionário.

Lyapunov falou sobre tradução extraindo o significado do texto traduzido e apresentando-o em outro idioma. A abordagem de construção de sistemas de tradução automática baseada na obtenção da representação semântica da sentença de entrada por análise semântica e síntese da sentença de entrada de acordo com a representação semântica obtida ainda é considerada a mais perfeita. Tais sistemas são chamados de sistemas I (da palavra "interlíngua"). No entanto, a tarefa de criá-los, recuada no final dos anos 50 e início dos anos 60, não foi totalmente resolvida até agora, apesar dos esforços da Federação Internacional do IFIP, a comunidade mundial de cientistas na área de processamento de informação.

Os cientistas pensaram em como formalizar e construir algoritmos para trabalhar com textos, quais dicionários deveriam ser inseridos na máquina, quais padrões linguísticos deveriam ser usados na tradução automática. A linguística tradicional não tinha tais ideias - não apenas em termos de semântica, mas também em termos de sintaxe. Naquela época, não havia listas de construções sintáticas para nenhuma língua, as condições para sua compatibilidade e intercambialidade não foram estudadas, as regras para construir grandes unidades de estrutura sintática a partir de elementos constituintes menores não foram desenvolvidas.

A necessidade de criar os fundamentos teóricos da tradução automática levou à formação e desenvolvimento da linguística matemática. O papel principal neste assunto na URSS foi desempenhado pelos matemáticos A.A. Lyapunov, O. S. Kulagina, V. A. Uspensky, linguistas V.Yu. Rosenzweig, P. S. Kuznetsov, R. M. Frumkina, A. A. Reformatsky, I.A. Melchuk, V. V. Ivanov. A dissertação de Kulagina foi dedicada ao estudo da teoria formal das gramáticas (simultaneamente com N. Khomsky nos EUA), Kuznetsov propôs a tarefa de axiomatização da linguística, que remonta aos trabalhos de F.F. Fortunatov.

Em 6 de maio de 1960, foi adotado o Decreto do Presidium da Academia de Ciências da URSS "Sobre o desenvolvimento de métodos estruturais e matemáticos para o estudo da linguagem", e as divisões correspondentes foram criadas no Instituto de Linguística e no Instituto da Língua russa. Desde 1960, nas principais universidades humanitárias do país - a faculdade de filologia da Universidade Estadual de Moscou, Leninrad, universidades de Novosibirsk, Instituto Estadual de Línguas Estrangeiras de Moscou - começou a treinar no campo do processamento automático de texto.

No entanto, os trabalhos de tradução automática desse período, chamados de "clássicos", são de interesse teórico e não prático. Os sistemas de tradução automática econômicos começaram a ser criados apenas nos anos oitenta do século passado. Falarei sobre isso mais tarde na Seção 2.1, Tradução automática.

As décadas de 1960 e 1970 incluem desenvolvimentos teóricos profundos usando os métodos da teoria dos conjuntos e da lógica matemática, como a teoria de campo e a teoria dos conjuntos difusos.

O autor da teoria de campo em linguística foi o poeta, tradutor e linguista soviético V.G. Admoni. Ele inicialmente desenvolveu sua teoria com base na língua alemã. Para Admoni, o conceito de "campo" denota um conjunto arbitrário não vazio de elementos linguísticos (por exemplo, "campo lexical", "campo semântico").

A estrutura do campo é heterogênea: consiste em um núcleo, cujos elementos possuem um conjunto completo de características que definem um conjunto, e uma periferia, cujos elementos podem ter tanto as características de um determinado conjunto (não todas). e vizinhos. Vou dar um exemplo que ilustra esta afirmação: por exemplo, em inglês, o campo de palavras compostas (“day-dream” - “dream” é difícil de separar do campo de frases (“tear gas” - “tear gas”) .

A teoria dos conjuntos fuzzy já mencionada acima está intimamente relacionada à teoria de campos. Na URSS, os linguistas V.G. Admoni, I. P. Ivanova, G. G. Pochentsov, no entanto, seu ancestral foi o matemático americano L. Zadeh, que em 1965 publicou o artigo “Fuzzy Logic”. Dando uma justificativa matemática para a teoria dos conjuntos fuzzy, Zade os considerou com base no material linguístico.

Nesta teoria, estamos falando não tanto da pertença dos elementos a um determinado conjunto (АОа), mas do grau dessa pertinência (mАОа), uma vez que elementos periféricos podem pertencer a vários campos em um grau ou outro. Zade (Lofti-zade) era natural do Azerbaijão, até os 12 anos tinha a prática de se comunicar em quatro idiomas - azerbaijano, russo, inglês e persa - e usava três alfabetos diferentes: cirílico, latino, árabe. Quando se pergunta a um cientista o que há de comum entre a teoria dos conjuntos difusos e a linguística, ele não nega essa conexão, mas esclarece: “Não tenho certeza de que o estudo dessas linguagens tenha tido um grande impacto no meu pensamento. Se este fosse o caso, então apenas subconscientemente. Em sua juventude, Zadeh estudou em uma escola presbiteriana em Teerã e, após a Segunda Guerra Mundial, emigrou para os Estados Unidos. “A questão não é se sou americano, russo, azerbaijano ou qualquer outra pessoa”, disse ele em uma das conversas, “sou moldado por todas essas culturas e povos e me sinto bastante confortável entre cada um deles”. Nessas palavras há algo parecido com o que caracteriza a teoria dos conjuntos difusos - um afastamento de definições inequívocas e categorias nítidas.

Em nosso país, na década de 70, foram traduzidas e estudadas as obras de linguistas ocidentais do século XX. I A. Melchuk traduziu as obras de N. Chomsky para o russo. NO. Slyusareva em seu livro "A teoria de F. de Saussure à luz da linguística moderna" conecta os postulados do ensino de Saussure com os problemas reais da linguística dos anos 70. Há uma tendência para uma maior matematização da linguística. As principais universidades nacionais estão treinando pessoal na especialidade "Lingüística matemática (teórica, aplicada)". Ao mesmo tempo, no Ocidente, há um salto acentuado no desenvolvimento da tecnologia da computação, que exige cada vez mais novos fundamentos linguísticos.

Assim, ao longo do século XX, houve uma convergência das exatas e das humanidades. A interação da matemática com a linguística encontrou cada vez mais aplicações práticas. Mais sobre isso no próximo capítulo.

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1 Tradução automática

A ideia de traduzir de uma língua para outra com a ajuda de um mecanismo universal surgiu vários séculos antes do início dos primeiros desenvolvimentos nesta área - em 1649, René Descartes propôs a ideia de uma língua em que as ideias equivalentes de diferentes idiomas seriam expressos por um símbolo. As primeiras tentativas de implementar essa ideia nas décadas de 1930 e 1940, o início dos desenvolvimentos teóricos em meados do século, o aprimoramento dos sistemas de tradução com a ajuda da tecnologia nas décadas de 1970 e 80, o rápido desenvolvimento da tecnologia de tradução nos últimos década - estas são as etapas do desenvolvimento da tradução automática como indústria. É a partir dos trabalhos sobre tradução automática que a linguística computacional como ciência cresceu.

Com o desenvolvimento da tecnologia da computação no final dos anos 70 e início dos anos 80, os pesquisadores estabeleceram metas mais realistas e econômicas - a máquina se tornou não uma concorrente (como se supunha anteriormente), mas uma assistente de um tradutor humano. A tradução automática deixa de servir exclusivamente a tarefas militares (todas as invenções e pesquisas soviéticas e americanas, focadas principalmente em russo e inglês, contribuíram para a Guerra Fria de uma forma ou de outra). Em 1978, palavras em linguagem natural foram transmitidas pela rede interconectada Arpa e, seis anos depois, os primeiros programas de tradução para microcomputadores surgiram nos Estados Unidos.

Nos anos 70, a Comissão das Comunidades Europeias compra a versão inglês-francês do tradutor informático Systran, encomendando também as versões francês-inglês e italiano-inglês, e o sistema de tradução russo-inglês utilizado pelas Forças Armadas dos EUA. Assim foram lançadas as bases do projeto EUROTRA.

Sobre o renascimento da tradução automática nos anos 70-80. atestam os seguintes factos: a Comissão das Comunidades Europeias (CEC) adquire a versão inglês-francesa do Systran, bem como o sistema de tradução do russo para o inglês (este último desenvolvido após o relatório ALPAC e continuado a ser utilizado pela US Air Força e NASA); além disso, a CEC ordena o desenvolvimento das versões francês-inglês e italiano-inglês. Simultaneamente, há uma rápida expansão das atividades de tradução automática no Japão; nos EUA, a Organização Pan-Americana da Saúde (OPAS) ordena o desenvolvimento de uma direção espanhol-inglês (sistema SPANAM); A Força Aérea dos EUA está financiando o desenvolvimento de um sistema de tradução automática no Centro de Pesquisa Linguística da Universidade do Texas em Austin; O grupo TAUM no Canadá está fazendo progressos notáveis no desenvolvimento de seu sistema METEO (tradução meteorológica). Vários projetos começaram nos anos 70 e 80. posteriormente desenvolvido em sistemas comerciais completos.

Durante o período 1978-93, foram gastos 20 milhões de dólares em pesquisas na área de tradução automática nos EUA, 70 milhões na Europa e 200 milhões no Japão.

Uma das novidades é a tecnologia TM (translation memory), que funciona no princípio da acumulação: durante o processo de tradução, o segmento original (frase) e sua tradução são salvos, resultando na formação de um banco de dados linguístico; se um segmento idêntico ou semelhante for encontrado no texto recém-traduzido, ele será exibido junto com a tradução e uma indicação da porcentagem de correspondência. O tradutor toma então uma decisão (editar, rejeitar ou aceitar a tradução), cujo resultado é armazenado pelo sistema, de modo que não há necessidade de traduzir a mesma frase duas vezes. Um conhecido sistema comercial baseado na tecnologia TM é atualmente desenvolvido pelo sistema TRADOS (fundado em 1984).

Atualmente, várias dezenas de empresas estão desenvolvendo sistemas comerciais de tradução automática, incluindo: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. e outros.Agora você pode usar os serviços de tradutores automáticos diretamente na Web: alphaWorks; Tradutor Online da PROMT, LogoMedia.net, Serviço de Tradução Babel Fish da AltaVista; InfiniT. com; Traduzindo a Internet.

Sistemas de tradução comercialmente eficazes também surgiram na segunda metade dos anos 80 em nosso país. O próprio conceito de tradução automática se expandiu (começou a incluir “a criação de uma série de sistemas e dispositivos automáticos e automatizados que executam automática ou semiautomaticamente todo o ciclo de tradução ou tarefas individuais em diálogo com uma pessoa”) e as dotações governamentais para o desenvolvimento desta indústria aumentaram.

Russo, inglês, alemão, francês e japonês tornaram-se os principais idiomas dos sistemas de tradução nacionais. O All-Union Translation Center (VTsP) desenvolveu um sistema de tradução do inglês e do alemão para o russo em um computador ES-1035 -ANRAP. Consistia em três dicionários - entrada em inglês e alemão e saída em russo - sob um único software. Havia vários dicionários especializados intercambiáveis - sobre tecnologia da computação, programação, eletrônica de rádio, engenharia mecânica, agricultura, metalurgia. O sistema poderia funcionar em dois modos - automático e interativo, quando a tela exibia o texto-fonte e a tradução por frase, que uma pessoa podia editar. A velocidade de tradução do texto em ANRAP (do início da digitação até o final da impressão) foi de aproximadamente 100 páginas por hora.

Em 1989, foi criada uma família de tradutores comerciais do tipo SPRINT, trabalhando com russo, inglês, alemão e japonês. Sua principal vantagem era a compatibilidade com o IBM PC - assim, os sistemas nacionais de tradução automática atingiram o nível internacional de qualidade. Ao mesmo tempo, está sendo desenvolvido um sistema de tradução automática do francês para o russo FRAP, que inclui 4 etapas de análise de texto: grafemática, morfológica, sintática e semântica. Em LGPI eles. Herzen, o trabalho estava em andamento em um sistema SILOD-MP de quatro idiomas (inglês, francês, espanhol e russo) (os dicionários inglês-russo e franco-russo foram usados no modo industrial.

Para tradução especializada de textos de engenharia elétrica, existia o sistema ETAP-2. A análise do texto de entrada nele foi realizada em dois níveis - morfológico e sintático. O dicionário ETAP-2 continha cerca de 4 mil verbetes; a fase de transformação do texto - cerca de 1000 regras (96 gerais, 342 privadas, o resto são dicionário). Tudo isso garantiu uma qualidade de tradução satisfatória (por exemplo, o título da patente "Arranjo de grade de fase óptica e dispositivo de acoplamento com tal arranjo" foi traduzido como "Um dispositivo de grade de fase óptica e um dispositivo de conexão com tal dispositivo" - apesar de a tautologia, o significado é preservado).

No Instituto Pedagógico de Línguas Estrangeiras de Minsk, com base no dicionário inglês-russo de formas e frases de palavras, foi inventado um sistema de tradução automática de títulos, no Instituto de Estudos Orientais da Academia de Ciências - um sistema para traduzir do japonês para o russo. O primeiro serviço automático de vocabulário e terminologia (SLOTHERM) para computação e programação, criado no Instituto de Pesquisa de Sistemas de Automação de Moscou, continha aproximadamente 20.000 termos em um dicionário explicativo e dicionários especiais para pesquisa linguística.

Os sistemas de tradução automática começaram gradualmente a ser usados não apenas para o fim a que se destinavam, mas também como um componente importante dos sistemas de aprendizado automático (para ensinar tradução, verificar ortografia e conhecimento gramatical).

Os anos 90 trouxeram consigo o rápido desenvolvimento do mercado de PCs (do desktop ao bolso) e da tecnologia da informação, o uso generalizado da Internet (que está se tornando mais internacional e multilíngue). Tudo isso tornou o desenvolvimento de sistemas de tradução automática em demanda. Desde o início dos anos 1990 Desenvolvedores domésticos também estão entrando no mercado de sistemas para PC.

Em julho de 1990, o primeiro sistema comercial de tradução automática na Rússia chamado PROMT (PROgrammer's Machine Translation) foi apresentado no PC Forum em Moscou. Em 1992, a PROMT lançou toda uma família de sistemas sob o novo nome STYLUS para tradução de inglês, alemão, francês, italiano e espanhol para russo e de russo para inglês, e o primeiro sistema de tradução automática do mundo para Windows foi criado em a base do STYLUS em 1993. Em 1994, o STYLUS 2.0 foi lançado para Windows 3.X/95/NT, e em 1995-1996 a terceira geração de sistemas de tradução automática, totalmente 32 bits STYLUS 3.0 para Windows 95/NT, enquanto o desenvolvimento dos primeiros sistemas de tradução automática russo-alemão e russo-francês do mundo foi concluído com sucesso.

Em 1997, foi assinado um acordo com a empresa francesa Softissimo para a criação de sistemas de tradução de francês para alemão e inglês e vice-versa, e em dezembro deste ano foi lançado o primeiro sistema de tradução alemão-francês do mundo. No mesmo ano, a empresa PROMT lançou um sistema implementado usando a tecnologia Giant, que suporta várias direções de idioma em um shell, além de um tradutor especial para trabalhar no WebTranSite da Internet.

Em 1998, toda uma constelação de programas foi lançada sob o novo nome PROMT 98. Um ano depois, a PROMT lançou dois novos produtos: um pacote de software exclusivo para trabalhar na Internet - PROMT Internet e um tradutor para sistemas de correio corporativo - PROMT Mail Tradutor. Em novembro de 1999, o PROMT foi reconhecido como o melhor sistema de tradução automática testado pela revista francesa PC Expert, superando seus concorrentes em 30%. Soluções de servidor especiais também foram desenvolvidas para clientes corporativos - o servidor de tradução corporativa PROMT Translation Server (PTS) e a solução de Internet PROMT Internet Translation Server (PITS). Em 2000, a PROMT atualizou toda a sua linha de produtos de software lançando uma nova geração de sistemas MT: PROMT Translation Office 2000, PROMT Internet 2000 e Magic Gooddy 2000.

A tradução online com o suporte do sistema PROMT é utilizada em diversos sites nacionais e estrangeiros: Tradutor Online da PROMT, InfiniT.com, Translate.Ru, Lycos, etc., bem como em instituições de diversos perfis de tradução de documentos comerciais, artigos e cartas (há sistemas de tradução integrados diretamente no Outlook Express e em outros clientes de e-mail).

Atualmente, novas tecnologias de tradução automática estão surgindo com base no uso de sistemas de inteligência artificial e métodos estatísticos. Estes últimos são discutidos na próxima seção.

2.2 Métodos estatísticos na aprendizagem de línguas

Considerável atenção na linguística moderna é dada ao estudo dos fenômenos linguísticos usando os métodos da matemática quantitativa. Os dados quantitativos muitas vezes ajudam a compreender mais profundamente os fenômenos em estudo, seu lugar e papel no sistema de fenômenos relacionados. A resposta à pergunta "quanto" ajuda a responder às perguntas "o quê", "como", "por que" - tal é o potencial heurístico de uma característica quantitativa.

Os métodos estatísticos desempenham um papel significativo no desenvolvimento de sistemas de tradução automática (ver Seção 2.1). Na abordagem estatística, o problema de tradução é considerado em termos de um canal ruidoso. Imagine que precisamos traduzir uma frase do inglês para o russo. O princípio do canal barulhento nos oferece a seguinte explicação da relação entre uma frase em inglês e uma frase em russo: uma frase em inglês nada mais é que uma frase em russo distorcida por algum tipo de ruído. Para recuperar a frase original em russo, precisamos saber o que as pessoas costumam dizer em russo e como as frases em russo são distorcidas em inglês. A tradução é realizada procurando uma frase em russo que maximize os produtos da probabilidade incondicional da frase em russo e a probabilidade da frase em inglês (original) dada a frase em russo fornecida. De acordo com o teorema de Bayes, esta frase em russo é a tradução mais provável do inglês:

onde e é a frase de tradução e f é a frase original

Portanto, precisamos de um modelo de origem e um modelo de canal, ou um modelo de linguagem e um modelo de tradução. O modelo de idioma deve atribuir uma pontuação de probabilidade a qualquer frase no idioma de destino (no nosso caso, russo) e o modelo de tradução à frase original. (ver tabela 1)

Em geral, um sistema de tradução automática opera em dois modos:

1. Treinamento do sistema: um corpus de treinamento de textos paralelos é obtido e, usando programação linear, são procurados tais valores de tabelas de correspondência de tradução que maximizam a probabilidade de (por exemplo) a parte russa do corpus com o inglês disponível de acordo ao modelo de tradução selecionado. Um modelo da língua russa é construído na parte russa do mesmo corpus.

2. Exploração: com base nos dados obtidos para uma frase em inglês desconhecido, busca-se um russo que maximize o produto das probabilidades atribuídas pelo modelo de linguagem e pelo modelo de tradução. O programa usado para essa pesquisa é chamado de decodificador.

O modelo de tradução estatística mais simples é o modelo de tradução literal. Neste modelo, assume-se que para traduzir uma frase de um idioma para outro, basta traduzir todas as palavras (criar um “saco de palavras”), e o modelo providenciará sua colocação na ordem correta. P(a, f | e) para P(a | e, f), ou seja probabilidades de um dado alinhamento dado um par de sentenças, cada probabilidade P(a, f | e) é normalizada pela soma das probabilidades de todos os alinhamentos de um dado par de sentenças:

A implementação do algoritmo de Viterbi usado para treinar o Modelo #1 é a seguinte:

1. Toda a tabela de probabilidades de correspondência de tradução é preenchida com os mesmos valores.

2. Para todas as variantes possíveis de conexões de palavras em pares, a probabilidade P(a, f | e) é calculada:

3. Os valores de P(a, f | e) são normalizados para obter os valores de P(a | e, f).

4. A frequência de cada par de tradução é calculada, ponderada pela probabilidade de cada opção de alinhamento.

5. As frequências ponderadas resultantes são normalizadas e formam uma nova tabela de probabilidades de correspondência de tradução

6. O algoritmo é repetido a partir da etapa 2.

Considere, como exemplo, o treinamento de um modelo semelhante em um corpus de dois pares de sentenças (Fig. 2):

Casa Branca

Após um grande número de iterações, obteremos uma tabela (Tabela 2), que mostra que a tradução é realizada com alta precisão.

Além disso, os métodos estatísticos são amplamente utilizados no estudo do vocabulário, morfologia, sintaxe e estilo. Cientistas da Universidade Estadual de Perm realizaram um estudo baseado na afirmação de que as frases estereotipadas são um importante "material de construção" do texto. Essas frases consistem em palavras repetidas "nucleares" e especificadores de palavras dependentes e têm uma coloração estilística pronunciada.

No estilo científico, as palavras "nucleares" podem ser chamadas: pesquisa, estudo, tarefa, problema, questão, fenômeno, fato, observação, análise etc. No jornalismo, outras palavras serão “nucleares”, que têm um valor acrescido especificamente para o texto do jornal: tempo, pessoa, poder, negócios, ação, lei, vida, história, lugar etc. (total 29)

De particular interesse para os linguistas é também a diferenciação profissional da língua nacional, a originalidade do uso do vocabulário e da gramática, dependendo do tipo de ocupação. Sabe-se que os motoristas na fala profissional utilizam a forma w cerca de fer, os médicos dizem k cerca de clube em vez de coquetel Yu sh - tais exemplos podem ser dados. A tarefa da estatística é rastrear a variabilidade da pronúncia e a mudança na norma linguística.

As diferenças profissionais levam a diferenças não apenas gramaticais, mas também lexicais. Universidade Estadual de Yakut em homenagem M.K. Ammosov, foram analisados 50 questionários com as reações mais comuns a certas palavras entre médicos e construtores (Tabela 3).

		Construtores
Humano	paciente (10), personalidade (5)	homem (5)
Boa	ajuda (8), ajuda (7)	mal (16)
uma vida	morte (10)	adorável (5)
morte	cadáver (8)	vida (6)
o fogo	calor (8), queimar (6)	fogo (7)
dedo	mão (14), panarício (5)	grande (7), índice (6)
olhos	visão (6), aluno, oftalmologista (5 cada)	marrom (10), grande (6)
cabeça	mente (14), cérebro (5)	grande (9), inteligente (8), inteligente (6)
perder	consciência, vida (4 cada)	dinheiro (5), encontrar (4)

Nota-se que os médicos mais frequentemente do que os construtores fazem associações relacionadas à sua atividade profissional, uma vez que as palavras de estímulo dadas no questionário têm mais a ver com sua profissão do que com a profissão de construtor.

Regularidades estatísticas em um idioma são usadas para criar dicionários de frequência - dicionários que fornecem características numéricas da frequência de palavras (formas de palavras, frases) de qualquer idioma - o idioma do escritor, qualquer trabalho, etc. uma palavra é usada como característica da ocorrência de uma palavra no texto de um determinado volume

O modelo de percepção da fala é impossível sem um dicionário como seu componente essencial. Na percepção da fala, a unidade operacional básica é a palavra. Disso se segue, em particular, que cada palavra do texto percebido deve ser identificada com a unidade correspondente do vocabulário interno do ouvinte (ou leitor). É natural supor que desde o início a busca está limitada a alguns subdomínios do dicionário. De acordo com a maioria das teorias modernas de percepção da fala, a análise fonética real da sonoridade do texto em um caso típico fornece apenas algumas informações parciais sobre a possível aparência fonológica da palavra, e esse tipo de informação corresponde não a uma, mas a algumas MUITAS palavras. do dicionário; Assim, surgem dois problemas:

(a) selecionar o conjunto apropriado de acordo com certos parâmetros;

(b) dentro dos limites do conjunto delineado (se alocado adequadamente) para "eliminar" todas as palavras, exceto a única que melhor corresponde à palavra dada do texto reconhecido. Uma das estratégias de “abandono” é a exclusão de palavras de baixa frequência. Segue-se que o vocabulário para percepção da fala é um dicionário de frequência. É a criação de uma versão para computador do dicionário de frequências da língua russa que é a tarefa inicial do projeto apresentado.

Com base no material do idioma russo, existem 5 dicionários de frequência (sem contar os dicionários de filiais). Observemos apenas algumas deficiências gerais dos dicionários existentes.

Todos os dicionários de frequência conhecidos do idioma russo são baseados no processamento de matrizes de textos escritos (impressos). Em parte por esse motivo, quando a identidade de uma palavra é amplamente baseada em coincidências formais e gráficas, a semântica não é suficientemente levada em consideração. Como resultado, as características de frequência também são deslocadas, distorcidas; por exemplo, se o compilador do dicionário de frequência inclui palavras da combinação "um ao outro" nas estatísticas gerais do uso da palavra "amigo", isso dificilmente se justifica: dada a semântica, devemos admitir que já são palavras diferentes, ou melhor, que uma unidade de dicionário independente é apenas a combinação como um todo.

Além disso, em todos os dicionários existentes, as palavras são colocadas apenas em suas formas básicas: substantivos no singular, caso nominativo, verbos no infinitivo etc. Alguns dos dicionários fornecem informações sobre a frequência das formas das palavras, mas geralmente não o fazem de forma consistente o suficiente, não de forma exaustiva. As frequências de diferentes formas de palavras da mesma palavra obviamente não coincidem. O desenvolvedor de um modelo de percepção de fala deve levar em conta que em um processo perceptivo real, é precisamente uma forma de palavra específica que está “imersa” no texto que está sujeita a reconhecimento: com base na análise da seção inicial do expoente da forma da palavra, um conjunto de palavras com início idêntico é formado, e a seção inicial da forma da palavra não é necessariamente idêntica à seção inicial da forma do dicionário. É a forma da palavra que possui uma estrutura rítmica específica, que também é um parâmetro extremamente importante para a seleção perceptiva das palavras. Por fim, na representação final do enunciado reconhecido, novamente, as palavras são representadas pelas formas de palavras correspondentes.

Existem muitos trabalhos que demonstram a importância da frequência no processo de percepção da fala. Mas não temos conhecimento de trabalhos em que a frequência das formas das palavras seria usada - ao contrário, todos os autores praticamente ignoram a frequência das formas das palavras individuais, referindo-se exclusivamente aos lexemas. Se os resultados obtidos por eles não forem considerados artefatos, deve-se supor que o falante nativo de alguma forma tem acesso a informações sobre a razão das frequências das formas das palavras e das formas do dicionário, ou seja, de fato, lexemas. Além disso, tal transição de uma forma de palavra para um lexema, é claro, não pode ser explicada pelo conhecimento natural do paradigma correspondente, pois a informação de frequência deve ser usada antes da identificação final da palavra, caso contrário ela simplesmente perde seu significado.

De acordo com as características estatísticas primárias, é possível determinar com um dado erro relativo aquela parte do vocabulário, que inclui palavras com alta frequência de ocorrência, independentemente do tipo de texto. Também é possível, introduzindo ordenação gradual no dicionário, obter uma série de dicionários cobrindo as primeiras 100, 1000, 5000, etc. de palavras frequentes. As características estatísticas do dicionário são de interesse em relação à análise semântica do vocabulário. O estudo de grupos sujeito-ideológicos e campos semânticos mostra que as associações lexicais são sustentadas por ligações semânticas que se concentram em torno de lexemas de significado mais comum. A descrição de significados dentro do campo léxico-semântico pode ser realizada por meio da identificação de palavras com os lexemas mais abstratos em significado. Aparentemente, unidades de dicionário "vazias" (do ponto de vista das potências nominativas) constituem uma camada estatisticamente homogênea.

Vocabulários para gêneros individuais não são menos valiosos. Estudar a medida de sua similaridade e a natureza das distribuições estatísticas fornecerá informações interessantes sobre a estratificação qualitativa do vocabulário dependendo da esfera de uso da fala.

A compilação de dicionários de grande frequência requer o uso de tecnologia de computador. A introdução de mecanização parcial e automação no processo de trabalho em um dicionário é de interesse como um experimento no processamento de máquina de dicionários para diferentes textos. Tal dicionário requer um sistema mais rigoroso para processar e acumular material de vocabulário. Em miniatura, trata-se de um sistema de recuperação de informações capaz de fornecer informações sobre vários aspectos do texto e do vocabulário. Algumas solicitações básicas a este sistema são planejadas desde o início: o número total de palavras do inventário, as características estatísticas de uma única palavra e dicionários inteiros, a ordenação de zonas freqüentes e raras do dicionário, etc. para construir automaticamente dicionários reversos para gêneros e fontes individuais. Muitas outras informações estatísticas úteis sobre o idioma serão extraídas do conjunto acumulado de informações. O dicionário de frequência do computador cria uma base experimental para a transição para uma automação mais ampla do trabalho de vocabulário.

Os dados estatísticos dos dicionários de frequência também podem ser amplamente utilizados na resolução de outros problemas linguísticos - por exemplo, na análise e determinação dos meios ativos de formação de palavras do idioma russo moderno, resolvendo problemas de melhoria de gráficos e ortografia, relacionados à consideração informações estatísticas sobre o vocabulário (é importante levar em conta características probabilísticas de combinações de grafemas, tipos de combinações de letras realizadas em palavras), transcrição e transliteração prática. Os parâmetros estatísticos do dicionário também serão úteis na resolução de problemas de automatização de digitação, reconhecimento e leitura automática de texto literal.

Dicionários explicativos modernos e gramáticas da língua russa são construídos principalmente com base em textos literários e artísticos. Existem dicionários de frequência da língua de A.S. Pushkin, A. S. Griboedova, F. M. Dostoiévski, V. V. Vysotsky e muitos outros autores. No Departamento de História e Teoria da Literatura do Estado de Smolensk. A Universidade Pedagógica trabalha há vários anos para compilar dicionários de frequência de textos poéticos e em prosa. Para este estudo, foram selecionados dicionários de frequência de todas as letras de Pushkin e mais dois poetas da idade de ouro - "Ai da sagacidade" de Griboedov e toda a poesia de Lermontov; Pasternak e outros cinco poetas da Idade de Prata - Balmont 1894-1903, "Poems about the Beautiful Lady" de Blok, "Stone" de Mandelstam, "Pillar of Fire" de Gumilyov, "Anno Domini MCMXXI" de Akhmatova e "Sisters of My Life" de Pasternak e mais quatro poetas da Idade do Ferro - "Poems by Yuri Jivago", "When it clears up", todo o corpus de letras de M. Petrovs, "The road is far away", "Windshield", "Adeus à neve" e "Ferraduras" de Mezhirov, "Antimirov" de Voznesensky e "Bolas de neve" » Rylenkova.

Deve-se notar que esses dicionários são de natureza diferente: alguns representam o vocabulário de uma obra dramática, outros - livros de letras, ou vários livros, ou todo o corpus de poemas do poeta. Os resultados da análise apresentada neste artigo devem ser tomados com cautela, não podem ser tomados como absolutos. No entanto, com a ajuda de medidas especiais, a diferença na natureza ontológica dos textos pode ser reduzida até certo ponto.

Nos últimos anos, a oposição entre o discurso coloquial e o livro tornou-se cada vez mais clara. Essa questão é especialmente discutida entre os metodólogos que reivindicam uma guinada no ensino para a língua falada. No entanto, a especificidade do discurso coloquial ainda permanece inexplicada.

Os dicionários foram processados através da criação de um aplicativo de usuário no ambiente do programa EXCEL97 office. O aplicativo inclui quatro planilhas do livro EXCEL - "Folha de Título", "Folha de Dicionários" com dados iniciais, "Proximidade" e "Distâncias" com resultados, além de um conjunto de macros.

As informações iniciais são inseridas na folha "Dicionários". Os dicionários dos textos estudados são escritos em células do EXCEL, a última coluna S é formada a partir dos resultados obtidos e é igual ao número de palavras encontradas em outros dicionários. As tabelas "Proximidade" e "Distâncias" contêm medidas calculadas de proximidade M, correlação R e distância D.

Macros de aplicativo são procedimentos de programação baseados em eventos escritos em Visual Basic for Application (VBA). Os procedimentos são baseados em objetos de biblioteca VBA e seus métodos de processamento. Assim, para operações com planilhas do aplicativo, são utilizados o objeto-chave Planilha (planilha) e o método correspondente de ativação da planilha Ativar (ativar). A configuração do intervalo dos dados de origem analisados na planilha Dicionário é realizada pelo método Select do objeto Range (range), e a transferência de palavras como valores para variáveis é realizada conforme a propriedade Value (valor) do mesmo Range objeto.

Apesar do fato de que a análise de correlação de posto nos torna cautelosos sobre a dependência de tópicos entre diferentes textos, a maioria das palavras mais frequentes em cada texto tem correspondências em um ou mais outros textos. A coluna S mostra o número de tais palavras entre as 15 palavras mais frequentes para cada autor. Palavras em negrito aparecem apenas nas palavras de um poeta em nossa tabela. Blok, Akhmatova e Petrovs não têm nenhuma palavra destacada, eles têm S = 15. Esses três poetas têm as mesmas 15 palavras mais frequentes, diferem apenas no local da lista. Mas mesmo Pushkin, cujo vocabulário é o mais original, tem S = 8, e há 7 palavras destacadas.

Os resultados mostram que existe uma certa camada de vocabulário que concentra os principais temas da poesia. Como regra, essas palavras são curtas: do número total (225) de usos de palavras de uma sílaba 88, duas sílabas 127, três sílabas 10. Muitas vezes, essas palavras representam os principais mitologemas e podem se formar em pares: noite - dia, terra - céu (sol), Deus - homem (pessoas), vida - morte, corpo - alma, Roma - mundo(em Mandelstam); podem ser combinados em mitologemas de nível superior: céu, estrela, sol, terra; em uma pessoa, como regra, o corpo, coração, sangue, braço, perna, bochecha, olhos se destacam. Dos estados humanos, a preferência é dada ao sono e ao amor. A casa e as cidades pertencem ao mundo humano - Moscou, Roma, Paris. A criatividade é representada por lexemas palavra e música.

Griboedov e Lermontov quase não têm palavras que denotam natureza entre as palavras mais frequentes. Eles têm três vezes mais palavras que denotam uma pessoa, partes de seu corpo, elementos de seu mundo espiritual. Pushkin e poetas do século XX. designações de homem e natureza são aproximadamente iguais. Neste aspecto importante do assunto, podemos dizer que o século XX. seguiu Pushkin.

Tema mínimo caso entre as palavras mais frequentes, encontra-se apenas em Griboyedov e Pushkin. Lermontov e poetas do século XX. dá lugar a um tema mínimo palavra. A palavra não exclui os atos (interpretação bíblica do tema: no Novo Testamento, todos os ensinamentos de Jesus Cristo são considerados como a palavra de Deus ou a palavra de Jesus, e os apóstolos às vezes se autodenominam ministros da Palavra). O significado sagrado da palavra lexema é manifestado de forma convincente, por exemplo, no verso de Pasternak "E a imagem do mundo, revelada na Palavra". O significado sagrado do lexema palavra em conjunto e em contraste com os assuntos humanos, é convincentemente manifestado no poema de mesmo nome de Gumilyov.

Tokens encontrados em apenas um texto caracterizam a originalidade de um determinado livro ou de uma coleção de livros. Por exemplo, a palavra "mente" é a mais frequente na comédia de Griboedov "Ai da inteligência" - mas não ocorre entre as palavras mais frequentes em outros textos. O tema da mente é de longe o mais significativo na comédia. Este lexema acompanha a imagem de Chatsky, sendo o nome de Chatsky o mais frequente na comédia. Assim, a obra combina organicamente o nome comum mais frequente com o nome próprio mais frequente.

O coeficiente de correlação mais alto conecta os temas dos livros trágicos "A Coluna de Fogo" de Gumilyov e "Anno Domini MCMXXI" de Akhmatova. Entre os 15 substantivos mais frequentes, há 10 comuns, incluindo sangue, coração, alma, amor, palavra, céu. Lembre-se de que o livro de Akhmatova incluía uma miniatura "Você não estará vivo ...", escrito entre a prisão de Gumilyov e sua execução.

Os temas da vela e da multidão no material estudado são encontrados apenas nos "Poemas de Yuri Zhivago". O tema da vela nos versos do romance tem muitos significados contextuais: está associado à imagem de Jesus Cristo, aos temas da fé, imortalidade, criatividade, namoro. A vela é a fonte de luz mais importante nas cenas centrais do romance. O tema da multidão se desenvolve em conexão com a ideia principal do romance, na qual a vida privada de uma pessoa com seus valores inabaláveis se opõe à imoralidade do novo estado, construído sobre os princípios de agradar a multidão .

O trabalho também envolve a terceira etapa, também refletida no programa - este é o cálculo da diferença entre os números ordinais de palavras comuns a dois dicionários e a distância média entre as mesmas palavras de dois dicionários. Esta etapa permite passar das tendências gerais na interação dos dicionários identificadas com a ajuda da estatística para um nível que se aproxima do texto. Por exemplo, os livros de Gumilyov e Akhmatova se correlacionam estatisticamente significativamente. Observamos quais palavras se tornaram comuns em seus dicionários e, em primeiro lugar, escolhemos aquelas cujos números de série diferem minimamente ou iguais a zero. São essas palavras que têm o mesmo número de classificação e, consequentemente, são esses temas mínimos nas mentes dos dois poetas que são igualmente importantes. Em seguida, você deve passar para o nível de textos e contextos.

Os métodos quantitativos também ajudam a estudar as características dos povos - falantes nativos. Digamos, existem 6 casos em russo, não há casos em inglês e, em alguns idiomas dos povos do Daguestão, o número de casos chega a 40. L. Perlovsky em seu artigo “Consciousness, Language and Culture” correlaciona esses características com a tendência dos povos ao individualismo ou coletivismo, com percepção das coisas e fenômenos separadamente ou em conexão com outros. Afinal, foi no mundo de língua inglesa (não há casos - a coisa é percebida “por si mesma”) que surgiram conceitos como liberdade individual, liberalismo e democracia (observo que uso esses conceitos apenas em conexão com o linguagem, sem quaisquer características avaliativas). Apesar do fato de que tais suposições ainda permanecem apenas no nível de hipóteses científicas ousadas, elas ajudam a olhar para fenômenos já familiares de uma nova maneira.

Como podemos ver, as características quantitativas podem ser aplicadas em áreas completamente diferentes da linguística, o que cada vez mais borra as fronteiras entre métodos "exatos" e "humanitários". A linguística está recorrendo cada vez mais à ajuda não apenas da matemática, mas também da tecnologia computacional para resolver seus problemas.

2.3 Aprendendo a língua por métodos de lógica formal

Com os métodos não quantitativos da matemática, em particular com a lógica, a linguística teórica moderna interage não menos frutífera do que com os quantitativos. O rápido desenvolvimento das tecnologias computacionais e o crescimento de seu papel no mundo moderno exigiram uma revisão da abordagem da interação da linguagem e da lógica em geral.

Os métodos da lógica são amplamente utilizados no desenvolvimento de linguagens formalizadas, em particular, linguagens de programação, cujos elementos são alguns símbolos (semelhantes à matemática), escolhidos (ou construídos a partir de símbolos previamente selecionados) e interpretados de uma certa maneira, relacionados a qualquer uso, compreensão e compreensão "tradicionais" dos mesmos símbolos em outros contextos. Um programador lida constantemente com a lógica em seu trabalho. O significado de programação é apenas ensinar o computador a raciocinar (no sentido mais amplo da palavra). Ao mesmo tempo, os métodos de "raciocínio" são muito diferentes. Todo programador gasta uma certa quantidade de tempo procurando bugs em seus próprios programas e nos programas de outras pessoas. Ou seja, procurar erros no raciocínio, na lógica. E isso também deixa sua marca. É muito mais fácil detectar erros lógicos na fala comum. A relativa simplicidade das línguas estudadas pelos lógicos permite que eles elucidem as estruturas dessas línguas com mais clareza do que é alcançável por linguistas que analisam exclusivamente línguas naturais complexas. Tendo em vista que as línguas estudadas pelos lógicos usam relações copiadas das línguas naturais, os lógicos são capazes de fazer contribuições significativas para a teoria geral da linguagem. A situação aqui é semelhante à que ocorre na física: o físico também formula teoremas para casos idealmente simplificados que não ocorrem na natureza - ele formula leis para gases ideais, líquidos ideais, fala sobre movimento na ausência de atrito, etc. Para esses casos idealizados, podem ser estabelecidas leis simples que muito contribuiriam para a compreensão do que realmente está acontecendo e do que provavelmente permaneceria desconhecido para a física se tentasse considerar a realidade diretamente, em toda a sua complexidade.

No estudo das línguas naturais, métodos lógicos são usados para que os aprendizes de línguas não possam “memorizar” estupidamente o maior número possível de palavras, mas compreendam melhor sua estrutura. L. Shcherba também usou em suas palestras um exemplo de uma frase construída de acordo com as leis da língua russa: “Um kuzdra shteko brilhante boked um bokra e enrola um bokra”, e depois perguntou aos alunos o que isso significava. Apesar de o significado das palavras na frase permanecer obscuro (elas simplesmente não existem em russo), foi possível responder claramente: “kuzdra” é o sujeito, um substantivo feminino, no caso nominativo singular, “ bokr” é animado, e etc. A tradução da frase acaba sendo mais ou menos assim: “Algo feminino de uma só vez fez algo sobre algum tipo de criatura masculina e depois começou a fazer algo longo e gradual com seu filhote”. Um exemplo semelhante de um texto (artístico) a partir de palavras inexistentes, construído inteiramente de acordo com as leis da linguagem, é o Jabberwock de Lewis Carroll (em Alice no País das Maravilhas, Carroll, pela boca de seu personagem Humpty Dumpty, explica o significado de as palavras que ele inventou: "cozido" - oito horas da noite, quando é hora de preparar o jantar, "chlivky" - frágil e hábil, "shorek" - um cruzamento entre um furão, um texugo e um saca-rolhas, "mergulho " - pular, mergulhar, girar, "nava" - grama sob o relógio de sol (se estende um pouco para a direita, um pouco para a esquerda e um pouco para trás), "grunhir" - grunhir e rir, "zelyuk" - um peru verde, “myumzik” - um pássaro; suas penas estão desgrenhadas e se projetam em todas as direções, como uma vassoura, “mova” - longe de casa) .

Um dos principais conceitos da lógica moderna e da linguística teórica, usado no estudo de linguagens de vários cálculos lógicos e matemáticos, as linguagens naturais, para descrever a relação entre linguagens de diferentes "níveis" e caracterizar a relação entre os línguas em consideração e as áreas temáticas descritas com sua ajuda, é o conceito de metalinguagem. Uma metalinguagem é uma linguagem usada para expressar julgamentos sobre outra linguagem, a linguagem-objeto. Com a ajuda de uma metalinguagem, eles estudam a estrutura das combinações de caracteres (expressões) da linguagem-objeto, provam teoremas sobre suas propriedades expressivas, sobre sua relação com outras linguagens etc. relação a essa metalinguagem. Tanto a linguagem de assunto quanto a metalinguagem podem ser linguagens comuns (naturais). A metalinguagem pode diferir da linguagem objeto (por exemplo, em um livro didático de inglês para russos, russo é a metalinguagem e inglês é a linguagem objeto), mas também pode coincidir com ela ou diferir apenas parcialmente, por exemplo, em terminologia especial (A terminologia linguística russa é um elemento da metalinguagem) para descrever a língua russa, os chamados fatores semânticos fazem parte da metalinguagem para descrever a semântica das línguas naturais).

A lógica nos ensina uma distinção frutífera entre a linguagem-objeto e a metalinguagem. A linguagem-objeto é o próprio assunto da pesquisa lógica, e a metalinguagem é aquela linguagem inevitavelmente artificial na qual tal pesquisa é conduzida. O pensamento lógico consiste apenas em formular as relações e a estrutura de uma linguagem real (linguagem objeto) na linguagem dos símbolos (metalinguagem).

A metalinguagem deve, em qualquer caso, ser “não mais pobre” que sua linguagem objetiva (ou seja, para cada expressão desta última na metalinguagem deve haver seu nome, “tradução”) – caso contrário, se esses requisitos não forem atendidos (o que certamente leva lugar em línguas naturais, se acordos especiais não estabelecem o contrário) surgem paradoxos semânticos (antinomias).

À medida que mais e mais novas linguagens de programação foram criadas, em conexão com o problema dos tradutores de programação, havia uma necessidade urgente de criar metalinguagens. Atualmente, a metalinguagem da forma Backus-Naur (abreviada como BNF) é a mais comumente usada para descrever a sintaxe das linguagens de programação. É uma forma compacta na forma de algumas fórmulas semelhantes às matemáticas. Para cada conceito da linguagem existe uma metafórmula única (fórmula normal). Consiste em partes esquerda e direita. O lado esquerdo especifica o conceito que está sendo definido e o lado direito especifica o conjunto de construções de linguagem admissíveis que são combinadas nesse conceito. A fórmula usa metacaracteres especiais na forma de colchetes angulares, que contêm o conceito definido (no lado esquerdo da fórmula) ou um conceito previamente definido (no lado direito), e a separação das partes esquerda e direita é indicada por o metacaractere "::=", cujo significado é equivalente às palavras "por definição existe". As fórmulas metalinguísticas estão embutidas nos tradutores de alguma forma; com a ajuda deles, as construções usadas pelo programador são verificadas quanto à conformidade formal com qualquer uma das construções que são sintaticamente válidas nessa linguagem. Existem também metalinguagens separadas de várias ciências - assim, o conhecimento existe na forma de várias metalinguagens.

Os métodos lógicos também serviram de base para a criação de sistemas de inteligência artificial baseados no conceito de conexionismo. O conexionismo é uma tendência especial na ciência filosófica, cujo assunto são questões de conhecimento. Dentro da estrutura dessa tendência, estão sendo feitas tentativas para explicar as habilidades intelectuais de uma pessoa usando redes neurais artificiais. Compostas por um grande número de unidades estruturais semelhantes a neurônios, com um peso atribuído a cada elemento que determina a força da conexão com outros elementos, as redes neurais são modelos simplificados do cérebro humano. Experimentos com redes neurais desse tipo demonstraram sua capacidade de aprender a realizar tarefas como reconhecimento de padrões, leitura e identificação de estruturas gramaticais simples.

Os filósofos começaram a se interessar pelo conexionismo, pois a abordagem conexionista prometia fornecer uma alternativa à teoria clássica da mente e à ideia amplamente difundida dentro dessa teoria de que o funcionamento da mente é semelhante ao processamento da linguagem simbólica por um sistema digital. computador. Este conceito é muito controverso, mas nos últimos anos tem encontrado cada vez mais adeptos.

O estudo lógico da linguagem continua o conceito de linguagem como sistema de Saussure. O fato de que ela continua constantemente confirma mais uma vez a ousadia das conjecturas científicas do início do século passado. Dedicarei a última seção do meu trabalho às perspectivas para o desenvolvimento de métodos matemáticos na linguística hoje.

2.4 Perspectivas para a aplicação de métodos matemáticos em linguística

Na era da informática, os métodos da linguística matemática receberam uma nova perspectiva de desenvolvimento. A procura de soluções para os problemas da análise linguística está agora a ser cada vez mais implementada ao nível dos sistemas de informação. Ao mesmo tempo, a automatização do processo de tratamento do material linguístico, proporcionando ao investigador oportunidades e vantagens significativas, impõe-lhe inevitavelmente novas exigências e tarefas.

A combinação de conhecimento "exato" e "humanitário" tornou-se terreno fértil para novas descobertas no campo da linguística, informática e filosofia.

A tradução automática de um idioma para outro continua sendo um ramo da tecnologia da informação em rápido crescimento. Apesar do fato de que a tradução assistida por computador nunca pode ser comparada em qualidade à tradução humana (especialmente para textos literários), a máquina tornou-se um assistente indispensável para uma pessoa na tradução de grandes volumes de texto. Acredita-se que em um futuro próximo serão criados sistemas de tradução mais avançados, baseados principalmente na análise semântica do texto.

Uma direção igualmente promissora é a interação da linguística e da lógica, que serve como base filosófica para a compreensão da tecnologia da informação e da chamada "realidade virtual". Em um futuro próximo, o trabalho continuará na criação de sistemas de inteligência artificial - embora, novamente, nunca seja igual ao humano em suas capacidades. Tal competição não tem sentido: em nosso tempo, a máquina deveria se tornar (e se torna) não uma rival, mas uma assistente do homem, não algo do reino da fantasia, mas parte do mundo real.

O estudo da língua por métodos estatísticos continua, o que permite determinar com mais precisão suas propriedades qualitativas. É importante que as hipóteses mais ousadas sobre a linguagem encontrem sua prova matemática e, portanto, lógica.

O mais significativo é que vários ramos da aplicação da matemática na linguística, antes bastante isolados, nos últimos anos foram correlacionados entre si, conectando-se em um sistema coerente, por analogia com o sistema linguístico descoberto há um século por Ferdinand de Saussure e Yvan Baudouin de Courtenay. Esta é a continuidade do conhecimento científico.

A linguística no mundo moderno tornou-se a base para o desenvolvimento da tecnologia da informação. Enquanto a ciência da computação continuar sendo um ramo da atividade humana em rápido desenvolvimento, a união da matemática e da linguística continuará a desempenhar seu papel no desenvolvimento da ciência.

Conclusão

Ao longo do século 20, as tecnologias de computador percorreram um longo caminho - do uso militar ao uso pacífico, de uma faixa estreita de objetivos à penetração em todas as áreas da vida humana. A matemática como ciência encontrou um significado prático sempre novo com o desenvolvimento da tecnologia da computação. Este processo continua até hoje.

O anteriormente impensável "tandem" de "físicos" e "letristas" tornou-se uma realidade. Para a plena interação da matemática e da informática com as humanidades, eram necessários especialistas qualificados de ambos os lados. Enquanto os cientistas da computação precisam cada vez mais de conhecimentos humanitários sistemáticos (linguísticos, culturais, filosóficos) para compreender as mudanças na realidade ao seu redor, na interação do homem e da tecnologia, desenvolver cada vez mais novos conceitos linguísticos e mentais, escrever programas, então qualquer "Humanidades" em nosso tempo para seu crescimento profissional deve dominar pelo menos o básico de trabalhar com um computador.

A matemática, estando intimamente interligada com a informática, continua a desenvolver-se e a interagir com as ciências naturais e as humanidades. No novo século, a tendência para a matematização da ciência não está enfraquecendo, mas, ao contrário, está aumentando. Com base em dados quantitativos, são compreendidas as leis do desenvolvimento da língua, suas características históricas e filosóficas.

O formalismo matemático é mais adequado para descrever padrões em linguística (como, de fato, em outras ciências, tanto humanas quanto ciências naturais). A situação às vezes se desenvolve na ciência de tal maneira que, sem o uso de uma linguagem matemática apropriada, é impossível entender a natureza física, química etc. processo não é possível. Criando um modelo planetário do átomo, o famoso físico inglês do século XX. E. Rutherford experimentou dificuldades matemáticas. A princípio, sua teoria não foi aceita: não parecia convincente, e a razão para isso foi o desconhecimento de Rutherford da teoria da probabilidade, com base no mecanismo do qual só foi possível entender a representação modelo das interações atômicas. Percebendo isso, já naquela época um destacado cientista, dono do Prêmio Nobel, matriculou-se no seminário do matemático Professor Lamb e durante dois anos, junto com os alunos, participou de um curso e realizou um workshop sobre a teoria das probabilidades . Com base nele, Rutherford foi capaz de descrever o comportamento do elétron, dando ao seu modelo estrutural uma precisão convincente e ganhando reconhecimento. O mesmo acontece com a linguística.

Isso levanta a questão: o que há de tão matemático nos fenômenos objetivos, graças aos quais eles podem ser descritos na linguagem da matemática, na linguagem das características quantitativas? São unidades homogêneas de matéria distribuídas no espaço e no tempo. Aquelas ciências que foram mais longe do que outras no isolamento da homogeneidade e se revelam mais adequadas para o uso da matemática nelas.

A Internet, que se desenvolveu rapidamente na década de 1990, reuniu representantes de vários países, povos e culturas. Apesar de o inglês continuar sendo a principal língua de comunicação internacional, a Internet tornou-se multilíngue em nosso tempo. Isso levou ao desenvolvimento de sistemas de tradução automática comercialmente bem-sucedidos que são amplamente utilizados em vários campos da atividade humana.

As redes de computadores tornaram-se objeto de reflexão filosófica - cada vez mais novos conceitos linguísticos, lógicos, de visão de mundo têm sido criados que ajudam a entender a "realidade virtual". Em muitas obras de arte, foram criados cenários - mais frequentemente pessimistas - sobre o domínio das máquinas sobre uma pessoa e a realidade virtual - sobre o mundo exterior. Longe de sempre, tais previsões acabaram sendo sem sentido. A tecnologia da informação não é apenas uma área promissora para investir o conhecimento humano, é também uma forma de controlar a informação e, consequentemente, sobre o pensamento humano.

Este fenômeno tem um lado negativo e um lado positivo. Negativo - porque o controle sobre a informação é contrário ao direito humano inalienável de livre acesso a ela. Positivo - porque a falta desse controle pode levar a consequências catastróficas para a humanidade. Basta lembrar um dos filmes mais sábios da última década - "Quando o mundo acabar", de Wim Wenders, cujos personagens estão completamente imersos na "realidade virtual" de seus próprios sonhos gravados em um computador. No entanto, nem um único cientista e nem um único artista pode dar uma resposta inequívoca à pergunta: o que espera a ciência e a tecnologia no futuro.

Focar no "futuro", às vezes parecendo fantástico, era uma característica distintiva da ciência em meados do século XX, quando os inventores procuravam criar modelos perfeitos de tecnologia que pudessem funcionar sem intervenção humana. O tempo mostrou a natureza utópica de tal pesquisa. No entanto, seria supérfluo condenar os cientistas por isso - sem seu entusiasmo nos anos 1950 - a tecnologia da informação dos anos 60 não teria dado um salto tão poderoso nos anos 90, e não teríamos o que temos agora.

As últimas décadas do século XX mudaram as prioridades da ciência - a pesquisa, o pathos inventivo deu lugar ao interesse comercial. Novamente, isso não é bom nem ruim. Esta é uma realidade em que a ciência está cada vez mais integrada na vida quotidiana.

O século 21 deu continuidade a essa tendência e, em nosso tempo, as invenções não são apenas fama e reconhecimento, mas, antes de tudo, dinheiro. É também por isso que é importante garantir que as últimas conquistas da ciência e da tecnologia não caiam nas mãos de grupos terroristas ou regimes ditatoriais. A tarefa é difícil ao ponto da impossibilidade; realizá-lo ao máximo é tarefa de toda a comunidade mundial.

A informação é uma arma, e as armas não são menos perigosas que as nucleares ou químicas - só que não agem fisicamente, mas psicologicamente. A humanidade precisa pensar no que é mais importante para ela neste caso - liberdade ou controle.

Os mais recentes conceitos filosóficos relacionados ao desenvolvimento das tecnologias da informação e a tentativa de compreendê-los mostraram as limitações tanto do materialismo das ciências naturais, que dominou durante o século XIX e início do século XX, quanto do idealismo extremo, que nega o significado do mundo material . É importante para o pensamento moderno, especialmente o pensamento ocidental, superar esse dualismo de pensamento, quando o mundo circundante é claramente dividido em material e ideal. O caminho para isso é um diálogo de culturas, uma comparação de diferentes pontos de vista sobre os fenômenos circundantes.

Paradoxalmente, a tecnologia da informação pode desempenhar um papel importante nesse processo. As redes de computadores, e especialmente a Internet, não são apenas um recurso para entretenimento e atividade comercial vibrante, mas também um meio de comunicação significativo e controverso entre representantes de várias civilizações do mundo moderno, bem como para um diálogo entre o passado e o o presente. Podemos dizer que a Internet ultrapassa as fronteiras espaciais e temporais.

E no diálogo das culturas por meio da tecnologia da informação, o papel da linguagem como o mais antigo meio de comunicação universal ainda é importante. É por isso que a linguística, em interação com a matemática, filosofia e ciência da computação, experimentou seu segundo nascimento e continua a se desenvolver hoje. A tendência do presente continuará no futuro - "até o fim do mundo", como há 15 anos, o mesmo V. Wenders previu. É verdade que não se sabe quando esse fim ocorrerá - mas isso importa agora, porque o futuro mais cedo ou mais tarde se tornará o presente de qualquer maneira.

Apêndice 1

Fernando de Saussure

O linguista suíço Ferdinand de Saussure (1857-1913) é amplamente considerado o fundador da linguística moderna em suas tentativas de descrever a estrutura da linguagem em vez da história de línguas e formas de linguagem particulares. De fato, o método do Estruturalismo nos estudos linguísticos e literários e um ramo significativo da Semiótica encontram seu principal ponto de partida em sua obra na virada do século XX. Argumentou-se até que o complexo de estratégias e concepções que veio a ser chamado de “pós-estruturalismo” – obra de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros – é sugerido pela obra de Saussure na linguística e nas leituras anagramáticas da poesia latina tardia, do modernismo literário à psicanálise e à filosofia no início do século XX. Como Algirdas Julien Greimas e Joseph Courtés argumentam em Semiotics and Language: An Analytic Dictionary, sob o título "Interpretação", surgiu no início do século XX um novo modo de interpretação que eles identificam com a linguística saussureana, a fenomenologia husserliana e a psicanálise freudiana. Nesse modo, "a interpretação não é mais uma questão de atribuir um conteúdo dado a uma forma que de outra forma não teria, mas é uma paráfrase que formula de outro modo o conteúdo equivalente de um elemento significante dentro de um sistema semiótico dado" (p. 159). nesta compreensão de "interpretação", forma e conteúdo não são distintos; ao contrário, toda "forma" é, alternativamente, também um "conteúdo" semântico, uma "forma significante", de modo que a interpretação oferece uma paráfrase analógica de algo que já significa dentro de algum outro sistema de significação.

Tal reinterpretação da forma e da compreensão – que Claude Lévi-Strauss descreve em uma de suas articulações mais programáticas do conceito de estruturalismo, em “Estrutura e forma: reflexões sobre uma obra de Vladimir Propp” – está implícita no Curso póstumo de Saussure em General Linguistics (1916, trad., 1959, 1983). Em sua vida, Saussure publicou relativamente pouco, e sua principal obra, o Curso, foi a transcrição por seus alunos de vários cursos de linguística geral que ele ofereceu em 1907-11. No Curso, Saussure pediu o estudo "científico" da linguagem em oposição ao trabalho em linguística histórica que havia sido feito no século XIX. Esse trabalho é uma das grandes conquistas do intelecto ocidental: tomar palavras particulares como os blocos de construção de linguagem, a linguística histórica (ou "diacrônica") traçou a origem e o desenvolvimento das línguas ocidentais a partir de uma fonte de linguagem comum putativa, primeiro uma língua "indo-europeia" e depois uma "p" anterior língua roto-indo-europeia".

É precisamente esse estudo das ocorrências únicas de palavras, com a concomitante suposição de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos-palavra", que Saussure questionou. Seu trabalho foi uma tentativa de reduzir a massa de fatos sobre a linguagem, estudados tão minuciosamente pela linguística histórica, a um número manejável de proposições. A "escola comparada" da Filologia do século XIX, diz Saussure no Curso, "não conseguiu estabelecer a verdadeira ciência da linguística" porque "não conseguiu descobrir a natureza de seu objeto de estudo" (3). Essa “natureza”, argumenta ele, deve ser encontrada não apenas nas palavras “elementares” que uma linguagem compreende – os aparentes fatos “positivos” (ou “substâncias”) da linguagem – mas nas relações formais que dão origem àqueles "substâncias".

O reexame sistemático da linguagem por Saussure baseia-se em três pressupostos. O primeiro é que o estudo científico da linguagem precisa desenvolver e estudar o sistema e não a história dos fenômenos linguísticos. seus "eventos de fala" particulares, que ele designa como parole - e o objeto próprio da linguística, o sistema (ou "código") que governa esses eventos, que ele designa como langue. concepção sincrônica" da relação entre os elementos da linguagem em um determinado instante, em vez do estudo "diacrônico" do desenvolvimento da linguagem ao longo da história.

Essa suposição deu origem ao que Roman Jakobson em 1929 veio a designar como "estruturalismo", no qual "qualquer conjunto de fenômenos examinados pela ciência contemporânea é tratado não como uma aglomeração mecânica, mas como um todo estrutural, a concepção mecânica de processos cede à questão de sua função" ("Romântico" 711). Nesta passagem, Jakobson está articulando a intenção de Saussure de definir a linguística como um sistema científico em oposição a uma simples contabilidade "mecânica" de acidentes históricos. agora chamá-lo de "estrutural" - linguística: que os elementos básicos da linguagem só podem ser estudados em relação às suas funções e não em relação às suas causas. "palavras" europeias, esses eventos e entidades devem ser situados dentro de uma estrutura sistêmica em que se relacionam com outros chamados eventos e entidades. Trata-se de uma reorientação radical na concepção da experiência e dos fenômenos, cuja importância o filósofo Ernst Cassirer comparou "à nova ciência de Galileu que no século XVII mudou toda a nossa conceito do mundo físico" (citado em Culler, Pursuit 2 4). Essa mudança, como observam Greimas e Courtés, reconcebe a "interpretação" e, portanto, reconcebe a explicação e a compreensão em si. Em vez de a explicação "ser em termos das causas de um fenômeno", de modo que, como "efeito", está de alguma forma subordinada às suas causas, a explicação aqui consiste em subordinar um fenômeno à sua "função" orientada para o futuro ou "objetivo." A explicação não é mais independente das intenções ou propósitos humanos (mesmo que essas intenções possam ser impessoais, comunitárias ou, em termos freudianos, "inconscientes").

Em sua linguística, Saussure realiza essa transformação especificamente na redefinição da "palavra" linguística, que ele descreve como o "signo" linguístico e define em termos funcionalistas. O signo, ele argumenta, é a união de "um conceito e uma imagem sonora", que ele chamou de "significado e significante" (66-67; a tradução de Roy Harris de 1983 oferece os termos "significação" e "sinal"). A natureza de sua "combinação" é "funcional" na medida em que nem o significado nem o significante são a "causa" do outro, mas "cada um seus valores do outro" (8). elemento da linguagem, o signo , relacionalmente e faz a suposição básica da linguística histórica, a saber, a identidade das unidades elementares de linguagem e significação (ou seja, "palavras"), sujeita a análise rigorosa. a palavra "árvore" como a "mesma" palavra não é porque a palavra é definida por qualidades inerentes – não é uma “aglomeração mecânica” de tais qualidades – mas porque se define como um elemento de um sistema, o “todo estrutural”, da linguagem.

Tal definição relacional (ou "diacrítica") de uma entidade governa a concepção de todos os elementos da linguagem na linguística estrutural. Isso fica mais claro na realização mais impressionante da linguística saussureana, o desenvolvimento dos conceitos de "fonemas" e "características distintivas" da linguagem. Os fonemas são as menores unidades articuladas e significantes de uma língua. Não são os sons que ocorrem na linguagem, mas as "imagens sonoras" mencionadas por Saussure, que são apreendidas pelos falantes - fenomenalmente apreendidas - como portadoras de significado. (Assim, Elmar Holenstein descreve a linguística de Jakobson, que segue Saussure de maneiras importantes, como "estruturalismo fenomenológico".) . . é uma realidade fenomenológica e não empírica; não é a obra em si, mas um conjunto de relações funcionais que se localizam na consciência de um coletivo (geração, meio, etc.)" (citado em Galan 35). Da mesma forma, Lévi-Strauss, o principal porta-voz do estruturalismo francês , observou em 1960 que "a estrutura não tem conteúdo distinto; ela é o próprio conteúdo, e a organização lógica na qual ela está presa é concebida como uma propriedade do real” (167; ver também Jakobson, Fundamentals 27-28).

Os fonemas, portanto, os menores elementos perceptíveis da linguagem, não são objetos positivos, mas uma "realidade fenomenológica". Em inglês, por exemplo, o fonema /t/ pode ser pronunciado de muitas maneiras diferentes, mas em todos os casos um falante de inglês o reconhecerá como funcionando como um /t/. Um t aspirado (ou seja, um t pronunciado com uma respiração semelhante a h depois dele), um som t agudo ou grave, um som t estendido e assim por diante, todos funcionarão da mesma maneira para distinguir o significado de "to" e "do" em inglês. Além disso, as diferenças entre as línguas são tais que variações fonológicas em uma língua podem constituir fonemas distintos em outra; assim, o inglês distingue entre /l/ e /r/, enquanto outras línguas são tão estruturadas que essas articulações são consideradas variações do mesmo fonema (como o t aspirado e não aspirado em inglês). Em toda língua natural, o grande número de palavras possíveis é uma combinação de um pequeno número de fonemas. O inglês, por exemplo, possui menos de 40 fonemas que se combinam para formar mais de um milhão de palavras diferentes.

Os próprios fonemas da linguagem são estruturas de traços sistematicamente organizadas. Nas décadas de 1920 e 1930, seguindo o exemplo de Saussure, Jakobson e N. S. Trubetzkoy isolaram as "características distintivas" dos fonemas. Essas características são baseadas na estrutura fisiológica dos órgãos da fala - língua, dentes, cordas vocais, etc. Saussure menciona no Curso e que Harris descreve como "fonética fisiológica" (39; a tradução anterior de Baskin usa o termo "fonologia" [(1959) 38]) - e eles se combinam em "pacotes" de oposições binárias para formar fonemas. Por exemplo, em inglês a diferença entre /t/ e /d/ é a presença ou ausência de "voz" (o engajamento das cordas vocais), e no nível de vozeamento esses fonemas se definem reciprocamente. Dessa forma, a fonologia é um exemplo específico de uma regra geral da linguagem descrita por Saussure: Na linguagem existem apenas diferenças. ainda mais importante: uma diferença geralmente implica termos positivos entre os quais a diferença é estabelecida; mas na linguagem há apenas diferenças sem termos positivos. Quer tomemos o significado ou o significante, a linguagem não tem ideias nem sons que existiam antes do sistema linguístico. (120)

Nessa estrutura, as identidades linguísticas são determinadas não por qualidades inerentes, mas por relações sistêmicas ("estruturais").

Eu disse que a fonologia "seguiu o exemplo" de Saussure, porque embora sua análise da fisiologia da produção da linguagem "seria hoje", como diz Harris, "chamada de "física", em oposição a "psicológica" ou "funcional", "" (Leitura 49), consequentemente no Curso ele articulou a direção e os contornos de uma análise funcional da linguagem. Da mesma forma, sua única obra extensa publicada, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memória sobre o sistema primitivo de vogais nas línguas indo-europeias), que apareceu em 1878, estava totalmente inserida no projeto do século XIX. linguística histórica do século. No entanto, dentro deste trabalho, como Jonathan Culler argumentou, Saussure demonstrou "a fecundidade de pensar a linguagem como um sistema de itens puramente relacionais, mesmo quando trabalhando na tarefa de reconstrução histórica" (Saussure 66). Ao analisar as relações estruturais sistemáticas entre os fonemas para explicar os padrões de alternância vocálica nas línguas indo-européias existentes, Saussure sugeriu que, além de vários fonemas diferentes /a/, deve ter havido outro fonema que poderia ser descrito formalmente. "O que torna a obra de Saussure tão impressionante", conclui Culler, "é o fato de que quase cinquenta anos depois, quando o hitita cuneiforme foi descoberto e decifrado, descobriu-se que continha um fonema, escrito h, que se comportava como Saussure havia previsto. . Ele havia descoberto, por uma análise puramente formal, o que hoje é conhecido como laríngeos do indo-europeu" (66).

Essa concepção da determinação relacional ou diacrítica dos elementos de significação, implícita e explícita no Curso, sugere um terceiro pressuposto que rege a linguística estrutural, o que Saussure chama de "arbitrário do signo". Com isso ele quer dizer que a relação entre o significante e o significado na linguagem nunca é necessária (ou "motivada"): pode-se encontrar tão facilmente o significante sonoro arbre quanto a árvore significante para se unir ao conceito "árvore". Mas, mais do que isso, significa que o significado também é arbitrário: pode-se definir o conceito "árvore" tanto por sua qualidade lenhosa (que excluiria as palmeiras) quanto por seu tamanho (que exclui as "plantas lenhosas baixas" que chamar arbustos). Isso deve deixar claro que a numeração de pressupostos que venho apresentando não representa uma ordem de prioridade: cada pressuposto – a natureza sistêmica da significação (melhor apreendida estudando a linguagem “sincronicamente”), a natureza relacional ou “diacrítica” dos elementos da significação, a natureza arbitrária dos signos – deriva seu valor dos outros.

Ou seja, a linguística saussureana os fenômenos que estuda nas relações abrangentes de combinação e contraste na linguagem. Nessa concepção, a linguagem é tanto o processo de articulação do significado (significação) quanto seu produto (comunicação), e essas duas funções da linguagem não são idênticas nem totalmente congruentes (ver Schleifer, "Desconstrução"). Aqui, podemos ver a alternância entre forma e conteúdo que Greimas e Courtés descrevem na interpretação modernista: a linguagem apresenta contrastes que definem formalmente suas unidades, e essas unidades se combinam em níveis sucessivos para criar o conteúdo significante. Além disso, como os elementos da linguagem são arbitrários, nem o contraste nem a combinação podem ser considerados básicos. Assim, na linguagem, os traços distintivos se combinam para formar fonemas contrastantes em outro nível de apreensão, os fonemas se combinam para formar morfemas contrastantes, os morfemas se combinam para formar palavras, as palavras se combinam para formar frases e assim por diante. Em cada caso, o fonema inteiro, ou palavra, ou sentença, e assim por diante, é maior que a soma de suas partes (assim como a água, H2O, no exemplo de Saussure [(1959) 103] é mais que a aglomeração mecânica de hidrogênio e oxigênio).

Os três pressupostos do Curso de Lingüística Geral levaram Saussure a clamar por uma nova ciência do século XX que fosse além da ciência linguística para estudar "a vida dos signos na sociedade". Saussure chamou essa ciência de "semiologia (do grego semeîon "sinal")" (16). A "ciência" da semiótica, tal como passou a ser praticada no Leste Europeu nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, ampliou o estudo da linguagem e das estruturas linguísticas aos artefatos literários constituídos (ou articulados) por essas estruturas. Além disso, durante a última parte de sua carreira, mesmo enquanto oferecia os cursos de linguística geral, Saussure prosseguiu com sua própria análise "semiótica" da poesia latina tardia na tentativa de descobrir anagramas de nomes próprios deliberadamente ocultos. O método de estudo era, em muitos aspectos, o oposto do racionalismo funcional de suas análises linguísticas: tentava, como menciona Saussure em um dos 99 cadernos em que se dedicava a este estudo, examinar sistematicamente o problema do "acaso", que " torna-se o fundamento inevitável de tudo" (citado em Starobinski 101). Tal estudo, como diz o próprio Saussure, centra-se no "fato material" do acaso e do sentido (citado 101), de modo que a "palavra-tema" cujo anagrama Saussure busca, como argumenta Jean Starobinski, "é, para o poeta , um instrumento, e não um germe vital do poema. O poema é obrigado a reempregar os materiais fônicos da palavra-tema" (45). Nessa análise, diz Starobinski, "Saussure não se perdeu na busca de significados ocultos". Em vez disso, sua obra parece demonstrar um desejo de fugir de todos os problemas decorrentes da consciência: "Como a poesia não se realiza apenas em palavras, mas é algo nascido das palavras, ela escapa ao controle arbitrário da consciência para depender apenas de uma espécie de legalidade linguística "(121).

Ou seja, a tentativa de Saussure de descobrir nomes próprios na poesia latina tardia – o que Tzvetan Todorov chama de redução de uma “palavra”. . . ao seu significante” (266) – enfatiza um dos elementos que nortearam sua análise linguística, a arbitrariedade do signo. uma substância” – que elimina efetivamente a semântica como objeto principal de análise.) Como conclui Todorov, a obra de Saussure parece hoje notavelmente homogênea em sua recusa em aceitar fenômenos simbólicos. . . . Em sua pesquisa sobre anagramas, ele presta atenção apenas aos fenômenos de repetição, não aos de evocação. . . . Em seus estudos dos Nibelungos, ele reconhece símbolos apenas para atribuí-los a leituras equivocadas: como não são intencionais, os símbolos não existem. Finalmente, em seus cursos de linguística geral, ele contempla a existência da semiologia e, portanto, de outros signos que não os linguísticos; mas esta afirmação é ao mesmo tempo limitada pelo fato de que a semiologia se dedica a um único tipo de signo: aqueles que são arbitrários. (269-70)

Se isso é verdade, é porque Saussure não podia conceber a "intenção" sem sujeito; ele não conseguia escapar da oposição entre forma e conteúdo que seu trabalho tanto questionava. Em vez disso, ele recorreu à "legalidade linguística". Situada entre, por um lado, as concepções oitocentistas de história, subjetividade e o modo de interpretação causal governado por essas concepções e, por outro lado, concepções "estruturalistas" do século XX daquilo que Lévi-Strauss chamou de "kantismo sem um sujeito transcendental" (citado em Connerton 23) – conceitos que apagam a oposição entre forma e conteúdo (ou sujeito e objeto) e a hierarquia de primeiro e segundo plano no estruturalismo completo, na psicanálise e até na mecânica quântica – o trabalho de Ferdinand de Saussure em linguística e semiótica circunscreve um momento marcante no estudo do significado e da cultura.

Ronald Schleifer

Apêndice 2

Fernando de Saussure (tradução)

O linguista suíço Ferdinand de Saussure (1857-1913) é considerado o fundador da linguística moderna, graças às suas tentativas de descrever a estrutura da linguagem, em vez da história das línguas individuais e das formas das palavras. De um modo geral, as bases dos métodos estruturais em linguística e crítica literária e, em grande medida, semiótica foram lançadas em suas obras no início do século XX. Comprova-se que os métodos e conceitos do chamado "pós-estruturalismo", desenvolvidos nas obras de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros, remontam às obras linguísticas de Saussure e leituras anagramáticas da poesia romana tardia. Deve-se notar que o trabalho de Saussure sobre linguística e interpretação linguística ajuda a vincular uma ampla gama de disciplinas intelectuais, da física às inovações literárias, psicanálise e filosofia do início do século XX. A. J. Greimas e J. Kurte escrevem em Semiótica e Linguagem: “Um dicionário analítico com o título “Interpretação” como um novo tipo de interpretação surgiu no início do século XX junto com a linguística de Saussure, a fenomenologia de Husserl e a psicanálise de Freud. Nesse caso, “interpretação não é a atribuição de um conteúdo dado a uma forma que de outra forma não teria, mas sim uma paráfrase que formula de outro modo o mesmo conteúdo de um elemento significante dentro de um sistema semiótico dado” (159). ). Nessa compreensão de "interpretação", forma e conteúdo são inseparáveis; pelo contrário, cada forma é preenchida com significado semântico (“forma significativa”), de modo que a interpretação oferece uma nova e semelhante recontagem de algo significativo em outro sistema de signos.

Uma compreensão semelhante de forma e conteúdo, apresentada por Claude Lévi-Strauss em uma das principais obras do estruturalismo, ("Structure and Form: Reflections on the Works of Vladimir Propp"), pode ser vista no livro publicado postumamente por Saussure, A Course in Lingüística Geral (1916, trad., 1959, 1983). Durante sua vida, Saussure publicou pouco, "Curso" - sua principal obra - foi coletado das notas de alunos que assistiram às suas palestras sobre linguística geral em 1907-11. No Curso, Saussure pediu um estudo "científico" da linguagem, contrastando-o com a linguística histórico-comparativa do século XIX. Este trabalho pode ser considerado uma das maiores conquistas do pensamento ocidental: tomando como base as palavras individuais como elementos estruturais da linguagem, a linguística histórica (ou "diacrônica") comprovou a origem e o desenvolvimento das línguas da Europa Ocidental a partir de um língua indo-européia comum - e um proto-indo-europeu anterior.

É justamente esse estudo das ocorrências únicas das palavras, com a concomitante suposição de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos da palavra" que Saussure questionou. Seu trabalho foi uma tentativa de reduzir os muitos fatos sobre a linguagem estudados casualmente pela linguística comparativa a um pequeno número de teoremas. A escola filológica comparada do século XIX, escreve Saussure, "não conseguiu criar uma verdadeira escola de linguística" porque "não compreendia a essência do objeto de estudo" (3). Essa "essência", argumenta ele, está não apenas nas palavras individuais - as "substâncias positivas" da linguagem -, mas também nas conexões formais que ajudam essas substâncias a existir.

O "teste" de linguagem de Saussure baseia-se em três suposições. Em primeiro lugar, a compreensão científica da linguagem se baseia não em um fenômeno histórico, mas estrutural. Assim, ele distinguia entre fenômenos individuais da linguagem - "eventos de fala", que ele define como "parole" - e o próprio, em sua opinião, objeto de estudo da linguística, o sistema (código, estrutura) que controla esses eventos ( "língua"). Tal estudo sistemático, além disso, requer uma concepção "síncrona" da relação entre os elementos da linguagem em um determinado momento, em vez de um estudo "diacrônico" do desenvolvimento de uma língua ao longo de sua história.

Essa hipótese foi a precursora do que Roman Jakobson em 1929 chamaria de "estruturalismo" - uma teoria em que "qualquer conjunto de fenômenos investigados pela ciência moderna é considerado não como uma acumulação mecânica, mas como um todo estrutural em que o componente construtivo está correlacionado com a função" ("Romântico "711). Nesta passagem, Jakobson formulou a ideia de Saussure de definir a linguagem como uma estrutura, em oposição à enumeração "mecânica" dos acontecimentos históricos. Além disso, Jakobson desenvolve outro pressuposto saussureano, que se tornou o precursor da linguística estrutural: os elementos básicos da linguagem devem ser estudados em conexão não tanto com suas causas, mas com suas funções. Fenômenos e eventos separados (digamos, a história da origem de palavras indo-européias individuais) devem ser estudados não por si mesmos, mas em um sistema no qual são correlacionados com componentes semelhantes. Esta foi uma virada radical na comparação dos fenômenos com a realidade circundante, cujo significado foi comparado pelo filósofo Ernst Cassirer com "a ciência de Galileu, que transformou as idéias sobre o mundo material no século XVII". , como observam Greimas e Kurthe, muda a ideia de “interpretação”, consequentemente, as próprias explicações. presente e futuro A interpretação deixou de ser independente das intenções de uma pessoa (apesar de que as intenções podem ser impessoais, “inconscientes” no sentido freudiano da palavra).

Em sua linguística, Saussure mostra especialmente essa virada na mudança do conceito de palavra na linguística, que ele define como signo e descreve em termos de suas funções. Um sinal para ele é uma combinação de som e significado, "significado e designação" (66-67; na tradução inglesa de 1983 de Roy Harris - "significação" e "sinal"). A natureza deste composto é “funcional” (nem um nem outro elemento pode existir sem o outro); além disso, "um empresta qualidades do outro" (8). Assim, Saussure define o principal elemento estrutural da linguagem - o signo - e faz da base da linguística histórica a identidade dos signos às palavras, o que exige uma análise particularmente rigorosa. Portanto, podemos entender diferentes significados de, digamos, a mesma palavra "árvore" - não porque a palavra seja apenas um conjunto de certas qualidades, mas porque ela é definida como um elemento no sistema de signos, no "todo estrutural", na língua.

Tal conceito relativo ("diacrítico") de unidade fundamenta o conceito de todos os elementos da linguagem na linguística estrutural. Isso fica especialmente claro na descoberta mais original da linguística saussureana, no desenvolvimento do conceito de "fonemas" e "características distintivas" da linguagem. Os fonemas são a menor das unidades linguísticas faladas e significativas. Não são apenas sons que ocorrem na língua, mas "imagens sonoras", observa Saussure, que são percebidas pelos falantes nativos como tendo significado. (Ressalte-se que Elmar Holenstein chama a linguística de Jakobson, que dá continuidade às ideias e conceitos de Saussure em suas principais disposições, de "estruturalismo fenomenológico"). É por isso que o principal orador da Escola de Estruturalismo de Praga, Jan Mukarowski, observou em 1937 que “estrutura. . . não um conceito empírico, mas fenomenológico; não é o resultado em si, mas um conjunto de relações significativas da consciência coletiva (geração, outros, etc.)”. Pensamento semelhante foi expresso em 1960 por Lévi-Strauss, líder do estruturalismo francês: “A estrutura não tem conteúdo definido; é significativo em si mesmo, e a construção lógica em que está encerrado é a marca da realidade.

Por sua vez, os fonemas, como os menores elementos linguísticos aceitáveis para a percepção, representam uma "realidade fenomenológica" integral separada. Por exemplo, em inglês, o som "t" pode ser pronunciado de maneira diferente, mas em todos os casos, uma pessoa que fala inglês o perceberá como "t". Aspirado, levantado ou abaixado, um "t" longo e similares distinguirão igualmente o significado das palavras "para" e "fazer". Além disso, as diferenças entre as línguas são tais que variedades de um som em uma língua podem corresponder a diferentes fonemas em outra; por exemplo, "l" e "r" em inglês são diferentes, enquanto em outros idiomas são variedades do mesmo fonema (como o inglês "t", pronunciado com e sem aspiração). O vasto vocabulário de qualquer língua natural é um conjunto de combinações de um número muito menor de fonemas. Em inglês, por exemplo, apenas 40 fonemas são usados para pronunciar e escrever cerca de um milhão de palavras.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nos anos 1920-1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as “características distintivas” dos fonemas. Essas características são baseadas na estrutura dos órgãos da fala - língua, dentes, cordas vocais - Saussure observa isso no "Curso de Lingüística Geral", e Harris chama isso de "fonética fisiológica" (na tradução anterior de Baskin, o termo "fonologia " é usado) - eles estão conectados em "nós » durg contra um amigo para fazer sons. Por exemplo, em inglês, a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

Já mencionei que a fonologia em seu desenvolvimento se baseou nas ideias de Saussure. Embora sua análise da fisiologia linguística nos tempos modernos, diz Harris, "fosse chamada de 'física', em oposição a 'psicológica' ou 'funcional', em The Course ele articulou claramente a direção e os princípios básicos da análise funcional da linguagem. Seu único trabalho publicado durante sua vida, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Notas sobre o sistema vocálico original nas línguas indo-europeias), publicado em 1878, estava completamente alinhado com a linguística histórica comparativa do século 19. Não obstante, nesta obra, diz Jonathan Culler, Saussure mostrou “a fecundidade da ideia de linguagem como um sistema de fenômenos interligados, mesmo com sua reconstrução histórica”. Analisando a relação entre os fonemas, explicando a alternância de vogais nas línguas modernas do grupo indo-europeu, Saussure sugeriu que além de vários sons diferentes "a", deve haver outros fonemas que são descritos formalmente. “O que marca especialmente a obra de Saussure”, conclui Kaller, “é que quase 50 anos depois, quando o cuneiforme hitita foi descoberto e decifrado, foi encontrado um fonema, na escrita denotada por “h”, que se comportou como Saussure previu. Através da análise formal, ele descobriu o que hoje é conhecido como som gutural nas línguas indo-européias.

No conceito de uma definição relativa (diacrítica) dos signos, tanto explícitos quanto implícitos no Curso, há um terceiro pressuposto-chave da linguística estrutural, chamado por Saussure de "natureza arbitrária do signo". Com isso se quer dizer que a relação entre som e significado na linguagem não é motivada por nada: pode-se facilmente conectar a palavra "arbre" e a palavra "árvore" com o conceito de "árvore". Além disso, isso significa que o som também é arbitrário: você pode definir o conceito de "árvore" pela presença de sua casca (exceto palmeiras) e por tamanho (exceto "plantas lenhosas baixas" - arbustos). A partir disso, deve ficar claro que todos os pressupostos que apresento não são divididos em mais e menos importantes: cada um deles - a natureza sistêmica dos signos (mais compreensíveis no estudo "síncrono" da língua), seu relativo (diacrítico) essência, a natureza arbitrária dos signos - vem do resto.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras (designação) e seu resultado (comunicação) - e essas duas funções nunca coincidem (veja "Desconstrução da linguagem" de Shleifer). Podemos ver a alternância de forma e conteúdo que Greimas e Kurte descrevem na versão mais recente da interpretação: os contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem em níveis sucessivos para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que em uma língua, traços distintivos formam um contraste fonético em um nível diferente de compreensão, fonemas são combinados em morfemas contrastantes, morfemas em palavras, palavras em frases, etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que a soma de suas partes (assim como a água, no exemplo de Saussure, é mais do que a combinação de hidrogênio e oxigênio).

Os três pressupostos do “Curso de Linguística Geral” levaram Saussure à ideia de uma nova ciência do século XX, separada da linguística, estudando a “vida dos signos na sociedade”. Saussure chamou essa ciência de semiologia (do grego "semeîon" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, expandiu o estudo da linguagem e das estruturas linguísticas em descobertas literárias compostas (ou formuladas) com a ajuda dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era em muitos aspectos o oposto do racionalismo em sua análise linguística: era uma tentativa, como escreve Saussure em um dos 99 cadernos, de estudar no sistema o problema da "probabilidade", que "torna-se a base de tudo. " Tal investigação, afirma o próprio Saussure, ajuda a focalizar o "lado real" da probabilidade; A “palavra-chave” para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, “uma ferramenta para o poeta, e não a fonte de vida para o poema. O poema serve para inverter os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras, é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela extrapola o controle da consciência e depende apenas de as leis da linguagem”.

A tentativa de Saussure de estudar nomes próprios na poesia romana tardia (Tsvetan Todorov chamou isso de abreviação de "uma palavra... a essência formal da linguística saussureana ("Linguagem", argumenta ele, "a essência da forma, não do fenômeno"), que exclui a possibilidade de analisar o significado. Todorov conclui que hoje os escritos de Saussure parecem notavelmente consistentes em sua relutância em estudar símbolos [fenômenos que têm um significado bem definido]. . . . Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Entre, por um lado, os conceitos oitocentistas baseados na história e nas conjecturas subjetivas, e os métodos de interpretação acidental baseados nesses conceitos, e, por outro lado, os conceitos estruturalistas que Lévi-Strauss chamou de "kantismo sem transcendência". ator" - apagando a oposição entre forma e conteúdo (sujeito e objeto), significado e origem no estruturalismo, na psicanálise e até na mecânica quântica, os escritos de Ferlinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Ronald Shleifer

Literatura

1. Admoni V.G. Fundamentos da teoria da gramática / V.G. Admoni; Academia de Ciências da URSS.-M.: Nauka, 1964.-104p.

4. Arnold I.V. A estrutura semântica da palavra no inglês moderno e a metodologia para seu estudo. /4. Arnold - L.: Educação, 1966. - 187 p.

6. Bashlykov A.M. Sistema de tradução automática. / SOU. Bashlykov, A. A. Sokolov. - M.: FIMA LLC, 1997. - 20 p.

7.Baudouin de Courtenay: Patrimônio teórico e modernidade: Resumos dos relatórios da conferência científica internacional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Linguagem e estatística. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Lingüística teórica e aplicada. / V. A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semântica. Sintaxe. Morfologia. // V. B. Kasevich-M., 1988. - 292 p.

12. Lekomtsev Yu.K. Introdução à linguagem formal da linguística / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 p., il.

13. Legado linguístico de Baudouin de Courtenay no final do século XX: Resumos dos relatórios da conferência científica e prática internacional de 15 a 18 de março de 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Significados gramaticais ocultos e identificação da pessoa social (“retrato”) do falante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Experiência na construção de modelos linguísticos "Significado<-->Texto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Tradução e linguística aplicada / L.L. Nelyubin. - M. : Escola superior, 1983. - 207 p.

16. Sobre os métodos exatos de pesquisa linguística: sobre a chamada "linguística matemática" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e outros - M., 1961. - 162 p.

17. Piotrovsky L.G. Lingüística Matemática: Livro Didático / L.G. Piotrovsky, K. B. Bektaev, A. A. Piotrovskaya. - M.: Escola superior, 1977. - 160 p.

18. Ele é. Texto, máquina, pessoa. - L., 1975. - 213 p.

19. Ele é. Lingüística Aplicada / Ed. A. S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelos de linguagem. M., 1963. Revzin, I.I. Lingüística Estrutural Moderna. Problemas e métodos. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Fundamentos de tradução geral e automática / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. A teoria de F. de Saussure à luz da linguística moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Coruja, L.Z. Lingüística Analítica / L.Z. Coruja - M., 1970. - 192 p.

24. Saussure F. de. Notas sobre Lingüística Geral / F. de Saussure; Por. de fr. – M.: Progresso, 2000. – 187 p.

25. Ele é. Curso de Lingüística Geral / Per. de fr. - Ecaterimburgo, 1999. -426 p.

26. Estatísticas de fala e análise automática de texto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lógica. Teorias axiomáticas. / R. Stoll; Por. do inglês. - M., 1968. - 180 p.

28. Tenier, L. Fundamentos da sintaxe estrutural. M., 1988.

29. Ubin I.I. Automação das atividades de tradução na URSS / I.I. Ubin, L. Yu. Korostelev, B. D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Processamento de informações conceituais. M., 1980.

32. Shikhanovich, Yu.A. Introdução à matemática moderna (conceitos iniciais). M., 1965

33. Shcherba L.V. Vogais russas em termos qualitativos e quantitativos / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cidadão do mundo // Ogonyok - 1996. - No. 5. – p.13

35. V.A. Uspensky. Preliminar para os leitores da "New Literary Review" às mensagens semióticas de Andrei Nikolaevich Kolmogorov. - Uma nova revisão literária. –1997. - Nº 24. - S. 18-23

36. Perlovsky L. Consciência, linguagem e cultura. - Conhecimento é poder. –2000. Nº 4 - S. 20-33

37. Frumkina R.M. Sobre nós - obliquamente. // Jornal Russo. - 2000. - Nº 1. – página 12

38. Fitialov, S.Ya. Sobre Modelagem de Sintaxe em Linguística Estrutural // Problemas de Linguística Estrutural. M., 1962.

39. Ele é. Sobre a equivalência de gramática NN e gramática de dependência // Problemas de Linguística Estrutural. M., 1967.

40. Chomsky, N. Fundamentos lógicos da teoria linguística // Novo em linguística. Questão. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. pressione. jhu.ru

46. en.wikipedia.org

Anastasia Anufrieva, Mikhail Ivlev, Vsevolod Miroshnikov, Ekaterina Artyukh

O trabalho dos alunos do 5º ano. Projeto de pesquisa: "Linguística Matemática". Trabalho de grupo sobre disciplinas - matemática e língua estrangeira.

Download:

Visualização:

Departamento Principal de Educação da Prefeitura de Novosibirsk

Palácio da Criatividade para Crianças e Estudantes "Junior"

Concurso aberto da cidade de projetos de pesquisa

alunos do 5º ao 8º ano

Direção: projeto matemático-natural

Lingüística matemática

Ivlev, Mikhail

Miroshnikov Vsevolod,

Artyukh Ekaterina

MBOUSOSH №26, 5ª série

Distrito de Kalininsky de Novosibirsk

Consultores do projeto:Yasyurenko Maya Dmitrievna,

Professor de matemática e informática,

Sevastyanova Tatyana Sergeevna,

professor de inglês

I categoria de qualificação.

Telefones de contato dos gerentes:

8-952-924-02-66 (Yasyurenko M.D.)

8-913-896-81-77 (Sevastyanova T.S.)

Novosibirsk 2013

Projeto: "Linguística Matemática"

Participantes do projeto:Anufrieva Anastasia, Ivlev Mikhail, Miroshnikov Vsevolod, Artyukh Ekaterina.

Consultores do projeto:Yasyurenko Maya Dmitrievna, professor de matemática e informática. Sevastyanova Tatyana Sergeevna, professora de inglês I

categoria de qualificação.

Grau: 5A

Nome, número da instituição de ensino onde o projeto foi realizado:MBOUSOSH №26, distrito de Kalininsky, cidade de Novosibirsk

Área de estudo:matemática, língua estrangeira.

Tempo do projeto:Novembro de 2012 - Fevereiro de 2013 (longo prazo)

Objetivo do projeto: busca de um terreno comum entre matemática e linguística.

Tarefas:

Conheça a história do desenvolvimento da matemática e a formação da linguística.
Encontre exemplos individuais da aplicação da matemática na linguística.
Estudar as perspectivas de aplicação de métodos matemáticos em linguística. Tire conclusões.

Tipo de projeto (por tipo de atividade):pesquisar, pesquisar

Tecnologias usadas: multimídia

Formulário do produto do projeto:"Linguística Matemática" (apresentação multimídia).

Estudar:

- seleção e estudo de material teórico sobre o tema;

- processamento das informações recebidas;

- determinação das perspectivas de aplicação de métodos matemáticos em linguística.

Escopo do resultado do projeto:educacional (matemática, língua estrangeira).

Introdução……………………………………………………………………………..2

Capítulo 1. A história da aplicação de métodos matemáticos em linguística

1.1. História da matemática………………………………………………………….3

1.2. Formação da linguística……………………………………………………4

1.3. Lingüística matemática……………………………………………….8

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1. Aprender uma língua por métodos de lógica formal…………………………11

2.2. Perspectivas para a aplicação de métodos matemáticos em linguística ...... 13

Conclusão……………………………………………………………………… 14

Literatura…………………………………………………………………… 15

Introdução.

No século XX, houve uma tendência à interação e interpenetração de vários campos do conhecimento. As fronteiras entre as ciências individuais são gradualmente borradas; há cada vez mais ramos da atividade mental que estão "na junção" do conhecimento humanitário, técnico e das ciências naturais.

Outra característica óbvia da modernidade é o desejo de estudar as estruturas e seus elementos constituintes. Portanto, um lugar crescente, tanto na teoria científica quanto na prática, é dado à matemática. A matemática penetra cada vez mais profundamente naquelas áreas que por muito tempo foram consideradas puramente “humanitárias”, ampliando seu potencial heurístico (a resposta à pergunta “quanto” muitas vezes ajuda a responder às perguntas “o quê” e “como”). A linguística não foi exceção.

O objetivo do nosso trabalho é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a encontrar aplicação na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Os linguistas enfrentaram a questão: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. O filósofo alemão, linguista Friedrich Schlegel observou a interação da linguagem e da consciência, e o proeminente linguista do início do século XX, Ferdinand de Saussure, ligou a estrutura da língua ao seu pertencimento ao povo. A interação da matemática e da linguística é um tema multifacetado, e em nosso trabalho não nos deteremos em todos, mas, antes de tudo, em seus aspectos aplicados.

Capítulo 1. A história da aplicação de métodos matemáticos em linguística.

1.1. História da matemática.

Na história matemáticaTradicionalmente, existem várias etapas no desenvolvimento do conhecimento matemático:

Formação do conceitofigura geométrica e números como idealizaçãoobjetos reais e conjuntos de objetos homogêneos. O surgimento da contagem e medição, que tornou possível comparar diferentes números, comprimentos, áreas e volumes.
A invenção das operações aritméticas. Acumulação empiricamente (por tentativa e erro) de conhecimento sobre as propriedades das operações aritméticas, sobre métodos de medição de áreas evolumesfiguras e corpos simples. Progressos foram feitos nesta direçãoBabilônico sumério, chinês e indianomatemática antiga.
Aparência em Grécia antigaum sistema matemático dedutivo que mostrava como obter novas verdades matemáticas com base nas existentes. O coroamento da matemática grega antiga foi"Começos" de Euclides, que desempenhou o papel de padrão de rigor matemático por dois milênios.
Matemáticos dos países do Islãnão só preservaram conquistas antigas, mas também foram capazes de sintetizá-las com as descobertas dos matemáticos indianos, que na teoria dos números avançaram mais do que os gregos.
Nos séculos XVI-XVIII, a matemática européia renasce e vai muito além. Sua base conceitual nesse período foi a crença de que os modelos matemáticos são uma espécie de esqueleto ideal do Universo e, portanto, a descoberta de verdades matemáticas é ao mesmo tempo a descoberta de novas propriedades do mundo real. O principal sucesso nesse caminho foi o desenvolvimento de modelos matemáticos de dependência de variáveis (função) e a teoria geral do movimento (análise infinitesimal). Todas as ciências naturais foram reconstruídas com base em modelos matemáticos recém-descobertos, e isso levou a uma colossalprogresso.
Nos séculos XIX e XX, fica claro que a relação entre matemática e realidade está longe de ser tão simples quanto parecia antes. Não há resposta universalmente aceita para o tipo de "questão básica da filosofia da matemática": encontrar a causa da "incompreensível eficácia da matemática nas ciências naturais". A este respeito, e não apenas a este respeito, os matemáticos dividiram-se em muitas escolas de debate. Surgiram várias tendências perigosas: especialização excessivamente estreita, isolamento de problemas práticos, etc. Ao mesmo tempo, o poder da matemática e seu prestígio, apoiados pela eficácia de sua aplicação, são altos como nunca.

Além de grande interesse histórico, a análise da evolução da matemática é de grande importância para o desenvolvimentofilosofia e metodologiamatemática. Muitas vezes, o conhecimento da história também contribui para o progresso de disciplinas matemáticas específicas; por exemplo, antigoproblema chinês (teorema) sobre restosfez uma seção inteiraTeoria dos Números.

Justificação da matemática

No início do século 19, apenas a geometria euclidiana tinha uma justificação lógica (dedutiva) relativamente estrita, embora mesmo assim seu rigor fosse corretamente considerado insuficiente. Propriedades de novos objetos (por exemplo,números complexos, infinitesimaletc.) eram simplesmente considerados basicamente iguais aos de objetos já conhecidos; se tal extrapolação fosse impossível, as propriedades eram selecionadas empiricamente.

Augustin Louis Cauchy

A construção dos fundamentos da matemática começou com a análise. NO1821Cauchypublicou "Análise Algébrica", onde definiu claramente os conceitos básicos baseados no conceito de limite. No entanto, cometeu vários erros, por exemplo, integrou e diferenciou as séries termo a termo, sem provar a admissibilidade de tais operações. Completou a base da análiseWeierstrass, que esclareceu o papel de um importante conceitocontinuidade uniforme. Simultaneamente Weierstrass (1860) eDedekind(1870) deu uma justificativa para a teorianumeros reais.

Legendas dos slides:

Lingüística Matemática Autores: Anastasia Anufrieva, Mikhail Ivlev, Vsevolod Miroshnikov, Ekaterina Artyukh MBOUSOSH#26, 5ª série Kalininsky distrito de Novosibirsk Consultores do projeto: Maya Dmitrievna Yasyurenko, professora de matemática e informática, Tatyana Sergeevna Sevastyanova, professora de inglês, categoria de qualificação I.

O objetivo do projeto: buscar um terreno comum entre matemática e linguística.

Objetivos do projeto: Conhecer a história do desenvolvimento da matemática e da formação da linguística. Encontre exemplos individuais da aplicação da matemática na linguística. Estudar as perspectivas de aplicação de métodos matemáticos em linguística. Tire conclusões.

Etapas de desenvolvimento do conhecimento matemático: Formação do conceito de figura geométrica e número como idealização de objetos reais e conjuntos de objetos homogêneos. O surgimento da contagem e medição, que tornou possível comparar diferentes números, comprimentos, áreas e volumes.

A invenção das operações aritméticas. O surgimento do sistema matemático dedutivo na Grécia antiga. Os matemáticos dos países do Islã não apenas preservaram as antigas conquistas, mas também foram capazes de sintetizá-las com as descobertas dos matemáticos indianos, que avançaram mais do que os gregos na teoria dos números.

Nos séculos XVI-XVIII, a matemática européia renasce e vai muito além. Nos séculos XIX e XX, fica claro que a relação entre matemática e realidade está longe de ser tão simples quanto parecia antes.

Augustin Louis Cauchy

A história da linguística em seu desenvolvimento passou por 5 períodos. 1 período - 5-4 séculos. BC. - Séculos XVI. 2 período - séculos XVII-XVIII. 3º período - final do século XVIII - primeira metade do século XIX. 4º período - o período da aprendizagem sistêmica de línguas - o final do século XIX - o primeiro terço do século XX. 5 período - anos 30 do século XX. Até agora.

Lingüística matemática: estuda as características da modelagem semiótica e matemática da linguagem natural (e da fala) para traduzir informações contidas de forma informal em um texto em uma linguagem artificial formalizada (por exemplo, em alguma linguagem de informação) com base em tal aparato matemático como teoria dos conjuntos e relações algébricas, teoria dos conjuntos fuzzy e variáveis linguísticas, teoria das probabilidades e estatística matemática, bem como elementos da teoria da informação. Intimamente relacionado à linguística de engenharia. Ramo da linguística que estuda as possibilidades de aplicação de métodos matemáticos ao estudo e descrição de uma língua.

Uma metalinguagem é uma linguagem usada para expressar julgamentos sobre outra linguagem, a linguagem-objeto. Com a ajuda de uma metalinguagem, eles estudam a estrutura das combinações de caracteres (expressões) da linguagem-objeto, provam teoremas sobre suas propriedades expressivas, sobre sua relação com outras linguagens, etc.

Índice
Introdução
Capítulo 1. A história da aplicação de métodos matemáticos em linguística
1.1. A formação da linguística estrutural na virada dos séculos XIX-XX
1.2. Aplicação de métodos matemáticos em linguística na segunda metade do século XX.
Capítulo 2. Exemplos selecionados do uso da matemática na linguística
2.1. Tradução automática
2.2. Métodos estatísticos na aprendizagem de línguas
2.3. Aprender uma língua por métodos de lógica formal
2.4. Perspectivas para a aplicação de métodos matemáticos em linguística
Conclusão
Literatura
Apêndice 1. Ronald Schleifer. Fernando de Saussure
Apêndice 2. Ferdinand de Saussure (tradução)

Introdução
No século XX, houve uma tendência contínua para a interação e interpenetração de vários campos do conhecimento. As fronteiras entre as ciências individuais são gradualmente borradas; há cada vez mais ramos da atividade mental que estão "na junção" do conhecimento humanitário, técnico e das ciências naturais.
Outra característica óbvia da modernidade é o desejo de estudar as estruturas e seus elementos constituintes. Portanto, um lugar crescente, tanto na teoria científica quanto na prática, é dado à matemática. Entrando em contato, por um lado, com a lógica e a filosofia, por outro, com a estatística (e, consequentemente, com as ciências sociais), a matemática penetra cada vez mais profundamente naquelas áreas que por muito tempo foram consideradas puramente “humanitários”, ampliando seu potencial heurístico (a resposta à pergunta “quanto” muitas vezes ajudará a responder às perguntas “o quê” e “como”). A linguística não foi exceção.
O objetivo do meu trabalho de curso é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Desde a década de 1950, a matemática tem sido usada na linguística para criar um aparato teórico para descrever a estrutura das línguas (naturais e artificiais). No entanto, deve-se dizer que não encontrou imediatamente essa aplicação prática para si. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a encontrar aplicação na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Os linguistas enfrentaram a questão: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). Alguns cientistas dos últimos anos acreditam que a expressão em si não pode ser elevada à categoria de termo, pois não significa nenhuma “linguística” especial, mas apenas um novo direcionamento voltado para o aprimoramento, aumento da precisão e confiabilidade dos métodos de pesquisa linguística . A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. Até mesmo Schlegel notou a interação da linguagem e da consciência, e Ferdinand de Saussure, um linguista proeminente do início do século XX (falarei sobre sua influência no desenvolvimento de métodos matemáticos em linguística mais tarde), conectou a estrutura da linguagem com seu pertencimento. ao povo. O pesquisador moderno L. Perlovsky vai além, identificando as características quantitativas da língua (por exemplo, o número de gêneros, casos) com as peculiaridades da mentalidade nacional (mais sobre isso na Seção 2.2, "Métodos Estatísticos em Lingüística").
A interação da matemática e da linguística é um tema multifacetado, e em meu trabalho não me deterei em tudo, mas, antes de tudo, em seus aspectos aplicados.

Capítulo I. História da Aplicação de Métodos Matemáticos em Lingüística
1.1 A formação da linguística estrutural na virada dos séculos XIX-XX
A descrição matemática da linguagem é baseada na ideia de linguagem como mecanismo, que remonta ao famoso linguista suíço do início do século XX, Ferdinand de Saussure.
O elo inicial de seu conceito é a teoria da linguagem como um sistema composto por três partes (a própria linguagem é Língua, Fala - senha, e atividade de fala - Língua), em que cada palavra (membro do sistema) é considerada não em si mesma, mas em conexão com outros membros. Como outro linguista proeminente, o dinamarquês Louis Hjelmslev, observou mais tarde, Saussure "foi o primeiro a exigir uma abordagem estrutural da linguagem, isto é, uma descrição científica da linguagem registrando as relações entre as unidades".
Compreendendo a linguagem como uma estrutura hierárquica, Saussure foi o primeiro a colocar o problema do valor e do significado das unidades linguísticas. Fenômenos e eventos separados (digamos, a história da origem de palavras indo-européias individuais) devem ser estudados não por si mesmos, mas em um sistema no qual são correlacionados com componentes semelhantes.
A unidade estrutural da linguagem de Saussure considerava a palavra, "signo", na qual se combinavam som e significado. Nenhum desses elementos existe um sem o outro: portanto, o falante nativo entende os vários matizes do significado de uma palavra polissemântica como um elemento separado no todo estrutural, na língua.
Assim, na teoria de F. de Saussure pode-se ver a interação da linguística, por um lado, com a sociologia e a psicologia social (note-se que, ao mesmo tempo, a fenomenologia de Husserl, a psicanálise de Freud, a teoria da relatividade de Einstein eram desenvolvendo, experimentavam-se a forma e o conteúdo na literatura, na música e nas artes plásticas), por outro lado, com a matemática (o conceito de consistência corresponde ao conceito algébrico de linguagem). Tal conceito mudou o conceito de interpretação linguística como tal: os fenômenos passaram a ser interpretados não em relação às causas de sua ocorrência, mas em relação ao presente e ao futuro. A interpretação deixou de ser independente das intenções de uma pessoa (apesar do fato de que as intenções podem ser impessoais, "inconscientes" no sentido freudiano da palavra).
O funcionamento do mecanismo linguístico se manifesta através da atividade de fala dos falantes nativos. O resultado da fala são os chamados "textos corretos" - sequências de unidades de fala que obedecem a determinados padrões, muitos dos quais permitem a descrição matemática. A teoria das formas de descrever a estrutura sintática trata do estudo de métodos para a descrição matemática de textos corretos (principalmente sentenças). Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).
As ideias de Saussure foram desenvolvidas no Ocidente pelos contemporâneos mais jovens do grande linguista suíço: na Dinamarca - L. Hjelmslev, já mencionado por mim, que deu origem à teoria algébrica da linguagem em sua obra "Fundamentos da Teoria Linguística", no EUA - E. Sapir, L. Bloomfield, C. Harris, na República Tcheca - cientista-emigrante russo N. Trubetskoy.
As regularidades estatísticas no estudo da linguagem começaram a ser tratadas por ninguém menos que o fundador da genética, Georg Mendel. Foi somente em 1968 que os filólogos descobriram que, nos últimos anos de sua vida, ele era fascinado pelo estudo dos fenômenos linguísticos usando os métodos da matemática. Mendel trouxe esse método para a linguística da biologia; na década de 1990, apenas os linguistas e biólogos mais ousados afirmavam a viabilidade de tal análise. Nos arquivos do mosteiro de S. Tomasz em Brno, cujo abade era Mendel, foram encontradas folhas com colunas de sobrenomes terminadas em "mann", "bauer", "mayer", e com algumas frações e cálculos. Em um esforço para descobrir as leis formais da origem dos nomes de família, Mendel faz cálculos complexos, nos quais leva em conta o número de vogais e consoantes na língua alemã, o número total de palavras que considera, o número de sobrenomes, etc.
Em nosso país, a linguística estrutural começou a se desenvolver mais ou menos na mesma época que no Ocidente - na virada dos séculos 19 para 20. Simultaneamente com F. de Saussure, o conceito de linguagem como sistema foi desenvolvido em seus trabalhos por professores da Universidade de Kazan F.F. Fortunatov e I.A. Baudouin de Courtenay. Este último correspondeu por muito tempo com de Saussure, respectivamente, as escolas de linguística de Genebra e Kazan colaboraram entre si. Se Saussure pode ser chamado de ideólogo dos métodos "exatos" em linguística, então Baudouin de Courtenay lançou as bases práticas para sua aplicação. Ele foi o primeiro a separar a linguística (como exato uma ciência que usa métodos estatísticos e dependência funcional) da filologia (uma comunidade de disciplinas humanitárias que estudam a cultura espiritual através da linguagem e da fala). O próprio cientista acreditava que "a linguística pode ser útil em um futuro próximo, apenas libertada da união obrigatória com a filologia e a história literária" . A fonologia tornou-se o "campo de testes" para a introdução de métodos matemáticos na linguística - os sons como "átomos" do sistema linguístico, tendo um número limitado de propriedades facilmente mensuráveis, eram o material mais conveniente para métodos formais e rigorosos de descrição. A fonologia nega a existência de significado no som, de modo que o fator "humano" foi eliminado nos estudos. Nesse sentido, os fonemas são como objetos físicos ou biológicos.
Os fonemas, como os menores elementos linguísticos aceitáveis para a percepção, representam uma esfera separada, uma "realidade fenomenológica" separada. Por exemplo, em inglês, o som "t" pode ser pronunciado de maneira diferente, mas em todos os casos, uma pessoa que fala inglês o perceberá como "t". O principal é que o fonema desempenhará sua função principal - semântica -. Além disso, as diferenças entre as línguas são tais que variedades de um som em uma língua podem corresponder a diferentes fonemas em outra; por exemplo, "l" e "r" em inglês são diferentes, enquanto em outros idiomas são variedades do mesmo fonema (como o inglês "t", pronunciado com ou sem aspiração). O vasto vocabulário de qualquer língua natural é um conjunto de combinações de um número muito menor de fonemas. Em inglês, por exemplo, apenas 40 fonemas são usados para pronunciar e escrever cerca de um milhão de palavras.
Os sons de uma língua são um conjunto de características sistematicamente organizado. Nos anos 1920-1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as “características distintivas” dos fonemas. Esses recursos são baseados na estrutura dos órgãos da fala - língua, dentes, cordas vocais. Por exemplo, em inglês a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.
Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras e um meio de comunicação, e essas duas funções nunca coincidem. Podemos notar a alternância de forma e conteúdo: contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que em uma língua, traços distintivos formam um contraste fonético em um nível diferente de compreensão, fonemas são combinados em morfemas, morfemas em palavras, palavras em frases, etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que apenas a soma de suas partes.
Saussure propôs a ideia de uma nova ciência do século XX, separada da linguística, estudando o papel dos signos na sociedade. Saussure chamou essa ciência de semiologia (do grego "semeîon" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nos anos 1920-1930 e em Paris nos anos 1950-1960, expandiu o estudo da linguagem e das estruturas linguísticas em descobertas literárias compostas (ou formuladas) com a ajuda dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era, em muitos aspectos, o oposto do racionalismo em sua análise linguística: era uma tentativa de estudar em um sistema o problema da "probabilidade" na linguagem. Tal pesquisa ajuda a focalizar o "lado real" da probabilidade; a "palavra-chave" para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, "uma ferramenta para o poeta, não a fonte da vida do poema". O poema serve para trocar os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela ultrapassa o controle da consciência e depende apenas de as leis da linguagem” (ver . Apêndice 1).
A tentativa de Saussure de estudar os nomes próprios na poesia romana tardia enfatiza um dos componentes de sua análise linguística - a natureza arbitrária dos signos, bem como a essência formal da linguística de Saussure, que exclui a possibilidade de analisar o significado. Todorov conclui que hoje as obras de Saussure parecem ser extremamente consistentes em sua relutância em estudar os símbolos de um fenômeno que tem um significado claramente definido [Apêndice 1]. Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.
Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação aleatória baseados nesses conceitos, e, por outro lado, conceitos estruturalistas que apagam a oposição entre forma e conteúdo (sujeito e objeto) , significado e origens no estruturalismo, na psicanálise e até na mecânica quântica, os escritos de Ferdinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.
Cientistas russos também foram representados no Primeiro Congresso Internacional de Linguistas em Haia em 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy fizeram um relatório que examinou a estrutura hierárquica da linguagem - no espírito das ideias mais modernas para o início do século passado. Jakobson em seus escritos desenvolveu as ideias de Saussure de que os elementos básicos de uma língua devem ser estudados, antes de tudo, em relação às suas funções, e não às razões de sua ocorrência.
Infelizmente, depois que Stalin chegou ao poder em 1924, a linguística russa, como muitas outras ciências, foi rechaçada. Muitos cientistas talentosos foram forçados a emigrar, foram expulsos do país ou morreram em campos. Foi somente em meados da década de 1950 que um certo pluralismo de teorias se tornou possível – mais sobre isso na Seção 1.2.
1.2 Aplicação de métodos matemáticos em linguística na segunda metade do século XX
Em meados do século XX, quatro escolas linguísticas mundiais se formaram, cada uma das quais acabou sendo o ancestral de um certo método “exato”. Escola Fonológica de Leningrado(seu ancestral foi aluno de Baudouin de Courtenay L.V. Shcherba) usou um experimento psicolinguístico baseado na análise da fala de falantes nativos como o principal critério para generalizar o som na forma de um fonema.
Cientistas Círculo Linguístico de Praga, em particular, seu fundador N.S. Trubetskoy, que emigrou da Rússia, desenvolveu a teoria das oposições - a estrutura semântica da língua foi descrita por eles como um conjunto de unidades semânticas construídas opositivamente - Sem. Essa teoria foi aplicada no estudo não apenas da linguagem, mas também da cultura artística.
Ideólogos Descritivismo americano foram os linguistas L. Bloomfield e E. Sapir. A linguagem foi apresentada aos descritivistas como um conjunto de enunciados de fala, objeto principal de seu estudo. Seu foco estava nas regras de descrição científica (daí o nome) dos textos: o estudo da organização, disposição e classificação de seus elementos. A formalização de procedimentos analíticos no campo da fonologia e da morfologia (desenvolvimento de princípios para o estudo da linguagem em diferentes níveis, análise distributiva, método dos constituintes diretos etc.) levou à formulação de questões gerais de modelagem linguística. A desatenção ao plano do conteúdo da linguagem, bem como ao lado paradigmático da linguagem, não permitiu que os descritivistas interpretassem a linguagem como um sistema suficientemente completo.

A formação da linguística estrutural na virada dos séculos XIX-XX. Métodos estatísticos na aprendizagem de línguas. Aplicação de métodos matemáticos em linguística na segunda metade do século XX. Aprender a língua por métodos de lógica formal. Características da tradução automática.

INTRODUÇÃO

Capítulo 1. A história da aplicação de métodos matemáticos em linguística

1.1. A formação da linguística estrutural na virada dos séculos XIX-XX

1.2. Aplicação de métodos matemáticos em linguística na segunda metade do século XX.

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1. Tradução automática

2.2. Métodos estatísticos na aprendizagem de línguas

2.3. Aprender uma língua por métodos de lógica formal

2.4. Perspectivas para a aplicação de métodos matemáticos em linguística

Conclusão

Literatura

Apêndice 1. Ronald Schleifer. Fernando de Saussure

Apêndice 2. Ferdinand de Saussure (tradução)

INTRODUÇÃO

O objetivo do meu trabalho de curso é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Desde a década de 1950, a matemática tem sido usada na linguística para criar um aparato teórico para descrever a estrutura das línguas (naturais e artificiais). Ao mesmo tempo, deve-se dizer que não encontrou imediatamente essa aplicação prática para si. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a encontrar aplicação na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Os linguistas enfrentaram a questão: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). Alguns cientistas dos últimos anos acreditam que a expressão em si não pode ser elevada à categoria de termo, pois não significa nenhuma “linguística” especial, mas apenas um novo direcionamento voltado para o aprimoramento, aumento da precisão e confiabilidade dos métodos de pesquisa linguística . A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. Até mesmo Schlegel notou a interação da linguagem e da consciência, e Ferdinand de Saussure, um linguista proeminente do início do século XX (falarei sobre sua influência no desenvolvimento de métodos matemáticos em linguística mais tarde), conectou a estrutura da linguagem com seu pertencimento. ao povo. O pesquisador moderno L. Perlovsky vai além, identificando as características quantitativas da língua (por exemplo, o número de gêneros, casos) com as peculiaridades da mentalidade nacional (mais sobre isso na Seção 2.2, "Métodos Estatísticos em Lingüística").

A interação da matemática e da linguística é um tema multifacetado, e em meu trabalho não me deterei em tudo, mas, antes de tudo, em seus aspectos aplicados.

Capítulo IHistória da aplicação de métodos matemáticos em linguística

1.1 Formação da linguística estruturalna virada dos séculos XIX-XX

A descrição matemática da linguagem é baseada na ideia de linguagem como mecanismo, que remonta ao famoso linguista suíço do início do século XX, Ferdinand de Saussure.

Assim, na teoria de F. de Saussure pode-se ver a interação da linguística, por um lado, com a sociologia e a psicologia social (note-se que, ao mesmo tempo, a fenomenologia de Husserl, a psicanálise de Freud, a teoria da relatividade de Einstein eram desenvolvendo, experimentavam-se a forma e o conteúdo na literatura, na música e nas artes plásticas), por outro lado, com a matemática (o conceito de sistemicidade corresponde ao conceito algébrico de linguagem). Tal conceito mudou o conceito de interpretação linguística como tal: os fenômenos passaram a ser interpretados não em relação às causas de sua ocorrência, mas em relação ao presente e ao futuro. A interpretação deixou de ser independente das intenções de uma pessoa (apesar do fato de que as intenções podem ser impessoais, "inconscientes" no sentido freudiano da palavra).

O funcionamento do mecanismo linguístico se manifesta através da atividade de fala dos falantes nativos. O resultado da fala são os chamados "textos corretos" - sequências de unidades de fala que obedecem a determinados padrões, muitos dos quais permitem uma descrição matemática. A teoria das formas de descrever a estrutura sintática trata do estudo de métodos para a descrição matemática de textos corretos (principalmente sentenças). Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

No Ocidente, as ideias de Saussure são desenvolvidas pelos contemporâneos mais jovens do grande linguista suíço: na Dinamarca - L. Hjelmslev, já mencionado por mim, que deu origem à teoria algébrica da linguagem em sua obra "Fundamentos da Teoria Linguística", em os EUA - E. Sapir, L. Bloomfield, C. Harris, na República Checa - o cientista emigrante russo N. Trubetskoy.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nas décadas de 1920 e 1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as "características distintivas" dos fonemas. Esses recursos são baseados na estrutura dos órgãos da fala - língua, dentes, cordas vocais. Por exemplo, em inglês a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras e um meio de comunicação, e essas duas funções nunca coincidem. Podemos notar a alternância de forma e conteúdo: contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que em uma língua, os traços distintivos formam um contraste fonético em um nível diferente de compreensão, os fonemas são combinados em morfemas, morfemas - em palavras, palavras - em frases etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que apenas a soma de suas partes.

Saussure propôs a ideia de uma nova ciência do século XX, separada da linguística, estudando o papel dos signos na sociedade. Saussure chamou essa ciência de semiologia (do grego "semeion" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, expandiu o estudo da linguagem e das estruturas linguísticas em descobertas literárias compostas (ou formuladas) com a ajuda dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era, em muitos aspectos, o oposto do racionalismo em sua análise linguística: era uma tentativa de estudar em um sistema o problema da "probabilidade" na linguagem. Tal pesquisa ajuda a focalizar o "lado real" da probabilidade; a "palavra-chave" para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, "uma ferramenta para o poeta, não a fonte da vida do poema". O poema serve para trocar os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela ultrapassa o controle da consciência e depende apenas de as leis da linguagem” (ver . Apêndice 1).

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação aleatória baseados nesses conceitos, e, por outro lado, conceitos estruturalistas que apagam a oposição entre forma e conteúdo (sujeito e objeto) , significado e origens no estruturalismo, na psicanálise e até na mecânica quântica - os escritos de Ferdinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Infelizmente, depois que Stalin chegou ao poder em 1924, a linguística russa, como muitas outras ciências, foi rechaçada. Muitos cientistas talentosos foram forçados a emigrar, foram expulsos do país ou morreram em campos. Somente a partir de meados da década de 1950 um certo pluralismo de teorias se tornou possível - mais sobre isso na Seção 1.2.

1.2 Aplicação de métodos matemáticos em linguística na segunda metade do século XX

Cientistas Círculo Linguístico de Praga, em particular - seu fundador N.S. Trubetskoy, que emigrou da Rússia, desenvolveu a teoria das oposições - a estrutura semântica da língua foi descrita por eles como um conjunto de unidades semânticas construídas opositivamente - Sem. Essa teoria foi aplicada no estudo não apenas da linguagem, mas também da cultura artística.

A teoria de Chomsky passou por vários estágios em seu desenvolvimento.

Já recentemente, em 1995, Chomsky apresentou um programa minimalista, onde a linguagem humana é descrita como linguagem de máquina. Este é apenas um programa - não um modelo ou uma teoria. Nele, Chomsky identifica dois subsistemas principais do aparato da linguagem humana: o léxico e o sistema computacional, além de duas interfaces - fonética e lógica.

O impulso para o início desses trabalhos em nosso país foram os primeiros desenvolvimentos no campo da tradução automática nos Estados Unidos (embora o primeiro dispositivo de tradução mecanizada de P.P. Smirnov-Troyansky tenha sido inventado na URSS em 1933, sendo primitivo, não se difundiu). Em 1947, A. Butt e D. Britten criaram um código para tradução palavra por palavra usando um computador, um ano depois, R. Richens propôs uma regra para dividir palavras em radicais e terminações na tradução automática. Aqueles anos eram bem diferentes de hoje. Eram máquinas muito grandes e caras que ocupavam salas inteiras e exigiam uma grande equipe de engenheiros, operadores e programadores para mantê-las. Basicamente, esses computadores foram usados para realizar cálculos matemáticos para as necessidades das instituições militares - o novo em matemática, física e tecnologia serviu, antes de tudo, aos assuntos militares. Nos estágios iniciais, o desenvolvimento do MP foi ativamente apoiado pelos militares, com tudo isso (nas condições da Guerra Fria), a direção russo-inglesa desenvolvida nos EUA e a direção anglo-russa na URSS.

Em janeiro de 1954, o "Georgetown Experiment" ocorreu na Universidade Técnica de Massachusetts - a primeira demonstração pública de tradução do russo para o inglês na máquina IBM-701. Resumo da mensagem sobre a passagem bem sucedida do experimento, feita por D.Yu. Panov, apareceu no RJ "Matemática", 1954, nº 10: "Tradução de um idioma para outro usando uma máquina: um relatório sobre o primeiro teste bem-sucedido".

Ao mesmo tempo, a primeira geração de sistemas de tradução automática era muito imperfeita. Todos eles foram baseados em algoritmos de tradução sequencial "palavra por palavra", "frase por frase" - as conexões semânticas entre palavras e frases não foram levadas em consideração de forma alguma. Por exemplo, as frases são: John estava procurando sua caixa de brinquedos.Finalmente ele encontrou. A caixa estava na caneta.João ficou muito feliz. (John estava procurando sua caixa de brinquedos. Finalmente a encontrou. A caixa estava no cercadinho. John estava muito feliz.).” "Caneta" neste contexto não é uma "caneta" (ferramenta de escrita), mas um "cercadinho" ( caneta de brincar). O conhecimento de sinônimos, antônimos e significados figurativos é difícil de entrar em um computador. Uma direção promissora foi o desenvolvimento de sistemas computacionais focados no uso de um tradutor humano.

Lyapunov falou sobre tradução extraindo o significado do texto traduzido e apresentando-o em outro idioma. A abordagem de construção de sistemas de tradução automática baseada na obtenção da representação semântica da sentença de entrada por análise semântica e síntese da sentença de entrada de acordo com a representação semântica obtida ainda é considerada a mais perfeita. Tais sistemas são chamados de sistemas I (da palavra "interlíngua"). Ao mesmo tempo, a tarefa de criá-los, recuada no final dos anos 50 e início dos anos 60, não foi totalmente resolvida até agora, apesar dos esforços da Federação Internacional do IFIP - a comunidade mundial de cientistas na área de processamento de informações .

Em 6 de maio de 1960, foi adotado o Decreto do Presidium da Academia de Ciências da URSS "Sobre o desenvolvimento de métodos estruturais e matemáticos para o estudo da linguagem", e as divisões correspondentes foram criadas no Instituto de Linguística e no Instituto da Língua russa. Desde 1960, as principais universidades humanitárias do país - a Faculdade de Filologia da Universidade Estadual de Moscou, Leninrad, Universidades de Novosibirsk, Instituto Estadual de Línguas Estrangeiras de Moscou - começaram a treinar pessoal no campo do processamento automático de texto.

Ao mesmo tempo, os trabalhos de tradução automática desse período, chamados de "clássicos", são de interesse mais teórico do que prático. Os sistemas de tradução automática econômicos começaram a ser criados apenas nos anos oitenta do século passado. Falarei sobre isso mais tarde na Seção 2.1, Tradução automática.

As décadas de 1960 e 1970 incluem desenvolvimentos teóricos profundos usando os métodos da teoria dos conjuntos e da lógica matemática, como a teoria de campo e a teoria dos conjuntos difusos.

Nesta teoria, estamos falando não tanto da pertença de elementos a um determinado conjunto (Aa), mas do grau dessa pertinência (Aa), pois elementos periféricos podem pertencer a vários campos em um grau ou outro. Zade (Lofti-zade) era natural do Azerbaijão, até os 12 anos tinha a prática de se comunicar em quatro idiomas - azerbaijano, russo, inglês e persa - e usava três alfabetos diferentes: cirílico, latino, árabe. Quando se pergunta a um cientista o que há de comum entre a teoria dos conjuntos difusos e a linguística, ele não nega essa conexão, mas esclarece: “Não tenho certeza de que o estudo dessas linguagens tenha tido um grande impacto no meu pensamento. Se este fosse o caso, então apenas subconscientemente. Em sua juventude, Zadeh estudou em uma escola presbiteriana em Teerã e, após a Segunda Guerra Mundial, emigrou para os Estados Unidos. “A questão não é se sou americano, russo, azerbaijano ou qualquer outra pessoa”, disse ele em uma das conversas, “sou moldado por todas essas culturas e povos e me sinto bastante confortável entre cada um deles”. Nessas palavras há algo parecido com o que caracteriza a teoria dos conjuntos difusos - um afastamento de definições inequívocas e categorias nítidas.

Na década de 1980, o professor do Instituto de Estudos Orientais da Academia de Ciências Yu.K. Lekomtsev, ao analisar a linguagem da linguística por meio da análise de esquemas, tabelas e outros tipos de notação usados nas descrições linguísticas, considera sistemas matemáticos adequados para esses fins (principalmente sistemas de álgebra matricial).

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1 Tradução automática

A ideia de traduzir de uma língua para outra com a ajuda de um mecanismo universal surgiu vários séculos antes dos primeiros desenvolvimentos nesta área começarem - em 1649, René Descartes propôs a ideia de uma língua em que as ideias equivalentes de diferentes idiomas seriam expressos por um símbolo. As primeiras tentativas de implementar essa ideia nos anos 1930-40, o início dos desenvolvimentos teóricos em meados do século, a melhoria dos sistemas de tradução com a ajuda da tecnologia nos anos 1970-80, o rápido desenvolvimento da tecnologia de tradução nos últimos década - estas são as etapas do desenvolvimento da tradução automática como indústria. É a partir dos trabalhos sobre tradução automática que a linguística computacional como ciência cresceu.

Durante o período 1978-93, foram gastos 20 milhões de dólares em pesquisas na área de tradução automática nos EUA, 70 milhões na Europa e 200 milhões no Japão.

Russo, inglês, alemão, francês e japonês tornaram-se os principais idiomas dos sistemas de tradução nacionais. O All-Union Translation Center (VTsP) desenvolveu um sistema de tradução do inglês e do alemão para o russo em um computador ES-1035-ANRAP. Consistia em três dicionários - entrada em inglês e alemão e saída em russo - sob um único software. Havia vários dicionários especializados substituíveis - em informática, programação, eletrônica de rádio, engenharia mecânica, agricultura, metalurgia. O sistema poderia funcionar em dois modos - automático e interativo, quando a tela exibia o texto-fonte e a tradução por frase, que uma pessoa podia editar. A velocidade de tradução do texto em ANRAP (do início da digitação até o final da impressão) foi de aproximadamente 100 páginas por hora.

Para tradução especializada de textos de engenharia elétrica, existia o sistema ETAP-2. A análise do texto de entrada nele foi realizada em dois níveis - morfológico e sintático. O dicionário ETAP-2 continha cerca de 4 mil verbetes; a fase de transformação do texto - cerca de 1000 regras (96 gerais, 342 privadas, o resto são dicionário). Tudo isso garantiu uma qualidade de tradução satisfatória (digamos, o título da patente "Optical phase grid arranjo e dispositivo de acoplamento tendo tal arranjo" foi traduzido como "Um dispositivo óptico de rede de fase e um dispositivo de conexão com tal dispositivo" - apesar da tautologia, o significado é preservado).

Em julho de 1990, o primeiro sistema comercial de tradução automática na Rússia chamado PROMT (PROgrammer's Machine Translation) foi apresentado no PC Forum em Moscou. Em 1991, ZAO [!!! foi substituída por uma sociedade anônima não pública] "Proekt MT", e já em 1992, a empresa PROMT venceu a competição da NASA para o fornecimento de sistemas MP (PROMT foi a única empresa não americana nesta competição). toda a família de sistemas sob o novo nome STYLUS para tradução de inglês, alemão, francês, italiano e espanhol para russo e de russo para inglês, e em 1993, com base no STYLUS, foi criado o primeiro sistema de tradução automática para Windows do mundo. STYLUS 2.0 para Windows 3.X/95/NT foi lançado, e em 1995-1996 a terceira geração de sistemas de tradução automática, totalmente STYLUS 3.0 de 32 bits para Windows 95/NT, foi introduzida, ao mesmo tempo, o desenvolvimento de um novo, os primeiros sistemas de tradução automática russo-alemão e russo-francês do mundo.

Atualmente, novas tecnologias de tradução automática estão surgindo com base no uso de sistemas de inteligência artificial e métodos estatísticos. Sobre este último - na próxima seção.

2.2 Extrametodos icos no aprendizado de linguas

onde e é a frase de tradução e f é a frase original

Em geral, um sistema de tradução automática opera em dois modos:

A implementação do algoritmo de Viterbi usado para treinar o Modelo #1 é a seguinte:

1. Toda a tabela de probabilidades de correspondência de tradução é preenchida com os mesmos valores.

2. Para todas as variantes possíveis de conexões de palavras em pares, a probabilidade P(a, f | e) é calculada:

3. Os valores de P(a, f | e) são normalizados para obter os valores de P(a | e, f).

4. A frequência de cada par de tradução é calculada, ponderada pela probabilidade de cada opção de alinhamento.

5. As frequências ponderadas resultantes são normalizadas e formam uma nova tabela de probabilidades de correspondência de tradução

6. O algoritmo é repetido a partir da etapa 2.

Considere, como exemplo, o treinamento de um modelo semelhante em um corpus de dois pares de sentenças (Fig. 2):

Casa Branca

Após um grande número de iterações, obteremos uma tabela (Tabela 2), que mostra que a tradução é realizada com alta precisão.

		Construtores
Humano	paciente (10), personalidade (5)	homem (5)
Boa	ajuda (8), ajuda (7)	mal (16)
uma vida	morte (10)	adorável (5)
morte	cadáver (8)	vida (6)
o fogo	calor (8), queimar (6)	fogo (7)
dedo	mão (14), panarício (5)	grande (7), índice (6)
olhos	visão (6), aluno, oftalmologista (5 cada)	marrom (10), grande (6)
cabeça	mente (14), cérebro (5)	grande (9), inteligente (8), inteligente (6)
perder	consciência, vida (4 cada)	dinheiro (5), encontrar (4)

Regularidades estatísticas em um idioma são usadas para criar dicionários de frequência - dicionários que fornecem características numéricas da frequência de palavras (formas de palavras, frases) de qualquer idioma - o idioma do escritor, qualquer trabalho, etc. uma palavra é usada como uma característica da frequência de ocorrência de uma palavra no texto de um determinado volume

(a) selecionar o conjunto apropriado de acordo com certos parâmetros;

(b) dentro dos limites do conjunto delineado (se alocado adequadamente) para "eliminar" todas as palavras, exceto a única que melhor corresponde à palavra dada do texto reconhecido. Uma das estratégias de "abandono" é excluir palavras de baixa frequência. Segue-se que o vocabulário para percepção da fala é um dicionário de frequência. É a criação de uma versão para computador do dicionário de frequências da língua russa que é a tarefa inicial do projeto apresentado.

Com base no material do idioma russo, existem 5 dicionários de frequência (sem contar os dicionários de filiais). Observemos apenas algumas deficiências gerais dos dicionários existentes.

Os dados estatísticos dos dicionários de frequência também podem ser amplamente utilizados na resolução de outros problemas linguísticos - por exemplo, na análise e determinação dos meios ativos de formação de palavras do idioma russo moderno, resolvendo problemas de melhoria de gráficos e ortografia, relacionados a levar em consideração conta informações estatísticas sobre o vocabulário (com tudo isso, é importante levar em conta características probabilísticas de combinações de grafemas, tipos de combinações de letras realizadas em palavras), transcrição prática e transliteração. Os parâmetros estatísticos do dicionário também serão úteis na resolução de problemas de automatização de digitação, reconhecimento e leitura automática de texto literal.

Dicionários explicativos modernos e gramáticas da língua russa são construídos principalmente com base em textos literários e artísticos. Existem dicionários de frequência da língua de A.S. Pushkin, A. S. Griboedova, F. M. Dostoiévski, V. V. Vysotsky e muitos outros autores. No Departamento de História e Teoria da Literatura do Estado de Smolensk. A Universidade Pedagógica trabalha há vários anos para compilar dicionários de frequência de textos poéticos e em prosa. Para este estudo, foram selecionados dicionários de frequência de todas as letras de Pushkin e mais dois poetas da idade de ouro - "Ai da sagacidade" de Griboyedov e toda a poesia de Lermontov; Pasternak e cinco outros poetas da Idade de Prata - Balmont 1894-1903, "Poems about the Beautiful Lady" de Blok, "Stone" de Mandelstam, "Pillar of Fire" de Gumilyov, "Anno Domini MCMXXI" de Akhmatova e "Sisters of My Life" de Pasternak e mais quatro poetas da Idade do Ferro - "Poems by Yuri Zhivago", "When it clears up", todo o corpus de letras de M. Petrovs, "The road is far away", "Windscreen", "Adeus à neve" e "Ferraduras" de Mezhirov, "Antimirov" de Voznesensky e "Bolas de neve » Rylenkova.

Deve-se notar que esses dicionários são de natureza diferente: alguns representam o vocabulário de uma obra dramática, outros - livros de letras, ou vários livros, ou todo o corpus de poemas do poeta. Os resultados da análise apresentada neste artigo devem ser tomados com cautela, não podem ser tomados como absolutos. Ao mesmo tempo, com a ajuda de medidas especiais, a diferença na natureza ontológica dos textos pode ser reduzida até certo ponto.

Nos últimos anos, a oposição entre o discurso coloquial e o livro tornou-se cada vez mais clara. Essa questão é especialmente discutida entre os metodólogos que reivindicam uma guinada no ensino para a língua falada. Ao mesmo tempo, a especificidade do discurso coloquial ainda permanece inexplicada.

Tokens encontrados em apenas um texto caracterizam a originalidade de um determinado livro ou de uma coleção de livros. Por exemplo, a palavra "mente" é a mais frequente na comédia de Griboedov "Ai da inteligência" - mas não ocorre entre as palavras de frequência de outros textos. O tema da mente é de longe o mais significativo na comédia. Este lexema acompanha a imagem de Chatsky, sendo o nome de Chatsky o mais frequente na comédia. Assim, a obra combina organicamente o nome comum mais frequente com o nome próprio mais frequente.

2.3 Aprendizagem Ilinguagem por métodos de lógica formal

No estudo das línguas naturais, métodos lógicos são usados para que os aprendizes de línguas não possam “memorizar” estupidamente o maior número possível de palavras, mas compreendam melhor sua estrutura. L. Shcherba também usou em suas palestras um exemplo de uma frase construída de acordo com as leis da língua russa: “O kuzdra shteko com defeito bokeou o bokra e enrola o bokra”, e depois perguntou aos alunos o que isso significava. Apesar de o significado das palavras na frase permanecer obscuro (elas simplesmente não existem em russo), foi possível responder claramente: “kuzdra” é o sujeito, um substantivo feminino, no caso nominativo singular, “ bokr” é animado, e etc. A tradução da frase acaba sendo mais ou menos assim: “Algo feminino de uma só vez fez algo sobre algum tipo de criatura masculina e depois começou a fazer algo longo e gradual com seu filhote”. Um exemplo semelhante de um texto (artístico) a partir de palavras inexistentes, construído inteiramente de acordo com as leis da linguagem, é o Jabberwock de Lewis Carroll (em Alice no País das Maravilhas, Carroll, pela boca de seu personagem Humpty Dumpty, explica o significado de as palavras que ele inventou: "cozido" - oito horas da noite, quando é hora de preparar o jantar, "chlivky" - frágil e hábil, "shorek" - um cruzamento entre um furão, um texugo e um saca-rolhas, "mergulho " - pular, mergulhar, girar, "nava" - grama sob o relógio de sol (se estende um pouco para a direita, um pouco para a esquerda e um pouco para trás), "grunhir" - grunhir e rir, "zelyuk" - um peru verde, “myumzik” - um pássaro; suas penas estão desgrenhadas e se projetam em todas as direções, como uma vassoura, “mova” - longe de casa) .

Um dos principais conceitos da lógica moderna e da linguística teórica, usado no estudo de línguas de vários cálculos lógico-matemáticos, línguas naturais, para descrever a relação entre línguas de diferentes "níveis" e caracterizar a relação entre os línguas em consideração e as áreas temáticas descritas com sua ajuda, é o conceito de metalinguagem. Uma metalinguagem é uma linguagem usada para expressar julgamentos sobre outra linguagem, a linguagem-objeto. Com a ajuda de uma metalinguagem, eles estudam a estrutura das combinações de caracteres (expressões) da linguagem-objeto, provam teoremas sobre suas propriedades expressivas, sobre sua relação com outras linguagens etc. relação a essa metalinguagem. Tanto a linguagem de assunto quanto a metalinguagem podem ser linguagens comuns (naturais). A metalinguagem pode diferir da linguagem objeto (por exemplo, em um livro de inglês para russos, o russo é uma metalinguagem e o inglês é uma linguagem objeto), mas também pode coincidir com ela ou diferir apenas parcialmente, por exemplo, em terminologia especial (A terminologia linguística russa é um elemento da metalinguagem para descrever a língua russa, os chamados fatores semânticos fazem parte da metalinguagem para descrever a semântica das línguas naturais).

O conceito de "metalinguagem" tornou-se muito frutífero em conexão com o estudo de linguagens formalizadas que são construídas no âmbito da lógica matemática. Ao contrário das linguagens de assunto formalizadas, neste caso a metalinguagem, por meio da qual a metateoria é formulada (estudando as propriedades da teoria do sujeito formulada na linguagem de assunto), é, via de regra, uma linguagem natural ordinária, de alguma maneira especial uma fragmento limitado de uma linguagem natural que não contém nenhum tipo de ambiguidade, metáforas, conceitos "metafísicos", etc. elementos da linguagem comum que impedem seu uso como ferramenta para pesquisas científicas precisas. Ao mesmo tempo, a própria metalinguagem pode ser formalizada e (independentemente disso) tornar-se objeto de pesquisas realizadas por meio da metametalinguagem, e tal série pode ser “pensada” como crescendo indefinidamente.

A metalinguagem deve, em todo caso, ser “não mais pobre” do que sua linguagem objetiva (ou seja, para cada expressão desta última na metalinguagem deve haver seu nome, “tradução”) - caso contrário, se esses requisitos não forem atendidos (o que certamente ocorre em línguas naturais, se acordos especiais não estabelecem o contrário) surgem paradoxos semânticos (antinomias).

2.4 Perspectivas para a aplicação de métodos matemáticos em linguística

A combinação de conhecimento "exato" e "humanitário" tornou-se terreno fértil para novas descobertas no campo da linguística, informática e filosofia.

Conclusão

Ao longo do século 20, as tecnologias de computador percorreram um longo caminho - do uso militar ao uso pacífico, de uma faixa estreita de objetivos à penetração em todos os ramos da vida humana. A matemática como ciência encontrou um significado prático sempre novo com o desenvolvimento da tecnologia da computação. Este processo continua até hoje.

O formalismo matemático é mais adequado para descrever padrões em linguística (como, de fato, em outras ciências - tanto as humanas quanto as naturais). A situação às vezes se desenvolve na ciência de tal maneira que, sem o uso de uma linguagem matemática apropriada, é impossível entender a natureza física, química etc. processo não é possível. Criando um modelo planetário do átomo, o famoso físico inglês do século XX. E. Rutherford experimentou dificuldades matemáticas. A princípio, sua teoria não foi aceita: não parecia convincente, e a razão para isso foi o desconhecimento de Rutherford da teoria da probabilidade, com base no mecanismo do qual só foi possível entender a representação modelo das interações atômicas. Percebendo isso, já naquela época um destacado cientista, dono do Prêmio Nobel, matriculou-se no seminário do matemático Professor Lamb e durante dois anos, junto com os alunos, participou de um curso e realizou um workshop sobre a teoria das probabilidades . Com base nele, Rutherford foi capaz de descrever o comportamento do elétron, dando ao seu modelo estrutural uma precisão convincente e ganhando reconhecimento. O mesmo acontece com a linguística.

As redes de computadores tornaram-se objeto de reflexão filosófica - cada vez mais novos conceitos linguísticos, lógicos, de visão de mundo têm sido criados que ajudam a entender a "realidade virtual". Em muitas obras de arte, criaram-se cenários - mais frequentemente pessimistas - sobre o domínio das máquinas sobre os humanos e da realidade virtual - sobre o mundo exterior. Longe de sempre, tais previsões acabaram sendo sem sentido. A tecnologia da informação não é apenas uma indústria promissora para investir o conhecimento humano, é também uma forma de controlar a informação e, consequentemente, sobre o pensamento humano.

Este fenômeno tem um lado negativo e um lado positivo. Negativo - porque o controle sobre a informação é contrário ao direito humano inalienável de livre acesso a ela. Positivo - porque a falta desse controle pode levar a consequências catastróficas para a humanidade. Basta lembrar um dos filmes mais sábios da última década - "Quando o mundo acabar", de Wim Wenders, cujos personagens estão completamente imersos na "realidade virtual" de seus próprios sonhos gravados em um computador. Ao mesmo tempo, nem um único cientista e nem um único artista pode dar uma resposta inequívoca à pergunta: o que espera a ciência e a tecnologia no futuro.

Focar no "futuro", às vezes parecendo fantástico, era uma característica distintiva da ciência em meados do século XX, quando os inventores procuravam criar modelos perfeitos de tecnologia que pudessem funcionar sem intervenção humana. O tempo mostrou a natureza utópica de tal pesquisa. Ao mesmo tempo, seria supérfluo condenar os cientistas por isso - sem seu entusiasmo nos anos 1950-60, a tecnologia da informação não teria dado um salto tão poderoso nos anos 90, e não teríamos o que temos agora.

A informação é uma arma, e as armas não são menos perigosas do que as armas nucleares ou químicas - só que não agem fisicamente, mas psicologicamente. A humanidade precisa pensar no que é mais importante para ela neste caso - liberdade ou controle.

Paradoxalmente, a tecnologia da informação pode desempenhar um papel importante nesse processo. As redes de computadores, e especialmente a Internet, não são apenas um recurso de entretenimento e atividade comercial vigorosa, mas também um meio de comunicação significativo e controverso entre representantes de várias civilizações do mundo moderno, bem como de diálogo entre o passado e o o presente. Podemos dizer que a Internet ultrapassa as fronteiras espaciais e temporais.

E no diálogo das culturas por meio da tecnologia da informação, o papel da linguagem como o mais antigo meio de comunicação universal ainda é importante. É por isso que a linguística, em interação com a matemática, filosofia e ciência da computação, experimentou seu segundo nascimento e continua a se desenvolver hoje. A tendência do presente continuará no futuro - "até o fim do mundo", como há 15 anos, o mesmo V. Wenders previu. É verdade que não se sabe quando esse fim ocorrerá - mas é importante agora, porque o futuro mais cedo ou mais tarde se tornará o presente de qualquer maneira.

Apêndice 1

Fernando de Saussure

O linguista suíço Ferdinand de Saussure (1857-1913) é amplamente considerado o fundador da linguística moderna em suas tentativas de descrever a estrutura da linguagem em vez da história de línguas e formas de linguagem particulares. De fato, o método do Estruturalismo nos estudos linguísticos e literários e um ramo significativo da Semiótica encontram seu principal ponto de partida em sua obra na virada do século XX. Argumentou-se até que o complexo de estratégias e concepções que veio a ser chamado de "pós-estruturalismo" - o trabalho de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros - é sugerido pela obra de Saussure na linguística e nas leituras anagramáticas da poesia latina tardia, do modernismo literário à psicanálise e à filosofia no início do século XX. Como argumentam Algirdas Julien Greimas e Joseph Courtes em Semiotics and Language: An Analytic Dictionary, sob o título "Interpretação", surgiu no início do século XX um novo modo de interpretação que eles identificam com a linguística saussureana, a fenomenologia husserliana e a psicanálise freudiana. Nesse modo, "a interpretação não é mais uma questão de atribuir um conteúdo dado a uma forma que de outra forma não teria, mas é uma paráfrase que formula de outro modo o conteúdo equivalente de um elemento significante dentro de um sistema semiótico dado" (p. 159). nesta compreensão de "interpretação", forma e conteúdo não são distintos; ao contrário, toda "forma" é, alternativamente, também um "conteúdo" semântico, uma "forma significante", de modo que a interpretação oferece uma paráfrase analógica de algo que já significa dentro de algum outro sistema de significação.

Tal reinterpretação da forma e da compreensão - que Claude Lévi-Strauss descreve em uma de suas articulações mais programáticas do conceito de estruturalismo, em "Estrutura e forma: reflexões sobre uma obra de Vladimir Propp" - está implícita no Curso póstumo de Saussure em General Linguistics (1916, trad., 1959, 1983). Em sua vida, Saussure publicou relativamente pouco, e sua obra principal, o Curso, foi a transcrição por seus alunos de vários cursos de linguística geral que ele ofereceu em 1907-11. No Curso, Saussure pediu o estudo "científico" da linguagem em oposição ao trabalho em linguística histórica que havia sido feito no século XIX. Esse trabalho é uma das grandes conquistas do intelecto ocidental: tomar palavras particulares como os blocos de construção de linguagem, a linguística histórica (ou "diacrônica") traçou a origem e o desenvolvimento das línguas ocidentais a partir de uma fonte de linguagem comum putativa, primeiro uma língua "indo-europeia" e depois uma "p" anterior língua roto-indo-europeia".

É precisamente esse estudo das ocorrências únicas de palavras, com a concomitante suposição de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos-palavra", que Saussure questionou. Seu trabalho foi uma tentativa de reduzir a massa de fatos sobre a linguagem, estudados tão minuciosamente pela linguística histórica, a um número manejável de proposições. A "escola comparada" da Filologia do século XIX, diz Saussure no Curso, "não conseguiu estabelecer a verdadeira ciência da linguística" porque "não conseguiu descobrir a natureza de seu objeto de estudo" (3). Essa "natureza", argumenta ele, deve ser encontrada não apenas nas palavras "elementares" que uma linguagem compreende - os aparentes fatos "positivos" (ou "substâncias") da linguagem - mas nas relações formais que dão origem a esses fatos. "substâncias".

Essa suposição deu origem ao que Roman Jakobson em 1929 veio a designar como "estruturalismo", no qual "qualquer conjunto de fenômenos examinados pela ciência contemporânea é tratado não como uma aglomeração mecânica, mas como um todo estrutural, a concepção mecânica de processos cede à questão de sua função" ("Romântico" 711). Nesta passagem, Jakobson está articulando a intenção de Saussure de definir a linguística como um sistema científico em oposição a uma simples contabilidade "mecânica" de acidentes históricos. agora chamá-lo de "estrutural" - linguística: que os elementos básicos da linguagem só podem ser estudados em relação às suas funções e não em relação às suas causas. em que se relacionam com outros chamados eventos e entidades. Trata-se de uma reorientação radical na concepção da experiência e dos fenômenos, cuja importância o filósofo Ernst Cassirer comparou à "nova ciência de Galileu que no século XVII mudou toda a nossa conceito do mundo físico" (citado em Culler, Pursuit 2 4). Essa mudança, como observam Greimas e Courtes, reconcebe a "interpretação" e, portanto, reconcebe a explicação e a compreensão em si. Em vez de a explicação "ser em termos das causas de um fenômeno", de modo que, como "efeito", está de alguma forma subordinada às suas causas, a explicação aqui consiste em subordinar um fenômeno à sua "função" orientada para o futuro ou "objetivo." A explicação não é mais independente das intenções ou propósitos humanos (mesmo que essas intenções possam ser impessoais, comunitárias ou, em termos freudianos, "inconscientes").

Em sua linguística, Saussure realiza essa transformação especificamente na redefinição da "palavra" linguística, que ele descreve como o "signo" linguístico e define em termos funcionalistas. O signo, ele argumenta, é a união de "um conceito e uma imagem sonora", que ele chamou de "significado e significante" (66-67; a tradução de Roy Harris de 1983 oferece os termos "significação" e "sinal"). A natureza de sua "combinação" é "funcional" na medida em que nem o significado nem o significante são a "causa" do outro, mas "cada um seus valores do outro" (8). elemento da linguagem, o signo , relacionalmente e faz a suposição básica da linguística histórica, a saber, a identidade das unidades elementares de linguagem e significação (ou seja, "palavras"), sujeita a análise rigorosa. a palavra "árvore" como a "mesma" palavra não é porque a palavra é definida por qualidades inerentes - não é uma "aglomeração mecânica" de tais qualidades - mas porque é definida como um elemento de um sistema, o "todo estrutural" da linguagem.

Tal definição relacional (ou "diacrítica") de uma entidade governa a concepção de todos os elementos da linguagem na linguística estrutural. Isso fica mais claro na realização mais impressionante da linguística saussureana, o desenvolvimento dos conceitos de "fonemas" e "características distintivas" da linguagem. Os fonemas são as menores unidades articuladas e significantes de uma língua. Não são os sons que ocorrem na linguagem, mas as "imagens sonoras" mencionadas por Saussure, que são apreendidas pelos falantes - fenomenalmente apreendidas - como portadoras de significado. (Assim, Elmar Holenstein descreve a linguística de Jakobson, que segue Saussure de maneiras importantes, como "estruturalismo fenomenológico".) . . é uma realidade fenomenológica e não empírica; não é a obra em si, mas um conjunto de relações funcionais que estão localizadas na consciência de um coletivo (geração, meio, etc.)" (citado em Galan 35). Da mesma forma, Lévi-Strauss, o principal porta-voz do estruturalismo francês , observou em 1960 que "a estrutura não tem conteúdo distinto; ela é o próprio conteúdo, e a organização lógica na qual ela está presa é concebida como uma propriedade do real” (167; ver também Jakobson, Fundamentals 27-28).

Nessa estrutura, as identidades linguísticas são determinadas não por qualidades inerentes, mas por relações sistêmicas ("estruturais").

Eu disse que a fonologia "seguiu o exemplo" de Saussure, porque embora sua análise da fisiologia da produção da linguagem "seria hoje", como diz Harris, "chamada de "física", em oposição a "psicológica" ou "funcional", "" (Leitura 49), consequentemente no Curso ele articulou a direção e os contornos de uma análise funcional da linguagem. Da mesma forma, sua única obra extensa publicada, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memória sobre o sistema primitivo de vogais nas línguas indo-europeias), que apareceu em 1878, estava totalmente inserida no projeto do século XIX. linguística histórica do século. No entanto, dentro deste trabalho, como Jonathan Culler argumentou, Saussure demonstrou "a fecundidade de pensar a linguagem como um sistema de itens puramente relacionais, mesmo quando trabalhando na tarefa de reconstrução histórica" (Saussure 66). Ao analisar as relações estruturais sistemáticas entre os fonemas para explicar os padrões de alternância vocálica nas línguas indo-européias existentes, Saussure sugeriu que, além de vários fonemas diferentes /a/, deve ter havido outro fonema que poderia ser descrito formalmente. "O que torna a obra de Saussure tão impressionante", conclui Culler, "é o fato de que quase cinquenta anos depois, quando o hitita cuneiforme foi descoberto e decifrado, descobriu-se que continha um fonema, escrito h, que se comportava como Saussure havia previsto. . Ele havia descoberto, por uma análise puramente formal, o que hoje é conhecido como laríngeos do indo-europeu" (66).

Essa concepção da determinação relacional ou diacrítica dos elementos de significação, implícita e explícita no Curso, sugere um terceiro pressuposto que rege a linguística estrutural, o que Saussure chama de "arbitrário do signo". Com isso ele quer dizer que a relação entre o significante e o significado na linguagem nunca é necessária (ou "motivada"): pode-se encontrar tão facilmente o significante sonoro arbre quanto a árvore significante para se unir ao conceito "árvore". Mas, mais do que isso, significa que o significado também é arbitrário: pode-se definir o conceito "árvore" tanto por sua qualidade lenhosa (que excluiria as palmeiras) quanto por seu tamanho (que exclui as "plantas lenhosas baixas" que chamar arbustos). Isso deve deixar claro que a numeração de suposições que venho apresentando não representa uma ordem de prioridade: cada suposição - a natureza sistêmica da significação (melhor apreendida estudando a linguagem "sincronicamente"), a natureza relacional ou "diacrítica" dos elementos da significação, a natureza arbitrária dos signos - deriva seu valor dos outros.

Ou seja, a linguística saussureana os fenômenos que estuda nas relações abrangentes de combinação e contraste na linguagem. Nessa concepção, a linguagem é tanto o processo de articulação do significado (significação) quanto seu produto (comunicação), e essas duas funções da linguagem não são idênticas nem totalmente congruentes (ver Schleifer, "Desconstrução"). Aqui, podemos ver a alternância entre forma e conteúdo que Greimas e Courtes descrevem na interpretação modernista: a linguagem apresenta contrastes que definem formalmente suas unidades, e essas unidades se combinam em níveis sucessivos para criar o conteúdo significante. Além disso, como os elementos da linguagem são arbitrários, nem o contraste nem a combinação podem ser considerados básicos. Assim, na linguagem, os traços distintivos se combinam para formar fonemas contrastantes em outro nível de apreensão, os fonemas se combinam para formar morfemas contrastantes, os morfemas se combinam para formar palavras, as palavras se combinam para formar frases e assim por diante. Em cada caso, o fonema inteiro, ou palavra, ou sentença, e assim por diante, é maior que a soma de suas partes (assim como a água, H2O, no exemplo de Saussure [(1959) 103] é mais que a aglomeração mecânica de hidrogênio e oxigênio).

Os três pressupostos do Curso de Lingüística Geral levaram Saussure a clamar por uma nova ciência do século XX que fosse além da ciência linguística para estudar "a vida dos signos na sociedade". Saussure chamou essa ciência de "semiologia (do grego semeion "sinal")" (16). A "ciência" da semiótica, tal como passou a ser praticada no Leste Europeu nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, ampliou o estudo da linguagem e das estruturas linguísticas aos artefatos literários constituídos (ou articulados) por essas estruturas. Além disso, durante a última parte de sua carreira, mesmo enquanto oferecia os cursos de linguística geral, Saussure prosseguiu com sua própria análise "semiótica" da poesia latina tardia na tentativa de descobrir anagramas de nomes próprios deliberadamente ocultos. O método de estudo era, em muitos aspectos, o oposto do racionalismo funcional de suas análises linguísticas: tentava, como menciona Saussure em um dos 99 cadernos em que se dedicava a este estudo, examinar sistematicamente o problema do "acaso", que " torna-se o fundamento inevitável de tudo" (citado em Starobinski 101). Tal estudo, como diz o próprio Saussure, centra-se no "fato material" do acaso e do sentido (citado 101), de modo que a "palavra-tema" cujo anagrama Saussure busca, como argumenta Jean Starobinski, "é, para o poeta , um instrumento, e não um germe vital do poema. O poema é obrigado a reempregar os materiais fônicos da palavra-tema" (45). Nessa análise, diz Starobinski, "Saussure não se perdeu na busca de significados ocultos". Em vez disso, sua obra parece demonstrar um desejo de fugir de todos os problemas decorrentes da consciência: "Como a poesia não se realiza apenas em palavras, mas é algo nascido das palavras, ela escapa ao controle arbitrário da consciência para depender apenas de uma espécie de legalidade linguística "(121).

Ou seja, a tentativa de Saussure de descobrir nomes próprios na poesia latina tardia - o que Tzvetan Todorov chama de redução de uma "palavra . . . ao seu significante" (266) - enfatiza um dos elementos que nortearam sua análise linguística, a natureza arbitrária do signo. uma substância" - que elimina efetivamente a semântica como objeto principal de análise.) Como conclui Todorov, a obra de Saussure parece hoje notavelmente homogênea em sua recusa em aceitar fenômenos simbólicos. . . . Em sua pesquisa sobre anagramas, ele presta atenção apenas aos fenômenos de repetição, não aos de evocação. . . . Em seus estudos dos Nibelungos, ele reconhece símbolos apenas para atribuí-los a leituras equivocadas: como não são intencionais, os símbolos não existem. Finalmente, em seus cursos de linguística geral, ele contempla a existência da semiologia e, portanto, de outros signos que não os linguísticos; mas esta afirmação é ao mesmo tempo limitada pelo fato de que a semiologia se dedica a um único tipo de signo: aqueles que são arbitrários. (269-70)

Se isso é verdade, é porque Saussure não podia conceber a "intenção" sem sujeito; ele não conseguia escapar da oposição entre forma e conteúdo que seu trabalho tanto questionava. Em vez disso, ele recorreu à "legalidade linguística". Situada entre, por um lado, as concepções oitocentistas de história, subjetividade e o modo de interpretação causal governado por essas concepções e, por outro, concepções "estruturalistas" do século XX daquilo que Lévi-Strauss chamou de "kantismo sem um sujeito transcendental" (citado em Connerton 23) - conceitos que apagam a oposição entre forma e conteúdo (ou sujeito e objeto) e a hierarquia de primeiro plano e segundo plano no estruturalismo completo, na psicanálise e até na mecânica quântica - o trabalho de Ferdinand de Saussure em linguística e semiótica circunscreve um momento marcante no estudo do significado e da cultura.

Ronald Schleifer

Apêndice 2

Fernando de Saussure (tradução)

O linguista suíço Ferdinand de Saussure (1857-1913) é considerado o fundador da linguística moderna - graças às suas tentativas de descrever a estrutura da língua, e não a história de línguas individuais e formas de palavras. De um modo geral, as bases dos métodos estruturais em linguística e crítica literária e, em grande medida, semiótica foram lançadas em suas obras no início do século XX. Comprova-se que os métodos e conceitos do chamado "pós-estruturalismo", desenvolvidos nas obras de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros, remontam às obras linguísticas de Saussure e leituras anagramáticas da poesia romana tardia. Deve-se notar que o trabalho de Saussure sobre linguística e interpretação linguística ajuda a conectar uma ampla gama de disciplinas intelectuais - da física às inovações literárias, psicanálise e filosofia do início do século XX. A. J. Greimas e J. Kurte escrevem em Semiótica e Linguagem: “Um dicionário analítico com o título “Interpretação” como um novo tipo de interpretação surgiu no início do século XX junto com a linguística de Saussure, a fenomenologia de Husserl e a psicanálise de Freud. Nesse caso, “interpretação não é a atribuição de um conteúdo dado a uma forma que de outra forma não teria, mas sim uma paráfrase que formula de outro modo o mesmo conteúdo de um elemento significante dentro de um sistema semiótico dado” (159). ). Nessa compreensão de "interpretação", forma e conteúdo são inseparáveis; pelo contrário, cada forma é preenchida com significado semântico (“forma significativa”), de modo que a interpretação oferece uma nova e semelhante recontagem de algo significativo em outro sistema de signos.

Uma compreensão semelhante de forma e conteúdo, apresentada por Claude Lévi-Strauss em uma das principais obras do estruturalismo, ("Structure and Form: Reflections on the Works of Vladimir Propp"), pode ser vista no livro postumamente publicado de Saussure "Curse in Lingüística Geral" (1916, trad., 1959, 1983). Durante sua vida, Saussure publicou pouco, "Curso" - sua principal obra - foi coletado das notas de alunos que assistiram às suas palestras sobre linguística geral em 1907-11. No Curso, Saussure pediu um estudo "científico" da linguagem, contrastando-o com a linguística histórico-comparativa do século XIX. Essa obra pode ser considerada uma das maiores conquistas do pensamento ocidental: tomando como base as palavras individuais como elementos estruturais da linguagem, a linguística histórica (ou “diacrônica”) comprovou a origem e o desenvolvimento das línguas da Europa Ocidental língua indo-européia comum - e um proto-indo-europeu anterior.

É justamente esse estudo das ocorrências únicas das palavras, com a concomitante suposição de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos da palavra" que Saussure questionou. Seu trabalho foi uma tentativa de reduzir os muitos fatos sobre a linguagem estudados casualmente pela linguística comparativa a um pequeno número de teoremas. A escola filológica comparada do século XIX, escreve Saussure, "não conseguiu criar uma verdadeira escola de linguística" porque "não compreendia a essência do objeto de estudo" (3). Essa "essência", argumenta ele, não reside apenas nas palavras individuais - as "substâncias positivas" da linguagem -, mas também nas conexões formais que ajudam essas substâncias a existir.

O "teste" de linguagem de Saussure baseia-se em três suposições. Em primeiro lugar, a compreensão científica da linguagem se baseia não em um fenômeno histórico, mas estrutural. Assim, distinguiu entre fenômenos individuais da língua - "eventos de fala", que ele define como "parole" - e o próprio, em sua opinião, objeto de estudo da linguística, o sistema (código, estrutura) que controla esses eventos ("língua"). Tal estudo sistemático, além disso, requer uma concepção "síncrona" da relação entre os elementos da linguagem em um determinado momento, em vez de um estudo "diacrônico" do desenvolvimento de uma língua ao longo de sua história.

Em sua linguística, Saussure mostra especialmente essa virada na mudança do conceito de palavra na linguística, que ele define como signo e descreve em termos de suas funções. Um sinal para ele é uma combinação de som e significado, "significado e designação" (66-67; na tradução inglesa de 1983 de Roy Harris - "significação" e "sinal"). A natureza deste composto é "funcional" (nem um nem outro elemento pode existir sem o outro); além disso, "um empresta qualidades do outro" (8). Assim, Saussure define o principal elemento estrutural da linguagem - o signo - e faz da base da linguística histórica a identidade dos signos às palavras, o que exige uma análise particularmente rigorosa. Portanto, podemos entender diferentes significados de, digamos, a mesma palavra "árvore" - não porque a palavra seja apenas um conjunto de certas qualidades, mas porque ela é definida como um elemento no sistema de signos, no "todo estrutural", na língua.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nas décadas de 1920 e 1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as "características distintivas" dos fonemas. Essas características são baseadas na estrutura dos órgãos da fala - língua, dentes, cordas vocais - Saussure percebe isso no "Curso de Lingüística Geral", e Harris chama isso de "fonética fisiológica" (na tradução anterior de Baskin, o termo "fonologia " é usado) - eles estão conectados em "nós » durg contra um amigo para fazer sons. Por exemplo, em inglês, a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

Já mencionei que a fonologia em seu desenvolvimento se baseou nas ideias de Saussure. Embora sua análise da fisiologia linguística nos tempos modernos, diz Harris, "fosse chamada de 'física', em oposição a 'psicológica' ou 'funcional', em The Course ele articulou claramente a direção e os princípios básicos da análise funcional da linguagem. Seu único trabalho publicado durante sua vida, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Notas sobre o sistema vocálico original nas línguas indo-europeias), publicado em 1878, estava completamente alinhado com a linguística histórica comparativa do século 19. Não obstante, nesta obra, diz Jonathan Culler, Saussure mostrou “a fecundidade da ideia de linguagem como um sistema de fenômenos interligados, mesmo com sua reconstrução histórica”. Analisando a relação entre os fonemas, explicando a alternância de vogais nas línguas modernas do grupo indo-europeu, Saussure sugeriu que além de vários sons diferentes "a", deve haver outros fonemas que são descritos formalmente. “O que marca especialmente a obra de Saussure”, conclui Kaller, “é que quase 50 anos depois, quando o cuneiforme hitita foi descoberto e decifrado, foi encontrado um fonema, na escrita denotada por “h”, que se comportou como Saussure previu. Através da análise formal, ele descobriu o que hoje é conhecido como som gutural nas línguas indo-européias.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras (designação) e seu resultado (comunicação) - e essas duas funções nunca coincidem (veja "Desconstrução da linguagem" de Shleifer). Podemos ver a alternância de forma e conteúdo que Greimas e Kurte descrevem na versão mais recente da interpretação: os contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem em níveis sucessivos para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que, em uma língua, os traços distintivos formam um contraste fonético em um nível diferente de compreensão, os fonemas são combinados em morfemas contrastantes, morfemas - em palavras, palavras - em frases etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que a soma de suas partes (assim como a água, no exemplo de Saussure, mais do que a combinação de hidrogênio e oxigênio).

Os três pressupostos do “Curso de Linguística Geral” levaram Saussure à ideia de uma nova ciência do século XX, separada da linguística, estudando a “vida dos signos na sociedade”. Saussure chamou essa ciência de semiologia (do grego "semeion" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, estendeu o estudo da linguagem e das estruturas linguísticas em achados literários compostos (ou formulados) em termos dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era em muitos aspectos o oposto do racionalismo em sua análise linguística: era uma tentativa, como escreve Saussure em um dos 99 cadernos, de estudar no sistema o problema da "probabilidade", que "torna-se a base de tudo. " Tal investigação, afirma o próprio Saussure, ajuda a focalizar o "lado real" da probabilidade; A “palavra-chave” para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, “uma ferramenta para o poeta, e não a fonte de vida para o poema. O poema serve para inverter os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras, é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela extrapola o controle da consciência e depende apenas de as leis da linguagem”.

A tentativa de Saussure de estudar nomes próprios na poesia romana tardia (Tsvetan Todorov chamou isso de abreviação de "uma palavra... a essência formal da linguística saussureana ("Linguagem", afirma ele, "a essência da forma, não do fenômeno"), que exclui a possibilidade de analisar o significado. Todorov conclui que hoje os escritos de Saussure parecem notavelmente consistentes em sua relutância em estudar símbolos [fenômenos que têm um significado bem definido]. . . . Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Situando-se entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação acidental baseados nesses conceitos, e, por outro lado, conceitos estruturalistas, que Lévi-Strauss chamou de “kantismo sem ator transcendente”. "- apagando a oposição entre forma e conteúdo (sujeito e objeto), significado e origem no estruturalismo, na psicanálise e mesmo na mecânica quântica, os escritos de Ferlinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Ronald Shleifer

Literatura

1. Admoni V.G. Fundamentos da teoria da gramática / V.G. Admoni; Academia de Ciências da URSS.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Métodos matemáticos em linguística. M., 1974.

4. Arnold I.V. A estrutura semântica da palavra no inglês moderno e a metodologia para seu estudo. /4. Arnold-L.: Educação, 1966. - 187 p.

6. Bashlykov A.M. Sistema de tradução automática. / SOU. Bashlykov, A. A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7.Baudouin de Courtenay: Patrimônio teórico e modernidade: Resumos dos relatórios da conferência científica internacional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Linguagem e estatística. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Lingüística teórica e aplicada. / V. A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semântica. Sintaxe. Morfologia. // V. B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. INTRODUÇÃO à linguagem formal da linguística / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., fl.

Matveeva G.G. Significados gramaticais ocultos e identificação da pessoa social (“retrato”) do falante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Experiência na construção de modelos linguísticos "Significado<-->Texto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Tradução e linguística aplicada / L.L. Nelyubin. - M.: Escola Superior, 1983. - 207 p.

16. Sobre os métodos exatos de pesquisa linguística: sobre a chamada "linguística matemática" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e outros - M., 1961. - 162 p.

17. Piotrovsky L.G. Lingüística Matemática: Livro Didático / L.G. Piotrovsky, K. B. Bektaev, A. A. Piotrovskaya. - M.: Escola Superior, 1977. - 160 p.

18. Ele é. Texto, máquina, pessoa. - L., 1975. - 213 p.

19. Ele é. Lingüística Aplicada / Ed. A. S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelos de linguagem. M., 1963. Revzin, I.I. Lingüística Estrutural Moderna. Problemas e métodos. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Fundamentos de tradução geral e automática / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. A teoria de F. de Saussure à luz da linguística moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Coruja, L.Z. Lingüística Analítica / L.Z. Coruja - M., 1970. - 192 p.

24. Saussure F. de. Notas sobre Lingüística Geral / F. de Saussure; Por. de fr. - M.: Progresso, 2000. - 187 p.

25. Ele é. Curso de Lingüística Geral / Per. de fr. - Ecaterimburgo, 1999. -426 p.

26. Estatísticas de fala e análise automática de texto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lógica. Teorias axiomáticas. / R. Stoll; Por. do inglês. - M., 1968. - 180 p.

28. Tenier, L. Fundamentos da sintaxe estrutural. M., 1988.

29. Ubin I.I. Automação das atividades de tradução na URSS / I.I. Ubin, L. Yu. Korostelev, B. D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Processamento de informações conceituais. M., 1980.

32. Shikhanovich, Yu.A. INTRODUÇÃO à matemática moderna (conceitos iniciais). M., 1965

33. Shcherba L.V. Vogais russas em termos qualitativos e quantitativos / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cidadão do mundo // Spark - 1996. - No. 5. - p.13

35. V.A. Uspensky. Preliminar para os leitores da "New Literary Review" às mensagens semióticas de Andrei Nikolaevich Kolmogorov. - Nova Revisão Literária. -1997. - Nº 24. - S. 18-23

36. Perlovsky L. Consciência, linguagem e cultura. - Conhecimento é poder. -2000. №4 - S. 20-33

Introdução? Teoria da Tradução de Palestra

Portal para o aluno. Autotreinamento

Ronald Shleifer

Download:

Visualização:

Legendas dos slides:

ARTIGOS RELACIONADOS