Métodos matemáticos em linguística. Dicionário Enciclopédico Linguístico

disciplina matemática, cujo tema é o desenvolvimento de um aparato formal para descrever a estrutura de linguagens naturais e algumas artificiais. Originado na década de 1950. século 20; um dos principais estímulos para o aparecimento de M. l. serviu como uma necessidade madura em linguística para esclarecer seus conceitos básicos. Métodos M.l. têm muito em comum com os métodos da lógica matemática - uma disciplina matemática que estuda a estrutura do raciocínio matemático - e, em particular, com seções como a teoria dos algoritmos e a teoria dos autômatos. São amplamente utilizados em M. l. também métodos algébricos. M.l. desenvolve em estreita interação com a linguística. Às vezes, o termo "M. eu." também é usado para se referir a qualquer pesquisa linguística que use algum tipo de aparato matemático.

A descrição matemática da linguagem é baseada na ideia de linguagem de F. de Saussure como um mecanismo, cujo funcionamento se manifesta na atividade de fala de seus falantes; seu resultado são "textos corretos" - sequências de unidades de fala sujeitas a certos padrões, muitos dos quais permitem a descrição matemática. O desenvolvimento e estudo de métodos para a descrição matemática de textos corretos (principalmente frases) é o conteúdo de uma das seções de M. l. - teoria de maneiras de descrever a estrutura sintática. Para descrever a estrutura de uma frase - mais precisamente, sua estrutura sintática - pode-se destacar nela constituintes- grupos de palavras que funcionam como unidades sintáticas integrais, ou indicam para cada palavra aquelas que estão diretamente subordinadas a ela (se houver). Assim, na frase “O cocheiro senta-se na irradiação” (A. S. Pushkin), quando descrito de acordo com o 1º método, os componentes serão a frase inteira P, cada uma de suas palavras individuais e grupos de palavras A = senta-se na irradiação e B = na irradiação (ver. Fig. 1, as setas significam "aninhamento imediato"); a descrição de acordo com o 2º método dá o circuito mostrado na fig. 2. Os objetos matemáticos resultantes são chamados sistema de componentes(1º método) e árvore de subordinação sintática(2º método).

Mais precisamente, o sistema de componentes é um conjunto de segmentos de uma frase, contendo como elementos a frase inteira e todas as ocorrências de palavras nesta frase (“segmentos de palavra única”) e tendo a propriedade de que cada dois segmentos incluídos nela não se cruzam, ou um deles está contido em um diferente; uma árvore de subordinação sintática, ou simplesmente uma árvore de subordinação, é uma árvore cujo conjunto de nós é o conjunto de ocorrências de palavras em uma frase. árvore em matemática, um conjunto é chamado, entre os elementos dos quais - eles são chamados nós- uma relação binária é estabelecida - é chamada subordinação e representado graficamente por setas que vão dos nós subordinados aos subordinados - de tal forma que: 1) entre os nós há exatamente um - é chamado raiz, - não subordinado a nenhum nó; 2) cada um dos outros nós está subordinado a exatamente um nó; 3) é impossível, partindo de qualquer nó ao longo das setas, retornar ao mesmo nó. Os nós da árvore de subordinação são as ocorrências de palavras nas frases. Com uma representação gráfica, o sistema de componentes (como na Fig. 1) também assume a forma de uma árvore ( árvore de componentes). Uma árvore de subordinação ou um sistema de componentes construído para uma frase é frequentemente chamado estrutura sintática na forma de uma árvore de subordinação (sistema de componentes). Os sistemas de componentes são usados principalmente em descrições de idiomas com uma ordem de palavras rígida, árvores de subordinação são usadas em descrições de idiomas com uma ordem de palavras livre (em particular, russo), formalmente para cada frase (não muito curta), muitas diferentes estruturas sintáticas de qualquer um dos dois tipos podem ser construídas, mas entre elas, apenas uma ou algumas estão corretas. A raiz da árvore de subordinação correta geralmente é o predicado. Uma sentença que tem mais de uma estrutura sintática correta (do mesmo tipo) é chamada sintaticamente homônimo; como regra, diferentes estruturas sintáticas correspondem a diferentes significados da frase. Por exemplo, a frase "Alunos de Rzhev foram para Torzhok" permite duas árvores de subordinação regulares (Fig. 3, a, b); o primeiro deles corresponde ao significado “Os alunos de Rzhev foram (não necessariamente de Rzhev) para Torzhok”, o segundo - “Os alunos (não necessariamente Rzhev) foram de Rzhev para Torzhok”.

Em russo e em vários outros idiomas, as árvores de subordinação de frases de "estilo de negócios", como regra, obedecem a lei da projetividade, que consiste no fato de que todas as setas podem ser desenhadas sobre a linha em que a frase está escrita, de modo que duas delas não se cruzem e a raiz não esteja sob nenhuma seta. Na linguagem da ficção, especialmente na poesia, os desvios da lei da projetividade são permitidos e na maioria das vezes servem à tarefa de criar um certo efeito artístico. Assim, na frase “Amigos da antiguidade sangrenta do povo aguardavam a guerra” (Pushkin), a não-projetividade leva a uma ênfase enfática na palavra “povo” e ao mesmo tempo, por assim dizer, retarda a fala , criando assim a impressão de uma certa euforia e solenidade. Existem outros sinais formais de árvores de subordinação que podem ser usados para caracterizar o estilo. Por exemplo, o número máximo de setas aninhadas serve como medida do “volume sintático” de uma sentença (veja a Fig. 4).

Para uma descrição mais adequada da estrutura da frase, os componentes geralmente são marcados com símbolos de categorias gramaticais (“grupo nominal”, “grupo de verbo transitivo”, etc.), e as setas da árvore de subordinação - com símbolos de relações (“predicativo”, “atributivo”, etc.).

O aparato de árvores de subordinação e sistemas de componentes também é usado para representar a estrutura sintática profunda de uma sentença, que forma um nível intermediário entre a estrutura semântica e a estrutura sintática ordinária (esta última é freqüentemente chamada de sintática superficial).

Uma representação mais perfeita da estrutura sintática de uma frase (requerendo, no entanto, um aparato matemático mais complexo) é dada por sistemas de grupos sintáticos, que incluem tanto frases quanto links sintáticos, e não apenas entre palavras, mas também entre frases. Os sistemas de grupos sintáticos permitem combinar o rigor de uma descrição formal da estrutura de uma frase com a flexibilidade inerente às descrições tradicionais e informais. Árvores de subordinação e sistemas de componentes são casos especiais extremos de sistemas de grupos sintáticos.

Outra seção de M. l., que nela ocupa um lugar central, é teoria das gramáticas formais, cujo início foi estabelecido pelas obras de N. Chomsky. Estuda formas de descrever padrões que não caracterizam mais um único texto, mas todo o conjunto de textos corretos de uma determinada língua. Esses padrões são descritos usando gramática formal- um "mecanismo" abstrato que permite, usando um procedimento uniforme, obter os textos corretos de uma determinada língua juntamente com descrições de sua estrutura. O tipo de gramática formal mais utilizado é gramática generativa, ou a gramática de Chomsky, que é um sistema ordenado Г = ⟨ V, W, P, R ⟩, onde V e W são conjuntos finitos disjuntos, chamados respectivamente a Principal, ou terminal, e auxiliar, ou não terminal, alfabetos(seus elementos são chamados, respectivamente, de principal, ou terminal, e auxiliar, ou não terminal, símbolos), P é um elemento de W, chamado símbolo inicial, e R é um conjunto finito as regras da forma φ → ψ, onde φ e ψ são cadeias (sequências finitas) de símbolos principais e auxiliares. Se φ → ψ é uma regra gramatical G e ω 1 , ω 2 são cadeias de símbolos básicos e auxiliares, dizem que a cadeia ω 1 ψω 2 diretamente derivável em Г de ω 1 φω 2 . Se ξ 0 , ξ 1 , ..., ξ n são cadeias e para cada i = 1, ..., n a cadeia ξ i é diretamente derivável de ξ i−1 , dizemos que ξ n derivável para Г de ξ 0 . O conjunto dessas cadeias de símbolos básicos que são dedutíveis em Г de seu símbolo inicial é chamado linguagem gerada pela gramáticaГ, e é denotado por L(Г). Se todas as regras Г têm a forma η 1 Aη 2 → η 1 ωη 2 , então Г é chamado a gramática dos constituintes(ou diretamente componentes), abreviado como NS- gramática; se, além disso, em cada regra as cadeias η 1 e η 2 ( contextos direito e esquerdo) estão vazios, então a gramática é chamada livre de contexto(ou livre de contexto), abreviado B- gramática(ou KS- gramática). Na interpretação linguística mais comum, os símbolos principais são palavras, os símbolos auxiliares são símbolos de categorias gramaticais, o símbolo inicial é o símbolo da categoria “frase”; a linguagem gerada pela gramática é interpretada como o conjunto de todas as sentenças gramaticalmente corretas da linguagem natural dada. Em uma gramática NN, a derivação de uma sentença fornece uma árvore de constituintes para ela, na qual cada constituinte consiste em palavras "derivadas" de um símbolo auxiliar, de modo que para cada constituinte é indicada sua categoria gramatical. Então, se a gramática tem, entre outras, as regras P → S x, y, im, V y → V i y O, O → S x, y, preposição, V i y → senta, S marido, singular, im → on , cocheiro, S marido, sing., proposição. → irradiação, então a frase "O cocheiro está sentado na irradiação" tem a saída mostrada na Fig. 5, onde as setas vão das partes esquerdas das regras aplicadas aos elementos das partes direitas. O sistema de componentes correspondente a esta conclusão coincide com o mostrado na Fig. 1. Outras interpretações também são possíveis: por exemplo, os símbolos principais podem ser interpretados como morfos, auxiliares - como símbolos de tipos de morfos e cadeias de morfos aceitáveis, o símbolo inicial - como um símbolo do tipo "forma de palavra" e a linguagem gerada pela gramática - como um conjunto de formas regulares de palavras (interpretação morfológica); interpretações morfológicas e fonológicas também são comuns. Descrições reais de línguas geralmente usam gramáticas "multiníveis" que contêm regras sintáticas, morfológicas e morfofonológicas de trabalho sequencial.

Outro tipo importante de gramática formal é gramática de dominância, que gera um conjunto de cadeias, geralmente interpretadas como sentenças, juntamente com suas estruturas sintáticas na forma de árvores de subordinação. Gramática de grupos sintáticos gera um conjunto de sentenças juntamente com suas estruturas sintáticas, que têm a forma de sistemas de grupos sintáticos. Existem também vários conceitos gramática transformacional (gramáticas em árvore), que serve não para gerar sentenças, mas para transformar árvores interpretadas como árvores de subordinação ou árvores de constituintes. Um exemplo seria Δ- gramática- um sistema de regras de transformação de árvores interpretadas como árvores de subordinação de frases “puras”, ou seja, árvores de subordinação sem uma ordem linear de palavras.

se destacar Gramáticas de Montague, que servem para descrever simultaneamente as estruturas sintáticas e semânticas da frase; eles usam um complexo aparato matemático e lógico (o chamado lógica intencional).

As gramáticas formais são usadas para descrever não apenas linguagens naturais, mas também linguagens artificiais, especialmente linguagens de programação.

Em M.l. também desenvolveu modelos analíticos língua, na qual, a partir de determinados dados sobre a fala considerados conhecidos, são feitas construções formais, cujo resultado é a descrição de alguns aspectos da estrutura da língua. Esses modelos geralmente usam um aparato matemático simples - conceitos simples de teoria dos conjuntos e álgebra; portanto, os modelos analíticos da linguagem são às vezes chamados teórico dos conjuntos. Nos modelos analíticos do tipo mais simples, os dados iniciais são o conjunto de sentenças corretas e o sistema arredores- conjuntos de "palavras" pertencentes a um lexema (por exemplo, (casa, casa, casa, casa, casa, casa, casa, casa, casa, casa)). O conceito derivado mais simples em tais modelos é substituibilidade: palavra uma substituído por uma palavra b, se cada sentença correta contendo uma ocorrência da palavra uma, permanece válido quando esta ocorrência é substituída por uma ocorrência da palavra b. Se um uma substituível por b e b no uma, eles disseram aquilo uma e b intercambiável. (Por exemplo, em russo a palavra "azul" é substituída pela palavra "azul"; as palavras "azul" e "azul" são intercambiáveis.) A classe de palavras que são intercambiáveis entre si é chamada família. De bairros e famílias, várias outras classificações de palavras linguisticamente significativas podem ser derivadas, uma das quais corresponde aproximadamente ao sistema tradicional de partes do discurso. Em outro tipo de modelos analíticos, ao invés de um conjunto de sentenças corretas, é utilizada uma potencial relação de subordinação entre palavras, ou seja, a capacidade de uma delas subordinar a outra em sentenças corretas. Nesses modelos, pode-se obter, em particular, definições formais de uma série de categorias gramaticais tradicionais - por exemplo, a definição formal do substantivo caso, que é um procedimento que permite restaurar o sistema de casos da língua, sabendo apenas a relação de subordinação potencial, o sistema de vizinhanças e o conjunto de palavras que são formas de substantivos.

Os modelos analíticos da linguagem utilizam conceitos simples de teoria dos conjuntos e álgebra. Perto de modelos analíticos de linguagem modelos de descriptografia- procedimentos que permitem obter uma série de dados sobre sua estrutura a partir de um corpus de textos suficientemente grande em um idioma desconhecido sem qualquer informação preliminar sobre ele.

De acordo com sua finalidade, M. l. é principalmente uma ferramenta da linguística teórica. Ao mesmo tempo, seus métodos são amplamente utilizados na pesquisa linguística aplicada - processamento automático de texto, tradução automática e desenvolvimentos relacionados à chamada comunicação entre uma pessoa e um computador.

Kulagina O. S., Sobre uma maneira de definir conceitos gramaticais baseados na teoria dos conjuntos, em: Problemas da Cibernética, c. 1, Moscou, 1958;
Chomsky N., Estruturas sintáticas, na coleção: "Novo em linguística", v. 2, M., 1962;
Suave A.V., Melchuk I. A., Elementos de linguística matemática, M., 1969 (lit.);
seu próprio, Grammars of Trees, I, II, em: Questões Informacionais de Semiótica, Lingüística e Tradução Automática, c. 1, 4, M., 1971-74 (lit.);
Marco S., Modelos teóricos de conjuntos de linguagens, trad. de English, M., 1970 (lit.);
Suave A. V., Gramáticas formais e linguagens, M., 1973 (lit.);
seu próprio, Uma tentativa de definir formalmente os conceitos de caso e gênero de um substantivo, em Sat: Problemas de modelagem gramatical, M., 1973 (lit.);
seu próprio, Estruturas sintáticas de linguagem natural em sistemas de comunicação automatizados, M., 1985 (lit.);
Sukhotin BV, Métodos de otimização para pesquisa de linguagem. M., 1976 (lit.);
Sevbo I.P., Representação gráfica de estruturas sintáticas e diagnósticos estilísticos, K., 1981;
Festa B. Kh., Gramática Montagu, representações mentais e realidade, no livro: Semiotics, M., 1983;
Montague R., Filosofia formal, New Haven - L., 1974(aceso.).

Não há dúvida de que o uso de métodos matemáticos e lógicos ("métodos exatos") em linguística foi amplamente estimulado pelas tarefas da linguística aplicada. Se foram feitas tentativas de aplicar esses métodos para resolver problemas diretamente relacionados ao campo da linguística teórica, por exemplo, para distinguir entre os fenômenos da linguagem e da fala * , então no futuro (embora, talvez, nem sempre claro e próximo), ainda tinham em mente as necessidades da linguística aplicada. Aliás, isso significa que a avaliação dos resultados de tais operações deve ser feita com a obrigatoriamente consideração dos objetivos da linguística aplicada.

* (Veja: G. Herdan, Language as Choice and Chance, Groningen, 1956.)

O sucesso de usar esses métodos em um campo completamente novo, de um ponto de vista geral, é em grande parte determinado pela resposta à pergunta sobre até que ponto é permitido identificar uma linguagem logicamente correta com uma linguagem natural, ou, em outra formulação, é possível reduzir a segunda à primeira * . A resposta a essa pergunta costuma ser dada de forma prática - por meio da construção de modelos estatísticos, teóricos da informação, teóricos dos conjuntos, probabilísticos e outros modelos matemáticos da linguagem, que, no entanto, nem sempre são focados em tarefas específicas ** . Ao construir modelos desse tipo, seus autores muitas vezes partem do pressuposto (óbvio do seu ponto de vista) de que qualquer aplicação de um aparato lógico-formal ou matemático à descrição e pesquisa linguística contribui automaticamente para seu aprimoramento. Nesta ocasião, Warren Plyat disse bem em sua revisão de trabalhos sobre linguística matemática: “Se considerarmos os modelos de linguagem como sistemas abstratos de elementos discretos, então vários conceitos e métodos matemáticos podem ser aplicados a eles, desde a ideia elementar de um número a complexas “operações lógicas, estatísticas e teóricas de conjuntos”. No entanto, a noção de que qualquer uso de números e operações matemáticas para descrever tais sistemas de elementos torna as declarações mais "exatas" ou mais "científicas" é completamente errônea. Em primeiro lugar, deve-se mostrar que o novo sistema assim obtido é um modelo mais satisfatório do que o sistema original, seja no sentido de que permite formular afirmações teóricas mais simples e mais gerais sobre certos aspectos da área modelada, seja no sentido de que porque as operações no modelo esclarecem os resultados das operações correspondentes no domínio modelado. Um dos principais perigos associados à construção de modelos matemáticos da linguagem, especialmente os quantitativos, é que o uso indiscriminado do aparato matemático a resultados sem sentido e enganosos. É necessário entender claramente, portanto, que um pré-requisito para o enriquecimento da linguística com a ajuda da matemática não é apenas o conhecimento das áreas relevantes da matemática, mas, além disso, uma compreensão profunda da essência da linguística. problemas, cuja solução deve visar métodos matemáticos" *** .

* (qua A observação de G. Curry: "O fato de que há uma estreita conexão entre matemática e lógica, por um lado, e linguagem, por outro, tornou-se óbvio por muito tempo, e agora esse fato tornou-se o foco de atenção em um pensamento mais rigoroso..." (N. V. Curry, Some Logical Aspects of Grammatical Structure, in Proceedings of the Symposium "Structure of Language and its Mathematical Aspects", Providence, 1961, p. 57).)

** (A este respeito, a observação de P. Garvin (feita por ele em uma revisão de W. Bar-Hillel, Language and Information: Selected Essays on Their Theory and Application, Londres, 1964) parece ser muito oportuna: "A maioria dos trabalhos sobre a teoria do processamento da informação e aplicações para seus propósitos de máquinas computacionais, é completamente ingênua e, sem dúvida, não tão útil quanto seria desejável. Em relação à posição negativa de Bar-Hillel em relação à eficácia dos métodos lógico-matemáticos para o processamento automático da informação da fala, P. Garvin acredita que ainda contém elementos positivos, pois essa posição "fará pelo menos alguns cientistas levarem suas teorias menos a sério" (American Documentation, New York, Vol. 16, No. 2, 1965, p. 127).)

*** (W. Plath, Lingüística Matemática. In: "Trends in European and American Linguistics 1930-1960", Antuérpia, 1961, pp. 22-2E.)

Para, se possível, evitar o perigo apontado por Warren Plat, é necessário não apenas ter tentativas puramente empíricas para responder à questão formulada acima, mas também lutar por sua compreensão teórica geral. De fato, a questão da redutibilidade de uma língua natural a um ou outro modelo lógico-matemático ou interpretação dela é a questão principal da teoria da linguística aplicada, cuja necessidade se faz sentir cada vez mais urgentemente. Ao considerar esta questão, em primeiro lugar, a natureza dos fenômenos que constituem o objeto de estudo, por um lado, a lógica e a matemática e, por outro, a linguagem natural, e também as possibilidades dos métodos pelos quais cada um desses trabalhos de ciências, devem ser considerados. Já a partir de um estudo comparativo desses pontos, será possível tirar algumas conclusões gerais, que poderão ser de alguma utilidade para todos aqueles que, por necessidade, tenham que realizar suas pesquisas na intersecção das ciências elencadas.

Até certo ponto esse objetivo é atendido pelo simpósio "A Estrutura da Linguagem e seus Aspectos Matemáticos" realizado pela American Mathematical Society*. Mas todos eles, como fica claro pelo próprio título do simpósio, afetam apenas aspectos individuais e em alguns casos muito particulares do problema que nos interessa. Embora em sua totalidade criem pré-requisitos suficientemente fundamentados para responder à questão que estamos considerando, ainda carecem de uma formulação clara e inequívoca das conclusões necessárias. De muitas maneiras, os participantes do simpósio continuam a linha de tentativas empíricas para resolver a questão, de forma alguma oferecendo obsessivamente seus experimentos à atenção dos linguistas na esperança de que eles mesmos descubram como as hipóteses e soluções apresentadas por eles revelar-se adequado aos seus propósitos.

* ("Estrutura da Linguagem e seus Aspectos Matemáticos". Proc. do Soc. de Ap. Math., 12. Providence, 1961.)

Mais adequado, portanto, como ponto de partida para a compreensão dos resultados do trabalho de linguistas, lógicos e matemáticos no plano que estamos analisando são dois artigos colocados na coleção "Linguagem Natural e a Máquina Computacional"*: M. Meron "A ponto de vista do lógico sobre o processamento de dados linguísticos" e P Garvin e V. Karash "Linguística, processamento de dados linguísticos e matemática". Eles delineiam as possibilidades de trabalho da lógica e da matemática, sua relação com as ciências empíricas, métodos de resolução de problemas, etc. Passemos à consideração dos problemas levantados por esses artigos do ponto de vista da questão que foi formulada acima.

* ("Linguagem Natural e o Computador", ed. bv P. Garvin, Nova York, 1963.)

2

Parece que já temos uma resposta absolutamente inequívoca para nossa pergunta. Assim, por exemplo, N. D. Andreev e JI. R. Zinder escreve: "A representação matemática (modelo) das linguagens não é de forma alguma idêntica à própria linguagem" * . Eles também são seguidos pelo autor do livro "Modelos de linguagem" II Revzin, que aponta que como resultado da modelagem, apenas "uma aproximação mais ou menos próxima dos dados da realidade concreta" ** pode aparecer. No entanto, dizer isso significa não dizer nada ainda, uma vez que não foi revelado por que é assim e se ainda se deve recorrer ao método de modelagem matemática e lógica e, em caso afirmativo, em que medida e com que finalidade.

* (N. D. Andreev, L. R. Zinder, Problemas básicos de linguística aplicada, "Problemas de Linguística", 1959, No. 4, p. 18.)

** (I. I. Revzin, Models of language, M., 1962, p. 8. Aliás, a expressão "aproximação" é uma tautologia direta: aproximação.)

Para resolver todas essas questões, estabelece-se inicialmente como ponto de partida quais ciências - indutivas ou dedutivas - incluem a linguística, a lógica e a matemática. Quanto às duas últimas ciências, sua posição é clara - elas pertencem, sem dúvida, às ciências dedutivas, baseadas em sua metodologia de pesquisa na inferência. A linguística é tradicionalmente definida como uma ciência empírica, o que implica que seu principal objetivo científico é descrever fatos. Isso significa, aparentemente, que a linguística deve ser atribuída ao campo das ciências indutivas. Isso também significa que, em um esforço para usar o aparato formal da lógica e da matemática na linguística, eles estão tentando aplicar métodos dedutivos de pesquisa na ciência indutiva.

No entanto, nos últimos anos, a natureza indutiva da ciência da linguagem - a linguística tem sido questionada direta ou indiretamente. L. Elmslev fez isso da forma mais nítida. É verdade que a terminologia que ele usa é muito inconsistente e, em particular, é caracterizada por uma compreensão peculiar e muito pessoal dos termos "dedução" e "indução" (na verdade, ele os interpreta de maneira completamente oposta). No entanto, os fundamentos de sua teoria linguística que ele expõe não deixam dúvidas sobre sua essência metodológica. Assim, ele considera aceitável usar quaisquer definições operacionais iniciais, o que é típico das ciências dedutivas. E ele mesmo caracteriza sua teoria nos seguintes termos: “1. Uma teoria em nosso sentido é em si mesma independente da experiência. de suas premissas 2. Por outro lado, a teoria inclui uma série de premissas, das quais se sabe por experiência anterior que satisfazem as condições de aplicação a certos dados experimentais. Essas premissas são as mais gerais e podem, portanto, satisfazer as condições de aplicação a um grande número de dados experimentais" * .

* ("Prolegômenos para a Teoria da Linguagem". Sentado. "Novo em Linguística", vol. 1, M., 1960, pp. 274-275.)

Como fica claro a partir desta afirmação, L. Elmslev procura realizar a ideia da dupla natureza metodológica dos objetos de pesquisa linguística, com ênfase predominante em suas características dedutivas. Ele também deve ser creditado com essa forma bastante ambígua (“por um lado ... mas por outro lado ...”), que geralmente se tornou característica da consideração desta questão (e que permite qualquer direção). A ideia da dualidade metódica da linguística recebeu recentemente ampla circulação e até serviu de base teórica para a formulação dos princípios e da tendência mais recente na ciência da linguagem - a linguística dos universais (universalismo). O "Memorando sobre os universais linguísticos" diz a esse respeito: "O estudo dos universais linguísticos leva a toda uma série de generalizações empíricas sobre o comportamento linguístico - ambas ainda exigindo experimentos e já estabelecidas. Essas generalizações são material potencial para a construção de uma estrutura dedutiva de No entanto, algumas e talvez a maioria delas ainda têm apenas o status de generalizações empíricas, que, no estado atual de nosso conhecimento, não podem ser correlacionadas com generalizações ou derivadas dedutivamente de leis de validade mais geral" * . J. Greenberg se expressa com não menos definição em seu prefácio à coleção dedicada aos universais linguísticos. Argumentando com as conhecidas palavras de L. Bloomfield de que "as únicas generalizações legítimas sobre a linguagem são as generalizações indutivas", ele escreve: "No entanto, parece ser geralmente aceito que o método científico deve ser não apenas indutivo, mas também dedutivo. As generalizações de formulação obtidas por investigação indutiva conduzem a hipóteses teóricas, com base nas quais outras generalizações podem, por sua vez, ser deduzidas por dedução. Estas últimas devem então ser submetidas a verificação empírica" ** .

* ("Memorandum Concerning Language Universals", "Universais of Language", ed. por J. Greenberg, Cambridge, Mass., 1963, p. 262-263.)

** ("Universais da Linguagem", p. IX.)

O fato de a história da linguística consistir não apenas no acúmulo dos fatos de uma língua e sua classificação, mas também em uma mudança de pontos de vista sobre a própria língua, o que implica inevitavelmente uma diferença de abordagem dos fatos linguísticos e até mesmo de sua diferentes interpretações teóricas, fez com que alguns linguistas soviéticos também chegassem a conclusões sobre a dualidade metodológica de sua ciência. S. K. Shaumyan prefere, no entanto, falar do método hipotético-dedutivo e delineia suas características da seguinte forma: “O método hipotético-dedutivo é um procedimento cíclico que começa com fatos e termina com fatos. Quatro fases são distinguidas neste procedimento:

fixação de fatos que requerem explicação;
apresentar hipóteses para explicar esses fatos;
derivação de hipóteses de predições sobre fatos que estão fora do alcance dos fatos para a explicação de quais hipóteses foram apresentadas;
verificar os fatos que são previstos por hipóteses e determinar a probabilidade de hipóteses.

O método hipotético-dedutivo é fundamentalmente diferente do método indutivo usado em campos do conhecimento como, por exemplo, botânica descritiva ou zoologia "*. O método de S.K. Shaumyan na verdade repete completamente o método de linguística dos universais de J. Greenberg. a única diferença está no nome. Se, por exemplo, J. Greenberg fala de uma combinação de métodos indutivos e dedutivos, então S. K. Shaumyan chama seu método de hipotético-dedutivo: a designação é claramente inconsistente para um método que "começa com fatos e termina com fatos”.

* (S. K. Shaumyan, Problems of Theoretical Phonology, Moscou, 1962, pp. 18-19. Sobre o método hipotético-dedutivo, ver também o artigo de V. S. Shvyrev "Algumas questões da análise lógica e metodológica da relação entre os níveis teórico e empírico do conhecimento científico" em Sat. "Problemas da lógica do conhecimento científico" (M., 1964), pp. 66-75 (3ª seção do artigo).)

A questão de onde a linguística deve ser atribuída também é feita por I. I. Revzin. “Por sua própria natureza”, ele responde a essa pergunta, “a linguística deve antes de tudo usar métodos indutivos, descreve atos de fala específicos de línguas específicas ...

Por outro lado, a presença de um conjunto infinito de atos de fala estudados por um linguista dificilmente permite formular os conceitos básicos da ciência da linguagem por generalização por indução.

Segue-se que os linguistas precisam não apenas de métodos de pesquisa indutivos, mas também dedutivos, a fim de obter um sistema de conhecimento geral que ajude a compreender os dados obtidos na análise de línguas específicas ...

Em sua parte dedutiva, a linguística, aparentemente, pode ser construída da mesma forma que a lógica ou a matemática, a saber: um certo número mínimo de termos primários indefinidos é destacado, e todos os outros termos são definidos por meio de termos primários. Ao mesmo tempo, algumas afirmações primárias sobre a conexão desses termos entre si (axiomas) devem ser claramente formuladas, e todas as outras afirmações devem ser provadas, isto é, reduzidas a algumas outras afirmações” * .

* (I.I. Revzin, Models of language, M., 1962, pp. 7-8.)

Aqui o método de dedução, incorporado na lógica e na matemática, atua apenas como um meio de ordenar o "conjunto de atos de fala" com o propósito de criar um "sistema de conceitos gerais". Em contradição direta com essa tarefa, porém, está a apresentação do próprio método dedutivo, recomendado para uso em linguística. Ela é completamente pensada tanto a partir de atos quanto de fatos, e para o momento inicial de construção de um sistema de conceitos linguísticos gerais, toma-se um conjunto de termos primários indefinidos e, aparentemente, absolutamente condicionais, através dos quais todos os termos subsequentes são definidos.

Essa contradição não é acidental, está na própria natureza das ciências que estamos considerando. Parece que a conclusão de que uma combinação de métodos indutivos e dedutivos é aceitável no estudo de objetos linguísticos abre a porta para o uso de métodos lógicos e matemáticos em linguística, e a implementação específica desta conclusão é a criação de numerosos métodos formais. modelos lógicos e matemáticos da linguagem. Mas, como ficará claro a seguir, uma abordagem tão simplificada não pode dar resultados satisfatórios. Podemos concordar que na pesquisa linguística é permissível e até necessário combinar métodos dedutivos e indutivos. Afinal, como escreveu W. Bröndal, "a indução nada mais é do que uma dedução disfarçada, e por trás das puras conexões estabelecidas entre os fenômenos observados, a realidade, objeto específico dessa ciência, é absolutamente inevitável" * . Mas isso não significa que o aparato formal da lógica e da matemática deva ser incondicional e mecanicamente transferido para a linguística sem qualquer consideração do "objeto específico dessa ciência". Como bem observa o mesmo I. I. Revzin, “as evidências obtidas por meios dedutivos, por mais irrepreensíveis que sejam do ponto de vista lógico, ainda não dizem nada sobre as propriedades da linguagem real descrita pelo modelo” ** . E para determinar a eficácia dos modelos, ele recomenda recorrer à prática, que é a tradução automática e "outras aplicações práticas da linguística".

* (B. Bröndal, Lingüística Estrutural. Citado do livro: V. A. Zvegintsev, História da linguística nos séculos XIX e XX. em ensaios e extratos, parte II, Moscou, 1965, p. 95.)

** (I. I. Revzin, Models of language, M., 1962, p. 10.)

E a prática da linguística aplicada mostra que são impostas restrições muito estritas ao uso de métodos matemáticos e lógicos no estudo dos fenômenos linguísticos.

3

A lógica fornece um exemplo do uso mais consistente do método dedutivo. A matemática segue em grande parte a lógica nesse sentido e, portanto, podem ser consideradas em conjunto.

É claro que tanto a lógica quanto a matemática não representam sistemas homogêneos em termos de seus métodos e interpretação de objetivos. Assim, por exemplo, em relação à lógica, podemos falar de lógica dialética, formal, matemática e, em um sentido mais restrito, de objetiva, semântica, fenomenológica, transcendental ou construtiva, combinatória, multivalorada, modal etc. Necessariamente, porém, será necessário pensar em todas essas divisões e falar apenas das características mais gerais inerentes à lógica e à matemática em geral, e principalmente daquelas que demonstram mais claramente a natureza dedutiva dos métodos dessas ciências.

Tendo tomado esta posição, não nos voltaremos, portanto, para a lógica indutiva. Notamos apenas que as conclusões na lógica indutiva não são determinadas por premissas - portanto, não são tautológicas. As conclusões em lógica indutiva são diretamente dependentes dos fatos, e estes últimos são determinados pela quantidade de nosso conhecimento - portanto, são estabelecidos em base probabilística. A probabilidade é a principal ferramenta metodológica da lógica indutiva.

A lógica dedutiva é mais plenamente representada pelas lógicas formais e matemáticas, que têm muito em comum. A lógica dedutiva é uma ciência que estuda o pensamento humano ou os atos mentais do ponto de vista de sua estrutura ou forma, abstraindo de seu conteúdo específico. Assim, a lógica dedutiva busca formular leis e princípios, cuja observância é um pré-requisito para alcançar resultados verdadeiros no processo de obtenção de conhecimento inferencial. A principal ferramenta metodológica da lógica dedutiva é a implicação. Obtém conhecimento inferencial sem apelo direto à experiência ou prática, simplesmente aplicando as leis da lógica. No processo de dedução, a premissa condiciona a conclusão: se a premissa é verdadeira, então a conclusão deve ser verdadeira. Assim, a conclusão já está na premissa, e o objetivo da dedução é tornar evidente o que no estado latente já está contido na premissa. Segue-se daí que qualquer conclusão obtida por meio de dedução é tautológica, ou seja, logicamente vazia, embora de outros pontos de vista, por exemplo, nos casos em que o aparato lógico formal seja usado para fins de outras ciências, possa ser novo. , inesperado e original.

Uma situação semelhante ocorre na matemática - a validade dos argumentos nela repousa inteiramente na dedução. Além disso, em matemática, como regra, qualquer ponto de vista inicial, qualquer abordagem para resolver um problema é aceitável - desde que satisfaçam as condições da dedução matemática. A matemática tem um rico conjunto de tais "pontos de vista iniciais" e "abordagens" que o pesquisador pode usar alternativamente para resolver seu problema. Problemas matemáticos são frequentemente traduzidos em diferentes formas equivalentes, e cada uma delas envolve o uso de diferentes áreas da teoria matemática para resolver o problema. Assim, um matemático tem liberdade virtualmente ilimitada na escolha de premissas - ele escolhe aquelas que, do seu ponto de vista, contêm as possibilidades mais promissoras para a solução mais simples, mais não banal e elegante de um problema. Seu talento e experiência se manifestam justamente na escolha bem-sucedida de pré-requisitos, aqueles "digamos que..." ou "se... então" que estão repletos de trabalhos matemáticos. Assim como na lógica, as premissas matemáticas - axiomas ou postulados - determinam as definições de unidades ainda indefinidas.

A liberdade de escolha de premissas em matemática está em proporção direta ao fato de operar com unidades não materiais, ou objetos - sua atenção é direcionada para as relações entre eles. Objetos matemáticos servem como símbolos que expressam a estrutura de relações puras. Um sistema matemático pode, assim, ser considerado como um conjunto de relações formais que existem apenas em virtude das declarações dessas relações. É claro que, em particular, para propósitos aplicados, os enunciados de relações podem tender a incorporar correspondências com a realidade externa, mas isso não afeta de forma alguma os enunciados de relações em si - pelo contrário. Os matemáticos não investigam a "verdade" de seus axiomas, embora exijam um acordo mútuo entre eles. A investigação dentro de um sistema matemático é a investigação e o estabelecimento de conexões que tornam possível provar que o fato da teoria A implica o fato da teoria B. Portanto, a questão principal na matemática não é "o que são A e B?", mas "A pressupõe (ou determina) B?".

Situação completamente diferente em linguística. Ela se concentra principalmente na primeira dessas questões, e isso não lhe dá a oportunidade de romper com a realidade; portanto, não opera com unidades abstratas, mas com unidades concretas, embora em alguns casos tenda a criar objetos abstratos, como o conceito de fonema ou morfema. Essa situação é característica não apenas da linguística tradicional, mas é igualmente característica de suas últimas tendências, unidas sob a bandeira do estruturalismo. Uma série de afirmações já foram citadas acima, que, ao tentar usar métodos não apenas indutivos, mas também dedutivos (ou métodos matemáticos e lógicos) na ciência da linguagem, não puderam ignorar a necessidade de se referir a um fato linguístico real. Além deles, pode-se citar mais uma coisa, que traz total clareza à questão em questão: “A análise linguística”, escreve P. Garvin a esse respeito, “é basicamente um processo indutivo no sentido de que busca estabelecer uma uma lista de elementos ou um conjunto de enunciados, a partir dos estímulos linguísticos dos informantes ou do estudo do texto. tipos e ordens de complexidade. A classificação desses tipos e a declaração de suas condições de distribuição, obtidas como resultado da análise, formam uma linguagem de descrição indutiva" * .

* (P. Garvin, Um Estudo do Método Indutivo em Sintaxe, "Word", vol. 18 (1962), pág. 107,)

Na linguística, é claro, também se pode usar o método das pressuposições, com base no qual determinados objetos, fatos ou unidades de linguagem são então determinados. Mas aqui nos deparamos com dois recursos que fazem ajustes significativos no uso desse método. Ao contrário da lógica e da matemática, neste caso será buscada a “verdade” das definições assim obtidas, ou seja, sua correspondência com os dados experimentais. Assim, a interdependência da premissa e do conhecimento inferencial é estabelecida: a premissa determina a conclusão (a definição de um determinado objeto linguístico em termos da premissa), mas se a conclusão não corresponder aos dados da experiência, então a própria premissa precisa ser corrigido. Mas os ajustes da pressuposição desse tipo não têm nada em comum com a traduzibilidade em formas equivalentes que, como observado acima, é permissível em matemática, uma vez que são determinadas não por considerações formais, mas pelos dados da experiência. Tudo isso dá razão para concluir que o próprio conceito de pré-requisito e a liberdade de escolhê-lo têm uma especificidade na análise linguística, que não pode ser ignorada quando se usa o método dedutivo em linguística.

Os linguistas não podem usar o método "se" ou "vamos" com tanta liberdade quanto os matemáticos. A sua liberdade de instalações é muito estritamente limitada. A história da ciência da linguagem conhece muitas mudanças nos "pontos de vista", ou seja, nas premissas iniciais, que foram motivadas pela descoberta de novos fatos, pela difusão de ideias científicas gerais para a linguística, ou mesmo pela formação de teorias originais. Mas para o linguista, em todos esses casos, a mudança do "se", ou da premissa inicial, é a mudança de todo o conceito científico. Portanto, o linguista não diz “se”, mas postula sua compreensão da premissa, ou seja, de fato, a compreensão do sujeito de sua pesquisa, e, a partir dessa compreensão, dá uma definição de unidades privadas da língua , verificando a "verdade" dessas definições com os dados da experiência. Esta última circunstância, devido à interdependência da premissa e da conclusão em linguística, serve como meio de verificar a legitimidade da própria premissa, que está no início de uma análise linguística de forma dedutiva. Assim, se nos voltarmos para exemplos específicos, no passado a linguagem era interpretada como um organismo natural (por Schleicher), como uma atividade psicofisiológica individual (por neogramaristas), etc. A prática de pesquisa baseada nesses conceitos tem mostrado sua insuficiência. Hoje, a premissa inicial da análise linguística é o postulado de que a linguagem é um sistema de signos*. Está sujeito ao mesmo teste de experiência e prática que qualquer outro conceito na ciência da linguagem.

* (Veja: Paul Garvin, The Definitional Model of Language. In: "Linguagem Natural e o Computador", ed. por P. L. Garvin, Nova York, 1964.)

Já essas considerações preliminares e mais gerais mostram que os métodos dedutivos não são de forma alguma contraindicados em linguística, mas sua aplicação exige o cumprimento de condições específicas. São essas condições específicas que impõem certas restrições à transferência mecânica dos métodos da lógica e da matemática para o campo da linguística. No entanto, se nos limitarmos a uma declaração tão geral, muito ainda permanece obscuro. É por isso que é necessário aprofundar a questão que estamos a considerar e, para reforçar as conclusões potenciais, recorrer à prática da linguística aplicada, onde a legitimidade das premissas e a correspondência aos dados experimentais das conclusões feitas com base nelas se manifestam mais claramente.

4

A relação entre linguagem e lógica é muito peculiar. Os representantes das ciências empíricas, que incluem a linguística, estudam um determinado objeto ou fenômeno para descrevê-lo ou explicá-lo. Eles formulam seus resultados em uma linguagem chamada linguagem objeto. O lógico empunha provas, inferências, julgamentos, etc., mas eles estão disponíveis para ele apenas na forma linguística. Assim, verifica-se que o lógico está um passo mais longe do mundo real do que os representantes das ciências empíricas. Sua análise se dirige não diretamente ao objeto real estudado pelas ciências empíricas, mas à sua linguagem*. Em outras palavras, ele investiga a linguagem e formula os resultados obtidos em uma linguagem que é chamada de metalinguagem.

* ("A análise lógica do conhecimento científico", escrevem P. V. Tavanets e V. S. Shvyrev a esse respeito, "é primordial e diretamente uma análise da linguagem na qual esse conhecimento é expresso". Veja o artigo "A lógica do conhecimento científico" em sáb. "Problemas da lógica do conhecimento científico", M., 1964, p. 161)

Do ponto de vista lógico, a unidade básica da língua não é um signo e nem o objeto por ele denotado, mas uma sentença, pois somente nela pode se desenrolar um processo lógico. É por isso que apenas uma frase pode ser verdadeira ou falsa. E as palavras por si só não podem ter essas qualidades. Mas antes que possamos estabelecer se uma sentença é verdadeira ou não, precisamos afirmar que ela tem um significado.

Os conceitos de verdade e significado pertencem ao domínio da semântica. Por meio dessas relações, a verdade ou falsidade de uma sentença é determinada: se a sentença descreve objetos corretamente, ela é verdadeira, e se estiver errada, não é. Mas as expressões linguísticas podem entrar em relações diferentes daquelas que existem entre os objetos que designam. Além disso, as ofertas podem estabelecer relações com outras ofertas. A tarefa do lógico é descobrir a natureza da relação entre expressões linguísticas e sentenças e estabelecer regras para determinar se o procedimento prescrito em um determinado caso é seguido ou não. Ao resolver a última questão, o lógico não se refere aos objetos descritos pela sentença. Ele está interessado na forma linguística, não em seu conteúdo, o que, claro, não impede sua interpretação significativa, resultando em uma linguagem formalizada. Uma linguagem formalizada pode ser representada como um sistema abstrato, como um cálculo de predicados.

Assim, o lógico pode, dependendo dos objetivos do estudo, trabalhar em dois níveis - sintático (sintaxe lógica) e semântico (semântica lógica). Considere primeiro a aplicação do primeiro desses níveis à linguagem natural.

Se um lógico, ocupado com o estudo das formas linguísticas e das relações existentes entre elas, pode permanecer nos limites do nível sintático, operando com termos que não têm sentido, então o linguista não pode fazer isso. Todos os níveis da linguagem natural (com a possível exceção do fonêmico) são significativos e, portanto, impensáveis fora da semântica. Além disso, a linguagem natural não existe fora da pragmática, que não pode ser facilmente desvinculada dela pela simples razão de que no ato de fala ela é constantemente transpolada para a semântica. Portanto, uma linguagem natural é sempre uma interpretação e, além disso, de dois estágios, pois está ligada tanto à semântica quanto à pragmática * . E essa interpretação ainda não se presta a nenhuma formalização.

* (qua As observações de Niels Bohr sobre a linguagem matemática, onde "a não ambiguidade das definições necessárias para uma descrição objetiva é alcançada com o uso de símbolos matemáticos justamente porque assim se evitam as referências ao sujeito consciente que permeiam a linguagem cotidiana" (Nieles Bohr, Atomic Physics and Human Cognition, M., 1961, p. 96).)

Passemos agora ao segundo nível, quando uma interpretação é atribuída ao cálculo por meio de regras semânticas. E, neste caso, teremos uma educação que não é de forma alguma comparável à linguagem natural. É verdade que aqui estamos lidando com termos significativos, mas em linguagem lógica e natural eles constroem sua relação com a "verdade" em bases completamente diferentes. Como escreve A. Tarsky, "verdadeiro", "em qualquer caso em sua interpretação clássica", é tal na medida em que "coincide com a realidade" * . Mas este critério de "verdade" na verdade se aplica apenas às línguas naturais, que são sempre orientadas para a realidade. A situação é diferente na semântica lógica. A análise semântica depende apenas da interpretação lógica do sistema e envolve o estabelecimento de certas regras que formulam as condições de verdade. Ele prescreve uma consequência dessas regras, sem responder à pergunta em que medida a "coincidência com a realidade" ocorre aqui. Além disso, o foco na própria realidade é realizado em linguagem natural não diretamente, mas por meio de uma pessoa, o que novamente torna necessário recorrer ao terceiro nível - o pragmático. “A passagem ao nível semântico”, afirmam P. V. Tavanets e V. S. Shvyrev, “não é em si um retorno à linguagem viva em sua concretude, como pode parecer à primeira vista, devido à essência da linguagem como De fato, o esquema original da semântica “linguagem-realidade” ainda não dá uma imagem concreta da linguagem como a realidade imediata do pensamento, pela simples razão de que a linguagem está ligada à realidade não por si mesma em algum tipo místico. maneira, mas através de uma pessoa, através de suas ações, seu comportamento. Portanto, de fato, uma ideia concreta da linguagem como portadora do pensamento só pode ser alcançada no nível de sua análise pragmática de acordo com o esquema "linguagem - humano ações com a linguagem e com base na linguagem - realidade" **.

* (A. Tarski, Grundlegung der Wissenschaftlichen Semantik. "Actes du Congres International de Philosophie Scientique", 1936.)

* (Veja o artigo "A lógica do conhecimento científico" em sáb. "Problemas da lógica do conhecimento científico" (M., 1964, p. 16).)

Mas isso não é tudo. Sobre o assunto em consideração, V. M. Glushkov escreve: “Uma linguagem humana viva pode ser considerada uma linguagem formal somente depois que um sistema estrito de regras for formulado que permita distinguir expressões que são permitidas na linguagem de todas as outras expressões, ou seja, frases significativas de "*" sem sentido. Explicando as dificuldades que surgem na formalização de uma linguagem natural, ele destaca ainda que "nenhuma linguagem formalizada fixa pode ser adequada a uma linguagem humana viva, pois esta, diferentemente da primeira, está em constante desenvolvimento e aperfeiçoamento. Portanto, qualquer formalização de qualquer linguagem humana viva é apenas um elenco instantâneo mais ou menos bem-sucedido dela, perdendo sua semelhança com o original à medida que este se desenvolve" ** . Se tudo se resumisse a isso, então seria metade do problema. A linguística aplicada pensa desde os momentos do desenvolvimento da língua, tende a considerá-la como um sistema completamente estável, mas não é possível realizar a formalização de uma língua natural. Isso acontece por uma razão muito simples. O sistema formal e a linguagem natural baseiam sua eficácia em qualidades opostas polares. Qualquer sistema formal é sempre idêntico a si mesmo. É esta qualidade que lhe permite desempenhar as suas funções em todos os casos específicos da sua aplicação. E a linguagem natural - em seu conteúdo, em sua semântica, ou, como se costuma dizer nesses casos, em seus termos informativos - nunca é idêntica a si mesma. É esta capacidade que permite funcionar em todos os casos específicos da sua aplicação. Permanecendo a mesma língua, é sempre diferente em diferentes situações. Ao mesmo tempo, ele não tem regras explícitas nem formativas, nem regras de "verdade", nem regras transformacionais para determinar quais dos significados potenciais ou matizes de significados uma determinada palavra receberá em uma determinada situação. Além disso, quase qualquer palavra de uma língua natural pode adquirir um significado que não é fixado em nenhuma língua - pode, tendo surgido, se firmar na língua, mas com o mesmo sucesso, como uma chama rápida, piscando, se perdendo em o "espaço" linguístico e sair. E com todas essas qualidades, a linguagem natural acaba sendo uma ferramenta incrivelmente perfeita que permite alcançar um entendimento mútuo completo sobre os conceitos mais complexos e em qualquer situação. Por que isso está acontecendo?

* (V. M. Glushkov, Thinking and Cybernetics, "Problems of Philosophy", 1963, No. 1, pp. 37-38.)

** (V. M. Glushkov, Thinking and Cybernetics, "Problems of Philosophy", 1963, No. 1, p. 38.)

Aparentemente, a resposta a esta pergunta deve ser parcialmente buscada em um pensamento do fundador da semiótica Ch. Pierce, que ele repete persistentemente em muitas de suas obras. Pode ser interpretado assim. Na linguística moderna, a linguagem é geralmente definida como um sistema de signos. Essa é a premissa básica de toda análise linguística. Se assim for, então a linguagem não é apenas um sistema de signos, mas um sistema de signos que se interpretam mutuamente, que existem na linguagem na medida em que são interpretados em outros signos. C. Peirce assim o formula: "Nenhum signo pode funcionar como signo se não for interpretado em outro signo. Portanto, é absolutamente essencial que um signo atue sobre outro signo" * . E em outro lugar: "Todo o propósito de um signo é que ele seja interpretado em outro signo" ** . E talvez o mais importante: "Um signo não é um signo, a menos que se traduza em outro signo, no qual recebe um desenvolvimento mais completo" ***.

* (CH. Peirce, Collected Papers, Cambridge, Mass., vol. oito, §. 225.)

** (Ibid e, §. 191.)

*** (CH. Peirce, Collected Papers, Cambridge, Mass., vol. 5, § 594.)

Consequentemente, a linguagem natural é um sistema de signos que, por meio da interpretação mútua, são capazes de responder a todas as necessidades humanas na expressão semântica. Mas uma ressalva importante é necessária aqui. Afinal, todas as necessidades desse tipo são determinadas pela atitude de uma pessoa em relação aos fenômenos do mundo externo e do ambiente social em que sua vida ocorre. Devido a essa circunstância, a semântica transformacional, se pudesse ser criada, não pode se basear apenas nas regras de interpretação mútua dos signos, seja de natureza fechada e finita. Acaba sendo uma derivada de um número muito grande de quantidades que se opõem de todas as maneiras possíveis à formalização * .

* (P. Jacobson afirma a esse respeito: "Podemos construir uma semântica puramente linguística se aceitarmos a posição de Peirce de que a característica essencial de cada signo linguístico é que ele pode ser traduzido por outro signo linguístico, mais desenvolvido, mais explícito, ou, ao ao contrário, um signo mais elíptico do mesmo ou de outro sistema linguístico. É graças a essa traduzibilidade que se revelam as invariantes semânticas que procuramos no significante. Assim, temos a oportunidade de resolver também os problemas semânticos da língua com a ajuda da análise distributiva "(discurso no 1º Simpósio Internacional "Sign in the system of language", Erfurt, RDA, 1959). Citado do livro: V. A. Zvegintsev, História da linguística dos séculos XIX - XX em ensaios e extratos, parte 2, M., 1965, p. 398.

Em conexão com o exposto, é importante considerar as características do procedimento para resolver problemas e o próprio conceito de determinação em lógica e matemática, por um lado, e em linguística, por outro.

Antes que um problema possa ser resolvido em matemática, ele deve ser formulado em termos precisos - essa mesma formulação é um pré-requisito para uma solução bem-sucedida do problema. Nesse caso, como já mencionado, um matemático pode transformar livremente uma dada formulação do problema em uma versão equivalente - a matemática tem os meios apropriados para isso. Já nesta fase primária da metodologia de pesquisa, a linguística difere significativamente da matemática. Ao formular seus problemas, o linguista tem à sua disposição uma certa quantidade de dados empíricos observados, aos quais ele nem sempre pode dar uma formulação exata, mas que, queira ou não, ele deve, queira ou não, fundamentar sua pesquisa, já no processo desta pesquisa em si. Para não ir muito além dos exemplos, podemos nos referir ao significado linguístico, que constitui a base de todo o trabalho no campo do processamento automático da informação da fala, mas ao mesmo tempo é definido de maneira muito vaga e contraditória. É esta circunstância que obriga os investigadores desta área a alterarem constantemente a sua estratégia.

Mas agora a pesquisa começou e alguma solução foi alcançada. O que isso significa em relação à lógica e à matemática e em relação à linguística? A lógica, como mencionado acima, permite representar explicitamente as conclusões implícitas na premissa, mas não possui regras, cuja utilização pode garantir que a solução desejada será obtida, pois não é um meio de chegar a novas conclusões , mas apenas uma técnica, determinando sua correção. Ela não é a chave mágica para todos os mistérios. É bastante óbvio que, se a lógica tivesse tais regras, não haveria problemas não resolvidos. Bastaria aplicar um certo conjunto de regras lógicas e receberíamos automaticamente uma resposta pronta para qualquer pergunta que nos atormentasse. À luz do que foi dito, o conceito de determinação de um problema ou tarefa também adquire um significado específico.

Em lógica e matemática, qualquer resultado final é reconhecido como verdadeiro se nenhuma regra formal foi violada no processo de prova. Uma vez que diferentes formas de prova são possíveis neste caso, a existência de diferentes soluções é admissível. Mas todos eles podem estar sujeitos a verificação do ponto de vista da exigência da lógica ou da matemática. A situação é diferente na linguística. Não dispõe de aparato para verificar ou provar a veracidade das conclusões tiradas. Assim, a verdade das decisões tomadas também é determinada - é estabelecida não por regras formais, mas por sua correspondência com os dados da experiência. Sob essas condições, teoricamente, seria de esperar uma única solução final. No entanto, na prática, como atestam definições linguísticas contraditórias até mesmo das principais categorias da linguagem, não é esse o caso. Uma certa subjetividade das avaliações está sempre presente neste caso e, em certa medida, é determinada pela quantidade de fatos (e, claro, sua natureza) à disposição do pesquisador. Segue-se disso que a "verdade" de uma solução em linguística é sempre dada em alguma aproximação e não é determinística, mas probabilística.

Nestas condições, é muito importante testar a exatidão das definições e interpretações linguísticas com base em critérios objetivos. A possibilidade de tal verificação é proporcionada por uma ampla área da linguística aplicada, onde a linguagem natural é oposta por uma máquina, representando os interesses da lógica e da matemática nessa oposição.

5

Um computador digital é usado para resolver problemas práticos de linguística aplicada. É capaz de perceber, armazenar, transmitir, reagrupar e emitir informações. Ele interpreta e executa um conjunto de comandos (programa de comando), e também os modifica no processo de execução de uma tarefa. É capaz de resolver problemas muito complexos, mas todo o processo de transição da tarefa para a solução deve ser descrito de forma exaustiva e consistente em termos de uma sequência de operações elementares básicas. As informações são inseridas na máquina usando um código ou idioma de dois dígitos (binário). A máquina opera em palavras codificadas dessa maneira, correspondendo às conexões lógicas básicas ou funções do cálculo proposicional ou de predicados. Uma máquina pode resolver problemas matemáticos complexos precisamente porque é possível reduzir operações matemáticas complexas a uma sequência de operações aritméticas e estas, por sua vez, a operações lógicas. Portanto, um computador digital pode ser considerado como uma máquina lógica.

Assim, qualquer que seja a complexidade da tarefa, a máquina a resolve com a ajuda de uma sequência de operações elementares, cujo programa deve ser formulado de forma absolutamente inequívoca (consistente), precisa, detalhada e exaustiva. Em outras palavras, não deve ir além dos limites estabelecidos pelo cálculo proposicional lógico, e quando nos perguntamos se uma máquina pode lidar com o processamento de informações contidas em linguagens naturais, precisamos primeiro descobrir até que ponto o cálculo proposicional lógico o cálculo é um modelo adequado para a linguagem natural.

Dadas as especificidades do computador digital descritas acima, a primeira coisa a fazer para que a máquina “compreenda” a tarefa e comece a processar as informações de fala de acordo com essa tarefa é reformular as informações contidas na linguagem natural em linguagem lógica. O ponto, portanto, é a tradução da linguagem natural para a linguagem do cálculo proposicional lógico. Ao mesmo tempo, como mostrou Bar-Hillel, é preciso enfrentar tais dificuldades que pintam as perspectivas do processamento automático sob uma luz muito sombria, a menos que toda a direção da busca de uma solução para esse problema seja alterada. No mínimo, teremos que contar com os seguintes obstáculos, para os quais ainda não temos os meios necessários para superar.

* (Y. Bar-Hillel, Uma Demonstração da Inviabilidade da Tradução Totalmente Automática de Alta Qualidade, "Avanços em Computadores:", vol. 1, Nova York, 1960, pp. 158-163.)

A. O cálculo proposicional lógico é muito pobre para ser capaz mesmo com uma aproximação distante de reformular uma linguagem natural, que é incrivelmente complexa em sua estrutura semântica, tem uma enorme quantidade de elementos redundantes e, mais importante, é muitas vezes caracterizada por tal imprecisão e indefinição na expressão "significando" que nenhuma lógica de dois valores pode lidar com a criação de uma contraparte artificial de uma linguagem natural * . É verdade que a lógica, como apontado, lida apenas com a forma linguística. Mas como se trata de processamento automático de informações, é necessário ser capaz de distinguir entre informações semânticas, e se isso não pode ser feito usando os meios lógicos à nossa disposição, então como podemos ter confiança de que nossa tradução de linguagem natural em lógica está correto?

* (O artigo de Ch. Hockett "Grammar for the Hearer" dá muitos exemplos de tais dificuldades na compreensão "natural" de uma sentença, que são resolvidas por etapas subsequentes e de longo alcance de análise (Ch, Hockett, Grammar for the Hearer, "Structure da Linguagem e seus Aspectos Matemáticos", Providence, 1961, pp. 220-236).)

B. A máquina não pode levar em conta o que Bar-Hillel chama de "fundo geral de informação", que de fato permanece fora dos limites da linguagem natural e, portanto, não pode ser traduzido em linguagem lógica. Os linguistas nestes casos falam de um contexto extralinguístico (quadro de referência), que discretamente para nós, mas de forma muito decisiva, corrige ou mesmo repensa completamente todas as nossas palavras. Afinal, mesmo uma frase tão simples como "Voltarei antes de escurecer", para sua acurada compreensão e determinação da indicação temporária contida nela, requer, no mínimo, conhecimento prévio de quando, onde foi proferida e em que época do ano. . Informações preliminares desse tipo são muitas vezes o único meio para elucidar aquelas relações intrafrasais que nem o cálculo proposicional nem o cálculo de predicados são capazes de lidar. Assim, tomando por exemplo duas frases que apareceram nos jornais:

Aluno de pós-graduação da universidade da cidade de Kursk;

Honrado inovador da Sibéria, -

vemos que cada um deles pode ser interpretado de duas maneiras. Se aderirmos apenas às características gramaticais formais, então a primeira frase pode ser igualmente entendida como "Um estudante de pós-graduação de uma universidade localizada na cidade de Kursk" e como "Um estudante de pós-graduação de uma universidade que vive na cidade de Kursk (ou originário da cidade de Kursk)". E a segunda frase pode ser interpretada tanto como "Honrado inovador, cujo campo de atividade é a Sibéria" e como "Honrado inovador, que é residente da Sibéria". E apenas o conhecimento preliminar (informações preliminares) que não é expresso de forma alguma nas propostas, afirmando que não há universidade na cidade de Kursk e que "honrado inovador" é um título honorário concedido na União Soviética por distritos administrativos individuais, torna possível compreender corretamente essas propostas. Se você olhar de perto, quase todas as frases da língua falada são informações preliminares muito sólidas e ramificadas, que são evidentes para uma pessoa, mas estão além da "compreensão" de uma máquina que não conhece clã nem tribo.

B. A máquina não pode fazer conclusões semânticas intratextuais que se estendam por várias frases (e às vezes até intencionalmente para uma história inteira, para não revelar completamente seu personagem ou movimento de enredo). O linguista holandês A. Reichling chamou a atenção para essa circunstância, ilustrando sua ideia com o seguinte exemplo. Suponha que estamos lendo uma história que começa com a frase "Estou brincando com meu irmão". Se pararmos por aí, não teremos dados à nossa disposição para esclarecer como essa frase deve ser entendida, de que tipo de jogo estamos falando aqui. Afinal, você pode jogar por dinheiro (cartas, etc.), em um instrumento musical, em um teatro ou cinema, com brinquedos, futebol, jogar por diversão, brincar com uma pessoa e seu destino etc. Mas aqui lemos mais : "Eu disse isso quando Wilhelm me encontrou um dia em um bar." Agora podemos concluir que, aparentemente, estamos falando de um jogo por dinheiro. Mas ainda existem outras possibilidades. Segue-se: "Meu irmão veio à mesa, e os dados foram lançados." Agora está claro a qual jogo está se referindo, embora em nenhum lugar do texto haja uma indicação exata do significado real da palavra "jogo". Nós adivinhamos sobre ele pela totalidade desses sinais externos que são dados no texto em frases diferentes. Esses signos seguem aqui um após o outro, mas na narrativa escrita eles podem ser significativamente separados um do outro. Uma pessoa pode escolhê-los de um contexto linguístico amplo (neste caso, estamos lidando com isso), comparar e depois tirar uma conclusão apropriada. A máquina é privada desta possibilidade.

* (Num colóquio organizado em 1961 pelo Stichting Studiecentrum voor Administrative Automatisering. Há também uma tradução alemã do relatório: A. Reichling, Moglichkeiten und Grenzen der mechanischen Ubersetzung, aus der Sicht des Linguisten, "Beitrage zur Sprachkunde und Informationsverarbeitung", Heft 1, Wifcn, 1963.)

Mas talvez ela não precise disso? De fato, ao traduzir essas frases para alemão ou francês por máquina, não há dificuldades particulares (mas, é claro, surgirão dificuldades ao traduzir outras frases). Ao traduzir para o alemão, podemos usar o literalismo: Ich spile mit meinem Bruder. Da mesma forma, em francês, podemos começar: Je joue avec... Mesmo na tradução para o inglês, surgem dificuldades de ordem gramatical, pois no texto dado não há indicação de qual forma a máquina deve escolher: 1. Estou brincando com meu irmão, 2. Eu brinco com meu irmão ou 3. Eu vou brincar com meu irmão? E é muito ruim quando traduzido para o espanhol, já que a máquina terá que escolher entre pelo menos três verbos: jugar, tocar ou trabajar.

Aqui a linguagem lógica é impotente.

D. A máquina realmente lida com a fala (ou, mais precisamente, com segmentos de fala) - em sua forma escrita e oral. Cada uma dessas formas de fala tem seu próprio sistema de elementos pragmáticos, que também são capazes de se transformar em semânticos (e as regras para tal transição não foram estudadas e são amplamente arbitrárias). Assim, por exemplo, a fala oral tem uma superestrutura suprasegmental como a entonação. Agora é possível classificar a entonação de acordo com os tipos funcionais e distinguir entre entonações interrogativas, narrativas e outras. No entanto, é absolutamente indiscutível que a entoação não existe independentemente das frases; certamente interage com o significado contido neles. Para sustentar esta afirmação, basta referir-se a uma pergunta retórica, que é uma pergunta apenas em sua estrutura externa, mas não é uma pergunta de sentido: ela não exige uma resposta dos ouvintes. Assim surge um novo tipo de dificuldade, que a linguagem lógica não tem como lidar.

E. O método de processamento automático de informações de fala (e, em particular, tradução automática) é baseado na suposição de que qualquer frase, e a linguagem como um todo, é "desmontada" em um certo número de unidades semânticas elementares (palavras) , do qual pode então ser, de acordo com certas regras, "coletar" sentenças dadas. Uma consequência dessa suposição é outra, segundo a qual o significado de uma frase é a soma aritmética dos significados de suas palavras constituintes. Aqui, a matemática é tomada como modelo, onde as operações mais complexas que um computador realiza são, em última análise, reduzidas a operações extremamente elementares. Mas na linguagem nos deparamos com uma imagem quase completamente oposta. A questão não é apenas que em diferentes idiomas as frases são semanticamente "compreendidas" em partes de maneiras diferentes. Por exemplo:

A menina está andando. A menina está de pé. O chapéu combina com a garota. Das Mädchen geht. Das Madchen Steht. Der Hut steht dem Madchen(literalmente: O chapéu vale a menina).

A questão também é que mesmo dentro da mesma língua, na maioria das vezes não há relação aritmeticamente correta entre o significado de uma frase e os significados (significados) de suas palavras constituintes. Nesta ocasião, E. Benveniste escreve: "Uma frase se realiza por meio de palavras. Mas as palavras não são apenas segmentos de uma frase. Uma frase é um todo, não redutível à soma de suas partes, o significado inerente ao todo é distribuído para todo o conjunto de componentes" *. Não se trata de expressões idiomáticas (como: "fazer descuidado", "esfregar os óculos de alguém", etc.), mas sim das frases mais comuns. Vamos a um exemplo elementar:

Esperar! - Vou ao teatro.

Pode-se argumentar que o significado desta frase é a soma aritmética dos significados das palavras: espere, vá, teatro, eu, em? Com base em tal representação aritmética, devemos esperar que qualquer combinação dessas palavras, apresentadas em uma frase gramaticalmente correta, mantenha o mesmo significado - afinal, a soma dos termos não muda a partir de um rearranjo do lugar dos termos . Mas vamos tentar modificar um pouco essa proposta:

Eu vou ao teatro - espere!

Vemos que em seu significado esta segunda frase difere significativamente da primeira.

* (E. Benveniste, Les niveaux de G analyse linguistique, "Preprints of Papers for the Ninth International Congress of Linguists", Cambridge, Mass., 1962, p. 497)

Este é um dos exemplos mais elementares, e se nos voltarmos para os mais complexos, então a impotência de quaisquer regras transformacionais que deveriam governar tais casos torna-se especialmente óbvia. Não pode ser de outra forma: afinal, uma frase é uma sequência de monossemas, e um monossema (ver a seção "Sistema de Pesquisa Semântica"), como configuração sintática, é mais do que uma palavra. Esta circunstância leva ao fato de que a frase, como uma sequência de monossemas, é uma sequência de elementos mutuamente determinados, conectados entre si em uma relação semântica em uma cadeia inextricável, que pode ser esquematicamente e de forma altamente generalizada como segue * :

* (Veja "Apêndice" no final do livro.)

É justamente por essas características das frases que há uma diferença qualitativa entre a última e as palavras. Se as palavras podem ser definidas como signos, então as frases vão, sem dúvida, além do nível do signo.

A questão da "decomponibilidade" da linguagem e das frases repousa sobre uma questão mais geral. Existem estruturas capazes de desempenhar suas funções apenas em sua composição complexa. Quando você tenta decompô-los em partes menores ou reduzi-los a estruturas mais elementares, eles realmente se desintegram, deixam de existir como tais, perdem as qualidades inerentes à sua composição complexa. Assim é a linguagem. W. Humboldt entendeu isso (abordando essa questão, porém, de um ângulo um pouco diferente), quando escreveu: “Para que uma pessoa entenda pelo menos uma única palavra, não apenas como um impulso espiritual (ou seja, reflexivamente. - V . Z.), mas como um som articulado que denota um conceito, a linguagem inteira e em todas as suas conexões já devem estar nela inseridas. Não há nada de singular na linguagem, cada um de seus elementos individuais se manifesta apenas como parte do todo. "*. Traduzindo esse julgamento de W. Humboldt para a linguagem da ciência moderna, obtemos a seguinte formulação pertencente a M. Taube: "... é fácil entender que a linguagem como um sistema de símbolos significativos, orais ou escritos, não é um sistema formal e não pode ser reduzido a ele sem destruir sua verdadeira natureza... Quando uma linguagem é formalizada, ela deixa de ser uma linguagem e se torna um código" ** .

* (W. Humboldt, Sobre o estudo comparativo das línguas em relação às diferentes épocas de seu desenvolvimento. Citado do livro: V. A. Zvegintsev, História da linguística dos séculos XIX - XX em ensaios e extratos, parte I, M., 1964, p. 79.)

** (M. Taube, Computing machines and common sense, M. * 1964, p. 18.)

Mas mesmo que seja possível lidar com as dificuldades linguísticas elencadas, ainda existem obstáculos de ordem lógica adequada - neste caso, estamos falando das chamadas "regras de resolução" (regras de decisão). Afinal, se queremos ter certeza de que a máquina agirá logicamente sem falhas, devemos fornecer a ela um conjunto de regras, seguindo as quais ela pode ir consistentemente da informação de origem às conclusões necessárias. Aplicados aos cálculos lógicos proposicionais, temos tais regras, mas para lógicas mais complexas não existem tais regras e, além disso, há razões para acreditar que tais regras não podem ser encontradas. Se nos concentrarmos nas regras que já temos à nossa disposição, usá-las tornará o processo de resolução tão complicado (mesmo com o uso de computadores aprimorados) que o jogo não valerá a pena * .

* (Para mostrar o trabalho que um computador passo a passo tem que fazer, A. L. Samuel recorre ao exemplo de um jogo de damas. Ele escreve: "Para fazer um computador jogar damas, devemos antes de tudo representar a posição das damas no tabuleiro de uma forma que o computador possa lembrar. Em seguida, as consequências de cada um dos movimentos disponíveis devem ser analisadas olhando no futuro, como uma pessoa geralmente faria. , considerando cada movimento inicial por sua vez, então todos os possíveis movimentos de retaliação do oponente, então para cada um deles todas as contra-respostas, e assim por diante. a natureza molecular da matéria e a velocidade finita de luz, então esse computador levaria muitos séculos, e talvez mais do que a idade do universo, para fazer seu primeiro movimento" (A. L. Samuel, Artificial Intelligence: Progress and problems. Apêndice do livro: M. Taube, Máquinas de computação e senso comum, Moscou, 1964* pp. 140-141).)

Dessa forma, o problema da aplicação de métodos lógicos e matemáticos na ciência da linguagem é traçado com base nos dados da linguística aplicada. Quais são as conclusões? As conclusões já foram formuladas acima - a análise lógica permite uma combinação de métodos indutivos com dedutivos, mas quando falamos sobre o uso de métodos dedutivos em linguística, tudo não deve ser reduzido à subordinação cega da pesquisa linguística aos métodos lógico-matemáticos . A linguagem natural se rebela contra tal violência. E a prática da linguística aplicada confirma essas conclusões, estabelecendo que existem tais diferenças entre uma linguagem lógica formalizada e uma linguagem natural que uma tradução suficientemente completa (em termos informativos) da segunda para a primeira é impossível. Isso significa que em linguística (e, em particular, aplicada) o uso de métodos lógico-matemáticos deve ser abandonado? Claro que não. Mas não se deve superestimar suas capacidades. Enquanto eles são bastante modestos. E para não sermos infundados aqui, voltemos ao testemunho de matemáticos e lógicos, que na prática de seu trabalho têm que aplicar seus conhecimentos ao estudo da linguagem natural.

Eis o que diz o matemático: “A ajuda da matemática no estudo da linguagem natural ainda está longe de ser óbvia... Este é um problema não matemático, faz parte dos métodos indutivos em linguística.

Descobriu-se que a matemática não substitui a metodologia empírica, embora alguns linguistas se esforcem para fazê-lo. Ao contrário, somente após as unidades e relações da linguagem natural terem sido estabelecidas pelo método indutivo e devidamente confirmadas (verificadas), as condições necessárias serão criadas para uma aplicação realista da matemática à linguagem natural. Ao mesmo tempo, os matemáticos descobrirão que estão lidando com uma nova manifestação do que já lhes é essencialmente familiar, ou receberão um estímulo para o pensamento matemático de uma nova ordem.

* (P. Garvin e W. Karush, Lingüística - Processamento de Dados e Matemática, "Linguagem Natural e o Computador", Nova York, 1963, pp. 368-369. Veja também o artigo no mesmo livro: W. Ksrush, The Use of Mathematics in the Behavioral Sciences, pp. 64-83.)

E aqui está o que o lógico diz: "As perspectivas de processamento automático de informações de fala são muito boas, mas o papel da lógica nessa área é limitado. No entanto, como ferramenta de análise linguística, não como um conjunto de regras para derivar conclusões , faz promessas reais" * . E ele ainda estabelece qual estratégia de pesquisa é mais preferível: “Os problemas não devem ser resolvidos seguindo rigorosamente um conjunto de regras estabelecidas por um lógico, mas sim usando técnicas heurísticas ** ... Uma abordagem indutiva empírica para processamento automático de informações de fala deve ser preferida, com as quais se buscam regras grosseiras para resolver problemas de informação. Deve-se parar de procurar certezas absolutas e recorrer a métodos aproximativos, que, com o acúmulo de experiência, serão refinados e aprimorados. Preferimos considerar aproximações da mesma forma que a teoria é considerada na ciência, onde modificações e aprimoramentos são feito com base em dados obtidos como resultado do experimento "***.

* (M. Maron, A Logician's View of Language - processamento de dados, livro citado, p. 144.)

** (Uma ideia bastante clara da técnica heurística é dada por A. L. Samuel. Contrastando-a com a técnica formal do procedimento lógico, ele escreve que se poderia aplicar uma técnica "onde um número de procedimentos escolhidos mais ou menos arbitrariamente são examinados em uma suposição bastante incompleta, não chegaremos a uma prova satisfatória. desses casos, às vezes podemos chegar a uma resposta correta ou mesmo muito boa em um período de tempo incrivelmente curto, mas ao mesmo tempo não há certeza de que chegaremos a uma solução, assim como a confiança que a solução que nos é apresentada é a melhor. Este método de resolução de problemas tem sido chamado de procedimento "heurístico" em contraste com a aplicação de um "algoritmo" ... ser considerada como uma atividade mental mais elevada do que a resolução de problemas por meio de um procedimento mais ou menos automático. Citado da tradução russa: A. L. Samuel, Artificial Intelligence: Progress and Problems. Apêndice do livro: M. Taube, Computing machines and common sense, M., 1964, pp. 136-137.)

*** (M. Maron, op. cit., pp. 143-144,)

Estas são as conclusões gerais. Eles dizem que os linguistas desempenham um papel de liderança no trabalho conjunto com lógicos e matemáticos. É dever dos linguistas preparar o material linguístico de forma a torná-lo acessível ao processamento por métodos lógicos e matemáticos. É nessa direção que se deve procurar uma combinação realista de métodos indutivos e dedutivos em linguística. E quando, na resolução de problemas de linguística aplicada, estamos falando de hipóteses heurísticas, então elas devem vir antes de tudo de um linguista, pois ele está mais próximo da língua e, de acordo com sua posição, é obrigado a conhecê-la e compreendê-la melhor. .

Índice
Introdução
Capítulo 1. A história da aplicação de métodos matemáticos em linguística
1.1. A formação da linguística estrutural na virada dos séculos XIX-XX
1.2. Aplicação de métodos matemáticos em linguística na segunda metade do século XX.
Conclusão
Literatura
Introdução
No século 20, tem havido uma tendência contínua para a interação e interpenetração de vários campos do conhecimento.As fronteiras entre as ciências individuais estão gradualmente se esvaindo; há cada vez mais ramos da atividade mental que estão "na junção" do conhecimento humanitário, técnico e das ciências naturais.
Outra característica óbvia da modernidade é o desejo de estudar as estruturas e seus elementos constituintes. Portanto, um lugar crescente, tanto na teoria científica quanto na prática, é dado à matemática. Entrando em contato, por um lado, com a lógica e a filosofia, por outro, com a estatística (e, consequentemente, com as ciências sociais), a matemática penetra cada vez mais profundamente naquelas áreas que por muito tempo foram consideradas puramente "humanitários", ampliando seu potencial heurístico (a resposta à pergunta "quanto" muitas vezes ajudará a responder às perguntas "o quê" e "como"). A linguística não foi exceção.O objetivo do meu trabalho de conclusão de curso é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Desde os anos 50 do século passado, a matemática tem sido usada na linguística para criar um aparato teórico para descrever a estrutura das línguas (naturais e artificiais). No entanto, deve-se dizer que não encontrou imediatamente essa aplicação prática para si. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a ser aplicada na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Uma questão surgiu diante dos linguistas: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). Alguns cientistas dos últimos anos acreditam que a expressão em si não pode ser elevada à categoria de termo, pois não significa nenhuma “linguística” especial, mas apenas uma nova direção voltada para o aprimoramento, aumento da precisão e confiabilidade dos métodos de pesquisa linguística. A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. Até mesmo Schlegel notou a interação da linguagem e da consciência, e o proeminente linguista do início do século XX, Ferdinand de Saussure (falarei sobre sua influência no desenvolvimento de métodos matemáticos em linguística mais tarde), conectou a estrutura da linguagem ao seu pertencimento. ao povo. O pesquisador moderno L. Perlovsky vai além, identificando as características quantitativas da língua (por exemplo, o número de gêneros, casos) com as peculiaridades da mentalidade nacional (mais sobre isso na Seção 2. 2, "Métodos Estatísticos em Lingüística").
A interação da matemática e da linguística é um tema multifacetado, e no meu trabalho não me deterei em tudo, mas, antes de tudo, em seus aspectos aplicados.
Capítulo I. História da Aplicação de Métodos Matemáticos em Lingüística
1.1 A formação da linguística estrutural na virada dos séculos XIX-XX
A descrição matemática da linguagem é baseada na ideia de linguagem como mecanismo, que remonta ao famoso linguista suíço do início do século XX, Ferdinand de Saussure.
O elo inicial de seu conceito é a teoria da linguagem como um sistema constituído de três partes (língua em si - langue, fala - parole e atividade de fala - langage), em que cada palavra (membro do sistema) é considerada não em si mesma. , mas em conexão com outros. ...

I ASPECTOS MATEMÁTICOS DA ESTRUTURA DA LINGUAGEM

NO.Zvegintsev APLICAÇÃO DE MÉTODOS LÓGICOS E MATEMÁTICOS EM LINGUÍSTICA

Não há dúvida de que o uso de métodos matemáticos e lógicos na linguística foi amplamente estimulado pelas tarefas da linguística aplicada. Se foram feitas tentativas de aplicar esses métodos para resolver problemas diretamente relacionados ao campo da linguística teórica, por exemplo, para distinguir entre os fenômenos da linguagem e da fala, 1 então no futuro (embora, talvez, nem sempre claro e próximo), ainda tinham em mente as necessidades da linguística aplicada.

1 Veja . G. Herdan, Linguagem como escolha e chance, Gronigen, 1956.

2 qua A observação de G. Curry: “O fato de haver uma estreita conexão entre matemática e lógica, por um lado, e linguagem - por outro lado, tornou-se óbvio há muito tempo, e agora esse fato se tornou o foco de atenção em um sentido mais estrito...” (veja abaixo, p. 98).

disse Warren Plath em sua revisão do trabalho da linguística matemática: “Se considerarmos os modelos de linguagem como sistemas abstratos de elementos discretos, então vários conceitos e métodos matemáticos podem ser aplicados a eles, desde a ideia elementar de número até a lógica complexa. , operações estatísticas e de teoria dos conjuntos. No entanto, a noção de que qualquer uso de números e operações matemáticas para descrever tais sistemas de elementos torna as declarações mais "exatas" ou mais "científicas" é completamente errônea. Em primeiro lugar, deve-se mostrar que o novo sistema assim obtido é um modelo mais satisfatório que o sistema original, seja no sentido de que permite formular afirmações teóricas mais simples e gerais sobre alguns aspectos da área modelada, seja no sentido de que permite formular afirmações teóricas mais simples e gerais sobre alguns aspectos da área modelada. porque as operações no modelo esclarecem os resultados das operações correspondentes na área modelada. Um dos maiores perigos associados à construção de modelos matemáticos de uma linguagem, especialmente os quantitativos, é que o uso indiscriminado do aparato matemático inevitavelmente leva a resultados sem sentido e desorientadores. Portanto, é necessário entender claramente que um pré-requisito para o enriquecimento da linguística com a ajuda da matemática não é apenas o conhecimento das áreas relevantes da matemática, mas, além disso, uma compreensão profunda da essência dos problemas linguísticos, a solução de que deve ser direcionado para métodos matemáticos.

Para evitar tanto quanto possível o perigo apontado por Warren Plath, é necessário ter não apenas tentativas puramente empíricas para responder à questão formulada acima, mas também lutar por sua compreensão teórica geral. De fato, a questão da redutibilidade de uma língua natural a um ou outro de seus modelos ou interpretações lógico-matemáticas é a questão principal da teoria da linguística aplicada, a necessidade de criar que se sente cada vez mais urgente. Para resolver esta questão, em primeiro lugar, deve-se considerar a natureza dos fenômenos que constituem o objeto de estudo, por um lado, a lógica e a matemática.

3 Veja o artigo Taxa nesta coleção, p. 202.

e, por outro, a linguagem natural, e também as possibilidades daqueles métodos que cada uma dessas ciências utiliza. Já a partir de um estudo comparativo desses pontos será possível tirar algumas conclusões gerais. Este último pode não ser inútil para todos aqueles que, por necessidade, têm que realizar suas pesquisas na intersecção dessas ciências.

De certa forma, esse objetivo também foi perseguido pelo simpósio "A Estrutura da Linguagem e seus Aspectos Matemáticos" realizado pela American Mathematical Society. Os trabalhos selecionados deste simpósio constituem a seção a seguir. Mas todos eles, como fica claro pelo próprio título do simpósio, afetam apenas aspectos individuais e em alguns casos muito particulares do problema que nos interessa. Embora em sua totalidade criem pré-requisitos suficientemente fundamentados para responder à nossa pergunta, ainda carecem de uma formulação clara e inequívoca das conclusões necessárias. De muitas maneiras, os participantes do simpósio continuam a linha de tentativas empíricas para resolver esta questão, de forma alguma oferecendo obsessivamente seus experimentos à atenção dos linguistas na esperança de que estes mesmos descubram quão adequadas são as hipóteses e soluções colocadas em a sua disposição revelar-se-á adequada para fins linguísticos.

Ao que parece, já temos uma resposta inequívoca à nossa pergunta. Assim, N. D. Andreev e L. R. Zinder escrevem: “A representação matemática (modelo) das linguagens não é de forma alguma idêntica à própria linguagem” 4 . Essa ideia também é desenvolvida pelo autor do livro "Modelos de Linguagem" II Revzin, que aponta que o resultado da modelagem só pode ser "uma aproximação mais ou menos próxima dos dados da realidade concreta" 5 . No entanto, dizê-lo significa não dizer nada ainda, pois permanece

4 N. D. Andreev, L. R. Zinder, Os principais problemas da linguística aplicada, "Problemas da Linguística", 1959, nº 4, p. 18

5 I. I. Revzin, Models of language, Moscou, 1962, p. 8. Aliás, a expressão “aproximação” é uma tautologia direta: aproximação.

não divulgado por que isso é assim, e se ainda se deve recorrer ao método de modelagem matemática e lógica, e em caso afirmativo, em que medida e com que finalidade.

Antes de abordar essas questões, primeiro é necessário estabelecer quais ciências - indutivas ou dedutivas - incluem linguística, lógica e matemática. Quanto às duas últimas ciências, sua posição é clara - sem dúvida pertencem às ciências dedutivas, que contam com a inferência em sua metodologia de pesquisa. A linguística é tradicionalmente definida como uma ciência empírica, pois acredita-se que seu principal objetivo científico seja a descrição de fatos. Isso significa, aparentemente, que a linguística deve ser atribuída ao campo das ciências indutivas. Isso também significa que, em um esforço para usar o aparato formal da lógica e da matemática na linguística, eles estão tentando aplicar métodos dedutivos de pesquisa na ciência indutiva.

Nos últimos anos, no entanto, a natureza indutiva da ciência da linguagem tem sido questionada implícita ou diretamente. L. Elmslev fez isso da forma mais nítida. É verdade que a terminologia que ele usa é muito inconsistente e, em particular, é caracterizada por uma compreensão peculiar e muito pessoal dos termos dedução e indução (na verdade, ele os interpreta no sentido oposto). No entanto, os fundamentos de sua teoria linguística não deixam dúvidas sobre sua essência metodológica. Assim, ele considera aceitável usar quaisquer definições operacionais iniciais, o que é típico das ciências dedutivas. E ele mesmo caracteriza sua teoria nos seguintes termos: “1. A teoria, em nosso sentido, é ela mesma independente da experiência. Por si só, não diz nada sobre a possibilidade de sua aplicação, ou sobre a atitude em relação aos dados experimentais. Não inclui o postulado da existência. É o que tem sido chamado de sistema puramente dedutivo, no sentido de que só ele pode ser usado para calcular as possibilidades decorrentes de suas premissas. 2. Por outro lado, a teoria inclui uma série de premissas que são conhecidas por experiência anterior para satisfazer as condições de aplicação a certos dados experimentais. Essas suposições são as mais gerais e podem, portanto, satisfazer as condições de aplicação a um grande número de dados experimentais” 6 .

Como fica claro a partir dessa afirmação, L. Hjelmslev procura realizar a ideia da dupla natureza metodológica dos objetos de pesquisa linguística com ênfase predominante em suas características dedutivas. Ele também deve ser creditado com essa forma bastante ambígua ("por um lado .., mas por outro lado ..."), que geralmente se tornou característica da consideração desta questão (e que permite entregar qualquer direção). A ideia de dualidade metodológica da linguística recentemente se difundiu e serviu até de base teórica para a formulação dos princípios da mais recente tendência na ciência da linguagem. - linguística dos universais (universalismo). O "Memorando sobre os universais linguísticos" diz a esse respeito: "O estudo dos universais linguísticos leva a toda uma série de generalizações empíricas sobre o comportamento linguístico - tanto ainda carentes de experimentação quanto os já estabelecidos. Essas generalizações são material potencial para construir a estrutura dedutiva das leis científicas. No entanto, alguns e talvez a maioria deles ainda têm apenas o status de generalizações empíricas, que, no estado atual de nosso conhecimento, não podem ser correlacionadas com generalizações ou deduzidas dedutivamente de leis de significado mais geral” 7 . J. Gryanberg se expressa com não menos definição em seu prefácio à coleção dedicada aos universais linguísticos. Argumentando com as conhecidas palavras de L. Bloomfield de que “as únicas generalizações legítimas sobre a linguagem são as generalizações indutivas”, ele escreve: “No entanto, parece ser geralmente aceito que o método científico não deve ser apenas indutivo, mas também dedutivo. A formulação de generalizações obtidas pela pesquisa indutiva leva a hipóteses teóricas baseadas em

6 L. Elmslev, Prolegômenos para a Teoria da Linguagem, sáb. "Novo em Linguística", vol. I, M., 1960, pp. 274-275.

7 Memorando sobre Universais de Linguagem, dentro Universais da Linguagem, ed. por J. Greenberg, Cambridge, Massachusetts, 1963, pp. 262-263.

que, por dedução, outras generalizações podem, por sua vez, ser derivadas. Estes últimos devem então ser submetidos à verificação empírica.

O fato de a história da linguística consistir não apenas no acúmulo dos fatos de uma língua e sua classificação, mas também em uma mudança de pontos de vista sobre a própria língua, o que implica inevitavelmente uma diferença de abordagem dos fatos linguísticos e até mesmo de sua diferentes interpretações teóricas, fez com que alguns linguistas soviéticos também chegassem a conclusões sobre a dualidade metodológica de sua ciência. S. K. Shaumyan prefere, no entanto, falar do método hipotético-dedutivo, e descreve suas características da seguinte forma: “O método hipotético-dedutivo é um procedimento cíclico que começa com fatos e termina com fatos. Este procedimento tem quatro fases:

1) fixação de fatos que requerem explicação;

2) apresentar hipóteses para explicar esses fatos;

3) derivação de hipóteses de predições sobre fatos que estão fora do alcance dos fatos para a explicação de quais hipóteses foram apresentadas;

4) verificar os fatos que são previstos por hipóteses e determinar a probabilidade de hipóteses.

O método hipotético-dedutivo é fundamentalmente diferente do método indutivo utilizado em áreas do conhecimento como, por exemplo, botânica descritiva ou zoologia” 9 . O método de S. K. Shaumyan repete completamente o método da linguística dos universais e J. Greenberg. A única diferença está no nome. Se, por exemplo, J. Greenberg fala de uma combinação do método indutivo e dedutivo, então S. K. Shaumyan chama seu método de hipotético-dedutivo - a designação é claramente inconsistente para um método que "começa com fatos e termina com fatos".

A questão de onde a linguística deve ser atribuída também é feita por I. I. Revzin. "Por sua própria natureza,

8 Universais das Línguas p. IX.

9 S. K-Shaumyan, Problemas de fonologia teórica, M., 1962, cfr. 18-19. Sobre o método hipotético-dedutivo, ver também o artigo de V. S. Shvyreva, Algumas questões da análise lógica e metodológica da relação entre os níveis teórico e empírico do conhecimento científico, na coleção “Problemas da lógica do conhecimento científico”, M. , “A ciência”, 1964, pp. 66-75 (3ª seção do artigo).

Ele responde a essa pergunta - a linguística deve antes de tudo usar métodos indutivos, descreve atos de fala específicos de idiomas específicos ...

Segue-se disso que os linguistas precisam não apenas de métodos indutivos, mas também dedutivos de pesquisa para obter um sistema de conhecimento geral que ajude a compreender os dados obtidos na análise de línguas específicas ...

Em sua parte dedutiva, a linguística, aparentemente, pode ser construída da mesma forma que a lógica ou a matemática, a saber: um certo número mínimo de termos primários indefinidos é destacado, e todos os outros termos são definidos por meio de termos primários. Ao mesmo tempo, algumas afirmações primárias sobre a conexão desses termos entre si (axiomas) devem ser claramente formuladas, e todas as outras afirmações devem ser provadas, ou seja, reduzidas a algumas outras afirmações” 10 .

Aqui, o método de dedução, incorporado na lógica e na matemática, atua apenas como meio de ordenar o "conjunto de atos de fala", com o objetivo de criar um "sistema de conceitos gerais". Em contradição direta com essa tarefa, porém, está a apresentação do próprio método dedutivo, recomendado para uso em linguística. Ela é completamente pensada tanto a partir de atos quanto de fatos, e para o momento inicial de construção de um sistema de conceitos linguísticos gerais, toma-se um conjunto de termos primários indefinidos e, aparentemente, absolutamente condicionais, através dos quais todos os termos subsequentes são definidos.

10 I.I. Revzin, Models of language, M., 1962, pp. 7-8.

modelos lógico-formais e matemáticos da linguagem. Mas, como será mostrado a seguir, uma abordagem tão simplificada não pode dar resultados satisfatórios. Podemos concordar que na pesquisa linguística é permissível e até necessário combinar métodos dedutivos e indutivos. Afinal, como escreveu W. Bröndal, “a indução nada mais é do que uma dedução disfarçada, e por trás das puras conexões estabelecidas entre os fenômenos observados, a realidade, objeto específico dessa ciência, é absolutamente inevitável” 11 . Mas isso não significa que o aparato formal da lógica e da matemática deva ser transferido incondicional e mecanicamente para a linguística sem qualquer consideração do “objeto específico dessa ciência”. Como bem observa o mesmo I. I. Revzin, “as provas obtidas por meios dedutivos, por mais irrepreensíveis que sejam do ponto de vista lógico, ainda nada dizem sobre as propriedades da linguagem real descrita pelo modelo” 12 . E para determinar a eficácia dos modelos, ele recomenda recorrer à prática, que é a tradução automática e "outras aplicações práticas, a linguística".

E a prática da linguística aplicada mostra que são impostas restrições muito estritas ao uso de métodos matemáticos e lógicos no estudo dos fenômenos linguísticos.

A lógica fornece um exemplo do uso mais consistente do método dedutivo. A matemática segue em grande parte a lógica a esse respeito e, portanto, podem ser consideradas em conjunto.

11 W. Bröndal, Lingüística Estrutural. Cit. em
O livro de V. A. Zvegintsev “A história da linguística nos séculos XIX e XX. no contorno
kah e extractos, parte II, M., Uchpedgiz, 1960, pp. 41-42.

12 I. I. Revzin, Modelos de linguagem, M., 1962, p. 10.

distante, etc. Necessariamente, porém, teremos que pensar em todas essas divisões e falar apenas sobre as características mais gerais inerentes à lógica e à matemática como um todo, e principalmente sobre aquelas que demonstram mais claramente a natureza dedutiva dos métodos de essas ciências.

A lógica dedutiva é mais plenamente representada pelas lógicas formais e matemáticas, que têm muito em comum. A lógica dedutiva é uma ciência que estuda o pensamento humano ou os atos mentais do ponto de vista de sua estrutura ou forma, abstraindo de seu conteúdo específico. Assim, a lógica dedutiva busca formular leis e princípios, cuja observância é um pré-requisito para alcançar resultados verdadeiros no processo de obtenção de conhecimento inferencial. A principal ferramenta metodológica da lógica dedutiva é a implicação. Ele recebe conhecimento derivacional sem apelo direto à experiência ou prática, apenas através da aplicação das leis da lógica. No processo de dedução, a premissa condiciona a conclusão: se a premissa é verdadeira, então a conclusão deveria ser verdadeiro. Assim, a conclusão já está na premissa, e o objetivo da dedução é tornar evidente o que no estado latente já está contido na premissa. Segue-se daí que qualquer conclusão obtida por dedução é tautológica, ou seja, é logicamente vazia, embora de outros pontos de vista, por exemplo, nos casos em que o aparato lógico formal é usado para fins de outras ciências, pode ser novo, inesperado e original.

Uma situação semelhante ocorre na matemática - a validade dos argumentos nela repousa inteiramente na dedução. Além disso, em matemática, como regra, qualquer ponto de vista inicial, qualquer abordagem para resolver um problema é aceitável - desde que satisfaçam as condições da dedução matemática. A matemática tem um rico conjunto de tais "pontos de vista iniciais" e "abordagens" que o pesquisador pode usar alternativamente para resolver seu problema. Problemas matemáticos são frequentemente traduzidos em diferentes formas equivalentes, e cada uma delas envolve o uso de diferentes áreas da teoria matemática para resolver o problema. Assim, um matemático tem liberdade virtualmente ilimitada na escolha de premissas - ele escolhe aquelas que, do seu ponto de vista, contêm as possibilidades mais promissoras para a solução mais simples, mais não banal e elegante de um problema. Seu talento e experiência se manifestam justamente na escolha bem-sucedida de pré-requisitos, aqueles “digamos que...” ou “se..., então”, que estão repletos de trabalhos matemáticos. Assim como na lógica, as premissas matemáticas - axiomas ou postulados - determinam as definições de unidades ainda indefinidas.

A liberdade de escolha de premissas em matemática depende diretamente daquelas unidades ou objetos imateriais com os quais ela opera - sua atenção é direcionada para a relação entre eles. Objetos matemáticos atuam como símbolos que expressam a estrutura de relações puras. Um sistema matemático pode, assim, ser considerado como um conjunto de relações formais que existem apenas em virtude do enunciado dessas relações. É claro que, em particular para fins aplicados, os enunciados de relações podem ter como objetivo incorporar neles uma correspondência com a realidade externa, o que não terá nenhum efeito sobre esses enunciados em si, muito pelo contrário. Os matemáticos não investigam a "verdade" de seus axiomas, embora exijam um acordo mútuo entre eles. A pesquisa dentro de um sistema matemático é a pesquisa e o estabelecimento de conexões que permitem provar que o fato da teoria A implica o fato da teoria B. Portanto, a questão principal na matemática não é “o que são A e B”, mas “ A pressupõe (ou condiciona) B? »

A situação na linguística é completamente diferente - concentra-se principalmente na primeira dessas questões, e isso não lhe dá a oportunidade de romper com a realidade; portanto, opera não com unidades abstratas, mas com unidades concretas, embora em alguns casos tenda a criar objetos abstratos como o conceito de fonema ou morfema. Essa situação é característica não apenas da linguística tradicional, mas é igualmente característica de suas últimas tendências, unidas sob a bandeira do estruturalismo. Uma série de afirmações já foram citadas acima, cujos autores, tentando usar não apenas métodos indutivos, mas também dedutivos (ou métodos matemáticos e lógicos) na ciência da linguagem, não puderam evitar a necessidade de se referir a uma verdadeira linguagem linguística. facto. Além deles, pode-se citar mais uma coisa, que traz total clareza à questão em apreço. "Análise Linguística,- P. Garvin escreve a esse respeito,- basicamente um processo indutivo no sentido de que busca estabelecer uma lista de elementos ou um conjunto de enunciados a partir dos estímulos linguísticos dos informantes ou do estudo de um texto. Baseia-se no pressuposto de que em ambas as fontes de informação será possível reconhecer elementos de ocorrência regular de vários tipos e ordens de complexidade. A classificação desses tipos e a declaração de suas condições de distribuição, obtidas como resultado da análise, formam uma descrição indutiva da linguagem” 13 .

Na linguística, é claro, também se pode usar o método das pressuposições, com base no qual determinados objetos, fatos ou unidades de linguagem são então determinados. Mas aqui nos deparamos com dois recursos que fazem ajustes significativos no uso desse método. Ao contrário da lógica e da matemática, neste caso, será buscada a “verdade” das definições assim obtidas, ou seja, sua correspondência com os dados da experiência. Assim, a interdependência da premissa e do conhecimento inferencial é estabelecida: a premissa determina a conclusão (a definição de um determinado objeto linguístico em termos da premissa), mas se a conclusão não corresponder aos dados da experiência, então a própria premissa precisa ser corrigido. Mas os ajustes da pressuposição desse tipo não têm nada em comum com a traduzibilidade em formas equivalentes que, como observado acima, é permissível em matemática, uma vez que não são condicionadas por

13 P. Garvin, Um Estudo do Método Indutivo em Sintaxe, "Word", vol. 18, 1962, pág. 107.

considerações formais, mas os dados da experiência. Tudo isso dá razão para concluir que o próprio conceito de pré-requisito e a liberdade de escolhê-lo têm uma especificidade na análise linguística, que não pode ser ignorada quando se usa o método dedutivo em linguística.

Os linguistas não podem usar o método “se” ou “vamos” com tanta liberdade quanto os matemáticos. A sua liberdade de instalações é muito estritamente limitada. A história da ciência da linguagem conhece muitas mudanças nos "pontos de vista" ou, em outras palavras, nas premissas iniciais, que foram motivadas pela descoberta de novos fatos, a difusão de idéias científicas gerais para a linguística, ou mesmo a formação de teorias. Mas para o linguista, em todos esses casos, a mudança do "se", ou da premissa inicial, é a mudança de todo o conceito científico. Portanto, o linguista não diz “se”, mas postula sua compreensão do pré-requisito, ou seja, de fato, uma compreensão do objeto de sua pesquisa, e, a partir dessa compreensão, dá uma definição de unidades privadas da língua , verificando essas definições com dados de experiência. Esta última circunstância, devido à interdependência da premissa e da conclusão em linguística, serve como meio de verificar a legitimidade da própria premissa, que está no início de uma análise linguística de forma dedutiva. Assim, se nos voltarmos para exemplos específicos,dentroAntigamente, a linguagem era interpretada como expressão da essência espiritual do povo (por Humboldt), como organismo natural (por Schleicher), como atividade psicofisiológica individual (por neogrammaristas), etc. conceitos mostraram sua insuficiência. Hoje, a premissa inicial da análise linguística é o postulado de que a linguagem é um sistema de signos. Está sujeito ao mesmo teste de experiência e prática que qualquer outro conceito na ciência da linguagem.

Já essas considerações preliminares e mais gerais mostram que os métodos dedutivos não são de forma alguma contraindicados em linguística, mas sua aplicação exige o cumprimento de condições específicas. São essas condições específicas que impõem certas restrições à transferência mecânica dos métodos da lógica e da matemática para o campo da linguística. No entanto, se nos limitarmos a uma declaração tão geral, muito ainda permanece obscuro. É por isso que é necessário aprofundar a questão por nós considerada e, para reforçar as conclusões potenciais, recorrer à prática da linguística aplicada, onde a legitimidade das premissas e a correspondência com os dados experimentais das conclusões feitas sobre a sua base são mais claramente manifestadas.

A relação entre linguagem e lógica é muito peculiar. Os representantes das ciências empíricas, que incluem a linguística, estudam um determinado objeto ou fenômeno para descrevê-lo ou explicá-lo. Eles formulam seus resultados em uma linguagem chamada linguagem objeto. O lógico empunha provas, inferências, julgamentos, etc., mas eles estão disponíveis para ele apenas na forma linguística. Assim, verifica-se que o lógico está um passo mais longe do mundo real do que os representantes das ciências empíricas. Sua análise se dirige não diretamente ao objeto real estudado pelas ciências empíricas, mas à sua linguagem 14 . Em outras palavras, ele investiga a linguagem e formula os resultados obtidos em uma linguagem que é chamada de metalinguagem.

Os conceitos de verdade e significado pertencem ao campo da semântica, que estuda a relação entre a linguagem e os objetos que ela denota. Por meio dessas relações, a verdade ou falsidade de uma sentença é determinada: se a sentença descreve objetos corretamente, ela é verdadeira, e se estiver errada, não é. Mas as expressões linguísticas podem entrar em relações diferentes daquelas que

14 “A análise lógica do conhecimento científico”, escrevem P. V. Tavanets e V. S. Shvyrev a esse respeito, “é antes de tudo uma análise da linguagem na qual esse conhecimento é expresso”. Ver o artigo "The Logic of Scientific Cognition" na coleção "Problems of the Logic of Scientific Cognition", M., "Nauka", 1964, p. 161.

existem entre os objetos que eles denotam. Além disso, as ofertas podem estabelecer relações com outras ofertas. A tarefa do lógico é descobrir a natureza da relação entre expressões linguísticas e sentenças e estabelecer regras para determinar se o procedimento prescrito em um determinado caso é seguido ou não. Ao resolver esta última questão, o lógico não se refere aos objetos descritos pela sentença. Ele está interessado na forma linguística, não em seu conteúdo, o que, claro, não impede a interpretação de seu conteúdo, resultando em uma linguagem formalizada. Uma linguagem formalizada pode ser representada como um sistema abstrato, como um cálculo de predicados.

Se um lógico, ocupado com o estudo das formas linguísticas e das relações existentes entre elas, pode permanecer no nível sintático, operando com termos sem sentido, então o linguista não pode fazer isso. Todos os níveis da linguagem natural (com a possível exceção do fonêmico) são significativos e, portanto, impensáveis fora da semântica. Além disso, a linguagem natural não existe fora da pragmática, que não pode ser facilmente desvinculada dela pela simples razão de que no ato de fala ela é constantemente transpolada para a semântica. Portanto, a linguagem natural é sempre uma interpretação e, mais ainda, de duas etapas, pois está ligada tanto à semântica quanto à pragmática 15 . E essa interpretação ainda não se presta a nenhuma formalização.

15 qua As observações de Niels Bohr sobre a linguagem matemática, onde "a não ambiguidade das definições necessárias para uma descrição objetiva é alcançada usando símbolos matemáticos precisamente porque assim se evitam as referências ao sujeito consciente que permeiam a linguagem cotidiana". (Nilo Bor, Física atômica e conhecimento humano, M., IL, 1961, p. 96.)aqui estamos lidando com termos significativos, mas em linguagem lógica e natural eles constroem sua relação com a "verdade" em bases completamente diferentes. Como escreve A. Tarski, "verdadeiro", "em todo caso, em sua interpretação clássica" é verdadeiro na medida em que "coincide com a realidade" 16 . Mas este critério de verdade, na verdade, só se aplica às línguas naturais, que são sempre orientadas para a realidade. A situação é diferente na semântica lógica. A análise semântica depende apenas da interpretação lógica do sistema e envolve o estabelecimento em- eucertas regras que formulam condições de verdade,euEle prescreve a adesão a essas regras, sem responder à questão de até que ponto a "coincidência" ocorre aqui.eurelação com a realidade. Além disso, o foco na própria realidade é realizado em linguagem natural não diretamente, mas por meio de uma pessoa, o que novamente torna necessário recorrer ao terceiro nível,- pragmático. “... A transição para o nível semântico,- apurado por P. V. Tavanets e V. S. Shvyrev,- não é em si um retorno à linguagem viva em sua concretude, como pode parecer à primeira vista devido ao fato de que a função semântica da linguagem é, por assim dizer, a essência da linguagem como a “realidade imediata do pensamento”. De fato, o esquema original da semântica "linguagem - “realidade” ainda não dá uma imagem concreta da linguagem como a realidade imediata do pensamento pela simples razão de que a linguagem está ligada à realidade não em si mesma de algum modo místico, mas através de uma pessoa, através de suas ações, seu comportamento. Portanto, de fato, uma ideia específica de linguagem como portadora do pensamento só pode ser alcançada no nível de sua análise pragmática de acordo com a “linguagem”. - ações humanas com e com base na linguagem - realidade" 17 .

Mas isso não é tudo. Em relação a esta questão, M. | Glushkov escreve: “Uma linguagem humana viva pode ser considerada como uma linguagem formal somente depois que um sistema estrito de regras foi formulado que permite

16A. Tag k i, Grundlegung der Wissenschaftlichen Semantik
(Atos de Congrès International de Philosophie Scientifique, 1936).

17 Veja o artigo "A lógica do conhecimento científico" na coleção "Pro-
problemas da lógica do conhecimento científico”, M., “Nauka”, 1964, página 16.

distinguir expressões permitidas na língua de todas as outras expressões, ou seja, frases significativasA partir desem sentido" 18 . Explicando as dificuldades que surgem na formalização de uma linguagem natural, ele aponta ainda que “... nenhuma linguagem formalizada fixa pode ser adequada a uma linguagem humana viva, pois esta, ao contrário da primeira, está em constante desenvolvimento e aperfeiçoamento. Portanto, qualquer formalização de qualquer linguagem humana viva é apenas uma cópia instantânea mais ou menos bem sucedida dela, que perde sua semelhança com o original à medida que este se desenvolve. Se tudo se resumisse a isso, seria metade do problema. Na linguística aplicada, eles pensam nos momentos do desenvolvimento da linguagem, tentam considerá-la como um sistema completamente estável e, no entanto, ainda não conseguem alcançar formalização de uma linguagem natural. Isso acontece por uma razão muito simples. O sistema formal e a linguagem natural baseiam sua eficácia em qualidades opostas polares. Qualquer sistema formal é sempre idêntico a si mesmo. É esta qualidade que lhe permite desempenhar as suas funções em todos os casos específicos da sua aplicação. E a linguagem natural - em seu conteúdo, em sua semântica, ou, como se costuma dizer nesses casos, em seus termos informativos - nunca é idêntica a si mesma. É essa sua capacidade que lhe permite atuar em todos os casos específicos de sua aplicação. Permanecendo a mesma língua, é sempre diferente em diferentes situações. Ao mesmo tempo, não tem regras explícitas nem formativas, nem regras de verdade, nem regras transformacionais para determinar quais dos significados potenciais ou matizes de significados uma determinada palavra receberá em uma determinada situação. Além disso, quase qualquer palavra de uma língua natural pode adquirir um significado que não está fixado em nenhuma língua - pode, surgindo, fixar-se na língua, mas com o mesmo sucesso, como uma chama rápida, lampejante, perder-se no espaço linguístico e sair.

18 V. M. Glushkov, Thinking and cybernetics, “Questões de fi-
filosofia”, 1963, nº 1, pp. 37-38

19 Ibid., p. 38.

E com todas essas qualidades, a linguagem natural acaba sendo uma ferramenta incrivelmente perfeita que permite alcançar um entendimento mútuo completo sobre os conceitos mais complexos e em qualquer situação. Por que isso está acontecendo?

Aparentemente, a resposta a esta pergunta deve ser buscada parcialmente em um dos pensamentos do fundador da semiótica Ch. Pierce, que ele repete persistentemente em muitas de suas obras. Ele se resume ao seguinte. Na linguística moderna, a linguagem é geralmente definida como um sistema de signos. Essa é a premissa básica de toda análise linguística. Se assim é, então a linguagem não é apenas um sistema de signos, mas um sistema de signos que se interpretam mutuamente que existem nela na medida em que são interpretados em outros signos. C. Pierce assim o formula: “Nenhum signo pode funcionar como signo se não for interpretado em outro signo. Portanto, é absolutamente essencial que um signo atue sobre outro signo. E em outro lugar: "Todo o propósito de um signo é que ele seja interpretado em outro signo" 21 . E, por fim, talvez o mais importante: “Um signo não é signo, a menos que se traduza em outro signo, no qual recebe um desenvolvimento mais completo” 22 .

Consequentemente, a linguagem natural é um sistema de signos que, por meio da interpretação mútua, são capazes de responder a todas as necessidades humanas na expressão semântica. Mas uma ressalva importante é necessária aqui. Afinal, todas as necessidades desse tipo são determinadas pela atitude de uma pessoa em relação aos fenômenos do mundo externo e do ambiente social em que sua vida ocorre. Devido a essa circunstância, a semântica transformacional, se pudesse ser criada, não pode contar apenas com as regras de interpretação mútua dos signos, ou seja, ser de natureza fechada e finita. Acaba sendo uma derivada de um número muito grande de quantidades que se opõem de todas as maneiras possíveis à formalização.

20 cap. R e i g c e , Collected Papers, Cambridge, Mass., vol. oito,
pág. 225.

21 Ibid., vol. 8, pág. 191.

22 Ibid., vol. 5, pág. 594.

Em conexão com o que foi dito, é importante considerar as características do procedimento para resolver problemas e o próprio conceito de solubilidade em lógica e matemática, por um lado, e em linguística, por outro.

Antes de resolver um problema de matemática, o problema deve ser formulado em termos precisos. Esta formulação em si é um pré-requisito para uma solução bem sucedida do problema. Ao mesmo tempo, como já foi apontado, um matemático pode transformar livremente uma dada formulação de um problema em uma variante equivalente; ele também tem os meios apropriados para isso. Já nesta primeira fase da metodologia de investigação, a linguística difere significativamente da matemática. Ao formular seus problemas, o linguista tem uma certa quantidade de dados empíricos observados, que nem sempre ele pode dar uma formulação exata, mas que, no entanto, ele quer ou não deve colocar como base de sua pesquisa - já em processo de pesquisa. em si, as formulações são esclarecidas, que muitas vezes são o objetivo da própria pesquisa. Para não ir muito além dos exemplos, podemos nos referir ao significado linguístico, que está subjacente à pesquisa no campo do processamento automático da informação da fala, mas ao mesmo tempo é definido de maneira muito vaga e contraditória. É esta circunstância que obriga os investigadores desta área a alterarem constantemente a sua estratégia.

Mas agora a pesquisa começou e alguma solução foi alcançada. O que isso significa em relação à lógica e à matemática e em relação à linguística? A lógica, como observado acima, torna possível representar explicitamente as conclusões que estão implícitas na premissa. No entanto, a lógica não possui regras, cujo uso pode garantir que a solução desejada seja obtida neste caso, pois não é um meio para chegar a novas conclusões, mas apenas um método para determinar sua correção. Ela não é a chave mágica para todos os mistérios. É bastante óbvio que, se a lógica tivesse tais regras, não haveria problemas não resolvidos. Bastaria aplicar um certo conjunto de regras lógicas e receberíamos automaticamente uma resposta pronta para qualquer pergunta que nos atormentasse. À luz do que foi dito, o conceito de resolubilidade de um problema ou tarefa também adquire um significado específico.

Em lógica e matemática, qualquer resultado final é reconhecido como verdadeiro se nenhuma regra formal foi violada no processo de prova. Uma vez que diferentes formas de prova são possíveis neste caso, a existência de diferentes soluções é admissível. Mas todos eles podem estar sujeitos a verificação do ponto de vista da exigência da lógica ou da matemática. A situação é diferente na linguística. Não dispõe de aparato para verificar ou provar a veracidade das conclusões tiradas. Assim, a verdade das decisões tomadas também é determinada - é estabelecida não por regras formais, mas por sua correspondência com os dados da experiência. Sob essas condições, teoricamente, seria de esperar uma única solução final. No entanto, na prática, como atestam definições linguísticas contraditórias até mesmo das principais categorias da linguagem, não é esse o caso. Nesse caso, há sempre uma certa subjetividade das avaliações, que é em grande parte determinada pela quantidade de fatos à disposição do pesquisador. Segue-se daí que a verdade de uma decisão em linguística é sempre dada em alguma aproximação e não é determinista, mas probabilística.

Nestas condições, é muito importante testar a exatidão das definições e interpretações linguísticas com base em critérios objetivos. A possibilidade de tal verificação é proporcionada por uma ampla área da linguística aplicada, onde a linguagem natural se opõe a uma máquina que representa os interesses da lógica e da matemática.

Um computador digital é usado para resolver problemas práticos de linguística aplicada. É capaz de perceber, armazenar, transmitir, reagrupar e emitir informações. Ele interpreta e executa um conjunto de comandos (programa de comando) e também os modifica durante a execução de uma tarefa. É capaz de resolver problemas muito complexos, mas todo o processo de transição da tarefa para a solução deve ser descrito de forma exaustiva e consistente em termos de uma sequência de operações elementares básicas. As informações são inseridas na máquina usando um código ou idioma de dois dígitos (binário). A máquina opera com palavras codificadas desta forma, correspondendo às principais conexões lógicas . ou funções do cálculo proposicional ou de predicados. Uma máquina pode resolver problemas matemáticos complexos precisamente porque é possível reduzir operações matemáticas complexas a uma sequência de operações aritméticas e estas, por sua vez, a operações lógicas. Portanto, um computador digital pode ser considerado da mesma forma que uma máquina lógica.

Assim, qualquer que seja a complexidade da tarefa, a máquina a resolve com a ajuda de uma sequência de operações elementares, cujo programa deve ser formulado de forma absolutamente inequívoca (consistente), precisa, detalhada e exaustiva. Em outras palavras, não deve ultrapassar os limites estabelecidos pelo cálculo lógico das proposições; e quando nos perguntamos se uma máquina pode lidar com o processamento de informações contidas em linguagens naturais, primeiro precisamos descobrir até que ponto o cálculo proposicional lógico é um modelo adequado para a linguagem natural.

Nesse caso, como mostrou Bar-Hillel 23, é preciso enfrentar tais dificuldades que pintam as perspectivas do processamento automático de informações com uma luz muito sombria, a menos que toda a direção da busca por uma solução para esse problema seja alterada. No mínimo, teremos que contar com os obstáculos listados abaixo, para os quais ainda não temos os meios necessários para superá-los.

A. O cálculo lógico das proposições é muito pobre para ser capaz, mesmo remotamente

23 Y. V a g - H i 1 1 f 1, Uma Demonstração da Inviabilidade da Tradução Totalmente Automática de Alta Qualidade, "Avanços em Computadores", ed. por F. Alt., vol. EU, N. Y., 1960, p. 158-163.

aproximação, para reformular uma linguagem natural que é incrivelmente complexa em sua estrutura semântica, possui uma enorme quantidade de elementos redundantes e, mais importante, é muitas vezes caracterizada por tal imprecisão e indefinição na expressão de “significado” que nenhuma lógica de dois valores é capaz de lidar com a criação de um gêmeo artificial de uma linguagem natural 24 . É verdade que a lógica, como apontado, lida apenas com a forma linguística. Mas, como se trata de processamento automático de informações, é necessário poder distinguir entre informações semânticas, e se isso não pode ser feito usando os meios lógicos à nossa disposição, então como podemos obter "certeza de que nossa tradução de linguagem natural em lógica está correto?

B. A máquina não pode levar em conta o que Bar-Hillel chama de "dados de informação anteriores comuns"(fundo geral de informações),que realmente permanecem fora da linguagem natural e, portanto, não podem ser traduzidas para uma linguagem lógica. Os linguistas nesses casos falam de um contexto extralinguístico.(quadro de Referência), que, de forma sutil, mas muito decisiva, corrige ou mesmo repensa completamente todas as nossas palavras. Afinal, mesmo uma frase tão simples como “Voltarei antes de escurecer” requer pelo menos um conhecimento prévio de onde foi pronunciada e em que hora do dia e do ano para entendê-la com precisão e determinar a indicação de tempo contida nela. Informações preliminares desse tipo sozinhas são muitas vezes o único meio para elucidar aquelas relações intra-fase que nem o cálculo proposicional nem o cálculo de predicados são capazes de lidar. Então, usando como exemplo duas frases que brilharam nos jornais:

Estudante de pós-graduação da universidade da cidade de Kursk. Honrado inovador da Sibéria,

vemos que cada um deles pode ser interpretado de duas maneiras. Se apenas formalmente

24 O artigo de C. Hockett "Gramática para o Ouvinte" incluído nesta seção dá muitos exemplos de tais dificuldades na compreensão "natural" da sentença, que são resolvidas por etapas subsequentes e de longo alcance de análise.

gramaticais, então a primeira frase pode igualmente ser entendida como "Um estudante de pós-graduação de uma universidade localizada na cidade de Kursk" e como "Um estudante de pós-graduação de uma universidade que vive na cidade de Kursk (ou originário da cidade de Kursk )". E a segunda frase pode ser interpretada tanto como "Honrado inovador, cujo campo de atividade é a Sibéria" e como "Honrado inovador, que é residente da Sibéria". E apenas conhecimento preliminar e não expresso em sentenças (informações preliminares), afirmando que não há universidade na cidade de Kursk e que merecido congestionamento racionalista há um título honorário conferido na União Soviética por distritos administrativos individuais, torna possível entender corretamente essas propostas. Se você olhar de perto, quase todas as frases da língua falada são informações preliminares muito sólidas e ramificadas, o que é evidente para uma pessoa, mas está além da “compreensão” de uma máquina que não conhece clã nem tribo.

25 No colóquio Stichting Studiecentrum para Automação Administrativa,organizado em 1961. Há também uma tradução alemã do relatório: A. R e i ch 1 i n g, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, "Beiträge zur Sprachkunde und Informationsverarbeitung", Heft I., Viena, 1963.

no bar". Agora podemos concluir que, aparentemente, estamos falando de um jogo por dinheiro. Mas ainda existem outras possibilidades. Segue-se: "Meu irmão veio à mesa e os dados foram lançados." Agora está claro a qual jogo está se referindo, embora em nenhum lugar do texto haja uma indicação exata do significado real da palavra "jogo". Nós adivinhamos sobre ele pela totalidade desses sinais externos que são dados no texto em frases diferentes. Esses signos seguem aqui um após o outro, mas em uma narrativa escrita eles podem ser significativamente separados um do outro. Uma pessoa pode selecioná-los a partir de um amplo contexto linguístico, compará-los e então tirar a conclusão apropriada. A máquina é privada desta possibilidade.

Mas talvez não seja tão importante? De fato, ao traduzir essas frases para alemão ou francês por máquina, não há dificuldades particulares (mas, é claro, podem surgir dificuldades ao traduzir outras frases). Ao traduzir para o alemão, podemos usar o literalismo:Ich Spiele mit Meinem Bruder.Da mesma forma, em francês podemos começar: Je joue avec... Ao traduzir para o inglês, no entanto, surgem dificuldades gramaticais, pois no texto dado não há indicação de qual forma a máquina deve escolher: 1. Estou jogando com meu irmão, 2. Eu jogo com meu irmão, ou 3. Vou brincar com meu irmão. E será muito ruim na hora de traduzir para o espanhol, já que a máquina terá que escolher entre pelo menos três verbos: jugar, tocar ou trabajar.

Aqui a linguagem lógica é impotente.

D. A máquina realmente lida com fala (ou, mais precisamente, com segmentos de fala) - em sua forma escrita e oral. Cada uma dessas formas de fala tem seu próprio sistema de elementos pragmáticos, que também são capazes de se transformar em semânticos (e as regras para tal transição não foram estudadas e são amplamente arbitrárias). Assim, por exemplo, a fala oral tem uma superestrutura suprasegmental como a entonação. Parece agora possível classificar a entonação de acordo com os tipos funcionais, destacando as entonações interrogativas, narrativas, etc. No entanto, é bastante claro que a entonação não existe isoladamente das frases. Ela, claro, interage com o significado contido neles. Para isso, basta referir-se a uma pergunta retórica, que é uma pergunta apenas em sua estrutura externa, mas não em seu significado. - não requer uma resposta dos ouvintes. Estas são as novas dificuldades com as quais a linguagem lógica é incapaz de lidar.

E. Mas mesmo que seja possível lidar com as dificuldades linguísticas listadas, ainda existem obstáculos de ordem lógica adequada. - neste caso estamos falando das chamadas "regras de decisão de inferência"(regras de decisão). Afinal, se queremos ter certeza de que a máquina funcionará logicamente sem falhas, devemos fornecer a ela um conjunto de regras, seguindo as quais ela pode ir consistentemente da informação de origem às conclusões necessárias. Temos tais regras para cálculos lógicos proposicionais, mas para lógicas mais complexas não existem tais regras e, além disso, há razões para acreditar que tais regras não podem ser encontradas. Se nos concentrarmos nas regras que já temos à nossa disposição, usá-las tornará o processo de resolução tão complicado (mesmo com computadores avançados) que o jogo não valerá a pena.

Dessa forma, o problema da aplicação de métodos lógicos e matemáticos na ciência da linguagem é traçado com base nos dados da linguística aplicada. Quais são as conclusões? As conclusões já foram formuladas acima. - a análise linguística permite uma combinação de métodos indutivos com dedutivos, mas quando falamos do uso de métodos dedutivos em linguística, não se deve reduzir tudo à subordinação cega da pesquisa linguística aos métodos lógico-matemáticos. A linguagem natural se rebela contra tal violência. E a prática da linguística aplicada confirma essas conclusões, estabelecendo que existem tais diferenças entre uma linguagem lógica formalizada e uma linguagem natural que uma linguagem bastante completa (em termos informativos), a tradução da segunda para a primeira é impossível. Isso significa que em linguística, e em linguística aplicada em particular, o uso de métodos lógico-matemáticos deve ser abandonado? Claro que não. Mas você não deve confiar inteiramente neles, mas combiná-los com outros. E para não sermos infundados, vamos ao testemunho de matemáticos e lógicos, que na prática têm que aplicar seus conhecimentos ao estudo da linguagem natural.

Eis o que diz o matemático: “A ajuda da matemática no estudo da linguagem natural ainda está longe de ser óbvia... . Esse - problema não matemático, faz parte dos métodos indutivos em linguística.

E aqui está o que o lógico diz: “As perspectivas de processamento automático de informações de fala são muito boas, mas o papel da lógica nessa área é limitado. No entanto, como ferramenta de análise linguística, não como um conjunto de regras para tirar conclusões, faz promessas reais” 27 . E então ele estabelece qual estratégia de pesquisa é mais preferível neste caso: “Os problemas devem ser resolvidos não seguindo firmemente um conjunto de regras estabelecidas por um lógico, mas usando técnicas heurísticas ... , abordagem indutiva é preferível, em que regras aproximadas para resolver problemas de informação. Não se deve tentar traduzir a linguagem comum para a linguagem lógica com o propósito de processá-la posteriormente, mas sim procurar regras do tipo heurístico que permitirão lidar com a linguagem natural. Necessário pare de olhar

26 P. Garvin e W. C a g u s h, Lingüística, Processamento de Dados-
canto e Matemática, "Linguagem natural e o computador", N. Y.,
1963, pág. 368-369. Cm . também no mesmo livro artigo W. K a g você é,
O uso da matemática nas ciências comportamentais, pp. 64-83.

27 M. M a g o n, Visão de um lógico de processos de dados de linguagem-
canta, referido livro, pág. 144.

certeza absoluta e recorrer a métodos aproximados, que, com o acúmulo de experiência, serão refinados e aprimorados. Preferimos tratar as aproximações da mesma forma que a teoria é tratada na ciência, onde modificações e melhorias são feitas com base em dados experimentais.

É com essas considerações em mente que os artigos incluídos nesta seção devem ser abordados. Como já mencionado, eles são retirados da coleção de materiais do simpósio sobre matemática aplicada "A estrutura da linguagem e seus aspectos matemáticos" (o simpósio foi realizado em Nova York em abril de 1960, os materiais do simpósio foram publicados em 1961) .

O simpósio contou com a presença de matemáticos, lógicos e linguistas, ou seja, apenas representantes das ciências cujo trabalho conjunto foi mencionado acima. O tema do simpósio, formulado com bastante liberdade, deu a seus participantes a oportunidade de falar tanto sobre questões muito particulares e especiais, quanto sobre questões bastante gerais, sem se vincular a um entendimento comum das tarefas dos temas em consideração, ou a uma avaliação de sua participação no problema como um todo. Talvez o único início teórico que uniu os participantes do simpósio tenha sido a tese citada por R. Jakobson no “Prefácio” aos materiais, segundo a qual a linguística deveria

28 Ibid., pp. 143-144.

deve ser considerado como uma ponte entre as disciplinas matemáticas e humanas. Caso contrário, cada autor da comunicação agiu de acordo com seus interesses individuais e de acordo com a direção de seu trabalho de pesquisa.

Devido a um certo limite de páginas desta coleção, não foi possível utilizar todos os artigos incluídos nos materiais do simpósio. Alguma seleção de artigos teve que ser feita, entretanto, de tal forma que desse ao leitor soviético a oportunidade de formar um quadro bastante completo das tendências gerais no estudo do problema que está no título do simpósio. Em sua qualidade informacional, todos os artigos desta seção são de inegável interesse tanto para a teoria da linguística quanto para a prática de pesquisa da linguística aplicada.

NO.Zvegintsev

A formação da linguística estrutural na virada dos séculos XIX-XX. Métodos estatísticos na aprendizagem de línguas. Aplicação de métodos matemáticos em linguística na segunda metade do século XX. Aprender a língua por métodos de lógica formal. Características da tradução automática.

INTRODUÇÃO

Capítulo 1. A história da aplicação de métodos matemáticos em linguística

1.1. A formação da linguística estrutural na virada dos séculos XIX-XX

1.2. Aplicação de métodos matemáticos em linguística na segunda metade do século XX.

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1. Tradução automática

2.2. Métodos estatísticos na aprendizagem de línguas

2.3. Aprender uma língua por métodos de lógica formal

2.4. Perspectivas para a aplicação de métodos matemáticos em linguística

Conclusão

Literatura

Apêndice 1. Ronald Schleifer. Fernando de Saussure

Apêndice 2. Ferdinand de Saussure (tradução)

INTRODUÇÃO

No século XX, houve uma tendência contínua para a interação e interpenetração de vários campos do conhecimento. As fronteiras entre as ciências individuais são gradualmente borradas; há cada vez mais ramos da atividade mental que estão "na junção" do conhecimento humanitário, técnico e das ciências naturais.

Outra característica óbvia da modernidade é o desejo de estudar as estruturas e seus elementos constituintes. Portanto, um lugar crescente, tanto na teoria científica quanto na prática, é dado à matemática. Entrando em contato, por um lado, com a lógica e a filosofia, por outro, com a estatística (e, consequentemente, com as ciências sociais), a matemática penetra cada vez mais profundamente naquelas áreas que por muito tempo foram consideradas puramente “humanitários”, ampliando seu potencial heurístico (a resposta à pergunta “quanto” muitas vezes ajudará a responder às perguntas “o quê” e “como”). A linguística não foi exceção.

O objetivo do meu trabalho de curso é destacar brevemente a conexão entre a matemática e um ramo da linguística como a linguística. Desde os anos 50 do século passado, a matemática tem sido usada na linguística para criar um aparato teórico para descrever a estrutura das línguas (naturais e artificiais). Ao mesmo tempo, deve-se dizer que não encontrou imediatamente essa aplicação prática para si. Inicialmente, os métodos matemáticos em linguística começaram a ser utilizados para esclarecer os conceitos básicos da linguística, porém, com o desenvolvimento da tecnologia computacional, tal premissa teórica começou a encontrar aplicação na prática. A resolução de tarefas como tradução automática, recuperação de informações por máquina, processamento automático de texto exigia uma abordagem fundamentalmente nova da linguagem. Os linguistas enfrentaram a questão: como aprender a representar padrões linguísticos na forma em que eles podem ser aplicados diretamente à tecnologia. O termo “linguística matemática”, que é popular em nosso tempo, refere-se a qualquer pesquisa linguística que use métodos exatos (e o conceito de métodos exatos na ciência está sempre intimamente relacionado à matemática). Alguns cientistas do passado acreditam que a expressão em si não pode ser elevada à categoria de termo, pois não significa nenhuma “linguística” especial, mas apenas uma nova direção voltada para o aprimoramento, aumento da precisão e confiabilidade dos métodos de pesquisa linguística. A linguística usa métodos quantitativos (algébricos) e não quantitativos, o que a aproxima da lógica matemática e, consequentemente, da filosofia e até da psicologia. Até mesmo Schlegel notou a interação da linguagem e da consciência, e Ferdinand de Saussure, um linguista proeminente do início do século XX (falarei sobre sua influência no desenvolvimento de métodos matemáticos em linguística mais tarde), conectou a estrutura da linguagem com seu pertencimento. ao povo. O pesquisador moderno L. Perlovsky vai além, identificando as características quantitativas da língua (por exemplo, o número de gêneros, casos) com as peculiaridades da mentalidade nacional (mais sobre isso na Seção 2.2, "Métodos Estatísticos em Lingüística").

A interação da matemática e da linguística é um tema multifacetado, e no meu trabalho não me deterei em tudo, mas, antes de tudo, em seus aspectos aplicados.

Capítulo IHistória da aplicação de métodos matemáticos em linguística

1.1 Formação da linguística estruturalna virada dos séculos XIX-XX

A descrição matemática da linguagem é baseada na ideia de linguagem como mecanismo, que remonta ao famoso linguista suíço do início do século XX, Ferdinand de Saussure.

O elo inicial de seu conceito é a teoria da linguagem como um sistema composto por três partes (a própria linguagem é Língua, Fala - senha, e atividade de fala - Língua), em que cada palavra (membro do sistema) é considerada não em si mesma, mas em conexão com outros membros. Como outro linguista proeminente, o dinamarquês Louis Hjelmslev, observou mais tarde, Saussure "foi o primeiro a exigir uma abordagem estrutural da linguagem, isto é, uma descrição científica da linguagem registrando as relações entre as unidades".

Compreendendo a linguagem como uma estrutura hierárquica, Saussure foi o primeiro a colocar o problema do valor e do significado das unidades linguísticas. Fenômenos e eventos separados (digamos, a história da origem de palavras indo-européias individuais) devem ser estudados não por si mesmos, mas em um sistema no qual são correlacionados com componentes semelhantes.

A unidade estrutural da linguagem de Saussure considerava a palavra, "signo", na qual se combinavam som e significado. Nenhum desses elementos existe um sem o outro: portanto, o falante nativo entende os vários matizes do significado de uma palavra polissemântica como um elemento separado no todo estrutural, na língua.

Assim, na teoria de F. de Saussure pode-se ver a interação da linguística, por um lado, com a sociologia e a psicologia social (note-se que, ao mesmo tempo, a fenomenologia de Husserl, a psicanálise de Freud, a teoria da relatividade de Einstein eram desenvolvendo, experimentavam-se a forma e o conteúdo na literatura, na música e nas artes plásticas), por outro lado, com a matemática (o conceito de sistemicidade corresponde ao conceito algébrico de linguagem). Tal conceito mudou o conceito de interpretação linguística como tal: os fenômenos passaram a ser interpretados não em relação às causas de sua ocorrência, mas em relação ao presente e ao futuro. A interpretação deixou de ser independente das intenções de uma pessoa (apesar do fato de que as intenções podem ser impessoais, "inconscientes" no sentido freudiano da palavra).

O funcionamento do mecanismo linguístico se manifesta através da atividade de fala dos falantes nativos. O resultado da fala são os chamados "textos corretos" - sequências de unidades de fala que obedecem a determinados padrões, muitos dos quais permitem uma descrição matemática. A teoria das formas de descrever a estrutura sintática trata do estudo de métodos para a descrição matemática de textos corretos (principalmente sentenças). Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

No Ocidente, as ideias de Saussure são desenvolvidas pelos contemporâneos mais jovens do grande linguista suíço: na Dinamarca - L. Hjelmslev, já mencionado por mim, que deu origem à teoria algébrica da linguagem em sua obra "Fundamentos da Teoria Linguística", em os EUA - E. Sapir, L. Bloomfield, C. Harris, na República Checa - o cientista emigrante russo N. Trubetskoy.

As regularidades estatísticas no estudo da linguagem começaram a ser tratadas por ninguém menos que o fundador da genética, Georg Mendel. Foi somente em 1968 que os filólogos descobriram que, nos últimos anos de sua vida, ele era fascinado pelo estudo dos fenômenos linguísticos usando os métodos da matemática. Mendel trouxe esse método para a linguística da biologia; na década de 1990, apenas os linguistas e biólogos mais ousados afirmavam a viabilidade de tal análise. Nos arquivos do mosteiro de S. Tomasz em Brno, cujo abade era Mendel, foram encontradas folhas com colunas de sobrenomes terminadas em "mann", "bauer", "mayer", e com algumas frações e cálculos. Em um esforço para descobrir as leis formais da origem dos nomes de família, Mendel faz cálculos complexos, nos quais leva em conta o número de vogais e consoantes na língua alemã, o número total de palavras que considera, o número de sobrenomes, etc.

Em nosso país, a linguística estrutural começou a se desenvolver mais ou menos na mesma época que no Ocidente - na virada dos séculos 19 para 20. Simultaneamente com F. de Saussure, o conceito de linguagem como sistema foi desenvolvido em seus trabalhos por professores da Universidade de Kazan F.F. Fortunatov e I.A. Baudouin de Courtenay. Este último correspondeu por muito tempo com de Saussure, respectivamente, as escolas de linguística de Genebra e Kazan colaboraram entre si. Se Saussure pode ser chamado de ideólogo dos métodos "exatos" em linguística, então Baudouin de Courtenay lançou as bases práticas para sua aplicação. Ele foi o primeiro a separar a linguística (como exato uma ciência que usa métodos estatísticos e dependência funcional) da filologia (uma comunidade de disciplinas humanitárias que estudam a cultura espiritual através da linguagem e da fala). O próprio cientista acreditava que "a linguística pode ser útil em um futuro próximo, apenas libertada da união obrigatória com a filologia e a história literária" . A fonologia tornou-se o "campo de testes" para a introdução de métodos matemáticos na linguística - os sons como "átomos" do sistema linguístico, tendo um número limitado de propriedades facilmente mensuráveis, eram o material mais conveniente para métodos formais e rigorosos de descrição. A fonologia nega a existência de significado no som, de modo que o fator "humano" foi eliminado nos estudos. Nesse sentido, os fonemas são como objetos físicos ou biológicos.

Os fonemas, como os menores elementos linguísticos aceitáveis para a percepção, representam uma esfera separada, uma "realidade fenomenológica" separada. Por exemplo, em inglês, o som "t" pode ser pronunciado de maneira diferente, mas em todos os casos, uma pessoa que fala inglês o perceberá como "t". O principal é que o fonema desempenhará sua função principal - significativa. Além disso, as diferenças entre as línguas são tais que variedades de um som em uma língua podem corresponder a diferentes fonemas em outra; por exemplo, "l" e "r" em inglês são diferentes, enquanto em outros idiomas são variedades do mesmo fonema (como o inglês "t", pronunciado com ou sem aspiração). O vasto vocabulário de qualquer língua natural é um conjunto de combinações de um número muito menor de fonemas. Em inglês, por exemplo, apenas 40 fonemas são usados para pronunciar e escrever cerca de um milhão de palavras.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nas décadas de 1920 e 1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as "características distintivas" dos fonemas. Esses recursos são baseados na estrutura dos órgãos da fala - língua, dentes, cordas vocais. Por exemplo, em inglês a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema do outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras e um meio de comunicação, e essas duas funções nunca coincidem. Podemos notar a alternância de forma e conteúdo: contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que em uma língua, os traços distintivos formam um contraste fonético em um nível diferente de compreensão, os fonemas são combinados em morfemas, morfemas - em palavras, palavras - em frases etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que apenas a soma de suas partes.

Saussure propôs a ideia de uma nova ciência do século XX, separada da linguística, estudando o papel dos signos na sociedade. Saussure chamou essa ciência de semiologia (do grego "semeion" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, expandiu o estudo da linguagem e das estruturas linguísticas em descobertas literárias compostas (ou formuladas) com a ajuda dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era, em muitos aspectos, o oposto do racionalismo em sua análise linguística: era uma tentativa de estudar em um sistema o problema da "probabilidade" na linguagem. Tal pesquisa ajuda a focalizar o "lado real" da probabilidade; a "palavra-chave" para a qual Saussure procura um anagrama é, como argumenta Jean Starobinsky, "uma ferramenta para o poeta, não a fonte da vida do poema". O poema serve para trocar os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela ultrapassa o controle da consciência e depende apenas de as leis da linguagem” (ver . Apêndice 1).

A tentativa de Saussure de estudar os nomes próprios na poesia romana tardia enfatiza um dos componentes de sua análise linguística - a natureza arbitrária dos signos, bem como a essência formal da linguística de Saussure, que exclui a possibilidade de analisar o significado. Todorov conclui que hoje as obras de Saussure parecem ser extremamente consistentes em sua relutância em estudar os símbolos de um fenômeno que tem um significado claramente definido [Apêndice 1]. Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação aleatória baseados nesses conceitos, e, por outro lado, conceitos estruturalistas que apagam a oposição entre forma e conteúdo (sujeito e objeto) , significado e origens no estruturalismo, na psicanálise e até na mecânica quântica - os escritos de Ferdinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Cientistas russos também foram representados no Primeiro Congresso Internacional de Linguistas em Haia em 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy fizeram um relatório que examinou a estrutura hierárquica da linguagem - no espírito das ideias mais modernas para o início do século passado. Jakobson em seus escritos desenvolveu as idéias de Saussure de que os elementos básicos de uma língua devem ser estudados, antes de tudo, em conexão com suas funções, e não com as razões de sua ocorrência.

Infelizmente, depois que Stalin chegou ao poder em 1924, a linguística russa, como muitas outras ciências, foi rechaçada. Muitos cientistas talentosos foram forçados a emigrar, foram expulsos do país ou morreram em campos. Somente a partir de meados da década de 1950 um certo pluralismo de teorias se tornou possível – mais sobre isso na Seção 1.2.

1.2 Aplicação de métodos matemáticos em linguística na segunda metade do século XX

Em meados do século XX, quatro escolas linguísticas mundiais se formaram, cada uma das quais acabou sendo o ancestral de um certo método “exato”. Escola Fonológica de Leningrado(seu ancestral foi aluno de Baudouin de Courtenay L.V. Shcherba) usou um experimento psicolinguístico baseado na análise da fala de falantes nativos como o principal critério para generalizar o som na forma de um fonema.

Cientistas Círculo Linguístico de Praga, em particular - seu fundador N.S. Trubetskoy, que emigrou da Rússia, desenvolveu a teoria das oposições - a estrutura semântica da língua foi descrita por eles como um conjunto de unidades semânticas construídas opositivamente - Sem. Essa teoria foi aplicada no estudo não apenas da linguagem, mas também da cultura artística.

Ideólogos Descritivismo americano foram os linguistas L. Bloomfield e E. Sapir. A linguagem foi apresentada aos descritivistas como um conjunto de enunciados de fala, objeto principal de seu estudo. Seu foco estava nas regras de descrição científica (daí o nome) dos textos: o estudo da organização, disposição e classificação de seus elementos. A formalização de procedimentos analíticos no campo da fonologia e da morfologia (desenvolvimento de princípios para o estudo da linguagem em diferentes níveis, análise distributiva, método dos constituintes diretos etc.) levou à formulação de questões gerais de modelagem linguística. A desatenção ao plano do conteúdo da linguagem, bem como ao lado paradigmático da linguagem, não permitiu que os descritivistas interpretassem a linguagem como um sistema suficientemente completo.

Na década de 1960, desenvolveu-se a teoria das gramáticas formais, que surgiu principalmente devido ao trabalho do filósofo e linguista americano N. Chomsky. Ele é legitimamente considerado um dos mais famosos cientistas modernos e figuras públicas, muitos artigos, monografias e até mesmo um documentário completo são dedicados a ele. Com o nome de uma maneira fundamentalmente nova de descrever a estrutura sintática inventada por Chomsky - gramática generativa (generativa) - a tendência correspondente na linguística foi chamada gerativismo.

Chomsky, descendente de imigrantes da Rússia, estudou linguística, matemática e filosofia na Universidade da Pensilvânia desde 1945, sendo fortemente influenciado por seu professor Zelig Harris - assim como Harris, Chomsky considerou e ainda considera suas visões políticas próximas ao anarquismo (ele ainda é conhecido como crítico do sistema político dos EUA existente e como um dos líderes espirituais do anti-globalismo).

Primeiro grande trabalho científico de Chomsky, tese de mestrado "Morfologia do hebraico moderno » (1951) permaneceu inédito. Chomsky recebeu seu doutorado na Universidade da Pensilvânia em 1955, mas grande parte da pesquisa subjacente à sua dissertação (publicada na íntegra apenas em 1975 sob o título The Logical Structure of Linguistic Theory) e sua primeira monografia, Syntactic Structures (1957, Rus. trans. . 1962), foi realizado na Universidade de Harvard em 1951-1955. No mesmo ano de 1955, o cientista mudou-se para o Massachusetts Institute of Technology, onde se tornou professor em 1962.

A teoria de Chomsky passou por vários estágios em seu desenvolvimento.

Na primeira monografia "Estruturas sintáticas", o cientista apresentou a linguagem como um mecanismo de geração de um conjunto infinito de frases usando um conjunto finito de meios gramaticais. Para descrever as propriedades linguísticas, ele propôs os conceitos de estruturas gramaticais profundas (ocultas da percepção direta e geradas por um sistema de regras recursivas, ou seja, podem ser aplicadas repetidamente) e superficiais (diretamente percebidas), bem como transformações que descrevem a transição desde estruturas profundas até estruturas superficiais. Várias estruturas de superfície podem corresponder a uma estrutura profunda (por exemplo, uma estrutura passiva O decreto é assinado pelo presidente derivado da mesma Estrutura Profunda que a construção ativa O presidente assina o decreto) e vice-versa (assim, a ambiguidade mãe ama filha descrito como resultado de uma coincidência de estruturas superficiais que remontam a duas profundezas diferentes, em uma das quais a mãe é quem ama a filha, e na outra, a que é amada pela filha).

A teoria padrão de Chomsky é considerada o modelo de "Aspectos" estabelecido no livro de Chomsky "Aspectos da Teoria da Sintaxe". Nesse modelo, pela primeira vez, regras de interpretação semântica foram introduzidas na teoria formal, atribuindo significado a estruturas profundas. Em Aspectos, a competência linguística se opõe ao uso da linguagem (performance), adota-se a chamada hipótese Katz-Postal sobre a preservação do sentido durante a transformação, em relação à qual se exclui o conceito de transformação opcional, e um aparato de recursos sintáticos que descrevem a compatibilidade léxica são introduzidos.

Na década de 1970, Chomsky trabalhou na teoria do controle e vinculação (teoria GB - das palavras governo e vinculativo) é mais geral que o anterior. Nele, o cientista abandonou as regras específicas que descrevem as estruturas sintáticas de linguagens específicas. Todas as transformações foram substituídas por uma transformação de movimento universal. Dentro da estrutura da teoria GB, existem também módulos privados, cada um responsável por sua própria parte da gramática.

Já recentemente, em 1995, Chomsky apresentou um programa minimalista, onde a linguagem humana é descrita como linguagem de máquina. Este é apenas um programa - não um modelo ou uma teoria. Nele, Chomsky identifica dois subsistemas principais do aparato da linguagem humana: o léxico e o sistema computacional, além de duas interfaces - fonética e lógica.

As gramáticas formais de Chomsky tornaram-se clássicas por descrever não apenas linguagens naturais, mas também linguagens artificiais - em particular, linguagens de programação. O desenvolvimento da linguística estrutural na segunda metade do século XX pode ser justamente considerado uma "revolução chomskiana".

Escola Fonológica de Moscou, cujos representantes eram A.A. Reformatsky, V. N. Sidorov, P. S. Kuznetsov, A. M. Sukhotin, R.I. Avanesov, usou uma teoria semelhante para estudar fonética. Gradualmente, métodos "exatos" estão começando a ser aplicados não apenas em fonética, mas também em sintaxe. Tanto linguistas quanto matemáticos, tanto aqui quanto no exterior, estão começando a estudar a estrutura da língua. Nas décadas de 1950 e 1960, iniciou-se na URSS uma nova etapa na interação entre matemática e linguística, associada ao desenvolvimento de sistemas de tradução automática.

O impulso para o início desses trabalhos em nosso país foram os primeiros desenvolvimentos no campo da tradução automática nos Estados Unidos (embora o primeiro dispositivo de tradução mecanizada de P.P. Smirnov-Troyansky tenha sido inventado na URSS em 1933, sendo primitivo , não se difundiu). Em 1947, A. Butt e D. Britten criaram um código para tradução palavra por palavra usando um computador; um ano depois, R. Richens propôs uma regra para dividir palavras em radicais e terminações na tradução automática. Aqueles anos eram bem diferentes de hoje. Eram máquinas muito grandes e caras que ocupavam salas inteiras e exigiam uma grande equipe de engenheiros, operadores e programadores para mantê-las. Basicamente, esses computadores foram usados para realizar cálculos matemáticos para as necessidades das instituições militares - o novo em matemática, física e tecnologia serviu, antes de tudo, aos assuntos militares. Nos estágios iniciais, o desenvolvimento do MP foi ativamente apoiado pelos militares, com tudo isso (nas condições da Guerra Fria), a direção russo-inglesa desenvolvida nos EUA e a direção anglo-russa na URSS.

Em janeiro de 1954, o "Georgetown Experiment" ocorreu na Universidade Técnica de Massachusetts - a primeira demonstração pública de tradução do russo para o inglês na máquina IBM-701. Resumo da mensagem sobre a passagem bem sucedida do experimento, feita por D.Yu. Panov, apareceu no RJ "Matemática", 1954, nº 10: "Tradução de um idioma para outro usando uma máquina: um relatório sobre o primeiro teste bem-sucedido".

D. Yu. Panov (na época diretor do Instituto de Informação Científica - INI, mais tarde VINITI) atraiu I. K. Belskaya, que mais tarde chefiou o grupo de tradução automática do Instituto de Matemática Precisa e Engenharia da Computação da Academia de Ciências da URSS, para trabalhar na tradução automática. No final de 1955, data a primeira experiência de tradução do inglês para o russo com a ajuda da máquina BESM. Programas para BESM foram compilados por N.P. Trifonov e L. N. Korolev, cuja tese de doutorado foi dedicada a métodos de construção de dicionários para tradução automática.

Paralelamente, o trabalho de tradução automática foi realizado no Departamento de Matemática Aplicada do Instituto de Matemática da Academia de Ciências da URSS (agora o Instituto M.V. Keldysh de Matemática Aplicada da Academia Russa de Ciências). Por iniciativa do matemático A.A. Lyapunov. Ele envolveu O.S. Kulagin e seus alunos T.D. Wentzel e N. N. Rico. As ideias de Lyapunov e Kulagina sobre a possibilidade de usar a tecnologia para traduzir de um idioma para outro foram publicadas na revista Nature, 1955, nº 8. A partir do final de 1955, T.N. Moloshnaya, que então começou a trabalhar de forma independente no algoritmo de tradução inglês-russo.

R. Frumkina, que na época trabalhava no algoritmo de tradução do espanhol, lembra que nesta fase do trabalho era difícil dar passos consistentes. Com muito mais frequência, tive que seguir a experiência heurística - minha ou de colegas.

Ao mesmo tempo, a primeira geração de sistemas de tradução automática era muito imperfeita. Todos eles foram baseados em algoritmos de tradução sequencial "palavra por palavra", "frase por frase" - as conexões semânticas entre palavras e frases não foram levadas em consideração de forma alguma. Por exemplo, as frases são: John estava procurando sua caixa de brinquedos.Finalmente ele encontrou. A caixa estava na caneta.João ficou muito feliz. (John estava procurando sua caixa de brinquedos. Finalmente a encontrou. A caixa estava no cercadinho. John estava muito feliz.).” "Caneta" neste contexto não é uma "caneta" (ferramenta de escrita), mas um "cercadinho" ( caneta de brincar). O conhecimento de sinônimos, antônimos e significados figurativos é difícil de entrar em um computador. Uma direção promissora foi o desenvolvimento de sistemas computacionais focados no uso de um tradutor humano.

Com o tempo, os sistemas de tradução direta foram substituídos por sistemas T (da palavra inglesa "transfer" - transformação), nos quais a tradução era realizada no nível das estruturas sintáticas. Os algoritmos de T-systems usaram um mecanismo que possibilitou construir uma estrutura sintática de acordo com as regras gramaticais do idioma da sentença de entrada (semelhante a como uma língua estrangeira é ensinada no ensino médio) e, em seguida, sintetizar a sentença de saída transformando a estrutura sintática e substituindo as palavras necessárias do dicionário.

Lyapunov falou sobre tradução extraindo o significado do texto traduzido e apresentando-o em outro idioma. A abordagem de construção de sistemas de tradução automática baseada na obtenção da representação semântica da sentença de entrada por análise semântica e síntese da sentença de entrada de acordo com a representação semântica obtida ainda é considerada a mais perfeita. Tais sistemas são chamados de sistemas I (da palavra "interlíngua"). Ao mesmo tempo, a tarefa de criá-los, recuada no final dos anos 50 e início dos anos 60, não foi totalmente resolvida até agora, apesar dos esforços da Federação Internacional do IFIP - a comunidade mundial de cientistas na área de processamento de informações .

Os cientistas pensaram em como formalizar e construir algoritmos para trabalhar com textos, quais dicionários deveriam ser inseridos na máquina, quais padrões linguísticos deveriam ser usados na tradução automática. A linguística tradicional não tinha tais ideias - não apenas em termos de semântica, mas também em termos de sintaxe. Naquela época, não havia listas de construções sintáticas para nenhuma língua, as condições para sua compatibilidade e intercambialidade não foram estudadas, as regras para construir grandes unidades de estrutura sintática a partir de elementos constituintes menores não foram desenvolvidas.

A necessidade de criar os fundamentos teóricos da tradução automática levou à formação e desenvolvimento da linguística matemática. O papel principal neste assunto na URSS foi desempenhado pelos matemáticos A.A. Lyapunov, O. S. Kulagina, V. A. Uspensky, linguistas V.Yu. Rosenzweig, P. S. Kuznetsov, R. M. Frumkina, A. A. Reformatsky, I.A. Melchuk, V. V. Ivanov. A dissertação de Kulagina foi dedicada ao estudo da teoria formal das gramáticas (simultaneamente com N. Khomsky nos EUA), Kuznetsov propôs a tarefa de axiomatização da linguística, que remonta aos trabalhos de F.F. Fortunatov.

Em 6 de maio de 1960, foi adotado o Decreto do Presidium da Academia de Ciências da URSS "Sobre o desenvolvimento de métodos estruturais e matemáticos para o estudo da linguagem", e as divisões correspondentes foram criadas no Instituto de Linguística e no Instituto da Língua russa. Desde 1960, as principais universidades humanitárias do país - a Faculdade de Filologia da Universidade Estadual de Moscou, Leninrad, Universidades de Novosibirsk, Instituto Estadual de Línguas Estrangeiras de Moscou - começaram a treinar pessoal no campo do processamento automático de texto.

Ao mesmo tempo, os trabalhos de tradução automática desse período, chamados de "clássicos", são de interesse mais teórico do que prático. Os sistemas de tradução automática econômicos começaram a ser criados apenas nos anos oitenta do século passado. Falarei sobre isso mais tarde na Seção 2.1, Tradução automática.

As décadas de 1960 e 1970 incluem desenvolvimentos teóricos profundos usando os métodos da teoria dos conjuntos e da lógica matemática, como a teoria de campo e a teoria dos conjuntos difusos.

O autor da teoria de campo em linguística foi o poeta, tradutor e linguista soviético V.G. Admoni. Ele inicialmente desenvolveu sua teoria com base na língua alemã. Para Admoni, o conceito de "campo" denota um conjunto arbitrário não vazio de elementos linguísticos (por exemplo, "campo lexical", "campo semântico").

A estrutura do campo é heterogênea: consiste em um núcleo, cujos elementos possuem um conjunto completo de características que definem um conjunto, e uma periferia, cujos elementos podem ter tanto as características de um determinado conjunto (não todas). e vizinhos. Vou dar um exemplo que ilustra esta afirmação: por exemplo, em inglês, o campo de palavras compostas (“day-dream” - “dream” é difícil de separar do campo de frases (“tear gas” - “tear gas”) .

A teoria dos conjuntos fuzzy já mencionada acima está intimamente relacionada à teoria de campos. Na URSS, os linguistas V.G. Admoni, I. P. Ivanova, G. G. Pochentsov, no entanto, seu ancestral foi o matemático americano L. Zadeh, que em 1965 publicou o artigo “Fuzzy Logic”. Dando uma justificativa matemática para a teoria dos conjuntos fuzzy, Zade os considerou com base no material linguístico.

Nesta teoria, estamos falando não tanto da pertença dos elementos a um determinado conjunto (Aa), mas do grau dessa pertinência (Aa), uma vez que elementos periféricos podem pertencer a vários campos em um grau ou outro. Zade (Lofti-zade) era natural do Azerbaijão, até os 12 anos tinha a prática de se comunicar em quatro idiomas - azerbaijano, russo, inglês e persa - e usava três alfabetos diferentes: cirílico, latim, árabe. Quando se pergunta a um cientista o que há de comum entre a teoria dos conjuntos difusos e a linguística, ele não nega essa conexão, mas esclarece: “Não tenho certeza de que o estudo dessas linguagens tenha tido um grande impacto no meu pensamento. Se este fosse o caso, então apenas subconscientemente. Em sua juventude, Zadeh estudou em uma escola presbiteriana em Teerã e, após a Segunda Guerra Mundial, emigrou para os Estados Unidos. “A questão não é se sou americano, russo, azerbaijano ou qualquer outra pessoa”, disse ele em uma das conversas, “sou moldado por todas essas culturas e povos e me sinto bastante confortável entre cada um deles”. Nessas palavras há algo parecido com o que caracteriza a teoria dos conjuntos difusos - um afastamento de definições inequívocas e categorias nítidas.

Em nosso país, na década de 70, foram traduzidas e estudadas as obras de linguistas ocidentais do século XX. I A. Melchuk traduziu as obras de N. Chomsky para o russo. NO. Slyusareva em seu livro "A teoria de F. de Saussure à luz da linguística moderna" conecta os postulados do ensino de Saussure com os problemas reais da linguística dos anos 70. Há uma tendência para uma maior matematização da linguística. As principais universidades nacionais estão treinando pessoal na especialidade "Lingüística matemática (teórica, aplicada)". Ao mesmo tempo, no Ocidente, há um salto acentuado no desenvolvimento da tecnologia da computação, que exige cada vez mais novos fundamentos linguísticos.

Na década de 1980, o professor do Instituto de Estudos Orientais da Academia de Ciências Yu.K. Lekomtsev, ao analisar a linguagem da linguística através da análise de esquemas, tabelas e outros tipos de notação utilizados em descrições linguísticas, considera sistemas matemáticos adequados para esses fins (principalmente sistemas de álgebra matricial).

Assim, ao longo do século XX, houve uma convergência das exatas e das humanidades. A interação da matemática com a linguística encontrou cada vez mais aplicações práticas. Mais sobre isso no próximo capítulo.

Capítulo 2. Exemplos selecionados do uso da matemática na linguística

2.1 Tradução automática

A ideia de traduzir de uma língua para outra com a ajuda de um mecanismo universal surgiu vários séculos antes dos primeiros desenvolvimentos nesta área começarem - em 1649, René Descartes propôs a ideia de uma língua em que as ideias equivalentes de diferentes idiomas seriam expressos por um símbolo. As primeiras tentativas de implementar essa ideia nos anos 1930-40, o início dos desenvolvimentos teóricos em meados do século, a melhoria dos sistemas de tradução com a ajuda da tecnologia nos anos 1970-80, o rápido desenvolvimento da tecnologia de tradução nos últimos década - estas são as etapas do desenvolvimento da tradução automática como indústria. É a partir dos trabalhos sobre tradução automática que a linguística computacional como ciência cresceu.

Com o desenvolvimento da tecnologia da computação no final dos anos 70 e início dos anos 80, os pesquisadores estabeleceram metas mais realistas e econômicas - a máquina se tornou não uma concorrente (como se supunha anteriormente), mas uma assistente de um tradutor humano. A tradução automática deixa de servir exclusivamente a tarefas militares (todas as invenções e pesquisas soviéticas e americanas, focadas principalmente em russo e inglês, contribuíram para a Guerra Fria de uma forma ou de outra). Em 1978, palavras em linguagem natural foram transmitidas pela rede interconectada Arpa e, seis anos depois, os primeiros programas de tradução para microcomputadores surgiram nos Estados Unidos.

Nos anos 70, a Comissão das Comunidades Europeias compra a versão inglês-francês do tradutor informático Systran, encomendando também as versões francês-inglês e italiano-inglês, e o sistema de tradução russo-inglês utilizado pelas Forças Armadas dos EUA. Assim foram lançadas as bases do projeto EUROTRA.

Sobre o renascimento da tradução automática nos anos 70-80. Atestam os seguintes factos: a Comissão das Comunidades Europeias (CEC) adquire a versão inglês-francesa do Systran, bem como o sistema de tradução do russo para o inglês (este último desenvolvido após o relatório ALPAC e continuado a ser utilizado pela US Air Força e NASA); além disso, a CEC ordena o desenvolvimento das versões francês-inglês e italiano-inglês. Simultaneamente, há uma rápida expansão das atividades de tradução automática no Japão; nos EUA, a Organização Pan-Americana da Saúde (OPAS) ordena o desenvolvimento de uma direção espanhol-inglês (sistema SPANAM); A Força Aérea dos EUA está financiando o desenvolvimento de um sistema de tradução automática no Centro de Pesquisa Linguística da Universidade do Texas em Austin; O grupo TAUM no Canadá está fazendo progressos notáveis no desenvolvimento de seu sistema METEO (tradução meteorológica). Vários projetos começaram nos anos 70 e 80. posteriormente desenvolvido em sistemas comerciais completos.

Durante o período de 1978-93, foram gastos 20 milhões de dólares em pesquisas no campo da tradução automática nos EUA, 70 milhões na Europa e 200 milhões no Japão.

Uma das novidades é a tecnologia TM (translation memory), que funciona no princípio da acumulação: durante o processo de tradução, o segmento original (frase) e sua tradução são salvos, resultando na formação de um banco de dados linguístico; se um segmento idêntico ou semelhante for encontrado no texto recém-traduzido, ele será exibido junto com a tradução e uma indicação da porcentagem de correspondência. O tradutor toma então uma decisão (editar, rejeitar ou aceitar a tradução), cujo resultado é armazenado pelo sistema, de modo que não há necessidade de traduzir a mesma frase duas vezes. Atualmente, o desenvolvedor de um conhecido sistema comercial baseado na tecnologia TM é o sistema TRADOS (fundado em 1984).

Atualmente, várias dezenas de empresas estão desenvolvendo sistemas comerciais de tradução automática, incluindo: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. e outros.Agora você pode usar os serviços de tradutores automáticos diretamente na Web: alphaWorks; Tradutor Online da PROMT, LogoMedia.net, Serviço de Tradução Babel Fish da AltaVista; InfiniT. com; Traduzindo a Internet.

Sistemas de tradução comercialmente eficazes também surgiram na segunda metade dos anos 80 em nosso país. O próprio conceito de tradução automática se expandiu (começou a incluir “a criação de uma série de sistemas e dispositivos automáticos e automatizados que executam automática ou semiautomaticamente todo o ciclo de tradução ou tarefas individuais em diálogo com uma pessoa”) e as dotações governamentais para o desenvolvimento desta indústria aumentaram.

Russo, inglês, alemão, francês e japonês tornaram-se os principais idiomas dos sistemas de tradução nacionais. O All-Union Translation Center (VTsP) desenvolveu um sistema de tradução de inglês e alemão para russo usando o computador EC-1035-ANRAP. Consistia em três dicionários - entrada em inglês e alemão e saída em russo - sob um único software. Havia vários dicionários especializados substituíveis - em informática, programação, eletrônica de rádio, engenharia mecânica, agricultura, metalurgia. O sistema poderia funcionar em dois modos - automático e interativo, quando a tela exibia o texto-fonte e a tradução por frase, que uma pessoa podia editar. A velocidade de tradução do texto em ANRAP (do início da digitação até o final da impressão) foi de aproximadamente 100 páginas por hora.

Em 1989, foi criada uma família de tradutores comerciais do tipo SPRINT, trabalhando com russo, inglês, alemão e japonês. Sua principal vantagem era a compatibilidade com o IBM PC - assim, os sistemas nacionais de tradução automática atingiram o nível internacional de qualidade. Ao mesmo tempo, está sendo desenvolvido um sistema de tradução automática do francês para o russo FRAP, que inclui 4 etapas de análise de texto: grafemática, morfológica, sintática e semântica. Em LGPI eles. Herzen, o trabalho estava em andamento em um sistema SILOD-MP de quatro idiomas (inglês, francês, espanhol e russo) (os dicionários inglês-russo e franco-russo foram usados no modo industrial.

Para tradução especializada de textos de engenharia elétrica, existia o sistema ETAP-2. A análise do texto de entrada nele foi realizada em dois níveis - morfológico e sintático. O dicionário ETAP-2 continha cerca de 4 mil verbetes; a fase de transformação do texto - cerca de 1000 regras (96 gerais, 342 privadas, o resto são dicionário). Tudo isso garantiu uma qualidade de tradução satisfatória (digamos, o título da patente "Optical phase grid arranjo e dispositivo de acoplamento tendo tal arranjo" foi traduzido como "Um dispositivo de rede de fase óptica e um dispositivo de conexão com tal dispositivo" - apesar da tautologia, o significado é preservado).

No Instituto Pedagógico de Línguas Estrangeiras de Minsk, com base no dicionário inglês-russo de formas e frases de palavras, foi inventado um sistema de tradução automática de títulos, no Instituto de Estudos Orientais da Academia de Ciências - um sistema para traduzir do japonês para o russo. O primeiro serviço automático de vocabulário e terminologia (SLOTHERM) para computação e programação, criado no Instituto de Pesquisa de Sistemas de Automação de Moscou, continha aproximadamente 20.000 termos em um dicionário explicativo e dicionários especiais para pesquisa linguística.

Os sistemas de tradução automática começaram gradualmente a ser usados não apenas para o fim a que se destinavam, mas também como um componente importante dos sistemas de aprendizagem automática (para ensino de tradução, verificação de ortografia e conhecimento gramatical).

Os anos 90 trouxeram consigo o rápido desenvolvimento do mercado de PCs (do desktop ao bolso) e da tecnologia da informação, o uso generalizado da Internet (que está se tornando mais internacional e multilíngue). Tudo isso tornou o desenvolvimento de sistemas de tradução automática em demanda. Desde o início dos anos 1990 Desenvolvedores domésticos também estão entrando no mercado de sistemas para PC.

Em julho de 1990, o primeiro sistema comercial de tradução automática na Rússia chamado PROMT (PROgrammer's Machine Translation) foi apresentado no PC Forum em Moscou. Em 1991, ZAO [!!! foi substituída por uma sociedade anónima não pública] "Proekt MT", e já em 1992, a empresa PROMT venceu o concurso da NASA para o fornecimento de sistemas MP (a PROMT foi a única empresa não americana nesta competição). toda a família de sistemas sob o novo nome STYLUS para tradução de inglês, alemão, francês, italiano e espanhol para russo e de russo para inglês, e em 1993, com base no STYLUS, foi criado o primeiro sistema de tradução automática para Windows do mundo. STYLUS 2.0 para Windows 3.X/95/NT foi lançado, e em 1995-1996 a terceira geração de sistemas de tradução automática, totalmente STYLUS 3.0 de 32 bits para Windows 95/NT, foi introduzida, ao mesmo tempo, o desenvolvimento de um novo, os primeiros sistemas de tradução automática russo-alemão e russo-francês do mundo.

Em 1997, foi assinado um acordo com a empresa francesa Softissimo para a criação de sistemas de tradução de francês para alemão e inglês e vice-versa, e em dezembro deste ano foi lançado o primeiro sistema de tradução alemão-francês do mundo. No mesmo ano, a empresa PROMT lançou um sistema implementado usando a tecnologia Giant, que suporta várias direções de idioma em um shell, além de um tradutor especial para trabalhar no WebTranSite da Internet.

Em 1998, toda uma constelação de programas foi lançada sob o novo nome PROMT 98. Um ano depois, a PROMT lançou dois novos produtos: um pacote de software exclusivo para trabalhar na Internet - PROMT Internet e um tradutor para sistemas de correio corporativo - PROMT Mail Tradutor. Em novembro de 1999, o PROMT foi reconhecido como o melhor sistema de tradução automática testado pela revista francesa PC Expert, superando seus concorrentes em 30%. Soluções de servidor especiais também foram desenvolvidas para clientes corporativos - o servidor de tradução corporativa PROMT Translation Server (PTS) e a solução de Internet PROMT Internet Translation Server (PITS). Em 2000, a PROMT atualizou toda a sua linha de produtos de software lançando uma nova geração de sistemas MT: PROMT Translation Office 2000, PROMT Internet 2000 e Magic Gooddy 2000.

A tradução online com o suporte do sistema PROMT é utilizada em diversos sites nacionais e estrangeiros: Tradutor Online da PROMT, InfiniT.com, Translate.Ru, Lycos, etc., bem como em instituições de diversos perfis de tradução de documentos comerciais, artigos e cartas (há sistemas de tradução integrados diretamente no Outlook Express e em outros clientes de e-mail).

Atualmente, novas tecnologias de tradução automática estão surgindo com base no uso de sistemas de inteligência artificial e métodos estatísticos. Sobre este último - na próxima seção.

2.2 Extramtodos icos no aprendizado de lnguas

Considerável atenção na linguística moderna é dada ao estudo dos fenômenos linguísticos usando os métodos da matemática quantitativa. Os dados quantitativos muitas vezes ajudam a compreender mais profundamente os fenômenos em estudo, seu lugar e papel no sistema de fenômenos relacionados. A resposta à pergunta "quanto" ajuda a responder às perguntas "o quê", "como", "por que" - tal é o potencial heurístico de uma característica quantitativa.

Os métodos estatísticos desempenham um papel significativo no desenvolvimento de sistemas de tradução automática (ver Seção 2.1). Na abordagem estatística, o problema de tradução é considerado em termos de um canal ruidoso. Imagine que precisamos traduzir uma frase do inglês para o russo. O princípio do canal barulhento nos oferece a seguinte explicação da relação entre uma frase em inglês e uma frase em russo: uma frase em inglês nada mais é que uma frase em russo distorcida por algum tipo de ruído. Para recuperar a frase original em russo, precisamos saber o que as pessoas costumam dizer em russo e como as frases em russo são distorcidas em inglês. A tradução é realizada procurando uma frase em russo que maximize os produtos da probabilidade incondicional da frase em russo e a probabilidade da frase em inglês (original) dada a frase em russo fornecida. De acordo com o teorema de Bayes, esta frase em russo é a tradução mais provável do inglês:

onde e é a frase de tradução e f é a frase original

Portanto, precisamos de um modelo de origem e um modelo de canal, ou um modelo de linguagem e um modelo de tradução. O modelo de idioma deve atribuir uma pontuação de probabilidade a qualquer frase no idioma de destino (no nosso caso, russo) e o modelo de tradução à frase original. (ver tabela 1)

Em geral, um sistema de tradução automática opera em dois modos:

1. Treinamento do sistema: um corpus de treinamento de textos paralelos é obtido e, usando programação linear, são procurados tais valores de tabelas de correspondência de tradução que maximizam a probabilidade de (por exemplo) a parte russa do corpus com o inglês disponível de acordo ao modelo de tradução selecionado. Um modelo da língua russa é construído na parte russa do mesmo corpus.

2. Exploração: com base nos dados obtidos para uma frase em inglês desconhecido, busca-se um russo que maximize o produto das probabilidades atribuídas pelo modelo de linguagem e pelo modelo de tradução. O programa usado para essa pesquisa é chamado de decodificador.

O modelo de tradução estatística mais simples é o modelo de tradução literal. Este modelo assume que para traduzir uma frase de um idioma para outro, basta traduzir todas as palavras (criar um “saco de palavras”), e o modelo providenciará sua colocação na ordem correta. a, f | e) para P(a | e, f), ou seja probabilidades de um dado alinhamento dado um par de sentenças, cada probabilidade P(a, f | e) é normalizada pela soma das probabilidades de todos os alinhamentos de um dado par de sentenças:

A implementação do algoritmo de Viterbi usado para treinar o Modelo #1 é a seguinte:

1. Toda a tabela de probabilidades de correspondência de tradução é preenchida com os mesmos valores.

2. Para todas as variantes possíveis de conexões de palavras em pares, a probabilidade P(a, f | e) é calculada:

3. Os valores de P(a, f | e) são normalizados para obter os valores de P(a | e, f).

4. A frequência de cada par de tradução é calculada, ponderada pela probabilidade de cada opção de alinhamento.

5. As frequências ponderadas resultantes são normalizadas e formam uma nova tabela de probabilidades de correspondência de tradução

6. O algoritmo é repetido a partir da etapa 2.

Considere, como exemplo, o treinamento de um modelo semelhante em um corpus de dois pares de sentenças (Fig. 2):

Casa Branca

Após um grande número de iterações, obteremos uma tabela (Tabela 2), que mostra que a tradução é realizada com alta precisão.

Além disso, os métodos estatísticos são amplamente utilizados no estudo do vocabulário, morfologia, sintaxe e estilo. Cientistas da Universidade Estadual de Perm realizaram um estudo baseado na afirmação de que as frases estereotipadas são um importante "material de construção" do texto. Essas frases consistem em palavras repetidas "nucleares" e especificadores de palavras dependentes e têm uma coloração estilística pronunciada.

No estilo científico, as palavras "nucleares" podem ser chamadas: pesquisa, estudo, tarefa, problema, questão, fenômeno, fato, observação, análise etc. No jornalismo, outras palavras serão “nucleares”, que têm um valor acrescido especificamente para o texto do jornal: tempo, pessoa, poder, negócios, ação, lei, vida, história, lugar etc. (total 29)

De particular interesse para os linguistas é também a diferenciação profissional da língua nacional, a originalidade do uso do vocabulário e da gramática, dependendo do tipo de ocupação. Sabe-se que os motoristas na fala profissional utilizam a forma sh cerca de fer, os médicos dizem k cerca de clube em vez de coquetel Yu sh - tais exemplos podem ser dados. A tarefa da estatística é rastrear a variabilidade da pronúncia e a mudança na norma linguística.

As diferenças profissionais levam a diferenças não apenas gramaticais, mas também lexicais. Universidade Estadual de Yakut em homenagem M.K. Ammosov, foram analisados 50 questionários com as reações mais comuns a certas palavras entre médicos e construtores (Tabela 3).

		Construtores
Humano	paciente (10), personalidade (5)	homem (5)
Boa	ajuda (8), ajuda (7)	mal (16)
uma vida	morte (10)	adorável (5)
morte	cadáver (8)	vida (6)
o fogo	calor (8), queimar (6)	fogo (7)
dedo	mão (14), panarício (5)	grande (7), índice (6)
olhos	visão (6), aluno, oftalmologista (5 cada)	marrom (10), grande (6)
cabeça	mente (14), cérebro (5)	grande (9), inteligente (8), inteligente (6)
perder	consciência, vida (4 cada)	dinheiro (5), encontrar (4)

Nota-se que os médicos mais frequentemente do que os pedreiros fazem associações relacionadas à sua atividade profissional, uma vez que as palavras-estímulos dados no questionário têm mais a ver com sua profissão do que com a profissão de pedreiro.

Regularidades estatísticas em um idioma são usadas para criar dicionários de frequência - dicionários que fornecem características numéricas da frequência de palavras (formas de palavras, frases) de qualquer idioma - o idioma do escritor, qualquer trabalho, etc. uma palavra é usada como uma característica da frequência de ocorrência de uma palavra no texto de um determinado volume

O modelo de percepção da fala é impossível sem um dicionário como seu componente essencial. Na percepção da fala, a unidade operacional básica é a palavra. Disso se segue, em particular, que cada palavra do texto percebido deve ser identificada com a unidade correspondente do vocabulário interno do ouvinte (ou leitor). É natural supor que desde o início a busca está limitada a alguns subdomínios do dicionário. De acordo com a maioria das teorias modernas de percepção da fala, a análise fonética real da sonoridade do texto em um caso típico fornece apenas algumas informações parciais sobre a possível aparência fonológica da palavra, e esse tipo de informação corresponde não a uma, mas a algumas MUITAS palavras. do dicionário; Assim, surgem dois problemas:

(a) selecionar o conjunto apropriado de acordo com certos parâmetros;

(b) dentro dos limites do conjunto delineado (se alocado adequadamente) para "eliminar" todas as palavras, exceto a única que melhor corresponde à palavra dada do texto reconhecido. Uma das estratégias de "abandono" é excluir palavras de baixa frequência. Segue-se que o vocabulário para percepção da fala é um dicionário de frequência. É a criação de uma versão para computador do dicionário de frequências da língua russa que é a tarefa inicial do projeto apresentado.

Com base no material do idioma russo, existem 5 dicionários de frequência (sem contar os dicionários de filiais). Observemos apenas algumas deficiências gerais dos dicionários existentes.

Todos os dicionários de frequência conhecidos do idioma russo são baseados no processamento de matrizes de textos escritos (impressos). Em parte por esse motivo, quando a identidade de uma palavra é amplamente baseada em coincidências formais e gráficas, a semântica não é suficientemente levada em consideração. Como resultado, as características de frequência também são deslocadas, distorcidas; por exemplo, se o compilador do dicionário de frequência inclui palavras da combinação "um ao outro" nas estatísticas gerais do uso da palavra "amigo", isso dificilmente se justifica: dada a semântica, devemos admitir que já são palavras diferentes, ou melhor, que uma unidade de dicionário independente é apenas a combinação como um todo.

Além disso, em todos os dicionários existentes, as palavras são colocadas apenas em suas formas básicas: substantivos no singular, caso nominativo, verbos no infinitivo etc. Alguns dos dicionários fornecem informações sobre a frequência das formas das palavras, mas geralmente não o fazem de forma consistente o suficiente, não de forma exaustiva. As frequências de diferentes formas de palavras da mesma palavra obviamente não coincidem. O desenvolvedor de um modelo de percepção de fala deve levar em conta que em um processo perceptivo real, é precisamente uma forma de palavra específica que está “imersa” no texto que está sujeita a reconhecimento: com base na análise da seção inicial do expoente da forma da palavra, um conjunto de palavras com início idêntico é formado, e a seção inicial da forma da palavra não é necessariamente idêntica à seção inicial da forma do dicionário. É a forma da palavra que possui uma estrutura rítmica específica, que também é um parâmetro extremamente importante para a seleção perceptiva das palavras. Por fim, na representação final do enunciado reconhecido, novamente, as palavras são representadas pelas formas de palavras correspondentes.

Existem muitos trabalhos que demonstram a importância da frequência no processo de percepção da fala. Mas não temos conhecimento de trabalhos em que a frequência das formas das palavras seria usada - ao contrário, todos os autores praticamente ignoram a frequência das formas das palavras individuais, referindo-se exclusivamente aos lexemas. Se os resultados obtidos por eles não forem considerados artefatos, deve-se supor que o falante nativo de alguma forma tem acesso a informações sobre a razão das frequências das formas das palavras e das formas do dicionário, ou seja, de fato, lexemas. Além disso, tal transição de uma forma de palavra para um lexema, é claro, não pode ser explicada pelo conhecimento natural do paradigma correspondente, pois a informação de frequência deve ser usada antes da identificação final da palavra, caso contrário ela simplesmente perde seu significado.

De acordo com as características estatísticas primárias, é possível determinar com um dado erro relativo aquela parte do vocabulário, que inclui palavras com alta frequência de ocorrência, independentemente do tipo de texto. Também é possível, introduzindo ordenação gradual no dicionário, obter uma série de dicionários cobrindo as primeiras 100, 1000, 5000, etc. de palavras frequentes. As características estatísticas do dicionário são de interesse em relação à análise semântica do vocabulário. O estudo de grupos sujeito-ideológicos e campos semânticos mostra que as associações lexicais são sustentadas por ligações semânticas que se concentram em torno de lexemas de significado mais comum. A descrição de significados dentro do campo léxico-semântico pode ser realizada por meio da identificação de palavras com os lexemas mais abstratos em significado. Aparentemente, unidades de dicionário "vazias" (do ponto de vista das potências nominativas) constituem uma camada estatisticamente homogênea.

Vocabulários para gêneros individuais não são menos valiosos. Estudar a medida de sua similaridade e a natureza das distribuições estatísticas fornecerá informações interessantes sobre a estratificação qualitativa do vocabulário dependendo da esfera de uso da fala.

A compilação de dicionários de grande frequência requer o uso de tecnologia de computador. A introdução de mecanização parcial e automação no processo de trabalho em um dicionário é de interesse como um experimento no processamento de máquina de dicionários para diferentes textos. Tal dicionário requer um sistema mais rigoroso para processar e acumular material de vocabulário. Em miniatura, trata-se de um sistema de recuperação de informações capaz de fornecer informações sobre vários aspectos do texto e do vocabulário. Alguns pedidos básicos a este sistema são planejados desde o início: o número total de palavras do inventário, as características estatísticas de uma única palavra e dicionários inteiros, a ordenação de zonas freqüentes e raras do dicionário, etc. para construir automaticamente dicionários reversos para gêneros e fontes individuais. Muitas outras informações estatísticas úteis sobre o idioma serão extraídas do conjunto acumulado de informações. O dicionário de frequência do computador cria uma base experimental para a transição para uma automação mais ampla do trabalho de vocabulário.

Os dados estatísticos dos dicionários de frequência também podem ser amplamente utilizados na resolução de outros problemas linguísticos - por exemplo, na análise e determinação dos meios ativos de formação de palavras do idioma russo moderno, resolvendo problemas de melhoria de gráficos e ortografia, relacionados a levar em consideração conta informações estatísticas sobre o vocabulário (com tudo isso, é importante levar em conta características probabilísticas de combinações de grafemas, tipos de combinações de letras realizadas em palavras), transcrição prática e transliteração. Os parâmetros estatísticos do dicionário também serão úteis na resolução de problemas de automatização de digitação, reconhecimento e leitura automática de texto literal.

Dicionários explicativos modernos e gramáticas da língua russa são construídos principalmente com base em textos literários e artísticos. Existem dicionários de frequência da língua de A.S. Pushkin, A. S. Griboedova, F. M. Dostoiévski, V. V. Vysotsky e muitos outros autores. No Departamento de História e Teoria da Literatura do Estado de Smolensk. A Universidade Pedagógica trabalha há vários anos para compilar dicionários de frequência de textos poéticos e em prosa. Para este estudo, foram selecionados dicionários de frequência de todas as letras de Pushkin e mais dois poetas da idade de ouro - "Ai da sagacidade" de Griboyedov e toda a poesia de Lermontov; Pasternak e outros cinco poetas da Idade de Prata - Balmont 1894-1903, "Poems about the Beautiful Lady" de Blok, "Stone" de Mandelstam, "Pillar of Fire" de Gumilyov, "Anno Domini MCMXXI" de Akhmatova e "Sisters of My Life" de Pasternak e mais quatro poetas da Idade do Ferro - "Poems by Yuri Jivago", "When it clears up", todo o corpus de letras de M. Petrovs, "The road is far away", "Windshield", "Adeus à neve" e "Ferraduras" de Mezhirov, "Antimirov" de Voznesensky e "Snezhnitsa » Rylenkova.

Deve-se notar que esses dicionários são de natureza diferente: alguns representam o vocabulário de uma obra dramática, outros - livros de letras, ou vários livros, ou todo o corpus de poemas do poeta. Os resultados da análise apresentada neste artigo devem ser tomados com cautela, não podem ser tomados como absolutos. Ao mesmo tempo, com a ajuda de medidas especiais, a diferença na natureza ontológica dos textos pode ser reduzida até certo ponto.

Nos últimos anos, a oposição entre o discurso coloquial e o livro tornou-se cada vez mais clara. Essa questão é especialmente discutida entre os metodólogos que exigem uma guinada no ensino para a língua falada. Ao mesmo tempo, a especificidade do discurso coloquial ainda permanece inexplicada.

Os dicionários foram processados através da criação de um aplicativo de usuário no ambiente do programa EXCEL97 office. O aplicativo inclui quatro planilhas do livro EXCEL - "Folha de Título", "Dicionários" com dados iniciais, "Proximidades" e "Distâncias" com resultados, além de um conjunto de macros.

As informações iniciais são inseridas na folha "Dicionários". Os dicionários dos textos estudados são escritos em células do EXCEL, a última coluna S é formada a partir dos resultados obtidos e é igual ao número de palavras encontradas em outros dicionários. As tabelas "Proximidade" e "Distâncias" contêm medidas calculadas de proximidade M, correlação R e distância D.

Macros de aplicativo são procedimentos de programação baseados em eventos escritos em Visual Basic for Application (VBA). Os procedimentos são baseados em objetos de biblioteca VBA e seus métodos de processamento. Assim, para operações com planilhas do aplicativo, são utilizados o objeto-chave Planilha (planilha) e o método correspondente de ativação da planilha Ativar (ativar). A configuração do intervalo dos dados de origem analisados na planilha Dicionário é realizada pelo método Select do objeto Range (range), e a transferência de palavras como valores para variáveis é realizada conforme a propriedade Value (valor) do mesmo Range objeto.

Apesar do fato de que a análise de correlação de posto nos torna cautelosos sobre a dependência de tópicos entre diferentes textos, a maioria das palavras mais frequentes em cada texto tem correspondências em um ou mais outros textos. A coluna S mostra o número de tais palavras entre as 15 palavras mais frequentes para cada autor. Palavras em negrito aparecem apenas nas palavras de um poeta em nossa tabela. Blok, Akhmatova e Petrovs não têm nenhuma palavra destacada, eles têm S = 15. Esses três poetas têm as mesmas 15 palavras mais frequentes, diferem apenas no local da lista. Mas mesmo Pushkin, cujo vocabulário é o mais original, tem S = 8, e há 7 palavras destacadas.

Os resultados mostram que existe uma certa camada de vocabulário que concentra os principais temas da poesia. Como regra, essas palavras são curtas: do número total (225) de usos de palavras de uma sílaba 88, duas sílabas 127, três sílabas 10. Muitas vezes, essas palavras representam os principais mitologemas e podem se formar em pares: noite - dia, terra - céu (sol), Deus - homem (pessoas), vida - morte, corpo - alma, Roma - mundo(em Mandelstam); podem ser combinados em mitologemas de nível superior: céu, estrela, sol, terra; em uma pessoa, como regra, o corpo, coração, sangue, braço, perna, bochecha, olhos se destacam. Dos estados humanos, a preferência é dada ao sono e ao amor. A casa e as cidades pertencem ao mundo humano - Moscou, Roma, Paris. A criatividade é representada por lexemas palavra e música.

Griboedov e Lermontov quase não têm palavras que denotam natureza entre as palavras mais frequentes. Eles têm três vezes mais palavras que denotam uma pessoa, partes de seu corpo, elementos de seu mundo espiritual. Pushkin e poetas do século XX. designações de homem e natureza são aproximadamente iguais. Neste aspecto importante do assunto, podemos dizer que o século XX. seguiu Pushkin.

Tema mínimo caso entre as palavras mais frequentes, encontra-se apenas em Griboyedov e Pushkin. Lermontov e poetas do século XX. dá lugar a um tema mínimo palavra. A palavra não exclui os atos (interpretação bíblica do tema: no Novo Testamento, todos os ensinamentos de Jesus Cristo são considerados como a palavra de Deus ou a palavra de Jesus, e os apóstolos às vezes se autodenominam ministros da Palavra). O significado sagrado da palavra lexema é manifestado de forma convincente, por exemplo, no verso de Pasternak "E a imagem do mundo, revelada na Palavra". O significado sagrado do lexema palavra em conjunto e em contraste com os assuntos humanos, é convincentemente manifestado no poema de mesmo nome de Gumilyov.

Tokens encontrados em apenas um texto caracterizam a originalidade de um determinado livro ou de uma coleção de livros. Por exemplo, a palavra "mente" é a mais frequente na comédia de Griboedov "Ai do Wit" - mas não ocorre entre as palavras de frequência de outros textos. O tema da mente é de longe o mais significativo na comédia. Este lexema acompanha a imagem de Chatsky, sendo o nome de Chatsky o mais frequente na comédia. Assim, a obra combina organicamente o nome comum mais frequente com o nome próprio mais frequente.

O coeficiente de correlação mais alto conecta os temas dos livros trágicos "A Coluna de Fogo" de Gumilyov e "Anno Domini MCMXXI" de Akhmatova. Entre os 15 substantivos mais frequentes, há 10 comuns, incluindo sangue, coração, alma, amor, palavra, céu. Lembre-se de que o livro de Akhmatova incluía uma miniatura "Você não estará vivo ...", escrito entre a prisão de Gumilyov e sua execução.

Os temas da vela e da multidão no material estudado são encontrados apenas nos "Poemas de Yuri Zhivago". O tema da vela nos versos do romance tem muitos significados contextuais: está associado à imagem de Jesus Cristo, aos temas da fé, imortalidade, criatividade, namoro. A vela é a fonte de luz mais importante nas cenas centrais do romance. O tema da multidão se desenvolve em conexão com a ideia principal do romance, na qual a vida privada de uma pessoa com seus valores inabaláveis se opõe à imoralidade do novo estado, construído sobre os princípios de agradar a multidão .

O trabalho também envolve a terceira etapa, também refletida no programa, - este é o cálculo da diferença entre os números ordinais de palavras comuns a dois dicionários e a distância média entre as mesmas palavras de dois dicionários. Esta etapa permite passar das tendências gerais na interação dos dicionários identificadas com a ajuda da estatística para um nível que se aproxima do texto. Por exemplo, os livros de Gumilyov e Akhmatova se correlacionam estatisticamente significativamente. Observamos quais palavras se tornaram comuns em seus dicionários e, em primeiro lugar, escolhemos aquelas cujos números de série diferem minimamente ou iguais a zero. São essas palavras que têm o mesmo número de classificação e, consequentemente, são esses temas mínimos nas mentes dos dois poetas que são igualmente importantes. Em seguida, você deve passar para o nível de textos e contextos.

Os métodos quantitativos também ajudam a estudar as características dos povos - falantes nativos. Digamos, existem 6 casos em russo, não há casos em inglês e, em alguns idiomas dos povos do Daguestão, o número de casos chega a 40. L. Perlovsky em seu artigo “Consciousness, Language and Culture” correlaciona esses características com a tendência dos povos ao individualismo ou coletivismo, com percepção das coisas e fenômenos separadamente ou em conexão com outros. Afinal, foi no mundo de língua inglesa (não há casos - a coisa é percebida “por si mesma”) que surgiram conceitos como liberdade individual, liberalismo e democracia (observo que uso esses conceitos apenas em conexão com o linguagem, sem quaisquer características avaliativas). Apesar do fato de que tais suposições ainda permanecem apenas no nível de hipóteses científicas ousadas, elas ajudam a olhar para fenômenos já familiares de uma nova maneira.

Como podemos ver, as características quantitativas podem ser aplicadas em áreas completamente diferentes da linguística, o que cada vez mais borra as fronteiras entre métodos "exatos" e "humanitários". A linguística está recorrendo cada vez mais à ajuda não apenas da matemática, mas também da tecnologia computacional para resolver seus problemas.

2.3 Aprendizagem Ilinguagem por métodos de lógica formal

Com os métodos não quantitativos da matemática, em particular com a lógica, a linguística teórica moderna interage não menos frutífera do que com os quantitativos. O rápido desenvolvimento das tecnologias computacionais e o crescimento de seu papel no mundo moderno exigiram uma revisão da abordagem da interação da linguagem e da lógica em geral.

Os métodos da lógica são amplamente utilizados no desenvolvimento de linguagens formalizadas, em particular, linguagens de programação, cujos elementos são alguns símbolos (semelhantes à matemática), escolhidos (ou construídos a partir de símbolos previamente selecionados) e interpretados de uma certa maneira, relacionados a qualquer uso, compreensão e compreensão "tradicionais" dos mesmos símbolos em outros contextos. Um programador lida constantemente com a lógica em seu trabalho. O significado de programação é apenas ensinar o computador a raciocinar (no sentido mais amplo da palavra). Ao mesmo tempo, os métodos de "raciocínio" são muito diferentes. Todo programador gasta uma certa quantidade de tempo procurando bugs em seus próprios programas e nos programas de outras pessoas. Ou seja, procurar erros no raciocínio, na lógica. E isso também deixa sua marca. É muito mais fácil detectar erros lógicos na fala comum. A relativa simplicidade das línguas estudadas pelos lógicos permite que eles elucidem as estruturas dessas línguas com mais clareza do que é alcançável por linguistas que analisam exclusivamente línguas naturais complexas. Tendo em vista que as línguas estudadas pelos lógicos usam relações copiadas das línguas naturais, os lógicos são capazes de fazer contribuições significativas para a teoria geral da linguagem. A situação aqui é semelhante à que ocorre na física: o físico também formula teoremas para casos idealmente simplificados que não ocorrem na natureza - ele formula leis para gases ideais, líquidos ideais, fala sobre movimento na ausência de atrito, etc. Para esses casos idealizados, podem ser estabelecidas leis simples que muito contribuiriam para a compreensão do que realmente acontece e do que provavelmente permaneceria desconhecido para a física se tentasse considerar a realidade diretamente, em toda a sua complexidade.

No estudo das línguas naturais, os métodos lógicos são usados para que os aprendizes da língua não possam “memorizar” estupidamente o maior número possível de palavras, mas compreendam melhor sua estrutura. L. Shcherba também usou em suas palestras um exemplo de uma frase construída de acordo com as leis da língua russa: “O brilhante kuzdra shteko boked o bokra e enrola o bokra”, e então perguntou aos alunos o que isso significava. Apesar de o significado das palavras na frase permanecer obscuro (elas simplesmente não existem em russo), foi possível responder claramente: “kuzdra” é o sujeito, um substantivo feminino, no caso nominativo singular, “ bokr” é animado, e etc. A tradução da frase acaba por ser algo assim: “Algo feminino de uma só vez fez algo sobre algum tipo de criatura masculina e depois começou a fazer algo assim por um longo e gradual com seu filhote”. Um exemplo semelhante de um texto (artístico) a partir de palavras inexistentes, construído inteiramente de acordo com as leis da linguagem, é o Jabberwock de Lewis Carroll (em Alice no País das Maravilhas, Carroll, pela boca de seu personagem Humpty Dumpty, explica o significado de as palavras que ele inventou: "cozido" - oito horas da noite, quando é hora de preparar o jantar, "chlivky" - frágil e hábil, "shorek" - um cruzamento entre um furão, um texugo e um saca-rolhas, "mergulho " - saltar, mergulhar, girar, "nava" - grama sob o relógio de sol (se estende um pouco para a direita, um pouco para a esquerda e um pouco para trás), "grunhir" - grunhir e rir, "zelyuk" - um peru verde, "myumzik" - um pássaro; suas penas estão desgrenhadas e se projetam em todas as direções, como uma vassoura, "mova" - longe de casa).

Um dos principais conceitos da lógica moderna e da linguística teórica, usado no estudo de línguas de vários cálculos lógico-matemáticos, línguas naturais, para descrever a relação entre línguas de diferentes "níveis" e caracterizar a relação entre os línguas em consideração e as áreas temáticas descritas com sua ajuda, é o conceito de metalinguagem. Uma metalinguagem é uma linguagem usada para expressar julgamentos sobre outra linguagem, a linguagem-objeto. Com a ajuda de uma metalinguagem, eles estudam a estrutura das combinações de caracteres (expressões) da linguagem-objeto, provam teoremas sobre suas propriedades expressivas, sobre sua relação com outras linguagens etc. relação a essa metalinguagem. Tanto a linguagem de assunto quanto a metalinguagem podem ser linguagens comuns (naturais). A metalinguagem pode diferir da linguagem objeto (por exemplo, em um livro didático de inglês para russos, russo é a metalinguagem e inglês é a linguagem objeto), mas também pode coincidir com ela ou diferir apenas parcialmente, por exemplo, em terminologia especial (A terminologia linguística russa é um elemento da metalinguagem para descrever a língua russa, os chamados fatores semânticos fazem parte da metalinguagem para descrever a semântica das línguas naturais).

O conceito de "metalinguagem" tornou-se muito frutífero em conexão com o estudo de linguagens formalizadas que são construídas no âmbito da lógica matemática. Ao contrário das linguagens de assunto formalizadas, neste caso a metalinguagem, por meio da qual a metateoria é formulada (estudando as propriedades da teoria do sujeito formulada na linguagem de assunto), é, via de regra, uma linguagem natural ordinária, de alguma forma especial um fragmento limitado de uma linguagem natural que não contém nenhum tipo de ambiguidade, metáforas, conceitos "metafísicos", etc. elementos da linguagem comum que impedem seu uso como ferramenta para pesquisas científicas precisas. Ao mesmo tempo, a própria metalinguagem pode ser formalizada e (independentemente disso) tornar-se objeto de pesquisas realizadas por meio da metametalinguagem, e tal série pode ser “pensada” como crescendo indefinidamente.

A lógica nos ensina uma distinção frutífera entre a linguagem-objeto e a metalinguagem. A linguagem-objeto é o próprio objeto da pesquisa lógica, e a metalinguagem é aquela linguagem inevitavelmente artificial na qual tal pesquisa é conduzida. O pensamento lógico consiste apenas em formular as relações e a estrutura de uma linguagem real (linguagem objeto) na linguagem dos símbolos (metalinguagem).

A metalinguagem deve, em todo caso, ser “não mais pobre” do que sua linguagem objetiva (ou seja, para cada expressão desta última na metalinguagem deve haver seu nome, “tradução”) - caso contrário, se esses requisitos não forem atendidos (o que certamente ocorre em línguas naturais, se acordos especiais não estabelecem o contrário) surgem paradoxos semânticos (antinomias).

À medida que mais e mais novas linguagens de programação foram criadas, em conexão com o problema dos tradutores de programação, havia uma necessidade urgente de criar metalinguagens. Atualmente, a metalinguagem da forma Backus-Naur (abreviada como BNF) é a mais comumente usada para descrever a sintaxe das linguagens de programação. É uma forma compacta na forma de algumas fórmulas semelhantes às matemáticas. Para cada conceito da linguagem existe uma metafórmula única (fórmula normal). Consiste em partes esquerda e direita. O lado esquerdo especifica o conceito que está sendo definido e o lado direito especifica o conjunto de construções de linguagem admissíveis que são combinadas nesse conceito. A fórmula usa metacaracteres especiais na forma de colchetes angulares, que contêm o conceito definido (no lado esquerdo da fórmula) ou um conceito previamente definido (no lado direito), e a separação das partes esquerda e direita é indicada por o metacaractere "::=", cujo significado é equivalente às palavras "por definição existe". As fórmulas metalinguísticas são incorporadas aos tradutores de alguma forma; com a ajuda deles, as construções usadas pelo programador são verificadas quanto à conformidade formal com qualquer uma das construções que são sintaticamente válidas nessa linguagem. Existem também metalinguagens separadas de várias ciências - assim, o conhecimento existe na forma de várias metalinguagens.

Os métodos lógicos também serviram de base para a criação de sistemas de inteligência artificial baseados no conceito de conexionismo. O conexionismo é uma tendência especial na ciência filosófica, cujo assunto são questões de conhecimento. Dentro da estrutura dessa tendência, estão sendo feitas tentativas para explicar as habilidades intelectuais de uma pessoa usando redes neurais artificiais. Compostas por um grande número de unidades estruturais semelhantes aos neurônios, com um peso atribuído a cada elemento que determina a força da conexão com outros elementos, as redes neurais são modelos simplificados do cérebro humano. Experimentos com redes neurais desse tipo demonstraram sua capacidade de aprender a realizar tarefas como reconhecimento de padrões, leitura e identificação de estruturas gramaticais simples.

Os filósofos começaram a se interessar pelo conexionismo, pois a abordagem conexionista prometia fornecer uma alternativa à teoria clássica da mente e à ideia amplamente difundida dentro dessa teoria de que o funcionamento da mente é semelhante ao processamento da linguagem simbólica por um sistema digital. computador. Este conceito é muito controverso, mas nos últimos anos tem encontrado cada vez mais adeptos.

O estudo lógico da linguagem continua o conceito de linguagem como sistema de Saussure. O fato de que ela continua constantemente confirma mais uma vez a ousadia das conjecturas científicas do início do século passado. Dedicarei a última seção do meu trabalho às perspectivas para o desenvolvimento de métodos matemáticos na linguística hoje.

2.4 Perspectivas para a aplicação de métodos matemáticos em linguística

Na era da informática, os métodos da linguística matemática receberam uma nova perspectiva de desenvolvimento. A procura de soluções para os problemas da análise linguística está agora a ser cada vez mais implementada ao nível dos sistemas de informação. Ao mesmo tempo, a automatização do processo de tratamento do material linguístico, proporcionando ao investigador oportunidades e vantagens significativas, impõe-lhe inevitavelmente novas exigências e tarefas.

A combinação de conhecimento "exato" e "humanitário" tornou-se terreno fértil para novas descobertas no campo da linguística, informática e filosofia.

A tradução automática de um idioma para outro continua sendo um ramo da tecnologia da informação em rápido crescimento. Apesar do fato de que a tradução assistida por computador nunca pode ser comparada em qualidade à tradução humana (especialmente para textos literários), a máquina tornou-se um assistente indispensável para uma pessoa na tradução de grandes volumes de texto. Acredita-se que em um futuro próximo serão criados sistemas de tradução mais avançados, baseados principalmente na análise semântica do texto.

Uma área igualmente promissora é a interação da linguística e da lógica, que serve como base filosófica para a compreensão da tecnologia da informação e da chamada "realidade virtual". Em um futuro próximo, o trabalho continuará na criação de sistemas de inteligência artificial - embora, novamente, nunca seja igual ao humano em suas capacidades. Tal competição não tem sentido: em nosso tempo, a máquina deveria se tornar (e se torna) não uma rival, mas uma assistente do homem, não algo do reino da fantasia, mas parte do mundo real.

O estudo da língua por métodos estatísticos continua, o que permite determinar com mais precisão suas propriedades qualitativas. É importante que as hipóteses mais ousadas sobre a linguagem encontrem sua prova matemática e, portanto, lógica.

O mais significativo é que vários ramos da aplicação da matemática na linguística, antes bastante isolados, nos últimos anos foram correlacionados entre si, conectando-se em um sistema coerente, por analogia com o sistema linguístico descoberto há um século por Ferdinand de Saussure e Yvan Baudouin de Courtenay. Esta é a continuidade do conhecimento científico.

A linguística no mundo moderno tornou-se a base para o desenvolvimento da tecnologia da informação. Enquanto a ciência da computação continuar sendo um ramo da atividade humana em rápido desenvolvimento, a união da matemática e da linguística continuará a desempenhar seu papel no desenvolvimento da ciência.

Conclusão

Ao longo do século 20, as tecnologias de computador percorreram um longo caminho - do uso militar ao uso pacífico, de uma faixa estreita de objetivos à penetração em todos os ramos da vida humana. A matemática como ciência encontrou um significado prático sempre novo com o desenvolvimento da tecnologia da computação. Este processo continua até hoje.

O anteriormente impensável "tandem" de "físicos" e "letristas" tornou-se uma realidade. Para a plena interação da matemática e da informática com as humanidades, eram necessários especialistas qualificados de ambos os lados. Enquanto os cientistas da computação precisam cada vez mais de conhecimentos humanitários sistemáticos (linguísticos, culturais, filosóficos) para compreender as mudanças na realidade ao seu redor, na interação do homem e da tecnologia, desenvolver cada vez mais novos conceitos linguísticos e mentais, escrever programas, então qualquer "Humanidades" em nosso tempo para seu crescimento profissional deve dominar pelo menos o básico de trabalhar com um computador.

A matemática, estando intimamente interligada com a informática, continua a desenvolver-se e a interagir com as ciências naturais e as humanidades. No novo século, a tendência para a matematização da ciência não está enfraquecendo, mas, ao contrário, está aumentando. Com base em dados quantitativos, são compreendidas as leis do desenvolvimento da língua, suas características históricas e filosóficas.

O formalismo matemático é mais adequado para descrever padrões em linguística (como, de fato, em outras ciências - tanto as humanas quanto as naturais). A situação às vezes se desenvolve na ciência de tal maneira que, sem o uso de uma linguagem matemática apropriada, é impossível entender a natureza física, química etc. processo não é possível. Criando um modelo planetário do átomo, o famoso físico inglês do século XX. E. Rutherford experimentou dificuldades matemáticas. A princípio, sua teoria não foi aceita: não parecia convincente, e a razão para isso foi o desconhecimento de Rutherford da teoria da probabilidade, com base no mecanismo do qual só foi possível entender a representação modelo das interações atômicas. Percebendo isso, já naquela época um destacado cientista, dono do Prêmio Nobel, matriculou-se no seminário do matemático Professor Lamb e durante dois anos, junto com os alunos, participou de um curso e realizou um workshop sobre a teoria das probabilidades . Com base nele, Rutherford foi capaz de descrever o comportamento do elétron, dando ao seu modelo estrutural uma precisão convincente e ganhando reconhecimento. O mesmo acontece com a linguística.

Isso levanta a questão: o que há de tão matemático nos fenômenos objetivos, graças aos quais eles podem ser descritos na linguagem da matemática, na linguagem das características quantitativas? São unidades homogêneas de matéria distribuídas no espaço e no tempo. Aquelas ciências que foram mais longe do que outras no isolamento da homogeneidade e se revelam mais adequadas para o uso da matemática nelas.

A Internet, que se desenvolveu rapidamente na década de 1990, reuniu representantes de vários países, povos e culturas. Apesar de o inglês continuar sendo a principal língua de comunicação internacional, a Internet tornou-se multilíngue em nosso tempo. Isso levou ao desenvolvimento de sistemas de tradução automática comercialmente bem-sucedidos que são amplamente utilizados em vários campos da atividade humana.

As redes de computadores tornaram-se objeto de reflexão filosófica - cada vez mais novos conceitos linguísticos, lógicos, de visão de mundo têm sido criados que ajudam a entender a "realidade virtual". Em muitas obras de arte, criaram-se cenários - mais frequentemente pessimistas - sobre o domínio das máquinas sobre os humanos e da realidade virtual - sobre o mundo exterior. Longe de sempre, tais previsões acabaram sendo sem sentido. A tecnologia da informação não é apenas uma indústria promissora para investir o conhecimento humano, é também uma forma de controlar a informação e, consequentemente, sobre o pensamento humano.

Este fenômeno tem um lado negativo e um lado positivo. Negativo - porque o controle sobre a informação é contrário ao direito humano inalienável de livre acesso a ela. Positivo - porque a falta desse controle pode levar a consequências catastróficas para a humanidade. Basta lembrar um dos filmes mais sábios da última década - "Quando o mundo acabar", de Wim Wenders, cujos personagens estão completamente imersos na "realidade virtual" de seus próprios sonhos gravados em um computador. Ao mesmo tempo, nem um único cientista e nem um único artista pode dar uma resposta inequívoca à pergunta: o que espera a ciência e a tecnologia no futuro.

Focar no "futuro", às vezes parecendo fantástico, era uma característica distintiva da ciência em meados do século XX, quando os inventores procuravam criar modelos perfeitos de tecnologia que pudessem funcionar sem intervenção humana. O tempo mostrou a natureza utópica de tal pesquisa. Ao mesmo tempo, seria supérfluo condenar os cientistas por isso - sem seu entusiasmo nos anos 1950-60, a tecnologia da informação não teria dado um salto tão poderoso nos anos 90, e não teríamos o que temos agora.

As últimas décadas do século XX mudaram as prioridades da ciência - a pesquisa, o pathos inventivo deu lugar ao interesse comercial. Novamente, isso não é bom nem ruim. Esta é uma realidade em que a ciência está cada vez mais integrada na vida quotidiana.

O século 21 deu continuidade a essa tendência e, em nosso tempo, as invenções não são apenas fama e reconhecimento, mas, antes de tudo, dinheiro. É também por isso que é importante garantir que as últimas conquistas da ciência e da tecnologia não caiam nas mãos de grupos terroristas ou regimes ditatoriais. A tarefa é difícil ao ponto da impossibilidade; realizá-lo tanto quanto possível é tarefa de toda a comunidade mundial.

A informação é uma arma, e as armas não são menos perigosas do que as armas nucleares ou químicas - só que não agem fisicamente, mas psicologicamente. A humanidade precisa pensar no que é mais importante para ela neste caso - liberdade ou controle.

Os mais recentes conceitos filosóficos relacionados ao desenvolvimento das tecnologias da informação e a tentativa de compreendê-los mostraram as limitações tanto do materialismo das ciências naturais, que dominou durante o século XIX e início do século XX, quanto do idealismo extremo, que nega o significado do mundo material . É importante para o pensamento moderno, especialmente o pensamento ocidental, superar esse dualismo de pensamento, quando o mundo circundante é claramente dividido em material e ideal. O caminho para isso é um diálogo de culturas, uma comparação de diferentes pontos de vista sobre os fenômenos circundantes.

Paradoxalmente, a tecnologia da informação pode desempenhar um papel importante nesse processo. As redes de computadores, e especialmente a Internet, não são apenas um recurso de entretenimento e atividade comercial vigorosa, mas também um meio de comunicação significativo e controverso entre representantes de várias civilizações do mundo moderno, bem como de diálogo entre o passado e o o presente. Podemos dizer que a Internet ultrapassa as fronteiras espaciais e temporais.

E no diálogo das culturas por meio da tecnologia da informação, o papel da linguagem como o mais antigo meio de comunicação universal ainda é importante. É por isso que a linguística, em interação com a matemática, filosofia e ciência da computação, experimentou seu segundo nascimento e continua a se desenvolver hoje. A tendência do presente continuará no futuro - "até o fim do mundo", como há 15 anos, o mesmo V. Wenders previu. É verdade que não se sabe quando esse fim ocorrerá - mas é importante agora, porque o futuro mais cedo ou mais tarde se tornará o presente de qualquer maneira.

Apêndice 1

Fernando de Saussure

O linguista suíço Ferdinand de Saussure (1857-1913) é amplamente considerado o fundador da linguística moderna em suas tentativas de descrever a estrutura da linguagem em vez da história de línguas e formas de linguagem particulares. De fato, o método do Estruturalismo nos estudos linguísticos e literários e um ramo significativo da Semiótica encontram seu principal ponto de partida em sua obra na virada do século XX. Argumentou-se mesmo que o complexo de estratégias e concepções que veio a ser chamado de "pós-estruturalismo" - o trabalho de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros - é sugerido pela obra de Saussure na linguística e nas leituras anagramáticas da poesia latina tardia, do modernismo literário à psicanálise e à filosofia no início do século XX. Como argumentam Algirdas Julien Greimas e Joseph Courtes em Semiotics and Language: An Analytic Dictionary, sob o título "Interpretação", surgiu no início do século XX um novo modo de interpretação que eles identificam com a linguística saussureana, a fenomenologia husserliana e a psicanálise freudiana. Nesse modo, "a interpretação não é mais uma questão de atribuir um conteúdo dado a uma forma que de outra forma não teria, mas uma paráfrase que formula de outra maneira o conteúdo equivalente de um elemento significante dentro de um sistema semiótico dado" (p. 159). nesta compreensão de "interpretação", forma e conteúdo não são distintos; ao contrário, toda "forma" é, alternativamente, também um "conteúdo" semântico, uma "forma significante", de modo que a interpretação oferece uma paráfrase analógica de algo que já significa dentro de algum outro sistema de significação.

Tal reinterpretação da forma e da compreensão - que Claude Lévi-Strauss descreve em uma de suas articulações mais programáticas do conceito de estruturalismo, em "Estrutura e forma: reflexões sobre uma obra de Vladimir Propp" - está implícita no Curso póstumo de Saussure em General Linguistics (1916, trad., 1959, 1983). Em sua vida, Saussure publicou relativamente pouco, e sua principal obra, o Curso, foi a transcrição por seus alunos de vários cursos de linguística geral que ele ofereceu em 1907-11. No Curso, Saussure pediu o estudo "científico" da linguagem em oposição ao trabalho em linguística histórica que havia sido feito no século XIX. Esse trabalho é uma das grandes conquistas do intelecto ocidental: tomar palavras particulares como os blocos de construção de linguagem, a linguística histórica (ou "diacrônica") traçou a origem e o desenvolvimento das línguas ocidentais a partir de uma fonte de linguagem comum putativa, primeiro uma língua "indo-europeia" e depois uma "p" anterior língua roto-indo-europeia".

É precisamente este estudo das ocorrências únicas de palavras, com a suposição concomitante de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos-palavra", que Saussure questionou. Seu trabalho foi uma tentativa de reduzir a massa de fatos sobre a linguagem, estudados tão minuciosamente pela linguística histórica, a um número gerenciável de proposições. A "escola comparada" da Filologia do século XIX, diz Saussure no Curso, "não conseguiu estabelecer a verdadeira ciência da linguística" porque "não conseguiu descobrir a natureza de seu objeto de estudo" (3). Essa "natureza", argumenta ele, deve ser encontrada não apenas nas palavras "elementares" que uma linguagem compreende - os aparentes fatos "positivos" (ou "substâncias") da linguagem - mas nas relações formais que dão origem a esses fatos. "substâncias".

O reexame sistemático da linguagem por Saussure baseia-se em três pressupostos. O primeiro é que o estudo científico da linguagem precisa desenvolver e estudar o sistema e não a história dos fenômenos linguísticos. seus "eventos de fala" particulares, que ele designa como parole - e o objeto próprio da linguística, o sistema (ou "código") que governa esses eventos, que ele designa como langue. concepção sincrônica" da relação entre os elementos da linguagem em um determinado instante, em vez do estudo "diacrônico" do desenvolvimento da linguagem ao longo da história.

Essa suposição deu origem ao que Roman Jakobson em 1929 veio a designar como "estruturalismo", no qual "qualquer conjunto de fenômenos examinados pela ciência contemporânea é tratado não como uma aglomeração mecânica, mas como um todo estrutural, a concepção mecânica de processos cede à questão da sua função" ("Romântico" 711). Nesta passagem, Jakobson está articulando a intenção de Saussure de definir a linguística como um sistema científico em oposição a uma simples contabilidade "mecânica" de acidentes históricos. agora chamá-lo de "estrutural" - linguística: que os elementos básicos da linguagem só podem ser estudados em relação às suas funções e não em relação às suas causas. em que se relacionam com outros chamados eventos e entidades. Trata-se de uma reorientação radical na concepção da experiência e dos fenômenos, cuja importância o filósofo Ernst Cassirer comparou "à nova ciência de Galileu que no século XVII mudou toda a nossa conceito do mundo físico" (citado em Culler, Pursuit 2 4). Essa mudança, como observam Greimas e Courtes, reconcebe a "interpretação" e, portanto, reconcebe a explicação e a compreensão em si. Em vez de a explicação "ser em termos das causas de um fenômeno", de modo que, como "efeito", está de alguma forma subordinada às suas causas, a explicação aqui consiste em subordinar um fenômeno à sua "função" orientada para o futuro ou "objetivo." A explicação não é mais independente das intenções ou propósitos humanos (mesmo que essas intenções possam ser impessoais, comunitárias ou, em termos freudianos, "inconscientes").

Em sua linguística, Saussure realiza essa transformação especificamente na redefinição da "palavra" linguística, que ele descreve como o "signo" linguístico e define em termos funcionalistas. O signo, ele argumenta, é a união de "um conceito e uma imagem sonora", que ele chamou de "significado e significante" (66-67; a tradução de Roy Harris de 1983 oferece os termos "significação" e "sinal"). A natureza de sua "combinação" é "funcional" na medida em que nem o significado nem o significante são a "causa" do outro, mas "cada um seus valores do outro" (8). elemento da linguagem, o signo , relacionalmente e faz a suposição básica da linguística histórica, a saber, a identidade das unidades elementares de linguagem e significação (ou seja, "palavras"), sujeita a análise rigorosa. a palavra "árvore" como a "mesma" palavra não é porque a palavra é definida por qualidades inerentes - não é uma "aglomeração mecânica" de tais qualidades - mas porque é definida como um elemento de um sistema, o "todo estrutural" da linguagem.

Tal definição relacional (ou "diacrítica") de uma entidade governa a concepção de todos os elementos da linguagem na linguística estrutural. Isso fica mais claro na realização mais impressionante da linguística saussureana, o desenvolvimento dos conceitos de "fonemas" e "características distintivas" da linguagem. Os fonemas são as menores unidades articuladas e significantes de uma língua. Não são os sons que ocorrem na linguagem, mas as "imagens sonoras" mencionadas por Saussure, que são apreendidas pelos falantes - fenomenalmente apreendidas - como portadoras de significado. (Assim, Elmar Holenstein descreve a linguística de Jakobson, que segue Saussure de maneiras importantes, como "estruturalismo fenomenológico".) . . é uma realidade fenomenológica e não empírica; não é a obra em si, mas um conjunto de relações funcionais que estão localizadas na consciência de um coletivo (geração, meio, etc.)" (citado em Galan 35). Da mesma forma, Lévi-Strauss, o principal porta-voz do estruturalismo francês , observou em 1960 que "a estrutura não tem conteúdo distinto; ela é o próprio conteúdo, e a organização lógica na qual ela está presa é concebida como uma propriedade do real" (167; ver também Jakobson, Fundamentals 27-28).

Os fonemas, portanto, os menores elementos perceptíveis da linguagem, não são objetos positivos, mas uma "realidade fenomenológica". Em inglês, por exemplo, o fonema /t/ pode ser pronunciado de muitas maneiras diferentes, mas em todos os casos um falante de inglês o reconhecerá como funcionando como um /t/. Um t aspirado (ou seja, um t pronunciado com uma respiração semelhante a h depois dele), um som t agudo ou grave, um som t estendido e assim por diante, todos funcionarão da mesma maneira para distinguir o significado de "to" e "do" em inglês. Além disso, as diferenças entre as línguas são tais que variações fonológicas em uma língua podem constituir fonemas distintos em outra; assim, o inglês distingue entre /l/ e /r/, enquanto outras línguas são tão estruturadas que essas articulações são consideradas variações do mesmo fonema (como o t aspirado e não aspirado em inglês). Em toda língua natural, o grande número de palavras possíveis é uma combinação de um pequeno número de fonemas. O inglês, por exemplo, possui menos de 40 fonemas que se combinam para formar mais de um milhão de palavras diferentes.

Os próprios fonemas da linguagem são estruturas de traços sistematicamente organizadas. Nas décadas de 1920 e 1930, seguindo o exemplo de Saussure, Jakobson e N. S. Trubetzkoy isolaram as "características distintivas" dos fonemas. Essas características são baseadas na estrutura fisiológica dos órgãos da fala - língua, dentes, cordas vocais, etc. Saussure menciona no Curso e que Harris descreve como "fonética fisiológica" (39; a tradução anterior de Baskin usa o termo "fonologia" [(1959) 38]) - e eles se combinam em "pacotes" de oposições binárias para formar fonemas. Por exemplo, em inglês a diferença entre /t/ e /d/ é a presença ou ausência de "voz" (o engajamento das cordas vocais), e no nível de vozeamento esses fonemas se definem reciprocamente. Dessa forma, a fonologia é um exemplo específico de uma regra geral da linguagem descrita por Saussure: Na linguagem existem apenas diferenças. ainda mais importante: uma diferença geralmente implica termos positivos entre os quais a diferença é estabelecida; mas na linguagem há apenas diferenças sem termos positivos. Quer tomemos o significado ou o significante, a linguagem não tem ideias nem sons que existiam antes do sistema linguístico. (120)

Nessa estrutura, as identidades linguísticas são determinadas não por qualidades inerentes, mas por relações sistêmicas ("estruturais").

Eu disse que a fonologia "seguiu o exemplo" de Saussure, porque embora sua análise da fisiologia da produção da linguagem "seria hoje", como diz Harris, "chamada de "física", em oposição a "psicológica" ou "funcional", "" (Leitura 49), consequentemente no Curso ele articulou a direção e os contornos de uma análise funcional da linguagem. Da mesma forma, sua única obra extensa publicada, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memória sobre o sistema primitivo de vogais nas línguas indo-europeias), que apareceu em 1878, estava totalmente inserida no projeto do século XIX. linguística histórica do século. No entanto, dentro deste trabalho, como Jonathan Culler argumentou, Saussure demonstrou "a fecundidade de pensar a linguagem como um sistema de itens puramente relacionais, mesmo quando trabalhando na tarefa de reconstrução histórica" (Saussure 66). Ao analisar as relações estruturais sistemáticas entre os fonemas para explicar os padrões de alternância vocálica nas línguas indo-européias existentes, Saussure sugeriu que, além de vários fonemas diferentes /a/, deve ter havido outro fonema que poderia ser descrito formalmente. "O que torna a obra de Saussure tão impressionante", conclui Culler, "é o fato de que quase cinquenta anos depois, quando o hitita cuneiforme foi descoberto e decifrado, descobriu-se que continha um fonema, escrito h, que se comportava como Saussure havia previsto. . Ele havia descoberto, por uma análise puramente formal, o que hoje é conhecido como as laríngeas do indo-europeu" (66).

Essa concepção da determinação relacional ou diacrítica dos elementos de significação, implícita e explícita no Curso, sugere um terceiro pressuposto que rege a linguística estrutural, o que Saussure chama de "arbitrário do signo". Com isso ele quer dizer que a relação entre o significante e o significado na linguagem nunca é necessária (ou "motivada"): pode-se encontrar tão facilmente o significante sonoro arbre quanto a árvore significante para se unir ao conceito "árvore". Mas, mais do que isso, significa que o significado também é arbitrário: pode-se definir o conceito "árvore" tanto por sua qualidade lenhosa (que excluiria as palmeiras) quanto por seu tamanho (que exclui as "plantas lenhosas baixas" que chamar arbustos). Isso deve deixar claro que a numeração de suposições que venho apresentando não representa uma ordem de prioridade: cada suposição - a natureza sistêmica da significação (melhor apreendida estudando a linguagem "sincronicamente"), a natureza relacional ou "diacrítica" dos elementos da significação, a natureza arbitrária dos signos - deriva seu valor dos outros.

Ou seja, a linguística saussureana compreende os fenômenos que estuda nas relações abrangentes de combinação e contraste na linguagem. Nessa concepção, a linguagem é tanto o processo de articulação do significado (significação) quanto seu produto (comunicação), e essas duas funções da linguagem não são idênticas nem totalmente congruentes (ver Schleifer, "Desconstrução"). Aqui, podemos ver a alternância entre forma e conteúdo que Greimas e Courtes descrevem na interpretação modernista: a linguagem apresenta contrastes que definem formalmente suas unidades, e essas unidades se combinam em níveis sucessivos para criar o conteúdo significante. Além disso, como os elementos da linguagem são arbitrários, nem o contraste nem a combinação podem ser considerados básicos. Assim, na linguagem, os traços distintivos se combinam para formar fonemas contrastantes em outro nível de apreensão, os fonemas se combinam para formar morfemas contrastantes, os morfemas se combinam para formar palavras, as palavras se combinam para formar frases e assim por diante. Em cada caso, o fonema inteiro, ou palavra, ou sentença, e assim por diante, é maior que a soma de suas partes (assim como a água, H2O, no exemplo de Saussure [(1959) 103] é mais que a aglomeração mecânica de hidrogênio e oxigênio).

Os três pressupostos do Curso de Lingüística Geral levaram Saussure a clamar por uma nova ciência do século XX que fosse além da ciência linguística para estudar "a vida dos signos na sociedade". Saussure chamou essa ciência de "semiologia (do grego semeion "sinal")" (16). A "ciência" da semiótica, tal como passou a ser praticada no Leste Europeu nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, ampliou o estudo da linguagem e das estruturas linguísticas aos artefatos literários constituídos (ou articulados) por essas estruturas. Além disso, durante a última parte de sua carreira, mesmo enquanto oferecia os cursos de linguística geral, Saussure prosseguiu com sua própria análise "semiótica" da poesia latina tardia na tentativa de descobrir anagramas de nomes próprios deliberadamente ocultos. O método de estudo era, em muitos aspectos, o oposto do racionalismo funcional de suas análises linguísticas: tentava, como menciona Saussure em um dos 99 cadernos em que se dedicava a este estudo, examinar sistematicamente o problema do "acaso", que " torna-se o fundamento inevitável de tudo" (citado em Starobinski 101). Tal estudo, como diz o próprio Saussure, centra-se no "fato material" do acaso e do sentido (citado 101), de modo que a "palavra-tema" cujo anagrama Saussure busca, como argumenta Jean Starobinski, "é, para o poeta , um instrumento, e não um germe vital do poema. O poema é obrigado a reempregar os materiais fônicos da palavra-tema" (45). Nessa análise, diz Starobinski, "Saussure não se perdeu na busca de significados ocultos". Em vez disso, sua obra parece demonstrar um desejo de fugir de todos os problemas decorrentes da consciência: "Como a poesia não se realiza apenas em palavras, mas é algo nascido das palavras, ela escapa ao controle arbitrário da consciência para depender apenas de uma espécie de legalidade linguística "(121).

Ou seja, a tentativa de Saussure de descobrir nomes próprios na poesia latina tardia - o que Tzvetan Todorov chama de redução de uma "palavra . . . ao seu significante" (266) - enfatiza um dos elementos que nortearam sua análise linguística, a natureza arbitrária do signo. uma substância" - que elimina efetivamente a semântica como objeto principal de análise.) Como conclui Todorov, a obra de Saussure parece hoje notavelmente homogênea em sua recusa em aceitar fenômenos simbólicos. . . . Em sua pesquisa sobre anagramas, ele presta atenção apenas aos fenômenos de repetição, não aos de evocação. . . . Em seus estudos dos Nibelungos, ele reconhece símbolos apenas para atribuí-los a leituras equivocadas: como não são intencionais, os símbolos não existem. Finalmente, em seus cursos de linguística geral, ele contempla a existência da semiologia e, portanto, de outros signos que não os linguísticos; mas esta afirmação é ao mesmo tempo limitada pelo fato de que a semiologia se dedica a um único tipo de signo: aqueles que são arbitrários. (269-70)

Se isso é verdade, é porque Saussure não podia conceber a "intenção" sem sujeito; ele não conseguia escapar da oposição entre forma e conteúdo que seu trabalho tanto questionava. Em vez disso, ele recorreu à "legalidade linguística". Situada entre, por um lado, as concepções oitocentistas de história, subjetividade e o modo de interpretação causal governado por essas concepções e, por outro, concepções "estruturalistas" do século XX daquilo que Lévi-Strauss chamou de "kantismo sem um sujeito transcendental" (citado em Connerton 23) - conceitos que apagam a oposição entre forma e conteúdo (ou sujeito e objeto) e a hierarquia de primeiro plano e segundo plano no estruturalismo completo, na psicanálise e até na mecânica quântica - o trabalho de Ferdinand de Saussure em linguística e semiótica circunscreve um momento marcante no estudo do significado e da cultura.

Ronald Schleifer

Anexo 2

Fernando de Saussure (tradução)

O linguista suíço Ferdinand de Saussure (1857-1913) é considerado o fundador da linguística moderna - graças às suas tentativas de descrever a estrutura da língua, e não a história de línguas individuais e formas de palavras. Em geral, os fundamentos dos métodos estruturais em linguística e crítica literária e, em grande medida, semiótica foram lançados em suas obras no início do século XX. Comprova-se que os métodos e conceitos do chamado "pós-estruturalismo", desenvolvidos nas obras de Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e outros, remontam às obras linguísticas de Saussure e leituras anagramáticas da poesia romana tardia. Deve-se notar que o trabalho de Saussure sobre linguística e interpretação linguística ajuda a conectar uma ampla gama de disciplinas intelectuais - da física às inovações literárias, psicanálise e filosofia do início do século XX. A. J. Greimas e J. Kurte escrevem em Semiótica e Linguagem: “Um dicionário analítico com o título “Interpretação” como um novo tipo de interpretação surgiu no início do século XX junto com a linguística de Saussure, a fenomenologia de Husserl e a psicanálise de Freud. Nesse caso, “interpretação não é a atribuição de um conteúdo dado a uma forma que de outra forma não teria, mas sim uma paráfrase que formula de outro modo o mesmo conteúdo de um elemento significante dentro de um sistema semiótico dado” (159). ). Nessa compreensão de "interpretação", forma e conteúdo são inseparáveis; pelo contrário, cada forma é preenchida com significado semântico (“forma significativa”), de modo que a interpretação oferece uma nova e semelhante recontagem de algo significativo em outro sistema de signos.

Uma compreensão semelhante de forma e conteúdo, apresentada por Claude Lévi-Strauss em uma das principais obras do estruturalismo, ("Structure and Form: Reflections on the Works of Vladimir Propp"), pode ser vista no livro postumamente publicado de Saussure "Course in Lingüística Geral" (1916, trad., 1959, 1983). Durante sua vida, Saussure publicou pouco, "Curso" - sua principal obra - foi coletado das notas de alunos que assistiram às suas palestras sobre linguística geral em 1907-11. No Curso, Saussure pediu um estudo "científico" da linguagem, contrastando-o com a linguística histórico-comparativa do século XIX. Essa obra pode ser considerada uma das maiores conquistas do pensamento ocidental: tomando como base as palavras individuais como elementos estruturais da linguagem, a linguística histórica (ou “diacrônica”) comprovou a origem e o desenvolvimento das línguas da Europa Ocidental língua indo-européia comum - e um proto-indo-europeu anterior.

É justamente esse estudo das ocorrências únicas das palavras, com a concomitante suposição de que a "unidade" básica da linguagem é, de fato, a existência positiva desses "elementos da palavra" que Saussure questionou. Seu trabalho foi uma tentativa de reduzir os muitos fatos sobre a linguagem estudados casualmente pela linguística comparativa a um pequeno número de teoremas. A escola filológica comparada do século XIX, escreve Saussure, "não conseguiu criar uma verdadeira escola de linguística" porque "não compreendia a essência do objeto de estudo" (3). Essa "essência", argumenta ele, reside não apenas nas palavras individuais - as "substâncias positivas" da linguagem -, mas também nas conexões formais que ajudam essas substâncias a existir.

O "teste" de linguagem de Saussure baseia-se em três suposições. Em primeiro lugar, a compreensão científica da linguagem se baseia não em um fenômeno histórico, mas estrutural. Assim, distinguiu entre fenômenos individuais da língua - "eventos de fala", que ele define como "parole" - e o próprio, em sua opinião, objeto de estudo da linguística, o sistema (código, estrutura) que controla esses eventos ("língua"). Tal estudo sistemático, além disso, requer uma concepção "síncrona" da relação entre os elementos da linguagem em um determinado momento, ao invés de um estudo "diacrônico" do desenvolvimento de uma língua ao longo de sua história.

Essa hipótese foi a precursora do que Roman Jakobson em 1929 chamaria de "estruturalismo" - uma teoria em que "qualquer conjunto de fenômenos investigados pela ciência moderna é considerado não como uma acumulação mecânica, mas como um todo estrutural em que o componente construtivo está correlacionado com a função" ("Romântico "711). Nesta passagem, Jakobson formulou a ideia de Saussure de definir a linguagem como uma estrutura, em oposição à enumeração "mecânica" dos acontecimentos históricos. Além disso, Jakobson desenvolve outro pressuposto saussureano, que se tornou o precursor da linguística estrutural: os elementos básicos da linguagem devem ser estudados em conexão não tanto com suas causas, mas com suas funções. Fenômenos e eventos separados (digamos, a história da origem de palavras indo-européias individuais) devem ser estudados não por si mesmos, mas em um sistema no qual são correlacionados com componentes semelhantes. Esta foi uma virada radical na comparação dos fenômenos com a realidade circundante, cujo significado foi comparado pelo filósofo Ernst Cassirer com "a ciência de Galileu, que transformou as idéias sobre o mundo material no século XVII". , como observam Greimas e Kurthe, muda a ideia de “interpretação”, consequentemente, as próprias explicações. presente e futuro A interpretação deixou de ser independente das intenções de uma pessoa (apesar de as intenções poderem ser impessoais, “inconscientes” no sentido freudiano da palavra).

Em sua linguística, Saussure mostra especialmente essa virada na mudança do conceito de palavra na linguística, que ele define como signo e descreve em termos de suas funções. Um sinal para ele é uma combinação de som e significado, "significado e designação" (66-67; na tradução inglesa de 1983 de Roy Harris - "significação" e "sinal"). A natureza deste composto é "funcional" (nem um nem outro elemento pode existir sem o outro); além disso, "um empresta qualidades do outro" (8). Assim, Saussure define o principal elemento estrutural da linguagem - o signo - e faz da base da linguística histórica a identidade dos signos às palavras, o que exige uma análise particularmente rigorosa. Portanto, podemos entender diferentes significados de, digamos, a mesma palavra "árvore" - não porque a palavra seja apenas um conjunto de certas qualidades, mas porque ela é definida como um elemento no sistema de signos, no "todo estrutural", na língua.

Tal conceito relativo ("diacrítico") de unidade fundamenta o conceito de todos os elementos da linguagem na linguística estrutural. Isso fica especialmente claro na descoberta mais original da linguística saussureana, no desenvolvimento do conceito de "fonemas" e "características distintivas" da linguagem. Os fonemas são a menor das unidades linguísticas faladas e significativas. Não são apenas sons que ocorrem na língua, mas "imagens sonoras", observa Saussure, que são percebidas pelos falantes nativos como tendo significado. (Ressalte-se que Elmar Holenstein chama a linguística de Jakobson, que dá continuidade às ideias e conceitos de Saussure em suas principais disposições, de "estruturalismo fenomenológico"). É por isso que o principal orador da Escola de Estruturalismo de Praga, Jan Mukarowski, observou em 1937 que “estrutura. . . não um conceito empírico, mas fenomenológico; não é o resultado em si, mas um conjunto de relações significativas da consciência coletiva (geração, outros, etc.)”. Pensamento semelhante foi expresso em 1960 por Lévi-Strauss, líder do estruturalismo francês: “A estrutura não tem conteúdo definido; é significativo em si mesmo, e a construção lógica em que está encerrado é a marca da realidade.

Por sua vez, os fonemas, como os menores elementos linguísticos aceitáveis para a percepção, representam uma "realidade fenomenológica" integral separada. Por exemplo, em inglês, o som "t" pode ser pronunciado de maneira diferente, mas em todos os casos, uma pessoa que fala inglês o perceberá como "t". Aspirado, levantado ou abaixado, um "t" longo e similares distinguirão igualmente o significado das palavras "para" e "fazer". Além disso, as diferenças entre as línguas são tais que variedades de um som em uma língua podem corresponder a diferentes fonemas em outra; por exemplo, "l" e "r" em inglês são diferentes, enquanto em outros idiomas são variedades do mesmo fonema (como o inglês "t", pronunciado com e sem aspiração). O vasto vocabulário de qualquer língua natural é um conjunto de combinações de um número muito menor de fonemas. Em inglês, por exemplo, apenas 40 fonemas são usados para pronunciar e escrever cerca de um milhão de palavras.

Os sons de uma língua são um conjunto de características sistematicamente organizado. Nas décadas de 1920 e 1930, seguindo Saussure, Jacobson e N.S. Trubetskoy destacaram as "características distintivas" dos fonemas. Essas características são baseadas na estrutura dos órgãos da fala - língua, dentes, cordas vocais - Saussure percebe isso no "Curso de Lingüística Geral", e Harris chama isso de "fonética fisiológica" (na tradução anterior de Baskin, o termo "fonologia " é usado) - eles estão conectados em "nós » durg contra um amigo para fazer sons. Por exemplo, em inglês, a diferença entre "t" e "d" é a presença ou ausência de uma "voz" (a tensão das cordas vocais) e o nível de voz que distingue um fonema de outro. Assim, a fonologia pode ser considerada um exemplo da regra geral da linguagem descrita por Saussure: "Só existem diferenças na linguagem". Ainda mais importante não é isso: a diferença geralmente implica as condições exatas entre as quais está localizada; mas na linguagem há apenas diferenças sem condições precisas. Quer estejamos considerando "designação" ou "significado" - na língua não há conceitos nem sons que teriam existido antes do desenvolvimento do sistema linguístico.

Em tal estrutura, as analogias linguísticas são definidas não com a ajuda de suas qualidades inerentes, mas com a ajuda de relações de sistema (“estruturais”).

Já mencionei que a fonologia em seu desenvolvimento se baseou nas ideias de Saussure. Embora sua análise da fisiologia linguística nos tempos modernos, diz Harris, "fosse chamada de 'física', em oposição a 'psicológica' ou 'funcional', em The Course ele articulou claramente a direção e os princípios básicos da análise funcional da linguagem. Seu único trabalho publicado durante sua vida, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Notas sobre o sistema vocálico original nas línguas indo-europeias), publicado em 1878, estava completamente alinhado com a linguística histórica comparativa do século 19. Não obstante, nesta obra, diz Jonathan Culler, Saussure mostrou “a fecundidade da ideia de linguagem como um sistema de fenômenos interligados, mesmo com sua reconstrução histórica”. Analisando a relação entre os fonemas, explicando a alternância de vogais nas línguas modernas do grupo indo-europeu, Saussure sugeriu que além de vários sons diferentes "a", deve haver outros fonemas que são descritos formalmente. “O que torna a obra de Saussure particularmente impressionante”, conclui Kaller, “é que quase 50 anos depois, quando o cuneiforme hitita foi descoberto e decifrado, foi encontrado um fonema, na escrita denotada por “h”, que se comportou como Saussure previu. Através da análise formal, ele descobriu o que hoje é conhecido como som gutural nas línguas indo-européias.

No conceito de uma definição relativa (diacrítica) dos signos, tanto explícitos quanto implícitos no Curso, há um terceiro pressuposto-chave da linguística estrutural, chamado por Saussure de "natureza arbitrária do signo". Com isso se quer dizer que a relação entre som e significado na linguagem não é motivada por nada: pode-se facilmente conectar a palavra "arbre" e a palavra "árvore" com o conceito de "árvore". Além disso, isso significa que o som também é arbitrário: você pode definir o conceito de "árvore" pela presença de sua casca (exceto palmeiras) e por tamanho (exceto "plantas lenhosas baixas" - arbustos). A partir disso, deve ficar claro que todos os pressupostos que apresento não são divididos em mais e menos importantes: cada um deles - a natureza sistêmica dos signos (mais compreensíveis no estudo "síncrono" da língua), seu relativo (diacrítico) essência, a natureza arbitrária dos signos - vem do resto.

Assim, na linguística saussureana, o fenômeno estudado é entendido como um conjunto de comparações e oposições da linguagem. A linguagem é ao mesmo tempo uma expressão do significado das palavras (designação) e seu resultado (comunicação) - e essas duas funções nunca coincidem (veja "Desconstrução da linguagem" de Shleifer). Podemos ver a alternância de forma e conteúdo que Greimas e Kurte descrevem na última versão da interpretação: os contrastes linguísticos definem suas unidades estruturais, e essas unidades interagem em níveis sucessivos para criar um determinado conteúdo significativo. Como os elementos da linguagem são aleatórios, nem contraste nem combinação podem ser a base. Isso significa que, em uma língua, os traços distintivos formam um contraste fonético em um nível diferente de compreensão, os fonemas são combinados em morfemas contrastantes, morfemas - em palavras, palavras - em frases etc. Em qualquer caso, um fonema inteiro, palavra, frase, etc. é mais do que a soma de suas partes (assim como a água, no exemplo de Saussure, mais do que a combinação de hidrogênio e oxigênio).

Três pressupostos do “Curso de Linguística Geral” levaram Saussure à ideia de uma nova ciência do século XX, separada da linguística, estudando “a vida dos signos na sociedade”. Saussure chamou essa ciência de semiologia (do grego "semeion" - um sinal). A "ciência" da semiótica, que se desenvolveu na Europa Oriental nas décadas de 1920 e 1930 e em Paris nas décadas de 1950 e 1960, estendeu o estudo da linguagem e das estruturas linguísticas em achados literários compostos (ou formulados) em termos dessas estruturas. Além disso, no crepúsculo de sua carreira, paralelamente ao seu curso de linguística geral, Saussure se engajou em uma análise "semiótica" da poesia romana tardia, tentando descobrir anagramas de nomes próprios compostos deliberadamente. Esse método era em muitos aspectos o oposto do racionalismo em sua análise linguística: era uma tentativa, como escreve Saussure em um dos 99 cadernos, de estudar no sistema o problema da "probabilidade", que "torna-se a base de tudo. " Tal investigação, afirma o próprio Saussure, ajuda a focalizar o "lado real" da probabilidade; A “palavra-chave” para a qual Saussure procura um anagrama é, segundo Jean Starobinsky, “uma ferramenta para o poeta, e não a fonte de vida para o poema. O poema serve para inverter os sons da palavra-chave. Segundo Starobinsky, nesta análise, "Saussure não se aprofunda na busca de significados ocultos". Ao contrário, em suas obras, é perceptível um desejo de evitar questões relacionadas à consciência: “como a poesia se expressa não apenas em palavras, mas também no que essas palavras dão origem, ela extrapola o controle da consciência e depende apenas de as leis da linguagem”.

A tentativa de Saussure de estudar nomes próprios na poesia romana tardia (Tsvetan Todorov chamou isso de abreviação de "uma palavra... a essência formal da linguística saussureana ("Linguagem", afirma ele, "a essência da forma, não do fenômeno"), que exclui a possibilidade de analisar o significado. Todorov conclui que hoje os escritos de Saussure parecem notavelmente consistentes em sua relutância em estudar símbolos [fenômenos que têm um significado bem definido]. . . . Explorando anagramas, Saussure presta atenção apenas à repetição, mas não às opções anteriores. . . . Estudando os Nibelungenlied, ele define os símbolos apenas para atribuí-los a leituras errôneas: se não forem intencionais, os símbolos não existem. Afinal, em seus escritos sobre linguística geral, ele assume a existência de uma semiologia que descreve não apenas os signos linguísticos; mas essa suposição é limitada pelo fato de que a semiologia só pode descrever sinais aleatórios e arbitrários.

Se é realmente assim, é apenas porque ele não podia imaginar a "intenção" sem um objeto; ele não conseguiu preencher completamente a lacuna entre forma e conteúdo - em seus escritos isso se transformou em uma questão. Em vez disso, ele se voltou para a "legitimidade linguística". Situando-se entre, por um lado, conceitos oitocentistas baseados na história e conjecturas subjetivas, e métodos de interpretação acidental baseados nesses conceitos, e, por outro lado, conceitos estruturalistas, que Lévi-Strauss chamou de “kantismo sem ator transcendente”. "- apagando a oposição entre forma e conteúdo (sujeito e objeto), significado e origem no estruturalismo, na psicanálise e mesmo na mecânica quântica, os escritos de Ferlinand de Saussure sobre linguística e semiótica marcam um ponto de virada no estudo dos significados na linguagem e na cultura.

Ronald Shleifer

Literatura

1. Admoni V.G. Fundamentos da teoria da gramática / V.G. Admoni; Academia de Ciências da URSS.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Métodos matemáticos em linguística. M., 1974.

4. Arnold I.V. A estrutura semântica da palavra no inglês moderno e a metodologia para seu estudo. /4. Arnold-L.: Educação, 1966. - 187 p.

6. Bashlykov A.M. Sistema de tradução automática. / SOU. Bashlykov, A. A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7.Baudouin de Courtenay: Patrimônio teórico e modernidade: Resumos dos relatórios da conferência científica internacional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Linguagem e estatística. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Lingüística teórica e aplicada. / V. A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semântica. Sintaxe. Morfologia. // V. B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. INTRODUÇÃO à linguagem formal da linguística / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., fl.

13. A herança linguística de Baudouin de Courtenay no final do século XX: Resumos da Conferência Internacional Científica e Prática 15-18 de março de 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Significados gramaticais ocultos e identificação da pessoa social (“retrato”) do falante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Experiência na construção de modelos linguísticos "Significado<-->Texto". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Tradução e linguística aplicada / L.L. Nelyubin. - M.: Escola Superior, 1983. - 207 p.

16. Sobre os métodos exatos de pesquisa linguística: sobre a chamada "linguística matemática" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e outros - M., 1961. - 162 p.

17. Piotrovsky L.G. Lingüística Matemática: Livro Didático / L.G. Piotrovsky, K. B. Bektaev, A. A. Piotrovskaya. - M.: Escola Superior, 1977. - 160 p.

18. Ele é. Texto, máquina, pessoa. - L., 1975. - 213 p.

19. Ele é. Lingüística Aplicada / Ed. A. S. Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelos de linguagem. M., 1963. Revzin, I.I. Lingüística Estrutural Moderna. Problemas e métodos. M., 1977. - 239 p.

21. Revzin, I.I., Rozentsveig, V.Yu. Fundamentos de tradução geral e automática / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 p.

22. Slyusareva N.A. A teoria de F. de Saussure à luz da linguística moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Coruja, L.Z. Lingüística Analítica / L.Z. Coruja - M., 1970. - 192 p.

24. Saussure F. de. Notas sobre Lingüística Geral / F. de Saussure; Por. de fr. - M.: Progresso, 2000. - 187 p.

25. Ele é. Curso de Lingüística Geral / Per. de fr. - Ecaterimburgo, 1999. -426 p.

26. Estatísticas de fala e análise automática de texto / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 p.

27. Stoll, P. Sets. Lógica. Teorias axiomáticas. / R. Stoll; Por. do inglês. - M., 1968. - 180 p.

28. Tenier, L. Fundamentos da sintaxe estrutural. M., 1988.

29. Ubin I.I. Automação das atividades de tradução na URSS / I.I. Ubin, L. Yu. Korostelev, B. D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Processamento de informações conceituais. M., 1980.

32. Shikhanovich, Yu.A. INTRODUÇÃO à matemática moderna (conceitos iniciais). M., 1965

33. Shcherba L.V. Vogais russas em termos qualitativos e quantitativos / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cidadão do mundo // Spark - 1996. - No. 5. - p.13

35. V.A. Uspensky. Preliminar para os leitores da "New Literary Review" às mensagens semióticas de Andrei Nikolaevich Kolmogorov. - Nova Revisão Literária. -1997. - Nº 24. - S. 18-23

36. Perlovsky L. Consciência, linguagem e cultura. - Conhecimento é poder. -2000. №4 - S. 20-33

Introdução? Teoria da Tradução de Palestra

Portal para o aluno. Autotreinamento

2

3

4

5

NO.Zvegintsev APLICAÇÃO DE MÉTODOS LÓGICOS E MATEMÁTICOS EM LINGUÍSTICA

ARTIGOS RELACIONADOS