Módulo de linguagem universal. Usando o ensino modular de línguas estrangeiras para desenvolver a autonomia do aluno

Uma das tecnologias modernas que permite resolver o problema da mudança de paradigma da educação é a educação modular, porque se baseia nas posições de uma abordagem ativa, ativa e flexível na construção do processo pedagógico.

No final dos anos 80 - início dos anos 90 do século XX, um novo termo do campo das ciências técnicas "irrompe" na ciência pedagógica, a saber, "módulo". Módulo (de lat. módulo-"pequena medida") - uma parte integrante, separável ou pelo menos mentalmente distinta do geral. Modular geralmente chamado de uma coisa que consiste em partes claramente definidas, que muitas vezes podem ser removidas ou adicionadas sem destruir a coisa como um todo.

Muito tem sido escrito e falado sobre os benefícios da aprendizagem modular no sistema educacional. Aprendizagem modular - um método de organização do processo educacional baseado na apresentação modular de blocos de informações educacionais.

A essência do treinamento modular é que o conteúdo do treinamento é estruturado em blocos organizacionais e metodológicos autônomos - módulos, cujo conteúdo e volume podem variar dependendo dos objetivos didáticos, do perfil e da diferenciação de níveis dos alunos, dos desejos dos alunos de escolher um trajetória individual de movimento ao longo do curso de treinamento. Os módulos podem ser obrigatórios e eletivos. Os módulos propriamente ditos são formados: como unidade estruturante do currículo da especialidade; como estrutura organizacional e metodológica interdisciplinar, na forma de um conjunto de seções de diferentes disciplinas, unidas por bases temáticas; ou como unidade estrutural organizacional e metodológica no quadro de uma disciplina académica. Um elemento necessário do treinamento modular é geralmente um sistema de classificação para avaliar o conhecimento, que envolve uma pontuação do progresso dos alunos com base nos resultados do estudo de cada módulo.

Na ciência pedagógica, o módulo é considerado uma parte importante de todo o sistema, sem o conhecimento de que o sistema didático não funciona. Em termos de conteúdo, é um bloco completo e logicamente concluído.

A educação modular, utilizada parcialmente nas escolas da Inglaterra e Suécia, é construída de acordo com as regras da modularidade, quando o design do material didático garante que cada aluno cumpra as tarefas didáticas definidas, tenha a completude do material no módulo e a integração diferentes tipos e formas de educação. O efeito positivo obtido com esse treinamento está associado ao seu dinamismo, que consiste na variabilidade do conteúdo dos elementos e módulos. Os objetivos desta formação são formulados em termos de métodos de atividade e modos de ação, divididos em ciclos de cognição e ciclos de outros tipos de atividade. A aprendizagem modular distingue-se por uma abordagem problemática, uma atitude criativa do aluno em relação à aprendizagem. Sua flexibilidade está associada à diferenciação e individualização da aprendizagem com base em diagnósticos repetidos repetidamente para determinar o nível de conhecimento, as necessidades e o ritmo individual da atividade de aprendizagem do aprendiz.

Os princípios orientadores da aprendizagem modular incluem:

  • 1) princípios de modularidade;
  • 2) estruturar o conteúdo do treinamento em elementos separados;
  • 3) dinamismo;
  • 4) atividades;
  • 5) flexibilidade;
  • 6) perspectiva consciente;
  • 7) versatilidade de aconselhamento metodológico e paridade.

O princípio da modularidade pressupõe inteireza e completude, completude e consistência de unidades de construção de material educacional na forma de blocos-módulos, dentro dos quais o material educacional é estruturado na forma de um sistema de elementos educacionais. A partir de blocos-módulos, como de elementos, é construído um curso de formação sobre o tema. Os elementos dentro do bloco-módulo são intercambiáveis ​​e móveis. O desenvolvimento do material educativo ocorre no processo de um ciclo completo de atividades educativas.

É o módulo que pode funcionar como um programa de treinamento, individualizado em conteúdo, métodos de ensino, nível de independência, ritmo de atividade educacional e cognitiva do aluno. Nas características essenciais da aprendizagem modular reside a sua diferença em relação a outros sistemas de aprendizagem.

Em primeiro lugar, o conteúdo do treinamento é apresentado em complexos independentes completos (blocos de informação), cuja assimilação é realizada de acordo com o objetivo. A meta didática é formada para o aluno e contém não apenas uma indicação do volume do conteúdo estudado, mas também o nível de sua assimilação. Além disso, cada aluno recebe orientação escrita do professor sobre como agir de forma mais racional, onde encontrar o material didático necessário.

Em segundo lugar, a forma de comunicação entre professor e aluno está mudando. É realizado através de módulos e mais comunicação pessoal individual. São os módulos que possibilitam a transferência do aprendizado para o sujeito - a base subjetiva. As relações tornam-se paritárias, iguais entre professor e aluno.

Em terceiro lugar, o aluno trabalha o máximo de tempo de forma independente, aprende definição de metas, auto-planejamento, auto-organização, autocontrole e auto-estima.

Yu.B. Kuzmenkova define um módulo como um minicurso autónomo e assume que este curso (como qualquer outro) é desenhado de acordo com os objetivos definidos, métodos de implementação e verificação dos resultados alcançados. De acordo com Yu.B. Kuzmenkova precisa definir um número limitado de tarefas específicas que sejam realisticamente viáveis ​​em um período limitado de tempo de estudo. Para fazer isso, é conveniente compor vários módulos de curto prazo e rotativos de acordo com os componentes centrais marcados (para qualquer programa) - orientação temática e orientação ao objetivo - e construí-los sequencialmente e / ou em paralelo dentro da estrutura geral curso. Uma das características da abordagem proposta é a possibilidade de diferenciação, que permite distinguir claramente entre as configurações de destino selecionadas; Ao mesmo tempo, como mostra a prática, é bastante conveniente subdividir os módulos em módulos de linguagem e fala. Essa diferenciação baseia-se no princípio da atenção focalizada, segundo o qual o desenvolvimento de materiais educativos, principalmente os desconhecidos, torna-se mais eficaz ao diferenciar as dificuldades e removê-las uma a uma. (11, 21-28)

De acordo com isso, ao compilar módulos de linguagem, deve-se focar no domínio de um determinado tópico (ou uma sequência específica de tópicos) relacionado ao estudo de um aspecto da linguagem - por exemplo, da seção correspondente de fonética, gramática ou vocabulário, enquanto a compilação de módulos de fala assume como principal tarefa o domínio de quaisquer habilidades e habilidades no âmbito de um tipo de DR (ou dois relacionados - receptivo e reprodutivo).

Os estudos modernos do princípio modular de organização do processo educacional distinguem três blocos principais na estrutura do módulo: um bloco contendo o material a ser estudado, blocos práticos e de controle.

L.N. e eu. Os Kuznetsovs propõem a seguinte estrutura de módulos:

bloco de destino (objetivo didático de estudar o módulo, tarefas orientadas para a personalidade que realizam o objetivo).

Atualizar bloco (uma lista de conhecimentos básicos e métodos de ação necessários para estudar o tópico, exercícios, testes e outros trabalhos independentes para atualização

conhecimento básico).

Bloqueio de problema (situações problemáticas que são pessoalmente significativas para os alunos, material emocionalmente rico para o tópico).

Bloquear fundos (equipamentos e materiais didáticos (constantemente atualizados), achados metodológicos).

Bloco teórico (uma lista de conhecimentos sobre o assunto e métodos de ação, sistematizando ideias, princípios, padrões, métodos, generalizando métodos de ação, apresentação do conteúdo e estrutura do tópico na forma de suporte (orientação no tópico).

Bloqueio de aplicativo (um sistema de tarefas multinível para repetição e consolidação de variáveis).

Bloco de generalização (material didático para generalização concisa, sistematização de material didático, reflexão).

bloco de recesso (material de treinamento de maior complexidade).

Bloquear "saída" (material didático para provas, provas, relatórios em congressos educacionais, para trabalhos de casa).

Tabela 2. Possível construção do módulo de linguagem

Os objetivos de aprendizagem podem incluir o desenvolvimento complexo de habilidades e habilidades, e ao trabalhar no tema escolhido, você pode usar vários tipos de leitura/escuta, jogos de role-playing, apresentações, relatórios escritos, redação de ensaios, etc. - mas sem falhas com ênfase no desenvolvimento predominante das habilidades lexicais. O vocabulário (na quantidade regulada por meio de um dicionário mínimo) é bem absorvido no decorrer do desenvolvimento de habilidades de comunicação na área escolhida - em situações comunicativas condicionais de vários tipos.

Se, no entanto, os alunos não tiverem tempo suficiente dedicado no curso básico ao estudo de seções específicas de fonética ou gramática, é possível construir de forma semelhante um módulo focado no domínio das habilidades necessárias dentro de um tópico restrito. Por exemplo, "Correção da pronúncia das vogais alemãs" ou "Correção do uso de formas verbais tensas" (no último caso, um bom exemplo é a transferência de ênfase dos exercícios de treinamento para o estudo da gramática no contexto). Ao mesmo tempo, é possível desenvolver habilidades de fala de forma abrangente com base em material lexical já conhecido. A prioridade, no entanto, será o trabalho focado com material de gramática ou fonética.

É possível compor vários módulos temáticos restritos, escolhendo as configurações de destino com base na tabela 3 a seguir.

Tabela 3. Desenvolvimento do conhecimento necessário sobre aspectos da linguagem

Cabe ressaltar que a duração e a frequência dos minicursos são variáveis ​​e o módulo não é necessariamente uma aula inteira, pode ser meia aula, ou parte dela, ou uma série de aulas organizadas tematicamente de maior duração. Ao compilar o programa, eles podem ser variados e usados ​​em diferentes combinações: dois módulos de idioma diferentes dentro do programa de disciplinas eletivas podem ser estendidos ao longo de todo o primeiro trimestre e alinhados paralelamente em uma aula (10 minutos - fonético, o restante do tempo gramatical), e o módulo lexical pode começar a partir do segundo trimestre, ou não. A escolha e a sequência dos módulos de introdução são determinadas pelas necessidades específicas dos alunos. É importante que, do ponto de vista do planejamento, o principal requisito seja uma abordagem sistemática da organização das classes (sua ciclicidade, continuidade, repetição e, consequentemente, relatórios regulares), caso contrário, todas essas inovações modulares se tornarão caóticas .

É mais conveniente desenvolver módulos para o ensino de gramática, porque é a gramática que causa as maiores dificuldades na aprendizagem, é por causa do desconhecimento da gramática que os alunos cometem inúmeros erros na fala oral e escrita, por isso vamos nos debruçar sobre esse aspecto da língua com mais detalhes.

A gramática é uma coleção de regras sobre como mudar palavras e combinar palavras em frases. Torna possível revestir os pensamentos humanos em uma concha de linguagem material. A gramática não pode ser separada da fala; sem gramática, o domínio de qualquer forma de fala não é concebível, pois ela, juntamente com o vocabulário e a composição sonora, é a base material da fala. Um traço característico da gramática é que, abstraindo do particular e do concreto, ela toma o geral que subjaz à mudança das palavras e suas combinações nas frases e constrói regras gramaticais a partir dele.

Do exposto, segue-se que a gramática é de grande importância prática. Portanto, no experimento em andamento, será considerado um módulo para o ensino de gramática.

Assim, utilizando vários módulos, é possível implementar com sucesso comunicações intradisciplinares e interdisciplinares, integrar conteúdos educativos, formando-os na lógica do conteúdo da disciplina académica líder com a necessidade de diferenciar conteúdos educativos.

Gostou do nosso site? Seus reposts e avaliações são os melhores elogios para nós!

Construção de guarnição média que permite trocar reagentes de criação por recursos de guarnição e vice-versa. Além disso, abre o acesso às facções (Alliance) e (Horde). Permite que você use o leilão.

Recomendamos o uso do complemento. Plano principal- este é o melhor addon para gerenciar a guarnição no momento. O complemento pode ser encontrado e baixado. Para um gerenciamento de missão conveniente, recomendamos o uso do addon Gerente de Missão da Guarnição. Você pode encontrá-lo e baixá-lo.

1. Visão Geral

2. Como abrir o acesso à loja de negociação?

Nesta seção, mostraremos como obter acesso à loja de nível 1, 2 e 3.

2.1. Posto de Negociação Nível 1

A loja do primeiro nível estará disponível imediatamente após a construção da prefeitura.

2.2. Projeto da Guarnição: Posto de Comércio Nível 2

Garrison Blueprint: Trading Post, Level 2 pode ser adquirido no nível 98 ou depois de construir um posto avançado em Spires of Arak. Custa 1000g ou troca por Notas de Estabelecimento de Posto Avançado. As notas podem ser obtidas duas vezes: a primeira vez - durante as missões em Gorgrond, a segunda - durante as missões nas Agulhas de Arak, economizando assim algum ouro. Abaixo está a localização dos mercadores da Horda e da Aliança.

2.3. Projeto da Guarnição: Posto de Comércio Nível 3

Projeto da Guarnição: Posto de Comércio Nível 3 é uma recompensa da conquista Amigos Selvagens (Aliança) ou Amigos Selvagens (Horda), exaltada com 3 de 5 facções de Draenor: (Aliança), (Horda), (Aliança), (Horda), (Aliança), (Horda). A conquista é compartilhada por todos os personagens da conta.

Depois de completar a conquista, você não deve esperar que a planta apareça magicamente em sua bolsa. Vá para Spartz Boltwhack (Alliance) ou Rezlak (Horde) e compre por 1000g.

3. Troca

Ao visitar a loja pela primeira vez, você receberá uma missão (Alliance) ou A Little Tricks (Horde). Depois de completar a missão, você terá acesso ao comerciante. Ele vende reagentes de criação de Draenor: minério, grama, carne, filé de peixe, pele, couro e poeira encantadora. Preço para 5 unidades O reagente varia de 20 a 50x Recursos da Guarnição (os preços são sempre diferentes para Horda e Aliança).

4. Pedidos

Pedidos diários na feitoria permitem que você troque reagentes por Recursos da Guarnição. Taxa de câmbio - 5 reagentes por 20 recursos.

5. Leilão

Ao visitar a loja do segundo nível pela primeira vez, você pode pegar a missão do antigo mecanismo de negociação: (Aliança) ou (Horda). Você receberá 5 peças, cada uma das quais deve ser combinada com itens diferentes:

  • O módulo Arcane Crystal requer 4 reagentes, que podem ser obtidos de mobs e bosses em raids ou ataques de guarnição:
  • O módulo de gerenciamento de leilões requer 3 reagentes, que podem ser obtidos de mobs e chefes nas masmorras:

O ETAP-3 é um sistema multifuncional de processamento de texto em linguagem natural desenvolvido desde a década de 1980. um grupo de linguistas, matemáticos e programadores russos do Instituto para Problemas de Transmissão de Informação da Academia Russa de Ciências. O sistema ETAP-3 é baseado na teoria “Meaning Û Text”, desenvolvida por I.A. Melchuk, e a teoria integral da linguagem desenvolvida por Yu.D. Apresiano.

O STAGE-3 não é um desenvolvimento comercial destinado a atingir um objetivo de aplicação específico. Nossa principal tarefa é modelagem linguística de linguagem natural e implementação computacional de tais modelos. Isso explica nosso desejo de construir modelos o mais adequados possível do ponto de vista linguístico. Muitas vezes, informações linguísticas extensas são inseridas no sistema, independentemente de ser necessário melhorar a eficiência do processamento de texto do computador ou não. Em particular, nos esforçamos para obter estruturas sintáticas linguisticamente corretas para cada sentença, não porque, de outra forma, a sentença não seria, por exemplo, traduzida corretamente para outro idioma, mas simplesmente porque isso é exigido pela tarefa de modelar a sintaxe da linguagem natural. No entanto, estamos convencidos de que, em última análise, a adequação teórica e a completude da informação linguística compensam do ponto de vista puramente prático.

Todas as aplicações STAGE-3 usam o sistema lógico de 3 valores original e a linguagem de descrição linguística formal detalhada FORET (ver Apresyan et al. 1992a, Apresjan e outros. 1992b).

2. Estágio-3: módulos, propriedades, arquitetura, implementação

2.1.Módulos

O sistema ETAP-3 contém os seguintes módulos principais:

  • Sistema de tradução automática de alta qualidade
  • Módulo para gerar textos em russo com base no Universal Network Language (UNL)
  • Interface de linguagem natural para bancos de dados
  • Sistema de paráfrase sinonímica de frases
  • Corretor de erros de sintaxe
  • Sistema de aprendizado de idiomas assistido por computador
  • Local de trabalho para marcação sintática de corpus de texto.

Abaixo vamos caracterizar brevemente todos esses módulos, e nos deteremos em um deles - o módulo UNL - com mais detalhes.

2.1.1. Sistema de tradução automática ETAP-3

O módulo principal do ETAP-3 é um sistema de tradução automática (MT) que atende a cinco pares de idiomas. Os sistemas de tradução estão disponíveis para (1) inglês para russo, (2) russo para inglês, (3) russo para coreano, (4) russo para francês e (5) russo para alemão.

Até à data, os dois primeiros sistemas foram desenvolvidos com o maior detalhe. O sistema de tradução do inglês para o russo e do russo para o inglês, que pode ser considerado como um único módulo bidirecional, foi desenvolvido para traduzir textos reais, principalmente temas científicos e técnicos. Os melhores resultados foram obtidos para textos sobre ciência da computação, engenharia elétrica, economia e política, pois os dicionários combinatórios das línguas de trabalho do sistema (cada um contendo cerca de 50.000 verbetes) estão focados principalmente no vocabulário dessas áreas temáticas. No entanto, o ETAP-3 também lida com textos sobre temas do dia-a-dia, uma vez que recentemente os dicionários foram significativamente reabastecidos com vocabulário do dia-a-dia. Para cada lexema do dicionário combinatório, são fornecidas suas características sintáticas, formadoras de palavras, semânticas e formadoras de palavras, seu modelo de gestão, bem como informações sobre frases definidas com este lexema.

Além disso, há um dicionário morfológico russo (100.000 entradas de dicionário), que, além de informações puramente morfológicas, contém informações sintáticas básicas sobre o lexema e seu equivalente aproximado de tradução. O dicionário morfológico inglês tem a mesma estrutura (60.000 verbetes). O sistema é baseado em descrições gramaticais abrangentes dos idiomas inglês e russo, compiladas pelos desenvolvedores do STAGE-3.

Para outros pares de línguas, existem sistemas de tradução ao nível de protótipos.

Se o STAGE-3 receber uma frase homônima e o sistema não conseguir resolver essa homonímia, várias opções de tradução são oferecidas na saída. Em todos os outros casos, o sistema produz uma estrutura sintática mais plausível e uma tradução mais provável. Se o usuário do sistema deseja obter todas as traduções possíveis, ele pode selecionar a opção apropriada, e o sistema “lembrará” todos os casos de homonímia não resolvida e retornará todas as estruturas sintáticas possíveis da sentença com conteúdo lexical aceitável para elas. Vamos considerar um exemplo real. Frase Eles fizeram uma observação geral de que... com a opção “todas as opções de tradução” selecionada, foi traduzido para o russo de duas maneiras, que diferem tanto nas estruturas sintáticas quanto na escolha do vocabulário: (a) Eles fizeram uma observação geral de que... e B) Eles forçaram o general a apontar que

2.1.2. Interface de linguagem natural para bancos de dados

Este módulo do sistema ETAP-3 traduz consultas fornecidas de forma livre em linguagem natural (inglês ou russo) em expressões de linguagem de consulta SQL. O módulo também traduz de SQL para linguagem natural. O módulo é baseado em um componente semântico desenvolvido especificamente para este fim, que traduz a estrutura sintática profunda em uma representação semântica formal, da qual se pode facilmente passar para uma representação na linguagem SQL.

2.1.3. Sistema de paráfrase sinonímica

Este módulo é projetado para conduzir experimentos linguísticos para obter uma variedade de perífrases sinônimas e quase sinônimas de frases em russo e inglês. O sistema é baseado no aparato de funções lexicais, uma das inovações mais importantes da teoria "Significado Û Texto". O resultado do módulo de paráfrase de sinônimos pode ser ilustrado pelo seguinte exemplo:

(1) O diretor ordenou que John escrevesse um relatório – O diretor deu a John uma ordem para escrever um relatório – John foi ordenado pelo diretor a escrever um relatório – John recebeu uma ordem do diretor para escrever um relatório.

Essa área de pesquisa linguística parece ser muito promissora, pois pode ter uma grande variedade de aplicações, por exemplo, no ensino de línguas nativas e estrangeiras, em sistemas de autoria e sistemas de planejamento de texto.

2.1.4. Corretor de erros de sintaxe

Este módulo é projetado para processar textos em russo. Seu objetivo é encontrar e corrigir vários tipos de erros na concordância gramatical, bem como no gerenciamento de casos.

2.1.5 Sistema de ensino de linguagem de computador

Este módulo é um aplicativo de software autônomo, ou seja, um jogo de computador na forma de um diálogo. Este programa pode ser usado no ensino de russo, inglês e alemão como língua estrangeira. O jogo é destinado a quem já domina bem o idioma, mas gostaria de ampliar seu vocabulário, principalmente por meio de frases definidas e paráfrases. O sistema é baseado no aparato de funções lexicais. O programa também pode ser usado com sucesso por falantes nativos dos idiomas acima que desejam enriquecer seu vocabulário (por exemplo, jornalistas, professores e até políticos).

2.1.6. Local de trabalho para marcação sintática de corpus de texto.

Este módulo recém-desenvolvido usa os dicionários ETAP-3, bem como os analisadores morfológicos e de análise sintática do sistema, para construir o primeiro corpus de textos russos sintaticamente marcados. Esta é uma aplicação mista: a estrutura de árvore resultante da análise automática é então editada por um humano usando ferramentas gráficas convenientes.

2.2. Principais propriedades do sistema

Entre as principais características do sistema ETAP-3 como um todo e de seus módulos individuais, destacam-se:

  • Usando regras como a unidade básica de um algoritmo
  • Abordagem em camadas
  • Tradução através da fase de transferência
  • Usando Árvores de Sintaxe de Dependência
  • Abordagem lexicalista
  • Capacidade de receber opções de tradução
  • Possibilidade de uso diversificado de recursos linguísticos

Na versão atual do ETAP-3, todos os módulos usam apenas algoritmos baseados em regras. No entanto, em vários experimentos recentes, o módulo MT foi complementado com um componente baseado no acesso à memória de tradução (memória de tradução) , e um componente estatístico que extrai semiautomaticamente equivalentes de tradução de corpora de texto bilíngüe (ver Iomdin & Streiter 1999).

Como muitos outros sistemas de processamento de texto em linguagem natural, o ETAP-3 é caracterizado por uma abordagem em camadas. No decorrer do processamento, cada sentença passa por vários estágios e em cada estágio é apresentada na forma de uma determinada estrutura: 1) morfológica, 2) sintática e 3) normalizada (ou profunda-sintática). A tradução real (transferência) é realizada no nível de uma estrutura sintática normalizada, ou seja, As estruturas normalizadas em inglês são convertidas em estruturas normalizadas em russo correspondentes e vice-versa.

O que distingue o ETAP-3 da maioria dos sistemas similares é o uso de árvores de dependência sintática para representar a estrutura de uma sentença (a maioria dos sistemas de processamento de texto em linguagem natural ao redor do mundo usa estruturas de constituintes diretos).

O STAGE-3 é caracterizado por uma abordagem lexicalista em que as informações registradas no dicionário são consideradas tão importantes quanto as informações registradas na gramática. Assim, os dicionários ETAP-3 contêm significativamente mais informações do que os dicionários usados ​​em outros sistemas semelhantes. O verbete do dicionário ETAP-3 contém, além do nome do lexema, informações sobre as características sintáticas e semânticas do lexema, seu modelo de controle, equivalente de tradução, diversas regras, bem como os valores das funções lexicais, cuja palavra-chave é este lexema. Sinais sintáticos palavras caracterizam sua capacidade ou incapacidade de agir em certas construções sintáticas. Uma palavra pode receber vários recursos sintáticos de uma lista geral contendo mais de 200 recursos. Recursos semânticos necessário para verificar a concordância semântica entre as palavras em uma frase. Modelo de gestão a palavra contém informações sobre a expressão superficial dos actantes da palavra dada (por exemplo, a palavra pode controlar uma ou outra preposição ou conjunção, ou uma ou outra forma de caso de um nome). O componente mais importante da entrada do dicionário são regulamentos. Todas as regras do STAGE-3 são distribuídas entre gramática e vocabulário. As regras gramaticais são mais gerais e se aplicam a grandes classes de palavras, enquanto as regras referidas em entradas de dicionário (diretamente ou por referência) se aplicam a pequenos grupos de palavras ou até mesmo palavras isoladas. Essa organização de regras garante que o sistema seja configurado automaticamente para processar cada proposta individual. Durante o processo de tradução, apenas aquelas regras são ativadas, cuja referência está explicitamente contida nos verbetes do dicionário das palavras contidas na frase.

Como ilustração, apresentamos um fragmento do verbete do dicionário da palavra inglesa chance:

SYNT:COUNT,PREDTO,PREDTHAT

DES:"FATO","RESUMO"

D1.1: DO,"PESSOA"

D2.1: DO,"FACTO"

D2.2: TO2

D2.3: AQUELE1

SYN1: OPORTUNIDADE

MAGN: BOM1/JUSTO1/EXCELENTE

ANTÍMAGNO: PEQUENO/PEQUENO/POBRE/PEQUENO1/PEQUENO

OPER1: TER/STAND1

REAL1-M: LEVA

ANTIREAL1-M: MISS1

INCEPOPER1: PEGUE

FINOPER1: PERDER

CAUSFUNC1: DAR /DAR

TRANS: CHANCE/ ACONTECENDO

R:COMPOS/MODIF/POSSES

1.1 DEP-LEXA(X,Z,PREPOS,BY1)

1 ZAMRUZ:Z(PO1)

2 ZAMRUZ:X(ALEATÓRIA)

1 ZAMRUZ:Z(ALEATÓRIO)

TRÁFEGO:RA-EXPANS.16

TRÁFEGO:RA-EXPANS.22

Ao desenvolver o sistema ETAP-3, tentamos construir seus componentes de forma que pudessem ser usados ​​para diversas finalidades. Em particular, os principais recursos gramaticais e vocabulares do sistema são utilizados em todos os seus módulos. Por exemplo, os dicionários russos são usados ​​na fase de análise ao traduzir do russo para o inglês e na fase de síntese ao traduzir do inglês para o russo; os mesmos dicionários são utilizados no módulo MP, no sistema de paráfrase, no corpus sintaticamente marcado etc. pode ser usado em vários sistemas de processamento naturalmente - textos em linguagem.

2.3. Arquitetura geral do sistema ETAP-3

Para dar uma ideia geral do funcionamento do sistema ETAP-3, apresentamos o algoritmo geral do módulo MP (Esquema 1). Todos os outros módulos podem, com certa reserva, ser considerados como derivados deste.

MÓDULO DE TRADUÇÃO DE MÁQUINA DO SISTEMA DE ESTÁGIO-3

(ARQUITETURA)

2.4. Implementação

O sistema ETAP-3 foi implementado em um computador MicroVax (sistema operacional VMS). Recentemente, um novo software foi criado para trabalhar com o ETAP-3 em computadores pessoais com Windows NT 4.0, o que permite ao lexicógrafo usar várias ferramentas adicionais e manter e editar dicionários com mais eficiência.

3. Interface para linguagem UNL

3.1 Histórico e objetivos

módulo UNL está sendo desenvolvido como parte de um vasto projeto internacional com um objetivo muito ambicioso: superar, pelo menos em parte, a barreira linguística que separa os usuários da Internet. Apesar do fato de que, com o advento da Internet, as barreiras temporais e espaciais entre as pessoas praticamente desapareceram, os usuários da Internet continuam separados por uma barreira linguística. Este, aparentemente, é o principal obstáculo para o sucesso da comunicação internacional e interpessoal na sociedade da informação. A diversidade de idiomas falados pelos internautas tem sido reconhecida como um dos problemas prementes da humanidade. De qualquer forma, isso é comprovado pelo fato de o projeto, que visa solucionar esse problema, ser realizado sob os auspícios da ONU e coordenado pelo Instituto de Estudos Avançados da Universidade da ONU.

O projeto foi fundado em 1996. Atualmente, 15 universidades e institutos de pesquisa do Brasil, Alemanha, Índia, Indonésia, Jordânia, Espanha, Itália, China, Letônia, Mongólia, Rússia, Tailândia, França e Japão estão participando do projeto.

Espera-se que equipas de outros países se juntem ao projeto nos próximos anos, pelo que em última análise está previsto abranger as línguas oficiais de todos os países membros da ONU

A ideia do projeto é a seguinte. Propõe-se uma linguagem intermediária universal que seja poderosa o suficiente para expressar todas as informações essenciais que os textos em linguagem natural transmitem. Esta linguagem é a Universal Networking Language (UNL) proposta por H. Uchida (Universidade das Nações Unidas). Para cada língua natural, propõe-se desenvolver dois sistemas: um “desconversor” que traduziria textos da língua UNL para uma determinada língua, e um “conversor” que converteria textos de uma determinada língua em expressões da língua UNL. Deve-se enfatizar que a geração de texto UNL não será totalmente automática. Este procedimento é planejado como um diálogo entre um computador e um humano (editor).

Assim, este projeto é fundamentalmente diferente da tradução automática tradicional. Em primeiro lugar, a entrada para gerar textos em diferentes idiomas naturais é a estrutura UNL, cuja qualidade não depende da imperfeição dos procedimentos de análise de texto. Durante a construção interativa da UNL editor de estrutura revisará os resultados do conversor automático, corrigirá erros e resolverá a ambiguidade restante. O editor pode então executar o deconverter e traduzir o que editou UNL expressão em seu idioma nativo para verificar seu trabalho e fazer outras alterações na expressão, se necessário.

Outra diferença importante do sistema UNL da tradução automática reside no fato de que as expressões no idioma Os UNLs podem ser gerados e armazenados independentemente dos idiomas naturais para os quais esses textos serão traduzidos. UNL pode ser pensado como uma forma genérica de representar um valor. Para processar o texto UNL automaticamente, por exemplo, para indexá-lo, pesquisá-lo ou extrair informações dele, não é necessário traduzir esse texto em linguagem natural. Este último é necessário apenas se uma pessoa trabalhar com o texto.

Um conversor e um deconventor para cada idioma natural formam um servidor de idiomas planejado para ser hospedado na Internet. Todos os servidores linguísticos estarão ligados a uma única rede UNL, que permitirá ao internauta traduzir qualquer documento da UNL para a sua própria língua, bem como traduzir para a UNL os textos que pretenda disponibilizar publicamente.

3.2 linguagem UNL

Neste artigo, não poderemos descrever detalhadamente a linguagem UNL, pois este tópico merece um artigo à parte, que provavelmente será escrito pelo criador da linguagem, Dr. Hiroshi Uchida. Vamos nos debruçar apenas sobre os recursos da linguagem UNL que serão importantes para uma apresentação posterior. A especificação completa da linguagem UNL está localizada em http://www.unl.ias.unu.edu/.

UNL é uma linguagem de computador projetada para representar informações de tal forma que seja possível gerar textos contendo essas informações em uma ampla variedade de idiomas. Uma expressão UNL é um hipergrafo direcionado que corresponde a uma sentença em linguagem natural. Os arcos gráficos denotam relacionamentos semânticos, por exemplo, agente(ator)objeto(um objeto),Tempo(Tempo),Lugar, colocar(Lugar, colocar),instrumento(ferramenta),modo(modo de operação) Nos nós do grafo estão as chamadas Palavras Universais (CS) denotando conceitos, ou grupos de CS. Os nós podem ser fornecidos com atributos. Os atributos contêm informações adicionais sobre o uso de um nó em uma determinada frase, por exemplo, @imperative, @generic, @future, @obligation.

Cada US corresponde a alguma palavra em inglês. Algumas palavras possuem delimitadores semânticos que esclarecem os significados dessas palavras. Na maioria dos casos, os delimitadores indicam o lugar do conceito na base de conhecimento. Isso é feito da seguinte maneira. Palavra Universal do Tipo A (cl>B) interpretado como ‘A pertence à categoria B’. Por exemplo, EUA treinador sem delimitadores tem o mesmo significado que a palavra em inglês treinador geralmente. Delimitadores são usados ​​para esclarecer o significado de uma palavra. Sim, a expressão treinador (icl>transporte) deve ser entendido como "treinador como meio de transporte, ou seja, ônibus; expressão treinador (icl>humano) tem a interpretação treinador como um homem, ou seja, treinador, e a expressão treinador (icl>do)- interpretação ' treinador como uma espécie de ação”, isto é, um verbo Comboio. Em outras palavras, o aparato de limitadores torna possível representar o US como uma palavra inglesa tomada em exatamente um significado. Além disso, os delimitadores permitem que você introduza conceitos para os quais não há designações de uma única palavra no idioma inglês. Por exemplo, em russo existe um extenso grupo de verbos de movimento, cujo significado inclui uma indicação do método ou meio de movimento: voar em, nadar, rastejar, correr e outros.Não há correspondências em inglês de uma palavra para os verbos deste grupo. No entanto, com base em palavras em inglês, é possível construir um SE próximo a elas em significado, por exemplo, vir (conhecer>navio) significa “chegar, sendo o veículo um navio”.

Vamos dar um exemplo de uma expressão no idioma UNL correspondente à frase em inglês

(2) No entanto, as diferenças de idioma são uma barreira para o fluxo suave de informações em nossa sociedade.

Cada linha UNL estrutura é uma expressão da forma relação (RS1, RS2). Para simplificar, os delimitadores semânticos para palavras universais são omitidos.

aoj( [e-mail protegido]@[e-mail protegido]@Contudo, [e-mail protegido])

mod( [e-mail protegido]@[e-mail protegido]@Contudo, [e-mail protegido])

mod( [e-mail protegido], Língua)

aoj(suave, [e-mail protegido])

mod( [e-mail protegido], em formação)

scn( [e-mail protegido], sociedade)

pos(sociedade, nós)

3.3. Tradução da UNL para o russo no sistema ETAP-3

Como já observado na Seção 1, o ETAP-3 é um sistema de transferência, e a tradução real é realizada no estágio da estrutura sintática normalizada (NormSS). Nesse nível, é mais conveniente estabelecer uma correspondência entre a língua russa e a UNL, pois as expressões da língua UNL e as estruturas sintáticas normalizadas apresentam muitas semelhanças. Aqui estão os mais significativos:

  1. Tanto as expressões da linguagem UNL quanto o NormSS ocupam uma posição intermediária entre a superfície e as representações semânticas de uma sentença e correspondem aproximadamente ao chamado nível sintático profundo. Nesse nível, o significado das unidades lexicais não é decomposto em primitivos, e as relações entre as unidades lexicais são as mesmas para todas as línguas;
  2. Nas expressões UNL e NormSS, os nós são elementos terminais (unidades lexicais) em vez de categorias sintáticas;
  3. Os nós contêm características adicionais (atributos);
  4. Nas expressões UNL e NormSS, os arcos são dependências direcionadas.

Ao mesmo tempo, existem diferenças significativas entre as expressões UNL e NormSS:

  1. Em NormSS, todos os nós são unidades lexicais, e em UNL, um nó pode ser um subgrafo.
  2. No NormSS, um nó sempre corresponde a um valor de palavra única, e o valor de SS pode ser mais largo ou mais estreito que o valor da palavra em inglês correspondente:

2.1. O valor do CSS pode corresponder a vários valores de uma palavra de uma só vez (veja acima).

2.2. Eles podem corresponder a uma frase livre (por exemplo, baseado em computador ou alta qualidade).

2.3. Eles podem corresponder a alguma forma da palavra (por exemplo, a palavra melhoré uma forma de palavra Boa ou Nós vamos).

2.4. Eles podem denotar um conceito para o qual não há equivalente direto em inglês.

  1. NormSS é o mais simples de todos os grafos conectados, ou seja, uma árvore, enquanto uma expressão UNL é um hipergrafo.
  2. Em UNL, arcos podem formar laços e ligar subgrafos individuais.
  3. Os nós em NormSS são conectados por relações puramente sintáticas que não carregam nenhum significado, enquanto as relações em UNL denotam papéis semânticos.
  4. Atributos em NormSS correspondem a características gramaticais, enquanto o significado de muitos atributos UNL é transmitido por meios lexicais, tanto em inglês quanto em russo (por exemplo, verbos modais).
  5. NormSS contém informações sobre a ordem das palavras em uma frase, e tal informação está ausente em uma expressão UNL.

A proposta da NormaSS (2) é a seguinte:


  1. Transição da expressão UNL para a representação intermediária (IR)
  2. Transição do PP para o NormSS russo (NormSSR).
  3. Síntese da proposta russa para NormSSR.

A primeira dessas etapas é a interface entre UNL e o sistema ETAP-3, e o restante é realizado por meio padrão do módulo inglês-russo do sistema ETAP-3.

O algoritmo de tradução de UNL para russo é mostrado no Esquema 3.

Como segue acima, a transição de uma expressão na linguagem UNL para NormSS deve resolver os cinco problemas a seguir:

  1. Substitua todos os CLs por palavras em inglês sempre que possível. Os lexemas russos aparecerão no estágio de tradução inglês-russo ao se referir ao dicionário de inglês. Se nenhum equivalente em inglês foi encontrado para o RS, o valor deste RS deve ser expresso por outros meios.
  2. Traduza relações sintáticas UNL em relações sintáticas ETAP-3, diretamente ou por meios lexicais.
  3. Traduza os atributos da linguagem UNL em características gramaticais do STAGE-3, diretamente ou usando meios lexicais.
  4. Converta o gráfico UNL em uma árvore de dependência.
  5. Determine a ordem das palavras na frase.

A primeira e (em parte) a segunda tarefa são resolvidas com a ajuda dos dicionários UNL - inglês e inglês combinatório. Para todas as outras tarefas, as regras escritas na linguagem formal-lógica FORET são responsáveis.

Assim, todas essas tarefas são resolvidas com a ajuda de dicionários ou com a ajuda de regras. As regras são divididas em três classes dependendo do grau de universalidade: as regras GERAL, Stencil e VOCABULÁRIO são distinguidas. As regras gerais podem ser ativadas quando qualquer oferta é processada. Os outros dois tipos de regras se aplicam somente se a sentença que está sendo processada contiver uma palavra que contenha uma referência a alguma regra (no caso de uma regra modelo) ou à própria regra (no caso de uma regra de dicionário). Essa organização de regras garante o ajuste automático do sistema: apenas as regras necessárias para processar uma determinada oferta são ativadas.

3.4. Situação atual e planos para o futuro

Uma versão experimental do módulo de tradução UNL para russo está disponível em http://proling.iitp.ru/Deco . No verão de 2000, planejamos disponibilizar o módulo para uso geral. Nossa próxima tarefa é criar um conversor interativo.

Como resulta do Esquema 3, a interface entre a UNL e as estruturas com as quais o módulo de tradução automática ETAP-3 funciona é realizada ao nível da norma inglesa. O mesmo diagrama mostra que a tradução em inglês do original UNL expressões é um subproduto natural de tal arquitetura. Para isso, basta enviar a norma inglesa para síntese. Várias experiências bem sucedidas já foram realizadas nesse sentido.

Literatura

Yu.D. Apresyan, I.M. Boguslavsky, L.L. Iomdin e etc (1992 uma ). Processador linguístico para sistemas de informação complexos. Ciência, 256 p. M.

Ju. D. Apresjan, I. M. Boguslavsky, L. L. Iomdin etai. (1992b) ETAP-2: A Linguística de um Sistema de Tradução Automática. // META, Vol. 37, Nº 1, pág. 97-112.

Igor Boguslavsky (1995). Um sistema de tradução automática bidirecional de russo para inglês (ETAP-3). // Actas da Cimeira de Tradução Automática V. Luxemburgo.

Leonid Iomdin & Oliver Streiter. (1999). Aprendendo com Corpora Paralelos: Experiências em Tradução Automática. // Diálogo"99: Linguística Computacional e suas Aplicações Workshop Internacional. Tarusa, Rússia, junho de 1999. Vol.2, pp. 79-88.

O estudo ao qual este artigo é dedicado foi realizado com apoio financeiro parcial da Fundação Russa para Pesquisa Básica (bolsa nº 99-06-80277).