Filologia Computacional. A Linguística Computacional como uma Disciplina Linguística Aplicada.

Linguística (do lat. lingua -
língua), linguística, linguística - ciência,
estudando línguas.
Esta é a ciência da natureza linguagem humana geralmente
e sobre todas as línguas do mundo como seu
representantes personalizados.
NO sentido amplo palavras, linguística
subdividida em científica e prática. Mais frequentemente
apenas por linguística se entende precisamente
linguística científica. Faz parte da semiótica
a ciência dos signos.
A linguística é praticada profissionalmente por linguistas.

Linguística e Informática.
Em vida sociedade moderna papel importante jogar automatizado
Tecnologia da Informação. Mas o desenvolvimento tecnologia da Informação o que está acontecendo
muito irregular: se nível moderno Ciência da Computação e
meios de comunicação é incrível, então no campo do processamento semântico
o sucesso da informação é muito mais modesto. Esses sucessos dependem principalmente
avanços no estudo de processos pensamento humano, processos de fala
comunicação entre as pessoas e a capacidade de simular esses processos em um computador. E esta é uma tarefa de extrema complexidade. nós estamos falando sobre a criação de promissores
tecnologia da informação, então os problemas de processamento automático de texto
informações apresentadas em linguagens naturais vêm à tona.
Isso é determinado pelo fato de que o pensamento de uma pessoa está intimamente ligado à sua linguagem. Mais
Além disso, a linguagem natural é uma ferramenta de pensamento. Ele é também
meio universal de comunicação entre as pessoas - um meio de percepção,
acumulação, armazenamento, processamento e transmissão de informações.
Problemas de uso linguagem natural em automático
O processamento da informação é a ciência da linguística computacional. Esta ciência
surgiu relativamente recentemente - na virada dos anos cinquenta e sessenta
o século passado. No início, durante sua formação, teve vários
títulos: linguística matemática, linguística computacional, engenharia
linguística. Mas no início dos anos oitenta, o nome ficou
linguística do computador.

Linguística computacionalé um campo de conhecimento relacionado à resolução de problemas
processamento automático de informações apresentadas em linguagem natural.
Central problemas científicos linguística computacional é um problema
modelar o processo de compreensão do significado dos textos (transição do texto para o
representação formalizada de seu significado) e o problema da síntese de fala (transição de
representação formalizada de significado para textos em linguagem natural). Estes problemas
surgem ao resolver uma série de problemas aplicados:
1) detecção automática e correção de erros ao inserir textos em um computador,
2) análise e síntese automáticas Discurso oral,
3) tradução automática textos de uma língua para outra,
4) comunicação com um computador em linguagem natural,
5) classificação e indexação automática de documentos de texto, sua
sumarização automática, busca de documentos em bancos de dados de texto completo.
Ao longo do último meio século no campo da linguística computacional,
importantes cientistas e resultados práticos: sistemas de máquina
tradução de textos de uma língua natural para outra, automatizada
busca de informações em textos, sistemas de análise automática e síntese da fala oral e
muitos outros. Mas também houve decepções. Por exemplo, o problema da tradução automática
textos de uma língua para outra acabaram sendo muito mais difíceis do que se imaginava
os pioneiros da tradução automática e seus sucessores. O mesmo pode ser dito sobre
busca automatizada de informações em textos e sobre a tarefa de analisar e sintetizar
Fala. Cientistas e engenheiros aparentemente ainda terão que trabalhar duro para
alcançar os resultados desejados.

Processamento de linguagem natural (eng. processamento de linguagem natural;
morfológico, análises semânticas texto). Isso também inclui:
Linguística de corpus, criação e uso de corpora de texto eletrônico.
Criação dicionários eletrônicos, tesauros, ontologias. Por exemplo, Lingvo. Dicionários
usado, por exemplo, para tradução automática, verificação ortográfica.
Tradução automática de textos. Popular entre os tradutores russos
é Prom. Conhecido entre os gratuitos tradutor Google traduzir
Extração automática de fatos do texto (extração de informações) (fato em inglês
extração, mineração de texto)
Auto-abstração (resumo automático de texto em inglês). Este recurso está ativado
por exemplo, no Microsoft Word.
Construindo sistemas de gestão do conhecimento. Veja Sistemas Especialistas
Criação de sistemas de perguntas e respostas (sistemas de respostas a perguntas em inglês).
Reconhecimento óptico de caracteres (OCR). Por exemplo, FineReader
Reconhecimento Automático de Fala (ASR). Existem softwares pagos e gratuitos
Síntese automática de fala

Timofeeva Maria Kirílovna
Médico ciências filológicas, Mais velho investigador laboratório de sistemas lógicos do Instituto de Matemática. S.L. Soboleva SB RAS, Chefe do Departamento de Linguística Fundamental e Aplicada, Instituto de Humanidades da Universidade Estadual de Novosibirsk. Graduado pelo Departamento de Linguística Matemática Faculdade de ciências humanas Novosibirsk Universidade Estadual.
Interesses de investigação: fundamentos filosóficos e metodológicos da linguística, problemas lógicos semântica e pragmática da linguagem natural, funcional modelos matemáticos linguagem natural, linguagens naturais e formais.

Stukachev Alexey Ilitch
Candidato a Ciências Físicas e Matemáticas, Professor Associado, Pesquisador Sênior do Instituto de Matemática. S.L. Soboleva SB RAS, Professor Associado, Departamento de Matemática Discreta e Informática, Faculdade de Mecânica e Matemática, NSU, Professor Associado, Departamento de Linguística Fundamental e Aplicada, Institute for the Humanities, NSU
Esfera de interesses científicos: lógica matemática, teoria da computabilidade (computabilidade generalizada, computabilidade em conjuntos admissíveis, HF-computabilidade), teoria do modelo ( modelos construtivos, representações efetivas de sistemas, graus de representabilidade), análise computável. Lingüística matemática Palavras-chave: semântica formal, semântica de Montagu, semântica distributiva.

Barakhnin Vladimir Borisovich
Pesquisador Líder do Laboratório recursos de informação Instituto tecnologias de computação SB RAS, professor do departamento modelagem matemática Faculdade de Mecânica e Matemática, NSU, Professor do Departamento de Sistemas Informáticos e informática geral Faculdade de Tecnologia da Informação, Universidade Estadual de Novosibirsk.
Interesses de pesquisa: construção de modelos de sistemas de informação, criação de algoritmos para processamento de documentos de texto semiestruturados, automação análise complexa textos poéticos, questões metodológicas da informática.

Bruxas Elena Pavlovna
Aluno de pós-graduação do Instituto de Sistemas Informáticos em homenagem. A.P. Ershova SB RAS, Assistente do Departamento de Linguística Fundamental e Aplicada do Instituto de Humanidades da Universidade Estadual de Novosibirsk, linguista computacional da empresa "OnPositive".
Interesses de pesquisa: processamento de linguagem natural, aprendizado de máquina, inteligência artificial.

Pavlovsky Evgeny Nikolaevich
Candidato a Ciências Físicas e Matemáticas, membro do Conselho de Jovens Cientistas e Especialistas do Governo da Região de Novosibirsk, membro do conselho de especialistas do Technopark de Novosibirsk Akademgorodok, presidente do comitê organizador do Simpósio Siberiano de Ciência de Dados e Congresso de Engenharia.
Objetivo profissional: sistematização de abordagens para formalização de requisitos de negócios em projetos de big data.

Palchunov Dmitry Evgenievich
Pesquisador líder do Instituto de Matemática. S. L. Soboleva SB RAS, Chefe do Departamento de Informática Geral, NSU, Chefe do Departamento "Instituto de Matemática Discreta e Informática", Faculdade de Mecânica e Matemática, NSU.
Interesses de investigação: Obtêm-se resultados fundamentais no estudo de álgebras booleanas com ideais distintos (I-álgebras).

Sviridenko Dmitry Ivanovich
Funcionário do Instituto de Matemática do Ramo Siberiano da Academia Russa de Ciências e da Universidade Estadual de Novosibirsk, empresário, organizador e co-proprietário de empresas de alta tecnologia que operam no campo da informação, comunicação e tecnologias digitais. Participa de pesquisas sobre modelagem semântica financiadas por uma bolsa da Russian Science Foundation.
Interesses de investigação: filosofia, metodologia, lógica matemática aplicada. O autor do conceito e teoria matemática modelagem semântica, apresentada em conjunto com acadêmicos da Academia Russa de Ciências S.S. Goncharov e Yu.L. Ershov nos anos 80 do século passado. Atualmente, ele continua a desenvolver ativamente a metodologia e a teoria matemática deste conceito, e também está engajado em aplicações deste conceito para várias áreas. Trabalha na criação de uma metodologia, teoria matemática e linguagem semântica de transações inteligentes e contratos, aplicando as ideias de modelagem semântica em relação ao TRIZ e outras áreas.

Savostyanov Alexander Nikolaevich
Pesquisador Líder do Laboratório de Psicofisiologia Diferencial do Instituto de Pesquisas em Fisiologia e medicina fundamental, Chefe do Laboratório de Genética Psicológica do Instituto de Citologia e Genética do Ramo Siberiano da Academia Russa de Ciências, Professor do Departamento de Informática Geral da Faculdade de Tecnologia da Informação da Universidade Estadual de Novosibirsk, Professor do Departamento de e Lingüística Aplicada instituto humanitário NSU.
Interesses científicos Palavras-chave: neurofisiologia, psicogenética, neurolinguística, métodos de processamento computacional de sinais biológicos. A pesquisa visa identificar fatores de risco para o surgimento e desenvolvimento de patologias afetivas em humanos, dependendo das condições climáticas atividade vital. Como parte da pesquisa, são realizadas expedições a várias regiões da Rússia ( região de Novosibirsk, Tyva, Yakutia, República de Altai) e Países vizinhos(Mongólia, China) para recolher material biológico e coleções de registros de EEG em vários condições experimentais. O objetivo da pesquisa é criar sistemas de diagnóstico que permitam avaliar o risco de violação da regulação emocional do comportamento humano em condições de estresse aumentado.

LINGUÍSTICA COMPUTADORIZADA (papel vegetal da linguística computacional inglesa), uma das áreas da linguística aplicada, na qual se estuda a língua e modela o funcionamento da língua em determinadas condições, situações e áreas problemáticas desenvolvido e usado programas de computador, tecnologias de computador para organizar e processar dados. Por outro lado, esta é a área de aplicação de modelos de linguagem computacional em linguística e disciplinas afins. Como um especial direção científica A linguística computacional tomou forma Estudos europeus na década de 1960. Porque o adjetivo inglês computacional também pode ser traduzido como “computacional”, o termo “linguística computacional” também é encontrado na literatura, porém, em Ciência Doméstica ele fica mais significado estreito aproximando-se do conceito de "linguística quantitativa".

Muitas vezes, a linguística computacional refere-se ao termo "linguística quantitativa", que caracteriza uma direção interdisciplinar na pesquisa aplicada, onde métodos quantitativos ou estatísticos de análise são usados ​​como a principal ferramenta para o estudo da linguagem e da fala. Às vezes, a linguística quantitativa (ou quantitativa) se opõe à linguística combinatória. Neste último, o papel dominante é ocupado por um aparato matemático "não quantitativo" - teoria dos conjuntos, lógica matemática, teoria do algoritmo, etc. ponto teórico ver uso Métodos estatísticos em linguística permite complementar modelo estrutural linguagem com um componente probabilístico, ou seja, para criar um modelo teórico-probabilístico estrutural que tenha um potencial explicativo significativo. NO area de aplicação A linguística quantitativa é representada, antes de tudo, pelo uso de fragmentos desse modelo utilizados para monitoramento linguístico do funcionamento da língua, decodificação do texto codificado, autorização/atribuição do texto, etc.

O termo "linguística computacional" e os problemas desta área são frequentemente associados à modelação da comunicação e, sobretudo - à disponibilização da interacção humana com um computador numa linguagem natural natural ou limitada (para isso, sistemas especiais processamento de linguagem natural), bem como com a teoria e prática de sistemas de recuperação de informação (IPS). Garantir a comunicação entre uma pessoa e um computador em linguagem natural às vezes é denotado pelo termo "processamento de linguagem natural" (tradução de da lingua inglesa termo Processamento de Linguagem Natural). Essa área da linguística computacional surgiu no final da década de 1960 no exterior e se desenvolveu dentro da disciplina científica e tecnológica chamada inteligência artificial (obras de R. Schenk, M. Lebovits, T. Winograd, etc.). Em seu significado, a frase "processamento de linguagem natural" deve abranger todas as áreas em que os computadores são usados ​​para processar dados de linguagem. Na prática, no entanto, uma compreensão mais restrita do termo tornou-se fixa - o desenvolvimento de métodos, tecnologias e sistemas específicos que garantem a comunicação entre uma pessoa e um computador em linguagem natural ou limitada.

A linguística computacional, até certo ponto, pode incluir trabalhos no campo da criação de sistemas de hipertexto, considerados como maneira especial organização do texto e até mesmo quão fundamentalmente o novo tipo texto, oposto em muitas de suas propriedades ao texto comum formado na tradição de impressão de Gutenberg (ver Gutenberg).

A linguística computacional também inclui tradução automática.

No âmbito da linguística computacional, surgiu uma direção relativamente nova, que vem se desenvolvendo ativamente desde os anos 1980 e 90 - a linguística de corpus, onde princípios gerais construção de corpora de dados linguísticos (em particular, corpora de texto) usando tecnologia de computador. Corpora de texto são coleções de textos especialmente selecionados de livros, revistas, jornais, etc., transferidos para mídia de máquina e destinados ao processamento automático. Um dos primeiros corpora de textos foi criado para o inglês americano na Brown University (o chamado Brown Corpus) em 1962-63 sob a direção de W. Francis. Na Rússia, desde o início dos anos 2000, o Instituto da Língua Russa com o nome de V. V. Vinogradov da Academia Russa de Ciências vem desenvolvendo Corpo Nacional da língua russa, consistindo de uma amostra representativa de textos em língua russa com um volume de cerca de 100 milhões de usos de palavras. Além da própria construção de corpora de dados, a linguística de corpus está envolvida na criação de ferramentas de computador (programas de computador) destinadas a extrair várias informações de corpora de texto. Do ponto de vista do usuário, requisitos de representatividade (representatividade), completude e economia são impostos aos corpora de texto.

A linguística computacional está se desenvolvendo ativamente na Rússia e no exterior. O fluxo de publicações nesta área é muito alto. Exceto coleções temáticas, nos Estados Unidos desde 1984 a revista Computational Linguistics é publicada trimestralmente. Ótima organização e trabalho científicoé conduzido pela Association for Computational Linguistics, que possui estruturas regionais em todo o mundo (em particular, a filial europeia). A cada dois anos há conferências internacionais COLINT (em 2008 a conferência foi realizada em Manchester). As principais direções da linguística computacional também são discutidas na conferência internacional anual "Diálogo", organizada pelo Instituto Russo de Pesquisa em Inteligência Artificial, Faculdade de Filologia Universidade Estadual de Moscou, Yandex e várias outras organizações. As questões relevantes também são amplamente apresentadas em conferências internacionais em inteligência artificial de diferentes níveis.

Lit.: Zvegintsev V. A. Lingüística teórica e aplicada. M., 1968; Piotrovsky R. G., Bektaev K. B., Piotrovskaya A. A. Linguística matemática. M., 1977; Gorodetsky B. Yu. Problemas reais linguística aplicada // Novo em linguística estrangeira. M., 1983. Edição. 12; Kibrik A.E. Linguística Aplicada // Kibrik A.E. Ensaios sobre questões gerais e aplicadas de linguística. M., 1992; Kennedy G. Introdução à linguística de corpus. L., 1998; Bolshakov I.A., Gelbukh A. Linguística computacional: modelos, recursos, aplicações. Mekh., 2004; Corpus Nacional da Língua Russa: 2003-2005. M., 2005; Baranov A. N. Introdução à linguística aplicada. 3ª edição. M., 2007; Linguística Computacional e Tecnologias Inteligentes. M., 2008. Edição. 7.

Introdução

O que é Linguística Computacional?

LINGUÍSTICA DA COMPUTAÇÃO , uma direção em linguística aplicada, focada no uso de ferramentas computacionais - programas, tecnologias computacionais para organizar e processar dados - para modelar o funcionamento de uma língua em determinadas condições, situações, áreas problemáticas, etc., bem como todo o escopo de modelos de linguagem de computador em linguística e disciplinas afins. Na verdade, apenas em último caso e falando sobre linguística aplicada em sentido estrito, pois a modelagem computacional de uma linguagem também pode ser considerada como um campo de aplicação da ciência da computação e da teoria da programação para resolver problemas da ciência da linguagem. Na prática, no entanto, quase tudo relacionado ao uso de computadores em linguística é referido como linguística computacional.

Como uma direção científica especial, a linguística computacional tomou forma na década de 1960. O termo russo "linguística computacional" é um papel vegetal da linguística computacional inglesa. Como o adjetivo computacional em russo também pode ser traduzido como “computacional”, o termo “linguística computacional” também é encontrado na literatura, mas na ciência doméstica adquire um significado mais restrito, aproximando-se do conceito de “linguística quantitativa”. O fluxo de publicações nesta área é muito alto. Além das coleções temáticas, a revista Computational Linguistics é publicada trimestralmente nos Estados Unidos. Um grande trabalho organizacional e científico é realizado pela Association for Computational Linguistics, que possui estruturas regionais (em particular, a filial européia). A cada dois anos há conferências internacionais de linguística computacional - COLING. Questões relevantes geralmente são amplamente apresentadas também em várias conferências sobre inteligência artificial.

Tarefas

Linguística computacional assume os problemas linguísticos reais da modelagem computacional da atividade linguística. Suas tarefas são construir modelos linguísticos mais precisos e completos e algoritmos mais avançados para análise e síntese.

As principais direções são:

1) Interação humano-computador: controle - linguagens de programação, transferência de informações - interface.

2) Trabalhar com textos: indexação, análise e classificação, edição automática (correção de erros), detecção de conhecimento, tradução automática.

História

Uma geração simples de um subconjunto da língua inglesa para acesso a bases de dados foi fornecida por um dos primeiros sistemas americanos LIFER (Language Interface Facility wich Elipsis and Recursion), criado na década de 70. Em seguida, outros sistemas mais flexíveis surgiram no mercado de computadores, fornecendo uma interface de linguagem natural limitada com um computador.

Na década de 1980, várias empresas foram formadas nos Estados Unidos engajadas no desenvolvimento e venda de interfaces de linguagem natural com bancos de dados e sistemas especialistas. Em 1985 A Semantec Corporation apresentou um pacote de software de perguntas e respostas, o Carnegie Group ofereceu um pacote semelhante, LanguageCraft.

Está em andamento um trabalho ativo para criar sistemas de tradução automática. O sistema de tradução automática SYSTRAN, desenvolvido sob a direção de D. Tom, encomendado pela Força Aérea dos Estados Unidos, tornou-se difundido. Durante 1974-1975. o sistema foi usado pela NASA Aerospace Association para traduzir documentos para o projeto Apollo-Soyuz. Hoje em dia, traduz de várias línguas cerca de 100.000 páginas por ano.

Na Europa, o trabalho na criação de sistemas de tradução por computador foi estimulado pela formação da Rede Europeia de Informação (EURONET DIANA). Em 1982, a Comunidade Económica Europeia anunciou a criação do programa europeu EUROTRA, cujo objectivo é desenvolver um sistema tradução de computador para todos línguas europeias. Inicialmente, o projeto foi estimado em US$ 12 milhões; em 1987, especialistas determinaram o custo total deste projeto em mais de US$ 160 milhões.

No Japão, a pesquisa em linguística computacional está centrada em um programa de computador nacional de quinta geração lançado em 1981.

Existem vários projetos militares para criar interfaces homem-máquina em linguagem natural. Nos Estados Unidos, eles são realizados principalmente como parte da Iniciativa de Computadores Estratégicos, um programa de dez anos adotado pelo Departamento de Defesa em 1983. Seu objetivo é criar uma nova geração de armas e sistemas militares "inteligentes" para para garantir a superioridade tecnológica dos Estados Unidos a longo prazo.

Naturalmente, os especialistas em inteligência artificial, bem versados ​​em computadores e linguagens de programação, se empenharam energicamente em resolver o problema de entender a linguagem com seus próprios métodos. Houve uma busca por algoritmos de linguagem natural. Programas complexos de compreensão de linguagem foram criados para áreas especiais muito restritas, programas parciais de tradução automática foram implementados e vários outros. Mas não houve progresso decisivo na solução do problema de compreensão da língua. A linguagem e o homem estão tão ligados que os cientistas tiveram que lidar com o problema de entender o mundo pelo homem. E este é o reino da filosofia.

Conceitos básicos de linguística

O termo "linguística computacional" geralmente se refere a uma ampla área de uso de ferramentas de computador - programas, tecnologias computacionais para organizar e processar dados - para modelar o funcionamento de uma linguagem em determinadas condições, situações, áreas problemáticas, bem como o escopo de modelos de linguagem de computador, apenas em linguística, mas também em disciplinas relacionadas. Na verdade, somente neste último caso estamos falando de linguística aplicada em sentido estrito, pois a modelagem de linguagem computacional também pode ser considerada como um campo de aplicação da teoria da programação (ciência da computação) no campo da linguística. No entanto, a prática geral é tal que o escopo da linguística computacional abrange quase tudo relacionado ao uso de computadores em linguística: "O termo" linguística computacional "define uma orientação geral para o uso de computadores para resolver uma variedade de problemas científicos e tarefas práticas associados à língua, sem limitar as formas de resolver esses problemas.

Aspecto institucional da linguística computacional. Como direção científica especial, a linguística computacional tomou forma nos anos 60. O fluxo de publicações nesta área é muito alto. Além das coleções temáticas, a revista Computational Linguistics é publicada trimestralmente nos EUA. Um grande trabalho organizacional e científico é realizado pela Association for Computational Linguistics, que possui estruturas regionais em todo o mundo (em particular, a filial europeia). A cada dois anos há conferências internacionais sobre linguística computacional - KOLING. Questões relevantes também são amplamente representadas em conferências internacionais sobre inteligência artificial em vários níveis.

Kit de ferramentas cognitivas de linguística computacional

Lingüística Computacional como disciplina aplicada se destaca principalmente pelo instrumento - ou seja, pelo uso instalações de computador processamento de dados de linguagem. Como os programas de computador que modelam certos aspectos do funcionamento de uma linguagem podem usar uma variedade de ferramentas de programação, parece que não há necessidade de falar sobre uma metalinguagem comum. No entanto, não é. Existem princípios gerais simulação de computador pensamento, que de uma forma ou de outra são realizados em qualquer modelo de computador. Essa linguagem é baseada na teoria do conhecimento desenvolvida em inteligência artificial e formando um importante ramo da ciência cognitiva.

A tese principal da teoria do conhecimento afirma que o pensamento é um processo de processamento e geração de conhecimento. "Conhecimento" ou "conhecimento" é considerado uma categoria indefinida. O "processador" que processa o conhecimento é sistema cognitivo pessoa. Na epistemologia e na ciência cognitiva, distinguem-se dois tipos principais de conhecimento - declarativo ("saber o quê") e procedimental ("saber como"2)). O conhecimento declarativo geralmente é apresentado como um conjunto de proposições, declarações sobre algo. Um exemplo típico conhecimento declarativo pode ser considerado interpretações de palavras em dicionários explicativos. Por exemplo, um copo] - "um pequeno recipiente arredondado, geralmente com uma alça, feito de porcelana, faiança, etc.". O conhecimento declarativo se presta ao procedimento de verificação em termos de "verdadeiro-falso". O conhecimento procedimental é apresentado como uma sequência (lista) de operações, ações a serem executadas. Isso é algum instrução geral sobre as ações em uma determinada situação. Um exemplo típico de conhecimento processual são as instruções para o uso de eletrodomésticos.

Ao contrário do conhecimento declarativo, o conhecimento procedural não pode ser verificado como verdadeiro ou falso. Eles podem ser avaliados apenas pelo sucesso ou falha do algoritmo.

A maioria dos conceitos do conjunto de ferramentas cognitivas da linguística computacional são homônimos: eles designam simultaneamente algumas entidades reais do sistema cognitivo humano e formas de representar essas entidades em algumas metalinguagens. Em outras palavras, os elementos da metalinguagem têm um aspecto ontológico e instrumental. Ontologicamente, a separação entre conhecimento declarativo e procedimental corresponde a tipos diferentes conhecimento do sistema cognitivo humano. Assim, o conhecimento sobre assuntos específicos, os objetos da realidade são predominantemente declarativos, e as habilidades funcionais de uma pessoa para andar, correr, dirigir um carro são realizadas no sistema cognitivo como conhecimento processual. Instrumentalmente, o conhecimento (tanto ontologicamente procedimental quanto declarativo) pode ser representado como um conjunto de descrições, descrições e como um algoritmo, uma instrução. Em outras palavras, o conhecimento ontologicamente declarativo sobre o objeto da realidade “mesa” pode ser representado proceduralmente como um conjunto de instruções, algoritmos para sua criação, montagem (= aspecto criativo do conhecimento procedural) ou como algoritmo para seu uso típico (= aspecto funcional conhecimento processual). No primeiro caso, este pode ser um guia para um carpinteiro iniciante e, no segundo, uma descrição das possibilidades de uma mesa de escritório. O inverso também é verdadeiro: o conhecimento ontologicamente procedimental pode ser representado declarativamente.

Requer uma discussão separada se qualquer conhecimento ontologicamente declarativo pode ser representado como procedimental e qualquer ontologicamente procedimental - como declarativo. Os pesquisadores concordam que qualquer conhecimento declarativo pode, em princípio, ser representado procedimentalmente, embora isso possa se tornar muito antieconômico para um sistema cognitivo. O inverso dificilmente é verdade. O fato é que o conhecimento declarativo é muito mais explícito, é mais fácil para uma pessoa entender do que o conhecimento procedimental. Em contraste com o conhecimento declarativo, o conhecimento procedimental é predominantemente implícito. Então, habilidade de linguagem, sendo conhecimento processual, está oculto de uma pessoa, não é realizado por ela. Uma tentativa de explicar os mecanismos de funcionamento da linguagem leva à disfunção. Especialistas no campo da semântica lexical sabem, por exemplo, que a introspecção semântica de longo prazo necessária para estudar o plano de conteúdo da palavra leva o pesquisador a perder parcialmente a capacidade de distinguir entre o correto e o correto. usos indevidos palavra analisada. Outros exemplos podem ser citados. Sabe-se que, do ponto de vista da mecânica, o corpo humano é Sistema complexo dois pêndulos em interação.

Na teoria do conhecimento, o conhecimento é estudado e representado usando várias estruturas conhecimento - quadros, cenários, planos. Segundo M. Minsky, "um quadro é uma estrutura de dados projetada para representar uma situação estereotipada" [Minsky 1978, p.254]. Mais detalhadamente, podemos dizer que o frame é uma estrutura conceitual para a representação declarativa do conhecimento sobre uma situação unificada tematicamente tipificada contendo slots interligados por certas relações semânticas. Para fins de ilustração, um quadro é frequentemente representado como uma tabela, cujas linhas formam slots. Cada slot tem seu próprio nome e conteúdo (consulte a Tabela 1).

tabela 1

Fragmento do quadro "tabela" em uma visualização de tabela

Dependendo do tarefa específica a estruturação de quadros pode ser significativamente mais complexa; um quadro pode incluir subquadros aninhados e referências a outros quadros.

Em vez de uma tabela, uma forma de representação de predicado é frequentemente usada. Nesse caso, o quadro está na forma de um predicado ou de uma função com argumentos. Existem outras maneiras de representar um quadro. Por exemplo, pode ser representado como uma tupla o seguinte tipo: ( (nome do quadro) (nome do slot)) (valor do slot,),..., (nome do slot n) (valor do slot n) ).

Normalmente, os frames nas linguagens de representação do conhecimento têm essa forma.

Como outras categorias cognitivas da linguística computacional, o conceito de frame é homônimo. Ontologicamente, é uma parte do sistema cognitivo humano e, nesse sentido, o quadro pode ser comparado a conceitos como gestalt, protótipo, estereótipo, esquema. Na psicologia cognitiva, essas categorias são consideradas precisamente do ponto de vista ontológico. Assim, D. Norman distingue duas formas principais de existência e organização do conhecimento no sistema cognitivo humano - redes e esquemas semânticos. "Esquemas", escreve ele, "são pacotes organizados de conhecimento reunidos para representar unidades de conhecimento individuais e autocontidas. Meu esquema para Sam pode conter informações que descrevam sua características físicas, sua atividade e traços de personalidade. Este esquema se correlaciona com outros esquemas que descrevem outros aspectos dele" [Norman 1998, p.359]. Se tomarmos o lado instrumental da categoria de quadro, então esta é uma estrutura para a representação declarativa do conhecimento. Nos sistemas de IA existentes, quadros podem estruturas complexas conhecimento; os sistemas de quadros permitem hierarquia - um quadro pode fazer parte de outro quadro.

Em termos de conteúdo, o conceito de frame está muito próximo da categoria de interpretação. De fato, um slot é um análogo de valência, o preenchimento de um slot é um análogo de um actante. A principal diferença entre eles é que a interpretação contém apenas informações linguisticamente relevantes sobre o plano do conteúdo da palavra, e o frame, em primeiro lugar, não está necessariamente vinculado à palavra e, em segundo lugar, inclui todas as informações relevantes para um determinado problema situação, inclusive incluindo extralinguística (conhecimento do mundo) 3).

Um cenário é uma estrutura conceitual para a representação processual do conhecimento sobre uma situação ou comportamento estereotipado. Elementos de script são as etapas de um algoritmo ou instrução. As pessoas costumam falar sobre "cenário de restaurante", "cenário de compra" e assim por diante.

O quadro também foi originalmente usado para apresentação processual (cf. o termo "quadro processual"), mas o termo "cenário" é agora mais comumente usado nesse sentido. Um cenário pode ser representado não apenas como um algoritmo, mas também como uma rede, cujos vértices correspondem a determinadas situações e os arcos correspondem a conexões entre situações. Junto com o conceito de script, alguns pesquisadores utilizam a categoria de script para modelagem computacional de inteligência. De acordo com R. Schenk, um script é uma sequência bem conhecida e geralmente aceita causa. Por exemplo, entender o diálogo

Na rua derrama como um balde.

Você ainda tem que ir à loja: não há nada na casa - ontem os convidados varreram tudo.

é baseado em links semânticos não explícitos como "se está chovendo, é indesejável sair, porque você pode ficar doente." Essas conexões formam um roteiro, que é usado por falantes nativos para entender o comportamento verbal e não verbal de cada um.

Como resultado da aplicação do cenário a uma situação-problema específica, um plano). O blueprint é usado para representar procedimentalmente o conhecimento sobre ações possíveis levando à conquista propósito específico. Um plano relaciona uma meta a uma sequência de ações.

NO caso Geral o plano inclui uma sequência de procedimentos que transferem o estado inicial do sistema para o estado final e levam à realização de um subobjetivo e meta específicos. Nos sistemas de IA, o plano surge como resultado da atividade de planejamento ou planejamento do módulo correspondente - o módulo de planejamento. O processo de planejamento pode ser baseado na adaptação de dados de um ou mais cenários, ativados por procedimentos de teste, para solucionar uma situação-problema. A execução do plano é realizada por um módulo executivo que controla os procedimentos cognitivos e ações físicas sistemas. No caso elementar, o plano em sistema intelectualé uma sequência simples de operações; em versões mais complexas, o plano está associado a um assunto específico, seus recursos, capacidades, objetivos, informação detalhada sobre uma situação problemática, etc. A emergência do plano ocorre no processo de comunicação entre o modelo de mundo, parte do qual é formado por cenários, o módulo de planejamento e o módulo executivo.

Ao contrário de um roteiro, um plano é sobre situação específica, um performer específico e persegue a realização de um objetivo específico. A escolha do plano é regida pelos recursos do contratante. Viabilidade do plano - condição necessária suas gerações no sistema cognitivo, e a característica de satisfatibilidade é inaplicável ao cenário.

Outro conceito importante- modelo do mundo. O modelo do mundo é geralmente entendido como um conjunto de conhecimentos sobre o mundo organizado de uma determinada maneira, inerente a um sistema cognitivo ou seu modelo computacional. Em mais alguns visão geral o modelo do mundo é falado como uma parte do sistema cognitivo que armazena o conhecimento sobre a estrutura do mundo, seus padrões, etc. Em outro sentido, o modelo do mundo está associado aos resultados da compreensão do texto ou, mais amplo, o discurso. No processo de compreensão do discurso, constrói-se seu modelo mental, resultado da interação entre o plano do conteúdo do texto e o conhecimento sobre o mundo inerente a esse sujeito [Johnson-Laird 1988, p. 237 et. seg.]. O primeiro e o segundo entendimentos são frequentemente combinados. Isso é típico de pesquisadores linguísticos que trabalham com linguística cognitiva e ciência cognitiva.

Intimamente relacionado à categoria de quadro está o conceito de cena. A categoria cena é usada principalmente na literatura como designação da estrutura conceitual para a representação declarativa de atualizados em ato de fala e dedicado linguagem significa(tokens, construções sintáticas, categorias gramaticais etc) situações e suas partes5). Estando associada a formas linguísticas, a cena é frequentemente atualizada certa palavra ou expressão. Em gramáticas de enredo (veja abaixo), uma cena aparece como parte de um episódio ou narrativa. Exemplos típicos cenas - um conjunto de cubos com os quais o sistema de IA trabalha, a cena na história e os participantes da ação, etc. Na inteligência artificial, as cenas são usadas em sistemas de reconhecimento de imagem, bem como em programas orientados à pesquisa (análise, descrição) situações-problema. O conceito de cena tornou-se difundido na linguística teórica, bem como na lógica, em particular na semântica situacional, em que o significado item lexical conecta diretamente com a cena.