Codificação e implementação da informação genética. Código genético como forma de registro de informações hereditárias

Nucleotídeos de DNA e RNA
  1. Purinas: adenina, guanina
  2. Pirimidinas: citosina, timina (uracil)

códon- um tripleto de nucleotídeos que codifica um aminoácido específico.

aba. 1. Aminoácidos comumente encontrados em proteínas
Nome Abreviação
1. AlaninaAla
2. ArgininaArg
3. AsparaginaAsn
4. Ácido aspárticoáspide
5. CisteínaCys
6. Ácido glutâmicoGlu
7. GlutaminaGln
8. Glicinagly
9. HistidinaDele
10. Isoleucinaile
11. LeucinaLeu
12. LisinaLys
13. MetioninaConheceu
14. FenilalaninaPhe
15. ProlinaPró
16. SérieSer
17. TreoninaThr
18. Triptofanotrp
19. TirosinaTyr
20. ValinaVal

O código genético, também chamado de código de aminoácidos, é um sistema para registrar informações sobre a sequência de aminoácidos em uma proteína usando a sequência de resíduos de nucleotídeos no DNA que contém uma das 4 bases nitrogenadas: adenina (A), guanina (G), citosina (C) e timina (T). No entanto, como a hélice de DNA de fita dupla não está diretamente envolvida na síntese da proteína que é codificada por uma dessas fitas (ou seja, RNA), o código é escrito na linguagem do RNA, na qual o uracil (U) é incluído em vez de timina. Pela mesma razão, costuma-se dizer que um código é uma sequência de nucleotídeos, não pares de bases.

O código genético é representado por certas palavras de código - códons.

A primeira palavra de código foi decifrada por Nirenberg e Mattei em 1961. Eles obtiveram um extrato de E. coli contendo ribossomos e outros fatores necessários para a síntese de proteínas. O resultado foi um sistema livre de células para a síntese de proteínas, que poderia montar uma proteína a partir de aminoácidos se o mRNA necessário fosse adicionado ao meio. Ao adicionar RNA sintético, consistindo apenas de uracilos, ao meio, eles descobriram que uma proteína foi formada consistindo apenas de fenilalanina (polifenilalanina). Assim, verificou-se que o tripleto de nucleotídeos UUU (códon) corresponde à fenilalanina. Nos próximos 5-6 anos, todos os códons do código genético foram determinados.

O código genético é uma espécie de dicionário que traduz um texto escrito com quatro nucleotídeos em um texto protéico escrito com 20 aminoácidos. O resto dos aminoácidos encontrados na proteína são modificações de um dos 20 aminoácidos.

Propriedades do código genético

O código genético tem as seguintes propriedades.

  1. Triplicidade Cada aminoácido corresponde a um triplo de nucleotídeos. É fácil calcular que existem 4 3 = 64 códons. Destes, 61 são semânticos e 3 são sem sentido (terminação, códons de terminação).
  2. Continuidade(não há caracteres de separação entre nucleotídeos) - ausência de sinais de pontuação intragênicos;

    Dentro de um gene, cada nucleotídeo é parte de um códon significativo. Em 1961 Seymour Benzer e Francis Crick provaram experimentalmente o código tripleto e sua continuidade (compacidade) [exposição]

    A essência do experimento: mutação "+" - a inserção de um nucleotídeo. Mutação "-" - perda de um nucleotídeo.

    Uma única mutação ("+" ou "-") no início de um gene ou uma mutação dupla ("+" ou "-") estraga todo o gene.

    Uma mutação tripla ("+" ou "-") no início de um gene estraga apenas parte do gene.

    Uma mutação quádrupla "+" ou "-" novamente estraga todo o gene.

    O experimento foi realizado em dois genes de fagos adjacentes e mostrou que

    1. o código é tripleto e não há sinais de pontuação dentro do gene
    2. há sinais de pontuação entre os genes
  3. Presença de sinais de pontuação intergênicos- a presença entre os tripletos de códons de iniciação (começam a biossíntese de proteínas), códons - terminadores (indicam o fim da biossíntese de proteínas);

    Convencionalmente, o códon AUG também pertence aos sinais de pontuação - o primeiro após a sequência líder. Desempenha a função de uma letra maiúscula. Nesta posição, codifica a formilmetionina (em procariontes).

    No final de cada gene que codifica um polipeptídeo, há pelo menos um dos 3 códons de terminação, ou sinais de parada: UAA, UAG, UGA. Eles encerram a transmissão.

  4. Colinearidade- correspondência da sequência linear de códons de mRNA e aminoácidos na proteína.
  5. Especificidade- cada aminoácido corresponde apenas a determinados códons que não podem ser usados ​​para outro aminoácido.
  6. Unidirecional- os códons são lidos em uma direção - do primeiro nucleotídeo para o próximo
  7. Degeneração ou redundância, - vários tripletos podem codificar um aminoácido (aminoácidos - 20, possíveis tripletos - 64, 61 deles são semânticos, ou seja, em média, cada aminoácido corresponde a cerca de 3 códons); a exceção é a metionina (Met) e o triptofano (Trp).

    A razão para a degeneração do código é que a principal carga semântica é transportada pelos dois primeiros nucleotídeos do tripleto, e o terceiro não é tão importante. Daqui regra de degeneração de código : se dois códons têm dois primeiros nucleotídeos idênticos e seus terceiros nucleotídeos pertencem à mesma classe (purina ou pirimidina), então eles codificam o mesmo aminoácido.

    No entanto, existem duas exceções a essa regra ideal. Estes são o códon AUA, que deve corresponder não à isoleucina, mas à metionina, e o códon UGA, que é o terminador, enquanto deve corresponder ao triptofano. A degenerescência do código obviamente tem um valor adaptativo.

  8. Versatilidade- todas as propriedades do código genético listadas acima são características de todos os organismos vivos.
    códon Código universal Códigos mitocondriais
    Vertebrados Invertebrados Fermento Plantas
    UGAPAREtrptrptrpPARE
    AUAileConheceuConheceuConheceuile
    CUALeuLeuLeuThrLeu
    AGAArgPARESerArgArg
    AGGArgPARESerArgArg

    Recentemente, o princípio da universalidade do código foi abalado em conexão com a descoberta por Berell em 1979 do código ideal das mitocôndrias humanas, no qual a regra de degeneração do código é satisfeita. No código mitocondrial, o códon UGA corresponde ao triptofano e o AUA à metionina, conforme exigido pela regra de degenerescência do código.

    Talvez, no início da evolução, todos os organismos mais simples tivessem o mesmo código das mitocôndrias, e depois sofreram pequenos desvios.

  9. não sobreposto- cada um dos trigêmeos do texto genético é independente um do outro, um nucleotídeo faz parte de apenas um trigêmeo; Na fig. mostra a diferença entre código sobreposto e não sobreposto.

    Em 1976 O DNA do fago φX174 foi sequenciado. Possui um DNA circular de fita simples de 5375 nucleotídeos. O fago era conhecido por codificar 9 proteínas. Para 6 deles, foram identificados genes localizados um após o outro.

    Descobriu-se que há uma sobreposição. O gene E está completamente dentro do gene D. Seu códon de início aparece como resultado de um deslocamento de um nucleotídeo na leitura. O gene J começa onde termina o gene D. O códon de início do gene J se sobrepõe ao códon de parada do gene D por um deslocamento de dois nucleotídeos. O design é chamado de "mudança de quadro de leitura" por um número de nucleotídeos que não é um múltiplo de três. Até o momento, a sobreposição foi mostrada apenas para alguns fagos.

  10. Imunidade a ruídos- a razão entre o número de substituições conservativas e o número de substituições de radicais.

    Mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas de conservadoras. Mutações de substituições de nucleotídeos que levam a uma mudança na classe do aminoácido codificado são chamadas de radicais.

    Como o mesmo aminoácido pode ser codificado por trigêmeos diferentes, algumas substituições em trigêmeos não levam a uma mudança no aminoácido codificado (por exemplo, UUU -> UUC deixa fenilalanina). Algumas substituições alteram o aminoácido para outro da mesma classe (não polar, polar, básico, ácido), outras substituições também alteram a classe do aminoácido.

    Em cada tripleto, podem ser feitas 9 substituições simples, i.e. você pode escolher qual das posições mudar - de três maneiras (1ª ou 2ª ou 3ª), e a letra selecionada (nucleotídeo) pode ser alterada para 4-1 \u003d 3 outras letras (nucleotídeos). O número total de substituições de nucleotídeos possíveis é 61 por 9 = 549.

    Pelo cálculo direto de acordo com a tabela do código genético, pode-se convencer que destes: 23 substituições de nucleotídeos levam ao aparecimento de códons - terminadores de tradução. 134 substituições não alteram o aminoácido codificado. 230 substituições não alteram a classe do aminoácido codificado. 162 substituições levam a uma mudança na classe de aminoácidos, ou seja, são radicais. Das 183 substituições do 3º nucleotídeo, 7 levam ao aparecimento de terminadores de tradução e 176 são conservadoras. Das 183 substituições do 1º nucleotídeo, 9 levam ao aparecimento de terminadores, 114 são conservadoras e 60 são radicais. Das 183 substituições do 2º nucleotídeo, 7 levam ao aparecimento de terminadores, 74 são conservadoras e 102 são radicais.


Nikitin A.V.

Problemas de compreensão do sistema de codificação de DNA


Sim, devo admitir que estava errado. Os biólogos estão preocupados com a codificação das informações do DNA. Ainda mais. E há uma abordagem tecnocrática para este problema. Talvez não do jeito que eu queria, mas... há interesse em encontrar a verdade. E este é o ponto principal.

Petr Petrovich Garyaev me enviou sua última monografia para estudo e compreensão, pela qual um agradecimento especial a ele.

Mas, junto com novas informações, surgiram novas questões. Vou tentar falar sobre alguns deles neste artigo.

Escrevemos dois, um - na mente ...

Já observamos o seguimento difuso de trigêmeos durante a tradução de proteínas. A mesma questão é explorada por P.P. Garyaev. Eis uma aparente contradição:

“A precisão da codificação de sequências de aminoácidos de proteínas neste modelo coexiste estranhamente com a dupla degeneração do “código” proposto ao longo das linhas de excesso de RNA de transferência (tRNA) em comparação com o número de aminoácidos e a correspondência ambígua códon-anticódon, quando apenas dois (não três) nucleotídeos de tripletos de mRNA é necessário o emparelhamento exato com um par anticódon de nucleotídeos de tRNA e, para o terceiro nucleotídeo, a natureza permite o emparelhamento incorreto, o chamado “wobble” (da palavra inglesa “wobble” - swing ) de acordo com a hipótese de F. Crick. Isso significa que alguns anticódons podem “reconhecer” mais de um códon, dependendo de qual base está na 1ª posição do anticódon correspondente à 3ª posição do nucleotídeo, levando em consideração sua interação complementar antiparalela. “Reconhecimento” desse tipo é “errado”, se seguirmos o paradigma do código genético, pois surgem pares de bases não canônicos “Adenina-Guanina”, “Uracila-Citosina” e outros com ligações de hidrogênio energeticamente desfavoráveis. O “código”, especialmente o mitocondrial, torna-se tão degenerado, e a arbitrariedade da inclusão de aminoácidos na cadeia peptídica logicamente decorrente disso é tão grande que o próprio conceito de codificação genética parece desaparecer.”


A questão é colocada:

“A precisão da síntese de proteínas é evolutivamente conservadora e alta, mas pode ser alcançada por esse tipo de “escrita cifrada”, quando o “sinal” (códon) e o “designado” (aminoácido) nem sempre são isomórficos, não são inequívocos? Se aderimos ao antigo dogma do código genético, é lógico pensar que dois aminoácidos diferentes codificados por dois códons de mRNA idênticos (o terceiro não é importante) serão incluídos na cadeia peptídica com igual probabilidade, ou seja, por acaso. E existem seis dessas ambiguidades emparelhadas mesmo no código não mitocondrial, exceto por mais duas para códons de parada (elas também são “absurdas” ou sem sentido). Então, existe uma “indulgência permissiva” para substituições de aminoácidos frequentes e aleatórias na síntese de proteínas? No entanto, sabe-se que tais substituições aleatórias na maioria dos casos têm as consequências mais negativas para o organismo (anemia falciforme, talassemia, etc.). Há uma clara contradição: a precisão (sem ambiguidade) das relações “sinal-designadas” (códon-aminoácido) é necessária, mas o código inventado pelas pessoas não a fornece.”

Explicações da essência das contradições e da solução proposta:

“Pode-se ver que pares de aminoácidos diferentes são criptografados pelos mesmos dupletos significativos de nucleotídeos de códons (nucleotídeos “oscilantes” de pouco significado, de acordo com Crick, e geralmente ilegíveis, de acordo com Lagerquist, os nucleotídeos são deslocados para o índice). Em termos de linguística, esse fenômeno é chamado de homonímia, quando as mesmas palavras têm significados diferentes (por exemplo, as palavras russas “arco”, “trança” ou as palavras inglesas “caixa”, “anel”, etc.). Por outro lado, diferentes códons redundantes que denotam os mesmos aminoácidos há muito são considerados sinônimos.

“... Para maior ilustração, apresentamos uma tabela do código genético apresentado por Lagerquist e rearranjado por ele de acordo com as famílias de códons, focando nos dois primeiros nucleotídeos de trabalho:

Da Tabela 1. pode-se observar que o mesmo aminoácido pode ser codificado por quatro famílias de códons. Por exemplo, o quádruplo da família CU codifica a leucina. Os quatro códigos da família GU para valina, UC para serina, CC para prolina, AC para triptofano, GC para alanina, CG para arginina e GG para glicina. Este é um fato superficial, e imediatamente notado, de degeneração, i.e. redundância informativa do código. Se tomarmos emprestados os conceitos e termos da linguística para o código da proteína, que há muito tem sido amplamente e facilmente aceito, então a degeneração do código pode ser entendida como um sinônimo. Isso também foi aceito por unanimidade. Em outras palavras, o mesmo objeto, por exemplo, um aminoácido, possui várias cifras - códons. A sinonímia não representa nenhum perigo para a precisão da biossíntese de proteínas. Ao contrário, tal redundância é boa, pois aumenta a confiabilidade da "máquina" ribossômica translacional.

Eu adicionei uma pequena variação de cores na tabela para que você possa ver do que estamos falando. Quádruplos sinônimos são destacados em amarelo. Existem 8 desses quatros no total. Quatros homônimos tiveram que ser divididos em três categorias, de acordo com o grau de diversidade. Mais distante:

“... No entanto, a Tabela 1 também mostra outro fenômeno genolinguístico, fundamental, como se não fosse percebido ou ignorado. Esse fenômeno é encontrado no fato de que em algumas famílias de códons, quatro códons, mais precisamente, seus dois nucleotídeos idênticos e significativos codificam não um, mas dois aminoácidos diferentes, bem como códons de parada. Assim, a família UU dupla codifica para fenilalanina e leucina, AU para isoleucina e metionina, UA para tirosina, códons de parada Och e Amb, CA para histidina e glicina, AA para asparagina e lisina, GA para aspártico e glutamina, UG para cisteína , triptofano e codão de terminação Umb, AG - serina e arginina. Continuando a analogia linguística, vamos chamar esse fenômeno de HOMONÍMIA dos dois primeiros nucleotídeos codificantes em algumas famílias de códons.

Ao contrário da sinonímia, a homonímia é potencialmente perigosa, o que Lagerkvist observou, embora não tenha introduzido o termo-conceito de "homônimo" em relação ao código da proteína. Tal situação, ao que parece, deve de fato levar a ambiguidade na codificação de aminoácidos e sinais de parada: o mesmo códon duplo, dentro de algumas das famílias identificadas por Lagerquist, codifica dois aminoácidos diferentes ou é “diferente-parada”.

É fundamentalmente importante entender: se a sinonímia de código é uma bênção (um excesso de informação), então a homonímia é um mal potencial (incerteza, ambiguidade de informação). Mas isso é um mal imaginário, pois o aparato sintetizador de proteínas contorna facilmente essa dificuldade, que será discutida a seguir. Se, no entanto, a tabela (modelo) do código genético for seguida automaticamente, então o mal não se torna imaginário, mas real. E então é óbvio que o vetor de código homônimo leva a erros na síntese de proteínas, pois o aparelho de síntese de proteínas ribossômicas, cada vez encontrando um ou outro dublê homônimo e guiado pela regra de leitura “dois em três”, deve escolher um e apenas um aminoácido de dois diferentes, mas codificado por duplas homônimas ambiguamente idênticas.

Conseqüentemente, os nucleotídeos 3' nos códons e os nucleotídeos 5' nos anticódons que pareiam com eles não têm um caráter de sinal de gene e desempenham o papel de "muletas estéricas" preenchendo "lugares vazios" nos pares códon-anticódon. Em suma, os 5'-nucleotídeos nos anticódons são aleatórios, "wobble" - do inglês "wobble" (balançando, balançando, balançando). Esta é a essência da hipótese Wobble.”

A essência é declarada com bastante clareza. A tradução não é necessária. O problema é claro.

Os códons de parada e os códons de início, eles estão destacados em negrito na tabela, também funcionam nem sempre de forma inequívoca, mas dependendo de algo ..., como acreditam os biólogos, do contexto.

“Continuemos nossa análise do trabalho seminal de Crick e Nirenberg postulando o conceito de código genético.

P.142-143: “... até agora, todos os dados experimentais estão de acordo com a suposição geral de que a informação é lida em trigêmeos de bases, a partir de uma extremidade do gene. No entanto, obteríamos os mesmos resultados se as informações fossem lidas em grupos de quatro ou mais bases” ou “...grupos contendo um múltiplo de três bases”. Essa proposição está quase esquecida ou não compreendida, mas é aqui que se vê a dúvida se o código é necessariamente tripleto. E não é menos importante que o futuro entendimento de textos de DNA e RNA como formações fractais semânticas, semelhantes a linguagens naturais, seja previsto, o que é demonstrado em nossa pesquisa.”

Com 4 bases diferentes do sistema de código de DNA, os grupos de leitura podem ter apenas 3 ou 4 bases cada. 4 bases em leitura de pares dão apenas 16 combinações possíveis. Falta. Mas quantas: 3 ou 4 bases no grupo de leitura, é impossível estabelecer matematicamente. Porque de uma forma ou de outra, todas as combinações possíveis serão usadas. Ou 64 para um trio, ou 256 para um tetrapleto.

Com o aumento da zona de leitura de código por “grupos contendo um múltiplo de três bases”, o número de combinações de códigos possíveis aumentará indefinidamente. Apenas o que isso nos dá? Se você focar na codificação de aminoácidos, então... nada. E com a abordagem dupla dos biólogos, isso geralmente não é compatível.

Mas, o mais importante, nesta citação pela primeira vez, ainda que de forma implícita, apareceu uma "zona de leitura" de informação que não corresponde a um trio. Um trio é uma coisa, e uma zona de leitura é outra. E um pode não combinar com o outro. Uma nota muito importante.

De fato, a teoria do "balanço" propõe considerar apenas as duas primeiras bases como zona de leitura de códons. Aqueles. neste caso, propõe-se reconhecer que a área de leitura é menor que a área de codificação.

Agora considere a abordagem inversa:

“Alguns mRNAs contêm sinais para alterar o quadro de leitura. Alguns mRNAs contêm códons de terminação na região traduzida, mas esses códons são contornados com sucesso alterando o quadro de leitura antes ou diretamente neles. O quadro pode mudar em -1, +1 e + 2. Existem sinais especiais no mRNA que alteram o quadro de leitura. Assim, o desvio de estrutura de tradução por -1 no RNA do retrovírus ocorre em uma sequência de heptanucleotídeos específica antes da estrutura em gancho no mRNA (Fig. 5c). Para mudar de quadro em +1 no mRNA do fator de terminação bacteriano RF-2, a sequência de nucleotídeos no local de deslocamento (códon UGA), o códon subsequente e a sequência que os precede complementar à sequência 3'-terminal do RNA ribossômico ( análogo da sequência Shine-Dalgarno) são importantes (Fig. 5, d)".

A citação já foi citada anteriormente, mas agora vamos analisar seu conteúdo com mais cuidado. O que significa o termo “quadro de leitura”? Este é um conceito da antigüidade da informática, quando a área de leitura da informação de uma fita ou cartão perfurado era limitada a uma moldura opaca para reduzir o risco de erro na leitura de informação com fluxo leve para um fotodetector através furos no cartão ou fita, perfurados nos lugares certos, marcando as linhas. O princípio da leitura já se foi, mas o termo permanece. Como o conceito de quadro de leitura é claro para todos os biólogos, aparentemente significa a zona de leitura de apenas uma base de um trigêmeo. E por “leitura de deslocamento de quadro” deve-se entender que em +1, a base que segue o último elemento da tercina é lida, e -1, que a base é lida antes do primeiro elemento da mesma tercina. Que par de bases permanece a base no tripleto lido? Isso não está especificado...

Mas parece que nem todos entendem o quadro de leitura, como neste caso. Se o conceito de quadro de leitura for entendido como um quadro limitando 3 bases, então com um deslocamento de +2 do trio legível, resta 1 elemento e dois do vizinho.

Então, de que tipo de quadro de leitura estamos falando? Bem, sim, tudo bem, deixe a ambiguidade permanecer por enquanto ...

Mas, de qualquer forma, essas bases, já lidas pelo quadro, serão lidas novamente quando o quadro retornar ao seu lugar e o ribossomo passar a ler o próximo tripleto... mas e a não sobreposição do código?

Nesse caso, a abordagem mecanicista dos biólogos para estimar as mudanças nas posições de leitura de tripletos não leva em conta o tamanho real do que eles estão falando. A terminologia é claramente enganosa. Como eles próprios entendem isso não está claro. Obviamente, nenhum "frame" está se movendo em qualquer lugar ...

A seleção das posições necessárias na zona de leitura se move. E se somarmos os deslocamentos máximos do “quadro” de leitura dado acima com o comprimento do códon lido, obtemos: 2 + 3 + 2 = 7. Assim, a largura total da zona de leitura do ribossomo já é de 7 bases. O ribossomo escolhe um tripleto de 7 bases possíveis. Como? Essa é outra pergunta...

Mas outra coisa é mais importante para nós. Agora é possível estimar realisticamente que a zona de leitura de informação do RNA pode ser maior que um tripleto e ter 7 ou mais bases, enquanto apenas três bases são fixadas como as posições de leitura necessárias. Quais são as outras posições? Talvez o mesmo “contexto” que altera as opções de leitura do trio. Homonêmico, de acordo com a terminologia de P.P. Garyaev.

Claro, este é apenas um dos muitos casos especiais de compreensão do conceito multilateral de contexto. Mas... pelo menos permite que você entenda algo sem recorrer a generalizações filosóficas superiores. Em um nível muito real de compreensão mecanicista.

No alfabeto dos textos celulares.

A questão é certamente interessante...

Sobre a compreensão das bases do DNA, como as letras de algum tipo de alfabeto celular, há muito tempo vem sendo adotada pelos biólogos. Daí o surgimento do conceito de contexto semântico na avaliação da codificação de tripletos, e a busca por uma aproximação significativa da célula a essa codificação, e a transição gradual para a Mente Superior, que escreveu este livro da Vida...

Só que agora, com a indicação exata das letras desse alfabeto, surgem divergências o tempo todo. O que levar para as cartas? Bases (A, T, C, G), códons formados por elas ou aminoácidos na composição da proteína obtida durante a tradução?

Bases - 4, aminoácidos - 20, códons - 64, o que deve ser tomado como base?

Todos falam sobre a necessidade de uma avaliação linguística das moléculas de DNA, RNA e proteínas, independentemente do entendimento das letras do alfabeto celular. Abordar a informação do DNA como um texto semântico com uma compreensão do contexto aplicável à avaliação literária, é assim que os biólogos precisam entender. Assim, assume-se que a língua em estudo possui todos os atributos de uma linguagem literária desenvolvida e é necessária uma abordagem adequada para avaliar sua informatividade multissignificativa.

Perfeitamente. E, no entanto, onde estão as letras? Como é escrito esse texto literário, que exige tanta atenção dos linguistas? Até agora, no âmbito da mesma abordagem mecanicista ...

Bases ou nucleotídeos? Parece que não. A maioria dos biólogos concorda com isso. Não há motivos suficientes para criar um texto literário. Além disso, na presença de continuidade da sequência ao longo do DNA.

Com o códon, como a letra deste alfabeto, as dificuldades surgem imediatamente. Onde está esse códon, no DNA e RNA, como encontrá-lo? Isso só pode ser feito pelo ribossomo e somente por contato direto. E que tipo de letras compostas são essas, de trigêmeos? Difícil de entender. No entanto, essa compreensão dos códons, como letras do alfabeto celular, tem bastante adeptos.

Tome aminoácidos para letras do alfabeto? Sim, a maioria concorda com isso. Mas então a proteína se torna o Livro da Vida, não o DNA. Existe um contexto semântico em uma proteína, mas no DNA, ao que parece, pode não ser? Ou será, mas diferente, diferente da proteína...

E, portanto, há a exigência de avaliar tanto o DNA quanto a proteína do ponto de vista do contexto semântico, mas não há esclarecimento sobre o que e como deve ser avaliado.

P.P. Garyaev nesta situação propôs, inclusive linguisticamente, avaliar não DNA e proteína, mas seus “retratos” volumétricos holográficos. Uma posição muito forte, devo admitir. E muito produtivo...

Mas com o alfabeto da célula, com uma abordagem mecanicista, já familiar, é completamente incompreensível. Ele é ou não é, e esse conceito é apenas uma alegoria?

Os biólogos não dão esclarecimentos. Mas teimosamente continuar a aplicar este conceito. Todos - em seu entendimento ...

Sobre o sistema de codificação original.

Trata-se do original, que estava, talvez, na fase de divisão celular em procariontes e eucariontes. Agora está oculto por inúmeras sobreposições e desvios de ambos. Milhões de anos de evolução não passaram sem deixar vestígios.

Mas ainda…

O DNA nem sempre foi um repositório de informações; antes, esse papel podia ser desempenhado pelo RNA. Ela substituiu completamente a proteína em algum momento. Inúmeros estudos falam disso. E as bases de DNA e RNA nem sempre foram 4, mas não estamos falando disso agora...

Mas, em algum estágio de desenvolvimento, apareceu um sistema de codificação de informações que, na época, atendia plenamente a todos os requisitos da estrutura informacional e lógica para controlar os processos celulares.

O mesmo clássico que todos apontam e imediatamente começa a refutar...

Matriz de informações - DNA, RNA. Uma sequência que consiste em uma combinação de 4 nucleotídeos: A,T(U),C,G.

A etapa de leitura da informação é de 1 nucleotídeo.

O método de leitura das informações é sequencial.

O volume de uma única leitura é um tripleto.

Nenhum sistema lógico pode contar. Mas, aqui ela é capaz de contar até um. Isso já é mais - muito. E distinguir vários unidades em dois pares adjacentes - também. E se o eixo de simetria é real, então é bem capaz de determinar os estados lógicos das posições vizinhas em relação a tal eixo. Mas, aparentemente, era muito difícil aumentar ainda mais a zona de leitura sem contar nessa fase.

E, portanto, nessa fase - um tripleto é a forma máxima possível de uma unidade de informação do sistema. Uma descarga no eixo de simetria, uma descarga à direita e uma descarga à esquerda.

Três unidades de conta diferentes... mesmo para leitura de passos... isso é muito.

O sistema de codificação de informações de DNA e RNA usa 4 estados lógicos possíveis, leitura de tripletos. A complexidade para a célula é extrema.

Como provar o código tripleto? Já mostrei isso várias e várias vezes. Vamos escrever novamente: Bases - 4, aminoácidos - 20, códons ou trigêmeos - 64.

A matemática é simples: 64/3 = 21

Tal número de tripletos não sobrepostos pode ser obtido com uma etapa de fixação através de uma base. Existem 20 trigêmeos de aminoácidos e um códon STOP.

Por outro lado: 4 3 \u003d 64, são os mesmos 21x3 \u003d 63, são 60 combinações de tripletos, 3 códons de parada e um códon de início, que fecha o conjunto de variações. É apenas matemática, mas... mostra que originalmente, três bases seguidas foram realmente lidas - um códon em um passo de 1 base. Isso determinou a quantidade de aminoácidos utilizados - 20. Assim, no entanto - um trio.

Neste caso, a degenerescência do código de aminoácidos no tripleto é compreensível. Surgiu da sobreposição de código.

Não entendemos o surgimento da degeneração dos códons. Esta não é uma extensão dos recursos do sistema em codificar informações, mas "erros de seu passado". Este é um eco do sistema de codificação original…

Informações sobre o tema:

«С.153: «... um aminoácido é criptografado por vários códons. Tal código é chamado degenerado... este tipo de degeneração não indica nenhuma incerteza na construção da molécula de proteína... significa apenas que um determinado aminoácido pode ser direcionado para o local apropriado na cadeia proteica com a ajuda de várias palavras de código.

É claro que, para codificar qualquer aminoácido em bases de DNA, basta um tripleto de codificação. Especialmente com codificação não sobreposta. Repita um códon quantas vezes quiser e obtenha quantas moléculas do aminoácido desejado na proteína. Fácil, simples, compreensível e o consumo de energia é mínimo.

A degenerescência do código tripleto é uma medida forçada, diretamente relacionada com a forma original de leitura do código. Foi o que aconteceu no curso da evolução.

O mecanismo para o aparecimento da degeneração do código é assim:

Com um passo de leitura de tripletos de 1 base, apenas um sinal do tripleto muda para cada passo, e dois sinais do tripleto permanecem constantes. Apenas de forma síncrona muda suas posições. Com duas etapas, a informação de apenas um caractere da trinca permanece inalterada, mas passa sequencialmente por todas as posições do display.

Por que nós precisamos disso?

Com 3 caracteres de codificação, 2 caracteres são repetidos em cada etapa. E apenas uma muda. Na próxima etapa, o segundo sinal também mudará. E um sinal permanecerá inalterado no caminho percorrido. Uma mudança completa de sinais virá somente após a terceira etapa. Só que agora a nova combinação do trio não terá o efeito das combinações anteriores.

Com um passo de tripleto, cada novo tripleto na formação não depende do anterior, mas ... tal passo para tal sistema de leitura era então impossível.

E os trigêmeos de DNA formados acabaram sendo dependentes uns dos outros durante a leitura.

Esse fluxo suave de uma trinca para outra leva a uma limitação da capacidade de usar rapidamente todas as permutações na trinca. Para o uso possível de todas as 64 variantes do tripleto, são necessários 64 * 3 = 192 passos simples de leitura de tripletos de DNA. E vice-versa, dos 64 passos de leitura de combinações possíveis com leitura sequencial de todos os códons, do primeiro ao 64º, haverá 42 repetições, e não haverá mais de 1/3 = 21 combinações únicas. E mais 1/3….

Aqui está a resposta, por que existem apenas 20 aminoácidos, poderia ser mais, mas o sistema de codificação e leitura de informações não permite.

Assim, a célula começou a usar códigos adicionais das 42 repetições disponíveis. Caso contrário, ela não poderia, porque espaços na tradução não são permitidos. Existe um código - qualquer, e o ribossomo deve realizar a operação de tradução. Variantes de transição de um código triplet independente para outro rapidamente começaram a ocupar os mesmos 20 aminoácidos, mas dependendo da frequência de uso. Para um -6 códigos, e o outro e um é suficiente. Registramos isso como degeneração de código.

É claro que o uso de códons dependentes deveria ter expandido a base de tRNAs de transporte. E assim aconteceu. Em um sistema em escala real, o número de códons de mRNA deve corresponder ao número de anticódons por tRNA. Assim, um grande número de tRNAs indica apenas que o sistema foi originalmente formado dessa maneira.

Como podemos ver, o sistema de codificação inicial ou original no estágio do aparecimento de 4 nucleotídeos no DNA é claramente visível. Outras estratificações de processos evolutivos tardios já se foram. E hoje temos... o que temos.

Códigos básicos iniciais de aminoácidos.

Por outro lado, se você seguir esse caminho, das 64 combinações possíveis, poderá escolher cerca de 21 combinações e aplicá-las como principais. Mas o que?

Como uma célula poderia escolher? A resposta mais simples é de acordo com a simetria máxima do tripleto.

Vamos aplicar o princípio da simetria na busca das combinações certas e verificar quão corretamente entendemos a codificação natural dos aminoácidos no DNA. Para isso, coletaremos todas as variantes de códigos simétricos na Tabela 2. Excelente resultado..., 15 dos 16 aminoácidos possíveis receberam códigos simétricos.

Mas, ainda existem 5 aminoácidos e PARE.

Aparentemente a Natureza estava indo na mesma direção, ... e tropeçou no mesmo lugar. Todas as opções simétricas foram usadas, não há margem para expansão do sistema e não há códigos suficientes. Qual foi a próxima opção que ela usou para continuar procurando os códigos?

Agora repetições e um elemento adicional...

Há. CAA, AAC, UGG, e aqui está o códon de parada principal - UAA.

Apenas mais dois códons para encontrar...

GAC e AUG. Este último tornou-se o códon de início ...

E o número total de combinações básicas usadas em DNA e RNA tornou-se 21. A Tabela 2 reflete o caminho de busca para as principais designações de código.

Mas aqui também a lógica evolucionária do desenvolvimento mostra um exemplo interessante. Apenas simetrias completas foram usadas até o fim e imediatamente. As restantes opções não foram utilizadas imediatamente e não completamente. Por exemplo, para o aminoácido Gly, o códon principal GGG é usado e, em seguida, GGU é adicionado, a partir de uma reserva não utilizada ...

As reservas de codificação criadas funcionaram até o fim. Hoje, todas as reservas estão esgotadas há muito tempo e chegou a hora de combinar funções, sempre que possível. Por exemplo, para o códon de início. A busca por novas formas de expandir as possibilidades de codificação triplet começou. aminoácidos no RNA. Isso é algo assim, talvez, foi a seleção dos principais códigos. Por simetria e permutações simples...

mesa 2

A lógica das ações é clara. Talvez tenhamos cometido um erro na sequência de ações, mas isso ainda não é tão importante. Claro, essas são apenas minhas variações sobre o tema, os profissionais provavelmente sabem melhor, de uma forma ou de outra, tudo foi na realidade, mas ainda assim ... ficou interessante.

Não dê conta do recado...

Códigos estranhos... simétricos só podem ser usados ​​com leitura triplet, sem sobreposição. Este ponto nos faz olhar novamente para a matemática acima para obter 20 aminoácidos para usar na codificação de tripletos. Claramente, um não combina com o outro.

A matemática mostra a realidade objetiva do movimento elemento por elemento do ribossomo ao longo do RNA. Mas um uso tão amplo de simetrias na codificação de aminoácidos também não pode ser acidental e aponta para trigêmeos de leitura independente.

É possível que a leitura elemento a elemento da informação de RNA existisse antes da codificação de tripletos e por algum tempo junto com o aparecimento de tripletos. Ele determinou a quantidade de aminoácidos utilizados.

Mas em algum momento houve um salto no desenvolvimento. O sistema de codificação foi completamente revisto. A leitura independente do tripleto tornou necessário recodificar os aminoácidos utilizados de acordo com os sinais de simetria. Mas a evolução não sabe descartar velhas opções...

Códigos adicionais já existem, tivemos que redistribuí-los por aminoácidos dependendo da frequência de seu uso.

E surgiu um quadro paradoxal. A leitura parece não se sobrepor, e um códon é suficiente para codificar um aminoácido, e todas as 64 variantes foram usadas. A redundância potencial da codificação é coberta pela degeneração dos códigos. A reserva estimada é, mas na verdade - não. Como isso aconteceu, já vimos.

Muito provavelmente, o rápido desenvolvimento dos ribossomos celulares tornou-se um fator na revisão do sistema. Em última análise, eles determinam todo o sistema de codificação e sua aplicação no organismo celular.

Pode-se supor que a zona de leitura de informações do ribossomo há muito ultrapassou três sinais e foi muito além desses limites. Agora é possível selecionar e memorizar a informação do códon desejado dentro de uma grande zona de leitura de informação. Isso possibilitou deixar o ribossomo com uma etapa elemento a elemento, mas também foi implementada a possibilidade de leitura de tripletos de modo independente. O ribossomo tem uma memória de trabalho em algum lugar.

A zona de leitura de informações para o ribossomo, mesmo em procariontes, como vemos, atingiu 7 nucleotídeos. E este não é o limite. Se tomarmos como base que os ribossomos têm dois centros de tradução ou leitura de informações, então sua zona total de leitura de informações por um ribossomo já atingiu 14 nucleotídeos. Algumas seções de códigos são tomadas como trigêmeos, e o resto é contexto...

E agora…

E agora tudo está completamente confuso. Segundo os biólogos, a pontuação é em trigêmeos, embora ninguém explique como isso acontece. O contexto mais próximo é ignorado. A comparação da sequência do código do RNA e da proteína derivada dela é uma tarefa muito difícil, e aparentemente é impossível entender claramente como o sistema mudou e o que é levado em consideração durante a tradução.

Além disso, os biólogos se concentram não na sistematização, mas em encontrar desvios do sistema, aumentando assim a já vasta variedade de fatos e criando um quebra-cabeça enigmático para si mesmos. A confusão é complementada pela mistura completa de vários desvios nos mecanismos de leitura de trigêmeos de procariontes e eucariontes em um grande jogo de palavras cruzadas... onde eles mesmos parecem ter se confundido.

Por quê? Eles têm outras tarefas. Eles trabalham com objetos biológicos, como é costume em sua ciência. Portanto, as conclusões sobre as questões de codificação de RNA estão refletidas na teoria do "swing", e não no sistema de princípios para leitura da informação e teoria da codificação. Eles podem ser entendidos, mas uma saída deve ser encontrada ...

A abordagem tecnocrática proposta pelos próprios biólogos para o problema da compreensão da codificação do DNA ainda não esgotou suas possibilidades. Na verdade, até agora não foi realmente usado. Apenas a terminologia foi usada, não a abordagem.

Talvez tenha chegado a hora de aplicar a análise de máquina de sequências de DNA, levando em conta a zona estendida de leitura de informação em relação ao tripleto de codificação. Então ficará claro o mecanismo de ação do contexto de codificação mais próximo da trinca de leitura e, possivelmente, dos elementos de programação do processo de tradução de proteínas memorizados pelo ribossomo. Tal análise é especialmente importante para o estudo de regiões não traduzidas de RNA e DNA. Uma vez que já está claro que estes são elementos de software do sistema de codificação. Todos os processos dependem deles, incluindo a tradução de proteínas. O nome "lixo" obviamente não se assemelha a eles em nada...

Sim, e não pode haver "lixo" nas matrizes de informações estrategicamente importantes armazenadas no DNA. Nenhum sistema de informação pode permitir isso.

O actual nível de desenvolvimento da tecnologia informática permite resolver estes problemas. Construir um sistema de gerenciamento de informações na estrutura celular, esclarecer canais de comunicação, estabelecer controles-chave e um sistema de sinal. Então, pelo menos, um nível aproximado de complexidade técnica desse sistema de controle ficará claro. Até agora, apenas uma coisa é clara: o ribossomo desempenha um papel fundamental nisso, mas quão tecnicamente complexo é esse autômato celular universal? Como a complexidade técnica dos outros mecanismos executivos da célula se parece com seu pano de fundo?

Ainda não encontrei respostas...

Literatura:

  1. Garyaev P.P. Tertyshny G.G. Leonova E.A. Mologin A.V. Funções do biocomputador de ondas do DNA. http://nature.web.ru/db/msg.html?mid=1157645&s
  2. Nikitin A.V., Lendo e processando informações de DNA // "Academy of Trinitarianism", M., El No. 77-6567, publ. 16147, 08.11.2010

Nikitin A.V., Problemas de compreensão do sistema de codificação de DNA // "Academy of Trinitarianism", M., El No. 77-6567, publ. 16181, 27.11.2010


Esquilos- São heteropolímeros constituídos por 20 monômeros diferentes - alfa-aminoácidos naturais. Esquilos são polímeros irregulares. Na estrutura de uma molécula de proteína, vários níveis de organização estrutural são distinguidos. Estrutura primáriaé uma sequência de resíduos de aminoácidos ligados por ligações peptídicas. estrutura secundária- como regra, esta é uma estrutura helicoidal, que é mantida por muitas ligações de hidrogênio que surgem entre os grupos -C=O e -NH localizados próximos um do outro. Estrutura terciária uma molécula de proteína é uma configuração espacial, geralmente semelhante a um glóbulo compacto; é suportado por ligações iônicas, hidrogênio e dissulfeto (S-S). Estrutura quaternáriaé formado pela interação de várias subunidades - glóbulos (por exemplo, uma molécula de hemoglobina consiste em quatro dessas subunidades). A perda de uma molécula de proteína de sua estrutura é chamada de desnaturação; pode ser causada por temperatura, desidratação, radiação, etc. As informações sobre a sequência de aminoácidos em uma cadeia polipeptídica estão localizadas na seção de DNA, que chamado de gene. O DNA contém informações sobre a estrutura primária de uma proteína. O código de DNA é o mesmo para todos os organismos. Cada aminoácido corresponde a três nucleotídeos formando um tripleto, ou códon. Essa codificação é redundante: são possíveis 64 combinações de trigêmeos, enquanto existem apenas 20 aminoácidos.Há também trigêmeos de controle, por exemplo, marcando o início e o fim de um gene.

Biossíntese de proteínasé uma cadeia de reações que utiliza a energia do ATP. As enzimas estão envolvidas em todas as reações da síntese de proteínas. A biossíntese de proteínas é uma síntese de matriz.

Código genéticoé um sistema para registrar informações sobre a sequência de aminoácidos em proteínas usando a sequência de nucleotídeos no DNA. Propriedades do código genético.

1. Triplicidade Cada aminoácido é codificado por uma sequência de 3 nucleotídeos.

2. Degeneração. Todos os aminoácidos, com exceção da metionina e do triptofano, são codificados por mais de um tripleto. Um total de 61 códigos tripletos para 20 aminoácidos.

3. Singularidade. Cada tripleto codifica apenas um aminoácido ou é um terminador de tradução.

4. Compacidade, ou a ausência de sinais de pontuação intragênicos. Dentro de um gene, cada nucleotídeo é parte de um códon significativo.

23. O princípio de codificação e implementação da informação genética em uma célula, as propriedades do código genético, seu significado biológico. Etapas de realização da informação, suas características. O conceito de transcrição direta e reversa.

Código genético- um sistema para registrar informações hereditárias, após o qual a sequência de nucleotídeos no DNA (em alguns vírus de RNA) determina a sequência de aminoácidos nas moléculas de proteína. Uma vez que no processo de implementação a informação genética é reescrita de DNA para mRNA, o código genético é lido para mRNA e escrito usando as quatro bases nitrogenadas do RNA (A, B, G, C).

códon- uma sequência de três nucleotídeos adjacentes (triplet) de mRNA que codifica um aminoácido específico ou o início e o fim da tradução.

Como existem quatro tipos de nucleotídeos, o código genético consiste em 64 códons, dos quais 61 códons codificam 20 aminoácidos. Três códons (UAG, UAA, UGA) - códon-códons-códons sem sentido, não codificam um único aminoácido e não há RNAs de transporte para eles; eles agem como sinais para a conclusão da tradução (códon-códon-códons de parada, terminadores de códon). O códon AUG determina o início da tradução e é chamado de códon de início ou códon de início.

Código genético: suas propriedades e conceito. Principalmente, toda a diversidade da vida é determinada pela diversidade de moléculas de proteínas que desempenham várias funções biológicas nas células. A estrutura das proteínas é determinada pelo conjunto e ordem dos aminoácidos em suas cadeias peptídicas. É essa sequência de aminoácidos em peptídeos que é criptografada em moléculas de DNA usando o código genético. Na variedade de proteínas que existem na natureza, foram encontrados cerca de 20 aminoácidos diferentes.

Propriedades do código genético:

tripleto - um aminoácido é codificado por um tripleto, que inclui três nucleotídeos. Tal tripleto é chamado de códon.;

· “Degeneração”, ou redundância do código genético, ou seja, o mesmo aminoácido pode ser codificado por vários trigêmeos, uma vez que 20 aminoácidos e 64 códons são conhecidos

não sobrepostos, ou seja, não há sinais de separação entre trigêmeos em uma molécula de DNA, eles estão dispostos em ordem linear, um após o outro; três nucleotídeos adjacentes formam um trio;

versatilidade, ou seja, para todos os organismos, de procariontes a humanos, 20 aminoácidos são codificados pelos mesmos trigêmeos, o que é uma das provas da unidade da origem de toda a vida na Terra

Etapas de implementação da informação genética I.

Transcrição- síntese de todos os tipos de RNA em uma matriz de DNA.

A transcrição, ou reescrita, não ocorre em toda a molécula de DNA, mas no sítio responsável por uma proteína específica (gene). Condições necessárias para a transcrição:

a) desenrolamento de uma seção de DNA com a ajuda de desenrolamento de proteínas-enzimas

b) disponibilidade de material de construção.

c) enzimas de transcrição - RNA polimerases I, II, III

d) energia na forma de ATP.

A transcrição ocorre de acordo com o princípio da complementaridade. Ao mesmo tempo, com a ajuda de proteínas-enzimas especiais, uma seção da dupla hélice do DNA se desenrola e é um modelo para a síntese de mRNA. Em seguida, a enzima RNA polimerase se move ao longo da cadeia de DNA, conectando os nucleotídeos entre si de acordo com o princípio da complementaridade em uma cadeia de RNA crescente. O RNA de fita simples então se separa do DNA e sai do núcleo celular II através de poros na membrana nuclear.

Transmissão(tradução), ou biossíntese de proteínas. A essência da tradução é a tradução de uma cifra de quatro letras de bases nitrogenadas em um "dicionário" de aminoácidos de 20 letras. O processo de tradução consiste em transferir a informação genética codificada no mRNA para a sequência de aminoácidos de uma proteína. A síntese de proteínas é realizada no citoplasma em ribossomos e consiste em várias etapas:

A etapa preparatória (ativação dos aminoácidos) consiste na ligação enzimática de cada aminoácido ao seu tRNA e na formação de um complexo aminoácido-tRNA. Na verdade, a síntese de proteínas, que inclui três etapas:

a) iniciação- mRNA liga-se à pequena subunidade do ribossomo

b) alongamento- alongamento da cadeia polipeptídica. O processo é realizado em 3 etapas e consiste na ligação do códon do mRNA ao anticódon do tRNA de acordo com o princípio da complementaridade no centro ativo do ribossomo, depois na formação de uma ligação peptídica entre dois resíduos de aminoácidos e movimentação do dipeptídeo um passo à frente e, consequentemente, movendo o ribossomo ao longo do mRNA um códon para frente

c) rescisão- o fim da tradução depende da presença de códons de terminação ou "sinais de parada" (UAA, UGA, UAG) e enzimas proteicas - fatores de terminação no mRNA

Transcrição reversaé o processo de formação de DNA de fita dupla com base na informação do RNA de fita simples. Esse processo é chamado de transcrição reversa, pois a transferência da informação genética ocorre no sentido “reverso” em relação à transcrição.


Informações semelhantes.


A informação genética é codificada no DNA. O código genético foi elucidado por M. Nirenberg e H.G. Alcorão, pelo qual receberam o Prêmio Nobel em 1968.

Código genético- um sistema para o arranjo de nucleotídeos em moléculas de ácido nucleico que controla a sequência de aminoácidos em uma molécula de polipeptídeo.

Postulados básicos do código:

1) O código genético é triplo. O tripleto de mRNA é chamado de códon. Um códon codifica um aminoácido.

2) O código genético é degenerado. Um aminoácido é codificado por mais de um códon (de 2 a 6). As exceções são a metionina e o triptofano (AUG, GUG). Nos códons de um aminoácido, os dois primeiros nucleotídeos são mais frequentemente os mesmos e o terceiro varia.

3) Os códons não se sobrepõem. A sequência de nucleotídeos é lida em uma direção em uma linha, tripleto por tripleto.

4) O código é inequívoco. Um códon codifica um aminoácido específico.

5) AUG é o códon de iniciação.

6) Não há sinais de pontuação dentro do gene - códons de parada: UAG, UAA, UGA.

7) O código genético é universal, é o mesmo para todos os organismos e vírus.

A revelação da estrutura do DNA, o material portador da hereditariedade, contribuiu para a solução de muitas questões: a reprodução dos genes, a natureza das mutações, a biossíntese de proteínas, etc.

O mecanismo de transmissão do código genético contribuiu para o desenvolvimento da biologia molecular, bem como da engenharia genética, terapia gênica.

O DNA está localizado no núcleo e faz parte da cromatina, assim como as mitocôndrias, centrossomos, plastídios e o RNA está nos nucléolos, matriz citoplasmática e ribossomos.

O portador da informação hereditária na célula é o DNA, e o RNA serve para transferir e implementar a informação genética em pró e eucariotos. Com a ajuda do i-RNA, ocorre o processo de tradução da sequência de nucleotídeos de DNA em um polipeptídeo.

Em alguns organismos, além do DNA, o RNA pode ser o portador de informações hereditárias, por exemplo, nos vírus do mosaico do tabaco, poliomielite e AIDS.

Os monômeros de ácidos nucleicos são nucleotídeos. Foi estabelecido que a molécula gigante de DNA de fita dupla nos cromossomos eucarióticos é formada por 4 tipos de nucleotídeos: adenil, guanil, timidil e citosil. Cada nucleotídeo consiste em uma base nitrogenada (purina G+A ou pirimidina C+T), desoxirribose e um resíduo de ácido fosfórico.

Analisando DNA de diferentes origens, Chargaff formulou as regularidades da proporção quantitativa de bases nitrogenadas - Regras de Chargaff.

a) a quantidade de adenina é igual à quantidade de timina (A=T);

b) a quantidade de guanina é igual à quantidade de citosina (G=C);

c) a quantidade de purinas é igual à quantidade de pirimidinas (G+A = C+T);

d) o número de bases com grupos 6-amino é igual ao número de bases com grupos 6-ceto (A + C \u003d G + T).

Ao mesmo tempo, a proporção de bases A + TG + C é um coeficiente estritamente específico da espécie (para humanos - 0,66; camundongos - 0,81; bactérias - 0,41).

Em 1953, o biólogo J. Watson e físico F. Creek propôs um modelo molecular espacial de DNA.

Os principais postulados do modelo são os seguintes:

1. Cada molécula de DNA consiste em duas longas cadeias polinucleotídicas antiparalelas formando uma dupla hélice torcida em torno do eixo central (destro - forma B, canhoto - forma Z, descoberto por A. Rich no final dos anos 70).

2. Cada nucleosídeo (pentose + base nitrogenada) está localizado em um plano perpendicular ao eixo da hélice.

3. Duas cadeias de polinucleotídeos são mantidas juntas por ligações de hidrogênio formadas entre bases nitrogenadas.

4. O pareamento das bases nitrogenadas é estritamente específico, as bases purinas combinam-se apenas com as pirimidinas: A-T, G-C.

5. A sequência de bases de uma cadeia pode variar consideravelmente, mas as bases nitrogenadas da outra cadeia devem ser estritamente complementares a elas.

As cadeias polinucleotídicas são formadas por ligações covalentes entre nucleotídeos adjacentes através de um resíduo de ácido fosfórico que liga o carbono na quinta posição do açúcar ao terceiro carbono do nucleotídeo adjacente. As cadeias têm uma direção: o início da cadeia é 3 "OH - na terceira posição do carbono da desoxirribose, o grupo hidroxila OH está ligado, o final da cadeia é 5" F, um resíduo de ácido fosfórico está ligado a o quinto carbono da desoxirribose.

A função autossintética do DNA é a replicação - autorreprodução. A replicação é baseada nos princípios de semiconservação, antiparalelismo, complementaridade e descontinuidade. A informação hereditária do DNA é realizada como resultado da replicação de acordo com o tipo de síntese da matriz. Ele prossegue em etapas: ligação, iniciação, alongamento, terminação. O processo está confinado ao período S da interfase. A enzima DNA polimerase usa DNA de fita simples como molde e, na presença de 4 nucleotídeos, um primer (RNA), constrói uma segunda fita de DNA.

A síntese de DNA é realizada de acordo com o princípio da complementaridade. Entre os nucleotídeos da cadeia de DNA, as ligações fosfodiéster são formadas devido às conexões do grupo 3 "OH do último nucleotídeo com o 5" -fosfato do próximo nucleotídeo a ser adicionado à cadeia.

Existem três tipos principais de replicação do DNA: conservativa, semiconservativa e dispersa.

Conservador- preservação da integridade da molécula de fita dupla original e a síntese de uma molécula de fita dupla filha. Metade das moléculas filhas são construídas inteiramente a partir do novo material e metade do antigo material original.

semi-conservador - A síntese do DNA começa com a ligação à origem de replicação da enzima helicase, que desenrola seções de DNA. Cada fita tem um DNA de ligação a proteínas (DBP) ligado a ela, impedindo que elas se unam. A unidade de replicação é o replicon - esta é a área entre dois pontos do início da síntese das cadeias filhas. A interação das enzimas com a origem de replicação é chamada de iniciação. Este ponto se move ao longo da cadeia (3 "OH>5" F) e uma forquilha de replicação é formada.

A síntese de uma nova cadeia é descontínua com a formação de fragmentos de 700-800-2000 resíduos de nucleotídeos de comprimento. Há um ponto inicial e final para a replicação. O replicon se move ao longo da molécula de DNA e suas novas seções se desenrolam. Cada uma das cadeias parentais é uma matriz para a criança, que é sintetizada de acordo com o princípio da complementaridade. Como resultado de conexões sequenciais de nucleotídeos, a cadeia de DNA é alongada (estágio de alongamento) com a ajuda da enzima DNA ligase. Quando o comprimento desejado da molécula é alcançado, a síntese para - terminação. Os eucariotos têm milhares de forquilhas de replicação ao mesmo tempo. Nos procariontes, a iniciação ocorre em um ponto do anel de DNA, enquanto duas forquilhas de replicação se movem em duas direções. No ponto em que se encontram, as moléculas de DNA de duas fitas são separadas.

Disperso - a quebra do DNA em fragmentos de nucleotídeos, o novo DNA de fita dupla consiste em fragmentos novos e parentais recrutados espontaneamente.

O DNA eucariótico é estruturalmente semelhante ao DNA procariótico. As diferenças estão relacionadas com: a quantidade de DNA por genes, o comprimento da molécula de DNA, a ordem de alternância das sequências de nucleotídeos, a forma do empilhamento (em eucariotos - linear, em procariontes - circular).

Eucariotos são caracterizados pela redundância de DNA: a quantidade de seu DNA envolvida na codificação é de apenas 2%. Parte do excesso de DNA é representada pelos mesmos conjuntos de nucleotídeos, repetidos muitas vezes (repetições). Existem sequências repetidas e moderadamente repetidas. Eles formam heterocromatina constitutiva (estrutural). Ele é incorporado entre sequências únicas. Os genes em excesso têm 10 4 cópias.

Cromossomo metafásico (cromatina espiralizada) consiste em duas cromátides. A forma é determinada pela presença de uma constrição primária - o centrômero. Divide o cromossomo em 2 braços.

A localização do centrômero determina as principais formas dos cromossomos:

metacêntrico,

submetacêntrico,

acrocêntrico,

Telocêntrico.

O grau de espiralização dos cromossomos não é o mesmo. Regiões de cromossomos com espiralização fraca são chamadas eucromático. Esta é uma zona de alta atividade metabólica onde o DNA é composto de sequências únicas. Zona com forte espiralização - heterocromático região capaz de transcrição. Distinguir constitutivo heterocromatina-genética inerte, não contém genes, não passa para a eucromatina, bem como opcional, que pode ser convertida em eucromatina ativa. As extremidades das porções distais dos cromossomos são chamadas de telômeros.

Os cromossomos são divididos em autossomos (células somáticas) e heterocromossomos (células sexuais).

Por sugestão de Levitsky (1924), o conjunto diplóide de cromossomos somáticos de uma célula foi chamado de cariótipo. É caracterizada pelo número, forma, tamanho dos cromossomos. Descrever os cromossomos do cariótipo, de acordo com a proposta de S.G. Navashina eles estão dispostos na forma idiogramas - cariótipo sistemático. Em 1960, foi proposta a Classificação Internacional de Cromossomos de Denver, onde os cromossomos são classificados de acordo com o tamanho e a localização do centrômero. No cariótipo de uma célula somática humana, distinguem-se 22 pares de autossomos e um par de cromossomos sexuais. O conjunto de cromossomos nas células somáticas é chamado de diplóide, e nas células sexuais - haplóide (é ele igual a metade do conjunto de autossomos). No idiograma do cariótipo humano, os cromossomos são divididos em 7 grupos, dependendo de seu tamanho e forma.

1 - 1-3 grandes metacêntricos.

2 - 4-5 grandes submetacêntricos.

3 - 6-12 e meio do cromossomo X metacêntrico.

4 - 13-15 médio acrocêntrico.

5 - 16-18 meta-submetacêntrico relativamente pequeno.

6 - 19-20 pequenos metacêntricos.

7 - 21-22 e o cromossomo Y são os menores acrocêntricos.

De acordo com classificação parisiense cromossomos são divididos em grupos de acordo com seu tamanho e forma, bem como a diferenciação linear.

Os cromossomos têm as seguintes propriedades (regras dos cromossomos):

1. Individualidade - diferenças entre cromossomos não homólogos.

2. Emparelhamentos.

3. A constância do número - característica de cada espécie.

4. Continuidade - a capacidade de reproduzir.

07.04.2015 13.10.2015

Na era das nanotecnologias e inovações em todas as esferas da vida humana, é necessário saber muito para autoconfiança e comunicação com as pessoas. As tecnologias do século XXI avançaram muito, por exemplo, no campo da medicina e da genética. Neste artigo, tentaremos descrever em detalhes o passo mais importante da humanidade na pesquisa de DNA.

Descrição do código de DNA

O que é este código? O código é degenerado por propriedades genéticas e os geneticistas o estão estudando. Todos os seres vivos do nosso planeta são dotados deste código. Cientificamente definido como o método de seqüência de proteínas de aminoácidos utilizando uma cadeia de nucleotídeos.
O chamado alfabeto consiste em quatro bases, designadas A, G, T, C:
A é adenina
G - guanina,
T - timina,
C, citosina.
A cadeia do código é uma espiral das bases acima descritas compostas sequencialmente, verifica-se que uma determinada letra corresponde a cada etapa da espiral.
O código do DNA é degenerado por proteínas que estão envolvidas na compilação e são formadas por cadeias. Em que vinte tipos de aminoácidos participam. Os aminoácidos do código revelador são chamados de canônicos, se alinham de uma certa maneira em cada criatura e formam ligações protéicas.

História da descoberta

A humanidade estuda proteínas e ácidos há muito tempo, mas as primeiras hipóteses e a resolução da teoria da hereditariedade surgiram apenas em meados do século XX. A essa altura, os cientistas coletaram uma quantidade suficiente de conhecimento sobre esse assunto.
Em 1953, pesquisas mostraram que a proteína de um organismo individual tem uma cadeia única de aminoácidos. Deduziu-se ainda que esta cadeia não tem restrição no polipéptido.

Os registros de vários cientistas mundiais foram comparados, que eram diferentes. Portanto, um certo conceito foi formado: cada gene corresponde a um determinado polipeptídeo. Ao mesmo tempo, aparece o nome DNA, que definitivamente não é uma proteína.
Os pesquisadores Crick e Watson falaram pela primeira vez sobre o esquema matricial da cifra explicativa em 1953. Nos últimos trabalhos de grandes cientistas, ficou comprovado o fato de que a cifra é a portadora da informação.

Posteriormente, restava apenas entender a questão da determinação e formação de cadeias, bases e propriedades de aminoácidos de proteínas.

O primeiro cientista a construir a hipótese da codificação genética foi o físico Gamow, que também propôs uma certa maneira de testar a matriz.

Os geneticistas propuseram estabelecer uma correspondência entre os dois trilhos laterais da cadeia de aminoácidos e as etapas em forma de diamante resultantes. As etapas em forma de diamante da cadeia são formadas usando quatro nucleotídeos do código genético. Essa correspondência foi chamada de pandeiro.
Gamow em sua pesquisa posterior propõe a teoria do código tripleto. Essa suposição torna-se primordial na questão da natureza do código genético. Embora a teoria do físico Gamow tenha falhas, uma delas é a codificação da estrutura das proteínas através do código genético.
Assim, Georgy Gamow tornou-se o primeiro cientista que considerou a questão dos genes como a codificação de um sistema de quatro dígitos traduzido em um fato fundamental de vinte dígitos.

Princípio de funcionamento

Uma proteína é composta de várias cadeias de aminoácidos. A lógica das cadeias de conexão determina a estrutura e as características da proteína do corpo, o que contribui para a identificação de informações sobre os parâmetros biológicos de um ser vivo.

A informação das células vivas é extraída por dois processos matriciais:
Transcrição, ou seja, o processo sintetizado de fusão de moldes de RNA e DNA.
Tradução, isto é, a síntese de uma cadeia de polipeptídeos em um molde de RNA.
Durante a tradução, o código genético é redirecionado para uma cadeia lógica de aminoácidos.

Para identificar e implementar a informação dos genes, são necessários pelo menos três nucleotídeos de cadeia, considerando vinte aminoácidos estritamente consecutivos. Esse conjunto de três nucleotídeos é chamado de tripleto.
Os códigos genéticos são divididos em duas categorias:
Sobreposição - código menor, triangular e sequencial.
Sem sobreposição - o código é combinacional e “sem vírgulas”.
Estudos provaram que a ordem dos aminoácidos é caótica e, portanto, individualmente, com base nisso, os cientistas preferem códigos não sobrepostos. Posteriormente, a teoria do "sem vírgulas" foi refutada.
Por que você precisa saber o código de DNA
O conhecimento do código genético de um organismo vivo permite determinar a informação das moléculas no sentido hereditário e evolutivo. Necessário registro da hereditariedade, revela pesquisas sobre a formação do conhecimento sistêmico no mundo da genética.
A universalidade do código genético é considerada a propriedade mais singular de um organismo vivo. Com base nos dados, você pode obter respostas para a maioria das perguntas de natureza médica e genética.

Uso do conhecimento em medicina e genética

Os avanços da biologia molecular no século XX permitiram um amplo avanço no estudo de doenças e vírus com diferentes bases. As informações sobre o código genético são amplamente utilizadas na medicina e na genética.
A identificação da natureza de uma determinada doença ou vírus é sobreposta ao estudo do desenvolvimento genético. O conhecimento e a formação de teorias e práticas podem curar doenças de difícil tratamento ou incuráveis ​​do mundo moderno e do futuro.

Perspectivas de desenvolvimento

Uma vez que foi cientificamente comprovado que o código genético contém informações não apenas sobre a hereditariedade, mas também sobre a vida útil do organismo, o desenvolvimento da genética coloca a questão da imortalidade e longevidade. Essa perspectiva é apoiada por uma série de hipóteses de imortalidade terrestre, células cancerosas, células-tronco humanas.

Em 1985, um pesquisador do Instituto Técnico, P. Garyaev, descobriu um ponto vazio por acaso de análise espectral, que mais tarde foi chamado de fantasma. Fantasmas identificam moléculas genéticas mortas.
O que marcou ainda mais a teoria da mudança de um organismo vivo ao longo do tempo, que sugere que uma pessoa é capaz de viver por mais de quatrocentos anos.
O fenômeno é que as células de DNA são capazes de emitir vibrações sonoras de cem hertz. Então o DNA pode falar.