Quantas bases nitrogenadas codificam 56 aminoácidos. O que é o código genético: informações gerais

Nucleotídeos de DNA e RNA
  1. Purinas: adenina, guanina
  2. Pirimidinas: citosina, timina (uracil)

códon- um tripleto de nucleotídeos que codifica um aminoácido específico.

aba. 1. Aminoácidos comumente encontrados em proteínas
Nome Abreviação
1. AlaninaAla
2. ArgininaArg
3. AsparaginaAsn
4. Ácido aspárticoáspide
5. CisteínaCys
6. Ácido glutâmicoGlu
7. GlutaminaGln
8. Glicinagly
9. HistidinaDele
10. Isoleucinaarquivo
11. LeucinaLeu
12. LisinaLys
13. MetioninaConheceu
14. FenilalaninaPhe
15. ProlinaPró
16. SérieSer
17. TreoninaThr
18. Triptofanotrp
19. TirosinaTyr
20. ValinaVal

O código genético, também chamado de código de aminoácidos, é um sistema para registrar informações sobre a sequência de aminoácidos em uma proteína usando a sequência de resíduos de nucleotídeos no DNA que contém uma das 4 bases nitrogenadas: adenina (A), guanina (G), citosina (C) e timina (T). No entanto, como a hélice de DNA de fita dupla não está diretamente envolvida na síntese da proteína que é codificada por uma dessas fitas (ou seja, RNA), o código é escrito na linguagem do RNA, na qual o uracil (U) é incluído em vez de timina. Pela mesma razão, costuma-se dizer que um código é uma sequência de nucleotídeos, não pares de bases.

O código genético é representado por certas palavras de código - códons.

A primeira palavra de código foi decifrada por Nirenberg e Mattei em 1961. Eles obtiveram um extrato de E. coli contendo ribossomos e outros fatores necessários para a síntese de proteínas. O resultado foi um sistema livre de células para a síntese de proteínas, que poderia montar uma proteína a partir de aminoácidos se o mRNA necessário fosse adicionado ao meio. Ao adicionar RNA sintético, consistindo apenas de uracilos, ao meio, eles descobriram que uma proteína consistindo apenas de fenilalanina (polifenilalanina) foi formada. Assim, verificou-se que o tripleto de nucleotídeos UUU (códon) corresponde à fenilalanina. Nos próximos 5-6 anos, todos os códons do código genético foram determinados.

O código genético é uma espécie de dicionário que traduz um texto escrito com quatro nucleotídeos em um texto protéico escrito com 20 aminoácidos. O resto dos aminoácidos encontrados na proteína são modificações de um dos 20 aminoácidos.

Propriedades do código genético

O código genético tem as seguintes propriedades.

  1. Triplicidade Cada aminoácido corresponde a um triplo de nucleotídeos. É fácil calcular que existem 4 3 = 64 códons. Destes, 61 são semânticos e 3 são sem sentido (terminação, códons de terminação).
  2. Continuidade(não há caracteres de separação entre nucleotídeos) - ausência de sinais de pontuação intragênicos;

    Dentro de um gene, cada nucleotídeo é parte de um códon significativo. Em 1961 Seymour Benzer e Francis Crick provaram experimentalmente o código tripleto e sua continuidade (compacidade) [mostrar]

    A essência do experimento: mutação "+" - a inserção de um nucleotídeo. Mutação "-" - perda de um nucleotídeo.

    Uma única mutação ("+" ou "-") no início de um gene ou uma mutação dupla ("+" ou "-") estraga todo o gene.

    Uma mutação tripla ("+" ou "-") no início de um gene estraga apenas parte do gene.

    Uma mutação quádrupla "+" ou "-" novamente estraga todo o gene.

    O experimento foi realizado em dois genes de fagos adjacentes e mostrou que

    1. o código é tripleto e não há sinais de pontuação dentro do gene
    2. há sinais de pontuação entre os genes
  3. Presença de sinais de pontuação intergênicos- a presença entre os tripletos de códons de iniciação (começam a biossíntese de proteínas), códons - terminadores (indicam o fim da biossíntese de proteínas);

    Convencionalmente, o códon AUG também pertence aos sinais de pontuação - o primeiro após a sequência líder. Desempenha a função de uma letra maiúscula. Nesta posição, codifica a formilmetionina (em procariontes).

    No final de cada gene que codifica um polipeptídeo, há pelo menos um dos 3 códons de terminação, ou sinais de parada: UAA, UAG, UGA. Eles encerram a transmissão.

  4. Colinearidade- correspondência da sequência linear de códons de mRNA e aminoácidos na proteína.
  5. Especificidade- cada aminoácido corresponde apenas a determinados códons que não podem ser usados ​​para outro aminoácido.
  6. Unidirecional- os códons são lidos em uma direção - do primeiro nucleotídeo para o próximo
  7. Degeneração ou redundância, - um aminoácido pode ser codificado por vários tripletos (aminoácidos - 20, possíveis tripletos - 64, 61 deles são semânticos, ou seja, em média, cada aminoácido corresponde a cerca de 3 códons); a exceção é a metionina (Met) e o triptofano (Trp).

    A razão para a degeneração do código é que a principal carga semântica é transportada pelos dois primeiros nucleotídeos do tripleto, e o terceiro não é tão importante. Daqui regra de degeneração de código : se dois códons têm dois primeiros nucleotídeos idênticos e seus terceiros nucleotídeos pertencem à mesma classe (purina ou pirimidina), então eles codificam o mesmo aminoácido.

    No entanto, existem duas exceções a essa regra ideal. São eles o códon AUA, que deve corresponder não à isoleucina, mas à metionina, e o códon UGA, que é o terminador, enquanto deve corresponder ao triptofano. A degenerescência do código obviamente tem um valor adaptativo.

  8. Versatilidade- todas as propriedades do código genético listadas acima são características de todos os organismos vivos.
    códon Código universal Códigos mitocondriais
    Vertebrados Invertebrados Fermento Plantas
    UGAPAREtrptrptrpPARE
    AUAarquivoConheceuConheceuConheceuarquivo
    CUALeuLeuLeuThrLeu
    AGAArgPARESerArgArg
    AGGArgPARESerArgArg

    Recentemente, o princípio da universalidade do código foi abalado em conexão com a descoberta por Berell em 1979 do código ideal das mitocôndrias humanas, no qual a regra de degeneração do código é satisfeita. No código mitocondrial, o códon UGA corresponde ao triptofano e o AUA à metionina, conforme exigido pela regra de degenerescência do código.

    Talvez, no início da evolução, todos os organismos mais simples tivessem o mesmo código das mitocôndrias, e depois sofreram pequenos desvios.

  9. não sobreposto- cada um dos trigêmeos do texto genético é independente um do outro, um nucleotídeo faz parte de apenas um trigêmeo; Na fig. mostra a diferença entre código sobreposto e não sobreposto.

    Em 1976 O DNA do fago φX174 foi sequenciado. Possui um DNA circular de fita simples de 5375 nucleotídeos. O fago era conhecido por codificar 9 proteínas. Para 6 deles, foram identificados genes localizados um após o outro.

    Descobriu-se que há uma sobreposição. O gene E está completamente dentro do gene D. Seu códon de início aparece como resultado de um deslocamento de um nucleotídeo na leitura. O gene J começa onde termina o gene D. O códon de início do gene J se sobrepõe ao códon de parada do gene D por um deslocamento de dois nucleotídeos. O design é chamado de "mudança de quadro de leitura" por um número de nucleotídeos que não é um múltiplo de três. Até o momento, a sobreposição foi mostrada apenas para alguns fagos.

  10. Imunidade a ruídos- a razão entre o número de substituições conservativas e o número de substituições de radicais.

    Mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas de conservadoras. Mutações de substituições de nucleotídeos que levam a uma mudança na classe do aminoácido codificado são chamadas de radicais.

    Como o mesmo aminoácido pode ser codificado por trigêmeos diferentes, algumas substituições em trigêmeos não levam a uma mudança no aminoácido codificado (por exemplo, UUU -> UUC deixa fenilalanina). Algumas substituições alteram um aminoácido para outro da mesma classe (não polar, polar, básico, ácido), outras substituições também alteram a classe do aminoácido.

    Em cada tripleto, podem ser feitas 9 substituições simples, i.e. você pode escolher qual das posições mudar - de três maneiras (1ª ou 2ª ou 3ª), e a letra selecionada (nucleotídeo) pode ser alterada para 4-1 = 3 outras letras (nucleotídeos). O número total de substituições de nucleotídeos possíveis é 61 por 9 = 549.

    Pela contagem direta na tabela do código genético, pode-se verificar que destes: 23 substituições de nucleotídeos levam ao aparecimento de códons - terminadores de tradução. 134 substituições não alteram o aminoácido codificado. 230 substituições não alteram a classe do aminoácido codificado. 162 substituições levam a uma mudança na classe de aminoácidos, ou seja, são radicais. Das 183 substituições do 3º nucleotídeo, 7 levam ao aparecimento de terminadores de tradução e 176 são conservadoras. Das 183 substituições do 1º nucleotídeo, 9 levam ao aparecimento de terminadores, 114 são conservadoras e 60 são radicais. Das 183 substituições do 2º nucleotídeo, 7 levam ao aparecimento de terminadores, 74 são conservadoras e 102 são radicais.


Em qualquer célula e organismo, todas as características de natureza anatômica, morfológica e funcional são determinadas pela estrutura das proteínas que estão incluídas nelas. A propriedade hereditária de um organismo é a capacidade de sintetizar certas proteínas. Os aminoácidos estão localizados em uma cadeia polipeptídica, da qual dependem as características biológicas.
Cada célula tem sua própria sequência de nucleotídeos na cadeia polinucleotídica de DNA. Este é o código genético do DNA. Por meio dele, são registradas informações sobre a síntese de determinadas proteínas. Sobre o que é o código genético, sobre suas propriedades e informações genéticas é descrito neste artigo.

Um pouco de história

A ideia de que talvez exista um código genético foi formulada por J. Gamow e A. Down em meados do século XX. Eles descreveram que a sequência de nucleotídeos responsável pela síntese de um determinado aminoácido contém pelo menos três ligações. Mais tarde, eles provaram o número exato de três nucleotídeos (esta é uma unidade do código genético), que foi chamado de tripleto ou códon. Há sessenta e quatro nucleotídeos no total, porque a molécula de ácido, onde ocorre o RNA, consiste em resíduos de quatro nucleotídeos diferentes.

Qual é o código genético

O método de codificação da sequência proteica de aminoácidos devido à sequência de nucleotídeos é característico de todas as células e organismos vivos. Isso é o que é o código genético.
Existem quatro nucleotídeos no DNA:

  • adenina - A;
  • guanina - G;
  • citosina - C;
  • timina - T.

Eles são indicados por letras maiúsculas em latim ou (na literatura de língua russa) em russo.
O RNA também possui quatro nucleotídeos, mas um deles é diferente do DNA:

  • adenina - A;
  • guanina - G;
  • citosina - C;
  • uracila - W.

Todos os nucleotídeos se alinham em cadeias, e no DNA é obtida uma dupla hélice e no RNA é única.
As proteínas são construídas onde elas, localizadas em uma determinada sequência, determinam suas propriedades biológicas.

Propriedades do código genético

Triplicidade. A unidade do código genético consiste em três letras, é tripleto. Isso significa que os vinte aminoácidos existentes são codificados por três nucleotídeos específicos chamados códons ou trilpets. Existem sessenta e quatro combinações que podem ser criadas a partir de quatro nucleotídeos. Esta quantidade é mais que suficiente para codificar vinte aminoácidos.
Degeneração. Cada aminoácido corresponde a mais de um códon, com exceção da metionina e do triptofano.
Sem ambiguidade. Um códon codifica um aminoácido. Por exemplo, no gene de uma pessoa saudável com informações sobre o alvo beta da hemoglobina, o trio de GAG ​​e GAA codifica para A em todos que têm anemia falciforme, um nucleotídeo é alterado.
Colinearidade. A sequência de aminoácidos sempre corresponde à sequência de nucleotídeos que o gene contém.
O código genético é contínuo e compacto, o que significa que não possui "pontuações". Ou seja, a partir de um determinado códon, há uma leitura contínua. Por exemplo, AUGGUGTSUUAAAUGUG será lido como: AUG, GUG, CUU, AAU, GUG. Mas não AUG, UGG e assim por diante, ou de qualquer outra forma.
Versatilidade. É o mesmo para absolutamente todos os organismos terrestres, de humanos a peixes, fungos e bactérias.

Mesa

Nem todos os aminoácidos disponíveis estão presentes na tabela apresentada. Hidroxiprolina, hidroxilisina, fosfoserina, derivados de iodo de tirosina, cistina e alguns outros estão ausentes, pois são derivados de outros aminoácidos codificados por mRNA e formados após modificação da proteína como resultado da tradução.
Pelas propriedades do código genético, sabe-se que um códon é capaz de codificar um aminoácido. A exceção é o código genético que desempenha funções e códigos adicionais para valina e metionina. O RNA, estando no início com um códon, liga um t-RNA que transporta o formilmetion. Após a conclusão da síntese, ele se divide e leva consigo o resíduo de formila, transformando-se em um resíduo de metionina. Assim, os códons acima são os iniciadores da síntese de uma cadeia de polipeptídeos. Se eles não estão no início, então eles não são diferentes dos outros.

Informação genética

Este conceito significa um programa de propriedades que é transmitido de ancestrais. Está embutido na hereditariedade como um código genético.
Implementado durante a síntese de proteínas código genético:

  • informação e RNA;
  • rRNA ribossomal.

A informação é transmitida por comunicação direta (DNA-RNA-proteína) e reversa (ambiente-proteína-DNA).
Os organismos podem recebê-lo, armazená-lo, transferi-lo e usá-lo de forma mais eficaz.
Sendo herdada, a informação determina o desenvolvimento de um organismo. Mas devido à interação com o meio ambiente, a reação deste último é distorcida, devido à qual a evolução e o desenvolvimento ocorrem. Assim, novas informações são colocadas no corpo.


O cálculo das leis da biologia molecular e a descoberta do código genético ilustraram a necessidade de combinar a genética com a teoria de Darwin, a partir da qual surgiu uma teoria sintética da evolução - a biologia não clássica.
A hereditariedade, a variabilidade e a seleção natural de Darwin são complementadas pela seleção geneticamente determinada. A evolução é implementada no nível genético por meio de mutações aleatórias e herança das características mais valiosas e mais adaptadas ao ambiente.

Decifrando o código humano

Na década de 90, foi lançado o Projeto Genoma Humano, resultado do qual, nos anos 2000, foram descobertos fragmentos do genoma contendo 99,99% dos genes humanos. Fragmentos que não estão envolvidos na síntese de proteínas e não são codificados permaneceram desconhecidos. Seu papel ainda é desconhecido.

O cromossomo 1, descoberto pela última vez em 2006, é o mais longo do genoma. Mais de trezentas e cinquenta doenças, incluindo o câncer, aparecem como resultado de distúrbios e mutações nele.

O papel de tal pesquisa dificilmente pode ser superestimado. Quando descobriram o que é o código genético, ficou conhecido de acordo com quais padrões de desenvolvimento ocorre, como se forma a estrutura morfológica, a psique, a predisposição a certas doenças, o metabolismo e os vícios dos indivíduos.

No metabolismo do corpo papel de liderança pertence às proteínas e ácidos nucleicos.
As substâncias proteicas formam a base de todas as estruturas celulares vitais, têm uma reatividade extraordinariamente alta e são dotadas de funções catalíticas.
Os ácidos nucleicos fazem parte do órgão mais importante da célula - o núcleo, bem como o citoplasma, ribossomos, mitocôndrias, etc. Os ácidos nucleicos desempenham um papel importante e primário na hereditariedade, variabilidade corporal e síntese de proteínas.

Plano síntese proteína é armazenada no núcleo da célula, e a síntese direta ocorre fora do núcleo, por isso é necessário serviço de entrega codificado plano do núcleo para o local de síntese. Este serviço de entrega é realizado por moléculas de RNA.

O processo começa em essencial células: parte da "escada" do DNA se desenrola e se abre. Devido a isso, as letras de RNA formam ligações com as letras de DNA abertas de uma das fitas de DNA. A enzima transfere as letras do RNA para conectá-las em um fio. Assim, as letras do DNA são "reescritas" nas letras do RNA. A cadeia de RNA recém-formada é separada e a "escada" de DNA se torce novamente. O processo de ler informações do DNA e sintetizar seu molde de RNA é chamado de transcrição , e o RNA sintetizado é chamado de informativo ou i-RNA .

Após outras modificações, esse tipo de mRNA codificado está pronto. i-RNA sai do núcleo e vai para o local de síntese proteica, onde as letras i-RNA são decifradas. Cada conjunto de três letras de i-RNA forma uma "letra" que representa um aminoácido específico.

Outro tipo de RNA procura esse aminoácido, captura-o com a ajuda de uma enzima e o entrega ao local da síntese proteica. Este RNA é chamado de RNA de transferência, ou tRNA. À medida que a mensagem de mRNA é lida e traduzida, a cadeia de aminoácidos cresce. Essa cadeia se torce e se dobra em uma forma única, criando um tipo de proteína. Até o processo de dobramento de proteínas é notável: usar um computador para calcular todas as opções levaria 1027 (!) anos para dobrar uma proteína de tamanho médio consistindo de 100 aminoácidos. E para a formação de uma cadeia de 20 aminoácidos no corpo, não leva mais de um segundo, e esse processo ocorre continuamente em todas as células do corpo.

Genes, código genético e suas propriedades.

Cerca de 7 bilhões de pessoas vivem na Terra. Exceto por 25-30 milhões de pares de gêmeos idênticos, então geneticamente todas as pessoas são diferentes : cada um é único, possui características hereditárias únicas, traços de caráter, habilidades, temperamento.

Tais diferenças são explicadas diferenças de genótipos- conjuntos de genes de um organismo; cada um é único. As características genéticas de um organismo particular são incorporadas em proteínas - consequentemente, a estrutura da proteína de uma pessoa difere, embora bastante, da proteína de outra pessoa.

Isso não significa que os humanos não têm exatamente as mesmas proteínas. Proteínas que desempenham as mesmas funções podem ser iguais ou muito ligeiramente diferentes em um ou dois aminoácidos uma da outra. Mas não existe na Terra de pessoas (com exceção de gêmeos idênticos), em que todas as proteínas seriam são os mesmos .

Informações sobre a estrutura primária de uma proteína codificado como uma sequência de nucleotídeos em uma seção de uma molécula de DNA, gene - uma unidade de informação hereditária de um organismo. Cada molécula de DNA contém muitos genes. A totalidade de todos os genes de um organismo compõe sua genótipo . Nesse caminho,

Um gene é uma unidade de informação hereditária de um organismo, que corresponde a uma seção separada do DNA

A informação hereditária é codificada usando Código genético , que é universal para todos os organismos e difere apenas na alternância de nucleotídeos que formam genes e codificam proteínas de organismos específicos.

Código genético consiste em tripletos (tripletos) de nucleotídeos de DNA, combinados em diferentes sequências (AAT, HCA, ACG, THC, etc.), cada um dos quais codifica um aminoácido específico (que será construído na cadeia polipeptídica).

Na realidade código conta sequência de nucleotídeos em uma molécula de i-RNA , Porque remove informações do DNA (o processo transcrições ) e a traduz em uma sequência de aminoácidos nas moléculas de proteínas sintetizadas (processo transmissões ).
A composição do mRNA inclui nucleotídeos A-C-G-U, cujos trigêmeos são chamados códons : o tripleto CHT DNA no mRNA se tornará o tripleto HCA, e o tripleto AAG DNA se tornará o tripleto UUC. Exatamente códons de i-RNA reflete o código genético no registro.

Nesse caminho, código genético - um sistema unificado para registrar informações hereditárias em moléculas de ácido nucleico na forma de uma sequência de nucleotídeos . O código genético é baseado no uso de um alfabeto composto por apenas quatro letras de nucleotídeos que diferem em bases nitrogenadas: A, T, G, C.

As principais propriedades do código genético:

1. Código genético trio. Um tripleto (códon) é uma sequência de três nucleotídeos que codifica um aminoácido. Como as proteínas contêm 20 aminoácidos, é óbvio que cada um deles não pode ser codificado por um nucleotídeo ( como existem apenas quatro tipos de nucleotídeos no DNA, neste caso, 16 aminoácidos permanecem não codificados). Dois nucleotídeos para codificar aminoácidos também não são suficientes, pois neste caso apenas 16 aminoácidos podem ser codificados. Isso significa que o menor número de nucleotídeos que codificam um aminoácido deve ser pelo menos três. Neste caso, o número de tripletos de nucleotídeos possíveis é 43 = 64.

2. Redundância (degeneração) O código é uma consequência de sua natureza tripleto e significa que um aminoácido pode ser codificado por vários tripletos (já que são 20 aminoácidos e existem 64 tripletos), com exceção da metionina e do triptofano, que são codificados por apenas um trio. Além disso, alguns trigêmeos desempenham funções específicas: na molécula de mRNA, os trigêmeos UAA, UAG, UGA são códons de terminação, ou seja, Pare-sinais que interrompem a síntese da cadeia polipeptídica. O tripleto correspondente à metionina (AUG), situado no início da cadeia de DNA, não codifica um aminoácido, mas desempenha a função de iniciar (excitar) a leitura.

3. Sem ambiguidade code - junto com a redundância, o código tem a propriedade singularidade : cada códon corresponde apenas 1 aminoácido específico.

4. Colinearidade código, ou seja sequência de nucleotídeos em um gene exatamente corresponde à sequência de aminoácidos na proteína.

5. Código genético não sobreposto e compacto , ou seja, não contém "sinais de pontuação". Isso significa que o processo de leitura não permite a possibilidade de sobreposição de colunas (tríplices), e, a partir de um determinado códon, a leitura vai continuamente triplo a triplo até Pare-sinais ( códons de terminação).

6. Código genético universal , ou seja, os genes nucleares de todos os organismos codificam informações sobre proteínas da mesma forma, independentemente do nível de organização e da posição sistemática desses organismos.

Existir tabelas de código genético para descriptografia códons i-RNA e construção de cadeias de moléculas de proteínas.

Reacções de síntese de matrizes.

Nos sistemas vivos, existem reações desconhecidas na natureza inanimada - reações de síntese de matrizes.

O termo "matriz" em tecnologia denotam a forma utilizada para a fundição de moedas, medalhas, tipo tipográfico: o metal endurecido reproduz exatamente todos os detalhes da forma utilizada para a fundição. Síntese de matriz assemelha-se a um molde em uma matriz: novas moléculas são sintetizadas em estrita conformidade com o plano estabelecido na estrutura das moléculas já existentes.

O princípio matricial está no centro as reações sintéticas mais importantes da célula, como a síntese de ácidos nucléicos e proteínas. Nessas reações, é fornecida uma sequência exata e estritamente específica de unidades monoméricas nos polímeros sintetizados.

Este é o lugar onde direcional puxando monômeros para um local específico células - em moléculas que servem de matriz onde ocorre a reação. Se tais reações ocorressem como resultado de uma colisão aleatória de moléculas, elas ocorreriam infinitamente lentamente. A síntese de moléculas complexas com base no princípio da matriz é realizada com rapidez e precisão. O papel da matriz macromoléculas de ácidos nucléicos atuam em reações de matriz ADN ou ARN .

moléculas monoméricas, a partir do qual o polímero é sintetizado - nucleotídeos ou aminoácidos - de acordo com o princípio da complementaridade são dispostos e fixados na matriz em uma ordem estritamente definida e predeterminada.

Então vem "reticulação" de unidades de monômero em uma cadeia de polímero, e o polímero acabado é descartado da matriz.

Depois disso matriz pronta para a montagem de uma nova molécula de polímero. É claro que, assim como apenas uma moeda, uma letra pode ser lançada em um determinado molde, apenas um polímero pode ser "montado" em uma determinada molécula da matriz.

Tipo de matriz de reações- uma característica específica da química dos sistemas vivos. Eles são a base da propriedade fundamental de todos os seres vivos - sua capacidade de reproduzir sua própria espécie.

Reações de síntese de matriz

1. Replicação do DNA - replicação (de lat. replicatio - renovação) - o processo de síntese de uma molécula filha de ácido desoxirribonucleico na matriz da molécula de DNA parental. Durante a divisão subsequente da célula-mãe, cada célula-filha recebe uma cópia de uma molécula de DNA idêntica ao DNA da célula-mãe original. Este processo garante a transmissão precisa da informação genética de geração em geração. A replicação do DNA é realizada por um complexo enzimático complexo, consistindo de 15 a 20 proteínas diferentes, chamadas responsivo . O material para a síntese são os nucleotídeos livres presentes no citoplasma das células. O significado biológico da replicação está na transferência exata da informação hereditária da molécula-mãe para as filhas, o que normalmente ocorre durante a divisão das células somáticas.

A molécula de DNA consiste em duas fitas complementares. Essas cadeias são mantidas juntas por ligações de hidrogênio fracas que podem ser quebradas por enzimas. A molécula de DNA é capaz de se duplicar (replicar) e uma nova metade dela é sintetizada em cada metade antiga da molécula.
Além disso, uma molécula de mRNA pode ser sintetizada em uma molécula de DNA, que então transfere a informação recebida do DNA para o local da síntese proteica.

A transferência de informação e a síntese de proteínas seguem um princípio matricial, comparável ao trabalho de uma impressora em uma gráfica. As informações do DNA são copiadas repetidamente. Se ocorrerem erros durante a cópia, eles serão repetidos em todas as cópias subsequentes.

É verdade que alguns erros na cópia de informações por uma molécula de DNA podem ser corrigidos - o processo de eliminação de erros é chamado reparações. A primeira das reações no processo de transferência de informação é a replicação da molécula de DNA e a síntese de novas fitas de DNA.

2. Transcrição (do latim transcriptio - reescrever) - o processo de síntese de RNA usando DNA como molde, ocorrendo em todas as células vivas. Em outras palavras, é a transferência de informação genética do DNA para o RNA.

A transcrição é catalisada pela enzima RNA polimerase dependente de DNA. A RNA polimerase se move ao longo da molécula de DNA na direção 3" → 5". A transcrição consiste em etapas iniciação, alongamento e terminação . A unidade de transcrição é o operon, um fragmento da molécula de DNA que consiste em promotor, fração transcrita e terminador . O i-RNA consiste em uma fita e é sintetizado no DNA de acordo com a regra da complementaridade com a participação de uma enzima que ativa o início e o fim da síntese da molécula de i-RNA.

A molécula de mRNA finalizada entra no citoplasma nos ribossomos, onde ocorre a síntese de cadeias polipeptídicas.

3. Transmissão (de lat. tradução- transferência, movimento) - o processo de síntese de proteínas a partir de aminoácidos na matriz de informação (matriz) RNA (mRNA, mRNA) realizado pelo ribossomo. Em outras palavras, este é o processo de tradução da informação contida na sequência de nucleotídeos do i-RNA na sequência de aminoácidos do polipeptídeo.

4. Transcrição reversa é o processo de formação de DNA de fita dupla com base em informações de RNA de fita simples. Esse processo é chamado de transcrição reversa, pois a transferência da informação genética ocorre no sentido “reverso” em relação à transcrição. A ideia da transcrição reversa foi inicialmente muito impopular, pois ia contra o dogma central da biologia molecular, que assumia que o DNA é transcrito em RNA e depois traduzido em proteínas.

No entanto, em 1970, Temin e Baltimore descobriram independentemente uma enzima chamada transcriptase reversa (revertase) , e a possibilidade de transcrição reversa foi finalmente confirmada. Em 1975, Temin e Baltimore receberam o Prêmio Nobel de Fisiologia ou Medicina. Alguns vírus (como o vírus da imunodeficiência humana que causa a infecção pelo HIV) têm a capacidade de transcrever RNA em DNA. O HIV tem um genoma de RNA que se integra ao DNA. Como resultado, o DNA do vírus pode ser combinado com o genoma da célula hospedeira. A principal enzima responsável pela síntese de DNA a partir do RNA é chamada de reverter. Uma das funções da reversese é criar DNA complementar (cDNA) do genoma viral. A enzima associada ribonuclease cliva o RNA e a revertase sintetiza o cDNA a partir da dupla hélice do DNA. O cDNA é integrado ao genoma da célula hospedeira pela integrase. O resultado é síntese de proteínas virais pela célula hospedeira que formam novos vírus. No caso do HIV, a apoptose (morte celular) dos linfócitos T também é programada. Em outros casos, a célula pode permanecer como distribuidora de vírus.

A sequência de reações de matriz na biossíntese de proteínas pode ser representada como um diagrama.

Nesse caminho, biossíntese de proteínas- este é um dos tipos de troca plástica, durante a qual a informação hereditária codificada nos genes do DNA é realizada em uma determinada sequência de aminoácidos em moléculas de proteína.

As moléculas de proteína são essencialmente cadeias polipeptídicas formados por aminoácidos individuais. Mas os aminoácidos não são ativos o suficiente para se conectarem por conta própria. Portanto, antes de se combinarem e formarem uma molécula de proteína, os aminoácidos devem ativar . Essa ativação ocorre sob a ação de enzimas especiais.

Como resultado da ativação, o aminoácido torna-se mais lábil e, sob a ação da mesma enzima, liga-se a t- RNA. Cada aminoácido corresponde a um t- RNA, que encontra "seu" aminoácido e perdura para dentro do ribossomo.

Portanto, o ribossomo recebe vários aminoácidos ativados ligados ao seu t- RNA. O ribossomo é como transportador para montar uma cadeia de proteínas a partir de vários aminoácidos que entram nela.

Simultaneamente com o t-RNA, no qual seu próprio aminoácido "senta", " sinal» do DNA que está contido no núcleo. De acordo com este sinal, uma ou outra proteína é sintetizada no ribossomo.

A influência direta do DNA na síntese de proteínas não é realizada diretamente, mas com a ajuda de um intermediário especial - matriz ou RNA mensageiro (mRNA ou i-RNA), que sintetizado no núcleo Não é influenciado pelo DNA, portanto, sua composição reflete a composição do DNA. A molécula de RNA é, por assim dizer, um molde da forma de DNA. O mRNA sintetizado entra no ribossomo e, por assim dizer, o transfere para essa estrutura plano- em que ordem os aminoácidos ativados que entram no ribossomo devem ser combinados entre si para sintetizar uma determinada proteína. Por outro lado, A informação genética codificada no DNA é transferida para o mRNA e depois para a proteína.

A molécula de mRNA entra no ribossomo e pisca sua. Aquele segmento dele que está atualmente no ribossomo é determinado códon (tríplice), interage de forma completamente específica com uma estrutura adequada para isso tripleto (anticódon) no RNA de transferência que trouxe o aminoácido para o ribossomo.

O RNA de transferência com seu aminoácido se aproxima de um certo códon de mRNA e conecta com ele; para o próximo local vizinho de i-RNA une outro tRNA com um aminoácido diferente e assim por diante até que toda a cadeia de i-RNA seja lida, até que todos os aminoácidos sejam encadeados na ordem apropriada, formando uma molécula de proteína. E o t-RNA, que entregou o aminoácido a um local específico da cadeia polipeptídica, livre de seu aminoácido e sai do ribossomo.

Então, novamente no citoplasma, o aminoácido desejado pode se juntar a ele e o transferirá novamente para o ribossomo. No processo de síntese de proteínas, não um, mas vários ribossomos, polirribossomos, estão envolvidos simultaneamente.

As principais etapas da transferência de informação genética:

1. Síntese no DNA como em um modelo de mRNA (transcrição)
2. Síntese da cadeia polipeptídica nos ribossomos de acordo com o programa contido no i-RNA (tradução) .

Os estágios são universais para todos os seres vivos, mas as relações temporais e espaciais desses processos diferem em pró e eucariotos.

No procariontes transcrição e tradução podem ocorrer simultaneamente porque o DNA está localizado no citoplasma. No eucarioto transcrição e tradução são estritamente separadas no espaço e no tempo: a síntese de vários RNAs ocorre no núcleo, após o que as moléculas de RNA devem deixar o núcleo, passando pela membrana nuclear. O RNA é então transportado no citoplasma para o local de síntese proteica.

Eles se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

As proteínas de quase todos os organismos vivos são construídas a partir de apenas 20 tipos de aminoácidos. Esses aminoácidos são chamados canônicos. Cada proteína é uma cadeia ou várias cadeias de aminoácidos conectadas em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas.

C

CUU (Leu/L)Leucina
CUC (Leu/L)Leucina
CUA (Leu/L) Leucina
CUG (Leu/L) Leucina

Em algumas proteínas, aminoácidos não padronizados, como selenocisteína e pirrolisina, são inseridos pelo ribossomo de leitura do códon de parada, que depende das sequências no mRNA. A selenocisteína é agora considerada como o 21º e a pirrolisina como o 22º aminoácido que compõe as proteínas.

Apesar dessas exceções, o código genético de todos os organismos vivos tem características comuns: um códon é composto por três nucleotídeos, onde os dois primeiros são definidores, os códons são traduzidos por tRNA e ribossomos em uma sequência de aminoácidos.

Desvios do código genético padrão.
Exemplo códon significado usual Lê como:
Alguns tipos de levedura do gênero Candida CUG Leucina Sereno
Mitocôndrias, especialmente Saccharomyces cerevisiae CU(U, C, A, G) Leucina Sereno
Mitocôndrias de plantas superiores CGG Arginina triptofano
Mitocôndrias (em todos os organismos estudados, sem exceção) UGA Pare triptofano
Mitocôndrias de mamíferos, Drosophila, S.cerevisiae e muitos simples AUA Isoleucina Metionina = Iniciar
procariontes GUG Valina Começar
Eucariotos (raro) CUG Leucina Começar
Eucariotos (raro) GUG Valina Começar
Procariotos (raro) UUG Leucina Começar
Eucariotos (raro) ACG Treonina Começar
Mitocôndrias de mamíferos AGC, AGU Sereno Pare
Mitocôndrias de Drosophila AGA Arginina Pare
Mitocôndrias de mamíferos UMA MORDAÇA) Arginina Pare

A história das ideias sobre o código genético

No entanto, no início da década de 1960, novos dados revelaram o fracasso da hipótese do "código sem vírgula". Em seguida, experimentos mostraram que os códons, considerados por Crick como sem sentido, podem provocar a síntese de proteínas em um tubo de ensaio e, em 1965, o significado de todos os 64 trigêmeos foi estabelecido. Descobriu-se que alguns códons são simplesmente redundantes, ou seja, vários aminoácidos são codificados por dois, quatro ou até seis trigêmeos.

Veja também

Notas

  1. O código genético suporta a inserção direcionada de dois aminoácidos por um códon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Ciência. 9 de janeiro de 2009;323(5911):259-61.
  2. O códon AUG codifica a metionina, mas também serve como um códon de início - como regra, a tradução começa a partir do primeiro códon AUG do mRNA.
  3. NCBI: "Os códigos genéticos", compilado por Andrzej (Anjay) Elzanowski e Jim Ostell
  4. Jukes TH, Osawa S, O código genético nas mitocôndrias e cloroplastos., Experiência. 1 de dezembro de 1990;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (março de 1992). "Evidências recentes para a evolução do código genético". microbiol. Rev. 56 (1): 229–64. PMID 1579111.
  6. SANGER F. (1952). "O arranjo de aminoácidos em proteínas.". Adv Protein Chem. 7 : 1-67. PMID 14933251.
  7. M. Ichas código biológico. - Paz, 1971.
  8. WATSON JD, CRICK FH. (abril de 1953). «Estrutura molecular dos ácidos nucleicos; uma estrutura para ácido nucleico desoxirribose.". Natureza 171 : 737-738. PMID 13054692.
  9. WATSON JD, CRICK FH. (maio de 1953). "Implicações genéticas da estrutura do ácido desoxirribonucleico.". Natureza 171 : 964-967. PMID 13063483.
  10. Crick F. H. (abril de 1966). "O código genético - ontem, hoje e amanhã." Cold Spring Harb Sym Quant Biol.: 1-9. PMID 5237190.
  11. G. GAMOW (fevereiro de 1954). "Possível relação entre ácido desoxirribonucleico e estruturas de proteínas". Natureza 173 : 318. DOI: 10.1038/173318a0 . PMID 13882203.
  12. GAMOW G, RICH A, YCAS M. (1956). "O problema da transferência de informação dos ácidos nucleicos para as proteínas.". Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). CORRELAÇÃO ESTATÍSTICA DA COMPOSIÇÃO DE PROTEÍNAS E ÁCIDO RIBONUCLEICO. ". Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789.
  14. Crick FH, Griffith JS, Orgel LE. (1957). CÓDIGOS SEM VÍRGULAS. ". Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032.
  15. Hayes B. (1998). "A invenção do código genético." (Reimpressão em PDF). cientista americano 86 : 8-14.

Literatura

  • Azimov A. Código genético. Da teoria da evolução à decodificação do DNA. - M.: Tsentrpoligraf, 2006. - 208 s - ISBN 5-9524-2230-6.
  • Ratner V. A. Código genético como sistema - Soros Educational Journal, 2000, 6, No. 3, pp. 17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. Natureza geral do código genético das proteínas - Nature, 1961 (192), pp. 1227-32

Links

  • Código genético- artigo da Grande Enciclopédia Soviética

Fundação Wikimedia. 2010.

Código genético- um método inerente a todos os organismos vivos para codificar a sequência de resíduos de aminoácidos na composição de proteínas utilizando a sequência de nucleotídeos na composição do ácido nucleico.

Quatro bases nitrogenadas são usadas no DNA - adenina (A), guanina (G), citosina (C), timina (T), que na literatura russa são denotadas pelas letras A, G, C e T. Essas letras compõem o alfabeto do código genético. O RNA usa os mesmos nucleotídeos, exceto pelo nucleotídeo contendo timina, que é substituído por um nucleotídeo semelhante contendo uracila, que é indicado pela letra U (U na literatura em língua russa). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

As proteínas de quase todos os organismos vivos são construídas a partir de apenas 20 tipos de aminoácidos. Esses aminoácidos são chamados canônicos. Cada proteína é uma cadeia ou várias cadeias de aminoácidos conectadas em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas.

A implementação da informação genética em células vivas (ou seja, a síntese de uma proteína codificada por um gene) é realizada por meio de dois processos matriciais: transcrição (ou seja, a síntese de mRNA em um molde de DNA) e tradução do código genético em uma sequência de aminoácidos (síntese de uma cadeia polipeptídica no mRNA). Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, assim como o sinal de parada, que significa o fim da sequência da proteína. Um conjunto de três nucleotídeos é chamado de tripleto. As abreviaturas aceitas correspondentes a aminoácidos e códons são mostradas na figura. O conceito de "código genético" nada tem a ver com a sequência de tripletos (códons) em um ácido nucleico e, consequentemente, com a sequência de resíduos de aminoácidos em uma molécula de proteína. O código genético é uma forma de registro, não o conteúdo da gravação.

Código genético comum à maioria dos pró e eucariotos. A tabela lista todos os 64 códons e lista os aminoácidos correspondentes. A ordem de base é da extremidade 5' para a extremidade 3' do mRNA.

código genético padrão

base
2ª base
base
você C UMA G
você UUU (Phe/F) Fenilalanina UCU (Ser/S) Serina UAU (Tyr/Y) Tirosina UGU (Cys/C) Cisteína você
UUC UCC UAC UGC C
UUA (Leu/L) Leucina UCA Emirados Árabes Unidos Pare ( Ocre) UGA Pare ( Opala) UMA
UUG UCG UAG Pare ( Âmbar) UGG (Trp/W) Triptofano G
C CUU CCU (Pro/P) Prolina CAU (His/H) Histidina CGU (Arg/R) Arginina você
CUC CCC CAC CGC C
CUA CCA CAA (Gln/Q) Glutamina CGA UMA
CUG CCG CAG CGG G
UMA AUU (Ile/I) Isoleucina ACU (Thr/T) Treonina AAU (Asn/N) Asparagina AGU (Ser/S) Serina você
AUC ACC AAC AGC C
AUA ACA AAA (Lis/K) Lisina AGA (Arg/R) Arginina UMA
AGO[A] (Met/M) Metionina ACG AAG AGG G
G GUU (Val/V) Valina GCU (Ala/A) Alanina GAU (Asp/D) Ácido aspártico GGU (Gly/G) Glicina você
GUC GCC GAC GGC C
GU GCA GAA (Glu/E) Ácido glutâmico GGA UMA
GUG GCG MORDAÇA GGG G
UMA O códon AUG codifica a metionina e também é o local de iniciação da tradução: o primeiro códon AUG na região de codificação do mRNA serve como o início da síntese proteica. Versão do setor do registro, o círculo interno é a 1ª base do códon (da extremidade 5') Tabela reversa (os códons para cada aminoácido são indicados, bem como os códons de parada)
Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AGO
Asp/D GAU, GAC Fe/F UUU, UUC
Cys/C UGU, UGC Suporte CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Serviço/S UCU, UCC, UCA, UCG, AGU, AGC
Cola GA, GA Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
Seu/H CA, CAC Tyr/Y UAU, UAC
Ile/I UAU, UAU, UAU Val/V GU, GU, GU, GU, GU
COMEÇAR AGO PARE UAG, UGA, UAA
Desvios do código genético padrão
Exemplo códon significado usual Lê como:
Alguns tipos de levedura do gênero Candida CUG Leucina Sereno
Mitocôndrias, especialmente Saccharomyces cerevisiae CU(U, C, A, G) Leucina Sereno
Mitocôndrias de plantas superiores CGG Arginina triptofano
Mitocôndrias (em todos os organismos estudados, sem exceção) UGA Pare triptofano
Genoma nuclear dos ciliados Euplotes UGA Pare Cisteína ou selenocisteína
Mitocôndrias de mamíferos, Drosophila, S.cerevisiae e muitos simples AUA Isoleucina Metionina = Iniciar
procariontes GUG Valina Começar
Eucariotos (raro) CUG Leucina Começar
Eucariotos (raro) GUG Valina Começar
Procariotos (raro) UUG Leucina Começar
Eucariotos (raro) ACG Treonina Começar
Mitocôndrias de mamíferos AGC, AGU Sereno Pare
Mitocôndrias de Drosophila AGA Arginina Pare
Mitocôndrias de mamíferos UMA MORDAÇA) Arginina Pare