O código genético é caracterizado. As principais propriedades do código genético e seu significado

Cada organismo vivo tem um conjunto especial de proteínas. Certos compostos de nucleotídeos e sua sequência na molécula de DNA formam o código genético. Ele transmite informações sobre a estrutura da proteína. Na genética, um certo conceito foi adotado. Segundo ela, um gene correspondia a uma enzima (polipeptídeo). Deve-se dizer que a pesquisa sobre ácidos nucléicos e proteínas foi realizada por um período bastante longo. Mais adiante no artigo, examinaremos mais de perto o código genético e suas propriedades. Também será apresentada uma breve cronologia da pesquisa.

Terminologia

O código genético é uma forma de codificar a sequência de proteínas de aminoácidos usando a sequência de nucleotídeos. Este método de formação de informação é característico de todos os organismos vivos. As proteínas são substâncias orgânicas naturais com alto peso molecular. Esses compostos também estão presentes em organismos vivos. Eles consistem em 20 tipos de aminoácidos, que são chamados de canônicos. Os aminoácidos são organizados em uma cadeia e conectados em uma sequência estritamente estabelecida. Ele determina a estrutura da proteína e suas propriedades biológicas. Existem também várias cadeias de aminoácidos na proteína.

ADN e ARN

O ácido desoxirribonucleico é uma macromolécula. Ela é responsável pela transmissão, armazenamento e implementação de informações hereditárias. O DNA usa quatro bases nitrogenadas. Estes incluem adenina, guanina, citosina, timina. O RNA consiste nos mesmos nucleotídeos, exceto aquele que contém timina. Em vez disso, está presente um nucleótido contendo uracilo (U). As moléculas de RNA e DNA são cadeias de nucleotídeos. Graças a essa estrutura, as sequências são formadas - o "alfabeto genético".

Implementação de informações

A síntese de uma proteína codificada por um gene é realizada pela combinação de mRNA em um molde de DNA (transcrição). Há também uma transferência do código genético para uma sequência de aminoácidos. Ou seja, ocorre a síntese da cadeia polipeptídica no mRNA. Para codificar todos os aminoácidos e sinalizar o fim da sequência da proteína, 3 nucleotídeos são suficientes. Essa cadeia é chamada de tripleto.

Histórico de pesquisa

O estudo de proteínas e ácidos nucleicos é realizado há muito tempo. Em meados do século 20, as primeiras ideias sobre a natureza do código genético finalmente apareceram. Em 1953, descobriu-se que algumas proteínas são constituídas por sequências de aminoácidos. É verdade que naquela época eles ainda não podiam determinar seu número exato, e havia inúmeras disputas sobre isso. Em 1953, Watson e Crick publicaram dois artigos. O primeiro declarava a estrutura secundária do DNA, o segundo falava de sua admissível cópia por meio de síntese matricial. Além disso, destacou-se o fato de que determinada sequência de bases é um código que carrega informações hereditárias. O físico americano e soviético Georgy Gamov admitiu a hipótese de codificação e encontrou um método para testá-la. Em 1954, seu trabalho foi publicado, durante o qual ele apresentou uma proposta para estabelecer correspondências entre cadeias laterais de aminoácidos e "buracos" em forma de diamante e usar isso como mecanismo de codificação. Então foi chamado de rômbico. Explicando seu trabalho, Gamow admitiu que o código genético poderia ser trigêmeo. O trabalho de um físico foi um dos primeiros entre os considerados próximos da verdade.

Classificação

Após vários anos, vários modelos de códigos genéticos foram propostos, representando dois tipos: sobrepostos e não sobrepostos. A primeira foi baseada na ocorrência de um nucleotídeo na composição de vários códons. O código genético triangular, sequencial e maior-menor pertence a ele. O segundo modelo assume dois tipos. Não sobrepostos incluem combinacional e "código sem vírgulas". A primeira variante é baseada na codificação de um aminoácido por tripletos de nucleotídeos, sendo sua composição a principal. De acordo com o "código sem vírgula", certos trigêmeos correspondem a aminoácidos, enquanto o resto não. Nesse caso, acreditava-se que, se quaisquer trigêmeos significativos fossem dispostos sequencialmente, outros localizados em uma estrutura de leitura diferente seriam desnecessários. Os cientistas acreditavam que era possível selecionar uma sequência de nucleotídeos que atendesse a esses requisitos e que havia exatamente 20 trigêmeos.

Embora Gamow et al questionassem esse modelo, ele foi considerado o mais correto nos cinco anos seguintes. No início da segunda metade do século XX, surgiram novos dados que permitiram detectar algumas deficiências no "código sem vírgulas". Verificou-se que os códons são capazes de induzir a síntese de proteínas in vitro. Mais perto de 1965, eles compreenderam o princípio de todos os 64 trigêmeos. Como resultado, foi encontrada redundância de alguns códons. Em outras palavras, a sequência de aminoácidos é codificada por vários tripletos.

Características distintas

As propriedades do código genético incluem:

Variações

Pela primeira vez, o desvio do código genético do padrão foi descoberto em 1979 durante o estudo dos genes mitocondriais no corpo humano. Outras variantes semelhantes foram identificadas, incluindo muitos códigos mitocondriais alternativos. Estes incluem a decifração do códon de parada UGA usado como definição de triptofano em micoplasmas. GUG e UUG em archaea e bactérias são frequentemente usados ​​como variantes iniciais. Às vezes, os genes codificam uma proteína a partir de um códon de iniciação que difere daquele normalmente usado por essa espécie. Além disso, em algumas proteínas, a selenocisteína e a pirrolisina, que são aminoácidos não padronizados, são inseridas pelo ribossomo. Ela lê o códon de parada. Depende das sequências encontradas no mRNA. Atualmente, a selenocisteína é considerada o 21º, pirrolisano – o 22º aminoácido presente nas proteínas.

Características gerais do código genético

No entanto, todas as exceções são raras. Nos organismos vivos, em geral, o código genético tem uma série de características comuns. Estes incluem a composição do códon, que inclui três nucleotídeos (os dois primeiros pertencem aos determinantes), a transferência de códons por tRNA e ribossomos em uma sequência de aminoácidos.

Eles se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

As proteínas de quase todos os organismos vivos são construídas a partir de apenas 20 tipos de aminoácidos. Esses aminoácidos são chamados canônicos. Cada proteína é uma cadeia ou várias cadeias de aminoácidos conectadas em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas.

C

CUU (Leu/L)Leucina
CUC (Leu/L) Leucina
CUA (Leu/L)Leucina
CUG (Leu/L) Leucina

Em algumas proteínas, aminoácidos não padronizados, como selenocisteína e pirrolisina, são inseridos pelo ribossomo de leitura do códon de parada, que depende das sequências no mRNA. A selenocisteína é agora considerada como o 21º e a pirrolisina como o 22º aminoácido que compõe as proteínas.

Apesar dessas exceções, o código genético de todos os organismos vivos tem características comuns: um códon é composto por três nucleotídeos, onde os dois primeiros são definidores, os códons são traduzidos por tRNA e ribossomos em uma sequência de aminoácidos.

Desvios do código genético padrão.
Exemplo códon Valor normal Lê como:
Alguns tipos de levedura do gênero Candida CUG Leucina Sereno
Mitocôndrias, especialmente Saccharomyces cerevisiae CU(U, C, A, G) Leucina Sereno
Mitocôndrias de plantas superiores CGG Arginina triptofano
Mitocôndrias (em todos os organismos estudados, sem exceção) UGA Pare triptofano
Mitocôndrias de mamíferos, Drosophila, S.cerevisiae e muitos simples AUA Isoleucina Metionina = Iniciar
procariontes GUG Valina Começar
Eucariotos (raro) CUG Leucina Começar
Eucariotos (raro) GUG Valina Começar
Procariotos (raro) UUG Leucina Começar
Eucariotos (raro) ACG Treonina Começar
Mitocôndrias de mamíferos AGC, AGU Sereno Pare
Mitocôndrias de Drosophila AGA Arginina Pare
Mitocôndrias de mamíferos UMA MORDAÇA) Arginina Pare

A história das ideias sobre o código genético

No entanto, no início da década de 1960, novos dados revelaram o fracasso da hipótese do "código sem vírgula". Em seguida, experimentos mostraram que os códons, considerados por Crick como sem sentido, podem provocar a síntese de proteínas em um tubo de ensaio e, em 1965, o significado de todos os 64 trigêmeos foi estabelecido. Descobriu-se que alguns códons são simplesmente redundantes, ou seja, vários aminoácidos são codificados por dois, quatro ou até seis trigêmeos.

Veja também

Notas

  1. O código genético suporta a inserção direcionada de dois aminoácidos por um códon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Ciência. 9 de janeiro de 2009;323(5911):259-61.
  2. O códon AUG codifica a metionina, mas também serve como um códon de início - como regra, a tradução começa a partir do primeiro códon AUG do mRNA.
  3. NCBI: "Os códigos genéticos", compilado por Andrzej (Anjay) Elzanowski e Jim Ostell
  4. Jukes TH, Osawa S, O código genético nas mitocôndrias e cloroplastos., Experiência. 1 de dezembro de 1990;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (março de 1992). "Evidências recentes para a evolução do código genético". microbiol. Rev. 56 (1): 229–64. PMID 1579111.
  6. SANGER F. (1952). "O arranjo de aminoácidos em proteínas.". Adv Protein Chem. 7 : 1-67. PMID 14933251.
  7. M. Ichas código biológico. - Paz, 1971.
  8. WATSON JD, CRICK FH. (abril de 1953). «Estrutura molecular dos ácidos nucleicos; uma estrutura para ácido nucleico desoxirribose.". Natureza 171 : 737-738. PMID 13054692.
  9. WATSON JD, CRICK FH. (maio de 1953). "Implicações genéticas da estrutura do ácido desoxirribonucleico.". Natureza 171 : 964-967. PMID 13063483.
  10. Crick F. H. (abril de 1966). "O código genético - ontem, hoje e amanhã." Cold Spring Harb Sym Quant Biol.: 1-9. PMID 5237190.
  11. G. GAMOW (fevereiro de 1954). "Possível relação entre ácido desoxirribonucleico e estruturas de proteínas". Natureza 173 : 318. DOI: 10.1038/173318a0 . PMID 13882203.
  12. GAMOW G, RICH A, YCAS M. (1956). "O problema da transferência de informação dos ácidos nucleicos para as proteínas.". Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). CORRELAÇÃO ESTATÍSTICA DA COMPOSIÇÃO DE PROTEÍNAS E ÁCIDO RIBONUCLEICO. ". Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789.
  14. Crick FH, Griffith JS, Orgel LE. (1957). CÓDIGOS SEM VÍRGULAS. ". Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032.
  15. Hayes B. (1998). "A invenção do código genético." (Reimpressão em PDF). cientista americano 86 : 8-14.

Literatura

  • Azimov A. Código genético. Da teoria da evolução à decodificação do DNA. - M.: Tsentrpoligraf, 2006. - 208 s - ISBN 5-9524-2230-6.
  • Ratner V. A. Código genético como sistema - Soros Educational Journal, 2000, 6, No. 3, pp. 17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. Natureza geral do código genético das proteínas - Nature, 1961 (192), pp. 1227-32

Links

  • Código genético- artigo da Grande Enciclopédia Soviética

Fundação Wikimedia. 2010.

Classificação genética

1) Pela natureza da interação no par alélico:

Dominante (um gene capaz de suprimir a manifestação de um gene alélico recessivo); - recessivo (um gene cuja manifestação é suprimida por um gene alélico dominante).

2) Classificação funcional:

2) Código genético- estas são certas combinações de nucleotídeos e a sequência de sua localização na molécula de DNA. Esta é uma forma de codificar a sequência de aminoácidos de proteínas usando uma sequência de nucleotídeos, característica de todos os organismos vivos.

Quatro nucleotídeos são usados ​​no DNA - adenina (A), guanina (G), citosina (C), timina (T), que na literatura de língua russa são denotados pelas letras A, G, T e C. Essas letras compõem o alfabeto do código genético. No RNA, os mesmos nucleotídeos são usados, com exceção da timina, que é substituída por um nucleotídeo semelhante - uracil, indicado pela letra U (U na literatura em russo). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

Existem 20 aminoácidos diferentes usados ​​na natureza para construir proteínas. Cada proteína é uma cadeia ou várias cadeias de aminoácidos em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas. O conjunto de aminoácidos também é universal para quase todos os organismos vivos.

A implementação da informação genética em células vivas (ou seja, a síntese de uma proteína codificada por um gene) é realizada usando dois processos matriciais: transcrição (ou seja, síntese de mRNA em um molde de DNA) e tradução do código genético em um aminoácido sequência (síntese de uma cadeia polipeptídica em um molde de mRNA). Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, assim como o sinal de parada, que significa o fim da sequência da proteína. Um conjunto de três nucleotídeos é chamado de tripleto. As abreviaturas aceitas correspondentes a aminoácidos e códons são mostradas na figura.

Propriedades do código genético

1. Triplicidade- uma unidade significativa do código é uma combinação de três nucleotídeos (tripleto ou códon).

2. Continuidade- não há sinais de pontuação entre os trigêmeos, ou seja, a informação é lida continuamente.

3. discrição- o mesmo nucleotídeo não pode fazer parte simultaneamente de dois ou mais trigêmeos.

4. Especificidade- um certo códon corresponde a apenas um aminoácido.

5. Degeneração (redundância) Vários códons podem corresponder ao mesmo aminoácido.

6. Versatilidade - Código genético funciona da mesma forma em organismos de diferentes níveis de complexidade - de vírus a humanos. (os métodos de engenharia genética são baseados nisso)

3) transcrição - o processo de síntese de RNA usando DNA como modelo que ocorre em todas as células vivas. Em outras palavras, é a transferência de informação genética do DNA para o RNA.

A transcrição é catalisada pela enzima RNA polimerase dependente de DNA. O processo de síntese de RNA prossegue na direção de 5 "- para 3" - final, ou seja, a RNA polimerase se move ao longo da cadeia de DNA molde na direção 3 "-> 5"

A transcrição consiste nos estágios de iniciação, alongamento e término.

Iniciação da transcrição- um processo complexo que depende da sequência de DNA próxima à sequência transcrita (e em eucariotos também em partes mais distantes do genoma - potenciadores e silenciadores) e da presença ou ausência de vários fatores proteicos.

Alongamento- O desenrolamento da síntese de DNA e RNA ao longo da cadeia de codificação continua. ele, como a síntese de DNA, é realizado na direção 5-3

Terminação- assim que a polimerase atinge o terminador, ela é imediatamente clivada do DNA, o híbrido DNA-RNA local é destruído e o RNA recém-sintetizado é transportado do núcleo para o citoplasma, onde a transcrição é completada.

Em processamento- um conjunto de reações que levam à transformação dos produtos primários da transcrição e tradução em moléculas funcionais. Os itens estão sujeitos à decomposição de moléculas precursoras funcionalmente inativas. ácido ribonucleico (tRNA, rRNA, mRNA) e muitos outros. proteínas.

No processo de síntese de enzimas catabólicas (clivando substratos), os procariontes sofrem síntese induzida de enzimas. Isso dá à célula a oportunidade de se adaptar às condições ambientais e economizar energia, interrompendo a síntese da enzima correspondente se a necessidade dela desaparecer.
Para induzir a síntese de enzimas catabólicas, são necessárias as seguintes condições:

1. A enzima é sintetizada apenas quando a clivagem do substrato correspondente é necessária para a célula.
2. A concentração de substrato no meio deve exceder um certo nível antes que a enzima correspondente possa ser formada.
O mecanismo de regulação da expressão gênica em Escherichia coli é melhor estudado usando o exemplo do operon lac, que controla a síntese de três enzimas catabólicas que quebram a lactose. Se houver muita glicose e pouca lactose na célula, o promotor permanece inativo e a proteína repressora está localizada no operador - a transcrição do operon lac é bloqueada. Quando a quantidade de glicose no ambiente e, portanto, na célula, diminui e a lactose aumenta, ocorrem os seguintes eventos: a quantidade de monofosfato de adenosina cíclico aumenta, ele se liga à proteína CAP - esse complexo ativa o promotor ao qual a RNA polimerase liga; ao mesmo tempo, o excesso de lactose se liga à proteína repressora e libera o operador dela - o caminho para a RNA polimerase é aberto, a transcrição dos genes estruturais do operon lac começa. A lactose atua como um indutor para a síntese das enzimas que a quebram.

5) Regulação da expressão gênica em eucariotosé muito mais difícil. Diferentes tipos de células de um organismo eucariótico multicelular sintetizam várias proteínas idênticas e ao mesmo tempo diferem umas das outras em um conjunto de proteínas específicas para células desse tipo. O nível de produção depende do tipo de células, bem como do estágio de desenvolvimento do organismo. A expressão do gene é regulada ao nível da célula e ao nível do organismo. Os genes das células eucarióticas são divididos em dois tipos principais: o primeiro determina a universalidade das funções celulares, o segundo determina (determina) funções celulares especializadas. Funções dos genes primeiro grupo aparecer em todas as células. Para realizar funções diferenciadas, células especializadas devem expressar um conjunto específico de genes.
Cromossomos, genes e operons de células eucarióticas possuem uma série de características estruturais e funcionais, o que explica a complexidade da expressão gênica.
1. Os operons das células eucarióticas possuem vários genes - reguladores, que podem estar localizados em diferentes cromossomos.
2. Os genes estruturais que controlam a síntese de enzimas de um processo bioquímico podem estar concentrados em vários operons localizados não apenas em uma molécula de DNA, mas também em várias.
3. Sequência complexa da molécula de DNA. Existem seções informativas e não informativas, sequências nucleotídicas informativas únicas e repetidas repetidamente.
4. Os genes eucarióticos consistem em éxons e íntrons, e a maturação do mRNA é acompanhada pela excisão de íntrons dos correspondentes transcritos de RNA primário (pró-i-RNA), ou seja, emenda.
5. O processo de transcrição gênica depende do estado da cromatina. A compactação local do DNA bloqueia completamente a síntese de RNA.
6. A transcrição em células eucarióticas nem sempre está associada à tradução. O mRNA sintetizado pode ser armazenado como informassomas por um longo tempo. A transcrição e a tradução ocorrem em compartimentos diferentes.
7. Alguns genes eucarióticos têm localização não permanente (genes lábeis ou transposons).
8. Métodos de biologia molecular revelaram o efeito inibitório das proteínas histonas na síntese de mRNA.
9. No processo de desenvolvimento e diferenciação dos órgãos, a atividade dos genes depende dos hormônios que circulam no corpo e provocam reações específicas em determinadas células. Nos mamíferos, a ação dos hormônios sexuais é importante.
10. Em eucariotos, 5-10% dos genes são expressos em cada estágio da ontogênese, o restante deve ser bloqueado.

6) reparação de material genético

Reparo genético- o processo de eliminação de danos genéticos e restauração do aparelho hereditário, que ocorre nas células de organismos vivos sob a ação de enzimas especiais. A capacidade das células de reparar danos genéticos foi descoberta pela primeira vez em 1949 pelo geneticista americano A. Kelner. Reparar- uma função especial das células, que consiste na capacidade de corrigir danos químicos e quebras nas moléculas de DNA danificadas durante a biossíntese normal do DNA na célula ou como resultado da exposição a agentes físicos ou químicos. É realizado por sistemas enzimáticos especiais da célula. Várias doenças hereditárias (por exemplo, xeroderma pigmentoso) estão associadas a sistemas de reparo deficientes.

tipos de reparações:

O reparo direto é a maneira mais simples de eliminar danos no DNA, que geralmente envolve enzimas específicas que podem reparar rapidamente (geralmente em um estágio) o dano correspondente, restaurando a estrutura original dos nucleotídeos. É assim que atua, por exemplo, a O6-metilguanina-DNA-metiltransferase, que remove o grupo metil da base nitrogenada para um de seus próprios resíduos de cisteína.

Ministério da Educação e Ciência da Federação Russa Agência Federal de Educação

Instituição Educacional Estadual de Educação Profissional Superior "Universidade Técnica Estadual de Altai em homenagem a I.I. Polzunov"

Departamento de Ciências Naturais e Análise de Sistemas

Ensaio sobre o tema "Código genético"

1. O conceito de código genético

3. Informação genética

Bibliografia


1. O conceito de código genético

O código genético é um sistema unificado de registro de informações hereditárias em moléculas de ácido nucleico na forma de uma sequência de nucleotídeos, característica de organismos vivos. Cada nucleotídeo é denotado por uma letra maiúscula, que inicia o nome da base nitrogenada que faz parte dele: - A (A) adenina; - G (G) guanina; - C (C) citosina; - T (T) timina (no DNA) ou U (U) uracil (no mRNA).

A implementação do código genético na célula ocorre em duas etapas: transcrição e tradução.

A primeira delas ocorre no núcleo; consiste na síntese de moléculas de mRNA nas seções correspondentes de DNA. Nesse caso, a sequência de nucleotídeos de DNA é "reescrita" na sequência de nucleotídeos de RNA. A segunda etapa ocorre no citoplasma, nos ribossomos; neste caso, a sequência de nucleotídeos do i-RNA é traduzida na sequência de aminoácidos na proteína: esta etapa prossegue com a participação do RNA de transferência (t-RNA) e das enzimas correspondentes.

2. Propriedades do código genético

1. Triplicidade

Cada aminoácido é codificado por uma sequência de 3 nucleotídeos.

Um tripleto ou códon é uma sequência de três nucleotídeos que codifica um aminoácido.


O código não pode ser monopleto, pois 4 (o número de nucleotídeos diferentes no DNA) é menor que 20. O código não pode ser dublado, porque 16 (o número de combinações e permutações de 4 nucleotídeos por 2) é menor que 20. O código pode ser tripleto, porque 64 (o número de combinações e permutações de 4 a 3) é maior que 20.

2. Degeneração.

Todos os aminoácidos, exceto metionina e triptofano, são codificados por mais de um tripleto: 2 aminoácidos 1 tripleto = 2 9 aminoácidos 2 tripletos cada = 18 1 aminoácido 3 tripletos = 3 5 aminoácidos 4 tripletos cada = 20 3 aminoácidos 6 tripletos cada = 18 Total de 61 códigos tripletos para 20 aminoácidos.

3. A presença de sinais de pontuação intergênicos.

Um gene é uma seção de DNA que codifica uma cadeia polipeptídica ou uma molécula de tRNA, rRNA ou sRNA.

Os genes tRNA, rRNA e sRNA não codificam proteínas.

No final de cada gene que codifica um polipeptídeo, há pelo menos um dos 3 códons de terminação, ou sinais de parada: UAA, UAG, UGA. Eles encerram a transmissão.

Convencionalmente, o códon AUG também pertence aos sinais de pontuação - o primeiro após a sequência líder. Desempenha a função de uma letra maiúscula. Nesta posição, codifica a formilmetionina (em procariontes).

4. Singularidade.

Cada tripleto codifica apenas um aminoácido ou é um terminador de tradução.

A exceção é o códon AUG. Nos procariontes, na primeira posição (letra maiúscula) codifica a formilmetionina, e em qualquer outra posição codifica a metionina.

5. Compacidade ou ausência de pontuações intragênicas.

Dentro de um gene, cada nucleotídeo é parte de um códon significativo.

Em 1961 Seymour Benzer e Francis Crick provaram experimentalmente que o código é triplo e compacto.

A essência do experimento: mutação "+" - a inserção de um nucleotídeo. Mutação "-" - perda de um nucleotídeo. Uma única mutação "+" ou "-" no início de um gene corrompe o gene inteiro. Uma mutação dupla "+" ou "-" também estraga todo o gene. Uma mutação tripla "+" ou "-" no início do gene estraga apenas parte dele. Uma mutação quádrupla "+" ou "-" novamente estraga todo o gene.

O experimento prova que o código é triplo e não há sinais de pontuação dentro do gene. O experimento foi realizado em dois genes de fagos adjacentes e mostrou, além disso, a presença de marcas de pontuação entre os genes.

3. Informação genética

A informação genética é um programa das propriedades de um organismo, recebido de ancestrais e embutido em estruturas hereditárias na forma de um código genético.

Supõe-se que a formação da informação genética procedeu de acordo com o esquema: processos geoquímicos - formação mineral - catálise evolutiva (autocatálise).

É possível que os primeiros genes primitivos fossem cristais microcristalinos de argila, e cada nova camada de argila se alinhe de acordo com as características estruturais da anterior, como se recebesse informações sobre a estrutura dela.

A realização da informação genética ocorre no processo de síntese de moléculas proteicas com o auxílio de três RNAs: informacional (mRNA), de transporte (tRNA) e ribossomal (rRNA). O processo de transferência de informação passa: - pelo canal de comunicação direta: DNA - RNA - proteína; e - através do canal de retroalimentação: ambiente - proteína - DNA.

Os organismos vivos são capazes de receber, armazenar e transmitir informações. Além disso, os organismos vivos tendem a usar as informações recebidas sobre si mesmos e o mundo ao seu redor da maneira mais eficiente possível. A informação hereditária embutida nos genes e necessária para a existência, desenvolvimento e reprodução de um organismo vivo é transmitida de cada indivíduo para seus descendentes. Essas informações determinam a direção do desenvolvimento do organismo e, no processo de sua interação com o ambiente, a reação ao seu indivíduo pode ser distorcida, garantindo assim a evolução do desenvolvimento dos descendentes. No processo de evolução de um organismo vivo, novas informações surgem e são lembradas, inclusive o valor da informação para ela aumenta.

No curso da implementação de informações hereditárias sob certas condições ambientais, o fenótipo de organismos de uma determinada espécie biológica é formado.

A informação genética determina a estrutura morfológica, crescimento, desenvolvimento, metabolismo, armazém mental, predisposição a doenças e defeitos genéticos do corpo.

Muitos cientistas, enfatizando com razão o papel da informação na formação e evolução dos seres vivos, notaram essa circunstância como um dos principais critérios da vida. Então, V. I. Karagodin acredita: “O viver é tal forma de existência da informação e das estruturas por ela codificadas, que garante a reprodução dessa informação em condições ambientais adequadas”. A conexão da informação com a vida também é notada por A.A. Lyapunov: "A vida é um estado altamente ordenado da matéria que usa informações codificadas pelos estados de moléculas individuais para desenvolver reações persistentes." Nosso conhecido astrofísico N.S. Kardashev também enfatiza o componente informacional da vida: “A vida surge devido à possibilidade de sintetizar um tipo especial de moléculas que são capazes de lembrar e usar a princípio as informações mais simples sobre o ambiente e sua própria estrutura, que usam para autopreservação. , para reprodução e, o que é especialmente importante para nós, para obter mais informações." O ecologista F. Tipler chama a atenção para essa capacidade dos organismos vivos de armazenar e transmitir informações em seu livro "Física da Imortalidade": "Eu defino a vida como algum tipo de informação codificada que é preservada pela seleção natural". Além disso, ele acredita que, se for assim, então o sistema de informação da vida é eterno, infinito e imortal.

A descoberta do código genético e o estabelecimento de padrões na biologia molecular mostraram a necessidade de combinar a genética moderna com a teoria da evolução de Darwin. Assim, nasceu um novo paradigma biológico - a teoria sintética da evolução (STE), que já pode ser considerada como biologia não clássica.

As principais ideias da evolução de Darwin com sua tríade - hereditariedade, variabilidade, seleção natural - na visão moderna da evolução do mundo vivo são complementadas por ideias não apenas de seleção natural, mas de tal seleção, que é geneticamente determinada. O início do desenvolvimento da evolução sintética ou geral pode ser considerado o trabalho de S.S. Chetverikov sobre genética de populações, na qual foi demonstrado que não as características individuais e os indivíduos são submetidos à seleção, mas o genótipo de toda a população, mas é realizado através das características fenotípicas dos indivíduos. Isso leva à disseminação de mudanças benéficas por toda a população. Assim, o mecanismo de evolução é implementado tanto por mutações aleatórias no nível genético, quanto pela herança das características mais valiosas (o valor da informação!), que determinam a adaptação das características mutacionais ao ambiente, proporcionando a prole mais viável .

Mudanças climáticas sazonais, vários desastres naturais ou causados ​​pelo homem, por um lado, levam a uma mudança na frequência de repetição de genes nas populações e, como resultado, a uma diminuição da variabilidade hereditária. Esse processo às vezes é chamado de deriva genética. E, por outro lado, a alterações na concentração de várias mutações e diminuição da diversidade de genótipos contidos na população, o que pode levar a mudanças na direção e intensidade da ação de seleção.


4. Decifrando o código genético humano

Em maio de 2006, cientistas trabalhando para decifrar o genoma humano publicaram um mapa genético completo do cromossomo 1, que foi o último cromossomo humano sequenciado de forma incompleta.

Um mapa genético humano preliminar foi publicado em 2003, marcando o fim formal do Projeto Genoma Humano. Dentro de sua estrutura, fragmentos de genoma contendo 99% dos genes humanos foram sequenciados. A precisão da identificação do gene foi de 99,99%. No entanto, ao final do projeto, apenas quatro dos 24 cromossomos haviam sido totalmente sequenciados. O fato é que, além dos genes, os cromossomos contêm fragmentos que não codificam nenhuma característica e não estão envolvidos na síntese de proteínas. O papel que esses fragmentos desempenham na vida do organismo ainda é desconhecido, mas cada vez mais pesquisadores estão inclinados a acreditar que seu estudo requer a maior atenção.

Gene- uma unidade estrutural e funcional de hereditariedade que controla o desenvolvimento de uma determinada característica ou propriedade. Os pais transmitem um conjunto de genes para seus descendentes durante a reprodução. Uma grande contribuição para o estudo do gene foi feita por cientistas russos: Simashkevich E.A., Gavrilova Yu.A., Bogomazova O.V. (2011)

Atualmente, em biologia molecular, foi estabelecido que genes são seções de DNA que carregam qualquer informação integral - sobre a estrutura de uma molécula de proteína ou de uma molécula de RNA. Essas e outras moléculas funcionais determinam o desenvolvimento, crescimento e funcionamento do organismo.

Ao mesmo tempo, cada gene é caracterizado por uma série de sequências de DNA reguladoras específicas, como promotores, que estão diretamente envolvidos na regulação da expressão do gene. As sequências reguladoras podem estar localizadas nas proximidades do quadro de leitura aberto que codifica a proteína ou no início da sequência de RNA, como é o caso dos promotores (os chamados cis elementos reguladores cis), e a uma distância de muitos milhões de pares de bases (nucleotídeos), como no caso de intensificadores, isolantes e supressores (às vezes classificados como trans-elementos regulatórios elementos transreguladores). Assim, o conceito de gene não se limita à região codificadora do DNA, mas é um conceito mais amplo que inclui sequências regulatórias.

Originalmente o termo gene apareceu como uma unidade teórica para a transmissão de informações hereditárias discretas. A história da biologia lembra disputas sobre quais moléculas podem ser portadoras de informações hereditárias. A maioria dos pesquisadores acreditava que apenas as proteínas podem ser tais carreadores, já que sua estrutura (20 aminoácidos) permite criar mais opções do que a estrutura do DNA, que é composto por apenas quatro tipos de nucleotídeos. Mais tarde, provou-se experimentalmente que é o DNA que inclui a informação hereditária, que se expressou como o dogma central da biologia molecular.

Os genes podem sofrer mutações - mudanças aleatórias ou propositais na sequência de nucleotídeos na cadeia de DNA. As mutações podem levar a uma mudança na sequência e, portanto, uma mudança nas características biológicas de uma proteína ou RNA, que, por sua vez, pode resultar em um funcionamento alterado ou anormal geral ou local do organismo. Tais mutações em alguns casos são patogênicas, já que seu resultado é uma doença, ou letais em nível embrionário. No entanto, nem todas as alterações na sequência nucleotídica levam a uma alteração na estrutura da proteína (devido ao efeito da degenerescência do código genético) ou a uma alteração significativa na sequência e não são patogénicas. Em particular, o genoma humano é caracterizado por polimorfismos de nucleotídeo único e variações no número de cópias. variações de número de cópias), como deleções e duplicações, que compõem cerca de 1% de toda a sequência nucleotídica humana. Os polimorfismos de nucleotídeo único, em particular, definem diferentes alelos do mesmo gene.

Os monômeros que compõem cada uma das cadeias de DNA são compostos orgânicos complexos que incluem bases nitrogenadas: adenina (A) ou timina (T) ou citosina (C) ou guanina (G), um açúcar-pentose-desoxirribose de cinco átomos, denominado depois disso e recebeu o nome de DNA propriamente dito, assim como o resíduo de ácido fosfórico.Esses compostos são chamados de nucleotídeos.

Propriedades do gene

  1. discrição - imiscibilidade de genes;
  2. estabilidade - a capacidade de manter uma estrutura;
  3. labilidade - a capacidade de mutar repetidamente;
  4. alelismo múltiplo - muitos genes existem em uma população em uma variedade de formas moleculares;
  5. alelismo - no genótipo de organismos diplóides, apenas duas formas do gene;
  6. especificidade - cada gene codifica sua própria característica;
  7. pleiotropia - efeito múltiplo de um gene;
  8. expressividade - o grau de expressão de um gene em uma característica;
  9. penetrância - a frequência de manifestação de um gene no fenótipo;
  10. amplificação - um aumento no número de cópias de um gene.

Classificação

  1. Os genes estruturais são componentes únicos do genoma, representando uma única sequência que codifica uma proteína específica ou alguns tipos de RNA. (Veja também o artigo genes de limpeza).
  2. Genes funcionais - regulam o trabalho dos genes estruturais.

Código genético- um método inerente a todos os organismos vivos para codificar a sequência de aminoácidos de proteínas usando uma sequência de nucleotídeos.

Quatro nucleotídeos são usados ​​no DNA - adenina (A), guanina (G), citosina (C), timina (T), que na literatura de língua russa são denotados pelas letras A, G, C e T. Essas letras compõem o alfabeto do código genético. No RNA, os mesmos nucleotídeos são usados, com exceção da timina, que é substituída por um nucleotídeo semelhante - uracil, indicado pela letra U (U na literatura em russo). Nas moléculas de DNA e RNA, os nucleotídeos se alinham em cadeias e, assim, são obtidas sequências de letras genéticas.

Código genético

Existem 20 aminoácidos diferentes usados ​​na natureza para construir proteínas. Cada proteína é uma cadeia ou várias cadeias de aminoácidos em uma sequência estritamente definida. Essa sequência determina a estrutura da proteína e, portanto, todas as suas propriedades biológicas. O conjunto de aminoácidos também é universal para quase todos os organismos vivos.

A implementação da informação genética em células vivas (ou seja, a síntese de uma proteína codificada por um gene) é realizada por meio de dois processos matriciais: transcrição (ou seja, a síntese de mRNA em um molde de DNA) e tradução do código genético em uma sequência de aminoácidos (síntese de uma cadeia polipeptídica no mRNA). Três nucleotídeos consecutivos são suficientes para codificar 20 aminoácidos, assim como o sinal de parada, que significa o fim da sequência da proteína. Um conjunto de três nucleotídeos é chamado de tripleto. As abreviaturas aceitas correspondentes a aminoácidos e códons são mostradas na figura.

Propriedades

  1. Triplicidade- uma unidade significativa do código é uma combinação de três nucleotídeos (tripleto ou códon).
  2. Continuidade- não há sinais de pontuação entre os trigêmeos, ou seja, a informação é lida continuamente.
  3. não sobreposto- o mesmo nucleotídeo não pode fazer parte de dois ou mais trigêmeos ao mesmo tempo (não observado para alguns genes sobrepostos de vírus, mitocôndrias e bactérias que codificam várias proteínas de mudança de quadro).
  4. Sem ambiguidade (especificidade)- um determinado códon corresponde a apenas um aminoácido (no entanto, o códon UGA em Euplotes crasso códigos para dois aminoácidos - cisteína e selenocisteína)
  5. Degeneração (redundância) Vários códons podem corresponder ao mesmo aminoácido.
  6. Versatilidade- o código genético funciona da mesma maneira em organismos de diferentes níveis de complexidade - de vírus a humanos (os métodos de engenharia genética são baseados nisso; há várias exceções, mostradas na tabela em "Variações do código genético padrão " seção abaixo).
  7. Imunidade a ruídos- mutações de substituições de nucleotídeos que não levam a uma mudança na classe do aminoácido codificado são chamadas conservador; As mutações de substituição de nucleotídeos que levam a uma mudança na classe do aminoácido codificado são chamadas radical.

Biossíntese de proteínas e suas etapas

Biossíntese de proteínas- um processo complexo de vários estágios de síntese de uma cadeia polipeptídica a partir de resíduos de aminoácidos, ocorrendo nos ribossomos de células de organismos vivos com a participação de moléculas de mRNA e tRNA.

A biossíntese de proteínas pode ser dividida em etapas de transcrição, processamento e tradução. Durante a transcrição, a informação genética codificada nas moléculas de DNA é lida e esta informação é escrita em moléculas de mRNA. Durante uma série de estágios sucessivos de processamento, alguns fragmentos desnecessários em estágios subsequentes são removidos do mRNA e as sequências de nucleotídeos são editadas. Depois que o código é transportado do núcleo para os ribossomos, a síntese real das moléculas de proteína ocorre pela ligação de resíduos de aminoácidos individuais à cadeia polipeptídica em crescimento.

Entre a transcrição e a tradução, a molécula de mRNA sofre uma série de mudanças sucessivas que garantem a maturação de um molde funcional para a síntese da cadeia polipeptídica. Uma tampa é anexada à extremidade 5' e uma cauda poli-A é anexada à extremidade 3', o que aumenta a vida útil do mRNA. Com o advento do processamento em uma célula eucariótica, tornou-se possível combinar éxons gênicos para obter uma maior variedade de proteínas codificadas por uma única sequência nucleotídica de DNA - splicing alternativo.

A tradução consiste na síntese de uma cadeia polipeptídica de acordo com a informação codificada no RNA mensageiro. A sequência de aminoácidos é organizada usando transporte RNA (tRNA), que formam complexos com aminoácidos - aminoacil-tRNA. Cada aminoácido tem seu próprio tRNA, que possui um anticódon correspondente que “corresponde” ao códon do mRNA. Durante a tradução, o ribossomo se move ao longo do mRNA, à medida que a cadeia polipeptídica se acumula. A energia para a síntese de proteínas é fornecida pelo ATP.

A molécula de proteína finalizada é então clivada do ribossomo e transportada para o lugar certo na célula. Algumas proteínas requerem modificações pós-traducionais adicionais para atingir seu estado ativo.