Região de codificação
As referências deste artigo necessitam de formatação. (Setembro de 2018) |
A região de codificação de um gene, também conhecida e abreviada na literatura em inglês como CDS (de coding DNA sequence), é uma porção de DNA de um gene ou RNA que codifica para proteína.[1] A região geralmente começa na extremidade 5' por um codão de início e termina na extremidade 3' com um codão de parada.
A soma total das regiões de codificação de um genoma de um organismo é chamado seu exoma.
Estrutura
editarA região de codificação em um mRNA é ladeado pela região 5' não traduzida (5'-UTR) e a região 3' não traduzida (3'-UTR).[2] O CDS é a porção de uma transcrição de mRNA que é traduzido por uma ribossoma. CDS é uma palavra-chave (chave de recurso) usada para denotar a 'sequência de codificação de proteínas' em uma tabela de recursos de um gene pelos principais bancos de dados INSDC de sequências.[3] Eles também lêem CDS como sequência de codificação e região de codificação.[4]
Diferença com cDNA
editarUma sequência cDNA (DNA complementar) é derivado do transcrito por transcrição reversa, mas neste caso também contém as UTRs 5' e 3', as quais não são parte do CDS (são transcritas, mas não traduzidas). Um CDS irá quase sempre começar com um codon de iniciação AUG em eucariotas e parar em um dos três códons de parada (UAA, UGA, UAG).
Anotação de sequência de codificação
editarEnquanto a identificação de fases de leitura aberta dentro de uma sequência de DNA é direta, não identificando sequências de codificação, porque a célula traduz apenas um subconjunto de todos as fases de leitura aberta para proteínas.[5] Atualmente a previsão de CDS usa amostragem e sequenciamento de mRNA das células, embora ainda exista o problema de determinar quais partes de um determinado mRNA são realmente traduzidas para proteína. A previsão do CDS é um subconjunto de predição de genes, este último inclui também a previsão de sequências de DNA que codificam não só proteínas, mas também outros elementos funcionais, como genes de RNA e sequências reguladoras.
Ver também
editar- Cadeia codogênica - A cadeia que codifica uma proteína;
- Estrutura do gene - Os outros elementos que compõem um gene;
- DNA não codificante - Partes de genomas que não codificam genes;
- RNA não codificante - Genes que não codificam proteínas, não possuem CDS.
Referências
- ↑ Furuno M, Kasukawa T, Saito R (1 de junho de 2003). «CDS Annotation in Full-Length cDNA Sequence». Genome Research. 13 (6b): 1478–1487. doi:10.1101/gr.1060303
- ↑ Twyman, Richard (1 de agosto de 2003). «Gene Structure». The Wellcome Trust. Consultado em 6 de abril de 2003. Arquivado do original em 28 de março de 2007
- ↑ The DDBJ/ENA/GenBank Feature Table Definition - www.insdc.org
- ↑ coding region - ncbiinsights.ncbi.nlm.nih.gov
- ↑ Furuno, Masaaki; Kasukawa, Takeya; Saito, Rintaro; Adachi, Jun; Suzuki, Harukazu; Baldarelli, Richard; Hayashizaki, Yoshihide; Okazaki, Yasushi (setembro de 2011). «CDS Annotation in Full-Length cDNA Sequence» (PDF). Cold Spring Harbor Laboratory Press. Genome Research. 21 (9): 1478–1487. PMC 403693 . doi:10.1101/gr.1060303. Consultado em 18 de setembro de 2011