Estrutura 1
O trecho compreendido entre o códon de iniciação da síntese proteíca (usualmente ATG ou TTG) e um dos três códons para terminação da síntese protéica (designados aqui por stop) determina a sequência de aminoácidos do polipeptídeo final, produto do gene. Este trecho é frequentemente designado como quadro aberto de leitura (ORF = open reading frame) ou sequência codificadora (Cds = coding sequence). Antes dele (diz-se 5' dele) estão o promotor (onde vai se ligar a RNA polimerase) e o sítio ligador de ribossomo (RBS = ribosome binding site ou rrs = ribosome recognition site), uma sequência que, quando transcrita para o mRNA, irá permitir o pareamento deste com um trecho complementar do RNA 16 S da sub-unidade menor do ribossoma. Após a ORF (3' dela, como se diz no jargão de biologia molecular), há o sinal de parada da transcrição, que é formado por uma sequência diádica acompanhada de um poliT (na fita 5'-3', que é sempre a de cima, salvo quando especificado na figura). A transcrição da região do terminador provoca a formação de um grampo no RNA mensageiro nascente, seguido de um poli-U, que interrompe a síntese de RNA .
A transcrição do DNA, que começa numa base dentro da região