Kan exoner være placeret uden for kodningssekvensen?

Cleb

2017-10-20 12:29:16 UTC

view on stackexchange narkive permalink

Jeg har en gff-fil som denne (jeg redigerede navnet):

  scaffold_x source exon 2987526 2987805. -. navn "foobar"; transcriptId 68892scaffold_x kilde CDS 2987526 2987805. - 1 navn "foobar"; proteinId 68892; exonNumber 5scaffold_x kilde exon 2988610 2988745. -. navn "foobar"; transcriptId 68892scaffold_x kilde CDS 2988610 2988745. - 2 navn "foobar"; proteinId 68892; exonNumber 4scaffold_x kilde exon 2989157 2989645. -. navn "foobar"; transcriptId 68892scaffold_x kilde CDS 2989157 2989645. - 2 navn "foobar"; proteinId 68892; exonNumber 3scaffold_x kilde exon 2990903 2991541. -. navn "foobar"; transcriptId 68892scaffold_x kilde CDS 2990903 2991541. - 2 navn "foobar"; proteinId 68892; exonNumber 2scaffold_x kilde stop_codon 2990903 2990905. - 0 navn "foobar" scaffold_x kilde exon 2991587 2992430. -. navn "foobar"; transcriptId 68892scaffold_x kilde CDS 2991587 2992430. - 0 navn "foobar"; proteinId 68892; exonNumber 1scaffold_x kilde start_codon 2992428 2992430. - 0 navn "foobar"

Så start_codon er 2992428 2992430 og stop_codon er 2990903 2990905 ; Jeg ville derfor forvente alle eksoner inden for dette interval, dog f.eks. exon 5 findes i 2987526 2987805 som klart ligger uden for dette interval.

Er der noget galt med selve gff-filen, eller er der en sandsynlig forklaring på det?

EDIT :

I det tilsvarende protein fasta finder jeg en aminosyresekvens forbundet med dette prtein-ID og navn:

  >68892 | foobarMHTGD ...  kode>

Tak for redigering, men det fortæller os ikke noget. Vi har brug for at kende tiltrædelsen af det protein og / eller genet, du ser på. Hvad er `68892`? Er det genet ID? Også, hvorfor ville der ikke være en proteinsekvens forbundet med den? Det er kun UTR'erne, der ikke oversættes, resten af eksoner vil være.

@terdon Se min kommentar under dit svar. Og tak for antydningen; der er faktisk eksoner i den "korrekte" region, som derefter kan oversættes til et protein. Du er velkommen til at udvide dit svar, og så er jeg glad for at acceptere det.

Jeg forstår ikke, hvad der forvirrer dig, for at være ærlig. Jeg vil gerne udvide, men jeg ved ikke i hvilken retning. Det kan være enklere, hvis du kommer ind i [chat] (https://chat.stackexchange.com/rooms/58858/bioinformatics) et sekund og ping mig (`@terdon`) der, så vi kan finde ud af, hvad der forvirrer dig.