Spørgsmål:
Værktøj eller script til at analysere kommenterede VCF-filer
arupgsh
2017-08-11 12:44:08 UTC
view on stackexchange narkive permalink

Jeg har kommenteret VCF-filer ved hjælp af snpEff og på udkig efter et værktøj eller script til at parse VCF-filen og rydde op i filen for at gøre den fortolkelig for en biolog.

En svar:
Pierre
2017-08-11 13:04:59 UTC
view on stackexchange narkive permalink

(rediger) du kan filtrere VCF-kommentarerne med snpsift , jeg har også skrevet en VcfFilterSequenceOntology http://lindenb.github.io/jvarkit /VcfFilterSequenceOntology.html

Jeg har skrevet vcf2table: http://lindenb.github.io/jvarkit/VcfToTable.html Det dekoder VEP- og SNPeff-annoteringer:

  >>chr1 / 10001 / T (n 1) Variant + -------- + -------------------- + | Nøgle | Værdi | + -------- + -------------------- + | CHROM | chr1 | (....) VEP + -------------------------- + ------ + -------- -------- + ------------ + ----------------- + -------- + - ----------------- + -------------------------------- --------------- + ------------- + --------- + ---------- ------- + ---------------------- + | PolyPhen | EXON | SIFT | ALLELE_NUM | Gen | SYMBOL | Proteinposition | Konsekvens | Aminosyrer | Kodoner | Funktion | BIOTYPE | + -------------------------- + ------ + --------------- - + ------------ + ----------------- + -------- + -------- ---------- + --------------------------------------- -------- + ------------- + --------- + ----------------- + ---------------------- + | sandsynligvis_skadelig (0.956) | 8/9 | skadelig (0) | 1 | ENSG00000102967 | DHODH | 346/395 | missense_variant | R / W | Cgg / Tgg | ENST00000219240 | proteinkodning | | | 3/4 | | 1 | ENSG00000102967 | DHODH | | non_coding_exon_variant&nc_transcript_variant | | | ENST00000571392 | tilbageholdt_intron | | | | | 1 | ENSG00000102967 | DHODH | | downstream_gene_variant | | | ENST00000572003 | retained_intron |
| | | | 1 | ENSG00000102967 | DHODH | | downstream_gene_variant | | | ENST00000573843 | retained_intron | | | | | 1 | ENSG00000102967 | DHODH | | downstream_gene_variant | | | ENST00000573922 | bearbejdet_transcript | | | | | 1 | ENSG00000102967 | DHODH | - / 193 | intron_variant | | | ENST00000574309 | proteinkodning | | sandsynligvis_skadelig (0,946) | 8/9 | skadelig (0) | 1 | ENSG00000102967 | DHODH | 344/393 | missense_variant | R / W | Cgg / Tgg | ENST00000572887 | proteinkodning | + -------------------------- + ------ + --------------- - + ------------ + ----------------- + -------- + -------- ---------- + --------------------------------------- -------- + ------------- + --------- + ----------------- + ---------------------- + Genotyper + --------- + ------ + ------- + ---- + ---- + ----- + --------- + | Prøve | Type | AD | DP | GQ | GT | PL | + --------- + ------ + ------- + ---- + ---- + ----- + -------- - + | M10475 | HET | 10,2 | 15 | 10 | 0/1 | 25,0,10 | | M10478 | HET | 10,4 | 16 | 5 | 0/1 | 40,0,5 | | M10500 | HET | 10,10 | 21 | 7 | 0/1 | 111,0,7 | | M128215 | HET | 15,5 | 24 | 0 | 0/1 | 49,0,0 | + --------- + ------ + ------- + ---- + ---- + ----- + -------- - +  


Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 3.0-licens, den distribueres under.
Loading...