Spørgsmål:
Kan par-end-læsninger med høj heterozygositet bruges til at polere PacBio-samling?
MayWangmeiyue
2018-03-02 08:29:07 UTC
view on stackexchange narkive permalink

Jeg har brugt canu (korrekt) og smartdenovo til samling af PacBio læser. Dernæst skal jeg polere min samling ved hjælp af illumina-par-læsninger af Pilon. Imidlertid fandt jeg, at der er høj heterozygositet i min læsning af par, når jeg brugte vandmænd til at lave k-mer-analyse. Der er to toppe i fordelingsdiagrammet for k-mer-frekvenser. Størrelsen på mit genom er omkring 190M, og det er en diploid organisme.
enter image description here Hvad jeg tvivler på er, at kan jeg bruge dette par-slutdata til at polere min samling?

Hvis ikke, skal jeg lave sekventering igen.

Generelt er polering med korte læsninger [afskrevet] (https://youtu.be/zGYbiArVMV0?t=2848) på grund af kortlægningsproblemer. Hvis du har tilstrækkelig dækning, holder jeg mig bare til pilen.
En svar:
conchoecia
2018-03-05 23:40:10 UTC
view on stackexchange narkive permalink

At gentage din prøve vil ikke gøre det mindre heterozygot. Jeg antager, at du arbejder med en diploid organisme? Opdater venligst dit spørgsmål, og angiv din organisms genomstørrelse og ploidi (typen af ​​organisme hjælper os også med at opdatere vores svar).

Svaret, ja, du kan bruge Pilon + korte læsninger til at rette PacBio-enheden selv med en meget heterozygot prøve. For at gøre det skal du bruge indstillingen --diploid i Pilon for at fortælle det, at der vil være heterozygote websteder. Den måde, hvorpå det korrigerer heterozygote SNP'er og heterozygote indeler, er forskellig, og det ser ud til at fungere bedst med SNP'er og identificerer undertiden ikke korrekt heterozygote indels ( kilde).

Pilon selv håndterer ikke indfasning, men korrigerer bare med det, der læses i bam -filen, som den er forsynet med. Slutresultatet af at tilvejebringe en bam med læsninger fra begge haplotyper er, at den korrigerede sekvens vil være en mosaik af den dominerende allel på det heterozygote sted, som det blev observeret i de kortlæste data. Dette vælger måske eller måske ikke for nogle alleler baseret på sekventeringsdækningsforstyrrelse af Illumina-sequencere.



Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 3.0-licens, den distribueres under.
Loading...