Jeg har brugt canu (korrekt) og smartdenovo til samling af PacBio læser. Dernæst skal jeg polere min samling ved hjælp af illumina-par-læsninger af Pilon. Imidlertid fandt jeg, at der er høj heterozygositet i min læsning af par, når jeg brugte vandmænd til at lave k-mer-analyse. Der er to toppe i fordelingsdiagrammet for k-mer-frekvenser. Størrelsen på mit genom er omkring 190M, og det er en diploid organisme.
Hvad jeg tvivler på er, at kan jeg bruge dette par-slutdata til at polere min samling?
Hvis ikke, skal jeg lave sekventering igen.