Jeg vil gerne vide, hvad der menes med "frø" for forskellige sekvensjusteringer. Hvordan er det vigtigt?
Jeg vil gerne vide, hvad der menes med "frø" for forskellige sekvensjusteringer. Hvordan er det vigtigt?
Frøet er delmængden af en læsning, der blev brugt i det første trin i en justering. Mange aligners arbejder efter en frø-og-udvid-model, hvor de først finder alle regioner, der matcher "frøet" og derefter udvider justeringen omkring det, der tillader tågeoverensstemmelser og indeller, indtil den enten giver op (og derfor bruger et andet frø) eller finder en tilstrækkelig god tilpasning.
Devons svar giver en god og kortfattet definition. Men det er også nyttigt at overveje, hvorfor seed-and-Extend bruges, og hvilke fordele det giver.
At finde tilnærmede strengematcher kræver operationer, der er dyre beregningsmæssigt. På den anden side kan man finde nøjagtige strengkampe ved hjælp af meget billigere operationer - det vil sige det kan gøres hurtigere med mindre hukommelse. Så hurtigt at finde placeringen af alle frøkampe og derefter anvende den omtrentlige matchning KUN PÅ DE PLACERINGER (frø-og-udvid-strategien) sørger for, at der spildes mindre tid på at jagte falske ligheder.
Så hvor længe skulle et frø være? Hvis du afkalder din kommentar, ville et frø med en længde på 3 bp være fuldstændig ineffektiv, da den samme 3 bp-sekvens vil forekomme ALLE OVER GENOMET I RANDOM STEDER: gener, pseudogener, transponerbare elementer, regulatoriske sekvenser, du navngiver det. På den anden side ville et frø 51bp i længden også være ineffektivt, da næsten alle frø ville indeholde mindst en sekventeringsfejl eller variant / polymorfisme, hvilket forhindrer en perfekt match.
I praksis er kortlægere designet til at tilpasse 100-300bp Illumina læser typisk brug af frø i høje teenagere eller lave 20'ere.