Definition af "frø" i sekvensjustering

Spørgsmål:

user3138373

2019-03-16 08:22:52 UTC

view on stackexchange narkive permalink

Jeg vil gerne vide, hvad der menes med "frø" for forskellige sekvensjusteringer. Hvordan er det vigtigt?

To svar:

Devon Ryan

2019-03-16 17:52:40 UTC

view on stackexchange narkive permalink

Frøet er delmængden af en læsning, der blev brugt i det første trin i en justering. Mange aligners arbejder efter en frø-og-udvid-model, hvor de først finder alle regioner, der matcher "frøet" og derefter udvider justeringen omkring det, der tillader tågeoverensstemmelser og indeller, indtil den enten giver op (og derfor bruger et andet frø) eller finder en tilstrækkelig god tilpasning.

Tak devon for forklaringen. Jeg har et lidt lignende spørgsmål om, hvorfor det er svært at finde et frø til meget korte eksoner? I betragtning af en 3 nt exon, er det fordi så lille frø har en sandsynlighed for at kortlægge hver 4 ^ 3 = 64 baser og næsten umulig at lede efter i genomet? Dine synspunkter om dette

Normalt er frø et par gange så lang, da du vil have få nok hits til hurtigt at begrænse dit søgerum.

Daniel Standage

2019-03-18 22:57:34 UTC

view on stackexchange narkive permalink

Devons svar giver en god og kortfattet definition. Men det er også nyttigt at overveje, hvorfor seed-and-Extend bruges, og hvilke fordele det giver.

At finde tilnærmede strengematcher kræver operationer, der er dyre beregningsmæssigt. På den anden side kan man finde nøjagtige strengkampe ved hjælp af meget billigere operationer - det vil sige det kan gøres hurtigere med mindre hukommelse. Så hurtigt at finde placeringen af alle frøkampe og derefter anvende den omtrentlige matchning KUN PÅ DE PLACERINGER (frø-og-udvid-strategien) sørger for, at der spildes mindre tid på at jagte falske ligheder.

Så hvor længe skulle et frø være? Hvis du afkalder din kommentar, ville et frø med en længde på 3 bp være fuldstændig ineffektiv, da den samme 3 bp-sekvens vil forekomme ALLE OVER GENOMET I RANDOM STEDER: gener, pseudogener, transponerbare elementer, regulatoriske sekvenser, du navngiver det. På den anden side ville et frø 51bp i længden også være ineffektivt, da næsten alle frø ville indeholde mindst en sekventeringsfejl eller variant / polymorfisme, hvilket forhindrer en perfekt match.

I praksis er kortlægere designet til at tilpasse 100-300bp Illumina læser typisk brug af frø i høje teenagere eller lave 20'ere.

ⓘ

Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 4.0-licens, den distribueres under.

om - legalese