Er der en standarddefinition for "montagepolering"?

Spørgsmål:

EB2127

2018-05-16 00:19:22 UTC

view on stackexchange narkive permalink

Er der en standarddefinition for "montagepolering" i marken?
Er der en standarddefinition for, hvad poleringsalgoritmer gør?

Min forståelse af "polering" er stærkt påvirket af Pilon:

hvorved brugere indtaster en reference FASTA sammen med BAM af justeret læser mod denne reference FASTA. Poleringsalgoritmen tilpasser derefter for at opdage lokale fejlmonteringer og andre inkonsekvenser ved tilpasning. Disse "korrigeres", dvs. "poleres".

Alt, der gør noget mere korrekt (eller skinnere) ville polere det på engelsk, der er ingen særlig betydning her.

To svar:

user172818

2018-05-16 06:47:24 UTC

view on stackexchange narkive permalink

I langlæst samling henviser "polsk" til trinnet for at forbedre basisnøjagtigheden af kontigsekvenser. Jeg tror, at terminologien stammer fra HGAP-papiret:

Den endelige konsensusopkaldsalgoritme Quiver, der tager højde for alle de underliggende data og de rå kvalitetsværdier iboende for SMRT-sekventering, derefter polerer forsamlingen for endelig konsensusnøjagtighed på over 99,999% (QV på> 50) ...

Pilon blev offentliggjort mere end et år senere, og hverken dets papir eller README nævner faktisk ordet "polsk".

Forresten henviser "fejlkorrektion" til trinnet for at rette sekventeringsfejl i rå læser, ikke i konti. I Canu / HGAP / Falcon udføres dette trin af pbdagcon eller falcon_sense.

Sejt det vidste jeg ikke!

Kamil S Jaron

2018-05-16 02:21:13 UTC

view on stackexchange narkive permalink

Ansvarsfraskrivelse , dette svar er baseret på den følelse, jeg fik fra samtaler og papirer, men jeg har ikke nogen hård reference, der støtter det.

Jeg mener, at polering af genom er en teknik, der blev introduceret til korrektion af individuelle baser af lange støjende læsekonstruktioner - dvs. fastgørelse af SNP'er og korte indeller. At gætte en korrekt base fra lange læsninger under samlingen synes at være en smule mere kompliceret opgave i forhold til kortlæste samlinger, derfor er den isoleret i adskilte algoritmer som Quiver / Arrow, Nanopolish (til korrektion ved lange læsninger) eller det værktøj, du nævnte - Pilon (korrektion ved korte læsninger).

Miss-samlinger kunne korrigeres selv tidligere lange læsninger for eksempel ved at matche samling til optisk kortlægning eller ved hjælp af værktøjer som REAPR eller TGnet. Jeg har dog aldrig hørt udtrykket "genompolering" brugt til denne type genomkorrektion.

ⓘ

Denne spørgsmål og svar blev automatisk oversat fra det engelske sprog.Det originale indhold er tilgængeligt på stackexchange, som vi takker for den cc by-sa 4.0-licens, den distribueres under.

om - legalese