Ideelt set blev disse BQSR-metoder lavet under hensyntagen til, hvordan tekniske fejl rent faktisk vil skrue op for basiskvalitetsopkaldene, og hvornår maskinerne stadig var mere i udviklingsfasen, mens de blev brugt til 1000G-projektet. Fra nu af er maskiner stærkere og stærkere, hvor det sandsynligvis ikke vil blive brugt, men vi bruger stadig med listede SNP'er til at finde covariaterne og opbygge en model omkring dataene ved hjælp af informationen med machine learning-tricks til at forbedre kvaliteten af disse basisopkald . Ideelt set bør det være mere hensigtsmæssigt, når der bruges gamle maskiner fra Illumina eller andre standardfirmaer, men med nye maskiner, der er meget kraftfulde og med høj kapacitet, bør de have tendens til at gå ned. Jeg kan ikke huske, om der er foretaget sådanne tests, men jeg ved selvfølgelig, at ny sekventeringsmaskine altid foretager sådanne tests for at vise, at de har reduceret sådanne fejl, men stadig anbefale sådan en BQSR til variantopkald. Nu er problemet listen over SNP'er, dette for mig er det virkelige problem, da den liste, vi bruger, langt fra er guldstandard, og hvis det ikke ordentligt er taget hånd om alt, hvad vi udleder om kvalitet, er stadig rystende. Dette link er ret informativt, men det er et gammelt. Jeg ville virkelig se forbedringer med nye sequencere. Men meget færre mennesker bekymrer sig om sådanne tests i akademisk forskning, og også translationelt laboratorium vil virkelig ikke investere tid og penge på sådanne, medmindre anlægget har nogle bioinformatikere, der altid foretager en sådan test, mens de køber en ny sequencer til instituttet. Med hensyn til klinisk genomik til at finde varianter regner jeg med, at de mest kraftfulde og opdaterede sequencere skal bruges, men er ikke sikre på, om de stadig bruger BQSR, og hvis ja, hvad er den liste, de bruger til at opbygge model for samvariation omkring dataene.