Jeg har kigget rundt (inklusive læst de originale papirer) for at forstå, hvad der i det væsentlige er forskellen mellem StringTie i ikke-referencebaseret tilstand (de novo) og Trinity de novo-samling. Jeg forstår, at i den genomstyrede natur af StringTie understøttes vi af genominformationen (dvs. under hensyntagen til de kortlagte læsninger). Derudover har vi også en mulighed for enten at køre ved hjælp af genkommenteringsfilen eller ej.
Enkelt sagt, er jeg korrekt, hvis jeg siger, at Trinity rent kigger på de overlappende læser, så samler dem, mens StringTie (ikke-referencebaseret) ser på de kortlagte læsninger, der enten er tætte eller overlappende til hinanden? Er der nogen anden ting, jeg mangler her (jeg forstår, at det ikke er så simpelt, men jeg prøver at gøre det så simpelt / intuitivt som muligt)?
Også hvis det er tilfældet, ville det være er det sikkert at sige, at generelt ikke-referencebaseret StringTie foretrækkes frem for Trinity og referencebaseret StringTie (da genkommentarer kan føre til en vis "bias", hvilket forhindrer opdagelse af ny TSS, exon-længde eller endda lave unødvendige duplikater med små forskelle)? / p>