Spørgsmål Jeg formoder, at dette spørgsmål handler om fylogenetik ved methylering, og den fremgangsmåde, som efterforskeren foreslår, ville være den sidste tilgang at bruge.
Resumé stærk > Tilgange til at vurdere fylogenetikken ved methylering i rækkefølge efter præference er:
- dN / dS mellem CpG-steder og ikke-CpG-steder,
- Et eksplicit molekylur mellem CpG steder og ikke-CpG-steder
- En sandsynlighedsrationstest (LRT) baseret på en nulfordeling af mutationer genereret af en Monte Carlo-algoritme
Baggrund / begrundelse De tilgange, du bruger, har eksisteret i lang tid og genererer den tilfældige fordeling af mutationer for en given fylogeni. Dens fylogenetik i omvendt retning og teknikken er kendt som Monte Carlo, du starter med en randomiseret sandsynlighed og sender den gennem en parametreret model for at forudsige aminosyren / nukleotidet. Således er det ML (maks. Sandsynlighed), Bayesian, "fylogenetisk-HMM" i omvendt retning. Det bruges inden for beregninger af sandsynlighedsforholdstest. Modellen bestemmes af en standard ML, Bayesian fylogeny algoritme, dvs. dens cirkulære matematik, fordi der ikke er nogen uafhængig metode til beregning af mutationsadfærden, så den nøjagtige kontekst, du bruger dette til, skal overvejes nøje. > Pakker Der er mange pakker, der udfører denne type Monte Carlo-simulering, SOWHat er god (LRT), og du genererer et stort antal replikerede datasæt (100 eller 1000). Den ene af basisalgoritmerne er "seq-gen", selvom PAML muligvis har implementeret dette.
Overvejelser For at bruge denne fremgangsmåde skal du nøje overveje dit spørgsmål. "Mutationssimuleringerne", når de analyseres via et fylogenetisk program, vil producere de samme parametre, som du oprindeligt indstillede, og træer med stort set samme længde. Hvis du bruger dette til at generere en nulfordeling til en fylogenetisk test, er disse tilgange nyttige, sammenligner du derefter den observerede sandsynlighed med nulfordelingen. Hvis du bruger den til at finde ud af, om mutationshastigheden på CpG-steder er højere end på andre steder, er den ene tilgang blandt en række alternativer.
Ulemper Beregning af en de novo nulfordeling af mutationshastigheden er beregningsmæssigt meget dyr og har derfor tendens til den sidste udførte beregning. Det vil adressere en enkelt hypotese, normalt med hensyn til topologi.
Kernen i problemet For virkelig at gøre det (jeg tror) du vil gøre, har du brug for et uafhængigt mål for mutation og mutation adfærd og det er ikke trivielt at opnå. Du bliver nødt til at overveje det som en maskinlæringsberegning med et formelt træningssæt, jeg ved ikke, om en sådan tilgang er blevet implementeret.
Styrker / resumé Sammenfattende har Monte Carlo fylogenetik simulering en begrænset anvendelse på grund af beregningens cirkularitet, MEN, MEN, hvad jeg har udeladt, er når det er passende det er faktisk en meget kraftig test.
Interessepunkter Jeg kan godt lide befolkningsdynamiske simuleringer inden for Beast, dette bestemt "a priori" og dets potentielle IMO har brug for yderligere udforskning . Imidlertid tror jeg ikke, du ser på, hvordan molekylær epidemiologi kan påvirke methyleringens mutationsadfærd. Jeg har ikke kigget på uudslettelig, men ser interessant ud.
Jeg skulle tale om "processorkrigssimuleringer", men det er sandsynligvis uden for emnet.