od Colombo » pát bře 16, 2012 9:57 am
Takhle, řekněme, že já mám sekvence, rozházené v čase (tedy mám vzorky od 1960-2012).
Teď je otázka: jak fungují mutace?
Jedna věc je samozřejmě velikost populace, čím větší populace, tím více mutací. Další věc jsou samotné mechanismy uvnitř RNA, špatný přepis atp. To se abstrahuje do dvou věcí:
různá rychlost mutace na různých místech RNA
rychlost mutace pro (báze): A do A, A do C, A do T, A do G. Takže tabulka 4x4 s rychlostí mutací.
Teď já vezmu tyhle parametry a snažím se zjistit, jaký fylogenetický strom je nejpravděpodobnější, aby mi vyšly pozorovaná data (tedy ony sekvence, co mám).
Tohle je klasická bayesiánská koalesenční analýza (obyčejný fylogenetický strom je to samé, jen bez velikosti populace).
Teď já k tomu přidám ještě místo izolace. To funguje podobně jako ona rychlost mutace pro báze, jen místo bází tu mám tabulku lokalit.
A to je vlastně tak všechno.