Information

11.S: Fitting -Death Models (sammanfattning) - Biologi

11.S: Fitting -Death Models (sammanfattning) - Biologi


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

I det här kapitlet beskrev jag hur man uppskattar parametrar från födelsedödsmodeller med hjälp av data om artmångfald och åldrar, och hur man använder mönster av trädbalans för att testa hypoteser om förändrade födelse- och dödsgrader. I nästa kapitel kommer vi att utforska fördjupningar om födelse-död-modeller och diskutera modeller som går utöver konstanta födelse-dödsmodeller för att analysera mångfalden av liv på jorden.

Referenser

Blum, M. G. B. och O. François. 2006. Vilka slumpmässiga processer beskriver livets träd? En storskalig studie av fylogenetisk trädobalans. Syst. Biol. 55:685–691.

Blum, M. B., O. François och S. Janson. Medelvärdet, variansen och begränsande fördelningen av två statistik känsliga för fylogenetisk trädbalans. Ann. Appl. Probab. 16:2195–2214. Institutet för matematisk statistik.

Bortolussi, N., E. Durand, M. Blum och O. ApTreeshape: Statistisk analys av fylogenetisk trädform. Bioinformatik 22: 363–364.

Coyne, J. A. och H. A. Orr. 2004. Speciering. Sinauer, New York.

Drummond, C.S., R.J. Eastwood, S.T.S. Miotto och C.E. Hughes. 2012. Flera kontinentala strålningar och korrelat av diversifiering i Lupinus (Leguminosae): Testning för nyckelinnovation med ofullständig taxonprovtagning. 61: 443–460. academic.oup.com.

FitzJohn, R. G., W. P. Maddison och S. Otto. 2009. Uppskattning av egenskapsberoende artbildning och utrotningshastigheter från ofullständigt lösta fylogenier. 58: 595–611. sysbio.oxfordjournals.org.

Gould, S. J., D. M. Raup, J. Sepkoski, T. Schopf och D. Simberloff. 1977. Evolutionens form: En jämförelse av verkliga och slumpmässiga klader. Paleobiologi 3: 23–40. Cambridge University Press.

Harding, E. F. 1971. Sannolikheterna för rotade trädformer genererade av slumpmässig bifurkation. Adv. 3:44–77. Cambridge University Press.

Hedges, B. S. och S. Kumar. Livets tidsplan. Oxford University Press, Oxford.

Höhna, S. 2014. Sannolikhetsslutledning av icke-konstanta diversifieringshastigheter med ofullständig taxonsampling. PLoS One 9: e84184.

Höhna, S., M. R. May och B. Moore. 2016. TESS: Ett R -paket för att effektivt simulera fylogenetiska träd och utföra Bayesiansk slutsats av släktdiversifieringshastigheter. Bioinformatik 32: 789–791.

Höhna, S., T. Stadler, F. Ronquist och T. Britton. 2011. Avgörande av speciering och utrotningshastigheter enligt olika provtagningssystem. Mol. Evol. 28: 2577–2589.

Hughes, C. och R. Eastwood. Östrålning i kontinental skala: exceptionella växtspridningsnivåer efter Andesberget. Proc. Natl. Acad. Sci. U. 103: 10334–10339.

Hutter, C.R., S. Lambert och J. Wiens. 2017. Snabb diversifiering och tid förklarar amfibiernas rikedom i olika skalor i de tropiska Anderna, jordens mest hotspot för biologisk mångfald. Am. Nat. 190:828–843.

Maddison, W. P., P. Midford, S. Otto och T. Oakley. 2007. Uppskattning av en binär karaktärs effekt på artbildning och utrotning. 56: 701–710. Oxford University Press.

Madriñán, S., A. Cortés och J. Richardson. 2013. Páramo är världens snabbast utvecklade och coolaste hotspot för biologisk mångfald. Främre. Genet. 4: 192.

Magallon, S. och M. Sanderson. 2001. Absolut diversifieringsgrad i angiospermklader. Evolution 55: 1762–1780.

McConway, K.J. och H. Sims. En sannolikhetsbaserad metod för att testa för icke-stokastisk variation av diversifieringshastigheter i fylogenier. Evolution 58:12–23.

Miller, E. C. och J. Utrotning och tid hjälper till att driva den marina terrestriska biologiska mångfalden: Är havet en dödsfälla? Ecol. Lett. 20: 911–921.

Mooers, A. O. och S. B. Heard. 1997. Avgör evolutionär process från fylogenetisk trädform. Fr.Opp 72: 31–54.

Mora, C., D. Tittensor, S. Adl, A. Simpson och B. Worm. Hur många arter finns det på jorden och i havet? PLoS Biol. 9: e1001127. Public Library of Science.

Morlon, H., T. L. Parsons och J. Plotkin. Att förena molekylära fylogenier med fossilregistret. 108: 16327–16332. National Academy of Sciences.

Nee, S. Birth-Death modeller i makroevolution. Annu. Ecol. 37: 1–17. Årsöversikter.

Nee, S., R. May och P. H. Harvey. 1994. Den rekonstruerade evolutionsprocessen. Philos. Trans. Soc. Lond. B Biol. 344: 305–311.

Paradis, E. Skift i diversifiering i syster-clade jämförelser: Ett kraftfullare test. Evolution 66: 288–295. Wiley onlinebibliotek.

Rabosky, D.L., S.C. Donnellan, A. Talaba och I. Lovette. Exceptionell variation inom variationen i diversifieringshastigheten under strålningen från Australiens mest varierande ryggradsdjursklade. 274: 2915–2923.

Raup, D. 1985. Matematiska modeller av kladogenes. Paleobiologi 11: 42–52.

Raup, D.M. och S. Gould. 1974. Stokastisk simulering och utveckling av morfologi: Mot en nomotisk paleontologi. 23:305–322. Oxford University Press.

Raup, D. M., S. Gould, T. 1973. Stokastiska modeller för fylogeni och mångfaldens utveckling. Geol. 81: 525–542.

Rohatgi, V. K. 1976. En introduktion till sannolikhetsteori och matematisk statistik. Wiley.

Slowinski, J. B. och C. Guyer. 1993. Testa om vissa egenskaper har orsakat förstärkt diversifiering: En förbättrad metod baserad på en modell för slumpmässig artbildning och utrotning. 142:1019–1024.

Stadler, T. 2013a. Hur kan vi förbättra noggrannheten i makroevolutionära hastighetsuppskattningar? Syst. 62: 321–329.

Stadler, T. 2013b. Återställer speciering och utrotningsdynamik baserad på fylogenier. 26: 1203–1219.

Stadler, T. och J. Smrckova. Uppskatta förändringar i diversifieringshastigheter baserat på fylogenier på högre nivå. 12: 20160273. Royal Society.

Strathmann, R. R. och M. Slatkin. 1983. Osannolikheten av djurfila med få arter. Paleobiologi. cambridge.org.

Vamosi, S. M. och J. Vamosi. 2005. Ändlösa tester: Riktlinjer för att analysera icke-kapslade systergruppsjämförelser. Res. 7:567–579. Evolutionary Ecology, Ltd.

Yule, G. 1925. En matematisk evolutionsteori, baserad på slutsatserna av dr. Willis, FRS. 213: 21–87. Royal Society.


Koden visas sektion för sektion med resultat i följande exempel. Om du föredrar kan du ladda ner min fullständiga kodfil här, men du måste kommentera mina flickr -planeringsverktyg innan den körs. Nu kör vi:

Installera och ladda paketen "TreeSim" och "laser". Kommer att kräva en ny version av R för TreeSim för att installera korrekt. Vi skriver också två enkla anpassade funktioner för att göra vårt liv enklare, en för att få ett träds ålder, en för att lösa r= b-d och a= b/d för b och d.


11.S: Anpassa födelse-dödsmodeller (sammanfattning) - Biologi

Många viktiga stokastiska räknemodeller kan skrivas som allmänna födelse-dödsprocesser (BDP). BDP är kontinuerliga Markov-kedjor på de icke-negativa heltalen och kan användas för att enkelt parametrisera en mängd olika sannolikhetsfördelningar. Även om de teoretiska egenskaperna hos allmänna BDP:er är väl förstådda, har traditionellt statistiskt arbete på BDP:er begränsats till den enkla linjära (Kendall) processen, som uppstår i ekologi och evolutionära tillämpningar. Bortsett från några enkla fall är det fortfarande omöjligt att hitta analytiska uttryck för sannolikheten för en diskret observerad BDP, och beräkningssvårigheter har hindrat utvecklingen av verktyg för statistisk slutledning. Men gapet mellan BDP-teori och praktiska metoder för skattning har minskat de senaste åren. Det finns nu robusta metoder för att utvärdera sannolikheter för realiseringar av BDP:er: ändlig tidsövergång, första passage, jämviktssannolikheter och distributioner av sammanfattande statistik som ofta uppstår i applikationer. Det senaste arbetet har också utnyttjat sambandet mellan kontinuerligt och diskret observerade BDP: er för att härleda EM-algoritmer för maximal sannolikhetsuppskattning. Sannolikhetsbaserad slutsats för tidigare svårlösliga BDP är mycket lättare än man tidigare trott och regressionsmetoder som är analoga med Poisson-regression är enkla att härleda. I denna översyn beskriver vi den grundläggande matematiska teorin för BDP och visar nya verktyg för statistisk slutsats med hjälp av data från BDP. Vi ger sex exempel på BDP och härleder EM -algoritmer för att passa deras parametrar med maximal sannolikhet. Vi visar hur man beräknar distributionen av integrerad sammanfattande statistik och ger ett exempel på den totala kostnaden för en epidemi. Slutligen föreslår vi framtida riktningar för innovation i denna viktiga klass av stokastiska processer.


Författarsammanfattning

Både tillväxten av grupper av arter och spridningen av infektionssjukdomar genom populationer kan modelleras som födelse-dödsprocesser. Födelsehändelser motsvarar antingen artbildning eller infektion, och dödshändelser till utrotning eller att bli icke-smittsamma. Födelsetalen och dödsfrekvensen kan variera över tiden, och genom att undersöka denna variation kan forskare identifiera viktiga händelser i livshistorien på jorden eller under ett utbrott. Tidskalibrerade fylogenier spårar relationerna mellan en uppsättning arter (eller infektioner) och tidpunkterna för alla artbildnings- (eller infektions)händelser, och kan således användas för att sluta sig till födelse- och dödstalen. Vi utvecklar två fylogenetiska födelse-dödsmodeller med målet att urskilja signaler om hastighetsvariationer från brus på grund av den stokastiska naturen hos födelse-dödsmodeller. Med hjälp av en mängd olika simulerade datamängder visar vi att en av dessa modeller exakt kan utläsa långsamma och snabba hastighetsförskjutningar utan att offra precision. Med hjälp av verkliga data visar vi att vår nya metodik kan användas för samtidig slutsats av fylogeni och hastigheter genom tiden.

Citat: Magee AF, Höhna S, Vasylyeva TI, Leaché AD, Minin VN (2020) Lokalt adaptiv Bayesiansk födelse-dödmodell upptäcker framgångsrikt långsamma och snabba hastighetsförskjutningar. PLoS Comput Biol 16(10): e1007999. https://doi.org/10.1371/journal.pcbi.1007999

Redaktör: David A. Rasmussen, Duke University, USA

Mottagen: 28 november 2019 Accepterad: 28 maj 2020 Publicerad: 28 oktober 2020

Upphovsrätt: © 2020 Magee et al. Detta är en öppen åtkomstartikel som distribueras enligt villkoren i Creative Commons Attribution License, som tillåter obegränsad användning, distribution och reproduktion i vilket medium som helst, förutsatt att originalförfattaren och källan är krediterade.

Datatillgänglighet: Skript och datafiler som används för våra verkliga dataanalyser och simuleringar finns tillgängliga på github.com/afmagee/hsmrfbdp.

Finansiering: A.F.M. fick stöd av National Science Foundation (https://www.nsf.gov) stipendium DGE-1762114 och ARCS Foundation (https://www.arcsfoundation.org/) Fellowship. S.H. stöddes av Deutsche Forschungsgemeinschaft (https://www.dfg.de/) Emmy Noether-Program HO 6201/1-1. T.I.V. fick stöd av Branco Weiss Fellowship (https://brancoweissfellowship.org/) och New College, University of Oxford (https://www.new.ox.ac.uk/). A.D.L. stöddes av National Science Foundation (https://www.nsf.gov) grant DEB-1456098. V.N.M. stöddes av National Institutes of Health (https://www.nih.gov) bidrag R01-AI107034 och National Science Foundation (https://www.nsf.gov) beviljar IIS-1561334. Finansiärerna hade ingen roll i studiedesign, datainsamling och analys, beslut att publicera eller förberedelse av manuskriptet.

Konkurrerande intressen: Författarna har förklarat att det inte finns några konkurrerande intressen.


Diskussion

Tillvägagångssättet som beskrivs i detta dokument möjliggör att strukturerade, stokastiska epidemiologiska och andra populationsdynamiska modeller är anpassade till släktforskningar för att gemensamt utläsa tidigare befolkningsdynamik och modellparametrar. Vi tror att detta är ett viktigt steg framåt inom fylodynamik eftersom många populationer är strukturerade på ett sätt som kan skada uppskattningar av demografiska parametrar när man använder koalescentbaserade metoder om befolkningsstrukturen inte beaktas korrekt. Dessutom, till skillnad från tidigare metoder för att anpassa strukturerade koalescentmodeller till släkter (t.ex. [7], [15]), kan vårt ramverk rymma icke-jämvikt och icke-linjär populationsdynamik och tillåter födelse- och migrationshastigheter att variera över tiden. Vi kan också inkludera stokasticitet i våra modeller när vi anpassar dem till data som erhållits från verkliga populationer, som kan bete sig mycket annorlunda än vad som skulle förväntas under deterministiska modeller. Vi kan därför passa den typ av mekanistiska populationsdynamiska modeller som vanligtvis används av epidemiologer och ekologer, som ofta inkluderar befolkningsstruktur, till släktforskningar.

Som vi har visat, ställer stokastiska populationsdynamiska modeller in på släktforskningar genom en strukturerad koalescentmodell några utmaningar för statistisk slutsats som normalt inte behandlas i den statistiska litteraturen om anpassning av generiska statliga rymdmodeller till observationsdata. Enligt våra strukturerade sammanfogningsmodeller beror sannolikheten för en släktforskning villkorat av både populationsstatens variabler såväl som tillstånden för enskilda släktlinjer över tid. Men om vi går bakåt i tiden kan sannolikheten för att en släktlinje befinner sig i ett visst tillstånd starkt bero på det tillstånd som släktet samplades in vid någon framtida tidpunkt. Partikelfiltreringsmetoder, som används i stor utsträckning för att anpassa statliga rymdmodeller till andra datakällor, kan prestera mycket dåligt under dessa omständigheter eftersom systemets tillstånd, i detta fall härstamningstillstånden, kan bero starkt på systemets framtida tillstånd . En strategi vi inledningsvis försökte var därför att använda en Gibbs samplingsmetod för att iterativt ta prov från de villkorade bakre tätheterna av populationstillståndsvariablerna och härstamningstillståndsvariablerna i oberoende steg för att undvika problemet med att ha både framåt- och bakåttidsberoende i modellen. Tyvärr fann vi att en sådan Gibbs -provtagningsstrategi kan vara mycket ineffektiv och drabbas av extremt dålig MCMC -blandning när det finns starka korrelationer mellan parametrarna och släkttillstånden. Till exempel, i vår tvåpopulationsmodell styr blandningsparametern hur snabbt linjerna rör sig mellan tillstånden och är därför starkt korrelerad med släkttillstånden. Om vi ​​uppdaterar villkorat på våra nuvarande härstamningstillstånd, måste det föreslagna värdet på vara mycket nära det aktuella värdet för att förslaget ska ha tillräckligt hög sannolikhet för att accepteras villkorat av de nuvarande härstamningstillstånden. Vi utforskar därför ett potentiellt mycket stort parameterutrymme med bara små steg åt gången.

Med tanke på dessa problem bestämde vi oss för att använda en modifierad version av PMMH -algoritmen som ursprungligen föreslogs av Andrieu et al. [22]. I detta tillvägagångssätt föreslår vi helt enkelt nya parametervärden varje MCMC-iteration och kör sedan partikelfiltret för att numeriskt integrera över populationstillståndsvariablerna. För att göra partikelfiltreringsalgoritmen så effektiv som möjligt inom varje MCMC -steg tillåter vi omprovning genom att först väga partiklarna enligt de förväntade släkttillstånden. När vi har kört partikelfiltret framåt i tid, kan vi sedan beräkna sanningssannolikhetens sannolikheter bakåt i tiden och tillämpa en ytterligare omgång av viktprovtagning för att korrigera eventuell förspänning som införs genom att använda de förväntade släktlinjetillståndssannolikheterna. Med sannolikheterna för varje partikels sanna härstamningstillstånd kan vi beräkna sannolikheten för sammansmältning av släktforskningen samtidigt som vi summerar alla möjliga härstamningstillstånd. Vi kan därför integrera över både de obemärkta variablerna för befolkningstillstånd och variablerna för släkttillstånd när vi beräknar den marginella sannolikheten för parameterförslaget. Vi har således en effektiv MCMC -algoritm för provtagning från parametrarnas bakre densitet utan att behöva utforma oberoende förslag för befolkningsstaterna eller härkomststaterna. PMMH-provtagaren har därför en stor praktisk fördel jämfört med andra MCMC-metoder som lätt kan kvantifieras. För modellerna som behandlas i detta dokument konvergerade PMMH -algoritmen vanligtvis i mindre än 100 000 iterationer medan vi för Gibbs -provtagaren kunde köra miljontals MCMC -iterationer och fortfarande inte konvergera. Effektiviteten av detta tillvägagångssätt kommer förhoppningsvis att göra det möjligt att även överväga fylogenetisk osäkerhet i framtiden genom att ta urval av släktforskningar utöver epidemiologiska parametrar i MCMC -algoritmen.

Huruvida typen av koalescerande modeller som betraktas här är lämpliga för en viss patogen är en annan viktig fråga. De koalescerande modellerna antar att varje infekterad värd motsvarar en enda patogenlinje. Om detta verkligen alltid var fallet så skulle sammanfallande händelser i släktforskningen alltid motsvara överföringshändelser i befolkningen. I verkligheten kommer sammanfallande händelser inte att inträffa omedelbart vid överföringshändelser utan någon gång före den faktiska överföringshändelsen eftersom det kommer att finnas en väntetid mellan när en släkt överförs och när den sammanfogas med en annan samplad släktlinje i värden. Hur nära den faktiska överföringshändelsen överensstämmer i tid med koalescenthändelsen kommer sannolikt att bero på patogenens dynamik inom värd [42]. För kroniska virusinfektioner som HIV där flera släktlinjer kan kvarstå inom en given värd i månader eller år, kan detta resultera i en stor skillnad i tidpunkten för överföring och sammanfallande händelser. Icke desto mindre fann en simuleringsstudie med hjälp av en realistisk fördelning av inom-värd-koalescenttider för HIV att skillnaden i timing mellan koalescent- och överföringshändelser inte var tillräcklig för att förutse uppskattningar av epidemiologiska parametrar [34]. Detta kan bero på det faktum att en stor del av hiv-överföringarna beror på nyligen infekterade individer, i vilket fall koalescenthändelsen inom värden inte kan ha inträffat särskilt länge före själva överföringshändelsen. Ett mer principiellt tillvägagångssätt att följa i framtiden kan vara att tillskriva de faktiska överföringstiderna beroende på tidpunkten för koalescenthändelserna med hjälp av information om värdpopulationens dynamik. Till exempel kan ytterligare information om patogenpopulationsstorlekar under en typisk infektion ge en informativ väntetid mellan överföringshändelser och koalescerande händelser inom värdar.

En annan möjlig kränkning av den koalescenta modellen uppstår om individer ur urvalet har ättlingar som själva provtagits, vilket kan uppstå när prover samlas in i serie över tid. Den sammanförande modellen antar implicit att när en ny släktprov tas, samlas den här släkten från en annan värd än någon annan härstamning som redan finns i släktforskningen. Men om en härstamning provtas från en värd som har andra samplade avkomlingar i släktforskningen, resulterar detta i en koalescenthändelse i trädet som inte motsvarar en överföringshändelse i populationen. Ett liknande problem skulle uppstå om vi omedvetet samplade mer än en härstamning från en enda infekterad värd. Detta kommer emellertid sannolikt endast att ske om provtagningen är tät i förhållande till prevalensen över tid. Till exempel, om provtagningen är tät i början och slutet av en epidemi, kommer det med stor sannolikhet att värdar som provtagits i början av epidemin sannolikt kommer att ha urval av ättlingar i slutet av epidemin. Vi erkänner att de koalescerande modellerna som används i denna artikel inte kan hantera dessa typer av situationer adekvat, även om det för HIV-analysen är osannolikt att detta är ett allvarligt problem eftersom alla sekvenser togs under det senaste förflutna när prevalensen var hög. I fall där detta sannolikt kommer att vara ett allvarligt problem kan det vara värt att utveckla metapopulationskoalescentmodeller, till exempel de som introducerades av Dearlove och Wilson [43], som gör att värdar kan infekteras av mer än en enda släktlinje.

Som vår applikation för HIV visade, tillät PMMH-algoritmen oss att härleda viktiga epidemiologiska parametrar som stegspecifika överföringshastigheter direkt från släktforskning. Men när det gäller hiv stannar individer i samma infektionsstadium under långa perioder i förhållande till epidemin. Infektionsstadiet hos provtagna individer är därför mycket informativt om tillståndet för släktlinjen som går in i det förflutna. Vår erfarenhet av hiv är därför kanske inte representativ för vår allmänna förmåga att utläsa parametrar som avser patogenöverföring eller rörelse i strukturerade populationer. Faktum är att vår enkla tvåpopulation SIR-modell avslöjade vissa förhållanden under vilka det kan vara svårt att uppskatta parametrar relaterade till befolkningsstruktur. När släktlinjer snabbt rör sig mellan stater på grund av överföring eller migration kommer en viss härstamning sannolikt att ha ändrat tillstånd flera gånger innan en koalescent händelse nås, vilket leder till stor osäkerhet om släkttillståndet över majoriteten av släktforskningen. Detta är något analogt med problemet med platsmättnad vid fylogenetisk inferens, där flera övergångar på en viss plats längs grenar kan göra den platsen fylogenetiskt oinformativ [44]. När det gäller snabba övergångshastigheter bland befolkningsländerna ger observationer av släktlinjernas tillstånd vid provtagningen lite eller ingen information om befolkningens struktur eftersom all information om släktskapets tillstånd snabbt går förlorad. Under dessa omständigheter kommer det att vara svårt att exakt uppskatta migrationshastigheter eller andra parametrar relaterade till befolkningsstrukturen från släkter som vi såg från sannolikhetsprofilerna för blandningsparametern i tvåpopulationsmodellen, även om det kan vara möjligt med många prover eller en stor provfraktion. Detta återspeglar tidigare arbete med inferens med strukturerade koalescentmodeller, där forskare har funnit det svårt att uppskatta migrationshastigheter från släkter även utan komplikationen av komplex populationsdynamik [7], [45].

Även om det inte alltid är möjligt att exakt beräkna parametrar relaterade till befolkningsstruktur från släktforskningar, kan vi föreställa oss flera fall där förmågan att anpassa mekanistiska epidemiologiska modeller till släktforskningar som inkluderar befolkningsstruktur kan vara extremt användbar. Till exempel kan våra metoder användas för att anpassa rumsligt strukturerade modeller till släktforskning av prover som samlats in på olika platser och kan eventuellt komplettera nyligen utvecklade fylogeografiska metoder som tar hänsyn till rumslig struktur men som i allmänhet inte tar hänsyn till lokal befolkningsdynamik på någon särskild plats [46] , [47]. Till exempel kan det vara viktigt att införliva både rumslig och tidsmässig dynamik när strukturen hos en population inte är statisk utan förändras över tiden på grund av förändringar i migrationshastigheter, som i sig kan variera på grund av icke-stationär populationsdynamik mellan olika platser. Vår metod kan också tillämpas i fall där provtagningsansträngning är ojämnt fördelad mellan populationer så att antagandet om slumpmässig provtagning i ostrukturerade koalescerande modeller uppenbarligen har kränkts. I detta fall kan strukturerade koalescentmodeller användas för att kontrollera icke-slumpmässiga provtagningar så länge som urvalet är slumpmässigt inom delpopulationerna som definieras i den koalescenta modellen. Slutligen kan våra metoder tillämpas på multi-host eller vektorade patogener där släktlinjer kan röra sig mellan olika värd- eller vektorarter. Som visas i Rasmussen et al. [48] ​​för dengue-fallet, inklusive dynamiken hos både värd- och vektorpopulationerna i koalescerande modeller kan vara nödvändig för att populationsdynamik från släktforskning av vektorburna patogener ska vara korrekt.

Vi avslutar med att notera att metoderna som presenteras här kan användas för att passa epidemiologiska modeller till släkter såväl som andra datakällor samtidigt. Till exempel har vi tidigare visat hur ostrukturerade epidemiologiska modeller kan passa till en genealogi och en tidsserie av fallrapporter samtidigt och det skulle vara enkelt att utöka metoderna som presenteras här till att omfatta tidsserier eller andra observationsdata [21]. Detta kan vara särskilt användbart när vissa parametrar eller aspekter av dynamiken är svåra att härleda från en datakälla men för vilka en alternativ datakälla kan vara mycket informativ. Exempelvis kan fallrapportdata aggregeras över olika delpopulationer som döljer en del av den heterogenitet som finns i befolkningen men kan avslöjas genom att också överväga information som finns i en släktforskning. Att konsolidera datakällor på detta sätt kommer sannolikt att spela en viktig roll i epidemiologisk modellering i framtiden, särskilt när molekylära sekvensdata blir alltmer tillgängliga och fylodynamiska metoder integreras i modern epidemiologi.