Características da história natural predizem padrões de diferenciação genética em anuros do bioma Caatinga
anuros, Random Forest, diferença genética, área geográfica, dispersão, Caatinga.
Características intrínsecas das espécies são fatores importantes que podem favorecer ou restringir o fluxo gênico, influenciando a divergência genética entre as populações. A filogeografia é uma poderosa ferramenta para investigar os processos ecológicos e evolutivos que moldaram a diversidade das espécies. Nesse contexto, a integração de atributos de história natural à filogeografia oferece uma nova perspectiva acerca dos processos de diversificação. Aqui, apresentamos o primeiro capítulo da tese, no qual investigamos se atributos de história natural relacionadas à capacidade de dispersão dos anuros podem promover a diferenciação genética entre populações no bioma Caatinga. Postulamos que a diferenciação genética entre espécies codistribuídas no bioma pode ser melhor explicada por atributos intrínsecos das espécies do que por fatores extrínsecos. Para isso, selecionamos espécies com ocorrência na Caatinga e coletamos sequências de DNA mitocondrial disponíveis no GenBank, complementando-as com dados originais. Adicionalmente, geramos dados inéditos para a espécie Rhinella granulosa. Para identificar quais preditores melhor explicam a diferença genética entre as populações, construímos modelos de regressão baseados no algoritmo Random Forest. Calculamos a diferença nucleotídica entre os pares de população, qual foi utilizada como variável resposta. Como preditores, selecionamos cinco variáveis de história natural relacionadas a dispersão, além das distâncias geográfica e ambiental. Após a seleção dos preditores mais importantes, o modelo final foi construído por meio de regularização guiada, utilizando o Guided Regularized Random Forest (GRRF). Obtivemos um conjunto final com 925 sequências, distribuídas em 129 localidades e 22 espécies pertencentes a sete famílias. Nossos resultados indicam que os principais preditores que melhor explicam a diferença genética entre as populações de anuros da Caatinga são: tamanho da área de distribuição, distância geográfica, tamanho do corpo e isotermalidade, respectivamente. O tamanho da área de distribuição foi o preditor com maior importância. Além disso, sua relação com a variável resposta sugere um aumento da diferenciação genética em espécies com menores áreas de distribuição. Este estudo demostra que a inclusão de aspectos relacionados a história natural em métodos de aprendizado de máquina permite integrar múltiplas informações sobre as espécies e possibilita uma investigação mais abrangente dos fatores que influenciam a diferenciação genética. Além disso, reforça a importância da incorporação desses preditores em estudos filogeográficos voltados aos processos de diversificação da Caatinga.