Curso de Advanced Statistics with R for Biological Sciences entre os dias 25 a 29 de setembro
Descrição do Curso
A primeira sessão do curso é um lembrete da regressão linear e da análise de variância, as duas técnicas estatísticas que constituem a base dos quadros mais importantes dos modelos estatísticos. Estes modelos estatísticos (GLM, GLZ e GAM) serão o conteúdo das próximas quatro sessões. O GLM (Modelo Linear Geral) será estudado na segunda e terceira sessões. Devido à sua robustez e relativa simplicidade, este é o modelo estatístico mais utilizado. Por esse motivo, no curso passamos mais tempo com GLM do que com os demais frameworks de modelagem (GLZ, GAM). Através de exemplos trabalhados serão explicados os seguintes tópicos: I) pressupostos do GLM, como testá-los e como resolver problemas quando alguns desses pressupostos não são atendidos (transformação de dados para não normalidade, ajuste alternativo por mínimos quadrados generalizados para heterocedasticidade de variância e autocorrelação residual); II) contraste de hipóteses para os efeitos principais e testes post-hoc para os efeitos simples; III) visualização das previsões do modelo. No GLM será explicada com particular detalhe a inclusão de factores aleatórios (modelos simples de efeitos mistos, desenhos hierárquicos e desenhos de declives aleatórios). GLZ (Modelos Lineares Generalizados) são uma extensão do GLM para distribuições de erros que podem ser diferentes das gaussianas. Serão mostrados três exemplos trabalhados para diferentes distribuições (binomial Poisson e binomial negativo, para dados superdispersos), e um exemplo simples incluindo fatores aleatórios. GAM é um modelo estatístico que pode incorporar quaisquer recursos do GLM e GLZ. Mas, além disso, e considerando restrições adicionais, poderiam incorporar funções suavizadas (não lineares, mas não paramétricas) para descrever a relação entre a variável resposta e uma ou várias variáveis preditoras. Este modelo estatístico tem ganhado popularidade em diferentes campos da ciência devido ao aumento do poder dos computadores nos últimos 20 anos. Recomenda-se pelo menos um nível iniciante na linguagem R para este curso, e também alguma familiaridade com técnicas estatísticas básicas (regressão, contraste de hipóteses, ANOVA). O curso está aberto a qualquer nível, desde estudantes de graduação até pesquisadores seniores. É considerada a “segunda parte” de outra unidade curricular regularmente ministrada no CIIMAR intitulada Estatística Introdutória às Ciências Biológicas.
Metodologia do curso
O conteúdo do curso consiste em breves introduções teóricas a cada tópico seguidas de exemplos trabalhados em linguagem R, ao longo dos quais são mostradas todas as características do tópico específico. Ao final de cada seção, os alunos receberão dados para a realização de exercícios que serão revisados e corrigidos durante as aulas.
As explicações teóricas, bem como os exemplos trabalhados são integralmente desenvolvidos em pdf, com scripts R com os exemplos como suporte adicional. O acesso a todo esse material será fornecido dias antes do curso por meio de um link para a plataforma Open Science Framework. As soluções dos exercícios também serão entregues aos alunos no final do curso.
Objetivo geral do curso
Visão geral dos principais enquadramentos dos modelos estatísticos para compreender as diferenças entre eles e consequentemente, os seus contextos específicos de aplicabilidade.
Objetivos específicos do curso
– Compreender os princípios dos enquadramentos dos modelos estatísticos de forma a aplicá-los de acordo com as características dos dados.
– Testar pressupostos do modelo com contraste de hipóteses e gráficos de diagnóstico, e aprender a resolver problemas associados a este processo (transformação de dados, técnicas alternativas de ajuste, distribuições alternativas de erros, utilização de ajustes não lineares ou não paramétricos).
– Compreender a diferença entre factores aleatórios e fixos e as possíveis formas de incorporar 4 factores aleatórios no desenho do modelo.
– Conhecer os diferentes contrastes de hipóteses que podem ser realizados num modelo estatístico (análise de variância e análise de deviance para os efeitos principais, Tukey, Dunnett, diferenças menos significativas, etc. para o post-hoc).
– Aprenda os métodos mais padronizados para selecionar o melhor modelo entre uma série de candidatos ajustados aos mesmos dados.
Programa do Curso (10h – 14h)
Sessão 1. 10h00 – 14h00 25 de setembro de 2023
1.1 Lembrete de regressão linear
1.2 Exercício
1.3 Lembrete da ANOVA
1.4 Exercício
Sessão 2. 10h00 – 14h00 26 de setembro de 2023
2.1 Modelo linear geral (GLM). Introdução e exemplo 1
2.2 GLM, Exemplo 2
2.3 Exercício
2.4 GLM com fatores aleatórios (modelos de efeitos mistos). Exemplo
Sessão 3. 10h00 – 14h00 27 de setembro de 2023
3.1 GLM com fatores aleatórios. Projetos hierárquicos (aninhados)
3.2 GLM com fatores aleatórios. Projetos de inclinação aleatória
3.3 Exercício
3.4 Exercício
Sessão 4. 10h00 – 14h00 28 de setembro de 2023
4.1 Modelos lineares generalizados (GLZ). Introdução e exemplo de distribuição binomial
4.2 GLZ, exemplo de distribuição de Poisson
4.3 GLZ, exemplo com sobredispersão (distribuição binomial negativa)
4.4 GLZ com fatores aleatórios. Exemplo
Sessão 5. 10h00 – 14h00 29 de setembro de 2023
5.1 Exercício
5.2 Modelos aditivos generalizados (GAM). Introdução e exemplo
5.3 Modelos GAM com fatores aleatórios. Exemplo
5.4 Exercício
Instrutor: Aldo Barreiro Falpeto
Aldo Barreiro Felpeto é investigador do Centro Interdisciplinar de Investigação Marinha e Ambiental (CIIMAR) vinculado à Universidade do Porto (Porto, Portugal). Sua carreira de pesquisa se concentrou na ecologia do plâncton. Ele defendeu seu doutorado. dissertação em 2007 no Departamento de Ecologia da Universidade de Vigo (Vigo, Espanha) sobre interações entre zooplâncton e espécies tóxicas de fitoplâncton da costa atlântica noroeste espanhola, sul do mar Báltico e sul da costa de Tirreno. Em 2008-2010, realizou pós-doutorado no Departamento de Ecologia e Biologia Evolutiva da Cornell University (Ithaca, Nova York, EUA). Desde 2011 é investigador do CIIMAR. Desenvolveu uma sólida formação em estatística e modelação dinâmica com software R, frequentando 10 cursos no período 2006-2018 e desde 2013, organizando 14 edições de cursos sobre diferentes aspectos de estatística e programação com R, maioritariamente no CIIMAR, mas também no Universidade de Vigo (Espanha) e Universidade de Magalhães (Chile). É coautor de dois livros sobre estatística e programação: Tratamiento de Datos (Ed. Díaz de Santos, Madrid, 2006) e Tratamiento de Datos con R, SPSS y ESTATISTICA (Ed. Díaz de Santos, Madrid, 2010). Devido à sua experiência em estatística e programação, desenvolveu colaborações em diferentes áreas da ecologia, mas também das ciências ambientais e da biologia molecular. Publicou 56 artigos, contabilizando um índice h de 23 e um índice i10 de 40.
Informação importante:
– Todo o curso será ministrado através de uma plataforma zoom.
– O curso será ministrado em inglês.
– Recomenda-se pelo menos um conhecimento de iniciante em R e estatística básica.
– Todas as informações e materiais necessários ao desenvolvimento do curso (instruções para instalação dos pacotes R e R, pdf com conteúdo das aulas, roteiros com exemplos e exercícios, dados para exemplos e exercícios) serão disponibilizados para todos os participantes do curso através de um link para a plataforma Open Science Framework.
Informações de registro:
250€ (200€ para associados do CIIMAR/UP)
Após o anúncio, serão preenchidas 25 vagas disponíveis. A inscrição, juntamente com os dados de pagamento, estão disponíveis no site do CIIMAR, através do link que é enviado juntamente com o e-mail de divulgação do curso.
Passos para se registrar:
– Pergunte através do email (abarreiro@ciimar.up.pt) se há vagas disponíveis.
– Inscreva-se através do link do curso enviado no e-mail informativo (ou encontrado no site do CIIMAR)
– Enviar comprovativo do pagamento necessário à reserva do lugar (enviar comprovativo para abarreiro@ciimar.up.pt).
– Após o envio do comprovante de pagamento, será enviado um e-mail de confirmação da inscrição.
Website by: Glitz Design
© 2023 CIIMAR – Todos os direitos reservados.