ENVIRONMENTAL STATISTICS AND MODELLING
2° Anno - Primo Semestre
Frequenza Non obbligatoria
- 6 CFU
- 48 ore
- INGLESE
- Sede di Trieste
- Opzionale
- Convenzionale
- Scritto
- SSD BIO/03
- Caratterizzante
Al termine del corso, gli studenti saranno in grado di:
1. Comprendere i fondamenti teorici della modellistica ecologica e il suo ruolo nella ricerca scientifica in ecologia. Acquisiranno conoscenze sui principali framework di modellazione statistica, tra cui modelli lineari, modelli lineari generalizzati (GLM), modelli additivi generalizzati (GAM) e modelli a effetti misti. Saranno inoltre introdotti a tecniche multivariate e di clustering applicabili a dataset ecologici, come l’Analisi delle Componenti Principali (PCA) e i metodi basati sulla densità kernel.
2. Applicare modelli statistici utilizzando il linguaggio R per l’analisi di dati ecologici e l’interpretazione delle relazioni ecologiche. Gli studenti saranno in grado di eseguire il preprocessing dei dati, adattare modelli, effettuare analisi diagnostiche e validazioni, utilizzando dataset ecologici reali. Verranno svolti progetti di modellistica ecologica che integrano teoria e applicazione pratica.
3. Valutare criticamente l’adeguatezza dei diversi approcci modellistici rispetto a specifici quesiti ecologici e tipologie di dati. Gli studenti apprenderanno a valutare le prestazioni dei modelli attraverso criteri di selezione, validazione (cross-validation) e tecniche di bootstrapping, riflettendo sui limiti e sulle assunzioni dei modelli statistici nel contesto ecologico.
4. Presentare in modo efficace i risultati della modellistica ecologica, attraverso formati chiari, strutturati e scientificamente appropriati, inclusi output grafici e tabellari. Gli studenti saranno in grado di comunicare i risultati e le implicazioni ecologiche delle analisi statistiche tramite relazioni scritte e presentazioni orali.
5. Sviluppare competenze di apprendimento autonomo attraverso l’esplorazione di nuove tecniche modellistiche e funzionalità del software R. Il corso incoraggerà l’uso di risorse disponibili (documentazione, letteratura scientifica, piattaforme online) per affrontare sfide analitiche, promuovendo lo sviluppo di capacità utili per la ricerca avanzata e la pratica professionale in ambito ecologico.
Si prevede che gli studenti abbiano una conoscenza di base dei concetti statistici, inclusi statistica descrittiva, test di ipotesi e analisi di regressione. Non è richiesta alcuna esperienza precedente con la programmazione in R.
“Tutti i modelli sono sbagliati, ma alcuni sono utili.” Sebbene l’origine esatta di questa citazione sia incerta, il suo messaggio è chiaro: i modelli sono rappresentazioni semplificate della realtà che, nonostante le loro imperfezioni, possono essere estremamente efficaci per comprendere e prevedere fenomeni complessi. Con questa prospettiva, il corso offre un’introduzione completa alla modellistica ecologica, con un forte focus sull’applicazione di metodi statistici utilizzando il linguaggio di programmazione R. Gli studenti lavoreranno con strumenti fondamentali per la ricerca ecologica, tra cui: (i) diversi tipi di modelli lineari, (ii) metodi per gestire la non linearità, (iii) principali tecniche di analisi multivariata, e (iv) analisi di dati ecologici basate sulle distribuzioni. Combinando teoria ed esperienza pratica, il corso pone l’accento sull’apprendimento applicato attraverso studi di caso basati su dataset ecologici reali. È pensato per studenti che intendono sviluppare competenze solide e applicate nell’analisi dei dati, una parte essenziale del toolkit dell’ecologo moderno.
David I. Warton (2022). Eco-Stats: Data Analysis in Ecology. Springer International Publishing.
R icebreaking “party”
• Introduzione al software R: installazione, interfaccia e comandi di base.
• Fondamenti di programmazione in R I: tipi di dati, strutture e operazioni di base.
• Gestione dei dati con R: manipolazione, filtraggio e unione di dataset.
• Creazione di grafici con R.
• Fondamenti di programmazione in R II: funzioni, cicli, istruzioni if/else.
• Introduzione a R Markdown per la creazione di report.
Prima di iniziare
• Panoramica dei principi della modellazione ecologica e della loro importanza nella ricerca ecologica.
• Revisione dei concetti statistici chiave necessari per la modellazione.
Modelli lineari e loro estensioni
• Regressione lineare semplice con un solo predittore: interpretazione e diagnostica.
• Comprendere l’equivalenza tra modelli lineari e tecniche inferenziali tradizionali.
• Regressione lineare multipla: inclusione di più predittori continui.
• Inclusione di predittori categorici e interpretazione dei loro effetti.
• Termini di interazione nei modelli lineari: comprensione concettuale e applicazione pratica.
• Strategie di selezione dei modelli: selezione stepwise, criteri informativi.
• Introduzione ai modelli ad effetti misti: effetti casuali e strutture dati gerarchiche.
• Gestione della non-indipendenza tra osservazioni nei dataset ecologici.
• Tecniche di validazione dei modelli: metodi di cross-validation e bootstrapping.
• Modelli Lineari Generalizzati (GLM): regressione logistica, regressione di Poisson e funzioni di collegamento (link functions).
Suggerimenti per gestire la non linearità
• Introduzione ai Modelli Additivi Generali (GAM) per modellare in modo flessibile le relazioni non lineari.
Metodi analitici multivariati e avanzati
• Analisi delle Componenti Principali (PCA) per la riduzione della dimensionalità e l’identificazione di pattern.
• Adattamento di linee allometriche: modellazione delle relazioni in dati di dimensioni e forme.
• Metodi basati sulla densità del kernel per l’analisi spaziale e distribuzionale dei dati.
• Introduzione agli algoritmi di clustering: metodi di clustering gerarchico e k-means.
Il corso combina lezioni frontali con sessioni pratiche (interattive) di programmazione in R.
Tutti i materiali del corso, incluse le slide delle lezioni, i dataset, gli script R commentati e le letture supplementari, saranno forniti tramite il canale MS-Teams.
Progetto individuale che prevede l'elaborazione e la discussione critica di un caso studio.
NA