COMPUTATIONAL GENOMICS

Pierluigi RITROVATO COMPUTATIONAL GENOMICS

0623200010
DIPARTIMENTO DI INGEGNERIA DELL'INFORMAZIONE ED ELETTRICA E MATEMATICA APPLICATA
CORSO DI LAUREA MAGISTRALE
INFORMATION ENGINEERING FOR DIGITAL MEDICINE
2022/2023

OBBLIGATORIO
ANNO CORSO 1
ANNO ORDINAMENTO 2022
SECONDO SEMESTRE
CFUOREATTIVITÀ
324LEZIONE
324LABORATORIO
Obiettivi
Il corso fornisce le conoscenze di base per l’analisi di dati prodotti da piattaforme di Next Generation Sequencing e la costruzione di pipeline per l’analisi di tali dati.

Conoscenze e capacità di comprensione
Banche dati bioinformatiche, struttura, modalità di accesso e consultazione. Principali problemi per l’analisi di dati omici quali l’allineamento di sequenze, la ricerca di geni, mutazioni e varianti, la correlazione tra geni, genome assembly. Caratteristiche dei principali tool e piattaforme disponibili sul mercato.

Conoscenza e capacità di comprensione applicate
Accedere alle principali banche dati bioinformatiche e utilizzarle in specifiche applicazioni. Impiegare i principali tool e piattaforme per l’analisi dei dati. Realizzare pipeline per l’analisi di diverse tipologie di dati omici quali DNA, RNA, mRNA, miRNA, riferiti a diverse specie.
Prerequisiti
SEBBENE NON FORMALMENTE PREVISTA, PER GARANTIRE IL RAGGIUNGIMENTO DEGLI OBIETTIVI DEL CORSO, È FORTEMENTE CONSIGLIATO L’AVER ALMENO SEGUITO IL CORSO DI BIOLOGY AND GENOMICS
Contenuti
UNITÀ DIDATTICA 1: INTRODUZIONE AI PROBLEMI DI BIOINFORMATICA E GENOMICA COMPUTAZIONALE (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 2/0/0)
UNITÀ DIDATTICA 2: INTRODUZIONE AL LINGUAGGIO DI PROGRAMMAZIONE R (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 2/2/0)
- 1 (2 ORE LEZIONE) R STUDIO ENVIRONMENT AND R DATA STRUCTURES
- 2 (2 ORE ESERCITAZIONE) PACKAGE BIOCONDUCTOR
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: SINTASSI DEL LINGUAGGIO R E PRINCIPALI STRUTTURE DATI LIST, VECTOR, ARRAY, MATRIX E DATAFRAME
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: UTILIZZO DEL PACKAGE BIOCONDUCTOR PER L'ANALISI DI SEQUENZE DNA/RNA
UNITÀ DIDATTICA 3: DATABASE E RISORSE IN AMBITO BIOLOGICO E DELLA BIOINFORMATICA (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 2/6/0)
3 - (ESERCITAZIONE 2 ORE) GENOME SEQ DB (ESEMBLE GENE BANK) - PROTEIN SEQ DB
4 - (ESERCITAZIONE 2 ORE) BIOINFORMATIC RESOURCES AND GENE ONTOLOGY
5 - (LEZIONE 2 ORE) NEXT GENERATION SEQUENCE FILE FORMATS (FASTA, FASTQ, SAM/BAM, VCF)
6 - (ESERCITAZIONE 2 ORE) ESEMPI D'USO DELLE RISORSE BIOINFORMATICHE IN RETE E DEI DATABASES
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: CARATTERISTICHE DEI DIVERSI DB/REPOSITORY E POLITICHE DI ACCESSO ED UTILIZZO DI DATI E ALGORITMI
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: UTILIZZO DELLE RISORSE (DB E PROGRAMMI) PER LA RISOLUZIONE DI SEMPLICI PROBLEMI DI BIOINFORMATICA (RICERCA GENI, SEQUENZE, ECC.)
UNITÀ DIDATTICA 4: INDEXING TECHNIQUES AND READ ALIGNMENT (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 10/0/0)
7 - (LEZIONE 2 ORE) MOTIF SEARCH
8 - (LEZIONE 2 ORE) INDEXING TECHNIQUES FOR READ ALLIGNMENT
9 - (LEZIONE 2 ORE) BURROWS–WHEELER TRANSFORM AND FM INDEX
10 - (LEZIONE 2 ORE) APROX MATCHING AND DYNAMIC PROGRAMMING FOR EDIT DISTANCE
11 - (LEZIONE 2 ORE) DYNAMIC PROGRAMMING FOR LOCAL AND GLOBAL ALIGNMENT
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: CARATTERISTICHE DELLE STRUTTURE DI INDICIZZAZIONE SUFFIX ARRAY E FM INDEX; CARATTERSTICHE DEGLI ALGORITMI PER MOTIF SEARCH E PER L'ALLINEAMNENTO LOCALE E GLOBALE DI STRINGHE
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: VALUTAZIONE DELLE CARATTERISTICHE DELLE DIVERSE STRUTTURE DI INDICIZZAZIONE DEL DNA E DEGLI ALGORITMI PER L'ALLINEAMENTO
UNITÀ DIDATTICA 5 - TECNOLOGIE ED APPLICAZIONI DI NEXT GENERATION SEQUENCING (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 0/10/0)
12 - (ESERCITAZIONE 2 ORE) EXOME SEQUENCING
13 - (ESERCITAZIONE 2 ORE) TRANSCRIPTOMICS
14 - (ESERCITAZIONE 2 ORE) DE-NOVO SEQUENCING
15 - (ESERCITAZIONE 2 ORE) FUNCTIONAL ANALYSIS - GENE ONTOLOGY ENRICHMENT ANALYSIS
16 - (ESERCITAZIONE 2 ORE) TOOLS, ENVIRONMENTS AND PIPELINES FOR NGS APPLICATIONS
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: CARATTERISTICHE TECNOLOGICHE E FUNZIONALI DELLE PRINCIPALI TECNICHE DI SEQUENCING E DI ANALISI DEI DATI (DNA/RNA)
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: UTILIZZO DEI DATI DI SEQUENZIAMENTO E DEI TOOL PER LA CREZIONE DI PIPELINE BIONFORMATICHE
UNITÀ DIDATTICA 6 - GENOME ASSEMBLY ALGORITHMS AND GRAPHS (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 4/2/0)
17 - (LEZIONE 2 ORE) GENOME ASSEMBLY E OVERLAP GRAPH
18 - (LEZIONE 2 ORE) GENOME ASSEMBLY E DE BRUIJN GRAPH
19 - (ESERCITAZIONE 2 ORE) ESEMPI D'USO DI GENOME ASSEMBLY TOOLS
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: STRUTTURE A GRAFO E ALGORITMI SU GRAFI PER LA RISOLUZIONE DEL GENOME ASSEMBLY
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: VALUTAZIONE DELLE CARATTERISTICHE FUNZIONALI E DELLE PERFORMANCE COMPUTAZIONALI DEI TOOL DI GENOME ASSEMBLY DISPONIBILI IN LETTERATURA
UNITÀ DIDATTICA 7 - PROJECT WORK (ORE LEZIONE/ESERCITAZIONE/LABORATORIO 0/0/8)
REALIZZAZIONE DI UNA PIPELINE PER ANALISI DI DATI (DNA/RNA)
CONOSCENZE E CAPACITÀ DI COMPRENSIONE: ANALIZZARE IL PROBLEMA IN TERMINI DI DATI E TOOLS DA USARE PER LA PROGETTAZIONE DELLA PIPELINE
CONOSCENZE E CAPACITÀ DI COMPRENSIONE APPLICATE: IMPLEMENTAZIONE DELLA PIPELINE E DISCUSSIONE DEI RISULTATI
TOTALE ORE LEZIONE/ESERCITAZIONE/LABORATORIO 20/20/8
Metodi Didattici
L'INSEGNAMENTO (48H DI LEZIONI, ESERCITAZIONI E ATTIVITÀ DI LABORATORIO) È CARATTERIZZATO DA UN SETTING DINAMICO, CHE COMPRENDE L'ANALISI DI CASI DI STUDIO CON LA PARTECIPAZIONE ATTIVA DEGLI STUDENTI CHE ESEGUIRANNO APPROFONDIMENTI SPECIFICI SULL'USO DELLE TECNOLOGIE NGS E DEGLI STRUMENTI E DEGLI SCHEMI DI ANALISI DEL GENOMA DURANTE L'IMPLEMENTAZIONE DEL PROJECT WORK. IN PARTICOLARE, LE ATTIVITÀ DIDATTICHE INCLUDERANNO LEZIONI (20 ORE), ESERCITAZIONI (20 ORE) E LABORATORIO (8 ORE) CHE INCLUDE ANCHE LO SVILUPPO DEL PROJECT WORK. PER LO SVILUPPO DEL PROGETTO GLI STUDENTI APPLICHERANNO LE LORO CONOSCENZE AL FINE DI SCEGLIERE AUTONOMAMENTE LE TECNOLOGIE ED I TOOLS PIÙ APPROPRIATI PER RISOLVERE PROBLEMI SPECIFICI NEI DOMINI APPLICATIVI PREVISTI. LE ATTIVITÀ DIDATTICHE SARANNO SUPPORTATE DALL'USO DELLA PIATTAFORMA DI E-LEARNING DI ATENEO PER FACILITARE E STIMOLARE LA DISCUSSIONE E IL DIBATTITO TRA GLI STUDENTI, NONCHÉ PER LA NOTIFICA E LA DISTRIBUZIONE DI MATERIALE DIDATTICO.
Verifica dell'apprendimento
L'ESAME FINALE È FINALIZZATO A VALUTARE LE CONOSCENZE E LA COMPRENSIONE COMPLESSIVA DEI CONCETTI PRESENTATI NEL CORSO, LA CAPACITÀ DI APPLICARE TALI CONOSCENZE PER SVILUPPARE APPLICAZIONI SPECIFICHE E LA CAPACITÀ DI COMUNICARE E PRESENTARE IL LAVORO SVOLTO (ABILITÀ COMUNICATIVE).
L'ESAME CONSISTE IN UNA PARTE PRATICA E UNA PROVA ORALE (COLLOQUIO). LA PARTE PRATICA CONSISTE NELLO SVILUPPO DI UN PROGETTO DA SVOLGERE IN GRUPPI (2-4 STUDENTI) SULLE TEMATICHE TRATTATE DURANTE IL CORSO.
LA PROVA ORALE CONSISTE NELLA PRESENTAZIONE DEI RISULTATI RAGGIUNTI DURANTE LO SVILUPPO DEL LAVORO DEL PROGETTO.
OGNI MEMBRO DEL GRUPPO ESPONE IL PROPRIO CONTRIBUTO PER LA REALIZZAZIONE DEL PROGETTO INSIEME A UNA DISCUSSIONE SUGLI STRUMENTI E LE TECNOLOGIE UTILIZZATI, SULLA ARCHITETTURA DELLA SOLUZIONE REALIZZATA ED I RISULTATI OTTENUTI.
DURANTE IL COLLOQUIO SARANNO ALTRESÌ VALUTATA LA PREPARAZIONE DELLO STUDENTE SUGLI ARGOMENTI TRATTATI DURANTE IL CORSO.
Testi
COURSE BOOKS
COMPUTATIONAL METHODS FOR NEXT GENERATION SEQUENCING DATA ANALYSIS (MANDOIU I AND ZELIKOVSKY A) (2016)
BIOINFORMATICS ALGORITHMS - AN ACTIVE LEARNING APPROACH (3RD EDITION - 2018) PHILLIP COMPEAU & PAVEL PEVZNER

SUGGESTED BOOKS AND LEARNING MATERIAL
HTTPS://EN.WIKIBOOKS.ORG/WIKI/NEXT_GENERATION_SEQUENCING_%28NGS%29
NEXT-GENERATION SEQUENCING DATA ANALYSIS (XINKUN WANG) (2014)
BIOINFORMATICS: A PRACTICAL HANDBOOK OF NEXT GENERATION SEQUENCING AND ITS APPLICATIONS BY LLOYD LOW, MARTTI TAMMI 2017

MATERIALE DIDATTICO INTEGRATIVO SARA' DISPONIBILE NELLA SEZIONE DEDICATA DELL'INSEGNAMENTO ALL'INTERNO DELLA PIATTAFORMA E-LEARNING DI ATENEO (HTTP://ELEARNING.UNISA.IT) ACCESSIBILE AGLI STUDENTI DEL CORSO TRAMITE LE CREDENZIALI UNICHE DI ATENEO.
Altre Informazioni
L'INSEGNAMENTO È EROGATO IN INGLESE
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-08-21]