STRUMENTI FORMALI PER LA BIOINFORMATICA

Rosalba ZIZZA STRUMENTI FORMALI PER LA BIOINFORMATICA

0522500145
DIPARTIMENTO DI INFORMATICA
CORSO DI LAUREA MAGISTRALE
INFORMATICA
2023/2024



ANNO CORSO 1
ANNO ORDINAMENTO 2016
PRIMO SEMESTRE
CFUOREATTIVITÀ
1STRUMENTI FORMALI PER LA BIOINFORMATICA
540LEZIONE
18LABORATORIO
2STRUMENTI FORMALI PER LA BIOINFORMATICA
324LABORATORIO
Obiettivi
CONOSCENZA E CAPACITÀ DI COMPRENSIONE
•CONOSCENZA DEI MODELLI DI COMPUTAZIONE E MECCANISMI GENERATIVI, DELLE POTENZIALITÀ, LIMITI, ASPETTI MATEMATICI E CAMPI DI APPLICAZIONE DI TALI MODELLI.
•PADRONANZA DELLE TECNICHE DI ALGORITMI DI COMBINATORIA DELLE PAROLE E DELLE STRUTTURE DATI UTILIZZATE PER POTER AFFRONTARE LO STUDIO E LA SOLUZIONE DI PROBLEMI COMPUTAZIONALI DI ANALISI E CONFRONTO DI SEQUENZE BIOLOGICHE.
•CONOSCENZA DELLE APPLICAZIONI DEL MACHINE E DEEP LEARNING IN PROBLEMI DI GENOMICA.

CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
•SAPER RICONOSCERE I PROBLEMI CHE POSSONO ESSERE RISOLTI UTILIZZANDO SOLUZIONI BASATE SUI MODELLI DI CALCOLO STUDIATI.
•SAPER MODELLARE LA SOLUZIONE DI PROBLEMI BIOLOGICI SU SEQUENZE GENOMICHE MEDIANTE LA FORMULAZIONE DI PROBLEMI COMBINATORI.
•SAPER UTILIZZARE LE BANCHE DATI GENOMICHE PER ESTRARRE LE INFORMAZIONI DI INTERESSE.
•VALUTARE IN MODO CRITICO I RISULTATI, COGLIENDO LE DIFFERENZE CHE DIVERSI TIPI DI STRUMENTI E DI APPROCCI POSSONO AVERE SUL DATO OTTENUTO.

Prerequisiti
È PREFERIBILE, MA NON OBBLIGATORIO, CHE GLI STUDENTI ABBIANO CONOSCENZE DI C/C++ E PYTHON (IN PARTICOLARE LE LIBRERIE TENSORFLOW E PYTORCH). ANALOGAMENTE È PREFERIBILE, MA NON OBBLIGATORIO, CHE GLI STUDENTI ABBIANO CONOSCENZE DEI MODELLI DI COMPUTAZIONE DI BASE (AUTOMI FINITI E MACCHINE DI TURING).
Contenuti
PRIMA PARTE (40 ORE): STRINGHE E LINGUAGGI. AUTOMI FINITI DETERMINISTICI E NON DETERMINISTICI. ESPRESSIONI E LINGUAGGI REGOLARI. EQUIVALENZA E MINIMIZZAZIONE DI AUTOMI. GRAMMATICHE E LINGUAGGI LIBERI DAL CONTESTO. ALBERI SINTATTICI. AUTOMI A PILA. GRAMMATICHE REGOLARI. CENNI SULLA GERARCHIA DI CHOMSKY. CENNI SU RECENTI E RILEVANTI APPLICAZIONI DEI MODELLI DI COMPUTAZIONE.
PRINCIPALI ASPETTI DELLA COMBINATORIA DELLE PAROLE CON APPLICAZIONE ALLA BIOINFORMATICA.

SECONDA PARTE (16 ORE):
INTRODUZIONE ALLA BIOINFORMATICA: CONCETTI FONDAMENTALI DI BIOLOGIA MOLECOLARE E GENOMICA STRUTTURE DATI PER LA BIOINFORMATICA: BLOOM FILTERS, GRAFI DI DE BRUJIN, GRAFI DI OVERLAP, SUFFIX ARRAY, WHEELER GRAPH. ALGORITMI PER LA BIOINFORMATICA: LA RICERCA DI MOTIVI IN SEQUENZE BIOLOGICHE. TECNICHE DI ALLINEAMENTO MULTIPLO DI SEQUENZE. APPLICAZIONE DELLA TRASFORMATA BURROWS-WHEELER NELLA RICERCA DI PATTERN NELLE SEQUENZE BIOLOGICHE.

TERZA PARTE (16 ORE):
INTRODUZIONE ALLE TECNICHE DI ML (UNSUPERVISED LEARNING, SUPERVISED LEARNING) E DL (GRAPH NEURAL NETWORKS, GENERATIVE ADVERSARIAL NETWORK, SIAMESE NETWORKS). APPLICAZIONI DI ALGORITMI DI MACHINE E DEEP LEARNING IN BIOINFORMATICA: DEFINIZIONE DI EMBEDDED SIGNATURES PER LA CARATTERIZZAZIONE DI SEQUENZE (SEQUENCE EMBEDDING) ED ALBERI (GRAPH EMBEDDING/GEOMETRIC DEEP LEARNING). UTILIZZO DELLE EMBEDDED SIGNATURES PER IL DESIGN DI MISURE DI SIMILARITÀ E DI METODI ML E DL PER IL CONFRONTO DI DATI IN METAGENOMICA (SEQUENCE COMPARISON) E CANCER PHYLOGENY (TREE COMPARISON). ALCUNI CONTESTI APPLICATIVI: METAGENOMIC READS/CONTIGS BINNING, COMPARATIVE GENOMICS, CANCER PHYLOGENY AMALGAMATION.
Metodi Didattici
LEZIONI FRONTALI TESE A TRASFERIRE I CONCETTI ELENCATI NELLA SEZIONE “CONTENUTI DEL CORSO”. LE LEZIONI SONO COMPRENSIVE DI ESEMPI DI APPLICAZIONI DI TALI CONCETTI, ALLO SCOPO DI RENDERE LO STUDENTE IN GRADO DI APPLICARE LA CONOSCENZA ACQUISITA.
PARTE DELLE LEZIONI (QUELLE RELATIVE ALLA TERZA PARTE), SARANNO SVOLTE IN LABORATORIO.
Verifica dell'apprendimento
L’ESAME CONSISTERÀ NELLO SVILUPPO DI UN PROGETTO (TEORICO E/O APPLICATIVO), INDIVIDUALE O DI GRUPPO, RELATIVO A PROBLEMI SPECIFICI PRESENTATI DURANTE IL CORSO, CORREDATO DA UN BREVE SEMINARIO DI PRESENTAZIONE
LA PROVA È TESA A VALUTARE IL LIVELLO DELLE CONOSCENZE TEORICHE E DELLA CAPACITÀ DI APPLICARE TALI CONOSCENZE, L’AUTONOMIA DI ANALISI E GIUDIZIO, NONCHÉ LE CAPACITÀ ESPOSITIVE DELL’ALLIEVO.
IL LIVELLO DI VALUTAZIONE DELLE PROVE TIENE CONTO DELLA CORRETTEZZA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHÉ DELLA CHIAREZZA NELLA PRESENTAZIONE.
IL LIVELLO DI VALUTAZIONE MINIMO (18) È ATTRIBUITO QUANDO LO STUDENTE DIMOSTRA INCERTEZZE NELL’APPLICAZIONE DEI METODI STUDIATI E HA UNA LIMITATA CONOSCENZA DEI MODELLI DI COMPUTAZIONE E DEGLI ALGORITMI PRESENTATI.
IL LIVELLO MASSIMO (30) È ATTRIBUITO QUANDO LO STUDENTE DIMOSTRA UNA CONOSCENZA COMPLETA E APPROFONDITA DEI CONCETTI E DEI METODI STUDIATI. INOLTRE È IN GRADO DI RISOLVERE I PROBLEMI PROPOSTI PERVENENDO IN MODO EFFICIENTE ED ACCURATO ALLA SOLUZIONE E MOSTRA CAPACITÀ DI COLLEGARE TRA LORO CONCETTI DIVERSI.
LA LODE È ATTRIBUITA QUANDO IL CANDIDATO DIMOSTRA SIGNIFICATIVA PADRONANZA DEI CONTENUTI TEORICI ED OPERATIVI E MOSTRA DI SAPER PRESENTARE GLI ARGOMENTI CON NOTEVOLE PROPRIETÀ DI LINGUAGGIO E CAPACITÀ DI ELABORAZIONE AUTONOMA.
Testi
1.M. SIPSER, INTRODUZIONE ALLA TEORIA DELLA COMPUTAZIONE, APOGEO, 2016
2.J. HOPCROFT, R. MOTWANI, J. ULLMAN, AUTOMI, LINGUAGGI E CALCOLABILITÀ, ADDISON WESLEY PEARSON EDUCATION ITALIA S.R.L, TERZA EDIZIONE, 2009.
3.M. LOTHAIRE, APPLIED COMBINATORICS ON WORDS,
4.M. LOTHAIRE, ALGEBRAIC COMBINATORICS ON WORDS
5.N.C. JONES, P.A. PEVZNER. AN INTRODUCTION TO BIOINFORMATICS ALGORITHMS. HTTP://BIOINFORMATICSALGORITHMS.COM
6.D. GUSFIELD. ALGORITHM ON STRINGS, TREES, AND SEQUENCES: COMPUTER SCIENCE AND COMPUTATIONAL BIOLOGY. CAMBRIDGE PRESS.
7.INTRODUCTION TO MACHINE LEARNING, LECTURE NOTES, MIT, 2019.
8.IAN GOODFELLOW, YOSHUA BENGIO, AARON COURVILLE, DEEP LEARNING, MIT PRESS, 2016.
9.Z.R. YANG, MACHINE LEARNING APPROACHES TO BIOINFORMATICS, SCIENCE, ENGINEERING, AND BIOLOGY INFORMATICS.
10.HABIB IZADKHAH, DEEP LEARNING IN BIOINFORMATICS TECHNIQUES AND APPLICATIONS IN PRACTICE, 1ST EDITION, ELSEVIER.
11.SELEZIONE DI ARTICOLI SCIENTIFICI
Altre Informazioni
SITO WEB DELLA PIATTAFORMA E-LEARNING
HTTP://ELEARNING.INFORMATICA.UNISA.IT/EL-PLATFORM/
CONTATTI :
CDEFELICE@UNISA.IT, RZIZZA@UNISA.IT, RZACCAGNINO@UNISA.IT
HTTP://DOCENTI.UNISA.IT/001119/HOME
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-05]