Clelia DE FELICE | STRUMENTI FORMALI PER LA BIOINFORMATICA
Clelia DE FELICE STRUMENTI FORMALI PER LA BIOINFORMATICA
cod. 0522500145
STRUMENTI FORMALI PER LA BIOINFORMATICA
0522500145 | |
DIPARTIMENTO DI INFORMATICA | |
CORSO DI LAUREA MAGISTRALE | |
INFORMATICA | |
2024/2025 |
ANNO CORSO 1 | |
ANNO ORDINAMENTO 2016 | |
PRIMO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | ||
---|---|---|---|---|---|
STRUMENTI FORMALI PER LA BIOINFORMATICA | |||||
INF/01 | 2 | 16 | LEZIONE | ||
INF/01 | 4 | 32 | LABORATORIO | ||
STRUMENTI FORMALI PER LA BIOINFORMATICA | |||||
MAT/02 | 3 | 24 | LEZIONE |
Obiettivi | |
---|---|
OBIETTIVO GENERALE IL CORSO HA I SEGUENTI OBIETTIVI: 1) INTRODURRE ALLA RAPPRESENTAZIONE, MANIPOLAZIONE E GESTIONE EFFICIENTE DELL’INFORMAZIONE BIOLOGICA (E.G., PATTERN MATCHING, COMPRESSIONE, ALLINEAMENTO), A PARTIRE DA TECNICHE CLASSICHE DI COMBINATORIA SU PAROLE E LINGUAGGI; 2) DEFINIRE EMBEDDED SIGNATURES, CIOÈ RAPPRESENTAZIONI NUMERICHE DELLE STRUTTURE BIOLOGICHE (SEQUENZE E GRAFI) CHE POSSONO ESSERE UTILIZZATE EFFICIENTEMENTE IN APPLICAZIONI DI MACHINE E DEEP LEARNING. CONOSCENZA E CAPACITÀ DI COMPRENSIONE LO STUDENTE ACQUISIRÀ: •CONOSCENZA DEI MODELLI DI COMPUTAZIONE E MECCANISMI GENERATIVI, DELLE POTENZIALITÀ, LIMITI, ASPETTI MATEMATICI E CAMPI DI APPLICAZIONE DI TALI MODELLI. •PADRONANZA DELLE TECNICHE DI ALGORITMI DI COMBINATORIA DELLE PAROLE E DELLE STRUTTURE DATI UTILIZZATE PER POTER AFFRONTARE LO STUDIO E LA SOLUZIONE DI PROBLEMI COMPUTAZIONALI DI ANALISI E CONFRONTO DI SEQUENZE BIOLOGICHE. •CONOSCENZA DELLE APPLICAZIONI DEL MACHINE E DEEP LEARNING IN PROBLEMI DI GENOMICA. CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE LO STUDENTE SARÀ IN GRADO DI: •SAPER RICONOSCERE I PROBLEMI CHE POSSONO ESSERE RISOLTI UTILIZZANDO SOLUZIONI BASATE SUI MODELLI DI CALCOLO STUDIATI. •SAPER MODELLARE LA SOLUZIONE DI PROBLEMI BIOLOGICI SU SEQUENZE GENOMICHE MEDIANTE LA FORMULAZIONE DI PROBLEMI COMBINATORI. •SAPER UTILIZZARE LE BANCHE DATI GENOMICHE PER ESTRARRE LE INFORMAZIONI DI INTERESSE. •VALUTARE IN MODO CRITICO I RISULTATI, COGLIENDO LE DIFFERENZE CHE DIVERSI TIPI DI STRUMENTI E DI APPROCCI POSSONO AVERE SUL DATO OTTENUTO. AUTONOMIA DI GIUDIZIO LO STUDENTE SARÀ IN GRADO DI: •INQUADRARE UN PROBLEMA (TEORICO O PRATICO), INDIVIDUANDO LE OPPORTUNE STRATEGIE RISOLUTIVE •CONFRONTARE IL RISULTATO (TEORICO O PRATICO) OTTENUTO CON RISULTATI NOTI ABILITÀ COMUNICATIVE LO STUDENTE SARÀ IN GRADO DI ESPORRE, CON APPROPRIATA PADRONANZA DELLA TERMINOLOGIA, LE SCELTE TEORICHE E IMPLEMENTATIVE DI RISOLUZIONE DI PROBLEMI. CAPACITÀ DI APPRENDIMENTO LO STUDENTE SARÀ IN GRADO DI: •RISOLVERE I PROBLEMI PROPOSTI PERVENENDO IN MODO EFFICIENTE ED ACCURATO ALLA SOLUZIONE E MOSTRARE CAPACITÀ DI COLLEGARE TRA LORO CONCETTI DIVERSI. •COMPRENDERE MODELLI E RISULTATI TEORICI •COMPRENDERE LA PROGETTAZIONE E L’IMPLEMENTAZIONE DI TOOL SCRITTI DA ALTRI ED INTERVENIRE CON ATTIVITÀ DI AGGIORNAMENTO E MIGLIORAMENTO DEL CODICE •DI RIUTILIZZARE O ASSEMBLARE IL CODICE ESISTENTE PER LA RISOLUZIONE DI NUOVI PROBLEMI |
Prerequisiti | |
---|---|
È PREFERIBILE, MA NON OBBLIGATORIO, CHE GLI STUDENTI ABBIANO CONOSCENZE DI C/C++ E PYTHON (IN PARTICOLARE LE LIBRERIE TENSORFLOW E PYTORCH). ANALOGAMENTE È PREFERIBILE, MA NON OBBLIGATORIO, CHE GLI STUDENTI ABBIANO CONOSCENZE DEI MODELLI DI COMPUTAZIONE DI BASE (AUTOMI FINITI E MACCHINE DI TURING). |
Contenuti | |
---|---|
PRIMA PARTE (40 ORE): STRINGHE E LINGUAGGI. AUTOMI FINITI DETERMINISTICI E NON DETERMINISTICI. ESPRESSIONI E LINGUAGGI REGOLARI. EQUIVALENZA E MINIMIZZAZIONE DI AUTOMI. GRAMMATICHE E LINGUAGGI LIBERI DAL CONTESTO. ALBERI SINTATTICI. AUTOMI A PILA. GRAMMATICHE REGOLARI. CENNI SULLA GERARCHIA DI CHOMSKY. CENNI SU RECENTI E RILEVANTI APPLICAZIONI DEI MODELLI DI COMPUTAZIONE. PRINCIPALI ASPETTI DELLA COMBINATORIA DELLE PAROLE CON APPLICAZIONE ALLA BIOINFORMATICA. SECONDA PARTE (16 ORE): INTRODUZIONE ALLA BIOINFORMATICA: CONCETTI FONDAMENTALI DI BIOLOGIA MOLECOLARE E GENOMICA STRUTTURE DATI PER LA BIOINFORMATICA: BLOOM FILTERS, GRAFI DI DE BRUJIN, GRAFI DI OVERLAP, SUFFIX ARRAY, WHEELER GRAPH. ALGORITMI PER LA BIOINFORMATICA: LA RICERCA DI MOTIVI IN SEQUENZE BIOLOGICHE. TECNICHE DI ALLINEAMENTO MULTIPLO DI SEQUENZE. APPLICAZIONE DELLA TRASFORMATA BURROWS-WHEELER NELLA RICERCA DI PATTERN NELLE SEQUENZE BIOLOGICHE. TERZA PARTE (16 ORE): INTRODUZIONE ALLE TECNICHE DI ML (UNSUPERVISED LEARNING, SUPERVISED LEARNING) E DL (GRAPH NEURAL NETWORKS, GENERATIVE ADVERSARIAL NETWORK, SIAMESE NETWORKS). APPLICAZIONI DI ALGORITMI DI MACHINE E DEEP LEARNING IN BIOINFORMATICA: DEFINIZIONE DI EMBEDDED SIGNATURES PER LA CARATTERIZZAZIONE DI SEQUENZE (SEQUENCE EMBEDDING) ED ALBERI (GRAPH EMBEDDING/GEOMETRIC DEEP LEARNING). UTILIZZO DELLE EMBEDDED SIGNATURES PER IL DESIGN DI MISURE DI SIMILARITÀ E DI METODI ML E DL PER IL CONFRONTO DI DATI IN METAGENOMICA (SEQUENCE COMPARISON) E CANCER PHYLOGENY (TREE COMPARISON). ALCUNI CONTESTI APPLICATIVI: METAGENOMIC READS/CONTIGS BINNING, COMPARATIVE GENOMICS, CANCER PHYLOGENY AMALGAMATION. |
Metodi Didattici | |
---|---|
LEZIONI FRONTALI TESE A TRASFERIRE I CONCETTI ELENCATI NELLA SEZIONE “CONTENUTI DEL CORSO”. LE LEZIONI SONO COMPRENSIVE DI ESEMPI DI APPLICAZIONI DI TALI CONCETTI, ALLO SCOPO DI RENDERE LO STUDENTE IN GRADO DI APPLICARE LA CONOSCENZA ACQUISITA. PARTE DELLE LEZIONI (QUELLE RELATIVE ALLA TERZA PARTE), SARANNO SVOLTE IN LABORATORIO. |
Verifica dell'apprendimento | |
---|---|
L’ESAME CONSISTERÀ NELLO SVILUPPO DI UN PROGETTO (TEORICO E/O APPLICATIVO), INDIVIDUALE O DI GRUPPO, RELATIVO A PROBLEMI SPECIFICI PRESENTATI DURANTE IL CORSO, CORREDATO DA UN BREVE SEMINARIO DI PRESENTAZIONE LA PROVA È TESA A VALUTARE IL LIVELLO DELLE CONOSCENZE TEORICHE E DELLA CAPACITÀ DI APPLICARE TALI CONOSCENZE, L’AUTONOMIA DI ANALISI E GIUDIZIO, NONCHÉ LE CAPACITÀ ESPOSITIVE DELL’ALLIEVO. IL LIVELLO DI VALUTAZIONE DELLE PROVE TIENE CONTO DELLA CORRETTEZZA DEI METODI UTILIZZATI, DELLA COMPLETEZZA ED ESATTEZZA DELLE RISPOSTE, NONCHÉ DELLA CHIAREZZA NELLA PRESENTAZIONE. IL LIVELLO DI VALUTAZIONE MINIMO (18) È ATTRIBUITO QUANDO LO STUDENTE DIMOSTRA INCERTEZZE NELL’APPLICAZIONE DEI METODI STUDIATI E HA UNA LIMITATA CONOSCENZA DEI MODELLI DI COMPUTAZIONE E DEGLI ALGORITMI PRESENTATI. IL LIVELLO MASSIMO (30) È ATTRIBUITO QUANDO LO STUDENTE DIMOSTRA UNA CONOSCENZA COMPLETA E APPROFONDITA DEI CONCETTI E DEI METODI STUDIATI. INOLTRE È IN GRADO DI RISOLVERE I PROBLEMI PROPOSTI PERVENENDO IN MODO EFFICIENTE ED ACCURATO ALLA SOLUZIONE E MOSTRA CAPACITÀ DI COLLEGARE TRA LORO CONCETTI DIVERSI. LA LODE È ATTRIBUITA QUANDO IL CANDIDATO DIMOSTRA SIGNIFICATIVA PADRONANZA DEI CONTENUTI TEORICI ED OPERATIVI E MOSTRA DI SAPER PRESENTARE GLI ARGOMENTI CON NOTEVOLE PROPRIETÀ DI LINGUAGGIO E CAPACITÀ DI ELABORAZIONE AUTONOMA. |
Testi | |
---|---|
1.M. SIPSER, INTRODUZIONE ALLA TEORIA DELLA COMPUTAZIONE, APOGEO, 2016 2.J. HOPCROFT, R. MOTWANI, J. ULLMAN, AUTOMI, LINGUAGGI E CALCOLABILITÀ, ADDISON WESLEY PEARSON EDUCATION ITALIA S.R.L, TERZA EDIZIONE, 2009. 3.M. LOTHAIRE, APPLIED COMBINATORICS ON WORDS, 4.M. LOTHAIRE, ALGEBRAIC COMBINATORICS ON WORDS 5.N.C. JONES, P.A. PEVZNER. AN INTRODUCTION TO BIOINFORMATICS ALGORITHMS. HTTP://BIOINFORMATICSALGORITHMS.COM 6.D. GUSFIELD. ALGORITHM ON STRINGS, TREES, AND SEQUENCES: COMPUTER SCIENCE AND COMPUTATIONAL BIOLOGY. CAMBRIDGE PRESS. 7.INTRODUCTION TO MACHINE LEARNING, LECTURE NOTES, MIT, 2019. 8.IAN GOODFELLOW, YOSHUA BENGIO, AARON COURVILLE, DEEP LEARNING, MIT PRESS, 2016. 9.Z.R. YANG, MACHINE LEARNING APPROACHES TO BIOINFORMATICS, SCIENCE, ENGINEERING, AND BIOLOGY INFORMATICS. 10.HABIB IZADKHAH, DEEP LEARNING IN BIOINFORMATICS TECHNIQUES AND APPLICATIONS IN PRACTICE, 1ST EDITION, ELSEVIER. 11.SELEZIONE DI ARTICOLI SCIENTIFICI |
Altre Informazioni | |
---|---|
SITO WEB DELLA PIATTAFORMA E-LEARNING HTTP://ELEARNING.INFORMATICA.UNISA.IT/EL-PLATFORM/ CONTATTI : CDEFELICE@UNISA.IT, RZIZZA@UNISA.IT, RZACCAGNINO@UNISA.IT HTTP://DOCENTI.UNISA.IT/001119/HOME HTTPS://DOCENTI.UNISA.IT/020880/HOME |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]