Genoveffa TORTORA | NATURAL LANGUAGE PROCESSING
Genoveffa TORTORA NATURAL LANGUAGE PROCESSING
cod. 0522500138
NATURAL LANGUAGE PROCESSING
0522500138 | |
DIPARTIMENTO DI INFORMATICA | |
CORSO DI LAUREA MAGISTRALE | |
INFORMATICA | |
2022/2023 |
ANNO ORDINAMENTO 2016 | |
SECONDO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
INF/01 | 4 | 32 | LEZIONE | |
INF/01 | 2 | 16 | LABORATORIO |
Obiettivi | |
---|---|
L’OBIETTIVO FORMATIVO DELL’INSEGNAMENTO CONSISTE NEL FORNIRE AGLI STUDENTI LE COMPETENZE METODOLOGICHE E TECNOLOGICHE NECESSARIE PER LA PROGETTAZIONE E L’IMPLEMENTAZIONE DI SISTEMI NLP. CONOSCENZA E CAPACITÀ DI COMPRENSIONE •CONOSCERE I FENOMENI LINGUISTICI CHE CARATTERIZZANO E RENDONO COMPLESSO LO SVILUPPO DI APPROCCI NLP; •CONOSCERE IN MODO APPROFONDITO LE PRINCIPALI TECNICHE DI ANALISI STRUTTURALE E DI INTERPRETAZIONE SEMANTICA DEI TESTI; •CONOSCERE IN MODO APPROFONDITO STRUMENTI PRATICI PER SVOLGERE TASK DI NLP; •CONOSCERE APPLICAZIONI PRATICHE DI NLP, TRA CUI QUESTION ANSWERING, MACHINE TRANSLATION, INFORMATION EXTRACTION, E SISTEMI DI INTERACTIVE DIALOG (NEL LINGUAGGIO SIA SCRITTO CHE PARLATO) CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE: •SAPER ANALIZZARE I PROBLEMI GENERALI ED APPLICARE LE STRATEGIE APPROPRIATE NEI PROCESSI DI NATURAL LANGUAGE PROCESSING (NLP); •SAPER CARATTERIZZARE IL RUOLO DEI DATI E DEI MODELLI DI MACHINE LEARNING ADOTTATI NEI SISTEMI NLP; •SAPER PROGETTARE E SVILUPPARE MODELLI PER RISOLVERE PROBLEMATICHE DI NLP. |
Prerequisiti | |
---|---|
LO STUDENTE DEVE AVER ACQUISITO CONOSCENZE BASE DI PROBABILITÀ, ALGEBRA LINEARE, PROGRAMMAZIONE E MACHINE LEARNING. NON SONO PREVISTI INSEGNAMENTI PROPEDEUTICI. |
Contenuti | |
---|---|
DOPO UN’INTRODUZIONE SUL NATURAL LANGUAGE PROCESSING, INCLUSA LA SUA CARATTERIZZAZIONE COME DISCIPLINA CHE COMBINA METODOLOGIE INFORMATICHE E APPROFONDIMENTI DI RICERCA DALLA LINGUISTICA (LO STUDIO DEL LINGUAGGIO UMANO), IL CORSO SI CONCENTRERÀ SUI SEGUENTI ARGOMENTI: ANALISI STRUTTURALE DI TESTI •WORD, WORD COUNTING, LESSICO (3 ORE) •MISURE DI DISTANZA (2 ORE) •PART-OF-SPEECH TAGGING (2 ORE) •MODELLAZIONE PROBABILISTICA DEL LINGUAGGIO (4 ORE) INTERPRETAZIONE SEMANTICA DEL TESTO •VECTOR SEMANTIC E WORD EMBEDDING (3 ORE) •TEXT CLASSIFICATION CON MODELLI DI LINGUAGGIO (3 ORE) •TEXT CLASSIFICATION CON RETI NEURALI (4 ORE) •VITERBI ALGORITHM (PROGRAMMAZIONE DINAMICA) (3 ORE) NLP: LE PRINCIPALI APPLICAZIONI •INTERACTIVE DIALOG (2 ORE) •MACHINE TRANSLATION (2 ORE) •INFORMATION EXTRACTION (2 ORE) •SISTEMI DI QUESTION ANSWERING (1 ORA) •DEPENDENCY PARSING (1 ORA) LABORATORIO: •TEXT PROCESSING CON PYTHON (3 ORE) •CATEGORIZZAZIONE E WORD TAGGING (3 ORE) •ESTRARRE INFORMAZIONI DAL TESTO (3 ORE) •ANALISI DELLA STRUTTURA DELLE FRASI (4 ORE) •ANALISI SEMANTICA DELLE FRASI (3 ORE) |
Metodi Didattici | |
---|---|
L’INSEGNAMENTO PREVEDE: •LEZIONI FRONTALI A CARATTERE TEORICO-METODOLOGICO PER IL TRASFERIMENTO DELLE CONOSCENZE RELATIVE AI CONTENUTI DELL’INSEGNAMENTO (4 CFU/32 ORE) •LEZIONI DI LABORATORIO DI ASPETTI PRATICI, CON ESERCITAZIONI E SEMINARI SVOLTI IN COLLABORAZIONE TRA GLI STUDENTI E CON LA PRESENZA E L’INTERAZIONE DEL DOCENTE (2 CFU/16 ORE) •CIASCUN INCONTRO CON GLI STUDENTI PREVEDE SIA LA PRESENTAZIONE DEL MATERIALE DIDATTICO DA PARTE DEL DOCENTE CHE LE ESERCITAZIONI SULLE RELATIVE APPLICAZIONI. |
Verifica dell'apprendimento | |
---|---|
•IN CIASCUN APPELLO L’ESAME DI PROFITTO CONSISTE IN UNA PROVA SCRITTA PROPEDEUTICA ALLA PROVA ORALE FINALE IN CUI VERRANNO ACCERTATE LE CONOSCENZE ACQUISITE E DISCUSSE LE ATTIVITÀ SVOLTE DURANTE IL CORSO. LE ATTIVITÀ COMPRENDONO LA REALIZZAZIONE DI UN PROGETTO DI GRUPPO. LA PROVA SCRITTA PUÒ ESSERE SOSTITUITA DA PROVE IN ITINERE DURANTE IL CORSO DELLE LEZIONI ED INCLUDE DOMANDE CHE RIGUARDANO SIA LA CONOSCENZA E LA COMPRENSIONE DEGLI ARGOMENTI SVOLTI IN CLASSE CHE LA CAPACITÀ DI APPLICARLE ATTRAVERSO GLI ESERCIZI. •PROVA SCRITTA (2 ORE): PER ACCERTARE LE CONOSCENZE ACQUISITE SULLE TECNICHE AVANZATE PER LE BASI DI DATI, LE TRACCE CONTERRANNO DOMANDE APERTE ED ESERCIZI. I PUNTEGGI SONO ASSEGNATI A SECONDA DELLA COMPLESSITÀ DELLE DOMANDE O DEGLI ESERCIZI (TRA I 4 E I 10 PUNTI). I CRITERI DI VALUTAZIONE RIGUARDERANNO LA CORRETTEZZA E LA COMPLETEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA. IL VOTO FINALE SARÀ RIPORTATO IN TRENTESIMI. •PROVE INTERCORSO: VERRANNO EROGATE PROVE INTERCORSO NON CUMULATIVE VALUTATE IN TRENTESIMI. GLI STUDENTI CHE SUPERERANNO LE PROVE SARANNO ESENTATI DALLA PROVA SCRITTA. LO SCOPO È QUELLO DI INCENTIVARE GLI STUDENTI A SEGUIRE IN MODO PROFICUO IL CORSO. •PROGETTO: IL PROGETTO PERMETTERÀ ALLO STUDENTE DI ESERCITARSI SUGLI ARGOMENTI APPRESI DURANTE IL CORSO. IN SEDE DI ESAME, IL PROGETTO VERRÀ DISCUSSO DIRETTAMENTE CON IL DOCENTE CHE VERIFICHERÀ SOPRATTUTTO: •ADESIONE ALLE RICHIESTE DELLA TRACCIA •FUNZIONAMENTO DEL SOFTWARE PRODOTTO •COMPRENSIONE DEGLI ARGOMENTI IMPLEMENTATI •CAPACITÀ DI MODIFICA DEL SOFTWARE PRODOTTO E GRADO DI •FAMILIARITÀ CON IL SOFTWARE. •PROVA ORALE PER ACCERTARE LE CONOSCENZE ACQUISITE. I CRITERI DI VALUTAZIONE RIGUARDERANNO LA COMPLETEZZA E LA CORRETTEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA. •VALUTAZIONE: LA VALUTAZIONE FINALE SARÀ DATA DAL PUNTEGGIO MEDIO DELLE PROVE INTERCORSO (O VOTO DELL'APPELLO) E DEI PUNTI OTTENUTI CON LA DISCUSSIONE DEL PROGETTO OBBLIGATORIO E DALLA PROVA ORALE. |
Testi | |
---|---|
LIBRO DI TESTO: D. JURAFSKY AND J. MARTIN. SPEECH AND LANGUAGE PROCESSING, PRENTICE HALL, THIRD EDITION (2022). LETTURE CONSIGLIATE: •EISENSTEIN, JACOB. INTRODUCTION TO NATURAL LANGUAGE PROCESSING. MIT PRESS, 2019. •HARDENIYA, NITIN, ET AL. NATURAL LANGUAGE PROCESSING: PYTHON AND NLTK. PACKT PUBLISHING LTD, 2016. •BIRD, STEVEN, EWAN KLEIN, AND EDWARD LOPER. NATURAL LANGUAGE PROCESSING WITH PYTHON: ANALYZING TEXT WITH THE NATURAL LANGUAGE TOOLKIT. " O'REILLY MEDIA, INC.", 2009. |
Altre Informazioni | |
---|---|
LA FREQUENZA DELL’INSEGNAMENTO È FORTEMENTE CONSIGLIATA. GLI STUDENTI DEVONO ESSERE PREPARATI A TRASCORRERE UNA BUONA QUANTITÀ DI TEMPO NELLO STUDIO AL DI FUORI DELLE LEZIONI E NELLO SVILUPPO DEL PROGETTO. LE INFORMAZIONI RELATIVE AL CORSO SONO DISPONIBILI SULLA PIATTAFORMA DI E-LEARNING DEL DIPARTIMENTO DI INFORMATICA ALL’INDIRIZZO HTTP://ELEARNING.INFORMATICA.UNISA.IT/EL-PLATFORM/ CONTATTI PROF.SSA GENOVEFFA TORTORA TORTORA@UNISA.IT PROF.SSA LOREDANA CARUCCIO LCARUCCIO@UNISA.IT |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-08-21]