LOREDANA CARUCCIO | NATURAL LANGUAGE PROCESSING
LOREDANA CARUCCIO NATURAL LANGUAGE PROCESSING
cod. 0522500138
NATURAL LANGUAGE PROCESSING
0522500138 | |
DIPARTIMENTO DI INFORMATICA | |
CORSO DI LAUREA MAGISTRALE | |
INFORMATICA | |
2023/2024 |
ANNO ORDINAMENTO 2016 | |
SECONDO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
INF/01 | 4 | 32 | LEZIONE | |
INF/01 | 2 | 16 | LABORATORIO |
Obiettivi | |
---|---|
L’OBIETTIVO FORMATIVO DELL’INSEGNAMENTO CONSISTE NEL FORNIRE AGLI STUDENTI LE COMPETENZE METODOLOGICHE E TECNOLOGICHE NECESSARIE PER LA PROGETTAZIONE E L’IMPLEMENTAZIONE DI SISTEMI NLP. CONOSCENZA E CAPACITÀ DI COMPRENSIONE: •CONOSCERE I FENOMENI LINGUISTICI CHE CARATTERIZZANO E RENDONO COMPLESSO LO SVILUPPO DI APPROCCI NLP; •CONOSCERE IN MODO APPROFONDITO LE PRINCIPALI TECNICHE DI ANALISI STRUTTURALE E DI INTERPRETAZIONE SEMANTICA DEI TESTI; •CONOSCERE IN MODO APPROFONDITO STRUMENTI PRATICI PER SVOLGERE TASK DI NLP; •CONOSCERE APPLICAZIONI PRATICHE DI NLP, TRA CUI MACHINE TRANSLATION, INFORMATION EXTRACTION, SENTIMENT ANALYSIS E SISTEMI DI INTERACTIVE DIALOG (NEL LINGUAGGIO SIA SCRITTO CHE PARLATO) CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE: •SAPER ANALIZZARE I PROBLEMI GENERALI ED APPLICARE LE STRATEGIE APPROPRIATE NEI PROCESSI DI NATURAL LANGUAGE PROCESSING (NLP); •SAPER CARATTERIZZARE IL RUOLO DEI DATI E DEI MODELLI DI MACHINE LEARNING ADOTTATI NEI SISTEMI NLP; •SAPER PROGETTARE E SVILUPPARE SOLUZIONI APPLICATIVE PER RISOLVERE PROBLEMATICHE DI NLP. |
Prerequisiti | |
---|---|
LO STUDENTE DEVE AVER ACQUISITO CONOSCENZE BASE DI PROBABILITÀ, ALGEBRA LINEARE, PROGRAMMAZIONE E MACHINE LEARNING. NON SONO PREVISTI INSEGNAMENTI PROPEDEUTICI. |
Contenuti | |
---|---|
DOPO UN’INTRODUZIONE SUL NATURAL LANGUAGE PROCESSING, INCLUSA LA SUA CARATTERIZZAZIONE COME DISCIPLINA CHE COMBINA METODOLOGIE INFORMATICHE E APPROFONDIMENTI DI RICERCA DALLA LINGUISTICA (LO STUDIO DEL LINGUAGGIO UMANO), IL CORSO SI CONCENTRERÀ SUI SEGUENTI ARGOMENTI: ANALISI STRUTTURALE DI TESTI •WORD, WORD COUNTING, LESSICO (2 ORE) •TEXT NORMALIZATION (2 ORE) •MISURE DI DISTANZA (2 ORE) •PART-OF-SPEECH TAGGING (2 ORE) INTERPRETAZIONE SEMANTICA DEL TESTO E ARCHITETTURE EMERGENTI •VECTOR SEMANTIC E WORD EMBEDDING (2 ORE) •TEXT CLASSIFICATION CON RETI NEURALI (3 ORE) • RECURRENT NEURAL NETWORK E LANGUAGE MODEL (3 ORE) •ARCHITETTURA TRANSFORMER (2 ORE) •PRETRAINED MODEL (2 ORE) NLP: LE PRINCIPALI APPLICAZIONI •INTERACTIVE DIALOG (2 ORE) •MACHINE TRANSLATION (2 ORE) •INFORMATION RETRIEVAL (2 ORE) •SENTIMENT ANALYSIS (2 ORE) •TEXT SUMMARIZATION (2 ORE) •NATURAL LANGUAGE GENERATION (2 ORE) LABORATORIO: •TEXT PROCESSING CON PYTHON (3 ORE) •CATEGORIZZAZIONE E WORD TAGGING (3 ORE) •ESTRARRE INFORMAZIONI DAL TESTO (3 ORE) •ARCHITETTURA TRANSFORMER: ESEMPI DI APPLICAZIONE (3 ORE) •PROGETTAZIONE E IMPLEMENTAZIONE DI SOLUZIONI DI NLP: PRESENTAZIONE DI CASI DI STUDIO (4 ORE) |
Metodi Didattici | |
---|---|
L’INSEGNAMENTO PREVEDE: •LEZIONI FRONTALI A CARATTERE TEORICO-METODOLOGICO PER IL TRASFERIMENTO DELLE CONOSCENZE RELATIVE AI CONTENUTI DELL’INSEGNAMENTO (4 CFU/32 ORE) •LEZIONI DI LABORATORIO DI ASPETTI PRATICI, CON ESERCITAZIONI E SEMINARI SVOLTI IN COLLABORAZIONE TRA GLI STUDENTI E CON LA PRESENZA E L’INTERAZIONE DEL DOCENTE (2 CFU/16 ORE) •CIASCUN INCONTRO CON GLI STUDENTI PREVEDE SIA LA PRESENTAZIONE DEL MATERIALE DIDATTICO DA PARTE DEL DOCENTE CHE LE ESERCITAZIONI SULLE RELATIVE APPLICAZIONI. |
Verifica dell'apprendimento | |
---|---|
•IN CIASCUN APPELLO L’ESAME DI PROFITTO CONSISTE IN UNA PROVA SCRITTA PROPEDEUTICA ALLA PROVA ORALE FINALE IN CUI VERRANNO ACCERTATE LE CONOSCENZE ACQUISITE E DISCUSSE LE ATTIVITÀ SVOLTE DURANTE IL CORSO. LE ATTIVITÀ COMPRENDONO LA REALIZZAZIONE DI UN PROGETTO DI GRUPPO. LA PROVA SCRITTA PUÒ ESSERE SOSTITUITA DA PROVE IN ITINERE DURANTE IL CORSO DELLE LEZIONI ED INCLUDE DOMANDE CHE RIGUARDANO SIA LA CONOSCENZA E LA COMPRENSIONE DEGLI ARGOMENTI SVOLTI IN CLASSE CHE LA CAPACITÀ DI APPLICARLE ATTRAVERSO GLI ESERCIZI. •PROVA SCRITTA (2 ORE): PER ACCERTARE LE CONOSCENZE ACQUISITE SULLE TECNICHE E SOLUZIONI DI NATURAL LANGUAGE PROCESSING, LE TRACCE CONTERRANNO DOMANDE APERTE ED ESERCIZI. I PUNTEGGI SONO ASSEGNATI A SECONDA DELLA COMPLESSITÀ DELLE DOMANDE O DEGLI ESERCIZI (TRA I 4 E I 10 PUNTI). I CRITERI DI VALUTAZIONE RIGUARDERANNO LA CORRETTEZZA E LA COMPLETEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA. IL VOTO FINALE SARÀ RIPORTATO IN TRENTESIMI. •PROVE INTERCORSO: VERRANNO EROGATE PROVE INTERCORSO NON CUMULATIVE VALUTATE IN TRENTESIMI. GLI STUDENTI CHE SUPERERANNO LE PROVE SARANNO ESENTATI DALLA PROVA SCRITTA. LO SCOPO È QUELLO DI INCENTIVARE GLI STUDENTI A SEGUIRE IN MODO PROFICUO IL CORSO. •PROGETTO: IL PROGETTO PERMETTERÀ ALLO STUDENTE DI ESERCITARSI SUGLI ARGOMENTI APPRESI DURANTE IL CORSO. IN SEDE DI ESAME, IL PROGETTO VERRÀ DISCUSSO DIRETTAMENTE CON IL DOCENTE CHE VERIFICHERÀ SOPRATTUTTO: •ADESIONE ALLE RICHIESTE DELLA TRACCIA •COMPLETEZZA E CORRETTEZZA DEL SOFTWARE PRODOTTO •COMPRENSIONE DEGLI ARGOMENTI TRATTATI •CAPACITÀ DI ESPOSIZIONE DEI RISULTATI OTTENUTI E DI EVIDENZIARE LE EVENTUALI LIMITAZIONI E PROBLEMATICHE ANCORA APERTE. •PROVA ORALE PER ACCERTARE LE CONOSCENZE ACQUISITE DURANTE IL CORSO. I CRITERI DI VALUTAZIONE RIGUARDERANNO LA COMPLETEZZA E LA CORRETTEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA. •VALUTAZIONE: LA VALUTAZIONE FINALE SARÀ DATA DAL PUNTEGGIO MEDIO DELLE PROVE INTERCORSO (O VOTO DELL'APPELLO) E DEI PUNTI OTTENUTI CON LA DISCUSSIONE DEL PROGETTO OBBLIGATORIO E DALLA PROVA ORALE. |
Testi | |
---|---|
LIBRO DI TESTO: D. JURAFSKY AND J. MARTIN. SPEECH AND LANGUAGE PROCESSING, PRENTICE HALL, THIRD EDITION (2022). LETTURE CONSIGLIATE: •EISENSTEIN, JACOB. INTRODUCTION TO NATURAL LANGUAGE PROCESSING. MIT PRESS, 2019. •HARDENIYA, NITIN, ET AL. NATURAL LANGUAGE PROCESSING: PYTHON AND NLTK. PACKT PUBLISHING LTD, 2016. •BIRD, STEVEN, EWAN KLEIN, AND EDWARD LOPER. NATURAL LANGUAGE PROCESSING WITH PYTHON: ANALYZING TEXT WITH THE NATURAL LANGUAGE TOOLKIT. " O'REILLY MEDIA, INC.", 2009. |
Altre Informazioni | |
---|---|
LA FREQUENZA DELL’INSEGNAMENTO È FORTEMENTE CONSIGLIATA. GLI STUDENTI DEVONO ESSERE PREPARATI A TRASCORRERE UNA BUONA QUANTITÀ DI TEMPO NELLO STUDIO AL DI FUORI DELLE LEZIONI E NELLO SVILUPPO DEL PROGETTO. LE INFORMAZIONI RELATIVE AL CORSO SONO DISPONIBILI SULLA PIATTAFORMA DI E-LEARNING DEL DIPARTIMENTO DI INFORMATICA ALL’INDIRIZZO HTTP://ELEARNING.INFORMATICA.UNISA.IT/EL-PLATFORM/ CONTATTI PROF.SSA GENOVEFFA TORTORA TORTORA@UNISA.IT PROF.SSA LOREDANA CARUCCIO LCARUCCIO@UNISA.IT |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-05]