NATURAL LANGUAGE PROCESSING

LOREDANA CARUCCIO NATURAL LANGUAGE PROCESSING

0522500138
DIPARTIMENTO DI INFORMATICA
CORSO DI LAUREA MAGISTRALE
INFORMATICA
2024/2025



ANNO ORDINAMENTO 2016
SECONDO SEMESTRE
CFUOREATTIVITÀ
432LEZIONE
216LABORATORIO
Obiettivi
L’OBIETTIVO FORMATIVO DELL’INSEGNAMENTO CONSISTE NEL FORNIRE AGLI STUDENTI LE COMPETENZE METODOLOGICHE E TECNOLOGICHE NECESSARIE PER LA PROGETTAZIONE E L’IMPLEMENTAZIONE DI SISTEMI NATURAL LANGUAGE PROCESSING (NLP).

CONOSCENZA E CAPACITÀ DI COMPRENSIONE
LO STUDENTE POTRÀ:
- CONOSCERE I FENOMENI LINGUISTICI CHE CARATTERIZZANO E RENDONO COMPLESSO LO SVILUPPO DI APPROCCI DI NLP
- CONOSCERE IN MODO APPROFONDITO LE PRINCIPALI TECNICHE DI ANALISI STRUTTURALE E DI INTERPRETAZIONE SEMANTICA DEI TESTI
- CONOSCERE IN MODO APPROFONDITO STRUMENTI PRATICI PER SVOLGERE TASK DI NLP
- CONOSCERE APPLICAZIONI PRATICHE DI NLP, TRA CUI MACHINE TRANSLATION, INFORMATION EXTRACTION, SENTIMENT ANALYSIS E SISTEMI DI INTERACTIVE DIALOG (NEL LINGUAGGIO SIA SCRITTO CHE PARLATO)
- COMPRENDERE L’IMPIEGO EFFICACE DI METODI E TECNICHE DI NLP IN DIFFERENTI DOMINI D’APPLICAZIONE

CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
LO STUDENTE SAPRÀ:
- ANALIZZARE I PROBLEMI GENERALI ED APPLICARE LE STRATEGIE APPROPRIATE NEI PROCESSI DI NLP
- CARATTERIZZARE IL RUOLO DEI DATI E DEI MODELLI DI MACHINE LEARNING ADOTTATI NEI SISTEMI DI NLP
- APPLICARE STRUMENTI, API E METODI DEFINITI IN LETTERATURA PER RISOLVERE PROBLEMATICHE DI NLP
- PROGETTARE E SVILUPPARE SOLUZIONI APPLICATIVE IN SCENARI REALI CHE INTEGRINO PROCESSI DI NLP

AUTONOMIA DI GIUDIZIO
LO STUDENTE SAPRÀ:
- ANALIZZARE IN MODO CRITICO MODELLI E TECNOLOGIE DI UNA SOLUZIONE DI NLP, SPERIMENTANDO LE PRESTAZIONI SIA IN TERMINI DI EFFICIENZA CHE DI EFFICACIA
- SCEGLIERE I GIUSTI MODELLI/TECNICHE E IL GIUSTO INSIEME DI FEATURE PER RISOLVERE TASK DI NLP
- VALUTARE LA QUALITÀ DEI RISULTATI DI ANALISI MEDIANTE L’IMPEGO DI METRICHE SPECIFICHE IN RELAZIONE AI TASK SPECIFICI DI NLP


ABILITÀ COMUNICATIVE
LO STUDENTE SAPRÀ:
- DESCRIVERE IN DETTAGLIO, MEDIANTE OPPORTUNA DOCUMENTAZIONE, LE SCELTE INTRAPRESE DURANTE LE FASI DI PROGETTAZIONE E DI IMPLEMENTAZIONE DI UNA SOLUZIONE DI NLP
- DISCUTERE IN DETTAGLIO SOLUZIONI E MODELLI ALL’AVANGUARDIA PER LA RISOLUZIONE DI TASK DI NLP
- ESPORRE CHIARAMENTE I METODI E LE TECNICHE UTILIZZATE PER LA RISOLUZIONE DI UN TASK DI NLP COMPRESE LE SFIDE APERTE E LE CRITICITÀ EMERSE NELLA PROGETTAZIONE DI SOLUZIONI IN CONTESTI REALI

CAPACITÀ DI APPRENDIMENTO
LO STUDENTE SAPRÀ:
- ANALIZZARE E INTERPRETARE SISTEMATICAMENTE LE FUNZIONALITÀ E METODI FORNITI DA VARI STRUMENTI E TECNICHE AL FINE DI IMPIEGARLI EFFICACEMENTE NELLA REALIZZAZIONE E L’IMPIEGO DI SOLUZIONI DI NLP IN CONTESTI REALI
- ACQUISIRE, SPERIMENTARE, UTILIZZARE ED EVENTUALMENTE ESTENDERE IN MODO INDIPENDENTE NUOVI MODELLI PER LA RISOLUZIONE DI TASK DI NLP, ANCHE ANALIZZANDO I LORO I PUNTI DI FORZA E DI DEBOLEZZA
Prerequisiti
LO STUDENTE DEVE AVER ACQUISITO CONOSCENZE BASE DI PROBABILITÀ, ALGEBRA LINEARE, PROGRAMMAZIONE E MACHINE LEARNING. NON SONO PREVISTI INSEGNAMENTI PROPEDEUTICI.
Contenuti
DOPO UN’INTRODUZIONE SUL NATURAL LANGUAGE PROCESSING, INCLUSA LA SUA CARATTERIZZAZIONE COME DISCIPLINA CHE COMBINA METODOLOGIE INFORMATICHE E APPROFONDIMENTI DI RICERCA DALLA LINGUISTICA (LO STUDIO DEL LINGUAGGIO UMANO), IL CORSO SI CONCENTRERÀ SUI SEGUENTI ARGOMENTI:

ANALISI STRUTTURALE DI TESTI
•WORD, WORD COUNTING, LESSICO (2 ORE)
•TEXT NORMALIZATION (2 ORE)

•MISURE DI DISTANZA (2 ORE)
•PART-OF-SPEECH TAGGING (2 ORE)

INTERPRETAZIONE SEMANTICA DEL TESTO E ARCHITETTURE EMERGENTI
•VECTOR SEMANTIC E WORD EMBEDDING (2 ORE)
•TEXT CLASSIFICATION CON RETI NEURALI (3 ORE)
• RECURRENT NEURAL NETWORK E LANGUAGE MODEL (3 ORE)
•ARCHITETTURA TRANSFORMER (2 ORE)
•PRETRAINED MODEL (2 ORE)

NLP: LE PRINCIPALI APPLICAZIONI
•INTERACTIVE DIALOG (2 ORE)
•MACHINE TRANSLATION (2 ORE)
•INFORMATION RETRIEVAL (2 ORE)
•SENTIMENT ANALYSIS (2 ORE)
•TEXT SUMMARIZATION (2 ORE)
•NATURAL LANGUAGE GENERATION (2 ORE)

LABORATORIO:
•TEXT PROCESSING CON PYTHON (3 ORE)
•CATEGORIZZAZIONE E WORD TAGGING (3 ORE)
•ESTRARRE INFORMAZIONI DAL TESTO (3 ORE)
•ARCHITETTURA TRANSFORMER: ESEMPI DI APPLICAZIONE (3 ORE)
•PROGETTAZIONE E IMPLEMENTAZIONE DI SOLUZIONI DI NLP: PRESENTAZIONE DI CASI DI STUDIO (4 ORE)
Metodi Didattici
L’INSEGNAMENTO PREVEDE:
•LEZIONI FRONTALI A CARATTERE TEORICO-METODOLOGICO PER IL TRASFERIMENTO DELLE CONOSCENZE RELATIVE AI CONTENUTI DELL’INSEGNAMENTO (4 CFU/32 ORE)
•LEZIONI DI LABORATORIO DI ASPETTI PRATICI, CON ESERCITAZIONI E SEMINARI SVOLTI IN COLLABORAZIONE TRA GLI STUDENTI E CON LA PRESENZA E L’INTERAZIONE DEL DOCENTE (2 CFU/16 ORE)
•CIASCUN INCONTRO CON GLI STUDENTI PREVEDE SIA LA PRESENTAZIONE DEL MATERIALE DIDATTICO DA PARTE DEL DOCENTE CHE LE ESERCITAZIONI SULLE RELATIVE APPLICAZIONI.
Verifica dell'apprendimento
•IN CIASCUN APPELLO L’ESAME DI PROFITTO CONSISTE IN UNA PROVA SCRITTA PROPEDEUTICA ALLA PROVA ORALE FINALE IN CUI VERRANNO ACCERTATE LE CONOSCENZE ACQUISITE E DISCUSSE LE ATTIVITÀ SVOLTE DURANTE IL CORSO. LE ATTIVITÀ COMPRENDONO LA REALIZZAZIONE DI UN PROGETTO DI GRUPPO.
LA PROVA SCRITTA PUÒ ESSERE SOSTITUITA DA PROVE IN ITINERE DURANTE IL CORSO DELLE LEZIONI ED INCLUDE DOMANDE CHE RIGUARDANO SIA LA CONOSCENZA E LA COMPRENSIONE DEGLI ARGOMENTI SVOLTI IN CLASSE CHE LA CAPACITÀ DI APPLICARLE ATTRAVERSO GLI ESERCIZI.

•PROVA SCRITTA (2 ORE): PER ACCERTARE LE CONOSCENZE ACQUISITE SULLE TECNICHE E SOLUZIONI DI NATURAL LANGUAGE PROCESSING, LE TRACCE CONTERRANNO DOMANDE APERTE ED ESERCIZI. I PUNTEGGI SONO ASSEGNATI A SECONDA DELLA COMPLESSITÀ DELLE DOMANDE O DEGLI ESERCIZI (TRA I 4 E I 10 PUNTI). I CRITERI DI VALUTAZIONE RIGUARDERANNO LA CORRETTEZZA E LA COMPLETEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA. IL VOTO FINALE SARÀ RIPORTATO IN TRENTESIMI.

•PROVE INTERCORSO: VERRANNO EROGATE PROVE INTERCORSO NON CUMULATIVE VALUTATE IN TRENTESIMI. GLI STUDENTI CHE SUPERERANNO LE PROVE SARANNO ESENTATI DALLA PROVA SCRITTA. LO SCOPO È QUELLO DI INCENTIVARE GLI STUDENTI A SEGUIRE IN MODO PROFICUO IL CORSO.

•PROGETTO: IL PROGETTO PERMETTERÀ ALLO STUDENTE DI ESERCITARSI SUGLI ARGOMENTI APPRESI DURANTE IL CORSO. IN SEDE DI ESAME, IL PROGETTO VERRÀ DISCUSSO DIRETTAMENTE CON IL DOCENTE CHE VERIFICHERÀ SOPRATTUTTO:
•ADESIONE ALLE RICHIESTE DELLA TRACCIA
•COMPLETEZZA E CORRETTEZZA DEL SOFTWARE PRODOTTO
•COMPRENSIONE DEGLI ARGOMENTI TRATTATI
•CAPACITÀ DI ESPOSIZIONE DEI RISULTATI OTTENUTI E DI EVIDENZIARE LE EVENTUALI LIMITAZIONI E PROBLEMATICHE ANCORA APERTE.

•PROVA ORALE PER ACCERTARE LE CONOSCENZE ACQUISITE DURANTE IL CORSO. I CRITERI DI VALUTAZIONE RIGUARDERANNO LA COMPLETEZZA E LA CORRETTEZZA DELL'APPRENDIMENTO E LA CHIAREZZA ESPOSITIVA.

•VALUTAZIONE: LA VALUTAZIONE FINALE SARÀ DATA DAL PUNTEGGIO MEDIO DELLE PROVE INTERCORSO (O VOTO DELL'APPELLO) E DEI PUNTI OTTENUTI CON LA DISCUSSIONE DEL PROGETTO OBBLIGATORIO E DALLA PROVA ORALE.
Testi
LIBRO DI TESTO:
D. JURAFSKY AND J. MARTIN. SPEECH AND LANGUAGE PROCESSING, PRENTICE HALL, THIRD EDITION (2022).

LETTURE CONSIGLIATE:
•EISENSTEIN, JACOB. INTRODUCTION TO NATURAL LANGUAGE PROCESSING. MIT PRESS, 2019.
•HARDENIYA, NITIN, ET AL. NATURAL LANGUAGE PROCESSING: PYTHON AND NLTK. PACKT PUBLISHING LTD, 2016.
•BIRD, STEVEN, EWAN KLEIN, AND EDWARD LOPER. NATURAL LANGUAGE PROCESSING WITH PYTHON: ANALYZING TEXT WITH THE NATURAL LANGUAGE TOOLKIT. " O'REILLY MEDIA, INC.", 2009.
Altre Informazioni
LA FREQUENZA DELL’INSEGNAMENTO È FORTEMENTE CONSIGLIATA. GLI STUDENTI DEVONO ESSERE PREPARATI A TRASCORRERE UNA BUONA QUANTITÀ DI TEMPO NELLO STUDIO AL DI FUORI DELLE LEZIONI E NELLO SVILUPPO DEL PROGETTO.
LE INFORMAZIONI RELATIVE AL CORSO SONO DISPONIBILI SULLA PIATTAFORMA DI E-LEARNING DEL DIPARTIMENTO DI INFORMATICA ALL’INDIRIZZO HTTP://ELEARNING.INFORMATICA.UNISA.IT/EL-PLATFORM/

CONTATTI
PROF.SSA GENOVEFFA TORTORA
TORTORA@UNISA.IT

PROF.SSA LOREDANA CARUCCIO
LCARUCCIO@UNISA.IT
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2024-11-18]