Επεξεργασία Φυσικής Γλώσσας και Ανάκτηση Πληροφοριών

Course ID
ΠΜΣΕ10
Κατεύθυνση
Εξάμηνο
Εαρινό
Τύπος
Επιλογής 2ης κατεύθ.

Μαθησιακά Αποτελέσματα

– Επάρκεια σε διάφορα μοντέλα αναπαράστασης κειμένου που χρησιμοποιούνται στη Φυσική
Γλωσσική Επεξεργασία (NLP) και την Ανάκτηση Πληροφοριών (IR).
– Ικανότητα να εφαρμόζει και να χρησιμοποιεί τεχνικές Bag of Words και tf-idf για την
αναπαράσταση κειμένου και την εξαγωγή χαρακτηριστικών.
– Κατανόηση των θεμελιωδών αρχών της ανάκτησης πληροφοριών και των διαφόρων μεθόδων
της.
– Εξειδίκευση στη χρήση μεθόδων διανυσματικού χώρου για εργασίες ανάκτησης πληροφοριών.
– Γνώση των μετρικών αξιολόγησης που χρησιμοποιούνται για την αξιολόγηση της απόδοσης
των συστημάτων ανάκτησης πληροφοριών.
– Κατανόηση διαφορετικών μοντέλων γλωσσικής που χρησιμοποιούνται ειδικά στην ανάκτηση
πληροφοριών.
– Επάρκεια σε διάφορα μοντέλα αναπαράστασης λέξεων που χρησιμοποιούνται σε εργασίες
NLP.
– Δυνατότητα εργασίας με ενσωμάτωση λέξεων όπως το word2vec για σημασιολογική
αναπαράσταση των λέξεων.
– Κατανόηση και πρακτικές γνώσεις για τα μοντέλα βασισμένα σε Transformers όπως το BERT
και το GPT για εργασίες κατανόησης και δημιουργίας γλώσσας.
– Δυνατότητα εφαρμογής τεχνικών NLP σε διάφορους εφαρμοσμένους τομείς, όπως ανάλυση
συναισθήματος, ταξινόμηση κειμένου ή αναγνώριση ονοματικών οντοτήτων.
– Κατανόηση τεχνικών που χρησιμοποιούνται σε συστήματα ανάκτησης πολυμέσων βασισμένα
στο περιεχόμενο.

Περιεχόμενο Μαθήματος

Μοντέλα αναπαράστασης κειμένου
Bag of words, tf-idf
Ανάκτηση πληροφοριών
Διανυσματικές μέθοδοι για την Ανάκτηση Πληροφοριών
Μετρικές αξιολόγησης Ανάκτησης Πληροφοριών
Ανάκτηση πληροφορίας και γλωσσικά μοντέλα
Μοντέλα αναπαράστασης λέξεων
Ενσωματώσεις λέξεων (word2vec)
RNN-LSTM
Transformers – BERT, GPT
Εφαρμογές ειδικές στην Επεξεργασία Φυσικής Γλώσσας
Ανάκτηση πολυμέσων με βάση το περιεχόμενο

ΓΕΝΙΚΕΣ ΙΚΑΝΟΤΗΤΕΣ

Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των
απαραίτητων τεχνολογιών

Λήψη αποφάσεων

Αυτόνομη εργασία

Ομαδική εργασία

Εργασία σε διεπιστημονικό περιβάλλον

Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης

ΔΙΔΑΚΤΙΚΕΣ ΚΑΙ ΜΑΘΗΣΙΑΚΕΣ ΜΕΘΟΔΟΙ - ΑΞΙΟΛΟΓΗΣΗ

Τρόπος Παρακολούθησης: Δια ζώσης
Χρήση Τεχνολογιων Πληροφορίας και Επικοινωνιών:η-τάξη, παρουσιάσεις, παραδείγματα κώδικα

Δραστηριότητα Φόρτος Εργασίας
Εξαμήνου
Παρακολούθηση διαλέξεων 18
Εργαστηριακή Άσκηση 8
Ατομικές ή Ομαδικές Εργασίες 60
Αυτοτελής μελέτη 64
Σύνολο 150

ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Ομαδική και/ή ατομική εργασία με παρουσίαση

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

Schütze, H., Manning, C. D., Raghavan, P. (2008). Introduction to information retrieval (Vol. 39,
pp. 234-265). Cambridge: Cambridge University Press.
Jurafsky, D., Martin, J. H. (2000). Speech language processing. Pearson Education.
Li, H. (2022). Learning to rank for information retrieval and natural language processing.
Springer Nature.
Manning, C., Schutze, H. (1999). Foundations of statistical natural language processing. MIT
press.
Information Retrieval Journal
International Journal of Information Retrieval Research
International Journal of Multimedia Information Retrieval
Transactions of the Association for Computational Linguistics, ACL
IEEE/ACM Transactions on Audio, Speech, and Language Processing