Αναγνώριση ανθρώπινων δράσεων σε εικονοσειρές (human activity recognition in videos)

Ο Αλέξανδρος Ιωσηφίδης είναι Kαθηγητής Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης στο Πανεπιστήμιο του Ώρχους (Aarhus University) της Δανίας. Είναι επικεφαλής της ομάδας Μηχανικής Μάθησης και Υπολογιστικής Νοημοσύνης στο Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, και της ερευνητικής περιοχής Μηχανικής Νοημοσύνης του Κέντρου Ψηφιοποίησης, Μεγάλων Δεδομένων και Αναλύσεων Δεδομένων (DIGIT) του Πανεπιστημίου. Έχει συνεισφέρει σε περισσότερα από τριάντα έργα έρευνας και ανάπτυξης που χρηματοδοτήθηκαν από την Ευρωπαϊκή Επιτροπή και οργανισμούς και εταιρείες της Φινλανδίας και της Δανίας. Το έργο του έλαβε διακρίσεις και βραβεία, μεταξύ των οποίων την υποτροφία για Μεταδιδακτορική Έρευνα από την Ακαδημία της Φινλανδίας το 2016, το βραβείο για νέους ερευνητές του Δανέζικου οργανισμού H.C. Ørsted το 2018 για την συνεισφορά του στην Επεξεργασία Σήματος και την Μηχανική Μάθηση, και το Early Career Award 2021 από την Ευρωπαϊκή Ένωση για την Επεξεργασία Σήματος (EURASIP) για την συνεισφορά του στη Στατιστική Μηχανική Μάθηση και τα Τεχνητά Νευρωνικά Δίκτυα. Αυτή την περίοδο υπηρετεί ως Associate Editor in Chief για το επιστημονικό περιοδικό Neurocomputing (όπου και καλύπτει την ερευνητική περιοχή των Νευρωνικών Δικτύων). Έχει υπηρετήσει στα Editorial Boards διεθνών επιστημονικών περιοδικών, συμπεριλαμβανομένων των IEEE Transactions on Neural Networks and Learning Systems, IEEE Transactions on Artificial Intelligence, και Signal Processing: Image Communication. Συνέβαλε στη διοργάνωση διεθνών συνεδρίων ως Area Chair ή Technical Program Committee Chair, συμπεριλαμβανομένων των IEEE ICIP (2018-2023), IEEE ICASSP (2023) και EUSIPCO (2019,2021,2023), και ως Publicity co-Chair για το συνέδριο IEEE ICME 2021.

Ακολουθεί σύντομη περιγραφή

Η αναγνώριση ανθρώπινων ενεργειών σε εικονοσειρές είναι μια σημαντική εργασία σε εφαρμογές όπου ένας πράκτορας (π.χ. ένα ρομπότ, ή ένα UAV) πρέπει να αντιληφθεί το περιβάλλον του, να προβλέψει ενέργειες άλλων πρακτόρων που βρίσκονται στον ίδιο χώρο (π.χ. άλλων ρομπότ ή ανθρώπων) και να αλληλεπιδράσει μαζί τους. Για να αποφασίσει κάποιος ποια μέθοδος μηχανικής όρασης ή/και μηχανικής νοημοσύνης πρέπει να χρησιμοποιηθεί από τον πράκτορα για να μπορέσει να λειτουργήσει αυτόνομα, πρέπει να λάβει υπόψιν την επίδοση και την αποδοτικότητα των διαφόρων μεθόδων, καθώς η επεξεργασία συνήθως γίνεται σε ενσωματωμένες μονάδες επεξεργασίας (π.χ. embedded GPU platforms) οι οποίες είναι εγκατεστημένες στον πράκτορα. Σε αυτήν την ομιλία, θα περιγράψουμε το πρόβλημα αναγνώρισης ανθρώπινων ενεργειών με χρήση οπτικής πληροφορίας και το πως αυτό το πρόβλημα έχει προσεγγιστεί διαχρονικά, ξεκινώντας από μεθόδους που προτάθηκαν στις αρχές της δεκαετίας του 2000 μέχρι πρόσφατες μεθόδους τελευταίας τεχνολογίας. Θα διακρίνουμε δύο ειδών μεθοδολογίες, δηλαδή μεθόδους που περιγράφουν τις ενέργειες ως διαδοχικές πόζες του ανθρώπινου σώματος και μεθόδους που προσεγγίζουν το πρόβλημα ως ένα γενικό πρόβλημα ταξινόμησης εικονοσειρών. Η περιγραφή μας θα συμπεριλάβει πρόσφατα προτεινόμενα μοντέλα βαθιάς μάθησης που είναι ικανά να χρησιμοποιήσουν χρονική πληροφορία, όπως τα Χωροχρονικά Συνελικτικά Δίκτυα Γράφων, τα Νευρωνικά Δίκτυα Ανάδρασης, τα Συνελικτικά Νευρωνικά Δίκτυα Τριών Διααστάσεων και οι Οπτικοί Μετασχηματιστές, καθώς και πρόσφατες επεκτάσεις τους που βελτιώνουν την επίδοση και την ταχύτητα με την οποία γίνεται η ταξινόμηση.