Τα podcasts αποτελούν σήμερα μία από τις πιο δυναμικά αναπτυσσόμενες μορφές ψηφιακού περιεχομένου. Παρά τον πλούτο πληροφορίας που προσφέρουν, η αξιοποίησή τους σε μεγάλη κλίμακα παραμένει δύσκολη, καθώς πρόκειται για μη δομημένο ηχητικό υλικό που δεν μπορεί εύκολα να αναζητηθεί, να αναλυθεί ή να φιλτραριστεί.
Στο πλαίσιο της πρόσφατης ερευνητικής και τεχνολογικής μας δραστηριότητας, αναπτύξαμε ένα πλήρως αυτοματοποιημένο σύστημα που μετατρέπει τα podcasts σε δομημένο, προς ανάλυση και διαθέσιμο για συστάσεις περιεχόμενο, αξιοποιώντας σύγχρονες τεχνολογίες Τεχνητής Νοημοσύνης.
Από το ηχητικό περιεχόμενο σε γραπτή πληροφορία
Το σύστημά μας βασίζεται σε μια ολοκληρωμένη αλυσίδα επεξεργασίας, η οποία:
-
μετατρέπει τον ήχο σε κείμενο μέσω αυτόματης αναγνώρισης ομιλίας,
-
επεξεργάζεται και καθαρίζει τα δεδομένα,
-
αναλύει το κείμενο με τεχνικές NLP για την εξαγωγή θεμάτων και εννοιών,
-
και προτείνει σχετικό περιεχόμενο στους χρήστες.
Το αποτέλεσμα είναι ένα σύνολο podcasts που μπορεί πλέον να αναζητηθεί και να οργανωθεί με βάση το πραγματικό του νόημα και όχι απλώς με τίτλους ή ετικέτες.
Τεχνητή Νοημοσύνη με πρακτικό αντίκτυπο
Το έργο αυτό αποτελεί χαρακτηριστικό παράδειγμα του πώς ο συνδυασμός Data Engineering, Machine Learning και NLP μπορεί να προσφέρει ουσιαστικές λύσεις σε πραγματικά προβλήματα. Αντί να περιοριζόμαστε σε απομονωμένα μοντέλα, σχεδιάσαμε μια αρχιτεκτονική που λειτουργεί σε μεγάλη κλίμακα και μπορεί να υποστηρίξει παραγωγικά περιβάλλοντα.
Για οργανισμούς που διαχειρίζονται μεγάλους όγκους ηχητικού ή πολυμεσικού περιεχομένου, τέτοιου είδους λύσεις ανοίγουν τον δρόμο για καλύτερη ανακάλυψη περιεχομένου, βελτιωμένη εμπειρία χρήστη και νέες δυνατότητες αξιοποίησης δεδομένων.
Μια συνεργασία με ουσιαστικό αποτέλεσμα
Η ανάπτυξη του συστήματος πραγματοποιήθηκε μέσα από στενή συνεργασία μιας επιστημονικής ομάδας του Διεθνούς Πανεπιστημίου της Ελλάδος και του European School Radio, στο πλαίσιο του ευρωπαϊκού προγράμματος Kids Radio Europe, συνδυάζοντας τεχνογνωσία στην ανάλυση δεδομένων, την τεχνητή νοημοσύνη και τα κατανεμημένα συστήματα. Το αποτέλεσμα δεν είναι απλώς μια ερευνητική μελέτη, αλλά μια λειτουργική τεχνολογική λύση με σαφή επιχειρησιακή αξία. Αυτή η τεχνολογία που αναπτύχθηκε από την ομάδα μας, εφαρμόζεται ήδη στο europeanschoolradio.eu αλλά και στο youthradio.eu.
Για όσους ενδιαφέρονται να δουν τις τεχνικές λεπτομέρειες της προσέγγισης, τη μεθοδολογία και την αρχιτεκτονική του συστήματος, η πλήρης δημοσίευση είναι διαθέσιμη εδώ:
https://www.mdpi.com/3042-6308/2/1/1
0 σχόλια