Οι σύντομες αναφορές στο προϊόν που παρακολουθούμε (στην προκειμένη τους πολιτικούς που εμπλέκονται στις δημοτικές εκλογές της Θεσσαλονίκης) μπορεί να αποδειχθούν εξαιρετικά σημαντικές. (Πιο εκτενής ανάλυση του φαινόμενου γίνεται εδώ με παραδείγματα.) Σημαντική τεχνολογία για να γίνει αυτό είναι η ικανότητα του Aino να αναγνωρίζει γραπτές αναφορές στο τηλεοπτικό περιεχόμενο καθότι συχνά οι λεζάντες εμπλέκουν την οντότητα που μας ενδιαφέρει.
[youtube=http://www.youtube.com/watch?v=Kk0IcODHim4]
Κλέβω πάλι μια παράγραφο από παλιότερη ανταλλαγή email με τους ανθρώπους της Qualia γιατί πιστεύω ότι είναι εξαιρετική περίληψη του θέματος από τεχνική άποψη:
“Στην πολυμεσική αναζήτηση θέλουμε να συνδυάσουμε πληροφορία από τη φωνή και την εικόνα. Τα δεδομένα που παράγουμε (μεταδεδομένα) και με τα οποία κατασκευάζουμε τους δείκτες μας (indexes) για την αναζήτηση, προέρχονται από αναγνώριση φωνής και αναγνώριση κειμένου στο βίντεο. Στο τελευταίο, θέλουμε να αναγνωρίσουμε αυτό που γράφεται στο κείμενο και υπερτίθεται στην εικόνα. Ονομάζεται overlay text, σε αντίθεση με το scene text (πινακίδες αυτοκινήτων, δρόμων και σήματα). Το πρώτο πράγμα που κάνουμε είναι να προσπαθούμε να βρούμε περιοχές της εικόνας που είναι πιθανό να περιέχουν κείμενο. Αυτό γίνεται με διάφορες μετατροπές, προβολές και φιλτραρίσματα. Όταν έχουμε καταλήξει σε ένα σύνολο από τέτοιες περιοχές, εφαρμόζουμε οπτική αναγνώριση χαρακτήρων και παράγουμε το τελικό κείμενο. Και όλα αυτά βέβαια πρέπει να τρέχουν σε πραγματικό χρόνο !”