Ποια ήταν τα πιο σημαντικά θέματα στο ελληνικό web για το 2010; Σας τα παρουσιάζουμε σε ένα infographic.
Μεθοδολογία
Στην καρδιά της επεξεργασίας βρίσκεται η μηχανή εντοπισμού, παρακολούθησης και μέτρησης της εικόνας θεμάτων που ενσωματώνει το aino (topic detection, tracking & measurement). Η μηχανή αυτή συλλέγει συνεχώς μέσα στην ημέρα άρθρα από 200 επιλεγμένες πηγές του ελληνικού web. Οι πηγές αυτές έχουν επιλεγεί με τρόπο ώστε να δημιουργούν έναν αντιπροσωπευτικό της συνολικής θεματολογίας χώρο, εξασφαλίζοντας παράλληλα ότι έχουν τόσο τη μεγαλύτερη επισκεψιμότητα όσο και τα περισσότερα links: portals, ειδήσεις, επικαιρότητα, media, εφημερίδες, κλπ. Το aino ομαδοποιεί (clustering) τα άρθρα αυτά σε θέματα. Τα κύρια θέματα μιας ημέρας περιλαμβάνουν πολλά άρθρα ενώ στην ουρά της κατάταξης βρίσκονται και θέματα με ένα μόνο άρθρο. Τα θέματα δημιουργούνται συνεχώς όπως τρέχει η επικαιρότητα και στο χρόνο ακολουθούν διάφορες τροχιές, ανάλογα με το κάθε θέμα.
Στις 200 αυτές κύριες διαδικτυακές πηγές παράγονται κάπου 3000 θέματα κάθε ημέρα. Το aino αντιστοιχίζει σε κάθε θέμα τον τίτλο του πιο κεντρικού από τα άρθρα που το περιγράφουν, καθώς και ένα σκορ: το aino impact που ποσοτικοποιεί την εικόνα του θέματος στα μέσα. Το σκορ αυτό συνδυάζει τον αριθμό των άρθρων, τον αριθμό των πηγών και τη σημασία της κάθε πηγής όπως αυτή δίνεται από διάφορες διαδικτυακές μετρήσεις.
Έτσι λοιπόν επιλέξαμε ως κύριο θέμα της κάθε ημέρας του 2010, το θέμα με το μεγαλύτερο σκορ. Η κόκκινη μπάρα αριστερά σε κάθε θέμα είναι μια γραφική απεικόνιση του aino impact. Στην πρώτη σελίδα του γραφήματος απεικονίζουμε τους μήνες και τα κύρια θέματα του κάθε μήνα. Η κορυφογραμμή είναι μια προσεγγιστική εικόνα της καμπύλης του aino impact για κάθε μήνα. Τα κύρια θέματα περιγράφονται με 1-2 λέξεις. Πώς είπαμε ότι προφέρεται εκείνο το ισλανδικό ηφαίστειο; Enjoy!