Μικρή διαφορά υπερ του Γκιουλέκα αποτυπώνει ένα νέο εργαλείο ανάλυσης δεδομένων.
Κάθε φορά που πάω να ψηφίσω προετοιμάζομαι για την απάντηση που θα δώσω αν με σταματήσουν στο exit poll. Εκείνα τα συμπαθητικά παιδιά (πάντα βάζουν ωραίες κοπέλες;) με το τραπεζάκι στην έξοδο του εκλογικού κέντρου. Τελικά μόνο μια φορά με σταμάτησαν. Είχα προετοιμαστεί. Τους είπα το πιο τρελό κόμμα, έπρεπε να ψάξουν να το βρούνε σε λίστα! Σε στατιστικό επίπεδο δεν τους ενοχλώ βέβαια γιατί εξομαλύνονται τα νούμερα από …λιγότερο ανώμαλους που λένε την αλήθεια.
Αναφέρθηκα στην δυνατότητα προβλέψεων εκλογικού αποτελέσματος με βάση δεδομένα από την παρακολούθηση των ΜΜΕ. Δεν είμαι ο μόνος αφού πολλοί πιστεύουν ότι το Google ή το Twitter είναι κοντά σε μια τέτοια επιτυχία. Εδώ αναλύω πως λειτουργεί το impact analysis και γιατί είναι χρήσιμα και ενδεικτικά αυτά τα στοιχεία. Ο παραπάνω πίνακας δείχνει το Aino impact συνολικά. Μπορεί διαρκώς ο Μπουτάρης να είχε περισσότερες αναφορές αλλά ο Γκιουλέκας είχε περισσότερες αναφορές υψηλής mediaκής απόδοσης.
Μόλις μου ήρθε από την Qualia μια ακόμα πιο ενδιαφέρουσα ανάλυση βάση sentiment analysis η οποία ενσωματώνει νοημοσύνη για να καταλάβει αν μια αναφορά είναι θετική ή αρνητική. Έχει μεγάλο ενδιαφέρον.
Το λογισμικό έτρεξε σε σελίδες από το ελληνικό διαδίκτυο για το διάστημα 10/09-27/10. Είναι 1227 κείμενα για Μπουτάρη και 886 κείμενα για Γκιουλέκα. Σε μια κλίμακα από -100 (πολύ αρνητικό) ως +100 (πολύ θετικό), οι υποψήφιοι είναι στο:
Μπουτάρης -12,41
Γκιουλέκας +1,88
Αλλά έχει ενδιαφέρον και η κατανομή των αποτελεσμάτων με τον Μπουτάρη να συγκεντρώνει και πιο πολλές ακραίες αρνητικές αναφορές (4.66% “πολύ αρνητικό” έναντι 4.14% του Γκιουλέκα) αλλά και πιο ακραίες θετικές αναφορές. (5.44% “πολύ θετικό” έναντι 5.1% του Γκιουλέκα) Είναι η πόλωση στην οποία αναφέρθηκα στο προηγούμενο άρθρο μου η οποία θα αποδειχθεί κρίσιμη πιθανώς στον δεύτερο γύρο.
Μπορεί να σας φαίνονται μικρές οι διαφορές αλλά υπολογίστε ότι μιλάμε για επίσημες ιστοσελίδες με ειδησεογραφικό χαρακτήρα. Αυτές που υποτίθεται είναι αντικειμενικές. Την επόμενη εβδομάδα που θα τρέξει το ίδιο εργαλείο στα blogs αναμένω πιο έντονες διαφορές. Όταν με το καλό αυτό το εξαιρετικά προηγμένο εργαλείο ενσωματωθεί πλήρως στο Aino θα περιλαμβάνει και social media και τότε θα μιλάμε για τεράστιο όγκο πληροφοριών από διαφορετικές πηγές. Είναι σχεδόν σίγουρο ότι τότε θα μπορούμε να έχουμε πολύ πιο ακριβείς προβλέψεις.
Είναι σημαντικό βέβαια να κατανοήσουμε ότι ακόμα και με δεδομένα από facebook και όποιες άλλες πηγές, όσο ακρίβεια και αν έχουν αυτές οι αναλύσεις “κάθονται” μετά πάνω σε δημογραφικά δεδομένα, δηλαδή πόσοι ψηφοφόροι υπάρχουν, πάνε να ψηφίσουν και προϋπάρχουσες πολιτικές αντιλήψεις. Αλλά όσο βελτιώνονται, τόσο θα πλησιάζουν την απόλυτη ακρίβεια ή τουλάχιστον ακρίβεια καλύτερη από τις δημοσκοπήσεις. Και αντίθετα με τα exit poll θα είναι αδύνατον να λέω κάθε μέρα ψέματα στο Facebook, το Twitter και τα blog μου συστηματικά!
Τα δυο σχετικά tag clouds:
Πράγματι, η μηχανή sentiment analysis που επεξεργάστηκε τα δεδομένα φαίνεται να επιβεβαιώνει αυτό που συχνά έγραψες, το έντονο επικοινωνιακό παιχνίδι του Μπουτάρη στην προεκλογική περίοδο. Προκάλεσε με δηλώσεις, προβλήθηκε περισσότερο, θα φανεί αν η πόλωση που δημιούργησε τον ευνοήσει και πόσο τελικά.
Σχετικά με την impact analysis, παρατηρώ από τα δεδομένα πως τον “σαματά” που προκάλεσε ο Σαμαράς στην ΔΕΘ, κληρονόμησε ο Γκιουλέκας εκείνες τις ημέρες. Είναι αυτό το νούμερο που τον κρατάει συνολικά ως σήμερα λίγο μπροστά από τον Μπουτάρη. Από εκείνη τη στιγμή και μετά ο απόλυτος κυρίαρχος, όπως παρουσίασες σε όλα τα μέσα, είναι ο Μπουτάρης που σχεδόν έκλεισε με τις κινήσεις του το άνοιγμα (στο impact measurement) εκείνων των ημερών του Σεπτέμβρη. Η επίθεση της ΝΔ που ξεκίνησε στην ΔΕΘ και ο χαρακτήρας που έδωσε στις εκλογές, ίσως να αρκέσουν στον Γκιουλέκα για να μείνει μπροστά και να διατηρήσει ως ΝΔ τον Δήμο. Ο Μπουτάρης το παλεψε διαφορετικά. Περιμένουμε με ενδιαφέρον τα αποτελέσματα, ώστε να σχολιάσουμε και να εξάγουμε τα συμπεράσματά μας.
Με τέτοιου επιπέδου αλγόρυθμους θεωρώ θέμα χρόνου τις πολύ έγκυρες προβλέψεις από το Aino. Αλλά το συναρπαστικό δεν είναι αυτό. Είναι ότι θα μπορεί όποιος πολιτικός θέλει, να “πιάνει τον παλμό” του κόσμου διαρκώς και όχι μόνο λίγο πριν τις εκλογές. Ακόμα και τώρα που δεν είναι ακόμα ρυθμισμένο για αποτελέσματα, το Aino σου δίνει πληθώρα στοιχείων και ιδεών για τα πράγματα που απασχολούν τον κόσμο είτε απευθείας ή μέσα από τα ΜΜΕ. Και με interface που δεν χάνεσαι!