Casa Bases de dades Utilitzant algoritmes per predir eleccions: un xat amb dibuixat linzer

Utilitzant algoritmes per predir eleccions: un xat amb dibuixat linzer

Anonim

Drew es presentarà a la cimera Big Data Innovation, els dies 30 i 31 de gener a Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, juntament amb ponents d'Obama per a Amèrica, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes i Nobles, Walmart Labs i molts altres.


Enllaç de registre: http://bit.ly/Zs3wms


Aquesta entrevista va ser realitzada per George Hill i publicada a la Big Data Innovation Magazine.


Quin tipus de reacció hi ha hagut davant les vostres prediccions?


La major part de la reacció s’ha centrat en la diferència de precisió entre els que vam estudiar les enquestes d’opinió pública i les prediccions de “sensació de budells” de pundits i comentaristes populars. El dia de les eleccions, analistes de dades com jo, Nate Silver (bloc de New York Times FiveThirtyEight), Simon Jackman (Universitat de Stanford i Huffington Post) i Sam Wang (Princeton Election Consortium) van situar les possibilitats de reelecció d'Obama a més del 90% i van preveure correctament. 332 vots electorals per Obama com el resultat més probable. Mentrestant, entitats com Karl Rove, George Will i Steve Forbes van dir que Romney guanyaria, i en alguns casos, fàcilment. Això ha portat a parlar d'una "victòria per als candidats" que espero que puguin portar a les futures eleccions.


Com valoreu l'algorisme utilitzat en les vostres prediccions?


El meu model de previsió estimava els resultats de les votacions estatals i la votació electoral final, cada dia de la campanya, a partir del mes de juny. Volia que la valoració d’aquestes previsions fos la més justa i objectiva possible i que no em deixés cap espai perjudicial si s’equivoquessin. Així doncs, aproximadament un mes abans de les eleccions, vaig publicar al meu lloc web un conjunt de vuit criteris d’avaluació que utilitzarien un cop coneguts els resultats. Segons va resultar, el model va funcionar perfectament. A l'estiu, pronosticava que Obama guanyaria tots els seus estats del 2008 menys Indiana i Carolina del Nord, i gairebé no es va partir d'aquesta predicció, fins i tot després que el suport a Obama es va encallar a l'alça al setembre, i es caigués després del primer debat presidencial.


La quantitat de dades utilitzades al llarg d’aquesta campanya tant per analistes independents com per equips de campanya ha estat enorme, quina mena d’implicacions té això per a l’ús de dades el 2016?


La campanya del 2012 va demostrar que es podien gestionar, confiar i aplicar diverses fonts d’informació quantitativa i diverses, amb èxit per a diversos fins. Els forasters vam poder predir els resultats electorals amb molta antelació. A les campanyes, hi ha hagut un gran avenç en l’orientació dels votants, el seguiment d’opinions, la recaptació de fons i la participació de votants. Ara que sabem que aquests mètodes poden funcionar, crec que no hi ha marxa enrere. Espero que els periodistes i els comentaristes de la campanya tinguin molt més seriosament l’agregació de les enquestes el 2016. I, tot i que actualment Obama i els demòcrates semblen tenir un avantatge en la tecnologia de la campanya, m’estranyaria si els republicans no s’aconsegueixin ràpidament.


Creus que l’èxit d’aquesta campanya basada en dades ha fet que els gestors de les campanyes ara hagin de ser analistes i estrategos?


És possible que els gestors de la campanya no siguin necessaris analistes, però haurien d’apreciar més la manera d’aprofitar les dades i la tecnologia. Les campanyes sempre han utilitzat la investigació d’enquestes per formular estratègia i mesurar el sentiment dels votants. Però ara hi ha una sèrie d’altres eines potents disponibles: llocs web de xarxes socials, bases de dades d’electors, telèfons intel·ligents mòbils i màrqueting de correu electrònic, per citar només alguns. I això és a més dels avenços recents en metodologies de votació i modelització d’opinió estadística. Actualment hi ha molta innovació a la política de campanyes nord-americanes.


Heu aconseguit predir els resultats de les eleccions 6 mesos abans, quin creieu que és el termini màxim realista per predir amb precisió un resultat mitjançant les vostres tècniques d’analítica?


Aproximadament quatre o cinc mesos fa aproximadament el que la ciència ens permet anar ara mateix; i això fins i tot l’empeny una mica. Abans d’això, les enquestes no són prou informatives sobre el resultat final: molta gent és indecisa o no ha començat a prestar atenció a la campanya. Els factors econòmics i polítics històrics que s'han demostrat que es correlacionen amb els resultats electorals també comencen a perdre el seu poder predictiu una vegada que superem els quatre o cinc mesos aproximadament. Afortunadament, això encara dóna temps a les campanyes per traçar estratègia i prendre decisions sobre com destinar els seus recursos.

Utilitzant algoritmes per predir eleccions: un xat amb dibuixat linzer