COVID-19aren jarraipena Google Trends erabiliz 🤔

Francesc Pujol Nafarroako Unibertsitateko irakasleak "‘COVID sintomak’ Google Trendsen. COVID kasuen jarraipenerako adierazle alternatibo bat" artikulua argitaratu zuen joan den astean, eta horren harira Euskadi Irratiko Baipasa saiotik jarri ziren nirekin harremanetan.
Artikulua aurkezteko erabili zuen Twitterreko haritik honako txio hauek nabarmendu genituen elkarrizketa prestatzeko hitz egin genuen lehenengoan:
10. Porque, además de medir exactamente lo mismo que lo que hace la suma de miles de test PCR tiene una caracterĂstica complementaria bien interesante: es instantánea y se hace a coste cero.
— Francesc Pujol (@NewsReputation) April 13, 2021
Y porque en algunos casos resulta que no es tan fácil o eficiente medir los casos reales
Hau da, PCRak edo antigeno testak egitearen aldean, Google Trends erabiltzea doanekoa eta oso azkarra da. Pertsonalki hain garbi ez daukadana da “milaka PCR testek neurtzen duten gauza berbera” neurtzen duenik.
25. Los gráficos americanos muestran un elemento nuevo, visible en España sólo en parte: en algunas fases parece que hay un decalaje claro y sistemático. Los casos notificados van con retraso de una semana con respecto a las búsquedas en Google. Muy claro en México. pic.twitter.com/yCOPAcKpf5
— Francesc Pujol (@NewsReputation) April 13, 2021
Badirudi, orokortasunetik xeheago begiratzen jarrita, Amerikako estatu batzuetan (Mexikon adibidez) behitzat, Google Trendsen test bitartez baino lehenago ikus daitezkeela pandemiaren inzidentziaren gorabeherak. Honek hala-nolako ahalmen prediktiboa baduela esan nahi lezake. Eta…
29. El decalaje para los casos en C Valenciana y PaĂs Vasco es notorio. Son dos de las comunidades conocidas por notificar con mucho retraso los datos locales a las estadĂsticas de Madrid.
— Francesc Pujol (@NewsReputation) April 13, 2021
Es decir, la realidad serĂa Google. Porque sabemos que es un puente.
Señala subida en PV pic.twitter.com/hMeiRfTcp4
…Euskadiren kasuan ere ematen da, datuen arteko dekalaje hau.
Artikuluan eta txiotan erabiltzen dituen grafikoetan ikusten da bataren eta bestearen lerroak neurri batean bat datozela, hau da, Google Trendseko datuek pandemiaren inzidentziaren jarraipena egiteko balio dutela neurri batean (oraingoz); baina hortik aurrikusteko balioa izatera, tarte luzea doa nire ikuspegitik.
Interneteko bilaketen balioa
Gaixotasunen inzidentziak Google Trendsen bitartez jarraitu eta aurrikustea ez da berria: 2008az geroztik Googlek gripearen inzidentziaren estimazioak egiten zituen Google Flu Trends tresna jarri zuen eskuragarri, eta atentzio asko jaso zuen eremu askotatik, akademikoa barne1.
Nola funtzionatzen dute korrelazio edo parekotasun hauek? Gaixotzean, gripearekin edo sintoma jakin batzuekin erlazionatutako informazioa bilatzen dugu interneten, eta honek nolabaiteko inzidentziari buruzko informazioa jarraitzeko ahalmena ematen zuela baieztatu zen: zenbat eta gripe gehiago, orduan eta erlazionatutako bilaketa gehiago.
Gainera, aurrikusteko gaitasuna ere bazuen: datu ofizialak baino ia bi aste lehenago ikus zitezkeen gorakadak Google Trendsen. Aurrikuspen zehatzena dena den ez zen oso epe luzekoa, baina uneko irakurketa zehatz bat emateko balio zuen, nowcasting edo orainaren eta berehalako iragan eta etorkizunaren iragarpena.
Baina Google Flu Trendsek ez zuen luzaro iraun. Urtebete geroago, 2009an gripearen H1N1 aldaera (A gripea bezala ezagutu genuena) hedatu zenean… Google Flu Trendsek ez zuen ikusi. Aurrerago, 2013an, Google Flu Trendsen aurrikuspenak errealitatearen ia bikoitza eman zuen2… eta 2011-2013 urteen artean, 108 astetatik 100etan huts egin zuen.
Urteak pasa ahala, ikusi zen Google Flu Trendsek 2-3 urteetan zehar, ezustekorik egon ezean (!) hala-nola funtzionatzen zuela; baina, denbora hori pasata, doikuntza sakonak behar izaten zituela estimazio eta jarraipen datu zehatzak eman ahal izateko. Hau da, ia perfektua zela gripea iragartzen… pasatako urteetan.
Googlek 2015 utzi zuen alde batera Google Flu Trends, eta denborarekin isilean hiltzen utzi zuen, erabat desagertarazi arte.
COVID-19aren inzidentzia jarraitu eta aurrikusteko gai al da?
Noski, 2020 urtearen hasieran edozenolako tresnak baliagarri zitzaizkigun gainera zetorkigun pandemia ulertarazten laguntzeko. Une hartan bertan baina, zenbait erakundek adierazi zuten inteligentzia artifizialaren eta datu masiboen erabilera tentuz hartu beharra zegoela. Zehazki, Nazio Batuen Erakundeak ohartarazi zuen koronabirusari aurre egiteko ez zirela baliagarriak oraindik, eta Munduko Ekonomia Foroak jakinarazi zuen giza faktorea erabakigarria izango zela halako tresnez baliatzerakoan.
Zergatik ez zuen funtzionatu Google Flu Trendsek? Zein hobekuntza beharko lituzke gripearen edo koronabirusaren berehalako jarraipena egin eta, ahal izanez gero, aurrikuspenak egiten lagundu dezan? Bada hain zuzen, giza faktorea ez zuen kontuan hartu. Denborarekin bilaketa ohiturak aldatzen doaz, eta Google bilatzailea ohitura horietara moldatzen saiatzen da etengabe. Helburu horrekin, Google Flu Trends abiarazi ondoren, bilaketak iradokitzen dituen funtzioa jarri zuen martxan, bilatzen genuen informaziora errazago heltzen lagundu nahian. Honek Googleren erabilera erosoago egiten badu ere, bilaketa termino batzuk gailentzea ere sorrarazten du, aldi berean Google Flu Trendsen estimazioen doitasuna pikutara bidaliz3.
Laburbilduz
Google Trends tresna merkea da (ia kosturik gabea) era honetako irakurketak egiteko, baina predikzio tresna gisa, galdutako giltzak farolaren azpian bilatzearen txistearen antzerakoa gertatzen da. Heldutasuna falta duten neurrian, tentuz erabili beharrekoak dira tresna hauek, eta batez ere, alde batera utzi gabe baliagarritasuna frogatu izan duten beste estrategia batzuk, hala nola arriskuaren balorazioa adierazten duten mapak edo erakunde arteko komunikazio trukea hobetzea.
Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., & Brilliant, L. (2009). Detecting influenza epidemics using search engine query data. Nature, 457(7232), 1012–1014.
/10.1038/nature07634
↩︎Lazer, David, Kennedy, Ryan, King, Gary, & Vespignani, Alessandro (2014). “The Parable of Google Flu: Traps in Big Data Analysis”. Science, 343(6176), 1203–1205.
10.1126/science.1248506
↩︎Nolabaiteko Mateo efektu bat sortuz: gehien erabiltzen diren bilaketak maizago agertzen dira iradokita, eta horrek gehiago erabiltzea dakar. ↩︎
Zerbait esateko?
Edukiaren gaineko iruzkinen bat egin nahi baduzu, hypothes.is bidezko oharpenak erabiliz egin dezakezu eskubialdeko barraren bitartez. Nola?