Google Correlate: de do's en don'ts van Google's hidden gem

15 januari 2019 Inzichten /

Een tijdje geleden zette Search Engine Land Google Correlate nog eens in de kijker. Het is één van Google’s minder bekende services, zeker in onze contreien. De winter is volop aan de gang en de griep is in het land: een geschikte gelegenheid dus om deze intrigerende, maar tegelijk risicovolle en soms frustrerende tool nog eens te belichten.

Hoe een griepepidemie aan de basis lag

Griep treft jaarlijks 5 à 10% van de wereldbevolking. Daarvan worden tussen de 3 en 5 miljoen mensen ernstig ziek en sterven er tussen de 250.000 en 500.000. Om maar een open deur in te trappen: hoe sneller griep opgespoord kan worden, hoe beter. In Europa waakt het European Centre for Disease Prevention and Control (ECDC) hier mee over, in de Verenigde Staten is die rol weggelegd voor het Centers for Disease Control and Prevention (CDC).

Bij die opsporingssnelheid wringt vaak het schoentje. Het is eigenlijk al te laat om nog actie te ondernemen wanneer een griepepidemie ‘officieel’ is. We hollen dan achter de feiten aan en kunnen enkel nog genezen in plaats van voorkomen.

Dat moet beter kunnen, dacht Google. We schrijven 2008, waarschijnlijk niet toevallig het jaar waarin de zoekgigant tien kaarsjes mocht uitblazen. Met enig tromgeroffel werd in dat jaar dan ook Google Flu Trends uitgerold in de Verenigde Staten: een webservice met het nobele en ambitieuze doel om griepuitbraken op basis van zoekopdrachten snel en accuraat te voorspellen, bij voorkeur sneller en accurater dan het CDC.

Het algoritme van Google Flu Trends maakte gebruik van aggregatie en statistische analyse van 50 miljoen zoekopdrachten, ingevoerd in dezelfde locaties en tijdspannes waar in het verleden griepuitbraken geregistreerd werden. Gaven surfers vlak voor een griepuitbraak bepaalde terugkerende zoekopdrachten in? Waren hier trends, patronen en correlaties in te ontwaren? Zo ja, konden die gebruikt worden om toekomstige griepuitbraken te voorspellen?

De eerste jaren mocht Google Flu Trends best wel een pluimpje op de hoed steken. Het algoritme bleek aanvankelijk inderdaad vrij accuraat én snel te werken: zo kon het in 2010 twee weken vroeger dan het CDC een griepuitbraak in de oostelijke staten van de VS voorspellen. En dat allemaal dankzij een analyse van correlaties tussen zoekopdrachten.

Maar vanaf 2011 sloeg het de bal steeds vaker mis, en werden toekomstige griepuitbraken bijna systematisch overschat. De ambitieuze insteek bleek ook de achillespees van het programma te zijn: Google en Google Flu Trends kregen de kritiek te lijden aan big data hubris. Het algoritme draaide immers enkel op data van zoekopdrachten, en hield weinig of geen rekening met de context en evolutie ervan, en ook niet met andere databronnen. Surfers zijn niet per se dokters: kan je verwachten dat iedere surfer in staat is om symptomen juist te herkennen en diagnoses te stellen? Er zijn ook best veel ziekten met symptomen die op griep lijken te wijzen, maar toch geen griep zijn. En niet in het minst: zoekgedrag van surfers verandert voortdurend, en ook het algoritme van de zoekmachine zelf staat niet stil.

Kritiek of niet, het algoritme en kernidee van Google Flu Trends - patronen en correlaties zoeken in een immense berg zoekopdrachten - waren te beloftevol om zomaar op te bergen. Google Flu Trends zelf doofde dan wel helemaal uit in 2015, maar in de schoot ervan werd al in 2011 Google Correlate geboren: een webservice met dezelfde insteek als Google Flu Trends, toegankelijk voor iedereen en voor alle zoekopdrachten.

Schrik niet als je op bovenstaande link klikt. Je landt wel degelijk op de juiste pagina. Jazeker, de interface is oubollig en het design komt uit de jaren stillekes. Er wordt in de webcopy vooral naar het verre verleden verwezen. Meer nog: we kunnen meteen ook al verklappen dat Google sinds maart 2017 gestopt is met het programma te updaten, en niemand weet of en wanneer er nog nieuwe updates komen.

De tool is uniek in zijn opzet en kan informatie aanreiken die je in geen enkel ander programma kan vinden. 

Dus... waarom zou je het nu nog in godsnaam gebruiken?

Hoe werkt Google Correlate?

Over hoe je nu precies met Google Correlate werkt gaan we het hier niet uitvoerig hebben, daar hebben anderen reeds uitgebreid en goed over geschreven. We verwijzen je hiervoor graag naar het eerder genoemde artikel van Search Engine Land, en beperken ons hier tot een spoedcursus.

Wie vertrouwd is met Google Trends heeft een streepje voor. In Google Trends kan je de populariteit van een zoekopdracht nagaan, in een zelf te bepalen locatie en tijdspanne. Voer een woord in en Google Trends toont je grafieken ervan met de evolutie in tijd en locatie. In essentie komt het hierop neer: je voert een zoekopdracht in, en je krijgt een dataserie terug.

Laten we een actueel thema als voorbeeld nemen: Brexit. Als je de populariteit van zoekterm ‘Brexit’ in de UK wil nagaan, krijg je dit te zien in Google Trends:

Google Trends: de populariteit van zoekopdracht ‘brexit’ in de UK sinds 1 januari 2016.

De grafiek toont, niet verwonderlijk, een maximale populariteitspiek in juni 2016: op 23 juni 2016 werd het referendum over het al dan niet uittreden uit de EU gehouden.

We zien daarna een eerder gelijkmatige populariteit, tot oktober-november 2018, waar de grafiek opnieuw een kleine piek vertoont. Ook niet helemaal verwonderlijk, aangezien de Britse regering in die periode de laatste hand probeerde te leggen aan de Brexit-regeling, en het thema opnieuw all over the news was.

Leuk, dat zeker, maar niet echt wereldschokkend. Je hoeft geen politiek genie te zijn om te voorspellen dat de populariteit van dit zoekwoord op die momenten zou pieken. Zou het niet interessant zijn mochten we bijvoorbeeld te weten kunnen komen welke andere zoekopdrachten een gelijkaardig patroon vertoonden of, met andere woorden, óók piekten op die momenten?

Enter Google Correlate.

Google Correlate is Google Trends op z’n kop. In plaats van zoekopdrachten in te geven en een dataserie terug te krijgen, geef je een dataserie in en krijg je zoekopdrachten terug. Google Correlate gaat dus op zoek naar zoekopdrachten met een gelijkaardig zoekpatroon in tijd en locatie.

Goed nieuws: je hoeft niet noodzakelijk zelf ‘een dataserie’ te uploaden. Google beschikt uiteraard voor de meeste zoekopdrachten over de achterliggende dataserie. Je kan dus ook gewoon een woord ingeven, net zoals je in Google Trends zou doen, en Google doet de rest.

Terug naar Brexit. Voeren we dit woord in in Google Correlate, dan krijgen we dit te zien:

Google Correlate: zoekopdracht ‘brexit’ in de UK.

Google Correlate geeft in dit voorbeeld een lijst van zoektermen weer die op weekbasis een correlatie vertoonden met zoekopdracht ‘Brexit’ in de UK. Je krijgt per resultaat de correlatiecoëfficiënt mee (1.0 is een perfect positieve correlatie), en onder de lijst met resultaten kan je per zoekopdracht ook de bijhorende correlatiegrafiek zien.

Bekijken we de lijst met correlaties eens van dichterbij, dan zien we bijvoorbeeld een gelijkaardige zoekopdracht meerdere keren terugkomen, telkens met een sterk positieve correlatiecoëfficiënt:

Hou in gedachten dat het Brexit-referendum een dubbeltje op z’n kant was: het pro-kamp haalde het slechts nipt met 51,9%. Er waren dus bijna evenveel tegenstanders als voorstanders, en dat lijkt zich ook te weerspiegelen in het zoekgedrag. De interesse in een Iers paspoort was waarschijnlijk nog nooit zo hoog in de UK.
Google Correlate: de sterk positieve correlatie tussen zoektermen ‘brexit’ en ‘apply for irish passport’ in de UK, juni 2016.

Originele mogelijkheden

We hopen dat jouw innerlijke marketeer ondertussen ontwaakt is en de mogelijkheden van Google Correlate ziet. Het programma biedt namelijk fantastische opportuniteiten om je horizon te verruimen. Om er maar twee te noemen:

Keyword Research & Content Marketing

Elke online marketeer die keyword research doet zal het kunnen beamen: het is soms een frustrerende job. Je doet je stinkende best in Google Keyword Planner of een andere keyword research tool, je maakt lijsten van interessante zoekwoorden met hun zoekvolumes en seizoenaliteit, en je hebt al meteen enkele frisse ideetjes voor jouw content marketing. Maar dan merk je dat je niet alleen bent: naast jezelf hebben waarschijnlijk -tig marketeers ook al dezelfde keyword research gedaan, met dezelfde tools als jij, en met dezelfde bevindingen en bijhorende ideeën. Opeens lijkt die fantastisch originele landingspagina die je voor ogen had helemaal niet zo origineel meer.

Google Correlate kan hier soelaas brengen. Focus niet enkel op de meest evidente zoekwoorden: verlaat eens de platgetreden paden en ga ook eens kijken welke andere zoekopdrachten een gelijkaardig zoekpatroon vertonen in tijd en locatie. Veel kans dat je tot nieuwe inzichten komt.

Persona’s & Customer Journeys

Kennis van de noden en wensen van (potentiële) klanten is essentieel voor het succes van elke onderneming. Of je nu producten of diensten verkoopt of verleent: om de verschillende behoeften van jouw klanten zo goed mogelijk te kunnen beantwoorden, stel je persona’s op en maak je customer journeys. Dat is een vak apart, met eigen methodieken en tools, en dus zullen we hier niet verder behandelen. Maar ook hier kan Google Correlate een extra pijl op je boog zijn. Met dezelfde insteek als hierboven: wees creatief, gebruik Google Correlate in jouw voordeel en ga na wat er beweegt op de Google zoekmachine op het moment dat jouw potentiële klanten op zoek zijn naar jouw product of dienst. Het kan je zeer interessante informatie opleveren over elke stap in hun beslissingsproces, of zelfs een compleet nieuwe insteek. Tip: gebruik hiervoor zeker ook eens de shift series-functie.

Dit zijn slechts twee voorbeelden van mogelijke toepassingen van Google Correlate. Laat je creativiteit en inlevingsvermogen de vrije loop en je kan er zeker nog enkele bedenken.

Google Correlate kan hier soelaas brengen. Focus niet enkel op de meest evidente zoekwoorden: verlaat eens de platgetreden paden en ga ook eens kijken welke andere zoekopdrachten een gelijkaardig zoekpatroon vertonen in tijd en locatie. Veel kans dat je tot nieuwe inzichten komt.

Do’s and don’ts van Google Correlate

Hoe verrassend of verrijkend Google Correlate ook kan zijn: het is niet het one-stop-walhalla voor de marketeer. Google Correlate komt niet zonder risico’s, en vraagt enige discipline. Enkele tips om veel voorkomende valkuilen te vermijden:

  1. Elke docent statistiek zal het je meerdere malen inpeperen: correlaties geven verbanden aan, maar geen causaliteit. Niet in Google Correlate en ook niet daarbuiten. Dit is meteen een van de grootste uitdagingen: de verleiding weerstaan om iets te willen zien. Het vinden van de oorzaak of verklaring van correlaties in Google Correlate is dan ook volledig jouw taak en verantwoordelijkheid. Of om het met Google zelf te zeggen: “Explaining correlation between X and Y is left as an exercise to the reader”.
  2. Ga er dus ook niet zomaar van uit dat de gecorreleerde zoekopdrachten van dezelfde surfer(s) komen. Dat kan, maar is helemaal niet zeker. Google Correlate zoekt simpelweg correlaties tussen zoekopdrachten in dezelfde tijdspanne en dezelfde locatie.
  3. Google Correlate houdt geen rekening met het zoekvolume van de zoekopdrachten. Een zoekopdracht met 10.000 zoekopdrachten per maand kan correleren met een zoekopdracht met maar 10 zoekopdrachten per maand. In Google Correlate zie je enkel de correlatiewaarde.
  4. Val zelf niet ten prooi aan big data hubris en baseer je niet louter en alleen op wat je al dan niet vindt in Google Correlate. Het programma is vooral geschikt om nieuwe insteken te vinden en hypothesen op te stellen, die je staaft of ontkracht met andere onderzoeksbronnen.
  5. Het is geen toeval dat we een Engelstalig voorbeeld namen. Google Correlate is weliswaar ook beschikbaar en bruikbaar in Nederland en België, maar je zal er sneller op de limieten van het programma botsen. De dataset voor onze contreien is nu eenmaal kleiner dan die van pakweg de US of UK. Maar laat je dat vooral niet tegenhouden om te experimenteren - of en hoe je je bevindingen kan extrapoleren naar ons land is weliswaar jouw verantwoordelijkheid.
  6. Zoals eerder aangegeven: officieel heeft Google het nooit bevestigd, maar sinds 12 maart 2017 lijkt het programma geen enkele update meer gekregen te hebben. Verwacht dus geen ‘verse’ data. Maar dat hoeft niet per se een struikelblok te zijn: de historische dataset is ook nu nog nuttig. Niet alle zoekgedrag verandert immers fundamenteel over de jaren heen.

Google Correlate is niet het one-stop-walhalla voor de marketeer. Het programma komt niet zonder risico’s, en vraagt enige discipline.

Google Correlate mag dan wel gevaren en gebreken hebben, ook anno 2019 blijft het een leuke service die zeker het gebruiken waard blijft. De tool is uniek in z’n opzet, en kan informatie aanreiken die je in geen enkele ander programma kan vinden. We kunnen dus alleen maar hopen dat Google het programma opnieuw leven inblaast - schud gerust mee aan de boom hiervoor!

Wil je ook eens Google Correlate uittesten voor klanten? We zoeken nog ervaren Online Marketeers om ons team te versterken.

Solliciteer nu

Jan Criel
Online Marketeer

Lees meer

Iedereen bij Wijs deelt zijn expertise, ook Jasper en Evi. Benieuwd naar de laatste nieuwtjes en blogposts? Schrijf je in voor onze nieuwsbrief!