Wat is dat lek bij Google?

Roy Huiskes en Chantal Smink over de gelekte documenten van Google
Een lek bij Google: 2.600 modules, 14.000 features en 1 SEO community die helemaal over de rooie is. Wat is dat lek bij Google precies? Wat staat er in het document en wat kun je ermee?

Luister podcast

Bekijk video

Met Roy Huiskes ging ik in gesprek over de lek bij Google. Het gesprek is opgenomen op de dag van de lek, namelijk maandag 28 mei 2024. We hebben vooral besproken welke elementen door Mike King en Rand Fishkin besproken zijn. Een anonieme bron heeft Rand benaderd met de documenten, daarna zijn Rand en Mike aan de slag te gaan om alle documenten te bekijken. 

Wat is er nou precies gelekt?

Wat is er nou precies gelekt? Nou eigenlijk een hele lange lijst met 14.000 ‘dingen’ erop die Google op de een of manier gebruikt, gebruikte of opslaat. Je kunt die lijst vergelijken met een soort ingrediëntenlijst, het keukenkastje van Google. We weten nu dat er 14.000 potjes in hun kast staan maar we weten niet wat ze ermee doen, in welk gerecht ze het gebruiken, in welke hoeveelheid en of potjes niet allang over de datum zijn. Ook weten we niet hoeveel kasten er nog zijn met nog meer potjes erin en welke kast het precies is. Het is aannemelijk om te denken dat ze alle ‘dingen’ ook echt in het algoritme gebruiken maar ook dat weten we niet zeker. 

Zijn het rankingfactoren?

Dat weten we dus helaas (of juist gelukkig) niet. Het kan zijn dat bepaalde dingen gebruikt worden als ranking factor, maar welke van de 14.000 dan een ranking factor en in hoeverre Google ze meeweegt, wegen we ook niet. 

We weten dus echt niet meer dan dat het een potje in hun keuken is. Maar het geheim van de chef is daarmee niet ontrafeld. 

Zijn de documenten echt?

Ja, het had er al alle schijn van dat de documenten echt zouden zijn. Rand Fishkin en Mike King die als eersten over het lek publiceerden, claimden grondig onderzoek gedaan te hebben naar de klokkeluider en de documenten. Zo zouden ex-Googlers bevestigd hebben dat dit wel erg lijkt op officiele documenten. In middels heeft Google het bevestigd: de gelekte documenten zijn echt. 

Wat staat er in het document?

Het document is een verzameling van 14.000 “Excel-regels”, verdeeld over 2.600 modules. In het document zie je code staan zoals hieronder:

In die code zie je bijvoorbeeld dat Google “changes” opslaat, maar ook een “latest version” en dat op url-niveau. Er zijn dus 14.000 van dit soort stukjes codes uitgelekt, compleet met naam, omschrijving etc. 

In die hele brei aan informatie komen een aantal nieuwe leuke termen naar voren: 

Conclusie die Rand trekt op zijn website SparkToro over NavBoost

Maar ook zien we termen terugkomen die we al kennen:

Een aantal termen of opvallende zaken zijn leuk om nader te bespreken, zie hieronder. 

Twidder

We bespraken de Twiddler en concludeerden dat het een re-ranking systeem is voor documenten op basis van hun versheid. Het zorgt ervoor dat documenten opnieuw worden gerangschikt afhankelijk van hoe recent ze zijn, waardoor de meest actuele informatie hoger in de zoekresultaten verschijnt.

Mustang

We hadden de term Mustang nog nooit eerder gezien. Het blijkt het primaire scorings-, rangschikkings- en bedieningssysteem te zijn dat pagina’s initieel rangschikt voordat er enige her-ranking aanpassingen plaatsvinden. Dit systeem vormt de basis voor de eerste ordening van zoekresultaten.

Sandbox

De term Sandbox werd door Google nooit gebruikt, sterker nog: ze ontkenden het bestaan van een sandbox maar toch staat er in de documenten dat er een hostAge is waarmee “fresh spam gesandboxed kan worden”. 

Baby Panda

Het lijkt erop dat Baby Panda een Twiddler is die werkt bovenop Panda, maar verder was er weinig informatie beschikbaar. Mike van iPullRank benoemt in zijn artikel een band met de Helpful Content Update, hoewel het niet helemaal duidelijk is hoe dit precies werkt. 

Good clicks, bad clicks, lasting clicks

We ontdekten dat Google verschillende soorten clicks onderscheidt, zoals good clicks en bad clicks. Good clicks zijn klikken die positieve gebruikerssignalen afgeven, bijvoorbeeld wanneer een gebruiker lange tijd op een pagina blijft of meerdere pagina’s binnen dezelfde site bekijkt. Bad clicks daarentegen zijn klikken waarbij er negatieve signalen zijn. We weten niet welke signalen dit echt zijn maar denk bijvoorbeeld aan een gebruiker snel terugkeert naar de zoekresultaten, wat aangeeft dat de pagina niet relevant of bevredigend was.

Chrome data

Het verbaasde ons niet echt, maar Google slaat dus ook data die afkomstig is uit Chrome. Welke dat precies weten we niet maar ze spreken over Site-level Chrome views. 

Demotions

We waren verrast door hoeveel demotions Google daadwerkelijk toepast. Er zijn verschillende soorten demotions, zoals navigational demotion en exact match domains demotion, die invloed hebben op hoe bepaalde pagina’s worden gerangschikt of juist lager worden geplaatst in de zoekresultaten.

Authors

We leerden dat Google auteurs bijhoudt per pagina door te kijken wat ze kunnen vinden en parsen. Deze informatie wordt opgeslagen en lijkt een eenvoudige manier van phrase matching te zijn. Dit benadrukt het belang van auteurschap en de nauwkeurigheid van content toewijzing.

Way back machine

Google lijkt een soort van way back machine, ze bewaren tot twintig versies terug van een website om wijzigingen te volgen. Dit geeft hen de mogelijkheid om te zien wat er in de loop van de tijd is veranderd op een website.

YMYL score

Er is een soort YMYL score, maar uit de documentatie worden we helaas niet wijzer hoe dit werkt. Meer dan ‘er is een YMYL score’ kunnen we dan ook nu helaas niet vertellen. 

Video focused

Blijkbaar labelt Google websites als ‘videofocused’ als 50% van de pagina’s (of meer) een video bevat. We weten natuurlijk niet wat dit betekent voor je rankings of vindbaarheid en hoe ze dit gebruiken. 

Original content score

In de documenten komt ook de term Original Content Score naar voren. Google zegt dat het een getal is tussen 0 en 127 en dat alleen pagina’s met weinig content dit veld krijgen. Inspector Gadget zal moeten uitzoeken wat ze hiermee bedoelen. 

Wat kun jij hiermee?

Je ziet al hoe weinig je eigenlijk kan met het document. We weten dat Google naar iets kijkt maar verder ontbreekt elke context. We weten net wat het is en soms is zelfs dat niet duidelijk. Eigenlijk kun je er dus helemaal niets mee. Daarbij zijn er nu pas een klein aantal van alle 14.000 items bekeken. 

Als je mij vraagt hoe dit SEO verandert, dan zeg ik: weinig. Veel dingen hadden we al een vermoeden van. Zo zien dat Google Chrome data lijkt op te slaan en ook kijkt naar zaken als bad click, good clicks, lasting clicks etc. Eind 2023 was natuurlijk al uit rechtbank documenten gebleken hoe belangrijk user signals zijn voor Google, dit is wat de term NavBoost omvat. De grap is dat veel dingen altijd door Google werden ontkend die in dit document wel naar voren komen. Het document is dus eerder pijnlijk voor Google dan vernieuwend. 

Wat nu?

Tsja weinig… Mijn advies zou zijn: vergeet dit document en ga verder met goede content maken, focus je op de klant en zorg ervoor dat de content die je produceert waarde toevoegt aan het web en aan het leven van je gewenste klant. Als iets blijkt uit de documentatie van Google is dat user signals enorm belangrijk zijn en dat je je dus vooral daarop moet focussen. 

Training: van SEO naar Organic Marketing

Nog nooit veranderde er zoveel in SEO als de afgelopen periode. De index puilt uit, allemaal hebben we dezelfde middelmatige (en onderling vervangbare) content gemaakt. De eisen van Google gaan omhoog en daarmee ook de prijs van de content die we maken. Als we dan bekijken dat we mogelijk steeds meer verkeer gaan verliezen, dan moet je jezelf afvragen wat je aan het doen bent. 

Hoe overleef je in een tijd waarin SEO-verkeer onder druk staat en de eisen van Google omhoog gaan? Door een complete mindset shift: transformeren van SEO naar Organic Marketing.

Expert based content maken tijdens SEO-training

Lees verder

We zitten in een soort clusterfuck als we kijken naar content: iedereen maakt het. Gedicteerd door de social algoritmes, maken we ook nog allemaal min of meer hetzelfde. Voor SEO baseren we onze content op keywords, waardoor ook de inhoud nog eens enorm op elkaar lijkt. Over AI en zero click marketing hebben we het nog maar niet. Hoe ga je om content en deze clusterfucks? En waarom is paradoxaal denken de oplossing?