Duplicate content: wanneer is het uniek genoeg?

Logo Chantalsmink.nl
Duplicate content is een hot topic binnen SEO. Er wordt ook enorm veel over gezegd en geschreven, maar er gaan ook veel indianenverhalen over rond. Kan en zal Google je echt bestraffen voor duplicate content? Wat is het eigenlijk? Hoe los je het op en misschien wel de belangrijkste vraag: wanneer is je content uniek genoeg om niet als duplicate gezien te worden?

Wat is duplicate content?

Duplicate content heb je als je dezelfde content op meerdere URL’s hebt staan. Stel: je hebt twee websites en hebt op beide websites dezelfde informatie gepubliceerd, dan is er in principe sprake van duplicate content.

Is duplicate content een probleem?

Dat ligt er een beetje aan wat de oorzaak van de duplicate content is.

Mogelijke oorzaak 1: duplicate content kan per ongeluk ontstaan, bijvoorbeeld door (verkeerd) gebruik van filters of paginering op je website. Je krijgt dan per ongeluk meerdere pagina’s die wel heel erg op elkaar lijken:

website.nl/sportschoenen
website.nl/sportschoenen?page=1
website.nl/sportschoenen?page=2

Dit is eigenlijk geen probleem (meer), Google snapt wat hier gebeurt en dit vormt waarschijnlijk geen probleem voor je SEO-prestaties.

Mogelijke oorzaak 2: het kan ook zijn dat je met opzet duplicate content aan het creëren bent, bijvoorbeeld omdat je voor verschillende zoekopdrachten relevant wil zijn en telkens min of meer dezelfde content maakt:

website.nl/vakantie-kreta
website.nl/zonvakantie-kreta
website.nl/zomervakantie-kreta

In dit voorbeeld is de kans heel groot dat je op elke pagina dezelfde content zult publiceren: duplicate content.

Mogelijke oorzaak 3: een andere oorzaak kan zijn dat jouw bedrijf vestigingen heeft en elke vestiging bepaalde (dezelfde) content wil delen. Denk aan een dienstverlenend bedrijf waarbij franchisers elk hun eigen vestiging hebben. Als alle franchisers hetzelfde artikel willen delen over ontwikkelingen in de markt dan is er ook sprake van duplicate content.

Mogelijke oorzaak 4: je hebt duplicate content tussen talen. Als jij een website hebt voor België en een voor Nederland en je publiceert hierop dezelfde content, dan is er in principe ook sprake van duplicate content. Op zich snapt Google doorgaans wel dat de ene website voor Nederland is en de andere voor België als je dit aangeeft in bijvoorbeeld de URL (website.nl vs website.be) je zou ook kunnen kiezen om hreflangs toe te voegen. Dit is een stukje code waarmee je aangeeft welke content voor Nederland is en welke voor België. Helaas zijn beide oplossingen niet (meer) waterdicht en neemt Google regelmatig een beslissing waar jij als website-eigenaar niet blij van wordt.

Bestraft Google duplicate content?

Nee in principe bestraft Google duplicate content niet, tenzij er sprake is van kwade wil, bijvoorbeeld het manipuleren van de resultaten en rankings:

Google bestraft duplicate content alleen als er sprake is van opzet en het doel om de rankings te manipuleren

Wat is het echte probleem met duplicate content?

Het échte probleem met duplicate content is dat Google zelf zal bepalen welke van de pagina’s getoond wordt. Denk nog even terug aan die franchisers die allemaal hetzelfde nieuwsbericht willen delen; Google zal niet gauw meerdere keren dezelfde content willen laten zien als mensen in Google zoeken naar ‘ontwikkelingen in x’. Dat betekent dat Google dus keuzes moet maken: Google gaat nu zelf besluiten welke van de pagina’s met dezelfde content getoond wordt. Het kan nu zijn dat de door Google gemaakte keuze niet jouw keuze is. Dan heb je pech.

Hoe kun je duplicate content oplossen?

Als je er grip op wilt hebben wat Google laat zien, dan zul je dit moeten oplossen. Een optie is om bij Google aan te geven welke pagina de voorkeur heeft door middel van een canonical tag, dit klinkt wat technisch maar het valt mee. Met een canonical tag geef je aan dat pagina A en B duplicate zijn en vraag je Google of ze pagina A willen laten zien. De meeste CMS’en hebben standaard functionaliteit om dit in te voeren. Let op! met een canonical tag mag Google beslissen een andere pagina te laten zien dan door jou aangegeven, de canonical tag is dus geen ‘dwingend’ middel maar je hebt het probleem wel netjes “opgelost” voor Google.

Een andere oplossing is om de duplicate content daadwerkelijk op te lossen. In het geval van het voorbeeld rondom ‘vakantie kreta’ kun je dat doen door deze 3 pagina’s samen te voegen tot 1 goed, compleet verhaal over Kreta of écht 3 unieke pagina’s te maken door echt andere informatie aan te bieden. Waarschijnlijk vraag jij je nu af wanneer de drie pagina’s dan uniek genoeg zijn?

Wanneer is duplicate content uniek genoeg?

Als je meerdere pagina’s hebt over hetzelfde onderwerp en je wil ze allemaal houden dan kom je al snel uit op de vraag: wanneer is mijn content uniek genoeg om ze naast elkaar te kunnen laten bestaan?

We gaan even verder met die drie pagina’s over Kreta. De enige reden waarom je ze allemaal wilt hebben, is SEO. Toch? (Geef maar eerlijk toe!). Je wilt gevonden worden op ‘zomervakantie Kreta’, ‘zonvakantie Kreta’ en ‘vakantie Kreta’ en om dat af te dwingen heb je drie pagina’s waarop je eigenlijk hetzelfde vertelt over Kreta, wellicht in andere woorden, maar je hebt elke pagina geoptimaliseerd voor een ander keyword.

Vroeger was dit doorgaans voldoende om het duplicate content probleem op te lossen: je herschreef de content in je eigen woorden, maakte nieuwe zinnen of je liet AI wat “nieuws” genereren et voilá opgelost.
Tegenwoordig zien we echter dat dit niet altijd meer voldoende lijkt te zijn (gelukkig ook maar als je het mij vraagt) en lijkt Google hogere te stellen aan duplicate content.

2022: indexatieproblemen als gevolg van duplicate content?

Zoals gezegd lijkt Google steeds kritischer te worden over duplicate content. Het herschrijven van informatie in andere woorden is natuurlijk ook gewoon het voor de gek houden van Google. Je voegt niets toe aan het web, je maakt geen nieuwe informatie en deelt geen nieuwe inzichten. Waarom zou Google dit allemaal maar moeten indexeren? Google zegt zelf al dat het wel in feite oneindig is en dat het onmogelijk is om alles te indexeren, daarom zullen ze steeds hogere eisen moeten stellen aan wat de moeite van het crawlen en indexeren waard is. In het blogartikel ‘waarom indexeert Google mijn pagina niet‘ ga ik dieper op deze kwestie in.

Wat je hieruit op kunt maken is dat in de toekomst waarschijnlijk niet langer de oplossing is om steeds maar dezelfde content of informatie te blijven herkauwen. Je zult dus content moeten gaan maken die echt waarde toevoegt voor de gebruiker en voor Google.

Een voorbeeld: op dit moment heeft Google zo’n 1.390.000 pagina’s in de index over ‘recept appeltaart’. Heeft het zin om nog recept 1.390.001 te indexeren? Het lijkt mij niet. Je kunt dus beter zorgen dat jij zo’n autoriteit wordt op je vakgebied (YouTube-, TikTok of de volgende TV-kok) zodat Google jouw recept wél indexeert. Een andere oplossing is om bijzonder creatief te zijn. In plaats van recept 1.390.001 te schrijven kun je bijvoorbeeld ook verschillende recepten Appeltaart vergelijken en beoordelen welke het lekkerste is met een leuk of grappig filmpje erbij.

De toekomst van duplicate content?

Helaas weet ook IK niet zeker of het simpelweg herschrijven van informatie in je eigen woorden nog genoeg is om in de toekomst duplicate content te voorkomen, ik heb helaas geen lijntje met Google HQ.

Echter, op basis van wat ik nu zie gebeuren zou ik je aanraden om niet te kijken naar unieke woorden en zinnen maar naar unieke invalshoeken. We moeten het dus denk ik gaan hebben over het voorkomen van Duplicate Intentions in plaats van Duplicate Content.

Je doet dit door niet te herkauwen wat al op honderden of duizenden andere website geschreven is, maar wel door waarde toe te voegen aan het web. Een nieuwe visie, een nieuwe blik of nieuwe invalshoek. Probeer nu alvast de lat voor jezelf hoger te leggen en daar naar op zoek te gaan.

Voor de volledigheid

Het kan natuurlijk gebeuren dat je toch bepaalde informatie in je website wilt hebben die echt overal staat. Op mijn website leg ik bijvoorbeeld ook uit wat het belang is van SEO, wat SEO is en hoe content, links, techniek en structuur in verhouding tot elkaar staan. Dit valt voor mij onder hygiene content: je moet die informatie hebben op je website om compleet te zijn. Maar het is wel goed om te weten dat je deze informatie vooral maakt voord de gebruiker die al op je website zit en die jij een volledig beeld wil geven. Je moet die informatie niet maken omdat je hoopt erop gevonden te worden in Google/SEO. Dat mag je wel verwachten als jij de Coolblue bent in jouw markt (dan heb je voldoende autoriteit, zie het voorbeeld van de TV-kok) maar niet als jij gewoon een van de zovelen bent.

Wil jij meer weten over hoe je relevante content maakt?

In mijn boek ‘Handboek SEO & Contentstrategie‘ ga ik uitgebreid in op alle ontwikkelingen in Google en wat dit betekent voor de manier waarop we SEO doen. Het is hoogtijd om je niet langer te focussen op keywords en content voor SEO. Je zult nu de omslag moeten maken naar content voor je gebruiker.
Kijk dus verder dan alle trucjes en short cuts die je kent en ga jezelf onderscheiden ten opzichte van de rest.

Wil je weten hoe je dit moet aanpakken? Bestel dan nu het Handboek SEO & Contentstrategie om je op weg te helpen.
Het boek wordt getipt door SEO Benelux als must-read.

Handboek SEO & Contenstrategie

Lees verder

Op 8 februari houdt Google een live conferentie over AI. Het vermoeden is dat ze hun chatbot gaan aankondigen: het antwoord op ChatGPT. Als dat zo is, is dit mogelijk revolutionair. In dit blog houd ik alle ontwikkelingen en mijn hersenspinsels voor je bij.