Technische oplossing voor duplicate content problemen

Duplicate content is een vervelend probleem dat je website flink kan schaden. Zoekmachines, zoals Google, houden er niet van als dezelfde content op meerdere plekken te vinden is. Dit kan leiden tot lagere rankings en minder verkeer naar je site. Maar geen paniek, want met de juiste technische aanpak los je deze problemen vaak effectief op. Laten we eens kijken hoe je dat aanpakt.

Wat is duplicate content precies?

Duplicate content betekent simpelweg dat identieke of zeer vergelijkbare content op verschillende URL’s staat. Dit kan per ongeluk gebeuren, maar ook bewust. Denk aan productpagina’s die op meerdere manieren bereikbaar zijn, of blogposts die ook op een andere taalversie van je site staan. Zoekmachines zien dit als ongewenst gedrag, omdat het hun taak om de meest relevante content te tonen bemoeilijkt. Ze weten dan niet welke versie ze moeten indexeren en ranken, en dat kan leiden tot een “straf” in de zoekresultaten.

Technische oplossingen voor duplicate content

Gelukkig zijn er verschillende technische methoden om duplicate content aan te pakken. Het is belangrijk om te weten waar je problemen vandaan komen, zodat je de juiste oplossing kunt toepassen.

1. Canonical tags: de officiële oplossing

De canonical tag is een HTML-attribuut dat je in de `

` sectie van je webpagina plaatst. Hiermee geef je aan welke versie van een pagina de “originele” of “master” versie is. Stel, je hebt dezelfde productinformatie op bijvoorbeeld `jouwsite.nl/product/blauwe-schoenen` en `jouwsite.nl/kleding/schoenen/blauwe-schoenen`. Met een canonical tag op de tweede URL die verwijst naar de eerste, vertel je zoekmachines: “Hé, deze content is eigenlijk hetzelfde, maar de versie op `jouwsite.nl/product/blauwe-schoenen` is de officiële.”

Je plaatst dit in de HTML-code van de pagina die je wilt laten verwijzen naar de masterversie:

Dit is een van de meest effectieve manieren om duplicate content te voorkomen, omdat je de zoekmachines direct de juiste instructie geeft.

2. 301 redirects: de doorverwijzer

Een 301 redirect stuurt gebruikers en zoekmachines permanent van de ene URL naar een andere. Dit is ideaal als je een pagina hebt die op meerdere manieren bereikbaar is, maar je wilt dat één specifieke URL de hoofdversie wordt. Bijvoorbeeld, als je product ook bereikbaar is via `jouwsite.nl/product/blauwe-schoenen?kleur=blauw`, maar je wilt dat alleen `jouwsite.nl/product/blauwe-schoenen` getoond wordt.

Met een 301 redirect wordt al het “link juice” (de autoriteit die een link doorgeeft) van de oude URL overgezet naar de nieuwe. Dit is dus niet alleen goed voor het voorkomen van duplicate content, maar ook voor je SEO-score. Een 301 redirect stel je meestal in op de server (via `.htaccess` op Apache servers of via de webhosting-omgeving).

3. Hreflang tags: voor meertalige sites

Als je een website in meerdere talen hebt, is de kans groot dat je met duplicate content te maken krijgt. Denk aan een Nederlandse en een Engelse versie van dezelfde productpagina. Hier komen hreflang tags om de hoek kijken. Deze tags vertellen zoekmachines welke versie van een pagina bedoeld is voor welk land of welke taal.

Bijvoorbeeld, op de Nederlandse versie van een pagina plaats je:

En op de Engelse versie plaats je de omgekeerde verwijzingen.

Hiermee voorkom je dat de Nederlandse en Engelse content als duplicate worden gezien, en zorg je ervoor dat de juiste versie aan de juiste gebruiker wordt getoond.

4. Parameters uitsluiten in Google Search Console

Websites gebruiken soms URL-parameters om informatie door te geven, zoals sorteeropties of filterinstellingen. Dit kan leiden tot veel vergelijkbare URL’s. Een voorbeeld is `jouwsite.nl/producten?sorteer=prijs` en `jouwsite.nl/producten?sorteer=naam`. Als de content op deze pagina’s identiek is, is dit duplicate content.

Met de functie “URL-parameters” in Google Search Console kun je Google vertellen hoe het met deze parameters moet omgaan. Je kunt aangeven dat een bepaalde parameter genegeerd moet worden, of dat de pagina met die parameter op een specifieke manier behandeld moet worden. Dit is een krachtige tool om zoekmachines te helpen de canonieke versie te herkennen.

5. Robots.txt: voorzichtig mee zijn

De robots.txt file is een bestand op je server dat zoekmachines vertelt welke delen van je website ze wel of niet mogen crawlen. Je kunt hiermee dus ook voorkomen dat zoekmachines bepaalde pagina’s indexeren. Echter, het is geen ideale oplossing voor duplicate content.

Als je een pagina met robots.txt blokkeert, kan Google die pagina nog steeds zien als hij via een externe link wordt bereikt. Zoekmachines weten dan niet dat de content gedupliceerd is, en het lost het probleem niet structureel op. Gebruik robots.txt dus liever om niet-geïndexeerde content, zoals interne zoekresultaten of beheerderspagina’s, af te schermen.

6. Noindex tag: de laatste redmiddel

De noindex tag is een meta-tag die je kunt toevoegen aan de `

` van een specifieke pagina. Hiermee geef je zoekmachines expliciet de instructie om deze pagina niet te indexeren. Dit is nuttig voor pagina’s die wel toegankelijk moeten zijn voor gebruikers, maar die je niet in de zoekresultaten wilt hebben. Denk hierbij aan printversies van je content of interne zoekresultatenpagina’s.

De code ziet er als volgt uit:

Dit is wel een iets drastischere maatregel dan een canonical tag, omdat de pagina volledig uit de zoekresultaten wordt gehouden. Gebruik dit dus alleen als je zeker weet dat de content niet geïndexeerd mag worden.

Het belang van een goede analyse

Voordat je technische oplossingen implementeert, is het cruciaal om eerst een grondige analyse te doen. Gebruik tools zoals Google Search Console of gespecialiseerde SEO-software om te achterhalen welke pagina’s duplicate content bevatten en waarom. Soms is het een eenvoudig technisch foutje, soms zit het dieper in de structuur van je website.

Identificeer de bronnen van de duplicate content. Is het door:

Zonder www vs. met www
HTTP vs. HTTPS
Indexering van paginaparameters
Verschillende paden naar dezelfde content
Printvriendelijke versies
Productvarianten (kleur, maat)

Pas vervolgens de meest geschikte technische oplossing toe. Vaak is een combinatie van methoden het meest effectief.

Voorbeelden van duplicate content situaties

Om dit duidelijker te maken, hieronder een tabel met veelvoorkomende situaties en hoe je ze technisch aanpakt.

Type duplicate content	Voorbeeld	Technische oplossing	Voordeel
Zonder www vs. met www	`jouwsite.nl` en `www.jouwsite.nl`	Canonical tag op de ene versie verwijzend naar de andere, of een 301 redirect van de ene naar de andere.	Zorgt voor één consistente URL, verhoogt autoriteit.
HTTP vs. HTTPS	`http://jouwsite.nl` en `https://jouwsite.nl`	Implementeer een SSL-certificaat en stel een 301 redirect in van HTTP naar HTTPS.	Verbetert beveiliging en zorgt voor één versie.
Paginaparameters	`jouwsite.nl/producten?sorteer=prijs` en `jouwsite.nl/producten?sorteer=naam`	Canonical tags die verwijzen naar de “basis” productpagina of gebruik de URL-parameter tool in Google Search Console.	Voorkomt indexering van onnodige varianten.
Meertalige content	Nederlandse en Engelse versie van een productpagina	Implementeer hreflang tags correct op alle versies.	Zorgt voor de juiste weergave per taal/regio en voorkomt duplicate content problemen.
Printvriendelijke versies	Een speciale printversie van een blogpost	Gebruik de `noindex` meta-tag op de printversie, of een canonical tag naar de originele pagina.	Houdt zoekresultaten schoon en voorkomt indexering van onnodige versies.

Het belang van testen na implementatie

Na het toepassen van technische oplossingen is het essentieel om te testen. Controleer of de canonical tags correct worden weergegeven, of de 301 redirects werken zoals bedoeld, en of hreflang tags geen fouten bevatten. Gebruik tools zoals Google Search Console om te zien of Google de veranderingen oppikt en of er geen nieuwe fouten ontstaan.

Daarnaast is het goed om de indexeringsstatus van je pagina’s in de gaten te houden. Als je merkt dat pagina’s die je eerder hebt aangepakt nog steeds dubbel worden geïndexeerd, is het tijd om de implementatie opnieuw te controleren.

Hoe los je duplicate content problemen technisch op?

Duplicate content kan een complexe uitdaging zijn, maar met de juiste technische aanpak is het goed te beheersen. Door het strategisch inzetten van canonical tags, 301 redirects, hreflang tags en het correct configureren van tools zoals Google Search Console, kun je ervoor zorgen dat zoekmachines je content correct indexeren en je website de juiste autoriteit krijgt. Het is altijd belangrijk om een grondige analyse te doen van de oorzaken van duplicate content en de gekozen oplossing zorgvuldig te testen na implementatie om de beste resultaten te behalen.