Een canonical tag (ook wel rel=canonical genoemd) is een stukje HTML-code dat de hoofdversie van een aantal dubbele of vergelijkbare pagina’s definieert. Wanneer je op jouw website meerdere pagina’s hebt die sterk op elkaar lijken, is het dus verstandig om een canonical tag in te stellen. Hiermee laat je aan de crawler van de zoekmachines weten welke versie de belangrijkste is en dus geïndexeerd moet worden. Tegelijkertijd voorkom je hiermee ‘duplicate content’. 

Waarom canonical tags belangrijk zijn en hoe je deze kunt implementeren in jouw website, lees je in dit blog.

Het belang van correct geïmplementeerde canonical tags

Wanneer de crawler van de zoekmachine langskomt om meerdere pagina’s die sterk op elkaar lijken te crawlen – en er geen canonical tag ingesteld is – is het voor de crawler lastig om te beoordelen wat de hoofdpagina is en welke weergegeven moet worden in de SERP (search engine results page). Dit heeft op zijn beurt nadelige gevolgen voor je SEO

Daarnaast zijn er nog twee andere belangrijke problemen die zich voor kunnen doen bij incorrect gebruik van de canonical tag. Ten eerste loop je het risico dat het ‘crawl budget’ opraakt (met name bij grote webshops is dit belangrijk). Hierdoor kan het gebeuren dat niet alle pagina’s gecrawld worden en daardoor niet weergegeven worden in de SERP. Ten tweede is een groot risico dat de zoekmachine zelf besluit welke URL weergegeven wordt in de SERP. Als dit gebeurt kan het zomaar zijn dat dit de verkeerde URL is. Correct gebruik van canonical tags helpt al deze problemen te voorkomen.

Het ontstaan van duplicate content

Duplicate content komt een stuk vaker voor dan je in eerste instantie zou denken. Om goed te begrijpen in welke situaties het belangrijk is om een canonical tag in te stellen, geven we een aantal voorbeelden over de manier waarop dit ontstaat.

  1. Gekopieerde content
    Een potentieel probleem dat met name vaak terugkomt bij e-commerce websites, heeft betrekking op de productinformatie. Wanneer veel verschillende webshops hetzelfde product verkopen, en gebruik maken van de standaardtekst die is geschreven door de fabrikant, resulteert dit erin dat op meerdere websites dezelfde content (ofwel duplicate content) staat.
  2. HTTP/HTTPs & met of zonder WWW
    Wanneer jouw website afzonderlijke versies heeft, zoals ‘www.hemdvoorhem.nl’ en ‘hemdvoorhem.nl’ die dezelfde content op de pagina hebben staan, dan is er sprake van duplicate content. Hetzelfde geldt voor http:// en https://. 
  3. Variaties in de URL
    URL-parameters (zoals bij filterpagina’s, analytics en clicks-tracking) kunnen problemen veroorzaken. Een goed voorbeeld hiervan bij de webshop Hemdvoorhem.nl lees je verderop in dit blog.

How to: canonical tag implementeren

Er zijn vijf verschillende manieren om canonieke URL’s op te geven, namelijk:

  1. HTML-tag (rel=canonical)
  2. Sitemap
  3. 301-redirect
  4. Interne links
  5. HTTP-header

Verreweg de meest gebruikte methode voor het instellen van de canonical tag, loopt via de HTML-tag. Hieronder lees je voor het veel gebruikte CMS WordPress hoe deze geïmplementeerd kan worden.

Canonical tag implementeren in WordPress

Het instellen van een canonical tag kan bij WordPress heel gemakkelijk met behulp van de Yoast SEO plugin. Handig: zelfverwijzende canonical tags worden automatisch toegevoegd door deze plugin.

Onderaan iedere pagina – bij het Yoast SEO menu – vind je onder het kopje ‘geavanceerd’ het veld om de canonical tag in op te geven.

Controleren of de canonical tag correct geïmplementeerd is

Om te controleren of de canonical tag correct staat ingesteld, gebruiken we als voorbeeld de categorie Poloshirt van de webshop Hemdvoorhem.nl. 

De URL van de hoofdpagina is: https://www.hemdvoorhem.nl/poloshirts

Om te controleren of de canonical tags voor deze webshop correct zijn ingesteld, doorlopen we het onderstaande stappenplan:

  1. Controleer of de canonical tag van de hoofdpagina naar zichzelf verwijst
    Je kunt hiervoor bijvoorbeeld gebruik maken van de Google Chrome extensie ‘Inspect Canonical’ om het in één oogopslag te kunnen zien. Als alternatief kun je ook heel gemakkelijk de paginabron weergeven (control + u) en zoeken op ‘canonical’. Wanneer de hoofdpagina een rel=canonical heeft die naar zichzelf verwijst, staat deze correct ingesteld.
    In dit geval ziet de canonical tag er als volgt uit: <link rel=”canonical” href=”https://www.hemdvoorhem.nl/poloshirts” />
  2. Open een filterpagina en controleer of deze verwijst naar de hoofdpagina
    Aangezien we willen dat alleen de hoofdpagina wordt geïndexeerd en dus gevonden wordt in Google, is het belangrijk dat de filterpagina’s worden voorzien van een canonical tag die verwijst naar de hoofdpagina (in dit geval dus: https://www.hemdvoorhem.nl/poloshirts). Om dit te controleren kun je bijvoorbeeld naar de 2e pagina gaan met producten, of een andere willekeurig filter toepassen zoals de ‘strak getailleerde pasvorm’.
    In dit voorbeeld gaan we naar pagina 2, waardoor de URL er als volgt uit komt te zien: https://www.hemdvoorhem.nl/poloshirts?sort=orderby-asc&ppage=72&page=2
    Om te controleren of deze filterpagina een canonical tag heeft die naar de hoofdpagina verwijst, duiken we opnieuw in de broncode van de pagina en zoeken we op ‘canonical’. We zien dat hier dezelfde tag staat ingesteld als in stap één, wat betekent dat deze goed staat.

Top 5 meest gemaakte fouten

Canonicalisering is een complex onderwerp, waardoor er veel misverstanden zijn over hoe het op de juiste wijze toegepast moet worden. Een top 5 van meest gemaakte fouten:

Fout #1: De gecanoniseerde URL blokkeren via de robots.txt

Wanneer een URL wordt geblokkeerd in de robots.txt, betekent het dat deze niet door Google gecrawld kan worden. Mocht er een canonical tag zijn toegevoegd aan deze pagina, betekent het dus dat Google deze tag niet kan lezen. Dit weerhoudt Google er vervolgens weer van om de opgebouwde linkwaarde door te geven van de niet-canonieke naar de canonieke pagina.

Fout #2: De gecanoniseerde URL instellen op ‘noindex’

Combineer nooit de ‘noindex’ en ‘rel=canonical’ tags, deze instructies zijn namelijk tegenstrijdig.

Goed om te weten: Google geeft meestal prioriteit aan canonical tags boven ‘no-index’. Als je niet wil dat een URL geïndexeerd en gecanoniseerd wordt, is het beter om een 301-redirect te gebruiken. 

Fout #3: Het instellen van een 4XX HTTP-statuscode voor de gecanoniseerde URL

Het instellen van een 4XX HTTP-statuscode voor de gecanoniseerde URL heeft hetzelfde effect als het gebruik van de ‘noindex-tag’, namelijk: Google kan deze canonical tag niet inzien, waardoor er geen linkwaarde wordt doorgegeven aan de canonieke versie.

Fout #4: Het instellen van meerdere rel=canonical tags

Wanneer je meerdere rel=canonical tags hebt ingesteld dan is de kans groot dat deze genegeerd worden door Google. Dit wordt meestal veroorzaakt doordat de tags op meerdere plekken zijn ingevoerd. Denk hierbij aan een plug-in, het thema of via JavaScript. 

Fout #5: Rel=canonical gebruiken in de <body>

Het is belangrijk dat rel=canonical alleen voorkomt in de <head> van de pagina. Komt deze voor in de <body>? Dan wordt deze genegeerd door Google.

Hulp nodig?

De specialisten van het online marketing bureau Blauwe Monsters hebben jarenlange ervaring met canonical tags en helpen je graag met jouw (technische) SEO of online marketing vraagstuk. Neem vandaag nog contact met ons op voor vrijblijvend advies.