---
title: noindex / nofollow
slug: noindex-nofollow
canonical_url: https://www.geoquality.ai/glossar/noindex-nofollow
md_url: https://www.geoquality.ai/glossar/noindex-nofollow.md
language: de
last_modified: 2026-05-07T00:00:00+00:00
related_terms: [canonical-tag, duplicate-content, indexierung, robots-txt, thin-content]
content_hash: 99281740d0ca4750
license: CC BY 4.0
author: Marco Biner (geoquality.ai)
schema_type: DefinedTerm
---

# noindex / nofollow

noindex und nofollow sind Crawler-Direktiven, die Suchmaschinen anweisen, eine Page nicht in den Index aufzunehmen (noindex) oder den Links auf der Page nicht zu folgen (nofollow). Im KI-Zeitalter 2026 sind sie wichtige Werkzeuge für Index-Hygiene und Authority-Steuerung — insbesondere bei strukturell unvermeidbarem Thin Content.

## Erläuterung

noindex und nofollow sind Crawler-Direktiven, die seit den frühen 2000er-Jahren im Web-Standard etabliert sind. Sie werden typisch über meta name='robots' -Tags oder HTTP-Header kommuniziert. noindex weist Crawler an, die Page zu crawlen aber nicht in den Index aufzunehmen — die Page bleibt für Google-Suche, ChatGPT-Search und andere Such-Plattformen unsichtbar. nofollow weist Crawler an, den Links auf der Page nicht zu folgen — Authority-Transport via Link wird unterbrochen. Vier typische Anwendungsfälle dominieren 2026. Erstens noindex für Tag-Archive und Pagination : strukturell duplizierte Seiten mit niedrigem Information Gain. Zweitens noindex für interne Such-Ergebnisse : Suchergebnis-Seiten der Site sind kein zitierfähiger Inhalt und sollten nicht im Index landen. Drittens noindex für Login- und Admin-Bereiche : sensible Bereiche, die nicht öffentlich gefunden werden sollen. Viertens nofollow für User-Generated-Content-Links : Kommentar-Sektionen, Forum-Posts mit User-Links — verhindert Authority-Transfer auf Spam-Quellen. Drei Implementierungs-Methoden sind 2026 verbreitet. Erstens Meta-Robots-Tag : <meta name='robots' content='noindex,nofollow'> im HTML-Head. Standard-Methode für Page-Level-Direktiven. Zweitens X-Robots-Tag-HTTP-Header : X-Robots-Tag: noindex als HTTP-Response-Header. Funktioniert auch für Nicht-HTML-Inhalte (PDFs, Bilder). Drittens rel-Attribut auf Links : <a href='...' rel='nofollow'> für spezifische Links. Plus Erweiterungen seit 2019: rel='ugc' für User-Generated-Content, rel='sponsored' für bezahlte Links. Strategisch ist die korrekte Anwendung von noindex kritisch. Häufige Fehler: Erstens versehentlich die Hauptseiten noindex setzen — typisch durch WordPress-Plugin-Konflikte oder fehlerhafte Migration. Zweitens noindex auf Pillar-Pages , weil fälschlich als 'thin' erkannt — verschenkt strategische Sichtbarkeit. Drittens noindex statt 301-Redirect bei alten URLs — die Authority alter Backlinks geht verloren statt auf neue URLs übertragen zu werden. Quartalsweise Audits via Google Search Console Index-Coverage-Report identifizieren versehentliche noindex-Direktiven. Wichtig zur Abgrenzung: noindex ist nicht robots.txt-Disallow . robots.txt-Disallow blockiert das Crawling — die Page wird nicht abgerufen, also nicht in den Index aufgenommen, aber Authority wird nicht transferiert. noindex erlaubt Crawling, verhindert nur Indexierung . Beide werden oft verwechselt; korrekt ist: noindex für Pages mit Links (Authority kann fliessen), Disallow für strukturell zu blockierende Bereiche (z.B. Admin-Login mit Passwort-Schutz).

## Praxisbeispiel

noindex/nofollow-Anwendungs-Beispiele: # 1. Meta-Robots-Tag (Page-Level) <meta name='robots' content='noindex'> # nur noindex <meta name='robots' content='noindex,follow'> # noindex aber follow <meta name='robots' content='noindex,nofollow'> # beides # 2. X-Robots-Tag HTTP-Header (auch für PDFs) X-Robots-Tag: noindex X-Robots-Tag: noindex, nofollow # 3. rel-Attribut auf Links (Link-Level) <a href='https://example.com' rel='nofollow'>Link</a> <a href='https://example.com' rel='ugc'>User-Link</a> <a href='https://example.com' rel='sponsored'>Anzeige</a> # 4. Typische Anwendungs-Fälle noindex auf: - /tag/* (Tag-Archive) - /search?q=* (interne Suchergebnisse) - /admin/* (Admin-Bereich) - /print/* (Druck-Versionen) - /page/2, /page/3 (Pagination ab Seite 2) nofollow auf: - User-Kommentar-Links (rel='ugc') - Bezahlte Werbung (rel='sponsored') - Login-Seiten (verhindert Crawler-Verwirrung) # 5. Verifikation Google Search Console -> Index Coverage: 'Excluded by noindex tag' Filter zeigt alle Pages mit aktivem noindex. Prüfen: sind das wirklich alle gewünschten Pages? Sind versehentlich Hauptseiten gelistet? # 6. Haeufige Fehler vermeiden FALSCH: noindex auf Pillar-Page (verschenkt Sichtbarkeit) FALSCH: robots.txt-Disallow statt noindex (blockiert Crawl) FALSCH: noindex auf alte URLs statt 301-Redirect (verschenkt Authority-Transport) noindex/nofollow sind 2026 Standard-Werkzeuge der Index-Hygiene. Aufwand bei korrekter Anwendung minimal — bei fehlerhafter Anwendung erheblicher Sichtbarkeits-Verlust.

## Häufige Fehler

- Versehentlich Hauptseiten noindex setzen — typisch durch WordPress-Plugin-Konflikte oder fehlerhafte Migration.
- noindex statt robots.txt-Disallow nutzen oder umgekehrt — beide haben unterschiedliche Funktionen, oft verwechselt.
- noindex auf alten URLs statt 301-Redirect — verschenkt Authority-Transport von alten Backlinks.
- nofollow auf alle externen Links pauschal anwenden — schwächt Outbound-Authority-Signale, die im KI-Zeitalter Trust-Signale sind.
- noindex/nofollow-Audit nur einmalig durchführen — fehlerhafte Direktiven schleichen sich oft durch Plugin-Updates ein.

## Best Practices

- Setze noindex auf strukturell unvermeidbare Thin-Content-Pages (Tag-Archive, Pagination, interne Suche).
- Nutze rel='ugc' für User-Generated-Content-Links und rel='sponsored' für bezahlte Werbung.
- Implementiere X-Robots-Tag-Header für Nicht-HTML-Inhalte (PDFs, Bilder).
- Prüfe quartalsweise Google Search Console 'Excluded by noindex tag' auf versehentliche Direktiven.
- Verwende 301-Redirects statt noindex bei strukturellen URL-Änderungen.
- Behandle robots.txt-Disallow und noindex als separate Werkzeuge — beide haben unterschiedliche Funktionen.

## Fakten

- noindex und nofollow sind seit dem Robots-Exclusion-Standard der frühen 2000er-Jahre etabliert.
- Google führte 2019 die rel='ugc' und rel='sponsored' Erweiterungen als spezialisierte nofollow-Varianten ein.
- X-Robots-Tag-HTTP-Header funktioniert auch für Nicht-HTML-Inhalte wie PDFs, Bilder und Videos — wichtige Erweiterung gegenüber Meta-Robots-Tags.
- Im DACH-Raum 2026 haben schaetzungsweise 15-20% aller KMU-Sites versehentliche noindex-Direktiven auf strategischen Seiten — typisch durch WordPress-Plugin-Konflikte.
- Sites mit korrekter noindex-Hygiene auf Tag-Archiven und Pagination haben typisch 10-20% bessere Index-Coverage-Quote.
- Google Search Console 'Excluded by noindex tag'-Filter listet alle aktiven noindex-Direktiven — das wichtigste Verifikations-Tool.

## FAQ

### Was sind noindex und nofollow?

Crawler-Direktiven. noindex weist Suchmaschinen an, eine Page zu crawlen aber nicht in den Index aufzunehmen — die Page bleibt für Google, ChatGPT-Search etc. unsichtbar. nofollow weist an, den Links auf der Page nicht zu folgen — Authority-Transport via Link wird unterbrochen.

### Wann sollte ich noindex setzen?

Vier typische Fälle: erstens Tag-Archive und Pagination (strukturell duplizierte Seiten). Zweitens interne Such-Ergebnisse (kein zitierfaehiger Inhalt). Drittens Login- und Admin-Bereiche (sensibel). Viertens spezifische strukturelle Thin-Content-Pages, die nicht via Konsolidierung loesbar sind.

### Was ist der Unterschied zwischen noindex und robots.txt-Disallow?

noindex erlaubt Crawling, verhindert nur Indexierung — Authority kann via Links fliessen. robots.txt-Disallow blockiert das Crawling vollständig — Page wird nicht abgerufen, Authority wird nicht transferiert. Typischer Fehler: beide werden verwechselt. Korrekt: noindex für Pages mit Links, Disallow für strukturell zu blockierende Bereiche.

### Was ist rel='ugc' und rel='sponsored'?

Spezialisierte nofollow-Varianten, die Google 2019 einfuehrte. rel='ugc' (User-Generated-Content) für User-Kommentare und Forum-Posts. rel='sponsored' für bezahlte Werbung und Affiliate-Links. Praezisere Signale als pauschales nofollow — Google interpretiert sie kontextuell.

### Wie verifiziere ich aktive noindex-Direktiven?

Google Search Console -> Index Coverage -> 'Excluded by noindex tag'-Filter listet alle Pages mit aktivem noindex. Quartalsweise prüfen: sind das wirklich alle gewuenschten Pages? Sind versehentlich Hauptseiten gelistet? Plus URL-Inspection-Tool für einzelne URLs.

### Soll ich nofollow auf alle externen Links setzen?

Nein, schwaecht Outbound-Authority-Signale. Im KI-Zeitalter sind Outbound-Links zu Authority-Quellen Trust-Signale, die LLMs positiv werten. Empfehlung: nofollow nur auf User-Generated-Content (rel='ugc'), bezahlte Werbung (rel='sponsored') und untrusted Links. Authority-Quellen normal verlinken (ohne nofollow).

## Experten-Definition

noindex und nofollow sind 2026 Standard-Hygiene, aber haeufige Fehlerquellen. Bei Klienten finde ich regelmässig versehentliche noindex-Direktiven auf strategischen Seiten — durch Plugin-Updates, fehlerhafte Migrationen oder Copy-Paste-Fehler in WordPress-Templates. Mein Standard-Audit prueft Google Search Console 'Excluded by noindex tag'-Filter quartalsweise und gleicht mit der gewuenschten noindex-Liste ab. 30 Minuten Audit-Aufwand. Wirkung: verhindert versehentliche Sichtbarkeits-Verluste, oft die billigste GEO-Massnahme überhaupt.

## Verwandte Begriffe

- [Canonical Tag](https://www.geoquality.ai/glossar/canonical-tag.md) — Der Canonical Tag ist ein <link rel="canonical">-Element im HTML-Head, das die kanonische URL einer Seite definiert — verhindert Duplicate-Content-Probleme und konsolidiert Authority-Signale auf eine einzige Hauptversion.
- [Duplicate Content](https://www.geoquality.ai/glossar/duplicate-content.md) — Duplicate Content bezeichnet identische oder nahezu identische Inhalte, die unter mehreren URLs erreichbar sind — entweder innerhalb derselben Domain (interne Duplikate) oder über mehrere Domains hinweg (externe Duplikate). Im KI-Zeitalter 2026 wirkt sich Duplicate Content doppelt negativ aus: klassisches Ranking leidet und LLM-Trainings-Pipelines filtern duplizierte Inhalte aktiv.
- [Indexierung](https://www.geoquality.ai/glossar/indexierung.md) — Indexierung bezeichnet die Speicherung gecrawlter Web-Inhalte in einer durchsuchbaren Datenbank — bei Google im Search Index, bei KI-Plattformen in plattform-spezifischen Indizes (ChatGPT-Search-Index, Perplexity-Index). Indexierung ist der nachgelagerte Schritt nach Crawling und Voraussetzung dafür, dass eine Site überhaupt in Suchergebnissen oder KI-Antworten erscheint.
- [robots.txt](https://www.geoquality.ai/glossar/robots-txt.md) — robots.txt ist eine Textdatei im Root-Verzeichnis einer Website, die Crawlern Zugriffsregeln signalisiert — für GEO entscheidend, weil sie als erstes Hindernis darüber entscheidet, ob KI-Crawler die Site überhaupt indexieren dürfen.
- [Thin Content](https://www.geoquality.ai/glossar/thin-content.md) — Thin Content bezeichnet Web-Inhalte mit zu wenig Substanz, Tiefe oder Originalität — typisch unter 300 Wörtern, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen. Google's Panda-Update 2011 etablierte Thin Content als Ranking-Negativfaktor; im KI-Zeitalter wird es zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert.

## Quelle und Zitation

- HTML-Original: https://www.geoquality.ai/glossar/noindex-nofollow
- Lizenz: CC BY 4.0
- Zitiervorschlag: "noindex / nofollow (geoquality.ai Glossar, Biner 2026)"
