---
title: Thin Content
slug: thin-content
canonical_url: https://www.geoquality.ai/glossar/thin-content
md_url: https://www.geoquality.ai/glossar/thin-content.md
language: de
last_modified: 2026-05-07T00:00:00+00:00
related_terms: [answer-capsule, crawling, indexierung, information-gain, topical-authority]
content_hash: 58b63af1bdb6ba3f
license: CC BY 4.0
author: Marco Biner (geoquality.ai)
schema_type: DefinedTerm
---

# Thin Content

Thin Content bezeichnet Web-Inhalte mit zu wenig Substanz, Tiefe oder Originalität — typisch unter 300 Wörtern, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen. Google's Panda-Update 2011 etablierte Thin Content als Ranking-Negativfaktor; im KI-Zeitalter wird es zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert.

## Erläuterung

Thin Content ist seit Google's Panda-Update im Februar 2011 ein etablierter Ranking-Negativ-Faktor. Das Konzept beschreibt Web-Inhalte, die zu wenig eigenständige Substanz bieten — entweder durch geringen Umfang, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen oder fehlende Original-Insights. Vier typische Thin-Content-Muster sind 2026 verbreitet: Erstens Affiliate-Stubs — kurze Produkt-Vorstellungen mit Affiliate-Links ohne eigenständige Tiefe. Zweitens Doorway-Pages — Seiten, die nur für SERP-Position erstellt wurden und User zu anderen Seiten weiterleiten. Drittens automatisch generierte Inhalte ohne menschliche Substanz — typisch LLM-Massen-Output ohne Eigenleistung. Viertens duplizierter Content — Inhalte, die von anderen Quellen kopiert oder leicht modifiziert wurden. Im KI-Zeitalter 2026 wird Thin Content zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert. Anthropic, OpenAI und Google publizieren seit 2024 explizite Quality-Filter für ihre Trainings-Korpora — Thin Content wird ausgeschlossen, was die langfristige Trainings-Repräsentation der Site reduziert. Konsequenz: eine Site mit hohem Anteil Thin Content verliert nicht nur klassische SEO -Sichtbarkeit (Google-Ranking-Verluste), sondern auch zukünftige KI-Trainings-Coverage. Doppelter Schaden über 12-24 Monate. Drei Thin-Content-Indikatoren sind 2026 messbar. Erstens Wort-Anzahl : Inhalte unter 300 Wörtern werden oft als Thin Content gewertet — Ausnahme sind FAQ- Capsules mit 40-80 Wörtern, die strukturell als Antwort-Bausteine akzeptiert sind. Zweitens Original-Inhalts-Anteil : Texte mit über 70% Reproduktion von Drittquellen sind problematisch. Drittens Information Gain : Inhalte ohne eigene Daten, eigene Methodik oder eigene Position liefern niedrigen Information Gain — moderner Thin-Content-Begriff der KI-Ära. Strategisch sollten Sites Thin-Content-Audits quartalsweise durchführen. Tools wie Screaming Frog (Word-Count-Analyse), Sistrix (Visibility-Score-Veränderungen), Copyscape (Duplicate-Content-Erkennung) identifizieren Thin-Content-Probleme automatisch. Drei Lösungsstrategien: Erstens Konsolidierung — mehrere Thin-Pages zu einer umfassenden Page zusammenführen, mit 301-Redirects der alten URLs. Zweitens Erweiterung — Thin-Pages mit Original-Inhalten anreichern (eigene Daten, Beispiele, Position). Drittens Deindex-Direktiven — klassische Tag-Archive, Seiten-Paginations etc. via noindex aus dem Index entfernen. Wichtig zur Abgrenzung: Thin Content ist nicht Duplicate Content . Duplicate Content ist spezifisch kopierter Inhalt von anderen Quellen oder anderen Seiten der eigenen Site. Thin Content ist breiter — auch originale aber substanzlose Inhalte sind Thin. Beide haben überlappende Behandlungs-Strategien (Konsolidierung, Deindex), aber unterschiedliche Diagnosen.

## Praxisbeispiel

Thin-Content-Audit-Workflow für eine KMU-Site: # Schritt 1: Bestandsaufnahme Tool: Screaming Frog Filter: Word-Count unter 300 Resultat: Liste aller 'dünnen' Seiten # Schritt 2: Klassifikation Pro Seite zuordnen: - FAQ-Capsule (40-80 Wörter): OK, nicht Thin - Tag-Archiv ohne Inhalt: noindex setzen - Old Blog-Post 200 Wörter: erweitern oder konsolidieren - Service-Stub: erweitern mit Detail-Sektionen - Doorway-Page: löschen mit 301-Redirect # Schritt 3: Aktion priorisieren Hoch-Priorität: ranking-relevante Seiten erweitern Mittel-Priorität: Tag-Archive und Pagination noindex Niedrig-Priorität: alte irrelevante Stubs löschen # Schritt 4: Ergebnis-Tracking Tool: Google Search Console -> Index Coverage Erwartet: 'Crawled - currently not indexed' sinkt Ranking ranking-relevanter Seiten steigt # Beispiel-Erweiterung einer Thin-Page: VORHER (180 Wörter): 'Quellensteuer Beratung Wir beraten zu Quellensteuer-Themen. Kontaktieren Sie uns für ein Angebot.' NACHHER (450 Wörter): 'Quellensteuer-Beratung für Schweizer KMU Eigene Capsule: Wer ist betroffen? Capsule: Welche Fristen gelten? Capsule: Was kostet die Beratung? Praxis-Beispiel: Anonymisierter Klienten-Case FAQ-Sektion mit 5 Fragen CTA: Erstberatung buchen' # Information Gain Boost: Eigene Daten ergänzen: 'Aus 200 Beratungs-Cases 2025' Eigene Methodik: '5-Schritt-Quellensteuer-Prüfung' Eigene Position: 'Häufigste Fehler in der Praxis' Ein konsequentes Thin-Content-Audit-Programm ist 2026 Standard-Hygiene. Aufwand: 4-8 Stunden pro Quartal pro Site. Wirkung: messbarer Sichtbarkeits-Hebel über 6-12 Monate.

## Häufige Fehler

- Tag-Archive und Pagination als Thin Content im Index lassen — verbessert sich durch noindex-Direktive.
- Wort-Anzahl als einziges Thin-Content-Kriterium nutzen — auch lange Texte ohne Information Gain sind Thin.
- LLM-generierte Massen-Inhalte ohne menschliche Substanz publizieren — werden 2026 von LLM-Trainings-Pipelines aktiv gefiltert.
- Thin Content löschen ohne 301-Redirect — verlorene Backlinks und Authority-Transport-Lücken.
- Thin-Content-Audits einmalig durchführen — neue Inhalte können Thin werden, quartalsweise Pflege ist nötig.

## Best Practices

- Führe quartalsweise Thin-Content-Audits durch (Screaming Frog, Sistrix, Copyscape).
- Setze klare Wort-Anzahl-Schwellen: unter 300 Wörter ist verdächtig (Ausnahme: FAQ-Capsules 40-80 Wörter).
- Erweitere Thin-Pages mit Original-Inhalten — eigene Daten, eigene Methodik, eigene Position.
- Nutze noindex für strukturell unvermeidbare Thin-Pages (Tag-Archive, Pagination, interne Suche).
- Bei Thin-Page-Löschung: setze 301-Redirects auf thematisch verwandte Pillar-Pages, um Authority-Transport zu erhalten.
- Tracke Information Gain als modernen Thin-Content-Indikator — Inhalte ohne eigene Substanz werden im KI-Zeitalter doppelt benachteiligt.

## Fakten

- Google's Panda-Update wurde im Februar 2011 lanciert; etablierte Thin Content als formalen Ranking-Negativfaktor.
- Inhalte unter 300 Wörtern werden 2026 oft als Thin Content gewertet — Ausnahme sind FAQ-Capsules mit 40-80 Wörtern.
- Im DACH-Raum 2026 haben schätzungsweise 25-35% aller KMU-Sites mehr als 30% Thin-Content-Anteil — typisch durch Tag-Archive, alte Blog-Stubs und unvollständige Service-Pages.
- Anthropic, OpenAI und Google haben seit 2024 explizite Quality-Filter für Trainings-Korpora — Thin Content wird aktiv ausgeschlossen.
- Sites mit reduziertem Thin-Content-Anteil (von 30% auf unter 10%) erreichen typisch 15-25% Ranking-Steigerung über 6-12 Monate.
- LLM-generierte Massen-Inhalte ohne menschliche Substanz werden 2026 von Google E-E-A-T-Filtern und LLM-Trainings-Pipelines parallel benachteiligt.

## FAQ

### Was ist Thin Content?

Web-Inhalte mit zu wenig Substanz, Tiefe oder Originalität — typisch unter 300 Wörtern, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen. Etabliert als Ranking-Negativfaktor durch Google's Panda-Update 2011. Im KI-Zeitalter zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert.

### Welche Wort-Anzahl ist 'thin'?

Inhalte unter 300 Wörtern sind verdächtig. Ausnahme: FAQ-Capsules mit 40-80 Wörtern sind strukturell akzeptiert. Über 300 Wörter ist nicht automatisch nicht-thin — auch lange Texte ohne Information Gain sind Thin Content.

### Was sind typische Thin-Content-Muster?

Vier Muster: erstens Affiliate-Stubs ohne Tiefe. Zweitens Doorway-Pages für SERP-Position. Drittens automatisch generierte LLM-Inhalte ohne menschliche Substanz. Viertens duplizierter Content von anderen Quellen. Plus strukturelle Probleme wie Tag-Archive und leere Pagination.

### Wie behandle ich Thin Content?

Drei Strategien: erstens Konsolidierung (mehrere Thin-Pages zu einer umfassenden zusammenführen). Zweitens Erweiterung (mit Original-Inhalten, eigenen Daten anreichern). Drittens Deindex-Direktiven (noindex für strukturell unvermeidbare Thin-Pages wie Tag-Archive).

### Ist Thin Content im KI-Zeitalter wichtiger geworden?

Ja, doppelt. Klassisch wirkt Google's Panda-Filter weiter. Neu seit 2024 filtern Anthropic, OpenAI und Google explizit Thin Content aus Trainings-Korpora. Konsequenz: doppelter Schaden — verlorene Google-Sichtbarkeit plus reduzierte langfristige KI-Trainings-Coverage.

### Wie identifiziere ich Thin Content?

Drei Indikatoren: erstens Wort-Anzahl (Screaming Frog Filter unter 300 Wörter). Zweitens Original-Anteil (Copyscape für Duplicate-Detection). Drittens Information Gain (eigene Bewertung: enthält der Inhalt eigene Daten, Methodik oder Position?). Plus Google Search Console 'Crawled - currently not indexed'-Report.

## Experten-Definition

Thin Content ist 2026 doppelt benachteiligt — klassisch von Google's Panda-Filter, neu von LLM-Trainings-Pipelines. Bei Klienten finde ich oft das Muster: Site hat 200 Blog-Artikel, davon 50-80 mit unter 300 Wörtern. Diese 50-80 Thin-Pages schwächen die gesamte Site-Authority und werden aktiv aus Trainings-Korpora gefiltert. Mein Standard-Audit klassifiziert Thin-Pages in drei Kategorien: erweitern (ranking-relevant), noindex (strukturell unvermeidbar) oder löschen mit 301-Redirect (irrelevant). 4-8 Stunden Audit-Aufwand pro Quartal — typisch 15-25% Ranking-Hebel über 6-12 Monate.

## Verwandte Begriffe

- [Answer Capsule](https://www.geoquality.ai/glossar/answer-capsule.md) — Eine Answer Capsule ist ein eigenständig zitierfaehiger Textblock auf einer Website, der eine konkrete Frage in 40 bis 80 Wörtern vollständig, präzise und ohne Kontextabhaengigkeit beantwortet — gebaut für Wort-für-Wort-Übernahme durch ChatGPT, Perplexity und Google AI Overviews.
- [Crawling](https://www.geoquality.ai/glossar/crawling.md) — Crawling bezeichnet den systematischen Prozess, mit dem Web-Crawler Inhalte einer Website abrufen, durchqueren und indexieren. Im KI-Zeitalter erweitert sich Crawling um spezialisierte KI-Crawler wie GPTBot, ClaudeBot, PerplexityBot und Google-Extended — neben dem klassischen Googlebot, der seit 1998 Web-Inhalte für Google-Suche sammelt.
- [Indexierung](https://www.geoquality.ai/glossar/indexierung.md) — Indexierung bezeichnet die Speicherung gecrawlter Web-Inhalte in einer durchsuchbaren Datenbank — bei Google im Search Index, bei KI-Plattformen in plattform-spezifischen Indizes (ChatGPT-Search-Index, Perplexity-Index). Indexierung ist der nachgelagerte Schritt nach Crawling und Voraussetzung dafür, dass eine Site überhaupt in Suchergebnissen oder KI-Antworten erscheint.
- [Information Gain Score](https://www.geoquality.ai/glossar/information-gain.md) — Information Gain ist ein Bewertungs-Konzept, das misst, welchen einzigartigen Mehrwert ein Inhalt gegenüber bereits indexierten Quellen bietet. Google patentierte es 2020 als Ranking-Faktor; im KI-Zeitalter ist es zentral, weil LLMs Inhalte mit hohem Information Gain bevorzugt zitieren — originelle Perspektiven schlagen Wiederholungen.
- [Topical Authority](https://www.geoquality.ai/glossar/topical-authority.md) — Topical Authority bezeichnet die kumulierte Glaubwürdigkeit einer Domain für ein eng umgrenztes Themenfeld — gemessen an Tiefe und Breite des Content-Inventars, Verknüpfung mit Authority-Quellen und der Anzahl externer Erwähnungen aus thematisch verwandten Quellen. Sie ist der wichtigste Citation-Treiber in YMYL-Bereichen.

## Quelle und Zitation

- HTML-Original: https://www.geoquality.ai/glossar/thin-content
- Lizenz: CC BY 4.0
- Zitiervorschlag: "Thin Content (geoquality.ai Glossar, Biner 2026)"