Thin Content
Auch bekannt als: Dünner Inhalt, Low-Value Content, Substanzarmer Inhalt
1. Kurzdefinition
Thin Content bezeichnet Web-Inhalte mit zu wenig Substanz, Tiefe oder Originalität — typisch unter 300 Wörtern, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen. Google's Panda-Update 2011 etablierte Thin Content als Ranking-Negativfaktor; im KI-Zeitalter wird es zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert.
2. Ausführliche Erklärung
Thin Content ist seit Google's Panda-Update im Februar 2011 ein etablierter Ranking-Negativ-Faktor. Das Konzept beschreibt Web-Inhalte, die zu wenig eigenständige Substanz bieten — entweder durch geringen Umfang, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen oder fehlende Original-Insights. Vier typische Thin-Content-Muster sind 2026 verbreitet: Erstens Affiliate-Stubs — kurze Produkt-Vorstellungen mit Affiliate-Links ohne eigenständige Tiefe. Zweitens Doorway-Pages — Seiten, die nur für SERP-Position erstellt wurden und User zu anderen Seiten weiterleiten. Drittens automatisch generierte Inhalte ohne menschliche Substanz — typisch LLM-Massen-Output ohne Eigenleistung. Viertens duplizierter Content — Inhalte, die von anderen Quellen kopiert oder leicht modifiziert wurden.
Im KI-Zeitalter 2026 wird Thin Content zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert. Anthropic, OpenAI und Google publizieren seit 2024 explizite Quality-Filter für ihre Trainings-Korpora — Thin Content wird ausgeschlossen, was die langfristige Trainings-Repräsentation der Site reduziert. Konsequenz: eine Site mit hohem Anteil Thin Content verliert nicht nur klassische SEO-Sichtbarkeit (Google-Ranking-Verluste), sondern auch zukünftige KI-Trainings-Coverage. Doppelter Schaden über 12-24 Monate.
Drei Thin-Content-Indikatoren sind 2026 messbar. Erstens Wort-Anzahl: Inhalte unter 300 Wörtern werden oft als Thin Content gewertet — Ausnahme sind FAQ-Capsules mit 40-80 Wörtern, die strukturell als Antwort-Bausteine akzeptiert sind. Zweitens Original-Inhalts-Anteil: Texte mit über 70% Reproduktion von Drittquellen sind problematisch. Drittens Information Gain: Inhalte ohne eigene Daten, eigene Methodik oder eigene Position liefern niedrigen Information Gain — moderner Thin-Content-Begriff der KI-Ära.
Strategisch sollten Sites Thin-Content-Audits quartalsweise durchführen. Tools wie Screaming Frog (Word-Count-Analyse), Sistrix (Visibility-Score-Veränderungen), Copyscape (Duplicate-Content-Erkennung) identifizieren Thin-Content-Probleme automatisch. Drei Lösungsstrategien: Erstens Konsolidierung — mehrere Thin-Pages zu einer umfassenden Page zusammenführen, mit 301-Redirects der alten URLs. Zweitens Erweiterung — Thin-Pages mit Original-Inhalten anreichern (eigene Daten, Beispiele, Position). Drittens Deindex-Direktiven — klassische Tag-Archive, Seiten-Paginations etc. via noindex aus dem Index entfernen.
Wichtig zur Abgrenzung: Thin Content ist nicht Duplicate Content. Duplicate Content ist spezifisch kopierter Inhalt von anderen Quellen oder anderen Seiten der eigenen Site. Thin Content ist breiter — auch originale aber substanzlose Inhalte sind Thin. Beide haben überlappende Behandlungs-Strategien (Konsolidierung, Deindex), aber unterschiedliche Diagnosen.
3. Praxisbeispiel
Thin-Content-Audit-Workflow für eine KMU-Site:
# Schritt 1: Bestandsaufnahme
Tool: Screaming Frog
Filter: Word-Count unter 300
Resultat: Liste aller 'dünnen' Seiten
# Schritt 2: Klassifikation
Pro Seite zuordnen:
- FAQ-Capsule (40-80 Wörter): OK, nicht Thin
- Tag-Archiv ohne Inhalt: noindex setzen
- Old Blog-Post 200 Wörter: erweitern oder konsolidieren
- Service-Stub: erweitern mit Detail-Sektionen
- Doorway-Page: löschen mit 301-Redirect
# Schritt 3: Aktion priorisieren
Hoch-Priorität: ranking-relevante Seiten erweitern
Mittel-Priorität: Tag-Archive und Pagination noindex
Niedrig-Priorität: alte irrelevante Stubs löschen
# Schritt 4: Ergebnis-Tracking
Tool: Google Search Console -> Index Coverage
Erwartet: 'Crawled - currently not indexed' sinkt
Ranking ranking-relevanter Seiten steigt
# Beispiel-Erweiterung einer Thin-Page:
VORHER (180 Wörter):
'Quellensteuer Beratung
Wir beraten zu Quellensteuer-Themen.
Kontaktieren Sie uns für ein Angebot.'
NACHHER (450 Wörter):
'Quellensteuer-Beratung für Schweizer KMU
Eigene Capsule: Wer ist betroffen?
Capsule: Welche Fristen gelten?
Capsule: Was kostet die Beratung?
Praxis-Beispiel: Anonymisierter Klienten-Case
FAQ-Sektion mit 5 Fragen
CTA: Erstberatung buchen'
# Information Gain Boost:
Eigene Daten ergänzen: 'Aus 200 Beratungs-Cases 2025'
Eigene Methodik: '5-Schritt-Quellensteuer-Prüfung'
Eigene Position: 'Häufigste Fehler in der Praxis'Ein konsequentes Thin-Content-Audit-Programm ist 2026 Standard-Hygiene. Aufwand: 4-8 Stunden pro Quartal pro Site. Wirkung: messbarer Sichtbarkeits-Hebel über 6-12 Monate.
4. Typische Fehler & Missverständnisse
- Tag-Archive und Pagination als Thin Content im Index lassen — verbessert sich durch noindex-Direktive.
- Wort-Anzahl als einziges Thin-Content-Kriterium nutzen — auch lange Texte ohne Information Gain sind Thin.
- LLM-generierte Massen-Inhalte ohne menschliche Substanz publizieren — werden 2026 von LLM-Trainings-Pipelines aktiv gefiltert.
- Thin Content löschen ohne 301-Redirect — verlorene Backlinks und Authority-Transport-Lücken.
- Thin-Content-Audits einmalig durchführen — neue Inhalte können Thin werden, quartalsweise Pflege ist nötig.
5. Best Practices
- Führe quartalsweise Thin-Content-Audits durch (Screaming Frog, Sistrix, Copyscape).
- Setze klare Wort-Anzahl-Schwellen: unter 300 Wörter ist verdächtig (Ausnahme: FAQ-Capsules 40-80 Wörter).
- Erweitere Thin-Pages mit Original-Inhalten — eigene Daten, eigene Methodik, eigene Position.
- Nutze noindex für strukturell unvermeidbare Thin-Pages (Tag-Archive, Pagination, interne Suche).
- Bei Thin-Page-Löschung: setze 301-Redirects auf thematisch verwandte Pillar-Pages, um Authority-Transport zu erhalten.
- Tracke Information Gain als modernen Thin-Content-Indikator — Inhalte ohne eigene Substanz werden im KI-Zeitalter doppelt benachteiligt.
6. Fakten
- Google's Panda-Update wurde im Februar 2011 lanciert; etablierte Thin Content als formalen Ranking-Negativfaktor.
- Inhalte unter 300 Wörtern werden 2026 oft als Thin Content gewertet — Ausnahme sind FAQ-Capsules mit 40-80 Wörtern.
- Im DACH-Raum 2026 haben schätzungsweise 25-35% aller KMU-Sites mehr als 30% Thin-Content-Anteil — typisch durch Tag-Archive, alte Blog-Stubs und unvollständige Service-Pages.
- Anthropic, OpenAI und Google haben seit 2024 explizite Quality-Filter für Trainings-Korpora — Thin Content wird aktiv ausgeschlossen.
- Sites mit reduziertem Thin-Content-Anteil (von 30% auf unter 10%) erreichen typisch 15-25% Ranking-Steigerung über 6-12 Monate.
- LLM-generierte Massen-Inhalte ohne menschliche Substanz werden 2026 von Google E-E-A-T-Filtern und LLM-Trainings-Pipelines parallel benachteiligt.
Definition von Marco Biner · Certified GEO Expert
Thin Content ist 2026 doppelt benachteiligt — klassisch von Google's Panda-Filter, neu von LLM-Trainings-Pipelines. Bei Klienten finde ich oft das Muster: Site hat 200 Blog-Artikel, davon 50-80 mit unter 300 Wörtern. Diese 50-80 Thin-Pages schwächen die gesamte Site-Authority und werden aktiv aus Trainings-Korpora gefiltert. Mein Standard-Audit klassifiziert Thin-Pages in drei Kategorien: erweitern (ranking-relevant), noindex (strukturell unvermeidbar) oder löschen mit 301-Redirect (irrelevant). 4-8 Stunden Audit-Aufwand pro Quartal — typisch 15-25% Ranking-Hebel über 6-12 Monate.
GEO Importance Rank
Wie wichtig ist dieser Begriff für Generative Engine Optimization?
FAQs
Was ist Thin Content?
Web-Inhalte mit zu wenig Substanz, Tiefe oder Originalität — typisch unter 300 Wörtern, oberflächliche Themenabdeckung, hohe Reproduktion von Drittquellen. Etabliert als Ranking-Negativfaktor durch Google's Panda-Update 2011. Im KI-Zeitalter zusätzlich von LLM-Trainings-Pipelines aktiv gefiltert.
Welche Wort-Anzahl ist 'thin'?
Inhalte unter 300 Wörtern sind verdächtig. Ausnahme: FAQ-Capsules mit 40-80 Wörtern sind strukturell akzeptiert. Über 300 Wörter ist nicht automatisch nicht-thin — auch lange Texte ohne Information Gain sind Thin Content.
Was sind typische Thin-Content-Muster?
Vier Muster: erstens Affiliate-Stubs ohne Tiefe. Zweitens Doorway-Pages für SERP-Position. Drittens automatisch generierte LLM-Inhalte ohne menschliche Substanz. Viertens duplizierter Content von anderen Quellen. Plus strukturelle Probleme wie Tag-Archive und leere Pagination.
Wie behandle ich Thin Content?
Drei Strategien: erstens Konsolidierung (mehrere Thin-Pages zu einer umfassenden zusammenführen). Zweitens Erweiterung (mit Original-Inhalten, eigenen Daten anreichern). Drittens Deindex-Direktiven (noindex für strukturell unvermeidbare Thin-Pages wie Tag-Archive).
Ist Thin Content im KI-Zeitalter wichtiger geworden?
Ja, doppelt. Klassisch wirkt Google's Panda-Filter weiter. Neu seit 2024 filtern Anthropic, OpenAI und Google explizit Thin Content aus Trainings-Korpora. Konsequenz: doppelter Schaden — verlorene Google-Sichtbarkeit plus reduzierte langfristige KI-Trainings-Coverage.
Wie identifiziere ich Thin Content?
Drei Indikatoren: erstens Wort-Anzahl (Screaming Frog Filter unter 300 Wörter). Zweitens Original-Anteil (Copyscape für Duplicate-Detection). Drittens Information Gain (eigene Bewertung: enthält der Inhalt eigene Daten, Methodik oder Position?). Plus Google Search Console 'Crawled - currently not indexed'-Report.
Verwandte Begriffe
Eigene AI-Sichtbarkeit messen
Kostenlose SEAKT-Analyse für jede Website — Score in unter 2 Minuten.
Jetzt analysieren →