Questa pagina è attualmente disponibile solo in tedesco. Seguirà una traduzione professionale. Vedi la versione tedesca →
Cluster-Filter: Crawler & Indexierung (12 von 153 Begriffen) ← Alle Cluster anzeigen
GEO Importance Rank · 0–100

Glossar GEO & AI-Sichtbarkeit

Zentrale Begriffe rund um Generative Engine Optimization, das SEAKT-Framework und maschinenlesbare Web-Strukturdaten. Jeder Begriff bekommt einen GEO Importance Rank (0–100) — unsere autoritative Bewertungsachse für die Branche.

12 Begriffe
12 mit voller Definition
0 Backfill folgt
Bewertungssystem

Was ist der GEO Importance Rank?

Eine Skala von 0 bis 100, die ausdrückt, wie zentral ein Begriff für Generative Engine Optimization ist. 100 = Fundament (ohne den Begriff kein GEO). 0–29 = Nische (spezifische Schema-Typen, Edge-Cases). Der Rank lebt maschinenlesbar im JSON-LD jedes Begriffs als additionalProperty mit propertyID geoquality:geo-importance-rank.

100–90
Fundamental
Fundamental — ohne dieses Konzept funktioniert GEO nicht.
89–70
Sehr wichtig
Sehr wichtig — operative Hauptwerkzeuge fuer GEO-Optimierung.
69–50
Wichtig
Wichtig — solide Basis fuer professionelle GEO-Arbeit.
49–30
Nuetzlich
Nuetzlich — Spezialwissen fuer Profi-Level.
29–0
Nische
Nische — Spezialfaelle und emerging concepts.
12 von 12
Sehr wichtig

llms.txt

LLMs.txt

llms.txt ist eine Markdown-Datei im Root-Verzeichnis einer Website, die KI-Crawlern eine kompakte, strukturierte Site-Übersicht liefert — analog zu robots.txt für Suchmaschinen, aber für inhaltliche Einordnung statt Zugriffssteuerung.

Vollständige Definition →
Sehr wichtig

KI-Crawler

AI Crawler

KI-Crawler sind automatisierte Bots der grossen LLM-Anbieter (GPTBot, ClaudeBot, PerplexityBot, Google-Extended), die Websites systematisch besuchen und ihre Inhalte für die Retrieval-Layer der KI-Antwortmaschinen indexieren.

Vollständige Definition →
Sehr wichtig

robots.txt

Robots Exclusion Protocol

robots.txt ist eine Textdatei im Root-Verzeichnis einer Website, die Crawlern Zugriffsregeln signalisiert — für GEO entscheidend, weil sie als erstes Hindernis darüber entscheidet, ob KI-Crawler die Site überhaupt indexieren dürfen.

Vollständige Definition →
Sehr wichtig

GPTBot (OpenAI Crawler)

OpenAI Crawler

GPTBot ist OpenAI's Web-Crawler, lanciert August 2023. Er sammelt Web-Inhalte für ChatGPT-Search-Index, Trainings-Korpus-Updates und API-basierte Anwendungen. Sites müssen GPTBot in robots.txt explizit erlauben oder zumindest nicht blockieren — Default-Wildcard-Disallow blockiert GPTBot und schliesst die Site aus dem OpenAI-Ecosystem aus.

Vollständige Definition →
Sehr wichtig

ClaudeBot (Anthropic Crawler)

Anthropic Crawler

ClaudeBot ist Anthropic's Web-Crawler, lanciert 2023. Er sammelt Web-Inhalte für Claude-Trainings-Korpus und Claude-API-basierte Anwendungen mit Web-Search-Tool. Sites müssen ClaudeBot in robots.txt explizit erlauben — analog zu GPTBot — um Sichtbarkeit in Claude- und Anthropic-API-Plattformen zu sichern.

Vollständige Definition →
Wichtig

PerplexityBot (Crawler)

Perplexity Crawler

PerplexityBot ist Perplexity's Web-Crawler, lanciert 2023. Er sammelt Web-Inhalte für den Perplexity-Index, der Quick Search, Pro Search und Deep Research speist. Sites müssen PerplexityBot in robots.txt explizit erlauben — analog zu GPTBot und ClaudeBot — um in Perplexity-Citations zu erscheinen.

Vollständige Definition →
Wichtig

Sitemap.xml

XML-Sitemap

Sitemap.xml ist eine XML-Datei mit allen relevanten URLs einer Website, die Crawlern als systematisches URL-Inventar dient — Pflicht für jede Site mit mehr als 20 Pages und kritisch für die initiale Indexierung durch KI- und Suchmaschinen-Crawler.

Vollständige Definition →
Wichtig

Crawling

Web-Crawling

Crawling bezeichnet den systematischen Prozess, mit dem Web-Crawler Inhalte einer Website abrufen, durchqueren und indexieren. Im KI-Zeitalter erweitert sich Crawling um spezialisierte KI-Crawler wie GPTBot, ClaudeBot, PerplexityBot und Google-Extended — neben dem klassischen Googlebot, der seit 1998 Web-Inhalte für Google-Suche sammelt.

Vollständige Definition →
Wichtig

Google-Extended (Crawler)

Google AI Crawler

Google-Extended ist Googles dedizierter KI-Crawler, lanciert September 2023. Im Gegensatz zum klassischen Googlebot speist Google-Extended nicht die klassischen Trefferlisten, sondern ausschliesslich KI-Produkte: Google AI Mode, AI Overviews und Gemini-Trainings-Korpus. Strukturelle Crawler-Differenzierung erlaubt User-Kontrolle über klassische vs. KI-Indexierung.

Vollständige Definition →
Wichtig

Indexierung

Index-Aufnahme

Indexierung bezeichnet die Speicherung gecrawlter Web-Inhalte in einer durchsuchbaren Datenbank — bei Google im Search Index, bei KI-Plattformen in plattform-spezifischen Indizes (ChatGPT-Search-Index, Perplexity-Index). Indexierung ist der nachgelagerte Schritt nach Crawling und Voraussetzung dafür, dass eine Site überhaupt in Suchergebnissen oder KI-Antworten erscheint.

Vollständige Definition →
Wichtig

Applebot-Extended

Applebot

Applebot-Extended ist Apples KI-spezifischer Web-Crawler, lanciert 2024. Er sammelt Web-Inhalte für Apple-KI-Produkte: Apple Intelligence (auf iPhone, iPad, Mac), Siri mit ChatGPT-Integration, und künftige Apple-eigene LLM-Modelle. Strukturell analog zu Google-Extended, aber mit kleinerer User-Reichweite im DACH-Raum 2026.

Vollständige Definition →
Nuetzlich

CCBot (Common Crawl)

Common Crawl Crawler

CCBot ist der Crawler des Common-Crawl-Projekts, einer offenen Web-Archiv-Initiative seit 2008. Common Crawl bildet die Grundlage von 60-80 Prozent aller LLM-Pre-Training-Korpora. Sites mit blockiertem CCBot werden aus zukünftigen LLM-Trainings-Datasets ausgeschlossen — strategische Langzeit-Sichtbarkeit ist betroffen.

Vollständige Definition →

Eigene AI-Sichtbarkeit messen

Kostenlose SEAKT-Analyse für jede Website — Score in unter 2 Minuten.

Analizza ora →

Knowledge-Graph der GEO-Konzepte

Alle 12 Glossar-Begriffe als interaktiver Force-Directed Graph. Knoten-Grösse = GEO Importance Rank, Knoten-Farbe = thematischer Cluster. Kanten-Farbe und -Stil zeigen den Beziehungstyp (Hierarchie, verwandt, Voraussetzung, implementiert). Klick auf einen Knoten öffnet den Begriff.