---
title: Google-Extended (Crawler)
slug: google-extended
canonical_url: https://www.geoquality.ai/glossar/google-extended
md_url: https://www.geoquality.ai/glossar/google-extended.md
language: de
last_modified: 2026-05-07T00:00:00+00:00
related_terms: [ai-overview, google-ai-mode, google-gemini, gptbot, ki-crawler, robots-txt, training-data]
content_hash: df2e97808d5e6e82
license: CC BY 4.0
author: Marco Biner (geoquality.ai)
schema_type: DefinedTerm
---

# Google-Extended (Crawler)

Google-Extended ist Googles dedizierter KI-Crawler, lanciert September 2023. Im Gegensatz zum klassischen Googlebot speist Google-Extended nicht die klassischen Trefferlisten, sondern ausschliesslich KI-Produkte: Google AI Mode, AI Overviews und Gemini-Trainings-Korpus. Strukturelle Crawler-Differenzierung erlaubt User-Kontrolle über klassische vs. KI-Indexierung.

## Erläuterung

Google-Extended ist Googles dedizierter KI-Crawler , lanciert im September 2023 als Reaktion auf Anbieter-Forderungen nach differenzierter Crawler-Kontrolle. Anders als der klassische Googlebot — der seit 25 Jahren die Web-Inhalte für die Google-Suche sammelt — speist Google-Extended ausschliesslich Googles KI-Produkte: Google AI Mode , AI Overviews , und Gemini -Trainings-Korpus-Updates. Diese Differenzierung erlaubt Site-Betreibern strategische Steuerung: klassische Google-Suche erhalten, KI-Indexierung blockieren, oder beides erlauben. Strukturell ist Google-Extended ein 'Pseudo-Crawler' — er crawlt nicht selbst, sondern nutzt die Inhalte, die Googlebot bereits gecrawlt hat. Die Kontrolle erfolgt durch robots.txt-Direktiven: ein User-agent: Google-Extended mit Disallow: / schliesst die Site aus KI-Indexierung aus, ohne den klassischen Googlebot zu beeinflussen. Die klassische Google-Suche bleibt unberührt; nur Sichtbarkeit in Google AI Mode , AI Overviews und Gemini-Modell-Updates verschwindet. Für GEO ist Google-Extended 2026 ein strategisch kritischer Crawler. Mit Googles 92% Such-Marktanteilsposition im DACH-Raum bedeutet Google-Extended-Block oft den grössten Single-Verlust an KI-Sichtbarkeit . Sites mit explizitem Google-Extended-Allow oder Default-Allow (kein expliziter Disallow) erscheinen in AI Overviews und Google AI Mode-Citations — das volumen-stärkste KI-Sichtbarkeits-Segment im DACH-Raum 2026. Schätzungsweise 10-15% der DACH-KMU-Sites blockieren Google-Extended unbeabsichtigt — durch Wildcard-Disallow oder durch bewusste Entscheidung gegen KI-Trainingsdaten-Beitrag. Strategisch lohnt sich die Allow-Entscheidung in fast allen Fällen. Vorteile : AI-Overview-Inclusion, Google-AI-Mode-Sichtbarkeit, langfristige Trainings-Repräsentation in zukünftigen Gemini-Modellen. Nachteile : Inhalte werden in KI-Trainings verwendet (Trainings-Daten-Beitrag ohne explizite Vergütung). Für Marken-Sichtbarkeit überwiegen die Vorteile fast immer. Für sensible oder paywall-geschützte Inhalte kann Block sinnvoll sein. Die meisten DACH-KMU-Klienten sollten Google-Extended explizit erlauben. Wichtig zur Abgrenzung: Google-Extended ist nicht Googlebot. Googlebot ist der klassische Web-Crawler für Google-Suche-Index seit 1998. Google-Extended ist seit September 2023 spezifisch für KI-Produkte. Beide Crawler können separat in robots.txt erlaubt oder blockiert werden. Standard-Setup 2026: beide explizit erlauben für maximale Sichtbarkeits-Coverage über klassische Suche und KI-Antwortmaschinen.

## Praxisbeispiel

robots.txt-Konfiguration für Google-Extended: # Google-Extended explizit erlauben (empfohlen) User-agent: Google-Extended Allow: / # Falls explizit blockieren (selten gerechtfertigt): User-agent: Google-Extended Disallow: / # Klassische Google-Suche separat steuern: User-agent: Googlebot Allow: / User-agent: Google-Extended Allow: / # Gegenbeispiel: nur klassische Google-Suche, keine KI: User-agent: Googlebot Allow: / User-agent: Google-Extended Disallow: / # Multi-Bot-Allow im DACH-Best-Practice-Setup 2026: User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: PerplexityBot Allow: / User-agent: Google-Extended Allow: / User-agent: Applebot-Extended Allow: / # Verifikation: Google-Extended hat keinen separaten Server-Log-Eintrag — er ist eine Crawler-Direktive, kein eigener Bot. Wirkung in Google Search Console ueberpruefbar (AI-Overview-Tab). Diese Konfiguration sichert Google-AI-Sichtbarkeit ohne Auswirkung auf klassisches Google-Ranking. Im DACH-Raum 2026 die wichtigste Crawler-Single-Massnahme nach GPTBot-Erlaubnis.

## Häufige Fehler

- Google-Extended mit Googlebot verwechseln — sind separate Crawler-Identifikationen mit unterschiedlicher Wirkung.
- Google-Extended blockieren weil 'KI-Training nicht erwuenscht' — verschenkt im DACH-Raum die volumen-staerkste KI-Sichtbarkeit.
- Wildcard-Disallow ohne expliziten Google-Extended-Override — schliesst Site aus AI Overviews und AI Mode aus.
- Annehmen, dass Googlebot-Allow automatisch Google-Extended-Allow bedeutet — strukturell separate Crawler-Direktiven.

## Best Practices

- Erlaube Google-Extended in robots.txt explizit mit User-agent: Google-Extended / Allow: /.
- Pflege Googlebot und Google-Extended separat — strukturelle Differenzierung erlaubt strategische Steuerung.
- Bei DACH-KMU-Klienten: Google-Extended-Allow ist Pflicht-Schritt im GEO-Audit.
- Tracke Google-AI-Sichtbarkeit über Google Search Console (AI-Overview-Tab) und manuelle AI-Mode-Tests.
- Bei sensiblen oder paywall-geschuetzten Inhalten: Google-Extended-Disallow kann gerechtfertigt sein, mit klarer Strategie-Entscheidung.
- Multi-Bot-Allow-Konfiguration in robots.txt deckt Google-Extended neben GPTBot, ClaudeBot, PerplexityBot ab.

## Fakten

- Google-Extended wurde im September 2023 als dedizierter KI-Crawler von Google lanciert.
- Google-Extended ist strukturell ein 'Pseudo-Crawler' — er crawlt nicht selbst, sondern nutzt Googlebot-gecrawlte Inhalte für KI-Produkte.
- Sites mit Google-Extended-Allow erscheinen in AI Overviews und Google AI Mode; Sites mit Disallow sind aus diesen KI-Produkten ausgeschlossen.
- Im DACH-Raum 2026 blockieren schaetzungsweise 10-15% der KMU-Sites Google-Extended unbeabsichtigt — durch Wildcard-Disallow oder bewusste Anti-KI-Entscheidung.
- Google bestaetigt offiziell: Googlebot- und Google-Extended-Direktiven sind unabhaengig, klassische Google-Suche bleibt von Google-Extended-Disallow unberuehrt.
- Google-Extended speist Gemini-Trainings-Korpus-Updates — langfristige Trainings-Repräsentation in zukuenftigen Google-AI-Modellen hängt von Allow-Status ab.

## FAQ

### Was ist Google-Extended?

Googles dedizierter KI-Crawler seit September 2023. Speist ausschliesslich KI-Produkte (Google AI Mode, AI Overviews, Gemini-Training), nicht die klassische Google-Suche. Strukturelle Differenzierung erlaubt User-Kontrolle über klassische vs. KI-Indexierung.

### Was unterscheidet Google-Extended von Googlebot?

Googlebot ist der klassische Web-Crawler für Google-Suche-Index seit 1998. Google-Extended ist seit 2023 spezifisch für KI-Produkte. Beide können separat in robots.txt erlaubt oder blockiert werden. Wer Googlebot erlaubt, aber Google-Extended blockiert, behaelt klassische Suche aber verliert KI-Sichtbarkeit .

### Soll ich Google-Extended erlauben oder blockieren?

Erlauben — empfohlen für fast alle DACH-KMU-Sites. Vorteile: AI-Overview-Inclusion, AI-Mode-Sichtbarkeit, Trainings-Repräsentation. Nachteile: Trainings-Daten-Beitrag ohne explizite Vergütung. Im DACH mit 92% Google-Marktanteil ueberwiegen die Vorteile fast immer.

### Was passiert, wenn ich Google-Extended blockiere?

Site verschwindet aus AI Overviews und Google AI Mode-Citations. Klassische Google-Suche bleibt unberuehrt — Site rankt weiterhin in klassischen SERPs. Im DACH bedeutet Block typisch 25-40% Verlust der gesamten KI-Sichtbarkeit, weil Google-AI-Produkte das volumen-staerkste KI-Segment sind.

### Wie konfiguriere ich Google-Extended?

Zwei Zeilen in robots.txt: 'User-agent: Google-Extended' und 'Allow: /'. Bei Disallow analog. Wichtig: separat von Googlebot pflegen — strukturelle Differenzierung. Standard-Setup-Aufwand: 2 Minuten.

### Wie verifiziere ich Google-Extended-Aktivitaet?

Google-Extended hat keinen separaten Server-Log-Eintrag — er ist eine Crawler-Direktive, kein eigenständiger Bot. Verifikation indirekt via Google Search Console (AI-Overview-Tab) und manuelle AI-Mode-Tests gegen Brand-Prompt-Set.

## Experten-Definition

Google-Extended ist 2026 die wichtigste Crawler-Single-Entscheidung nach GPTBot. Bei Klienten ist es Standard-Audit-Schritt: 'Erlaubt eure robots.txt Google-Extended?'. In etwa 10-15% der Fälle ist die Antwort: nein, durch Wildcard-Disallow oder bewusste Anti-KI-Entscheidung. Die Empfehlung ist klar — für fast alle DACH-KMU-Klienten ueberwiegen die Vorteile (AI-Overview-Inclusion, AI-Mode-Sichtbarkeit, Trainings-Repräsentation in Gemini) deutlich die Nachteile (Trainings-Daten-Beitrag ohne Vergütung). Mit Googles 92% Marktanteil im DACH ist Google-Extended-Allow oft die volumen-staerkste KI-Sichtbarkeits-Massnahme.

## Verwandte Begriffe

- [AI Overview (Google)](https://www.geoquality.ai/glossar/ai-overview.md) — Ein AI Overview ist eine generative KI-Antwort, die Google seit 2026 in der DACH-Region oberhalb der klassischen Trefferliste anzeigt. Sie synthesizt Inhalte mehrerer Quellen zu einer kompakten Antwort und ist 2026 ein zentraler Sichtbarkeits-Treiber im Google-Ecosystem.
- [Google AI Mode](https://www.geoquality.ai/glossar/google-ai-mode.md) — Google AI Mode ist Googles dedizierter KI-Such-Modus, lanciert Mai 2024 als 'Search Generative Experience' (SGE) und ausgerollt 2026 unter dem neuen Namen. Er liefert synthetisierte KI-Antworten direkt im SERP-Header, ergänzend zu klassischen Trefferlisten. Wichtigster Hebel im Google-Ecosystem für GEO-Optimierung.
- [Google Gemini](https://www.geoquality.ai/glossar/google-gemini.md) — Google Gemini ist Googles LLM-Familie, eingeführt im Dezember 2023 als Nachfolger von Bard. Sie betreibt 2026 sowohl Google AI Mode als auch AI Overviews und ist durch native Multimodalität charakterisiert. Gemini 1.5 Pro hat mit 2 Millionen Tokens das grösste Context Window aller Mainstream-LLMs.
- [GPTBot (OpenAI Crawler)](https://www.geoquality.ai/glossar/gptbot.md) — GPTBot ist OpenAI's Web-Crawler, lanciert August 2023. Er sammelt Web-Inhalte für ChatGPT-Search-Index, Trainings-Korpus-Updates und API-basierte Anwendungen. Sites müssen GPTBot in robots.txt explizit erlauben oder zumindest nicht blockieren — Default-Wildcard-Disallow blockiert GPTBot und schliesst die Site aus dem OpenAI-Ecosystem aus.
- [KI-Crawler](https://www.geoquality.ai/glossar/ki-crawler.md) — KI-Crawler sind automatisierte Bots der grossen LLM-Anbieter (GPTBot, ClaudeBot, PerplexityBot, Google-Extended), die Websites systematisch besuchen und ihre Inhalte für die Retrieval-Layer der KI-Antwortmaschinen indexieren.
- [robots.txt](https://www.geoquality.ai/glossar/robots-txt.md) — robots.txt ist eine Textdatei im Root-Verzeichnis einer Website, die Crawlern Zugriffsregeln signalisiert — für GEO entscheidend, weil sie als erstes Hindernis darüber entscheidet, ob KI-Crawler die Site überhaupt indexieren dürfen.
- [Trainingsdaten](https://www.geoquality.ai/glossar/training-data.md) — Trainingsdaten sind die Texte, Bilder und Code-Beispiele, mit denen ein LLM während seiner Lern-Phase die Sprachverteilung und Faktenbasis erwirbt. Ihre Zusammensetzung bestimmt direkt, welche Marken, Personen und Themen das Modell ohne Live-Retrieval kennt — und ist damit ein zentrales Brand-Awareness-Reservoir im KI-Zeitalter.

## Quelle und Zitation

- HTML-Original: https://www.geoquality.ai/glossar/google-extended
- Lizenz: CC BY 4.0
- Zitiervorschlag: "Google-Extended (Crawler) (geoquality.ai Glossar, Biner 2026)"
