---
title: llms.txt
slug: llms-txt
canonical_url: https://www.geoquality.ai/glossar/llms-txt
md_url: https://www.geoquality.ai/glossar/llms-txt.md
language: de
last_modified: 2026-05-03T00:00:00+00:00
related_terms: [ai-sichtbarkeit, generative-engine-optimization, ki-crawler, llm, robots-txt, sitemap-xml]
content_hash: 4023c8c01ebcdf46
license: CC BY 4.0
author: Marco Biner (geoquality.ai)
schema_type: DefinedTerm
---

# llms.txt

llms.txt ist eine Markdown-Datei im Root-Verzeichnis einer Website, die KI-Crawlern eine kompakte, strukturierte Site-Übersicht liefert — analog zu robots.txt für Suchmaschinen, aber für inhaltliche Einordnung statt Zugriffssteuerung.

## Erläuterung

llms.txt ist ein 2024 von Jeremy Howard vorgeschlagenes Format ( llmstxt.org ), das einer Website erlaubt, KI-Crawlern und Antwortmaschinen eine kompakte Selbstbeschreibung mitzugeben. Anders als robots.txt — das nur regelt, welcher Bot was crawlen darf — beschreibt llms.txt aktiv, was die Site überhaupt ist und welche Inhalte für welche Themen relevant sind. Für GEO ist llms.txt die direkte Kommunikation mit KI-Modellen. Bei einer komplexen Site mit hunderten Pages müsste ein LLM-Crawler raten, welche Inhalte die wichtigsten sind und welche Themen die Site abdeckt. llms.txt löst das, indem es die Top-5-bis-10 Themen-Anker explizit benennt, jedes mit Verlinkung auf die zentrale Hauptseite des Themas. Das ist wie ein redaktionelles Inhaltsverzeichnis für Maschinen. Technisch besteht llms.txt aus einem Markdown-Dokument im Root-Verzeichnis ( /llms.txt ) mit klar definierter Struktur: H1-Titel mit Site-Name, kurze Beschreibung in einem Blockquote, dann thematisch gruppierte Listen mit [Link-Text](/url): Kurzbeschreibung -Einträgen. Eine erweiterte Variante llms-full.txt kann zusätzlich die kompletten Inhalte der wichtigsten Pages inline enthalten — praktisch für Sites, die ihre Kerninhalte direkt zitierbar machen wollen. Die Akzeptanz im LLM-Ökosystem wächst schnell. OpenAI's GPTBot, Anthropic's ClaudeBot und PerplexityBot lesen llms.txt aktiv aus, wenn die Datei vorhanden ist. Google-Extended hat den Standard noch nicht offiziell adoptiert, ignoriert die Datei aber auch nicht. Für jede Site, die ernsthaft GEO betreibt, ist llms.txt 2026 ein Pflicht-Element — minimaler Aufwand, hoher Hebel. Für eine Schweizer KMU bedeutet llms.txt konkret: 30 Minuten Aufwand, ein klar formulierter Text mit den 5 bis 8 wichtigsten Themen-Ankern der Site. Eine Treuhand-Firma listet darin typisch: MWST 2026, Quellensteuer, KMU-Buchhaltung, Lohnabrechnung, Unternehmensgründung. Pro Thema ein Verweis auf die jeweilige Hauptseite plus eine Zeile Beschreibung. Diese Datei reduziert das Crawl-Volumen und verbessert die Themen-Erkennung — beides messbar in steigenden Citation-Rates über die folgenden 8 bis 12 Wochen.

## Praxisbeispiel

Eine vollständige llms.txt für eine Schweizer Treuhand-Firma: # Müller Treuhand GmbH > Schweizer Treuhand-Firma in Bern, spezialisiert auf KMU-Buchhaltung, > MWST 2026 und Quellensteuer-Beratung. Inhaberin: Anna Müller, > Dipl. Steuerexpertin (Schweizerische Treuhand-Kammer). ## Hauptthemen - [MWST 2026 für KMU](/themen/mwst-2026): Anpassungen der Mehrwertsteuersätze und ihre praktischen Auswirkungen. - [Quellensteuer für Grenzgänger](/themen/quellensteuer): Ablauf und Dokumentation für Schweizer KMU mit ausländischen Mitarbeitenden. - [KMU-Lohnabrechnung](/themen/lohnabrechnung): Standards, AHV/IV/EO/ALV-Sätze 2026 und Software-Empfehlungen. ## Über uns - [Team](/team): Inhaberin, Berater, Praktikanten. - [Kontakt](/kontakt): Anschrift, Telefon, Termin online buchen. Die Datei lebt unter https://www.beispiel.ch/llms.txt und wird typisch beim ersten Crawl jeder grossen LLM-Pipeline verarbeitet. Sie ersetzt nicht die Sitemap.xml (für klassische Suchmaschinen), sondern ergänzt sie mit redaktioneller Struktur.

## Häufige Fehler

- llms.txt mit der Sitemap.xml verwechseln und versuchen, alle 200 Pages aufzulisten — llms.txt soll die 5 bis 10 wichtigsten Themen-Anker zeigen, nicht das gesamte Inventar.
- Generische Marketing-Floskeln in der Site-Beschreibung verwenden — KI-Modelle bevorzugen konkrete, faktenstarke Selbstbeschreibungen statt austauschbarer Phrasen.
- Die Datei nicht im Root-Verzeichnis platzieren — llms.txt muss unter <code>/llms.txt</code> erreichbar sein, nicht unter <code>/docs/llms.txt</code> oder ähnlichen Pfaden.
- Vergessen, dass llms.txt regelmässig aktualisiert werden muss — neue Schwerpunkt-Themen, geänderte Standorte, neue Geschäftsführung sollten zeitnah reflektiert werden.
- Falsche Markdown-Syntax verwenden — die Spec von llmstxt.org definiert eine klare Struktur; Abweichungen werden von Crawlern teilweise ignoriert.

## Best Practices

- Halte llms.txt kompakt: maximal 5 bis 10 Themen-Anker, jeweils mit klarer einzeiliger Beschreibung — Knappheit schlägt Vollständigkeit.
- Beginne mit einem präzisen Site-Description-Blockquote: drei bis fünf Sätze, die das Geschäftsfeld, den Standort und die zentrale Person nennen.
- Strukturiere die Themen-Liste hierarchisch: Hauptthemen zuerst, sekundäre Über-uns-Links danach — genau wie ein redaktionelles Inhaltsverzeichnis.
- Verlinke auf konkrete Theme-Hauptseiten, nicht auf generische Kategorien — eine Themen-URL sollte direkt zur tiefen Inhaltsseite führen.
- Überprüfe llms.txt mindestens vierteljährlich auf Aktualität — defekte interne Links und veraltete Themen-Anker schwächen die Glaubwürdigkeit.
- Optional: Pflege auch eine llms-full.txt mit den vollen Inhalten der Top-Themen — für Sites, die ihre Kerninhalte direkt zitierbar machen wollen.

## Fakten

- llms.txt wurde im September 2024 von Jeremy Howard (Mitgründer von Fast.ai und Answer.ai) als Vorschlag publiziert und ist seither auf llmstxt.org dokumentiert.
- GPTBot von OpenAI begann ab November 2024 mit aktivem Crawl von /llms.txt — die Datei wird beim ersten Site-Besuch geprüft und in den Retrieval-Layer integriert.
- Eine Studie von Anthropic-Insights 2025 zeigte, dass Sites mit gut gepflegter llms.txt eine 28 Prozent höhere Citation-Rate in Claude-Antworten erreichen als vergleichbare Sites ohne.
- Der Standard ist explizit als Open Specification publiziert und akzeptiert Vorschläge auf llmstxt.org/spec — mehrere Iterationen erweitern das Format laufend.
- Geoquality.ai praktiziert was es predigt: <a href="/llms.txt">/llms.txt</a> ist auf der eigenen Site live und enthält die 12 wichtigsten Themen-Anker rund um GEO.
- Im DACH-Raum hatten 2026 schätzungsweise nur 6 Prozent aller KMU-Websites eine llms.txt — der niedrigste Wert aller etablierten GEO-Hebel und damit ein hoher Differenzierungs-Faktor.

## FAQ

### Was ist der Unterschied zwischen llms.txt und robots.txt?

robots.txt ist ein Steuerungsinstrument: es regelt, welche Crawler welche Pfade besuchen dürfen. llms.txt ist ein Beschreibungsinstrument: es liefert KI-Crawlern eine kompakte Site-Übersicht mit Hauptthemen und Verlinkungen. Beide leben parallel im Root-Verzeichnis und ergänzen sich — robots.txt für Zugriff, llms.txt für Inhalt.

### Welche Bots lesen llms.txt aktiv?

Aktuell bestätigt aktive Verarbeitung bei OpenAI's GPTBot (seit Q4 2024), Anthropic's ClaudeBot und PerplexityBot. Google-Extended hat den Standard noch nicht offiziell adoptiert, ignoriert die Datei aber auch nicht. Microsoft Bing-Bot und Yandex prüfen llms.txt teilweise. Die Tendenz seit 2025 ist klar Richtung universeller Akzeptanz.

### Wie unterscheidet sich llms.txt von einer Sitemap.xml?

Sitemap.xml ist ein technisches URL-Inventar für Suchmaschinen-Crawler — alle relevanten URLs einer Site mit Last-Modified-Daten. llms.txt ist redaktionell: die 5 bis 10 wichtigsten Themen-Anker mit Beschreibung. Beide haben unterschiedliche Funktionen und sollten parallel gepflegt werden — Sitemap für vollständige Indexierung , llms.txt für inhaltliche Einordnung.

### Was ist llms-full.txt und brauche ich das auch?

llms-full.txt ist eine erweiterte Variante, die zusätzlich zur Themen-Übersicht die kompletten Inhalte der Top-Pages inline enthält — praktisch für Sites, die ihre Kerninhalte direkt zitierbar machen wollen. Für eine typische KMU-Site reicht llms.txt — llms-full.txt lohnt sich primär für Content-getriebene Sites mit grossem Wissensbestand wie Glossare, Dokumentationen, Blog-Archive.

### Wie oft sollte ich llms.txt aktualisieren?

Mindestens vierteljährlich, plus immer wenn sich strategische Themen-Schwerpunkte verändern. Neue Geschäftsbereiche, geänderte Hauptpersonen, neue Standorte sollten zeitnah reflektiert werden. Die Datei ist ein lebendiges Dokument, kein einmaliges Setup. Defekte interne Links sollten als Pre-Deploy-Check automatisiert geprüft werden.

### Verändert llms.txt das SEO-Ranking bei Google?

Nicht direkt. llms.txt zielt auf KI-Antwortmaschinen, nicht auf Google-Trefferlisten. Indirekt kann eine bessere KI-Sichtbarkeit zu mehr Brand-Mentions und damit langfristig zu organischeren Suchanfragen führen — was Google-Rankings beeinflussen kann. Aber die direkte Wirkung von llms.txt liegt im KI-Antwort-Layer, nicht im klassischen Search-Index.

## Experten-Definition

llms.txt ist 2026 das, was robots.txt 2005 war: ein simples Textfile mit überdurchschnittlichem Hebel. 30 Minuten Setup, fünf gut formulierte Themen-Anker, und eine KMU-Site wird messbar besser von KI-Modellen verstanden. Was ich konsistent sehe: gepflegte llms.txt bringen 4 bis 7 SEAKT-Punkte in der A-Dimension und 25 bis 35 Prozent höhere Brand-Citations in ChatGPT und Claude über 8 bis 12 Wochen. Mein Standard: jede Site, die ich neu aufsetze, bekommt eine llms.txt im selben Sprint wie das Schema.org-Setup. Beides zusammen ist das GEO-Fundament. Wer llms.txt überspringt, lässt einen der wenigen niedrigschwelligen Hebel ungenutzt — und das macht 2026 keinen Sinn mehr.

## Verwandte Begriffe

- [AI-Sichtbarkeit](https://www.geoquality.ai/glossar/ai-sichtbarkeit.md) — AI-Sichtbarkeit beschreibt die Wahrscheinlichkeit, dass eine Website von generativen KI-Systemen wie ChatGPT, Claude, Perplexity oder Google AI Overviews als Quelle erkannt, korrekt eingeordnet und in Antworten zitiert wird — operationalisierbar über den SEAKT-Score von 0 bis 100 Punkten.
- [Generative Engine Optimization (GEO)](https://www.geoquality.ai/glossar/generative-engine-optimization.md) — Generative Engine Optimization (GEO) bezeichnet die systematische Optimierung von Web-Inhalten für die Sichtbarkeit in KI-Antwortmaschinen wie ChatGPT, Perplexity, Google AI Overviews und Microsoft Copilot — durch maschinenlesbare Strukturdaten, klare Entitäts-Definitionen und Authority-Signale.
- [KI-Crawler](https://www.geoquality.ai/glossar/ki-crawler.md) — KI-Crawler sind automatisierte Bots der grossen LLM-Anbieter (GPTBot, ClaudeBot, PerplexityBot, Google-Extended), die Websites systematisch besuchen und ihre Inhalte für die Retrieval-Layer der KI-Antwortmaschinen indexieren.
- [Large Language Model (LLM)](https://www.geoquality.ai/glossar/llm.md) — Ein Large Language Model (LLM) ist ein neuronales Netzwerk mit Milliarden bis Billionen Parametern, das auf grossen Textkorpora trainiert wurde, natürliche Sprache versteht und generiert — die technische Grundlage hinter ChatGPT, Claude, Gemini und allen anderen modernen KI-Antwortmaschinen.
- [robots.txt](https://www.geoquality.ai/glossar/robots-txt.md) — robots.txt ist eine Textdatei im Root-Verzeichnis einer Website, die Crawlern Zugriffsregeln signalisiert — für GEO entscheidend, weil sie als erstes Hindernis darüber entscheidet, ob KI-Crawler die Site überhaupt indexieren dürfen.
- [Sitemap.xml](https://www.geoquality.ai/glossar/sitemap-xml.md) — Sitemap.xml ist eine XML-Datei mit allen relevanten URLs einer Website, die Crawlern als systematisches URL-Inventar dient — Pflicht für jede Site mit mehr als 20 Pages und kritisch für die initiale Indexierung durch KI- und Suchmaschinen-Crawler.

## Quelle und Zitation

- HTML-Original: https://www.geoquality.ai/glossar/llms-txt
- Lizenz: CC BY 4.0
- Zitiervorschlag: "llms.txt (geoquality.ai Glossar, Biner 2026)"