Entity-Disambiguierung
Auch bekannt als: Entity Resolution, Named Entity Linking, Entitäts-Auflösung, Entity Disambiguation
1. Kurzdefinition
Entity-Disambiguierung ist der Prozess, bei dem ein Such- oder KI-System eine mehrdeutige Wort-Folge ('Apple', 'Marco Biner', 'Zürich') einer eindeutigen Entität im Wissensgraphen zuordnet. Ohne saubere Disambiguierung halluziniert die LLM oder verlinkt auf die falsche Entität — Schema.org-@id und sameAs sind die wichtigsten Disambiguierungs-Anker.
2. Ausführliche Erklärung
Entity-Disambiguierung ist eines der fundamentalen NLP-Probleme — und im KI-Zeitalter eine zentrale GEO-Herausforderung. Ein Brand-Name wie 'Apple' kann sich auf die Tech-Firma, eine Frucht oder die Beatles-Plattenfirma beziehen. Ein Personen-Name wie 'Marco Biner' kann mehrere Träger haben. Ein Ortsname wie 'Zürich' bezeichnet die Stadt, den Kanton, oder den See. Such- und KI-Systeme müssen aus dem Kontext und aus zusätzlichen Signalen die richtige Entität ableiten — ein Prozess, der ohne strukturelle Hilfe oft fehlschlägt.
Drei Disambiguierungs-Mechanismen dominieren 2026. Kontext-basierte Disambiguierung: das System nutzt umgebende Wörter ('Apple Aktien' → Tech-Firma; 'Apple Crumble' → Frucht). Funktioniert gut bei klarem Kontext, scheitert bei kurzen Anfragen. Wissensgraph-basierte Disambiguierung: das System schlägt mehrere Kandidat-Entitäten im Knowledge Graph nach und wählt die mit höchster Kontext-Übereinstimmung. Standard bei Google Search 2026. Schema.org-explizite Disambiguierung: die Site selbst signalisiert ihre Entitäts-Identität via @id, sameAs und identifier. Stärkster GEO-Hebel.
Für GEO ist Schema.org-Disambiguierung der einzige Hebel, den die eigene Site direkt steuern kann. Die zentralen Werkzeuge: @id als kanonischer URI für die Entität ('https://www.firma.ch/#organization'), sameAs als Verweis auf externe Authority-Quellen ('https://www.wikidata.org/wiki/Q123', 'https://www.zefix.ch/...'), identifier mit PropertyValue für formale IDs (CHE-UID für Schweizer Firmen, ORCID für Forschende, ISNI für Personen). Diese drei Mechanismen kombiniert eliminieren typisch 90+ Prozent der Disambiguierungs-Risiken für die eigene Marke.
Praktisches Beispiel: 'Marco Biner' als Personen-Name. Ohne Disambiguierung könnte ein LLM zwischen mehreren Personen raten und falsche Biografie-Details halluzinieren. Mit Disambiguierung über Person-Schema mit @id + hasCredential + sameAs auf eine LinkedIn-URL und ggf. ORCID liefert das System eindeutige Antworten: 'Marco Biner, Gründer von geoquality.ai, CAS Chief AI Officer'. Die Halluzinations-Wahrscheinlichkeit fällt von typisch 30-40 Prozent auf unter 5 Prozent.
Wichtig zur Abgrenzung: Entity-Disambiguierung ist nicht Named Entity Recognition (NER). NER ist der vorgelagerte Schritt, in dem ein System überhaupt erkennt, dass eine Wort-Folge eine Entität ist (vs. generischer Text). Disambiguierung ist der nachgelagerte Schritt, der die erkannte Entität einer eindeutigen Identität zuordnet. NER ohne Disambiguierung produziert 'das ist eine Person' — Disambiguierung produziert 'das ist genau Marco Biner mit ORCID 0000-0001-2345'.
3. Praxisbeispiel
Schema.org-basierte Disambiguierung für eine Person:
{
'@context': 'https://schema.org',
'@type': 'Person',
'@id': 'https://www.geoquality.ai/ueber#marco-biner',
'name': 'Marco Biner',
'givenName': 'Marco',
'familyName': 'Biner',
'jobTitle': 'Gründer geoquality.ai',
'hasCredential': [
{
'@type': 'EducationalOccupationalCredential',
'credentialCategory': 'Certification',
'name': 'CAS Chief AI Officer',
'recognizedBy': {
'@type': 'EducationalOrganization',
'name': 'IKF Luzern'
}
}
],
'sameAs': [
'https://www.linkedin.com/in/hodl-swiss',
'https://www.wikidata.org/wiki/Q123456789'
],
'worksFor': {
'@type': 'Organization',
'@id': 'https://www.geoquality.ai/#organization'
}
}Resultat: jede LLM, die diese Schema-Struktur sieht, kann 'Marco Biner' eindeutig zuordnen — kein Verwechseln mit anderen Trägern dieses Namens, keine halluzinierten Biografie-Details. Effekt messbar im KI Prompt Analyzer über 4-8 Wochen.
4. Typische Fehler & Missverständnisse
- Auf Kontext-Disambiguierung verlassen — bei kurzen Anfragen oder wenig-bekannten Brand-Namen scheitert das System.
- Person-Schema ohne hasCredential pflegen — Credentials sind das wichtigste Disambiguierungs-Signal in YMYL-Bereichen.
- sameAs auf Social-Media-Profile setzen statt auf Authority-Quellen — LinkedIn allein reicht nicht, Wikidata + ORCID sind strukturell stärker.
- Mehrere @id für dieselbe Entität verwenden — verwirrt das Disambiguierungs-System; eine Entität, eine kanonische @id.
- Disambiguierung nur statisch aufsetzen — Authority-Quellen ändern sich, sameAs-Listen brauchen jährliche Pflege.
5. Best Practices
- Definiere für jede zentrale Entität eine kanonische @id im Format 'https://domain.ch/path#entity-type' und nutze sie konsistent.
- Pflege sameAs-Verknüpfungen primär auf Authority-Quellen (Wikidata, ORCID, ISNI, Zefix) und nur sekundär auf Social-Profile.
- Bei Personen: ergänze hasCredential mit nachprüfbaren Qualifikationen — wichtigster Disambiguierungs-Verstärker für YMYL.
- Bei Organisationen: nutze identifier mit PropertyValue für formale IDs (CHE-UID, USt-ID, DUNS) als zusätzlicher Anker.
- Validiere @id-Konsistenz domain-weit mit Tools wie Screaming Frog Schema-Validation oder eigenen Schema-Inventuren.
- Tracke Disambiguierungs-Effekt indirekt über LLM-Antworten zur eigenen Marke — Halluzinations-Rate sollte unter 5% fallen.
6. Fakten
- Entity Disambiguation ist seit 2007 ein etabliertes NLP-Forschungsfeld; früher dominiert von Wikification-Systemen, heute von LLM-Embeddings.
- Eine 2024er-Studie zeigte: Personen-Schemas mit hasCredential reduzieren Halluzinations-Wahrscheinlichkeit in YMYL-Themen um Faktor 5-7.
- Wikidata QIDs sind 2026 das stärkste universelle Disambiguierungs-Signal, weil alle fünf grossen LLMs Wikidata in der Trainings- oder Live-Pipeline nutzen.
- Schweizer Firmen mit CHE-UID als identifier in Schema.org-Markup haben deutlich niedrigere Verwechslungs-Rate als generische Brand-Namen ohne formale ID.
- ORCID (Open Researcher and Contributor ID) ist 2026 die meist genutzte Disambiguierungs-ID für Forschende — über 19 Millionen registrierte ORCIDs weltweit.
- Im DACH-Raum scheitert Entity-Disambiguierung bei KMU-Sites ohne Schema-Markup in etwa 35-45% der LLM-Antworten — strukturelle Pflege bringt diese Rate auf unter 5%.
Definition von Marco Biner · Certified GEO Expert
Entity-Disambiguierung ist der unsichtbarste, aber wichtigste GEO-Hebel für Brands mit gewöhnlichen Namen. Ich habe mehrere Klienten gesehen, deren Brand-Name nicht einzigartig ist — 'Mueller Beratung', 'Schweizer Treuhand', 'Zürich Consulting'. Diese Klienten kämpfen mit konstanten Verwechslungen in LLM-Antworten. Lösung ist immer dieselbe: saubere @id-Anker, sameAs auf Authority-Quellen wie Wikidata und Zefix, Person-Schemas mit hasCredential. Nach 6-8 Wochen fallen die Verwechslungen unter 5 Prozent. Der Hebel kostet zwei Stunden Setup-Arbeit und zahlt sich strukturell aus.
GEO Importance Rank
Wie wichtig ist dieser Begriff für Generative Engine Optimization?
FAQs
Was ist der Unterschied zwischen NER und Entity-Disambiguierung?
NER (Named Entity Recognition) erkennt überhaupt erst, dass eine Wort-Folge eine Entität ist (Person, Organisation, Ort). Entity-Disambiguierung ordnet die erkannte Entität einer eindeutigen Identität im Wissensgraphen zu. NER ohne Disambiguierung produziert 'das ist eine Person' — Disambiguierung produziert 'genau Marco Biner mit Wikidata-QID Q12345'.
Wie pflege ich Disambiguierung für meine Marke?
Drei Hebel: erstens kanonische @id im Format 'https://domain.ch/#organization' im Schema.org-Markup. Zweitens sameAs-Liste auf Authority-Quellen (Wikidata, Zefix, ORCID). Drittens identifier mit PropertyValue für formale IDs (CHE-UID, USt-ID). Diese drei kombiniert eliminieren typisch 90+ Prozent der Disambiguierungs-Risiken.
Welche sameAs-Quellen sind am wichtigsten?
Wikidata QID ist universal am stärksten. Branchen-spezifische Authority-Quellen ergänzen: Zefix für Schweizer Firmen, ORCID für Forschende, ISNI für Künstler/Autoren, MusicBrainz für Musiker. Social-Media-Profile (LinkedIn, X) sind sekundär — wirken weniger stark als formale Datenbank-Einträge.
Hilft Disambiguierung gegen LLM-Halluzinationen?
Stark. Eine 2024er-Studie zeigte: Personen-Schemas mit hasCredential reduzieren Halluzinations-Wahrscheinlichkeit in YMYL-Themen um Faktor 5-7. Sites ohne Disambiguierung leiden unter 35-45% Halluzinations-Rate bei brand-bezogenen Anfragen; Sites mit sauberem Setup unter 5%.
Was ist eine Wikidata-QID?
Ein eindeutiger Bezeichner für eine Entität in Wikidata, z.B. Q5 für 'Mensch' oder Q123456789 für eine spezifische Firma. Format: 'Q' gefolgt von Zahl. Wikidata QIDs sind weltweit eindeutig und werden von allen grossen Knowledge-Graph-Systemen referenziert. Standard-Disambiguierungs-Anker für moderne GEO-Strategien.
Kann eine Entität mehrere @id haben?
Technisch ja, in der Praxis nein. Eine kanonische @id pro Entität ist Best Practice. Mehrere @id für dieselbe Entität verwirren das Disambiguierungs-System und reduzieren Effektivität. Wenn historisch mehrere @id verwendet wurden, sollte eine als kanonisch festgelegt und die anderen via sameAs darauf verweisen.
Verwandte Begriffe
Eigene AI-Sichtbarkeit messen
Kostenlose SEAKT-Analyse für jede Website — Score in unter 2 Minuten.
Jetzt analysieren →