Dokumentations-SEO: Technische Docs für KI-Modelle zugänglich machen

· von geaio

Definition: Dokumentations-SEO bezeichnet die technische und inhaltliche Optimierung von Dokumentations-Websites — API-Referenzen, Entwickler-Handbücher und Nutzeranleitungen — damit KI-Crawler wie GPTBot, ClaudeBot und PerplexityBot deren Inhalte vollständig erfassen und in KI-generierten Antworten zitieren können.

Warum KI-Crawler technische Dokumentation oft nicht erreichen

Technische Dokumentation ist für KI-Modelle besonders wertvolles Trainings- und Retrievalmaterial: Präzise Definitionen, klare Schritt-für-Schritt-Anleitungen und eindeutige Fachbegriffe sind genau das, woraus KI-Systeme verlässliche Antworten zusammensetzen. In der Praxis scheitert Dokumentations-SEO jedoch an drei wiederkehrenden Problemen.

Problem 1 – JavaScript-Rendering: Viele Docs-Plattformen wie Docusaurus, GitBook oder Mintlify liefern Inhalte ausschließlich clientseitig via JavaScript. Eine inhaltlich hochwertige Seite, die vollständig per JavaScript gerendert wird, ist für die KI-Crawler, die Modelle trainieren, faktisch unsichtbar — unabhängig von ihrer inhaltlichen Qualität. (Search Engine Journal, 2025)

Problem 2 – Pauschalblockierung ohne Differenzierung: GPTBot ist der am häufigsten blockierte KI-Crawler weltweit und erscheint in 5,52 % aller DISALLOW-Regeln in robots.txt-Dateien (Cloudflare-Auswertung via technologychecker.io, Q1 2026). Viele Website-Betreiber blockieren ihn undifferenziert — auch auf Seiten, auf denen eine gezielte Freigabe für Retrieval-Crawler sinnvoll wäre.

Problem 3 – Fehlende Priorisierung: Dokumentations-Websites umfassen oft Hunderte bis Tausende von Unterseiten. Ohne klare Signale crawlen KI-Bots wahllos Changelog-Einträge, Deprecated-Seiten und interne Versionsartefakte — statt der eigentlichen Kernkonzepte und API-Referenzen.

llms.txt: Kuratierter Einstiegspunkt für Docs-Projekte

Die llms.txt-Datei, 2024 von Jeremy Howard vorgeschlagen und inzwischen unter anderem von Anthropic, Stripe und Vercel implementiert, ist eine Markdown-Datei im Root-Verzeichnis einer Website. Sie beschreibt in menschlich lesbarer Sprache, welche Seiten für KI-Modelle am relevantesten sind — eine Art kuratiertes Inhaltsverzeichnis speziell für KI-Crawler.

Für Dokumentations-Projekte ist dieser Ansatz besonders wirkungsvoll: Statt alle 800 Seiten eines Docs-Portals crawlen zu lassen, listet eine gut strukturierte llms.txt die wichtigsten Konzeptseiten, API-Endpunkte und Tutorials direkt auf. Ein minimaler, wirkungsvoller Aufbau sieht so aus:

# Produktname – Dokumentation

> Kurze Beschreibung des Produkts in 2–3 präzisen Sätzen.

## Kernkonzepte
- [Einführung](https://example.com/docs/intro): Grundlegende Architektur und Terminologie
- [Authentifizierung](https://example.com/docs/auth): API-Keys, OAuth, Sicherheitshinweise

## API-Referenz
- [Endpunkte](https://example.com/docs/api): Vollständige REST-API-Referenz mit Beispielen

## Schnellstart
- [Erste Schritte](https://example.com/docs/quickstart): Schritt-für-Schritt-Anleitung (5 Minuten)