Pagination für KI-Crawler: rel=next/prev korrekt einsetzen
Definition: Pagination bezeichnet die Aufteilung großer Inhaltsmengen – etwa Produktlisten, Blog-Archive oder Kategorieseiten – auf mehrere URLs. Für KI-Crawler und klassische Suchmaschinen entscheidet die technische Konfiguration darüber, ob tiefe Unterseiten überhaupt gecrawlt, indexiert und als Wissensquelle für KI-generierte Antworten berücksichtigt werden.
Was rel=next/prev heute noch leistet
Bis 2019 galt rel="next" und rel="prev" als Standardsignal, mit dem Webmaster Suchmaschinen mitteilen konnten: „Diese Seiten gehören zu einer paginierten Serie.” Google nutzte die Attribute, um Ranking-Signale über eine Seitenserie hinweg zusammenzuführen.
Im März 2019 enthüllte Google, dass es diese Tags bereits seit Jahren ignoriert hatte. Laut der offiziellen Ankündigung von Google Search Central (2019) hatte der Algorithmus gelernt, Paginierungsstrukturen eigenständig zu erkennen, sodass das explizite Markup überflüssig wurde. Was die SEO-Community schockte: Die Änderung war unbemerkt Jahre früher eingetreten.
Was bedeutet das konkret für die KI-Ära? KI-Crawler wie GPTBot (OpenAI), ClaudeBot (Anthropic) oder Perplexitybot folgen ebenfalls keinen rel=next/prev-Hinweisen. Ein Live-Experiment von Journey Further (2025) belegt dies mit Messdaten: URLs, die ausschließlich über rel=next/prev-Tags verknüpft waren und keine sichtbaren HTML-Ankerlinks besaßen, wurden von Googlebot über sechs Wochen hinweg nicht gecrawlt. Page 3 der Testserie wurde zum Zeitpunkt der Veröffentlichung überhaupt nicht besucht.
Fazit für die Praxis: Das Markup schadet nicht und kann für Bing, Browser-Prefetching und Barrierefreiheit sinnvoll sein. Als Crawling-Signal für KI-Bots taugt es nicht.
Warum Pagination das Crawl Budget von KI-Bots verschwendet
KI-Modelle und Suchmaschinen arbeiten mit einem begrenzten Crawl Budget – der Anzahl der URLs, die ein Bot pro Zeiteinheit besucht. Schlecht konfigurierte Paginierung gehört zu den häufigsten Ursachen für Crawl-Budget-Verlust, weil sie Bots in endlose Seiten mit geringem Mehrwert zieht.
Laut einem Audit von SEOmytics (2026), der 47 E-Commerce- und Archiv-Websites zwischen Januar und April 2026 umfasste, befanden sich im Durchschnitt 73 % aller tiefen paginierten Unterseiten außerhalb des Google-Index. Auf 38 % der analysierten Sites führten Paginierungsfehler direkt zu messbaren Index-Coverage-Problemen.
Typische Szenarien, die Crawl Budget verschwenden:
- Endlose Filterparameter:
/kategorie?page=2&sort=preis&farbe=blauerzeugt tausende nahezu identischer URLs - Zu tiefe Paginierungsketten: Produkte auf Seite 20 oder 30 einer Kategorie werden von KI-Crawlern kaum noch erreicht
- Canonical-Fehler: Seiten 2–N zeigen auf Seite 1, was tiefe Seiten als Duplikate deklariert und aus dem Index entfernt
- JavaScript-only-Pagination: KI-Crawler erkennen nur statisch gerenderte Links zuverlässig
Wie das Crawl Budget von KI-Bots und die Server-Response-Zeit zusammenhängen, lässt sich direkt messen: Wer Paginierung nicht kontrolliert, verschwendet Budget für Low-Value-URLs und bremst gleichzeitig die Indexierung hochwertiger Inhalte, die KI-Systeme als Quelltext zitieren könnten.
Die 4 häufigsten Pagination-Fehler und ihre Folgen
| Fehler | Symptom in GSC | Auswirkung auf KI-Sichtbarkeit |
|---|---|---|
| Canonical von Seite 2–N auf Seite 1 | „Duplicate, submitted URL not selected as canonical” | Produkte und Inhalte auf tiefen Seiten werden nicht indexiert |
robots.txt blockiert ?page= | Crawl-Fehler, fehlende Indexierung | Content komplett unsichtbar für alle KI-Crawler |
| JavaScript-Pagination ohne HTML-Links | Nur Seite 1 im Index | Laut Onely (2019): 40 % des JS-Contents nach 14 Tagen unindexiert |
| Fehlende self-referencing Canonical Tags | Google wählt eigene Canonical-URL | Unvorhersehbare, inkonsistente KI-Sichtbarkeit |
Ein konkretes Zahlenbeispiel: Die britische Fashion-Retailerin SilkFred hatte Anfang 2019 69 % ihrer Produktseiten durch fehlerhafte Paginierungsblockierung für Google unsichtbar gemacht. Nach der Korrektur stieg der Anteil indexierbarer Seiten von 31 % auf 99 % – eine nahezu vollständige Wiederherstellung der organischen Reichweite. (Lumar, 2020)
Pagination korrekt konfigurieren: Best Practices für KI-Crawler
Die moderne Paginierungsstrategie in der GEO- und SEO-Optimierung baut nicht mehr auf rel=next/prev, sondern auf fünf strukturellen Prinzipien:
1. Self-referencing Canonical Tags auf jeder Seite
Seite 2 erhält <link rel="canonical" href="/kategorie/seite/2/"> – nicht auf Seite 1. Damit gilt jede paginierte Seite als eigenständig indexierbar. Wie Canonical Tags in der generativen Suche korrekt eingesetzt werden, beschreibt der Leitfaden über Canonical Tags für KI-Crawler und Duplikate.
2. Sichtbare HTML-Ankerlinks in der Navigation
Pagination muss mit klickbaren <a href="..."> Links umgesetzt sein – kein JavaScript-only, keine Fragment-IDs wie #page2. Nur echte Ankerlinks werden von KI-Crawlern zuverlässig verfolgt. Eine Zahlennavigation (1, 2, 3, 4 … Weiter) ist besser als reine Vor/Zurück-Links, weil sie mehrere Einstiegspunkte in die Kette bietet.
3. Einzigartige Metadaten pro Seite
Laut SEOmytics (2026) verloren Sites mit identischen Meta-Descriptions über alle paginierten Seiten nach dem Google-Core-Update März 2026 zwischen 22 und 41 % ihrer Ranking-Positionen für tiefe Kategorieseiten. Jede Seite benötigt ein eindeutiges <title>-Tag und eine seitenspezifische Meta-Description, z. B. „Laufschuhe – Seite 3 von 12”. Gleiches gilt für die H1-Überschrift.
4. Tiefenlimit und Crawl-Budget-Schutz
Bei sehr großen Websites (mehr als 10.000 URLs) empfiehlt es sich, tiefe Paginierungsseiten ab Seite 8 oder 10 mit noindex, follow zu kennzeichnen. Das follow stellt sicher, dass verlinkte Produkt- oder Inhaltsseiten weiterhin gecrawlt werden, ohne dass die Paginierungsseite selbst Crawl Budget verbraucht.
5. XML-Sitemap als Direktzugang für KI-Bots
Tiefe Inhalte, die nur über Paginierung erreichbar sind, lassen sich zusätzlich in der XML-Sitemap für KI-Crawler listen. So haben GPTBot, ClaudeBot und Perplexitybot einen direkten Zugangspunkt – unabhängig davon, wie tief die Paginierungskette ist.
Pagination-Strategien im Vergleich — welche eignet sich wann?
| Strategie | Wann sinnvoll | Vorteil | Risiko |
|---|---|---|---|
| Self-canonical (jede Seite eigenständig) | Blog-Archive, tiefe Produktkataloge | Maximale Indexierung und KI-Sichtbarkeit | Mehr indexierte URLs |
| Canonical auf Seite 1 | Thin Content, wenig Unique Content pro Seite | Signalkonsolidierung auf Hauptseite | Produkte auf Seite 2+ unsichtbar |
| noindex, follow ab Seite X | Sehr große Kataloge (>10.000 URLs) | Schützt Crawl Budget | Links müssen explizit crawlbar bleiben |
| robots.txt-Blocking | Nahezu nie empfehlenswert | — | Vollständiger Content-Verlust für alle Crawler |
| Infinite Scroll mit Fallback-URLs | Moderne UX gewünscht | Gute User Experience | Fragile JS-Implementierung kann Crawl brechen |
Fazit: Pagination als Hebel für KI-Sichtbarkeit
rel=next/prev ist als Crawling-Signal Geschichte. Was in der KI-Ära zählt, ist eine saubere technische Pagination-Architektur: sichtbare HTML-Ankerlinks, self-referencing Canonical Tags, einzigartige Metadaten pro Seite und ein bewusstes Crawl-Budget-Management. Wer diese Stellschrauben richtig justiert, macht tiefe Inhalte für KI-Crawler erreichbar – und erhöht damit messbar die Chance, in ChatGPT, Perplexity, Google AI Overviews und Claude als Quelle zitiert zu werden.
Für die GEO-Optimierung gilt: Nur indexierte Seiten können in KI-Antworten erscheinen. Pagination ist damit kein rein technisches Detail, sondern ein direkter Hebel auf die KI-Sichtbarkeit Ihrer gesamten Website. geaio erkennt automatisch, welche paginierten URLs von KI-Crawlern nicht erreicht werden können, und bewertet die Konfiguration im geaio Score.
Häufig gestellte Fragen
Muss ich rel=next/prev aus meinem Code entfernen? Nein. Das Markup schadet nicht und kann für Bing, Browser-Prefetching und Web-Accessibility weiterhin sinnvoll sein. Google und KI-Crawler wie GPTBot ignorieren es seit mindestens 2019. Es besteht kein Handlungsbedarf, die Tags aktiv zu entfernen – wichtiger ist die korrekte Canonical-Konfiguration.
Warum verschwinden meine paginierten Seiten aus dem Google-Index? Die häufigste Ursache ist ein Canonical-Fehler: Seiten 2–N zeigen auf Seite 1 und werden als Duplikate eingestuft. Alternativ fehlen sichtbare HTML-Ankerlinks, oder ein robots.txt-Eintrag blockiert Paginierungs-URLs versehentlich. Der Filter „Duplicate, submitted URL not selected as canonical” in der Google Search Console zeigt betroffene Seiten direkt an.
Wie behandeln KI-Crawler wie GPTBot oder ClaudeBot Pagination? KI-Crawler folgen HTML-Ankerlinks – ähnlich wie Googlebot. URLs, die ausschließlich über JavaScript oder rel=next/prev verknüpft sind, werden oft nicht gecrawlt. Ohne sichtbare Verlinkung und korrekte Canonical-Tags bleiben tiefe Paginierungsseiten für KI-Modelle unsichtbar und stehen nicht als Textquelle für generierte Antworten zur Verfügung.
Welche Paginierungsstrategie empfiehlt sich für Shops mit mehr als 10.000 Produkten?
Für sehr große Kataloge empfiehlt sich eine Kombination: Self-referencing Canonical Tags auf Seiten 1–5 einer Kategorie sichern Indexierung und Long-Tail-Traffic. Ab Seite 6 oder 8 schützt noindex, follow das Crawl Budget, während verlinkte Produktseiten weiterhin gecrawlt werden. Ergänzend sollten alle Produkt-URLs direkt in der XML-Sitemap gelistet sein, damit KI-Crawler sie unabhängig von der Paginierungstiefe erreichen.