Pagination für KI-Crawler: rel=next/prev korrekt einsetzen

· von geaio

Definition: Pagination bezeichnet die Aufteilung großer Inhaltsmengen – etwa Produktlisten, Blog-Archive oder Kategorieseiten – auf mehrere URLs. Für KI-Crawler und klassische Suchmaschinen entscheidet die technische Konfiguration darüber, ob tiefe Unterseiten überhaupt gecrawlt, indexiert und als Wissensquelle für KI-generierte Antworten berücksichtigt werden.

Was rel=next/prev heute noch leistet

Bis 2019 galt rel="next" und rel="prev" als Standardsignal, mit dem Webmaster Suchmaschinen mitteilen konnten: „Diese Seiten gehören zu einer paginierten Serie.” Google nutzte die Attribute, um Ranking-Signale über eine Seitenserie hinweg zusammenzuführen.

Im März 2019 enthüllte Google, dass es diese Tags bereits seit Jahren ignoriert hatte. Laut der offiziellen Ankündigung von Google Search Central (2019) hatte der Algorithmus gelernt, Paginierungsstrukturen eigenständig zu erkennen, sodass das explizite Markup überflüssig wurde. Was die SEO-Community schockte: Die Änderung war unbemerkt Jahre früher eingetreten.

Was bedeutet das konkret für die KI-Ära? KI-Crawler wie GPTBot (OpenAI), ClaudeBot (Anthropic) oder Perplexitybot folgen ebenfalls keinen rel=next/prev-Hinweisen. Ein Live-Experiment von Journey Further (2025) belegt dies mit Messdaten: URLs, die ausschließlich über rel=next/prev-Tags verknüpft waren und keine sichtbaren HTML-Ankerlinks besaßen, wurden von Googlebot über sechs Wochen hinweg nicht gecrawlt. Page 3 der Testserie wurde zum Zeitpunkt der Veröffentlichung überhaupt nicht besucht.

Fazit für die Praxis: Das Markup schadet nicht und kann für Bing, Browser-Prefetching und Barrierefreiheit sinnvoll sein. Als Crawling-Signal für KI-Bots taugt es nicht.

Warum Pagination das Crawl Budget von KI-Bots verschwendet

KI-Modelle und Suchmaschinen arbeiten mit einem begrenzten Crawl Budget – der Anzahl der URLs, die ein Bot pro Zeiteinheit besucht. Schlecht konfigurierte Paginierung gehört zu den häufigsten Ursachen für Crawl-Budget-Verlust, weil sie Bots in endlose Seiten mit geringem Mehrwert zieht.

Laut einem Audit von SEOmytics (2026), der 47 E-Commerce- und Archiv-Websites zwischen Januar und April 2026 umfasste, befanden sich im Durchschnitt 73 % aller tiefen paginierten Unterseiten außerhalb des Google-Index. Auf 38 % der analysierten Sites führten Paginierungsfehler direkt zu messbaren Index-Coverage-Problemen.

Typische Szenarien, die Crawl Budget verschwenden:

  • Endlose Filterparameter: /kategorie?page=2&sort=preis&farbe=blau erzeugt tausende nahezu identischer URLs
  • Zu tiefe Paginierungsketten: Produkte auf Seite 20 oder 30 einer Kategorie werden von KI-Crawlern kaum noch erreicht
  • Canonical-Fehler: Seiten 2–N zeigen auf Seite 1, was tiefe Seiten als Duplikate deklariert und aus dem Index entfernt
  • JavaScript-only-Pagination: KI-Crawler erkennen nur statisch gerenderte Links zuverlässig

Wie das Crawl Budget von KI-Bots und die Server-Response-Zeit zusammenhängen, lässt sich direkt messen: Wer Paginierung nicht kontrolliert, verschwendet Budget für Low-Value-URLs und bremst gleichzeitig die Indexierung hochwertiger Inhalte, die KI-Systeme als Quelltext zitieren könnten.

Die 4 häufigsten Pagination-Fehler und ihre Folgen

FehlerSymptom in GSCAuswirkung auf KI-Sichtbarkeit
Canonical von Seite 2–N auf Seite 1„Duplicate, submitted URL not selected as canonical”Produkte und Inhalte auf tiefen Seiten werden nicht indexiert
robots.txt blockiert ?page=Crawl-Fehler, fehlende IndexierungContent komplett unsichtbar für alle KI-Crawler
JavaScript-Pagination ohne HTML-LinksNur Seite 1 im IndexLaut Onely (2019): 40 % des JS-Contents nach 14 Tagen unindexiert
Fehlende self-referencing Canonical TagsGoogle wählt eigene Canonical-URLUnvorhersehbare, inkonsistente KI-Sichtbarkeit

Ein konkretes Zahlenbeispiel: Die britische Fashion-Retailerin SilkFred hatte Anfang 2019 69 % ihrer Produktseiten durch fehlerhafte Paginierungsblockierung für Google unsichtbar gemacht. Nach der Korrektur stieg der Anteil indexierbarer Seiten von 31 % auf 99 % – eine nahezu vollständige Wiederherstellung der organischen Reichweite. (Lumar, 2020)

Pagination korrekt konfigurieren: Best Practices für KI-Crawler

Die moderne Paginierungsstrategie in der GEO- und SEO-Optimierung baut nicht mehr auf rel=next/prev, sondern auf fünf strukturellen Prinzipien:

1. Self-referencing Canonical Tags auf jeder Seite

Seite 2 erhält <link rel="canonical" href="/kategorie/seite/2/"> – nicht auf Seite 1. Damit gilt jede paginierte Seite als eigenständig indexierbar. Wie Canonical Tags in der generativen Suche korrekt eingesetzt werden, beschreibt der Leitfaden über Canonical Tags für KI-Crawler und Duplikate.

Pagination muss mit klickbaren <a href="..."> Links umgesetzt sein – kein JavaScript-only, keine Fragment-IDs wie #page2. Nur echte Ankerlinks werden von KI-Crawlern zuverlässig verfolgt. Eine Zahlennavigation (1, 2, 3, 4 … Weiter) ist besser als reine Vor/Zurück-Links, weil sie mehrere Einstiegspunkte in die Kette bietet.

3. Einzigartige Metadaten pro Seite

Laut SEOmytics (2026) verloren Sites mit identischen Meta-Descriptions über alle paginierten Seiten nach dem Google-Core-Update März 2026 zwischen 22 und 41 % ihrer Ranking-Positionen für tiefe Kategorieseiten. Jede Seite benötigt ein eindeutiges <title>-Tag und eine seitenspezifische Meta-Description, z. B. „Laufschuhe – Seite 3 von 12”. Gleiches gilt für die H1-Überschrift.

4. Tiefenlimit und Crawl-Budget-Schutz

Bei sehr großen Websites (mehr als 10.000 URLs) empfiehlt es sich, tiefe Paginierungsseiten ab Seite 8 oder 10 mit noindex, follow zu kennzeichnen. Das follow stellt sicher, dass verlinkte Produkt- oder Inhaltsseiten weiterhin gecrawlt werden, ohne dass die Paginierungsseite selbst Crawl Budget verbraucht.

5. XML-Sitemap als Direktzugang für KI-Bots

Tiefe Inhalte, die nur über Paginierung erreichbar sind, lassen sich zusätzlich in der XML-Sitemap für KI-Crawler listen. So haben GPTBot, ClaudeBot und Perplexitybot einen direkten Zugangspunkt – unabhängig davon, wie tief die Paginierungskette ist.

Pagination-Strategien im Vergleich — welche eignet sich wann?

StrategieWann sinnvollVorteilRisiko
Self-canonical (jede Seite eigenständig)Blog-Archive, tiefe ProduktkatalogeMaximale Indexierung und KI-SichtbarkeitMehr indexierte URLs
Canonical auf Seite 1Thin Content, wenig Unique Content pro SeiteSignalkonsolidierung auf HauptseiteProdukte auf Seite 2+ unsichtbar
noindex, follow ab Seite XSehr große Kataloge (>10.000 URLs)Schützt Crawl BudgetLinks müssen explizit crawlbar bleiben
robots.txt-BlockingNahezu nie empfehlenswertVollständiger Content-Verlust für alle Crawler
Infinite Scroll mit Fallback-URLsModerne UX gewünschtGute User ExperienceFragile JS-Implementierung kann Crawl brechen

Fazit: Pagination als Hebel für KI-Sichtbarkeit

rel=next/prev ist als Crawling-Signal Geschichte. Was in der KI-Ära zählt, ist eine saubere technische Pagination-Architektur: sichtbare HTML-Ankerlinks, self-referencing Canonical Tags, einzigartige Metadaten pro Seite und ein bewusstes Crawl-Budget-Management. Wer diese Stellschrauben richtig justiert, macht tiefe Inhalte für KI-Crawler erreichbar – und erhöht damit messbar die Chance, in ChatGPT, Perplexity, Google AI Overviews und Claude als Quelle zitiert zu werden.

Für die GEO-Optimierung gilt: Nur indexierte Seiten können in KI-Antworten erscheinen. Pagination ist damit kein rein technisches Detail, sondern ein direkter Hebel auf die KI-Sichtbarkeit Ihrer gesamten Website. geaio erkennt automatisch, welche paginierten URLs von KI-Crawlern nicht erreicht werden können, und bewertet die Konfiguration im geaio Score.


Häufig gestellte Fragen

Muss ich rel=next/prev aus meinem Code entfernen? Nein. Das Markup schadet nicht und kann für Bing, Browser-Prefetching und Web-Accessibility weiterhin sinnvoll sein. Google und KI-Crawler wie GPTBot ignorieren es seit mindestens 2019. Es besteht kein Handlungsbedarf, die Tags aktiv zu entfernen – wichtiger ist die korrekte Canonical-Konfiguration.

Warum verschwinden meine paginierten Seiten aus dem Google-Index? Die häufigste Ursache ist ein Canonical-Fehler: Seiten 2–N zeigen auf Seite 1 und werden als Duplikate eingestuft. Alternativ fehlen sichtbare HTML-Ankerlinks, oder ein robots.txt-Eintrag blockiert Paginierungs-URLs versehentlich. Der Filter „Duplicate, submitted URL not selected as canonical” in der Google Search Console zeigt betroffene Seiten direkt an.

Wie behandeln KI-Crawler wie GPTBot oder ClaudeBot Pagination? KI-Crawler folgen HTML-Ankerlinks – ähnlich wie Googlebot. URLs, die ausschließlich über JavaScript oder rel=next/prev verknüpft sind, werden oft nicht gecrawlt. Ohne sichtbare Verlinkung und korrekte Canonical-Tags bleiben tiefe Paginierungsseiten für KI-Modelle unsichtbar und stehen nicht als Textquelle für generierte Antworten zur Verfügung.

Welche Paginierungsstrategie empfiehlt sich für Shops mit mehr als 10.000 Produkten? Für sehr große Kataloge empfiehlt sich eine Kombination: Self-referencing Canonical Tags auf Seiten 1–5 einer Kategorie sichern Indexierung und Long-Tail-Traffic. Ab Seite 6 oder 8 schützt noindex, follow das Crawl Budget, während verlinkte Produktseiten weiterhin gecrawlt werden. Ergänzend sollten alle Produkt-URLs direkt in der XML-Sitemap gelistet sein, damit KI-Crawler sie unabhängig von der Paginierungstiefe erreichen.