Was ist Rate Limiting | Business.Digital

Rate Limiting ist eine Schutzmaßnahme von APIs und Webservices, die die Anzahl der Anfragen begrenzt, die ein Client in einem bestimmten Zeitraum senden darf. Wenn du zu viele Anfragen zu schnell stellst, antwortet der Server mit einem HTTP-Fehler 429 (Too Many Requests) und verweigert weitere Anfragen für eine bestimmte Zeit.

Das klingt wie eine Einschränkung, ist aber sinnvoll. APIs sind gemeinsame Ressourcen. Wenn ein Nutzer sie mit Tausenden Anfragen pro Sekunde überflutet, leidet die Performance für alle anderen. Rate Limiting schützt die Stabilität des Systems.

Wie sind typische Rate Limits aufgebaut?

Rate-Limit-Strukturen variieren stark nach Anbieter. Typische Beispiele: 100 Anfragen pro Minute (ein moderates Limit für kleinere APIs), 1000 Anfragen pro Stunde (stündliches Rolling Window), 10.000 Anfragen pro Tag (tagesbasiertes Limit). Manche Systeme kombinieren mehrere Limits gleichzeitig: maximal 10 Anfragen pro Sekunde UND maximal 5000 pro Stunde.

Die Limits stehen in der API-Dokumentation des Anbieters. Sie sind nicht verhandelbar, außer bei Enterprise-Tarifen mit erhöhten Limits.

Was passiert, wenn du Rate Limiting erreichst?

Der 429-Fehler kommt zurück, oft mit einem Retry-After-Header, der angibt, wie viele Sekunden du warten soll. Automatisierungen, die diesen Fall nicht behandeln, scheitern einfach und lassen Daten aus.

Richtig implementierte Systeme fangen den 429-Fehler ab, warten die angegebene Zeit und versuchen es dann erneut (Retry-Mechanismus). Das kombiniert mit einer Exponential Backoff-Strategie, bei der die Wartezeit bei jedem weiteren Fehler verdoppelt wird, ist der Standard-Ansatz.

Wie vermeidest du Rate-Limiting-Probleme?

Erstens durch Queuing: Statt alle Anfragen gleichzeitig zu schicken, werden sie in einer Queue mit kontrollierter Geschwindigkeit abgearbeitet. Wenn das Limit 100 Anfragen pro Minute erlaubt, konfigurierst du die Queue so, dass maximal 80 pro Minute gesendet werden (mit Sicherheitspuffer).

Zweitens durch Batching: Statt 100 einzelne Produktupdates als 100 separate Anfragen zu senden, fasst du sie in eine einzige Batch-Anfrage zusammen, wenn die API das unterstützt.

Drittens durch Caching: Wenn du dieselben Daten mehrmals in kurzer Zeit abrufst, caches du das erste Ergebnis lokal und sparst dir die wiederholten API-Anfragen.

Bei der Automation und Softwareentwicklung von Schnittstellen behandeln wir Rate Limiting immer als festen Bestandteil der Architektur, nicht als nachträgliches Problem. Beim Termin können wir besprechen, welche APIs bei dir die kritischen Limits haben.

Name	Anbieter	Zweck	Laufzeit
bd_consent	business.digital	Speichert den Cookie-Einwilligungsstatus	12 Monate
bd_cookie_consent	business.digital	Speichert die detaillierten Cookie-Einstellungen	12 Monate
_GRECAPTCHA / rc::*	Google LLC (USA)	Spam-Schutz für das Kontaktformular (reCAPTCHA)	6 Monate
Google Calendar	Google LLC (USA)	Terminbuchung für Erstgespräch	Sitzung

Name	Anbieter	Zweck	Laufzeit
_ga	Google LLC (USA)	Google Analytics: Unterscheidung von Nutzern	2 Jahre
_ga_*	Google LLC (USA)	Google Analytics: Sitzungsstatus speichern	2 Jahre

Name	Anbieter	Zweck	Laufzeit
_gcl_au	Google LLC (USA)	Google Ads: Conversion-Tracking	3 Monate
_fbp	Meta Platforms (USA)	Facebook Pixel: Nutzeridentifikation	3 Monate

Was ist Rate Limiting?

Wie sind typische Rate Limits aufgebaut?

Was passiert, wenn du Rate Limiting erreichst?

Wie vermeidest du Rate-Limiting-Probleme?

Verwandte Fragen

Lass uns herausfinden, was bei dir möglich ist.

Weiterführende Ressourcen

Tools & Services

Magazin

FAQ