Unbounded Dataset

Die klassische Batch-Verarbeitung behandelt abgeschlossene Datasets. Diese sind statisch und können je nach Anforderung vor der Verarbeitung beliebig sortiert, transformiert, gefiltert werden.

In der Real-Time-Verarbeitung treffen laufend neue Events ein, die in der Analyse zu berücksichtigen sind. Die Methoden der klassischen Batch-Verarbeitung funktionieren nicht mehr. Neue Herangehensweisen sind nötig um diese unbounded Datasets, also unbeschränkt wachsenden Datasets, zu verarbeiten und in Echtzeit zu analysieren.

Ein Unbounded Dataset kann als Queue, also Warteschlange, aufgefasst werden.

Synonyme:
unbeschränktes Dataset