Обзор
Комплексная платформа для потоковой передачи данных в реальном времени от периферии до облака.
Cloudera DataFlow (CDF) представляет собой масштабируемую платформу для аналитики потоковых данных в режиме реального времени, которая принимает, обрабатывает и анализирует данные для получения ключевой аналитической информации и мгновенных информированных действий. DataFlow решает следующие задачи:
- Потоковая передача данных в реальном времени в большом объеме и большом масштабе
- Отслеживание происхождения данных и прослеживание потоковых данных (lineage).
- Управление и мониторинг периферийных устройств и источников потоковых данных
- Получение аналитической информации и практических сведений в режиме реального времени из потоковых данных
DataFlow в CDP
Все возможности DataFlow доступны в рамках версии дистрибутива Cloudera Data Platform (CDP) для публичных облаков. Вы можете воспользоваться ключевыми преимуществами CDP, такими как быстрое предоставление ресурсов кластера, управление и мониторинг. Shared Data Experience (SDX) в CDP также обеспечивает единый уровень безопасности и управления для всех компонентов DataFlow.

Платформа Cloudera DataFlow (CDF)
Edge & Flow Management
Управляйте, контролируйте и отслеживайте потоковую передачу данных с периферии и IoT-инициатив, а также получайте потоковые данные в реальном времени без написания кода.
Streams Messaging
Буферизация и масштабирование больших объемов принимаемых данных для удовлетворения потребностей в данных других корпоративных и облачных приложений, которым необходим доступ к ним в реальном времени.
Потоковая обработка и аналитика
Улучшение обнаружения критических событий и реагирование на них для достижения ценных бизнес-результатов.
Сценарии использования
Модернизация ведения логов
Customer 360
Аналитика в режиме реального времени
Модернизация ведения логов
Раскройте ценность машино-генерируемых данных путём модернизации ведения логов с помощью CDF.
Модернизация логов - это целостный подход к раскрытию ценности данных, генерируемых машинами, снижение затрат на обработку и создание ряда новых аналитических сценариев использования. Это достигается за счет приема данных в режиме реального времени, периферийной обработки, преобразования и маршрутизации логов до описательной, предписывающей и предиктивной аналитики.
Customer 360
Получите полное представление о своих клиентах, собрав все данные из нескольких источников.
Одна из основных инициатив в области цифровой трансформации в организациях - получение полного представления о своих клиентах. Но данные о клиентах находятся в нескольких источниках, таких как традиционные корпоративные базы данных, озера данных, облачные хранилища и социальные сети. Возможности приема данных и обмена сообщениями CDF позволяют без проблем получать, комбинировать, обогащать и обрабатывать данные из всех этих источников и дают полное представление о ваших клиентах.
Аналитика в режиме реального времени
Прогнозируйте сбои и предпринимайте корректирующие действия в режиме реального времени.
Ваши реализации сценариев IoT или потоковой аналитики хороши ровно настолько, насколько хороша Ваша способность использовать ценность данных, которые Вы получаете в режиме реального времени. Сценарии использования Интернета вещей, такие как предиктивное обслуживание или наблюдение за пациентами, требуют, чтобы данные мгновенно потреблялись и обрабатывались для получения предиктивной и предписывающей аналитики в реальном времени. В некоторых случаях это может быть действительно жизненно важным.