Dans le Big Data, un énorme volume de données est utilisé. Concernant les données, nous avons deux défis principaux: le premier est de savoir comment collecter un grand volume de données et le second est d'analyser les données collectées. Pour surmonter ces défis, vous devez avoir besoin d'un système de messagerie.
Kafka est conçu pour les systèmes distribués à haut débit. Kafka a tendance à très bien fonctionner en remplacement d'un courtier de messages plus traditionnel.
Par rapport à d'autres systèmes de messagerie, Kafka offre un meilleur débit, un partitionnement intégré, une réplication et une tolérance aux pannes inhérente, ce qui en fait un outil idéal pour les applications de traitement de messages à grande échelle.
Apache Kafka est un système de messagerie de publication-abonnement distribué et une file d'attente robuste qui peut gérer un volume élevé de données et vous permet de transmettre des messages d'un point de terminaison à un autre.
Kafka convient à la consommation de messages hors ligne et en ligne.
Liste des sujets traités dans ce didacticiel:
Apache Kafka - Introduction
Apache Kafka - Principes de base
Apache Kafka - Architecture de cluster
Apache Kafka - WorkFlow
Apache Kafka - Étapes d'installation
Apache Kafka - Opérations de base
Apache Kafka - Exemple de producteur simple
Apache Kafka - Exemple de groupe de consommateurs
Apache Kafka - Intégration avec Storm
Apache Kafka - Intégration avec Spark
Application en temps réel (Twitter)
Apache Kafka - Outils
Apache Kafka - Applications