SF33572
3 jours
Formation Apache Flink.
Formez-vous au développement d'applications Big Data avec Flink !
A l'issue de cette formation Flink, les participants seront en mesure d'utiliser ce framework Big data pour réaliser des traitements sur les données de leur entreprise. Ils maîtriseront les APIs DataStream, Table, et sauront utiliser Flink SQL sur des flux de données. La formation se termine par l’appropriation des bonnes pratiques pour le déploiement de Flink.
Programme de formation Apache Flink.
Introduction à la formation Flink
Présentation générale de la formation
Objectifs pédagogiques
Introduction à Flink : intérêt, évolution, différences avec Spark…
Ecosystème
Batch processing vs Stream processing
Flux de données parallèles
Les notions State, Time et Snapshots
Configuration d’un premier projet Flink
Maven ou Gradle
Dépendances
Anatomie d’un programme Flink
Transformer des données avec l’API DataStream
Introduction à l’API DataStream
Types de données et sérialisation, Java/Scala
Environnement d’exécution et paramètres
Data sources
Transformations stateless, stateful
Opérateurs de transformations : Map, FlatMap, Filter…
Data sinks
Debug
Streaming Analytics : event time et watermarks
Event time, ingestion time et processing time
Travailler avec les watermarks
Utiliser les Windows pour traiter des flux de données : Tumbling, Sliding, Session et Global
L’API Table et Flink SQL
Types de données
Créer un TableEnvironment
Créer et requêter des tables
Les opérateurs à connaître
Configurer et exécuter un programme Flink SQL
Utiliser les fonctions pour transformer les données
Optimisation
Connecteurs
Vue d’ensemble des possibilités d’interfaçage avec d’autres systèmes Big Data (Kafka, Cassandra, ElasticSearch, RabbitMQ…)
Librairies
Vue d’ensemble
FlinkCEP (Complex Event Processing library)
FlinkML : la librairie Apache Flink pour le Machine Learning
Gelly, l’API Flink Graph
Déploiement d’un cluster Flink
Vue d’ensemble et architecture
Les différents modes de déploiement
Configurations
Prêts pour la mise en production ? Checklist
Déployer un cluster multinœuds
Nos autres formations en Big Data .
Formation Airflow
Formation Apache Flink
Formation Apache Kafka
Formation Apache NiFi
Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions
Formation Big Data : état de l’art
A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.
En apprendre davantage sur Apache Flink.
Apache Flink a été développé par l’Université de Berlin. C’est un framework et un moteur de traitement distribué utilisé pour réaliser des analyses sur des flux de données limités ou illimités.