
SF33548
3 jours
Formation Big Data on AWS (cours officiel).
3 jours de formation pour apprendre à traiter les données sur AWS !
Cette formation permettra aux participants de découvrir les solutions Big Data basées sur le cloud AWS : Amazon EMR, Amazon Redshift ou encore Amazon Kinesis. Ils apprendront à utiliser Amazon EMR pour traiter des données grâce à l'écosystème Hadoop, avec des outils comme Hive et Hue, créeront des environnements Big Data, et se formeront à l'utilisation d'Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena et Amazon Kinesis. A l'issue, ils maîtrisent les meilleures pratiques pour concevoir des environnements Big Data sécurisés et économiques sur AWS. Cette formation prépare au passage de l'examen de certification AWS Certified Big Data - Specialty (le voucher peut être fourni en fin de session, moyennant un coût supplémentaire). A noter que le niveau Specialty requiert une certification de niveau Associate pour être validée.
Programme de formation Big Data on AWS (cours officiel).
Introduction : aperçu du Big Data
Définition du Big Data
Pipeline du Big Data
Principes d’architecture du Big Data
Ingestion et transfert du Big Data
Ingestion de données dans AWS
Transfert de données
Diffusion du Big Data et Amazon Kinesis
Traitement de flux du big data
Amazon Kinesis
Amazon Kinesis Data Firehose
Amazon Kinesis Video Streams
Amazon Kinesis Data Analytics
Atelier 1 : Streaming and processing Apache Server Logs en utilisant Amazon Kinesis
Solutions de stockage du Big Data
Les options de stockage de données dans AWS
Concepts des solutions de stockage
Les facteurs à prendre en compte pour choisir un entrepôt de données
Traitement et analyses de données du Big Data
Traitement et analyses du Big Data
Amazon Athena
Atelier 2 : Utiliser Amazon Athena pour analyser les données du journal
Apache Hadoop et Amazon EMR
Introduction Amazon EMR et Apache Hadoop
Les bonnes pratiques pour ingérer les données
Amazon EMR
L’architecture d’Amazon EMR
Atelier 3 : Stocker et interroger les données sur Amazon DynamoDB
Utiliser Amazon EMR
Développer et faire fonctionner votre application
Lancer votre cluster
Gérer la sortie de vos travaux terminés
Cadres de programmation Hadoop
Les cadres Hadoop
Autres cadres d’utilisation sur Amazon EMR
Atelier 4 : Traitement des journaux de serveur avec Hive sur Amazon EMR
Interfaces web sur Amazon EMR
Hue sur Amazon EMR
Surveiller votre cluster
Atelier 5 : Fonctionnement de Pig Scripts dans Hue sur Amazon EMR
Apache Spark sur Amazon EMR
Apache Spark
Utiliser Spark
Atelier 6 : Traitement des données NY Taxi utilisant Apache Spark
Utiliser Amazon Glue pour automatiser les chargements de données ETL
Qu’est-ce que AWS Glue ?
AWS Glue : orchestration des tâches
Amazon Redshift et Big Data
Différence entre les entrepôts de données et les
bases de données traditionnelles
Amazon Redshift
L’architecture d’Amazon Redshift
Sécuriser vos déploiements Amazon
Le modèle de Responsabilité partagée d’AWS
Sécurité d’Amazon EMR
AWS Identity and Access Management
Sécuriser les données
Sécurité d’Amazon Kinesis
Sécurité d’Amazon DynamoDB
Sécurité d’Amazon Redshift
Gérer les coûts du Big Data
Les considérations de coût d’Amazon EMR
Les modèles tarifaires Amazon EC2
Les modèles tarifaires Amazon Kinesis
Les considérations de coût d’Amazon DynamoDB
Les considérations de coût et modèles tarifaires d’Amazon Redshift
Optimiser les coûts avec AWS
Visualisation et orchestration du Big Data
L’objectif de visualisation du Big Data
Amazon QuickSight
Orchestration des flux de travail du Big Data
Atelier 7 : Utiliser TIBCO Spotfire pour visualiser les données
Modèles du Big Data
Les architectures communes
Nos autres formations en Big Data .
Formation Apache Flink
Formation Apache Kafka
Formation Apache NiFi
Formation Bases de données NoSQL : introduction, enjeux et panorama des solutions
Formation Big Data : état de l’art
Formation Big Data : mise en œuvre
A travers sa Charte Engagement Qualité, Sparks s’engage à tout mettre en œuvre pour que chaque session de formation soit un succès et que votre satisfaction soit totale.