Accueil > Formations > Intelligence artificielle & Data Science > Data Science & Machine Learning > Spark

Data Science & Machine Learning

Spark

Traitez les données massives en un temps record grâce au moteur d'analyse Apache Spark et à notre formation Spark !

22 sessions Eligible OPCO

Vue d'ensemble

Apache Spark est un moteur d'analyse unifié (Unified Analytics Engine), créé pour le traitement rapide des données. Ce framework open source de calcul distribué permet l'analyse et le traitement de données à grandes échelles. Le framework permet le développement d'applications de traitement hautement performantes. Notre formation Apache Spark vous permettra de développer des applications permettant de traiter de larges quantités de données en temps réel et l'intégrer notamment dans un environnement Hadoop pour améliorer le temps d'exécution des applications Hadoop !

Public visé

Administrateurs de base de données Administrateurs systèmes et réseaux Architectes techniques Data analysts Data scientists Développeurs Ingénieurs Big Data

Prérequis

Connaissances basiques en Java, Scala ou Python, ainsi que sur Apache Hadoop

Objectifs pédagogiques

Expliquer le fonctionnement d'Apache Spark et ses relations avec le Big Data et Hadoop

Utiliser les RDD pour gérer les opérations et MapReduce

Intégrer et utiliser HDFS avec Spark

Mettre en place et déployer une structure de cluster Spark

Appliquer le partitionnement et la programmation parallèle sur les données HDFS

Concevoir et générer une application Spark

Implémenter Spark Streaming pour le traitement des données en temps réel

Appliquer des algorithmes de Machine Learning avec MLlib et optimiser Spark

Programme détaillé

Présentation de Apache Spark

Spark et le Big Data
Fonctionnement de Apache Spark
Spark et Hadoop: deux solutions différentes et complémentaires
Spark Shell
Environnement de travail
Outils

RDD (Resilient Distributed Datasets)

Fonctionnement
Cas d’usages
Gestion des opérations de RDD
MapReduce pour le RDD
Spark SQL

Combiner Spark à HDFS (Hadoop Distributed File System)

Intérêts
Cas d’usages
Intégration à Spark de HDFS
Utilisation de HDFS

Spark en cluster

Création d’une structure en clusters
Héberger la structure
Déployer la structure
Interface Web de Spark

Programmation parallèle, Partitionnement

Localiser les données du HDFS
Partitionnement de RDD
Programmation d’opérations parallèles
Exécution
Mise en cache du partitionnement
Gestion de la persistance des données

Conception d’une application à l’aide de Spark

Présentation de Spark
Configuration
Prototyper des opérations avec Spark Shell
Compiler
Générer l’application

Spark Streaming pour le traitement des données en temps réel

Fonctionnement
Principes de base
DStream
Intégrer, transformer des DStreams
Opérations de sortie
Gérer les performances

Implémenter des algorithmes, Machine Learning

Résoudre les problèmes à l’aide d’algorithmes itératifs
Machine Learning Library MLlib
Opérations sur les données graphiques

Optimiser Spark

Gérer les variables partagées
Données broadcastées
Accumulateurs
Optimiser les performances: méthodes et outils

Prochaines sessions

29 juil. 2026

Distance - Français

2 400 € HT

29 juil. 2026

Lille - Français

2 400 € HT

29 juil. 2026

Nantes - Français

2 400 € HT

29 juil. 2026

Paris - Français

2 400 € HT

7 sept. 2026

Lyon - Français

2 400 € HT

7 sept. 2026

Distance - Français

2 400 € HT

7 sept. 2026

Grenoble - Français

2 400 € HT

7 sept. 2026

Toulouse - Français

2 400 € HT

7 sept. 2026

Aix-en-Provence - Français

2 400 € HT

19 oct. 2026

Lille - Français

2 400 € HT

19 oct. 2026

Nantes - Français

2 400 € HT

19 oct. 2026

Distance - Français

2 400 € HT

19 oct. 2026

Paris - Français

2 400 € HT

25 nov. 2026

Lyon - Français

2 400 € HT

25 nov. 2026

Distance - Français

2 400 € HT

25 nov. 2026

Grenoble - Français

2 400 € HT

25 nov. 2026

Toulouse - Français

2 400 € HT

25 nov. 2026

Aix-en-Provence - Français

2 400 € HT

30 déc. 2026

Paris - Français

2 400 € HT

30 déc. 2026

Distance - Français

2 400 € HT

30 déc. 2026

Lille - Français

2 400 € HT

30 déc. 2026

Nantes - Français

2 400 € HT

Avis des participants

Taux de satisfaction global 97,9%

Basé sur les retours de nos stagiaires

Sophie L.

5,0/5

Formation claire, structurée et directement applicable. Le formateur a pris le temps de répondre à toutes nos questions avec des exemples concrets.

Karim B.

4,8/5

Très bon équilibre entre théorie et pratique. Les exercices permettent de comprendre rapidement les concepts et de les mettre en œuvre.

Julien M.

5,0/5

Un formateur expérimenté, pédagogue et disponible. Je repars avec des méthodes et des outils que je peux utiliser immédiatement dans mon travail.

Élodie R.

4,7/5

Le contenu était dense, mais très bien expliqué. Le rythme a été adapté au niveau du groupe et chacun a pu progresser.

Financement

Cette formation est éligible aux financements OPCO et FNE-Formation. Nos équipes vous accompagnent dans le montage de votre dossier.

En savoir plus sur le financement

Des formateurs experts, reconnus par nos apprenants

Chez Sparks Formation, la qualité de nos formations repose sur l'expertise de nos formateurs et la satisfaction de nos apprenants.

4.8 / 5

Note moyenne attribuée par les participants à nos formateurs

650

formateurs experts partenaires
Sparks Formation

1000 +

sujets IT délivrés chaque jour partout en France

Réf. SF33388

5.0/5

3 jours

22 sessions

Inter 2 400 € HT

Intra (≤12 pers.)

6 150 € HT

Choisissez votre modalité de formation

29 juil. - 31 juil. 2026

Distance

2 400 € HT

29 juil. - 31 juil. 2026

Lille

2 400 € HT

29 juil. - 31 juil. 2026

Nantes

2 400 € HT

Voir toutes les sessions

Demandez une intra-entreprise

Privatisez cette formation à vos dates dans vos locaux ou chez Sparks

6 150 € HT - Jusqu'à 8 personnes

Besoin d'une formation sur mesure ?

Adaptez cette formation à votre projet, où vous voulez, quand vous voulez

Télécharger la fiche PDF

Planifier un appel 20 min

Éligible OPCO En savoir plus sur le financement

Besoin d'aide ? demande@sparks-formation.com 0 805 950 800

Formations associées

Calendrier Inter

Calendrier Inter

Spark

Vue d'ensemble

Objectifs pédagogiques