MISSION DE COURS PONCTUELLE
Real-Time Data Engineering
Paris
Français
Présentiel
Détails sur le cours
TYPE D'ÉCOLE
- École d'ingénieurs top 3 privé France
- Paris Sud
- Habilitée Cti (Commission des titres d'ingénieur)
- Membre de la Conférence des Grandes Écoles
NOM DE L'ÉCOLE
Le nom de l'école et sa localisation vous seront indiqués lors du premier échange avec l'équipe du Bon intervenant.
NOMBRE D'HEURES / VOLUME HORAIRE
28 heures
DATES, HORAIRES, FRÉQUENCE DE COURS
8 séances de 3h30
ℹ️ Sauf indiqué, les cours se dispensent en journée et pendant la semaine, les étudiants ont rarement cours le soir ou le week-end.
DATE DE DÉBUT
Du 03/11/2025 au 06/03/2026
HORAIRES FIXES / À DÉFINIR AVEC L'ÉCOLE
Créneaux précis à définir avec l'école selon vos disponibilités et les moments disponibles sur l'emploi du temps des étudiants
OBJECTIFS PÉDAGOGIQUES / PLAN DE COURS
Ce cours est conçu comme une continuation avancée de « Théorie, Algorithmes et Architecture pour l'Ingénierie des Données ».
Il s'appuie sur les concepts fondamentaux des pipelines de données, des systèmes distribués et des lacs de données pour explorer des techniques de pointe en intégration de données en temps réel, architectures de streaming et ingénierie des données à grande échelle.
Les étudiants travailleront sur la conception de systèmes robustes, à faible latence et à haut débit, prenant en charge l'évolution dynamique des schémas, la résolution de conflits et le traitement efficace de grands volumes de données variées en temps réel.
Plan du cours (flexible selon l'expérience et la vision de l'intervenant) :
1. Traitement des flux en temps réel et algorithmes
- Fenêtres glissantes, estimation de fréquence, modèles à décroissance temporelle
- Échantillonnage par réservoir, heavy hitters (Misra-Gries, SpaceSaving)
- Algorithmes d'apprentissage en ligne pour l'ingestion continue
2. Intégration avancée des données et optimisation des requêtes distribuées
- Correspondance de schémas, résolution d'entités, déduplication des données
- Planification de requêtes basée sur les coûts vs heuristique
- Algorithmes de jointure pour les flux distribués (par exemple, jointures flux-à-flux)
3. Architectures de données en streaming et capture de changements
- Pipelines événementiels vs micro-batch
- Capture de données modifiées (basée sur les journaux, les déclencheurs, hybride)
- ELT/ETL pour les systèmes en temps réel (Flink, Spark Structured Streaming)
4. Gestion de la variété des données et évolution des schémas
- Intégration de sources JSON, XML et non structurées en temps réel
- Stratégies d'évolution des schémas et gouvernance des métadonnées en temps réel
- Ingestion depuis l'IoT, les plateformes sociales et les bases de données opérationnelles
5. Résolution de conflits et cohérence des données
- Modèles de cohérence distribuée (éventuelle, forte)
- Versionnage et horloges vectorielles
- Stratégies de détection et de résolution des conflits dans les systèmes distribués
6. Techniques de compression et de stockage efficace
- Encodage Huffman, arithmétique, RLE, dictionnaire
- Formats colonnaires (Parquet, ORC) et leur impact sur les performances
- Équilibrage entre performance et coût dans le stockage des données
7. Tolérance aux pannes dans les systèmes de streaming
- Réplication, partitionnement et point de contrôle
- Le théorème CAP et ses implications
- Conception de systèmes résilients avec des capacités de basculement en temps réel
8. Confidentialité, sécurité et gouvernance des données
- Confidentialité différentielle, anonymisation, calcul sécurisé
- Conformité dans les pipelines de traitement en temps réel
- Gestion éthique des données dans des environnements à haute vitesse
9. Analytique avancée et apprentissage automatique en temps réel
- Mises à jour des modèles en ligne et détection de dérive
- Systèmes de recommandation et d'alerte basés sur le streaming
- Tableaux de bord et indicateurs clés de performance en temps réel
10. Plateformes pour une intégration évolutive en temps réel
- Apache Flink, Kafka Streams, Spark Streaming
- Services cloud : AWS Kinesis, Google Dataflow, Azure Stream Analytics
- Optimisation du débit, de la latence et de l'évolutivité
FORMAT DE COURS
CTP (cours / travaux pratique = cours pratiques)
PRÉSENTIEL / DISTANCIEL
Présentiel
TRAVAIL DEMANDÉ À L'INTERVENANT
Création de tous les supports (cours, partie pratique, évaluation)
Le bon intervenant pourra vous fournir des supports et de l'aide sur les parties théorique et pratique si besoin.
MATÉRIEL FOURNI PAR L'ÉCOLE
Étudiants avec leur propre équipement
Matériel de classe classique
🛟 AIDE À LA CRÉATION DE SUPPORTS
Si l'école ne fournit pas de supports, Le bon intervenant pourra vous mettre à disposition : des supports théoriques au format PowerPoint ainsi que des exercices, travaux dirigiés / pratiques, jeux de données, activités, idées de projets, etc, afin de vous faire gagner 80 à 90 % du temps de préparation. N'hésitez pas à nous demander lorsque vous êtes recruté par l'école. Nous pouvons les personnaliser en fonction de votre expérience et selon les outils désirés.
NIVEAU DES ÉTUDIANTS DE LA MATIÈRE
Ce cours est la suite du module Data Lake and Data Integration.
Il s’adresse aux étudiants de I3 (Terminal) de la majeure BDML en apprentissage à l’Efrei. Le cours est dispensé en français. Voici le contenu dans le syllabus ci-dessous, mais cela peut être ajusté si nécessaire.
L’année dernière, les étudiants ont abordé les notions suivantes :
- Préparation à la certification azure DP103
- Architecture de Data lake
- Transformation de données avec SQL
- Pipeline avec Spark
- Talend (Pas trop)
NOMBRE D'ÉTUDIANTS
30 à 35
NIVEAU D'ÉTUDES
BAC +5
CURSUS / PROGRAMME
Cursus ingénieur Informatique
Profil recherché et modalités contractuelles
Les écoles recherchent généralement des experts avec au moins 3 à 4 ans d'expérience métier, ainsi si ce n'est pas le cas, votre candidature a de très fortes chances de ne pas être reçue (sauf dans certains cas particuliers comme des demandes urgentes ou des cours d'introduction).
PROFIL RECHERCHÉ
Expert technique, BAC+5
NOMBRE D'INTERVENANTS POSSIBLE SUR CETTE MISSION
1
TYPE DE CONTRAT POSSIBLE
- CDD usage (contrat de travail temporaire cumulable avec un CDI)
- Contrat de prestation (facturation de l'école via statut auto-entrepreneur ou entreprise)
RÉMUNÉRATION
- En CDD : 61 € / h brut
- En prestation : 89 € / h TTC
AUTRES CONDITIONS
Aucune
TVA PRISE EN COMPTE PAR L'ÉCOLE
Oui
Les étapes de candidature
Quelques jours à deux semaines selon l'urgence
1
2
3
4
Consultez la fiche de poste exhaustivement en vérifiant que vous êtes bien en mesure de réaliser cette mission
Planifiez un rendez-vous avec notre équipe pour faire un point rapide, répondre à vos premières questions et valider votre candidature
Échangez
avec l'école
Posez vos questions restantes
Discutez du plan de cours
Fixez les créneaux précis
Validez votre intérêt ou non
Fixez la rémunération, le contrat
L'école vous tiendra informée de sa décision
Recontactez-nous par email si vous n'avez pas de nouvelles après deux semaines : equipe@lebonintervenant.com
Quel rôle joue Le bon intervenant ?
En savoir plus sur nous en 2 minutes.
Enseigner
au sein des meilleures écoles
Réception de missions d'enseignement
Accès à nos ressources pédagogiques
Accompagnement par notre équipe
1 200+
intervenants placés depuis 2019

