top of page
Cours formation module Conférence universitaire enseignement professeur vacataire professionnel

MISSION DE COURS PONCTUELLE

Real-Time Data Engineering

Paris

Français

Présentiel

Postuler

Merci de bien lire la fiche de poste avant de candidater.

Détails sur le cours

TYPE D'ÉCOLE

- École d'ingénieurs top 3 privé France
- Paris Sud
- Habilitée Cti (Commission des titres d'ingénieur)
- Membre de la Conférence des Grandes Écoles

NOM DE L'ÉCOLE

Le nom de l'école et sa localisation vous seront indiqués lors du premier échange avec l'équipe du Bon intervenant.

NOMBRE D'HEURES / VOLUME HORAIRE

28 heures

DATES, HORAIRES, FRÉQUENCE DE COURS

8 séances de 3h30

ℹ️  Sauf indiqué, les cours se dispensent en journée et pendant la semaine, les étudiants ont rarement cours le soir ou le week-end.

DATE DE DÉBUT

Du 03/11/2025 au 06/03/2026

HORAIRES FIXES / À DÉFINIR AVEC L'ÉCOLE

Créneaux précis à définir avec l'école selon vos disponibilités et les moments disponibles sur l'emploi du temps des étudiants

OBJECTIFS PÉDAGOGIQUES / PLAN DE COURS

Ce cours est conçu comme une continuation avancée de « Théorie, Algorithmes et Architecture pour l'Ingénierie des Données ».

Il s'appuie sur les concepts fondamentaux des pipelines de données, des systèmes distribués et des lacs de données pour explorer des techniques de pointe en intégration de données en temps réel, architectures de streaming et ingénierie des données à grande échelle.

Les étudiants travailleront sur la conception de systèmes robustes, à faible latence et à haut débit, prenant en charge l'évolution dynamique des schémas, la résolution de conflits et le traitement efficace de grands volumes de données variées en temps réel.

Plan du cours (flexible selon l'expérience et la vision de l'intervenant) :

1. Traitement des flux en temps réel et algorithmes
- Fenêtres glissantes, estimation de fréquence, modèles à décroissance temporelle
- Échantillonnage par réservoir, heavy hitters (Misra-Gries, SpaceSaving)
- Algorithmes d'apprentissage en ligne pour l'ingestion continue

2. Intégration avancée des données et optimisation des requêtes distribuées
- Correspondance de schémas, résolution d'entités, déduplication des données
- Planification de requêtes basée sur les coûts vs heuristique
- Algorithmes de jointure pour les flux distribués (par exemple, jointures flux-à-flux)

3. Architectures de données en streaming et capture de changements
- Pipelines événementiels vs micro-batch
- Capture de données modifiées (basée sur les journaux, les déclencheurs, hybride)
- ELT/ETL pour les systèmes en temps réel (Flink, Spark Structured Streaming)

4. Gestion de la variété des données et évolution des schémas
- Intégration de sources JSON, XML et non structurées en temps réel
- Stratégies d'évolution des schémas et gouvernance des métadonnées en temps réel
- Ingestion depuis l'IoT, les plateformes sociales et les bases de données opérationnelles

5. Résolution de conflits et cohérence des données
- Modèles de cohérence distribuée (éventuelle, forte)
- Versionnage et horloges vectorielles
- Stratégies de détection et de résolution des conflits dans les systèmes distribués

6. Techniques de compression et de stockage efficace
- Encodage Huffman, arithmétique, RLE, dictionnaire
- Formats colonnaires (Parquet, ORC) et leur impact sur les performances
- Équilibrage entre performance et coût dans le stockage des données

7. Tolérance aux pannes dans les systèmes de streaming
- Réplication, partitionnement et point de contrôle
- Le théorème CAP et ses implications
- Conception de systèmes résilients avec des capacités de basculement en temps réel

8. Confidentialité, sécurité et gouvernance des données
- Confidentialité différentielle, anonymisation, calcul sécurisé
- Conformité dans les pipelines de traitement en temps réel
- Gestion éthique des données dans des environnements à haute vitesse

9. Analytique avancée et apprentissage automatique en temps réel
- Mises à jour des modèles en ligne et détection de dérive
- Systèmes de recommandation et d'alerte basés sur le streaming
- Tableaux de bord et indicateurs clés de performance en temps réel

10. Plateformes pour une intégration évolutive en temps réel
- Apache Flink, Kafka Streams, Spark Streaming
- Services cloud : AWS Kinesis, Google Dataflow, Azure Stream Analytics
- Optimisation du débit, de la latence et de l'évolutivité

FORMAT DE COURS

CTP (cours / travaux pratique = cours pratiques)

PRÉSENTIEL / DISTANCIEL

Présentiel

TRAVAIL DEMANDÉ À L'INTERVENANT

Création de tous les supports (cours, partie pratique, évaluation)

Le bon intervenant pourra vous fournir des supports et de l'aide sur les parties théorique et pratique si besoin.

MATÉRIEL FOURNI PAR L'ÉCOLE

Étudiants avec leur propre équipement
Matériel de classe classique

🛟   AIDE À LA CRÉATION DE SUPPORTS

Si l'école ne fournit pas de supports, Le bon intervenant pourra vous mettre à disposition : des supports théoriques au format PowerPoint ainsi que des exercices, travaux dirigiés / pratiques, jeux de données, activités, idées de projets, etc, afin de vous faire gagner 80 à 90 % du temps de préparation. N'hésitez pas à nous demander lorsque vous êtes recruté par l'école. Nous pouvons les personnaliser en fonction de votre expérience et selon les outils désirés.

NIVEAU DES ÉTUDIANTS DE LA MATIÈRE

Ce cours est la suite du module Data Lake and Data Integration.

Il s’adresse aux étudiants de I3 (Terminal) de la majeure BDML en apprentissage à l’Efrei. Le cours est dispensé en français. Voici le contenu dans le syllabus ci-dessous, mais cela peut être ajusté si nécessaire.

L’année dernière, les étudiants ont abordé les notions suivantes :
- Préparation à la certification azure DP103
- Architecture de Data lake
- Transformation de données avec SQL
- Pipeline avec Spark
- Talend (Pas trop)

NOMBRE D'ÉTUDIANTS

30 à 35

NIVEAU D'ÉTUDES

BAC +5

CURSUS / PROGRAMME

Cursus ingénieur Informatique

Profil recherché et modalités contractuelles

Les écoles recherchent généralement des experts avec au moins 3 à 4 ans d'expérience métier, ainsi si ce n'est pas le cas, votre candidature a de très fortes chances de ne pas être reçue (sauf dans certains cas particuliers comme des demandes urgentes ou des cours d'introduction).

PROFIL RECHERCHÉ

Expert technique, BAC+5

NOMBRE D'INTERVENANTS POSSIBLE SUR CETTE MISSION

1

TYPE DE CONTRAT POSSIBLE

- CDD usage (contrat de travail temporaire cumulable avec un CDI)
- Contrat de prestation (facturation de l'école via statut auto-entrepreneur ou entreprise)

RÉMUNÉRATION

- En CDD : 61 € / h brut
- En prestation : 89 € / h TTC

AUTRES CONDITIONS

Aucune

TVA PRISE EN COMPTE PAR L'ÉCOLE

Oui

Candidater

Les étapes de candidature

Quelques jours à deux semaines selon l'urgence

1

2

3

4

Consultez la fiche de poste exhaustivement en vérifiant que vous êtes bien en mesure de réaliser cette mission

Planifiez un rendez-vous avec notre équipe pour faire un point rapide, répondre à vos premières questions et valider votre candidature

Échangez
avec l'école

Posez vos questions restantes
Discutez du plan de cours

Fixez les créneaux précis
Validez votre intérêt ou non
Fixez la rémunération, le contrat

L'école vous tiendra informée de sa décision

Recontactez-nous par email si vous n'avez pas de nouvelles après deux semaines : equipe@lebonintervenant.com

Choisir un créneau

Sélectionnez un moment à votre convenance sur notre agenda

Être recontacté pour de nouvelles missions

Inscrivez-vous en 2 min aux alertes par email

Quel rôle joue Le bon intervenant ?

En savoir plus sur nous en 2 minutes.

Enseigner
au sein des meilleures écoles

Réception  de missions d'enseignement

Accès à nos ressources pédagogiques

Accompagnement par notre équipe​​

1 200+
intervenants placés depuis 2019

Notre rôle
recruter professeur enseignant vacataire école supérieur.jpg
bottom of page