MISSION DE COURS PONCTUELLE
Big Data Frameworks
Paris Sud
Anglais 🇬🇧
Présentiel et /ou distanciel
Détails sur le cours
TYPE D'ÉCOLE
- École d'ingénieurs top 3 privé France
- Habilitée Cti (Commission des titres d'ingénieur)
- Membre de la Conférence des Grandes Écoles
NOM DE L'ÉCOLE
Le nom de l'école et sa localisation vous seront indiqués lors du premier échange avec l'équipe du Bon intervenant.
NOMBRE D'HEURES / VOLUME HORAIRE
28 heures
DATES, HORAIRES, FRÉQUENCE DE COURS
Session de cours de 4h, flexible
ℹ️ Sauf indiqué, les cours se dispensent en journée et pendant la semaine, les étudiants ont rarement cours le soir ou le week-end.
DATE DE DÉBUT
Novembre 2026 à Mars 2027 (semestre 2)
HORAIRES FIXES / À DÉFINIR AVEC L'ÉCOLE
Horaires flexibles à définir avec l'école
OBJECTIFS PÉDAGOGIQUES / PLAN DE COURS
1. From Batch to Streaming: Foundations of Real-Time Data Processing
• Recap of batch processing and its limitations in modern data applications.
• Stream processing paradigms: micro-batch vs. true streaming.
• Event time vs. processing time, watermarks, and late data handling.
• Stateful vs. stateless transformations.
• Delivery semantics: at-most-once, at-least-once, exactly-once.
2. Apache Kafka for Real-Time Data Streaming
• Advanced Kafka: consumer groups, partition assignment strategies, and rebalancing.
• Kafka Streams API: stateful stream processing within Kafka.
• Kafka Connect for source/sink integration with external systems.
• Schema Registry and data contracts with Avro, Protobuf, and JSON Schema.
• Kafka tiered storage and modern deployment patterns (KRaft, Confluent Cloud).
3. Apache Spark Structured Streaming
• The Structured Streaming model: treating streams as unbounded tables.
• Sources, sinks, output modes (append, update, complete) and triggers.
• Windowing operations: tumbling, sliding, and session windows.
• Stateful aggregations, joins (stream-stream, stream-static), and watermarking.
• Checkpointing, recovery, and exactly-once guarantees.
4. Apache Flink for True Stream Processing
• Flink architecture: JobManager, TaskManager, and the dataflow runtime.
• DataStream API and Flink SQL for unified batch and streaming.
• Event time processing, watermarks, and state backends (RocksDB).
• Savepoints, checkpoints, and stateful application upgrades.
• Comparison: Spark Structured Streaming vs. Flink vs. Kafka Streams.
5. The Lakehouse Architecture and Open Table Formats
• From data warehouses and data lakes to the lakehouse paradigm.
• Apache Iceberg: architecture, metadata layer, hidden partitioning, and time travel.
• Delta Lake: ACID transactions, the transaction log, and Z-ordering.
• Apache Hudi: copy-on-write vs. merge-on-read, indexing, and incremental queries.
• Schema evolution, table maintenance (compaction, vacuum), and interoperability.
6. Change Data Capture (CDC) and Real-Time Ingestion
• CDC concepts: log-based vs. trigger-based capture.
• Debezium for database CDC into Kafka.
• Streaming CDC into lakehouse tables (Iceberg / Delta / Hudi).
• Upserts, deletes, and slowly changing dimensions in streaming pipelines.
• End-to-end CDC patterns from OLTP databases to analytics platforms.
7. Unified Batch and Streaming Pipelines
• Lambda vs. Kappa architectures.
• The medallion architecture: bronze, silver, and gold layers.
• Building unified pipelines with Spark / Flink on lakehouse tables.
• Incremental processing and streaming-first data modeling.
• Real-time analytics serving with Apache Pinot, ClickHouse, and Druid (overview).
8. Cloud-Native Data Platforms and Deployment
• Managed Spark and Flink on Databricks, AWS EMR, and Google Dataproc.
• Object storage as the lakehouse foundation: S3, GCS, ADLS.
• Catalogs and governance: AWS Glue, Unity Catalog, Nessie, Polaris.
• Kubernetes for stateful streaming workloads.
• Cost optimization and autoscaling strategies.
9. Observability, Reliability, and Production Operations
• Monitoring streaming pipelines: lag, throughput, backpressure, and state size.
• Metrics, logs, and traces with Prometheus, Grafana, and OpenLineage.
• Data quality and contract testing in streaming contexts.
• Handling failures: dead-letter queues, replay strategies, and disaster recovery.
• Performance tuning for stateful streaming and large-scale lakehouse queries.
FORMAT DE COURS
1/4 de cours, 3/4 de travaux pratiques (en mode projet), Évaluation sur papier
PRÉSENTIEL / DISTANCIEL
Présentiel et /ou distanciel
TRAVAIL DEMANDÉ À L'INTERVENANT
Création de tous les supports (cours, partie pratique, évaluation)
L'examen est surveillé par le service des examens, pas par l'intervenant.
MATÉRIEL FOURNI PAR L'ÉCOLE
Étudiants avec leur propre équipement
🛟 AIDE À LA CRÉATION DE SUPPORTS
Si l'école ne fournit pas de supports, Le bon intervenant pourra vous mettre à disposition : des supports théoriques au format PowerPoint ainsi que des exercices, travaux dirigiés / pratiques, jeux de données, activités, idées de projets, etc, afin de vous faire gagner 80 à 90 % du temps de préparation. N'hésitez pas à nous demander lorsque vous êtes recruté par l'école. Nous pouvons les personnaliser en fonction de votre expérience et selon les outils désirés.
NIVEAU DES ÉTUDIANTS DE LA MATIÈRE
Voir avec l'école
NOMBRE D'ÉTUDIANTS
40
NIVEAU D'ÉTUDES
Bac+5
CURSUS / PROGRAMME
Cursus ingénieur Informatique, Data Eng
Profil recherché et modalités contractuelles
Les écoles recherchent généralement des experts avec au moins 3 à 4 ans d'expérience métier, ainsi si ce n'est pas le cas, votre candidature a de très fortes chances de ne pas être reçue (sauf dans certains cas particuliers comme des demandes urgentes ou des cours d'introduction).
PROFIL RECHERCHÉ
Expert technique, BAC+5
NOMBRE D'INTERVENANTS POSSIBLE SUR CETTE MISSION
1
TYPE DE CONTRAT POSSIBLE
CDDU (CDD d'Usage : contrat de travail temporaire d'enseignement cumulable légalement avec un CDI)
RÉMUNÉRATION
95 € / h brut
L’enseignant est ensuite rémunéré en complément pour chaque copie corrigée, pour chaque évaluation de projet réalisée par les étudiants, ainsi que pour la préparation du contenu du cours.
L’ensemble de ces éléments s’ajoute aux heures d’enseignement, rémunérées au taux de 95 euros de l'heure brut.
AUTRES CONDITIONS
Aucune
TVA PRISE EN COMPTE PAR L'ÉCOLE
NC
Les étapes de candidature
Quelques jours à deux semaines selon l'urgence
1
2
3
4
Consultez la fiche de poste exhaustivement en vérifiant que vous êtes bien en mesure de réaliser cette mission
Planifiez un rendez-vous avec notre équipe pour faire un point rapide, répondre à vos premières questions et valider votre candidature
Échangez
avec l'école
Posez vos questions restantes
Discutez du plan de cours
Fixez les créneaux précis
Validez votre intérêt ou non
Fixez la rémunération, le contrat
L'école vous tiendra informée de sa décision
Recontactez-nous par email si vous n'avez pas de nouvelles après deux semaines : equipe@lebonintervenant.com
Quel rôle joue Le bon intervenant ?
En savoir plus sur nous en 2 minutes.
Enseigner
au sein des meilleures écoles
Réception de missions d'enseignement
Accès à nos ressources pédagogiques
Accompagnement par notre équipe
1 200+
intervenants placés depuis 2019

