Tu rejoindras l’équipe Data de RCA, composée de 18 personnes (Data Engineers, PM, Analystes, ML, développeurs, etc.), au cœur de nos enjeux produit, cloud et performance.
Ton rôle : concevoir, faire évoluer et maintenir nos pipelines data pour servir à la fois nos utilisateurs internes (outils d’aide à la décision) et nos clients externes (API exposées à destination des experts-comptables).
Tes missions :
- Concevoir des pipelines batch & streaming robustes, scalables et maintenables
- Participer à la migration vers un traitement en temps réel (Kafka)
- Dockeriser les environnements Python et les intégrer aux pipelines CI/CD
- Concevoir et mettre en œuvre des architectures data
- Déployer des composants AWS avec Terraform en lien avec l’équipe plateforme (IAM, S3, EKS, ECS, etc.)
- Participer à la mise en place d’une observabilité Data (logs, qualité, monitoring)
- Accompagner les Data Analysts & PM dans l’industrialisation des solutions
- Travailler dans une logique "data as a product" : forte proximité avec les usages
Stack & Environnement :
- Cloud : AWS (IAM, S3, RDS, EKS, ECS, DMS…)
- Data Engineering : Airflow, DBT, Kafka, Terraform
- Développement : Python (Poetry, Pytest, Black), SQL
- Stockage : Snowflake, PostgreSQL
- CI/CD : GitLab CI
- BI : Holistics, ThoughtSpot
- ML Ops : début d’implémentation, présence d’un Data Scientist + Ingénieur ML
Enjeux & projets :
- Migration progressive vers du streaming (Kafka)
- Mise en place de solutions d’observabilité et de gouvernance data
- Automatisation et montée en puissance sur les sujets MLOps / IA générative
- Vision produit forte : la donnée est un levier métier et business clé