Nous recherchons un(e) Data Engineer H/F, en CDI, à proximité de Montpellier (Lattes) pour notre filiale Septeo ADB.
Ce que nous pouvons accomplir ensemble :
Dans le cadre de l'industrialisation des migrations de données d'un ERP vers un autre, l'équipe Data renforce son pôle ETL / ELT.
Le poste s'inscrit dans un environnement industriel, orienté delivery, avec des contraintes fortes de qualité, reproductibilité et traçabilité.
Le Data Engineer interviendra au cœur de la plateforme de migration et travaillera en étroite collaboration avec :
- Le Tech Lead Data et un data engineer
- Les équipes produit
- Les équipes métier (migration / fonctionnel)
- Les équipes infra / DevOps
Vos missions principales
1.Modèles de données (dbt)
- Concevoir et maintenir des modèles dbt (RAW → REFINED → TRUSTED)
- Implémenter les règles métier de façon explicite et documentée
- Centraliser les règles communes (mapping, normalisation, référentiels)
2. Robustesse & fiabilité des pipelines
- Pipelines reproductibles, OS-agnostiques, déployables via CI/CD
- Tests dbt (schéma, unicité, volumétrie), contrôles de cohérence inter-modèles
- Alertes sur écarts ou régressions, optimisation des performances
3. Contributions applicatives
- Maintenir les endpoints API (FastAPI) et les interfaces (Vue.js 3 / Quasar) liés aux flux de migration et d'import
- Contribuer au système IA de suggestions en cascade (pattern matching, embeddings, LLM)
- Gérer les migrations de schéma (Alembic) et les connecteurs de données (ODBC / SQL Server)
4. Documentation & collaboration transverse
- Documenter modèles, règles de transformation, conventions de nommage
- Participer aux code reviews et aux ateliers de validation fonctionnelle post-migration
- Collaborer avec les équipes métier, produit et infra
Nouvelle stack :
- Transformation :dbt, SQL avancé, Python
- Bases de données :SQL Server, PostgreSQL (+ pgvector), Snowflake / équivalent
- Orchestration :Airflow (ou équivalent)
- Application :FastAPI, Vue.js + TypeScript + Quasar
- IA :scikit-learn, embeddings vectoriels, NLP, LLM
- Infra / CI/CD :Docker, AWS ECS , ECR, S3, Bitbucket & Azure Pipelines
- Data quality :Tests dbt, Pytest