En tant que Site Reliability Engineer (SRE), vous jouerez un rĂŽle clĂ© dans le maintien, lâoptimisation et la sĂ©curisation des infrastructures informatiques et des systĂšmes de production. Vous travaillerez en collaboration avec les Ă©quipes de dĂ©veloppement, dâinfrastructure et dâopĂ©rations pour garantir une disponibilitĂ© et une rĂ©silience maximales des services et applications critiques.
Missions principales:
- Maintien en conditions opérationnelles des systÚmes et des applications en production, en optimisant leur disponibilité, performance et évolutivité.
- Automatisation des tĂąches rĂ©pĂ©titives et des processus de dĂ©ploiement, de surveillance et dâalerting.
- Conception et mise en Ćuvre de solutions permettant dâamĂ©liorer la fiabilitĂ© des systĂšmes et de rĂ©duire le taux de pannes.
- Analyse des incidents et gestion des urgences, avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et dâaccroĂźtre la rĂ©silience.
- Optimisation des performances des applications et de lâinfrastructure, notamment via la gestion des capacitĂ©s et des coĂ»ts.
- Collaboration avec les équipes de développement pour favoriser une approche DevOps et intégrer les pratiques SRE dÚs les phases de conception.
- Création et suivi de métriques pour mesurer la fiabilité et les performances des systÚmes (SLI, SLO, SLA).
- Veille technologique pour assurer lâamĂ©lioration continue des outils et des processus SRE.