Le Run Manager « Group Service Desk Operations and Process Improvement Lead » assure la stabilitĂ©, la performance et lâamĂ©lioration continue des services IT de production de Rexel. Vous serez responsable de la gestion des incidents majeurs (MIM), des processus Incident/Problem/Change, des transitions de services vers le BAU, de la planification de capacitĂ© et du reporting opĂ©rationnel. Vous coordonnerez des Ă©quipes transverses, gĂ©rerez des flux de travail concurrents et promouvrez la rigueur opĂ©rationnelle et la fiabilitĂ© des services.
Responsabilités clés :
- Leadership opérationnel : Prendre en charge les opérations courantes (run) des services/plateformes assignés pour atteindre les objectifs de disponibilité, fiabilité et SLA/OLA. Maintenir et faire évoluer runbooks, SOP et playbooks ; assurer une couverture 24x7 appropriée.
- Major Incident Management (MIM) : Agir en tant que propriĂ©taire des incidents Sev1/Sev2 â diriger la triage, la restauration, les communications et les mises Ă jour aux Ă©quipes dirigeantes. Animer les appels de crise, la mobilisation des astreintes, des communications standardisĂ©es et conduire les revues post-incident (PIR) avec actions correctives/prĂ©ventives pour rĂ©duire les rĂ©currences.
- Incident, Problem & Change : Superviser la gestion des incidents (priorisation, escalade, résolution) et piloter le Problem Management (analyse des tendances, RCA, corrections permanentes). Travailler en partenariat avec les équipes Change/Release pour minimiser les risques de déploiement, garantir le succÚs des changements et la conformité aux standards.
- Transition de service (BAU) : Garantir la readiness opĂ©rationnelle des nouvelles solutions â valider la supervision/alerting, les SLA, les runbooks, les plans de rollback/DR, les bases de performance, les modĂšles de support et le transfert de connaissances.
- Gestion de capacitĂ© et performance : Surveiller et prĂ©voir la capacitĂ© sur lâinfrastructure, les applications et le cloud ; piloter lâoptimisation des performances, le dimensionnement et la rĂ©duction des coĂ»ts ; maintenir les modĂšles de demande et la planification des ressources/licences.
- Gouvernance, reporting & mĂ©triques : Produire tableaux de bord et rapports (SLA/OLA, tendances incidents, MTTD/MTTR, disponibilitĂ©, capacitĂ©, coĂ»ts, rĂ©ussite des changements). PrĂ©senter la santĂ© opĂ©rationnelle, les risques et les plans dâamĂ©lioration ; dĂ©finir et suivre OKR/KPI.
- Risques, conformité & sécurité : gérer le patching de sécurité, la remédiation des vulnérabilités, les contrÎles, audits et la conservation des preuves pour les opérations run.
- AmĂ©lioration continue & automatisation : Identifier les opportunitĂ©s dâautomatisation/self-healing (supervision, alerting, recovery, dĂ©ploiements), gĂ©rer le backlog de problĂšmes/tech-debt et promouvoir les pratiques de reliability engineering.