Du untersuchst technische Probleme, die von Enterprise Kund:innen gemeldet werden, analysierst Symptome, bildest Hypothesen und gehst den Ursachen systematisch auf den Grund
Einsatz von Observability Tools wie Datadog, einschließlich Logs, Traces, Metriken und Dashboards, um Fehler in verteilten Systemen zu diagnostizieren
Du analysierst Code über mehrere Repositories hinweg, um Hypothesen zu validieren und Request Flows nachzuvollziehen
Bei Bedarf führst du Datenbankabfragen durch, um Systemzustände zu überprüfen und Probleme reproduzierbar zu machen
Verantwortung für Tickets entlang der gesamten Eskalationskette zwischen Support und Engineering, von der Aufnahme bis zur finalen Lösung
Du kommunizierst proaktiv und professionell mit Enterprise Kund:innen, gibst strukturierte Updates, definierst klare nächste Schritte und sorgst für ein gutes Erwartungsmanagement
Enge Zusammenarbeit mit Engineering Teams im Eskalationsfall, inklusive klarer Problemdefinition, Bereitstellung reproduzierbarer Erkenntnisse und Vertretung der Kund:innenperspektive
Du dokumentierst deine Erkenntnisse, trägst zur internen Wissensbasis bei und hilfst dabei, wiederkehrende Muster zu erkennen und nachhaltige Verbesserungen voranzutreiben
Teilnahme an einer rotierenden Rufbereitschaft für kritische Incidents, auch abends und an Wochenenden, um Enterprise Kund:innen auch außerhalb der regulären Arbeitszeiten zu unterstützen