📖 Önsöz
- Burada Ödeal şirketindeki iş deneyimlerimi, karşılaştığım sorunlara nasıl yaklaştığımı ve bunları çözerken neler öğrendiğimi anlatmaya çalıştım.
- Her vakada gerçek problemleri, attığım adımları ve sonuçta ne gibi etkiler yarattığımı paylaşıyorum.
- Aslında sadece teknik çözümler değil; sistemsel düşünmeyi, ekipler arası köprü kurmayı ve proaktif hareket etmeyi nasıl öğrendiğimi göstermeye çalıştım. Keyifli okumalar..:)
🚀 Vaka Analizi 1: Operasyonel Veri Otomasyonu ve Sistem Gözlemlenebilirliği
🔴 Problem: Test ortamı olmayan, sıfır hata toleranslı bir Canlı (Production) ortamda iki temel operasyonel darboğazla karşı karşıyaydım:
-
E-fatura iptal süreçlerinde, entegratörden Mattermost'a düşen düzensiz metinlerdeki kritik mali numaraları manuel olarak kopyala-yapıştır ile bulmak gerekiyordu.
-
Şirketin Admin Panelinde hata mesajları görünmüyordu. Bir işlemin neden başarısız olduğunu bulmak için sürekli arka plana (Graylog/OpenSearch) gidip manuel log taraması yapmak zorundaydık; bu da büyük zaman kaybıydı.
🎯 Aksiyon:
- Veri Ayrıştırma Otomasyonu: Mattermost'tan gelen dağınık mesajları analiz ederek 10 satırlık bir Python (Regex) scripti geliştirdim. Script, gürültülü metnin içindeki mali numaraları otomatik ve hatasız olarak anında çıkardı.
- Sistem Mimarisi İyileştirmesi: Arka plandaki "log ameleliğini" bitirmek için inisiyatif aldım. Takım liderimle görüşerek, başarısız işlemlerdeki hata mesajlarının doğrudan Admin Paneline yansıtılmasını sağlayan kalıcı bir ürün geliştirmesi talep ve koordine ettim.
✅ Etki: İnsan hatasına açık ve dakikalar süren e-fatura veri ayıklama sürecini, saniyeler içinde çalışan bir otomasyona dönüştürdüm. Log hatalarının Admin Paneline çekilmesiyle, tüm ekibin günlük hata ayıklama ve operasyonel araştırma süresini önemli ölçüde düşürerek, reaktif bir süreci proaktif bir ekran deneyimine çevirdim.
🔗 Yazmış olduğum Python/Regex Scripti Github Linkine Buradan Ulaşabilirsiniz :)
📊 Vaka Analizi 2: Operasyonel İş Akışı Optimizasyonu ve Hata Oranının Düşürülmesi
🔴 Problem: Göreve başladığım ilk dönemde, TechOps ekibine gelen destek biletlerinin %50'sinin eksik veya hatalı parametrelerle açıldığını tespit ettim. Bu veri kalitesi sorunu mühendislik saatlerini israf ediyor ve kritik çözümleri geciktiriyordu.
🎯 Aksiyon:
- Kök Neden Müdahalesi: Hatalı biletleri sürekli reddetmek yerine, sorunun kaynağına inerek sorumluluk aldım.
- Standardizasyon: Teknik olmayan departmanların doğru talep açabilmesi için şirket çapında yayınlanan kapsamlı bir eğitim materyali ve videosu hazırladım.
- Süreç Mühendisliği: Veri girişini en başında doğrulamak için zorunlu bir "Talep Kontrol Listesi" tasarlayıp devreye aldım.
✅ Etki: Hatalı talep oranını %50'den %20'ye düşürdüm. Tek bir satır kod yazmadan ekipler arası gereksiz iletişimi minimize ettim ve tüm ekibin SLA metriklerini doğrudan iyileştirdim.
🚨 Vaka Analizi 3: Kritik Olay Yönetimi ve Kök Neden Analizi
🔴 Problem: Faturalandırma altyapısında, şirketi yasal riskler ve olası cezai yaptırımlarla karşı karşıya bırakan kritik bir yapısal hata tespit edildi. Ortam son derece kaotikti ve acil çapraz fonksiyonel kriz yönetimi gerekiyordu.
🎯 Aksiyon:
- Kriz Koordinasyonu: Fatura ekibi ve Üçüncü Parti Ödeme Geçidi partneri arasında acil bir iletişim köprüsü kurdum ve süreci uçtan uca yönettim.
- Derinlemesine Analiz: Geçmiş Confluence dokümanlarını ve olay loglarını inceleyerek, asıl sorunun teknik bir hata olmadığını tespit ettim. Kök neden, ekipler arası sistemsel bir iletişim kopukluğuydu.
- Mimari Haritalama: Bu krizi fırsata çevirerek, uçtan uca fatura tetikleme mekanizmalarını, iptal akışlarını ve veri mimarisini tersine mühendislikle analiz ettim.
✅ Etki: Acil yasal riski güvenli bir şekilde bertaraf ettim. Kaotik olayı, yeni ve güvenilir bir iletişim protokolü oluşturarak kalıcı bir öğrenime dönüştürdüm. Benzer mimari kör noktaların gelecekte tekrarlanmasını engelledim.