მომსახურების ფანჯრები
1) რა არის „მომსახურების ფანჯარა“ და რატომ არის საჭირო
მომსახურების ფანჯარა არის წინასწარ შეთანხმებული დრო სამუშაოსთვის, რაც პოტენციურად მოქმედებს ხელმისაწვდომობაზე/პროდუქტიულობაზე. მიზანია კონტროლირებადი ცვლილებები პროგნოზირებადი რისკით, გამჭვირვალე კომუნიკაციით და მტკიცებულებებით.
ტიპები:- დაგეგმილი (დაგეგმილი): გამოშვებები, მიგრაცია, სერთიფიკატების/გასაღებების როტაცია, BD/ბროკერების განახლება.
- განვითარებადი (გადაუდებელი): გადაუდებელი უსაფრთხოების ფიქსიები/ინციდენტის გამოტოვება.
- Silent/Zero-impact: მომხმარებლის გავლენის გარეშე (ფარული კანაფები, შენიშვნები, პარალელური შეყვანა).
- Provider-led: გარე პროვაიდერების ფანჯრები (PSP/KYC/CDN/Cloud).
2) პრინციპები
SLO-first: გადაწყვეტილება ფანჯრის დრო/ფორმატის შესახებ მიიღება SLI და შეცდომების ბიუჯეტებზე გავლენის მოხდენით.
მინიმალური ასაფეთქებელი სხივი: კანარი - ეტაპობრივად - სრული ჩართვა.
შექცევადობა: თითოეულ ოპერაციას აქვს უკანა გეგმა და დადასტურებული დაბრუნება.
ჭეშმარიტების ერთი წყარო: ფანჯრის კალენდარი + პიკეტი/RFC სრული მონაცემთა პაკეტით.
მტკიცებულება: საღამოს შეგროვება (ლოგოები, გრაფიკა, ეკრანის კადრები, არტეფაქტების ჰეში).
კომუნიკაციები SLA- ზე: წინასწარ, მუშაობის დროს, დასრულების შემდეგ.
3) დაგეგმვა: დროისა და დაფარვის არჩევა
ფანჯრის არჩევანი: დაბალი ტრაფიკი, საკვანძო კოჰორტების მინიმალური ზემოქმედება (რეგიონები/VIP/პარტნიორები).
დროის ზონები: ჩაწერეთ UTC + ადგილობრივი დრო (მაგალითად, ევროპა/კიევი).
ბლეკლუტის პერიოდები: პიკის სეზონებში მუშაობის აკრძალვა/მოვლენები (მატჩები, გაყიდვები, გამოშვებული „სიკვდილის ფანჯრები“).
Blast radius: მკაფიოდ განსაზღვროთ ვინ იმოქმედებს (სერვისები, რეგიონები, პროვაიდერები).
4) კოორდინაციის პროცესი (RFC/CAB lite)
1. ინიციატორი ქმნის ტიკეტს/RFC რისკის ანალიზით და გეგმის გამოყენებით (იხ. ქვემოთ მოცემული შაბლონი).
2. რისკების შეფასება (დაბალი/Med/High) და სამსახურის მფლობელის მიერ დამტკიცება + SRE/უსაფრთხოება.
3. კალენდარი: სლოტის დაჯავშნა; კონფლიქტის შემოწმება (სხვა ფანჯრები/პროვაიდერები).
4. Comm გეგმა: წინასწარ შეთანხმებული შეტყობინებები და სტატუსის გვერდი.
5. Go/No-Go შეხვედრა (24-48 საათისთვის) მაღალი რანგის ცვლილებებისთვის.
5) მომზადება: უსაფრთხოების კარიბჭეები
შემოწმებები დაწყებამდე: წარმატებული ტესტები სტეჯზე, არტეფაქტები გაფორმებულია, მთლიანი რისკები დასაშვებია.
Canareika: 1% - 5% და 25% კოგორაში/რეგიონში; ავტომატური SLO გარდერობები და ავტომატური გამოტოვება.
დეგრადაციის დროშები და ლიმიტები მზად არის.
Rollback/backout გეგმა შემოწმებულია ქვიშის ყუთში; დაფიქსირებულია გამოტოვების ბრძანებები.
ალერტების მხარდაჭერა: მხოლოდ მოსალოდნელი ხმაურისთვის, SLO სიგნალები არ არის ყრუ.
წვდომა: JIT/JEA ოპერაციების ანგარიშები, სავალდებულო აუდიტი.
6) კომუნიკაციები (ტაიმინგი და შინაარსი)
T-14/7/2 დღე (დაგეგმილი): heads-up მომხმარებლებისთვის/შიდა გუნდებისთვის (რაც/როდის/გავლენა/კონტაქტები).
T-60/30/15 წუთი: შეხსენებები შიგნით და სტატუსის გვერდზე.
მუშაობის დროს: Apdates ყოველ 15-30 წუთში (SEV დამოკიდებულია) შაბლონის მიხედვით: Impact-Stape: შემდეგი განახლება.
შემდეგ: საბოლოო „კომპოზიცია/წვეულება, რომელიც დასრულებულია/Rolled უკან“, ცვლილებების სია, SLO შემოწმება.
7) სამუშაოს ჩატარება (რეფერენდუმის სცენარი)
1. Freeze არაკომერციული გამოშვებები.
2. Canary (შეზღუდული კოჰორტები) გადასვლას ვხედავთ SLI/p95/p99 მეტრიკებს.
3. წილის ეტაპობრივი ზრდა მწვანე გარდერობებში.
4. ბიზნეს SLI შემოწმება (კონვერტაცია, გადახდის/რეგისტრაციის წარმატება).
5. ფუნქციონალური შემოწმების ფურცლის გადამოწმება (ბედნიერი path + კრიტიკული სცენარები).
6. Release/No-release გამოსავალი (IC/SRE/სამსახურის მფლობელი).
7. Supression- ის ამოღება, ალერტის პოლიტიკოსის დაბრუნება.
8) ფანჯრის შემდეგ: გადამოწმება და მოხსენება
Observation window (მაგალითად, 1-24 საათი): SLO- ს თვალყურის დევნება და შეცდომები.
ანგარიში ფანჯრის შესახებ: რა გაკეთდა, მეტრიკა, გადახრები, წინსვლა, შედეგი.
თუ პრობლემები იყო: AAR - RCA - CAPA (ფიქსირებული წესები, ტესტები, დოკუმენტაცია).
არქივი: თიკეტი, არტეფაქტები, ხელმოწერები, საკონტროლო თანხები.
9) კოორდინაცია გარე პროვაიდერებთან
დადასტურებული სლოტები და პროვაიდერის კონტაქტები; ფანჯარა მათ სტატუსის სისტემაში.
Folback/მარშრუტი ალტერნატიული პროვაიდერისთვის მუშაობის პერიოდისთვის.
ერთი ომის ოთახი პროვაიდერთან (ჩეთ/ხიდი) და SLA Apdates.
10) პროცესის სიმწიფის მეტრიკა
დრო: დროულად დაწყებული/დასრულებული ფანჯრების%.
Change failure: SLO- ზე გამოტოვებული/გავლენის მქონე ფანჯრების%.
Incident-during-MW: ინციდენტები, რომლებიც მოხდა ფანჯრის დროს.
კომუნიკაცია SLA: დროული გაფართოების წილი.
Evidence completeness: ფანჯრების% სრული მტკიცებულებების პაკეტით.
Customer impact: საჩივრები/თიკეტები 1 ფანჯარასთან, ტენდენცია.
7/30 დღის შემდეგ: SLO სტაბილურობა და რეციდივების ნაკლებობა.
11) ჩეკის ფურცლები
ფანჯრის წინ
- RFC/ticet ივსება; რისკის შეფასება დასრულებულია; მფლობელი დაინიშნა.
შემოწმებულია კანარიკა და დაბლოკვის გეგმა; ტესტირების უკან დაბრუნების ბრძანებები.
- JIT ხელმისაწვდომია; ალერტები განწყობილნი არიან (SLO არ ყრიან).
- კალენდარი/სტატუსის გვერდი და შეტყობინებები მომზადებულია.
- გამოშვებები/კონკურენტი ფანჯრები - გაყინული/გადაადგილება.
დადასტურებულია პროვაიდერები; ჩაწერილია კონტაქტები და SLA.
დროს
- აპდეიტები გრაფიკით; ომის ოთახი აქტიურია.
- SLO/შეცდომების მწვერვალები დაცულია; დარღვევის შემთხვევაში - მანქანის დაბრუნება.
- Evidence გროვდება (ეკრანის ეკრანები, გრაფიკა წინ/მის შემდეგ, მოქმედების ლოგო).
შემდეგ
- SLO მწვანე ზონაში observation window- ის განმავლობაში.
- საბოლოო ანგარიში ღონისძიებით; სტატუსის გვერდი განახლებულია.
- CAPA შედგენილია (თუ იყო გადახრები); დოკუმენტაცია განახლებულია.
12) შაბლონები
RFC შაბლონი მომსახურების ფანჯარასთან
RFC: MW-2025-11-05-DB-Upgrade
Window: 2025-11-05 00: 00-02: 00 UTC (Europe/Kyiv 02: 00-04: 00)
Service/component: payments-db (PostgreSQL cluster A)
Type: Planned (High)
Target: Upgrade to 15. x for security/bugs
Blast radius: EU region, tenant EU, all write operations
Impact: up to 2 × p99 growth to 400 ms; short-term read-only (≤5 min)
Gardrails: error-rate <0. 5%, p99 <400 ms, SLO not impaired
План: expand→migrate→contract; canary 1 %/5 %/25%; 1..N steps (with commands)
Backout: rolling back replica/slots; TTL DNS does not change; rollback time ≤ 10 min
Suppression: noise of database/replica alerts; SLO alerts are active
Communications: T-7/T-2 days and T-60/15 minutes; war-room #mw-db-a
Owners: @ db-tl, @ sre-ic, @ payments-pm
Evidence: before/after p95/p99 graphs, migration logs, checksums
Risk: High (data) - confirmed by CAB
კლიენტის შეტყობინების შაბლონი (მოკლედ)
Topic: Planned work 05. 11. 2025 02:00–04:00 (Europe/Kyiv)
We will update the payment database. Short delays and read-only mode (up to 5 minutes) are possible.
On-call contacts: status. example. com support@example. com
supression წესები (იდეა)
yaml suppress:
- name: db-maintenance when: window("2025-11-05T00:00Z","2025-11-05T02:00Z")
match: [ "db. replica. lag", "db. connection. reset", "migration. progress" ]
keep: [ "slo. payment. success", "api. availability" ]
13) რეგულირებადი დომენების მახასიათებლები
აუდიტის ჟურნალი უცვლელია: ვინ დაამტკიცა ვინ შეასრულა, რომელი გუნდები, ჰეშის არტეფაქტები.
PII/ფინანსები: შენიღბვა evidence, შეზღუდული წვდომა ანგარიშებზე.
მომხმარებლებისა და პარტნიორების შეტყობინებების ვადები ხელშეკრულებების შესაბამისად.
პროვაიდერის ფანჯრები - დოკუმენტირებულია გარე SLA და კონტაქტებით.
14) ანტი შაბლონები
ფანჯარა უკანა გეგმის გარეშე და დადასტურებული დაბრუნება.
SLO სიგნალების ჩაქრობა „მხოლოდ შემთხვევაში“.
კონკურენტი ფანჯრები ერთ დომენში/რეგიონში.
კომმ-დუმილი: არ არსებობს აპდეიტები „დროზე/მის შემდეგ“.
სახელმძღვანელო კორექტირება გაყიდვაში აუდიტის და სკრიპტების გარეშე.
„გაუთავებელი“ ფანჯრები წარმატების გაურკვეველი კრიტერიუმების გამო.
ევიდენციის არარსებობა ხარისხის დადასტურების არაფერია.
15) განხორციელების გზის რუკა (4-6 კვირა)
1. ნვე. 1: შემოიღეთ ერთი კალენდარი და RFC შაბლონი; განსაზღვრეთ შავი პერიოდები.
2. ნვე. 2: კარიბჭეების სტანდარტიზაცია (კანარი, SLO გარდერობი, ქილა).
3. ნვე. 3: ავტომატიზაცია suppression/გამოშვების ვიდეო და სტატუსის გვერდი.
4. ნვე. 4: სიმწიფის მოხსენებები და მეტრიკა; ყოველკვირეული MW მიმოხილვა.
5. ნვე. 5-6: ინტეგრაცია პროვაიდერებთან და აუდიტის არქივთან; მაღალი დონის ფანჯრის სიმულაცია.
16) შედეგი
სწორად ორგანიზებული მომსახურების ფანჯრები არის კონტროლირებადი, შექცევადი და დადასტურებული უსაფრთხო ცვლილებები. SLO გარდერობებით, კანარის განლაგებით, მკაცრი კომუნიკაციებით და ევიდაციის სრული კომპლექტით, ფანჯარა „საშინელი დროიდან“ გადაიქცევა რუტინულ გაუმჯობესების მექანიზმად მომხმარებლებისა და პარტნიორებისთვის სიურპრიზების გარეშე.