Bedrohungsüberwachung und SOC-Alerts

Kurze Zusammenfassung

Ein effektives SOC baut auf drei Säulen auf: Vollständigkeit der Telemetrie, qualitative Detektion und operative Disziplin (Priorisierung, Eskalationen, Post-Incident und Verbesserungen). Das Ziel: Angreifer schnell anhand von Verhaltens- und Signaturindikatoren identifizieren, innerhalb des SLO reagieren und Fehlalarme ohne Deckungsverlust minimieren.

SOC-Überwachungsarchitektur

SIEM - Empfang, Normalisierung und Korrelation von Ereignissen; Dashboards, Suche, Alerting.
UEBA - User/Host Behavioral Analytics, Basisprofile und Anomalien.
SOAR - Response Automation: Anreicherung von Alerts (TI, CMDB), Orchestrierung von Containment-Aktionen.
TI (Threat Intelligence) - IOC/TTP/kritische Schwachstellenfeeds; Kontext für Regeln und Bereicherung.
Lagerung - „heiße“ 7-30 Tage für Untersuchungen, „kalte“ 90-365 + für Compliance/Retrospektive.

Protokollquellen (minimal ausreichend)

Identität und Zugang:

IdP/SSO (OIDC/SAML), MFA, PAM, VPN/ZTNA, Verzeichnisse (AD/AAD).

Endpunkte:

EDR/AV, Sysmon/ETW (Windows), auditd/eBPF (Linux), MDM (Mobilgeräte).

Netzwerk und Perimeter:

Firewalls (L3/L7), WAF/WAAP, Balancer (NGINX/Envoy), DNS, Proxy, NetFlow/sFlow/Zeek.

Clouds und Plattformen:

CloudTrail/Activity Logs, KMS/Key Vault, Event IAM, Kubernetes (Audit, API Server), Containersicherheit.

Anwendungen und DB:

Admins Audit, Zugang zu PII/Zahlungen, DDL/Rechte, kritische Geschäftsereignisse (withdraw, Bonus, Auszahlung).

Post und Zusammenarbeit:

Phishing/Spam-Detail, DLP, URL-Klicks, Anhänge.

Normalisierung: einheitliches Format (z.B. ECS/CEF), Pflichtfelder: 'timestamp', 'src/dst ip', 'user', 'action', 'resource', 'result',' request _ id/trace _ id'.

Bedrohungstaxonomie und ATT & CK-Mapping

Erstellen Sie Regeln und Dashboards im MITRE ATT & CK-Schnitt: Initial Access, Execution, Persistence, Privilege Escalation, Defense Evasion, Credential Access, Discovery, Lateral Movement, C2, Collection/Exfiltration/Auswirkungen.
Für jede Taktik gibt es minimale Detektionen und Kontrollpanels „Abdeckung vs. fidelity“.

Alerting-Richtlinie und Priorisierung

Severity:

P1 (kritisch): aktives C2, erfolgreiche ATO/Token-Entführung, Verschlüsselung, Exfiltration von Payment/PII.
P2 (High): Implementierung in Infrastruktur/Cloud, Privilegien eskalieren, MFA umgehen.
P3 (Medium): verdächtige Anomalie, wiederholte Fehlversuche, seltenes Verhalten.
P4 (Low): Rauschen, Hypothesen, TI-Übereinstimmungen ohne Bestätigung.
Eskalationen: P1 - sofort on-call (24 × 7), P2 - während der Arbeitszeit ≤ 1 h, der Rest - durch Warteschlangen.
Duplikate reduzieren: Aggregiere Alerts nach Objekt/Sitzung, um einen „Sturm“ zu vermeiden.

SLI/SLO/SLA SOC

SLI: Erkennungszeit (MTTD), Bestätigungszeit (MTTA), Zeit bis zum Containment (MTTC), Anteil der falsch positiven (FP) und verpassten (FN) auf Szenario-Clustern.

SLO (Beispiele):

MTTD P1 ≤ 5 Minuten MTTC P1 ≤ 30 Min.
FP-Rate nach High-Severity-Regeln ≤ 2 %/Tag.
Die Abdeckung der wichtigsten ATT & CK-Techniken ≥ 90% (Vorhandensein von mindestens einem Nachweis).
SLA (extern): Stimmen Sie mit dem Unternehmen überein (z. B. P1-Benachrichtigung der Eigentümer ≤ 15 Minuten).

Erkennungsregeln: Signaturen, Heuristik, Verhalten

Sigma (Beispiel: Verdächtiger Zugriff auf Admins außerhalb des Landes)

yaml title: Admin Panel Access Outside Allowed Country id: 5c6c9c1d-8f85-4a0e-8c3a-1b7cabc0b001 status: stable logsource:
product: webserver detection:
selection:
http. request. uri: /admin http. response. status: 200 filter_country:
geoip. country: /^(?!UA    PL    GE)$/
condition: selection and filter_country level: high fields: [user, ip, geoip. country, user_agent, trace_id]
falsepositives:
- Service connections from SOC/VPN (add allow-list)

KQL (Beispiel: Anstieg fehlgeschlagener Logins + verschiedene Accounts von derselben IP)

kusto
SigninLogs where ResultType!= 0 summarize fails=count(), users=dcount(UserPrincipalName) by bin(TimeGenerated, 10m), IPAddress where fails > 50 and users > 5

Anwendung (SQL, Zugriff auf PII außerhalb des Zeitplans)

sql
SELECT user_id, count() AS reads
FROM audit_pii
WHERE ts > now() - interval '1 hour'
AND user_id NOT IN (SELECT user_id FROM roster WHERE role IN ('DPO','Support'))
AND extract(hour from ts) NOT BETWEEN 8 AND 21
GROUP BY 1 HAVING count() > 5;

UEBA und Kontext

Profile der zugrunde liegenden Aktivität nach Benutzern/Rollen/Diensten (Stunden, ASN, Geräte).
Anomalien: seltene IP/ASN, neues Gerät, ungewöhnliche API-Sequenzen, abrupte Änderung der Aktivitätszeit.
Risiko-Score-Ereignisse = Signale (TI, Anomalie, Ressourcenempfindlichkeit) × Gewichte.

SOAR und Antwortautomatisierung

Bereicherung: TI-Reputation IP/Domain/Hash, CMDB (wer ist der Host/Service-Eigentümer), HR (Mitarbeiterstatus), IAM-Rolle.
Aktionen: Host-Isolation (EDR), Blockierung von IP/ASN/JA3, vorübergehender Widerruf von Token/Sitzungen, erzwungene Rotation von Geheimnissen, Verbot von Auszahlungen/Einfrieren von Boni.
Guard Rails: für kritische Aktionen - Zwei-Faktor-Appruve; TTL auf Sperren.

SOC-Prozesse

1. Triage: Kontextprüfung, Deduplizierung, Abgleich mit TI, Primärklassifizierung nach ATT&CK.
2. Untersuchung: Sammlung von Artefakten (PCAP/EDR/Protokolle), Hypothesen, Zeitlinie, Schadensschätzung.
3. Containment/Eradication: Isolation, Rückruf von Schlüsseln/Token, Patchen, Sperren.
4. Wiederherstellung: Reinheitskontrolle, Rotation, Wiederholungsüberwachung.
5. RCA/Lektionen: Post-Incident, Regeln/Dashboards aktualisieren, Testfälle hinzufügen.

Tuning und Detektionsqualität

Schattenmodus für neue Regeln: zählen, aber nicht blockieren.
Regression Pack: Eine Bibliothek von „guten/schlechten“ Ereignissen für CI-Regeltests.
FP-Remediation: Pfad-/Rollen-/ASN-Ausnahmen; die Regel „standardmäßig böse“ - nur nach Kanarienvögeln.
Drift-Monitoring: Veränderung der Basisaktivität → Anpassung der Schwellenwerte/Modelle.

Dashboards und Bewertungen

Operativ: aktive Alerts, P1/P2, Angriffskarte (Geo/ASN), „Top-Talker“, TI-Match-Feed.
Taktisch: ATT & CK-Abdeckung, FP/FN-Trends, MTTD/MTTC, „noising“ Quellen.
Geschäft: Vorfälle nach Produkten/Regionen, Auswirkungen auf KPIs (Conversion, Time-to-Wallet, Auszahlungsausfälle).

Aufbewahrung, Datenschutz und Compliance

Retention: mindestens 90 Tage „warme“ Protokolle, ≥ 1 Jahr Archiv, wo erforderlich (Fintech/Aufsichtsbehörden).
PII/Secrets: Tokenisierung/Maskierung, rollenbasierter Zugriff, Verschlüsselung.
Gesetzliche Anforderungen: Meldung von Vorfällen, Speicherung von Entscheidungsketten, Taktkonsistenz (NTP).

Purple Team und Überprüfung der Abdeckung

Threat Hunting: TTP-Hypothesen (z. B. T1059 PowerShell), Ad-hoc-Abfragen in SIEM.
Purple Team: Red + Blue gemeinsame Sprints - TTP starten, Trigger checken, Regeln finalisieren.
Autotests von Detekten: periodisches Re-Play von Referenzereignissen (Atomic Tests) in Non-Prod und „Shadow“ Prod.

Besonderheiten von iGaming/Fintech

Kritische Domains: Login/Registrierung, Ein-/Auszahlungen, Promo, Zugang zu PII/fin. Berichte.
Szenarien: ATO/Credential Stuffing, Kartentests, Bonus-Missbrauch, Insider-Zugang zu Auszahlungen.
Regeln: Velocity auf '/login', '/withdraw', Idempotenz und HMAC von Webhooks, mTLS zu PSP, Detektionen für den Zugriff auf Tabellen mit PAN/PII.
Die Auslöser des Geschäfts: ein starker Anstieg von Zahlungsausfällen/Chargeback, Anomalien bei Conversions, Spitzen bei „Null“ -Einlagen.

Beispiele für Runbooks (abgekürzt)

P1: ATO bestätigt und Abhebungen

1. SOAR blockiert die Sitzung, ruft Refresh-Token zurück und friert Leads ein (TTL 24 h).
2. Benachrichtigen Sie den Product/Finance Owner; Password reset/2FA-rebind starten.
3. Überprüfen Sie benachbarte Konten durch device/IP/ASN-Spalte; Erweitern Sie den Block nach Cluster.
4. RCA: Wiederholungserkennung hinzufügen, Velocity-Schwelle auf '/withdraw 'verstärken.

P2: Exekyushnom auf dem Server (T1059)

1. EDR-Isolation, Speicherentnahme/Artefakte.
2. Inventar der letzten Deploys/Geheimnisse; Rotation der Schlüssel.
3. IOC-Flötenjagd; C2-Prüfung in DNS/Proxy.
4. Post-Incident: Regel „Parent = nginx → bash“ + Sigma für Sysmon/Linux-Audit.

Häufige Fehler

Überlastung des SIEM durch Rauschen ohne Normalisierung und TTL.
Detektionen ohne Mapping bei ATT&CK → „blinde Flecken“.
Keine SOAR/Anreicherung - lange MTTA, manuelle Routinen.
Ignorieren von UEBA/Verhalten - Auslassen von „langsamen“ Insidern.
Harte globale TI-Blöcke ohne TTL schneiden den Geschäftsverkehr → ab.
Keine Regressionstests der Regeln.

Roadmap für die Implementierung

1. Loginventur und Normalisierung (ECS/CEF), „Mindestsatz“.
2. ATT & CK-Beschichtungsmatrix und hochriskante Basisdetektionen.
3. SLO und Warteschlangen: P1-P4, On-Call und Eskalation.
4. SOAR-Playbooks: Anreicherung, Containment-Aktionen, TTL-Blöcke.
5. UEBA und Risiko-Scoring: Profile, Anomalien, Drift-Monitoring.
6. Purple Team/Detektentests: Schattenmodus, Kanarienvögel, Regression Pack.
7. Berichterstattung und Compliance: Retention, Datenschutz, Business Dashboards.

Ergebnis

Ein ausgereiftes SOC ist eine vollständige Telemetrie + Qualitätsdetektion + Reaktionsdisziplin. Binden Sie Regeln an MITRE ATT&CK, automatisieren Sie Anreicherung und Containment in SOAR, messen Sie das Ergebnis mit SLO-Metriken, überprüfen Sie regelmäßig die Abdeckung im Purple Team - und Ihre Überwachung ist geräuschresistent, reagiert schnell auf reale Bedrohungen und unterstützt Geschäftsmetriken.