ბენჩმარკინგი და პროდუქტიულობის შედარება

მოკლე რეზიუმე

Benchmarking არის ექსპერიმენტი და არა „5 წუთის განმავლობაში დაწყება“. ძირითადი პრინციპები:

1. ჩამოაყალიბეთ ჰიპოთეზა და მეტრიკა.

2. აკონტროლეთ ცვლადი (რკინა, ბირთვი, კვება, ფონის ხმაური).

3. შეაგროვეთ საკმარისი მონაცემები (შენიშვნები, ნდობის ინტერვალები).

4. ჩაატარეთ პროფილირება - ამის გარეშე არ არის გასაგები „რატომ“.

5. გააკეთეთ რეპრო: სკრიპტები, ვერსიების დაფიქსირება და არტეფაქტები.

საწვავის ბრენდის და ბიზნეს მეტრიკის მიზნები

გამტარუნარიანობა (throughput): RPS/QPS/CPS, ჩანაწერები/წმ.
შეფერხება: p50/p95/p99/კუდის სიმკვრივე.
ეფექტურობა: Cost-per-1k RPS, გარიგების ვატი ,/მილიწამალი გაუმჯობესება.
სტაბილურობა: ჯიტერი, ცვალებადობა ციკლებს/ნოდებს შორის.
ელასტიურობა: როგორ არის მასშტაბური ინდიკატორები N × რესურსზე (Amdahl/Gustafson მითითებები).

მეთოდოლოგია: ექსპერიმენტის დიზაინი

ჰიპოთეზა: „Envoy from HTTP/3 შეამცირებს p95 TTFB 10-15% -ით იმავე RPS- სთან შედარებით“.
შედარების ერთეული: ბილეთის/ჩამორთმევის/რკინის ინსტანციის ვერსია.
A/B სქემა: პარალელური პროგონი იდენტური გარემოზე; ან ABAB/Latin Square შეამცირებს დრიფტის გავლენას.
გამეორებების რაოდენობა: 10 მოკლე + 3 გრძელი რგოლი კონფიგურაციისთვის სტაბილური შეფასებისთვის.
სტატისტიკა: საშუალო, MAD, სანდო ინტერვალებით; არაპარმეტიკული ტესტები (Mann-Whitney) „კუდის“ განაწილებისთვის.
DoE (მინიმალური): შეცვალეთ ერთი ცვლადი ერთხელ (OVAT) ან ფრაქციული ფაქტორის გეგმა 2-3 ფაქტორისთვის (მაგალითად, TLS პროფილი × HTTP ვერსია × ბირთვი).

ცვლადის და ხმაურის კონტროლი

CPU governor: `performance`; გამორთეთ power save.
Turbo/Throttling: სიხშირის, ტემპერატურის და trottling მონიტორინგი (წინააღმდეგ შემთხვევაში, დათბობა ცრუ მოგებას მისცემს).
NUMA/Hyper-Threading: კონსოლიდაცია IRQ და პროცესები ('taskset/numactl'), გაზომეთ მეხსიერების ადგილმდებარეობა.
C-states/IRQ ბალანსი: ჩაწერეთ პარამეტრები; ქსელის ტესტებისთვის - სპეციფიკური ბირთვის pin IRQ.
ფონის პროცესები: სუფთა ნოდა, გამორთეთ cron/backup/antivirus/განახლება.
ქსელი: სტაბილური ბილიკები, ფიქსირებული MTU/ECN/AQM, არხის ფლატერის ნაკლებობა.
მონაცემები: იგივე ნაკრები, კარდინალობა და განაწილება.
ქეში: გაიზიარეთ „ცივი“ (პირველი გადასასვლელი) და „თბილი“ (განმეორებითი) რეჟიმები, აშკარად აღნიშნეთ.

ბენჩმარკის კლასები

1) მიკრო ბენზინგასამართი სადგურები (ფუნქცია/ალგორითმი)

მიზანი: კონკრეტული კოდის/ალგორითმის გაზომვა.
ინსტრუმენტები: ჩაშენებული ბენჩის ჩარჩოები (Go 'testing. B`, JMH, pytest-benchmark).
წესები: JIT დათბობა, მილიწამები და ნანოეკუნები; GC იზოლაცია; ფიქსირებული თესლი.

2) მეზო-ბენჩმარკი (კომპონენტი/მომსახურება)

HTTP სერვერი, ქეში, ბროკერი, BD ერთ მოდელზე.
ინსტრუმენტები: wrk/wrk2, k6 (ღია მოდელი), vegeta, ghz (gRPC), fio, sysbench, iperf3.
წესები: კავშირები/ფაილები, ტყვიები; ანგარიში CPU/IRQ/GC.

3) მაკრო ბენზინგასამართი სადგურები (e2e/მოთხოვნის გზა)

სრული გზა: CDN/edge - proxy - სერვისი - BD/ქეში - პასუხი.
ინსტრუმენტები: k6/Locust/Gatling + RUM/OTel ტრეისი; მარშრუტების რეალისტური ნაზავი.
წესები: რეალობასთან უფრო ახლოს („ბინძური“ მონაცემები, გარე სისტემების ბლოკები), სისუფთავე.

მეტრიკის ნაკრები ფენებში

ფენა	მეტრიკი
კლიენტი/edge	DNS p95, TLS handshake p95, TTFB, HTTP/2/3 доля
ქსელი	RTT/loss/jitter, ECN CE, Goodput, PPS/CPS
TLS/Proxy	handshakes/s, resumption rate, cipher mix
პროგრამა	p50/95/99, 5xx/429, GC pauses, threads, queues
კეში	hit-ratio by layer, eviction, hot-keys
BD	QPS, p95 მოთხოვნა, locks, buffer/cache hit, WAL/fsync
დისკი	IOPS, latency, 4k/64k, read/write mix, fsync cost
GPU/ML	throughput (samples/s), latency, mem BW, CUDA/ROCm util

ტესტებისა და ბრძანებების შაბლონები

ქსელი (TCP/UDP):

bash iperf3 -s # server iperf3 -c <host> -P 8 -t 60 # parallel, stable bandwidth

HTTP სერვერი (სტაბილური დატვირთვა, wrk2):

bash wrk2 -t8 -c512 -d5m -R 20000 https://api. example. com/endpoint \
--latency --timeout 2s

Open მოდელი (k6, arrival-rate):

javascript export const options = {
scenarios: { open: { executor: 'constant-arrival-rate', rate: 1000, timeUnit: '1s',
duration: '10m', preAllocatedVUs: 2000 } },
thresholds: { http_req_failed: ['rate<0. 3%'], http_req_duration: ['p(95)<250'] }
};

დისკი (fio, 4k random read):

bash fio --name=randread --rw=randread --bs=4k --iodepth=64 --numjobs=4 \
--size=4G --runtime=120 --group_reporting --filename=/data/testfile

BD (sysbench + PostgreSQL სავარაუდო იდეა):

bash sysbench oltp_read_write --table-size=1000000 --threads=64 \
--pgsql-host=... --pgsql-user=... --pgsql-password=... prepare sysbench oltp_read_write --time=600 --threads=64 run

მეხსიერება/CPU (Linux perf + stress-ng):

bash perf stat -e cycles,instructions,cache-misses,L1-dcache-load-misses \
-- <your_binary> --bench

სტატისტიკა და ნამდვილობა

განმეორებები: მინიმუმ 10 პროგონი, გამორიცხეთ outliers (დროულად: საშუალო/MAD).
ნდობის ინტერვალები: bootstrap 95% CI p95/p99 და საშუალო.
ეფექტი-ზომა: ფარდობითი ცვლილება და მისი CI (მაგ., − 12% [− 9%; − 15%]).
პრაქტიკული მნიშვნელობა: p95 10% -ით შემცირება ფასით + 30% CPU - ღირს?
გრაფიკა: violin/ECDF განაწილებისთვის, „გაჯერების მრუდი“ (RPS-latency).

ვიწრო ადგილის პროფილირება და ლოკალიზაცია

CPU: `perf`, `async-profiler`, eBPF/pyroscope; flamegraph ადრე და მის შემდეგ.
Alloc/GC: runtime პროფილები (Go ppprof/Java JFR).
I/O: `iostat`, `blktrace`, `fio --lat_percentiles=1`.
Сеть: `ss -s`, `ethtool -S`, `dropwatch`, `tc -s qdisc`.
БД: `EXPLAIN (ANALYZE, BUFFERS)`, pg_stat_statements, slowlog.
კეში: ტოპ გასაღებები, TTL, ღონისძიების მიზეზი.

ანგარიშები და ნივთები

რა დავაფიქსიროთ:

git SHA ბილეთი, კომპოზიციის/ოპტიმიზაციის დროშები.
ბირთვის/ქსელის კონფიგურაცია (sysctl), დრაივერების ვერსიები/NIC/firmware.
ტოპოლოგია (vCPU/NUMA/HT), მთავრობა, ტემპერატურა/სიხშირე.
მონაცემები: ზომა, კარდინალობა, განაწილება.
რა უნდა გამოქვეყნდეს: ცხრილები p50/p95/p99, შეცდომა/წმ, throughput, რესურსები (CPU/RAM/IO), CI.
არტეფაქტები: პროგონის სკრიპტები, გრაფიკა, flamegraph, ნედლეული JSON/CSV შედეგები, გარემოს პროტოკოლი.

გულწრფელი შედარებები

იდენტური შეზღუდვები (con pool, keepalive, TLS ჯაჭვები, OCSP სტაპლინგი).
კოორდინირებული ტაიმაუტები/რეტრაი და HTTP ვერსია (h2/h3).
ტემპერატურის ბალანსი: გაათბეთ წონასწორობამდე (ტერბოს ბუჩქის ეფექტის გარეშე).
სამართლიანი ქეში: ან ორივე „ცივი“, ან ორივე „თბილი“.
ქსელის სიმეტრია: იგივე მარშრუტები/MTU/ECN/AQM.
დროის ბიუჯეტი: DNS/TLS/კავშირი - განიხილოს მკაფიოდ ან გამორიცხოს იგივე.

ანტი შაბლონები

ერთი პროგონი არის „დასკვნა“.
რეჟიმების ნაზავი (ცივი ნაწილი, ნაწილი თბილი) ერთ სერიაში.
დახურული მოდელი ონლაინ დატვირთვისთვის გახსნილი ნაცვლად არის ყალბი „სტაბილურობა“.
"RPS" - ის მიუწვდომელი შენიშვნები იზრდება "დუბლების და კასკადის 5xx ფასით.
შედარება სხვადასხვა რკინის/ბირთვების/ენერგიის ქამრების შესახებ.
პროფილის არარსებობა - „ბრმა“ ოპტიმიზაცია.
თამაში GC/heap- ით, კუდის რეგრესიის პროფილების ანალიზის გარეშე.

პრაქტიკული რეცეპტები

მინიმალური ბენჩის ნაბიჯები:

1. გარემოს დაფიქსირება (სკრიპტი 'env _ capture. sh`).

2. გაათბეთ (5-10 წუთი), დააფიქსირეთ სიხშირე/ტემპერატურა.

3. ჩაატარეთ მოკლე + 1 მოკლე გამეორებები.

4. პროფილების ამოღება (CPU/alloc/IO) მწვერვალზე.

5. გამოთვალეთ CI/გრაფიკა, შეაგროვეთ ნივთები.

6. გადაწყვეტილება: ჰიპოთეზის მიღება/უარყოფა, შემდეგი ნაბიჯების შექმნა.

კონტეინერების მრუდი (capacity curve):

RPS ნაბიჯები (10% ნაბიჯი) - ჩვენ ვაფიქსირებთ p95/შეცდომას და ვიპოვით „მუხლს“.
ჩვენ ვქმნით გრაფიკს RPS - latence და RPS - CPU: ვხედავთ საზღვარს და ღირებულებას შემდგომი%.

სპეციფიკა iGaming/fintech

მილიწამურის ღირებულება: დაანგარიშეთ აშშ დოლარის გაუმჯობესება (კონვერტაცია/გადინება/PSP ლიმიტები).
Piki (მატჩები/ტურნირები): spike + plateau ფრენჩაიზები TLS/CDN/ქეში.
გადახდა/PSP: გაზომეთ end-to-end sandbox-limites, imempotence და რეაქციები დეგრადაციაზე; ჩაწერეთ დრო-Wallet მარიონეტული მეტრიკებით.
ანტიფროგრამის/ბოტის ფილტრები: ჩართეთ წესების პროფილი მაკრო ბენჩში (ფალსური-პოზიტიური-დანამატი, ლატენტური დანამატი).
ლიდერები/ჯეკპოტები: შეამოწმეთ ცხელი გასაღებები/რანჟირება, ბლოკირება, ატომურობა.

საწვავის მარკირების სია

ჰიპოთეზა/მეტრიკა/წარმატების კრიტერიუმი.
ცვლადის კონტროლი (კვება/NUMA/IRQ/ქსელი/ქეში).
პროგნოზის გეგმა (რეპლიკები, ხანგრძლივობა, დათბობა).
„ცივი/თბილი“ რეჟიმების გამიჯვნა.
პროფილის ჩართვა (CPU/alloc/IO/BD).
სტატისტიკა: CI, მნიშვნელობის ტესტები, გრაფიკა.
არტეფაქტები და რეპროდუქციული სკრიპტები საცავში (IaC სტენდისთვის).
ანგარიში „გაუმჯობესების ღირებულებით“ და რეკომენდაციებით.
regression perf ოპტიმიზაციის შემდეგ.

მინი ანგარიში (შაბლონი)

მიზანი: p95 API 15% -ით შემცირება CPU> 10% ზრდის გარეშე.
მეთოდი: A/B, k6 Open-model 1k rps, 10 × 3 ragon, warm cache.
სულ: p95 − 12% [− 9%; − 15%], CPU + 6%, 5xx უცვლელი.
Flamegraph: JSON სერიალიზაცია (CPU − 30%), ვიწრო ადგილი გადავიდა BD- ში.
გადაწყვეტილება: ოპტიმიზაციის მიღება; შემდეგი ნაბიჯი არის BD- ს მოთხოვნების ბრძოლა.
ნიმუშები: გრაფიკა, პროფილები, კონფიგურაცია, ნედლეული JSON.

შედეგი

კარგი ბენჩმარკინგი არის მკაცრი მეთოდოლოგია + გულწრფელი შედარებები + სტატისტიკური შესაბამისობა + პროფილირება + რეპროდუქცია. დადგით ჰიპოთეზა, აკონტროლეთ გარემო, გაითვალისწინეთ ნდობის ინტერვალები, გამოაქვეყნეთ ნივთები და მიიღეთ გადაწყვეტილებები გაუმჯობესების ღირებულებაზე. ასე რომ, თქვენ მიიღებთ არა ლამაზ ფიგურას პრეზენტაციაში, არამედ პლატფორმის სიჩქარისა და პროგნოზირების რეალურ ზრდას.