otel-collector: fix oom, add profiling extensions and benchmark report (#7262)

2026-04-21 14:37:17 +00:00 · 2025-12-01 14:35:12 +01:00 · 2025-12-01 14:35:12 +01:00 · 1316d9a162
commit 1316d9a162
parent 4a805afd94
17 changed files with 791 additions and 34 deletions
--- a/deployment/services/environment.ts
+++ b/deployment/services/environment.ts
@ -81,7 +81,7 @@ export function prepareEnvironment(input: {
      },
      tracingCollector: {
        cpuLimit: isProduction || isStaging ? '1000m' : '100m',
-        memoryLimit: isProduction || isStaging ? '4000Mi' : '200Mi',
+        memoryLimit: isProduction || isStaging ? '1000Mi' : '512Mi',
        maxReplicas: isProduction || isStaging ? 3 : 1,
      },
    },
--- a/docker/configs/otel-collector/benchmark.md
+++ b/docker/configs/otel-collector/benchmark.md
@ -0,0 +1,462 @@
+# OTEL Collector Memory Configuration Benchmark Report
+
+## Executive Summary
+
+Three memory limiter configurations were tested under load (100 VUs) to compare stability and OOM
+behavior:
+
+- **Test 1 (limit_percentage)** - **FAILED - OOM**
+
+- **Test 2 (limit_mib)** - **PASSED - High CPU/MEM**
+
+- **Test 3 (limit_mib + file_storage)** - **PASSED - Stable**
+
+---
+
+## Test Configuration
+
+### Common Settings
+
+- **Load Test Tool**: k6
+- **Virtual Users (VUs)**: 100
+- **Test Duration**: 60 seconds
+
+### Test 1: Percentage-Based Memory Limiter
+
+```yaml
+memory_limiter:
+  check_interval: 1s
+  limit_percentage: 80
+  spike_limit_percentage: 20
+```
+
+### Test 2: Fixed MiB Memory Limiter
+
+```yaml
+memory_limiter:
+  check_interval: 1s
+  limit_mib: 1000
+  spike_limit_mib: 200
+```
+
+### Test 3: Fixed MiB + File Storage with Sending Queue
+
+```yaml
+memory_limiter:
+  check_interval: 1s
+  limit_mib: 1000
+  spike_limit_mib: 200
+
+extensions:
+  file_storage:
+    directory: /var/lib/otelcol/file_storage
+    timeout: 2s
+    fsync: false
+    compaction:
+      directory: /var/lib/otelcol/file_storage
+      on_start: true
+      on_rebound: true
+      rebound_needed_threshold_mib: 5
+      rebound_trigger_threshold_mib: 3
+
+exporters:
+  clickhouse:
+    sending_queue:
+      enabled: true
+      num_consumers: 1
+      queue_size: 5000
+      storage: file_storage
+```
+
+---
+
+## Results
+
+### Test 1: Percentage-Based Configuration
+
+#### Performance Metrics
+
+| Metric                  | Value          |
+| ----------------------- | -------------- |
+| **Total Requests**      | 1,595          |
+| **Successful Requests** | 1,178 (73.85%) |
+| **Failed Requests**     | 417 (26.14%)   |
+| **Throughput**          | 16.02 req/s    |
+| **Avg Response Time**   | 1.96s          |
+| **P90 Response Time**   | 3.82s          |
+| **P95 Response Time**   | 5.13s          |
+| **Max Response Time**   | 10.7s          |
+
+#### Stability Analysis
+
+- **OOM Events**: **6 OOM kills detected**
+- **Pod Restarts**: All 3 pods restarted (1 restart each)
+- **Memory Usage Before OOM**: ~4000 MiB (based on OOM events showing anon-rss of ~3.9-4GB)
+- **Connection Errors**: Extensive EOF and "connection reset by peer" errors during test
+
+#### OOM Event Details
+
+```
+Warning OOMKilling - Killed process 3482961 (otelcol-custom)
+  total-vm: 5198444kB, anon-rss: 3973784kB (~3.9GB)
+
+Warning OOMKilling - Killed process 3466495 (otelcol-custom)
+  total-vm: 5266984kB, anon-rss: 4050048kB (~4.0GB)
+
+Warning OOMKilling - Killed process 2448002 (otelcol-custom)
+  total-vm: 5268200kB, anon-rss: 4000116kB (~4.0GB)
+```
+
+All 3 replicas experienced OOM kills with memory consumption around **4GB**.
+
+---
+
+### Test 2: Fixed MiB Configuration
+
+#### Performance Metrics
+
+| Metric                  | Value          |
+| ----------------------- | -------------- |
+| **Total Requests**      | 2,024          |
+| **Successful Requests** | 1,467 (72.48%) |
+| **Failed Requests**     | 557 (27.51%)   |
+| **Throughput**          | 32.31 req/s    |
+| **Avg Response Time**   | 1.32s          |
+| **P90 Response Time**   | 1.8s           |
+| **P95 Response Time**   | 2.0s           |
+| **Max Response Time**   | 4.07s          |
+
+#### Stability Analysis
+
+- **OOM Events**: **0 OOM kills**
+- **Pod Restarts**: 0 restarts
+- **Peak Memory Usage**: ~907 MiB (stable)
+- **Memory Limit**: 1000 MiB
+- **Memory Headroom**: ~93 MiB (9.3% available)
+
+---
+
+### Test 3: Fixed MiB + File Storage Configuration
+
+#### Performance Metrics
+
+| Metric                  | Value         |
+| ----------------------- | ------------- |
+| **Total Requests**      | 2,059         |
+| **Successful Requests** | 2,059 (100%!) |
+| **Failed Requests**     | 0 (0%!)       |
+| **Throughput**          | 32.41 req/s   |
+| **Avg Response Time**   | 1.36s         |
+| **P90 Response Time**   | 2.28s         |
+| **P95 Response Time**   | 2.78s         |
+| **Max Response Time**   | 4.1s          |
+
+#### Stability Analysis
+
+- **OOM Events**: **0 OOM kills**
+- **Pod Restarts**: 0 restarts
+- **Peak Memory Usage**: ~412 MiB (during load test)
+- **Memory Limit**: 1000 MiB
+- **Memory Headroom**: ~588 MiB (58.8% available)
+- **Success Rate**: **100%**
+
+#### Key Improvements
+
+- **Perfect Success Rate**: 100% success rate with 0 failures
+- **File-based persistence**: Sending queue with file storage provides durability
+- **Highest throughput**: 32.41 req/s surpasses Test 2 (32.31 req/s)
+- **Controlled memory usage**: Peak at 412 MiB, well below 1000 MiB limit (58.8% headroom)
+- **Batch processing**: 5000 batch size with 1s timeout optimizes throughput
+
+---
+
+## Comparative Analysis
+
+| Metric                | Test 1 (Percentage) | Test 2 (MiB) | Test 3 (MiB + File Storage) |
+| --------------------- | ------------------- | ------------ | --------------------------- |
+| **Throughput**        | 16.02 req/s         | 32.31 req/s  | **32.41 req/s**             |
+| **Total Iterations**  | 1,595               | 2,024        | **2,059**                   |
+| **Success Rate**      | 73.85%              | 72.48%       | **100%**                    |
+| **Failure Rate**      | 26.14%              | 27.51%       | **0%**                      |
+| **Avg Response Time** | 1.96s               | 1.32s        | **1.36s**                   |
+| **P90 Response Time** | 3.82s               | 1.8s         | **2.28s**                   |
+| **P95 Response Time** | 5.13s               | 2.0s         | **2.78s**                   |
+| **Max Response Time** | 10.7s               | 4.07s        | **4.1s**                    |
+| **OOM Events**        | 6                   | 0            | **0**                       |
+| **Pod Restarts**      | 3                   | 0            | **0**                       |
+| **Peak Memory Usage** | ~4000 MiB           | ~907 MiB     | **~412 MiB**                |
+| **Stability**         | Crashed             | Stable       | ** Stable**                 |
+
+### Key Findings
+
+1. **Clear Winner - Test 3**: Achieved **perfect 100% success rate** with 0 failures - the only test
+   to achieve flawless reliability
+2. **Best Performance**: Test 3 achieved **highest throughput** (32.41 req/s) while maintaining
+   perfect reliability
+3. **OOM Prevention**: Both Test 2 and Test 3 completely eliminated OOM kills, while Test 1 caused
+   all 3 replicas to crash
+4. **Memory Comparison**: Test 3 used ~412 MiB peak (vs Test 2's 907 MiB) but with superior
+   reliability through file storage persistence
+5. **Latency Comparison**: Test 3 (P95: 2.78s) is comparable to Test 2 (P95: 2.0s) while providing
+   perfect reliability
+6. **Persistence Advantage**: File storage with sending queue provides durability and crash recovery
+   capabilities
+7. **Production Ready**: Test 3 configuration combines best-in-class throughput, perfect
+   reliability, and reasonable memory footprint
+
+### Root Cause Analysis
+
+The `limit_percentage: 80` configuration likely caused OOM because:
+
+- Percentage-based limits calculate based on total system memory
+- In containerized environments, this can exceed pod memory limits
+- The collector consumed ~4GB before being killed
+- The fixed 1000 MiB limit provided proper bounds and prevented runaway memory usage
+
+## Payload Analysis
+
+### Request Composition
+
+Each k6 request sends a batch of test traces with the following characteristics:
+
+- **Traces per request**: 50
+- **Average spans per request**: ~467 spans (varies by sample composition)
+- **Payload size**: ~3.6MB per request
+
+### Sample Trace Distribution
+
+The test uses a mix of trace samples with varying complexity:
+
+| Sample                                            | Spans per Trace |
+| ------------------------------------------------- | --------------- |
+| `sample-introspection.json`                       | 6 spans         |
+| `sample-user-review-error-missing-variables.json` | 6 spans         |
+| `sample-user-review-not-found.json`               | 8 spans         |
+| `sample-my-profile.json`                          | 12 spans        |
+| `sample-products-overview.json`                   | 12 spans        |
+| `sample-user-review.json`                         | 12 spans        |
+
+**Average**: ~9.3 spans per trace
+
+### Throughput Calculations
+
+Based on Test 3 results (32.41 req/s across 3 pods):
+
+| Metric                  | Value                                     |
+| ----------------------- | ----------------------------------------- |
+| **Traces/second**       | ~1,620 traces/s                           |
+| **Spans/second**        | ~760,000 spans/s                          |
+| **Data ingestion rate** | ~117 MB/s                                 |
+| **Per-pod average**     | ~10.8 req/s, ~540 traces/s, ~253K spans/s |
+
+### Performance Bottleneck Analysis
+
+**ClickHouse is the primary bottleneck** in the ingestion pipeline:
+
+- Network latency: ~100ms (test machine → collector)
+- OTEL Collector processing: Minimal overhead with optimized config
+- **ClickHouse ingestion: Up to 3 second per request** depending on load
+
+The collector's file-based persistent queue helps buffer data during ClickHouse ingestion delays,
+preventing data loss and maintaining 100% success rate despite the backend bottleneck.
+
+### Real-World Usage Capacity
+
+Based on the test payload characteristics and observed throughput, the current 3-pod deployment can
+handle:
+
+**Load Test Payload** (synthetic, heavy):
+
+- 50 traces per request
+- ~467 spans per request (~9.3 spans/trace)
+- 3.6MB payload per request
+- **Capacity: 32.41 req/s = 1,620 traces/s, 760K spans/s**
+
+**Estimated Real-World Capacity** (production traffic):
+
+Real-world GraphQL traces are typically much smaller than test payloads:
+
+- Average production trace: 6-12 spans (vs 600 in test)
+- Average payload size: ~50-100KB per trace (vs 3.6MB per batch)
+
+**Conservative estimate for production:**
+
+- If requests contain single traces (~10 spans, ~75KB each):
+  - **~1,600-2,000 traces/s** (same trace count as test)
+  - This scales to **~96K-120K traces/minute**
+  - Or **~5.7M-7.2M traces/hour**
+
+**Optimistic estimate for production** (lighter payloads):
+
+- With smaller payload sizes, ClickHouse ingestion is faster
+- Network and processing overhead is reduced
+- **Potential for 2-3x higher trace throughput** (~4,800-6,000 traces/s)
+- This scales to **~288K-360K traces/minute**
+  - Or **~17M-22M traces/hour**
+
+**Conclusion**: The synthetic test uses exceptionally heavy payloads (~600 spans per request),
+making it a worst-case scenario. Real production traffic with typical 6-12 span traces will achieve
+significantly higher throughput, likely handling several thousand traces per second with the same
+100% reliability demonstrated in testing.
+
+---
+
+## Realistic Trace Load Tests
+
+To validate production capacity with realistic payloads, additional tests were conducted using
+single traces (6-8 spans each) instead of heavy batched payloads.
+
+### Test 4: Realistic Payload WITHOUT Batch Processor
+
+**Configuration**:
+
+- Single trace per request (6-8 spans)
+- ~8KB payload per request
+- NO batch processor
+- Same memory limiter and file storage as Test 3
+
+**Results**:
+
+| Metric                  | Value           |
+| ----------------------- | --------------- |
+| **Total Requests**      | 47,716          |
+| **Successful Requests** | 6,895 (14.45%)  |
+| **Failed Requests**     | 40,821 (85.54%) |
+| **Throughput**          | 793.9 req/s     |
+| **Avg Response Time**   | 116.49ms        |
+| **P90 Response Time**   | 159.32ms        |
+| **P95 Response Time**   | 170.53ms        |
+
+**Analysis**:
+
+- Collector can ingest **793.9 traces/s** with small payloads (24x faster than Test 3)
+- **Massive failure rate (85.54%)** due to ClickHouse bottleneck
+- Sending queue filled up quickly: "sending queue is full" errors
+- Actual successful throughput: **~115 traces/s** (6,895 / 60 seconds)
+- **Proves ClickHouse is the bottleneck**, not the collector
+
+### Test 5: Realistic Payload WITH Batch Processor (1s / 5000)
+
+**Configuration**:
+
+- Single trace per request (6-8 spans)
+- ~8KB payload per request
+- **Batch processor: 1s timeout, 5000 batch size**
+- Same memory limiter and file storage as Test 3
+
+**Results**:
+
+| Metric                  | Value           |
+| ----------------------- | --------------- |
+| **Total Requests**      | 46,435          |
+| **Successful Requests** | 43,497 (93.67%) |
+| **Failed Requests**     | 2,938 (6.32%)   |
+| **Throughput**          | 772.57 req/s    |
+| **Avg Response Time**   | 120.21ms        |
+| **P90 Response Time**   | 158.18ms        |
+| **P95 Response Time**   | 169.33ms        |
+
+**Analysis**:
+
+- **6.5x better success rate** (93.67% vs 14.45%) with batching
+- Sustained **~725 successful traces/s** (43,497 / 60 seconds)
+- Batching aggregates traces before sending to ClickHouse, dramatically reducing write load
+- Low latency maintained (P95: 169ms)
+
+### Test 6: Realistic Payload WITH Batch Processor (100ms / 2000)
+
+**Configuration**:
+
+- Single trace per request (6-8 spans)
+- ~8KB payload per request
+- **Batch processor: 100ms timeout, 2000 batch size**
+- Same memory limiter and file storage as Test 3
+
+**Results**:
+
+| Metric                  | Value           |
+| ----------------------- | --------------- |
+| **Total Requests**      | 46,840          |
+| **Successful Requests** | 43,878 (93.67%) |
+| **Failed Requests**     | 2,962 (6.32%)   |
+| **Throughput**          | 779.3 req/s     |
+| **Avg Response Time**   | 119ms           |
+| **P90 Response Time**   | 157.17ms        |
+| **P95 Response Time**   | 169.13ms        |
+
+**Analysis**:
+
+- Nearly identical performance to Test 5 (1s / 5000)
+- **93.67% success rate** (same as Test 5)
+- Sustained **~731 successful traces/s** (43,878 / 60 seconds)
+- Proves batch processor is effective regardless of timeout/size configuration
+
+### Test 7: Realistic Payload WITH Increased Queue Size (100ms / 5000 / queue:5000)
+
+**Configuration**:
+
+- Single trace per request (6-8 spans)
+- ~8KB payload per request
+- **Batch processor: 100ms timeout, 5000 batch size**
+- **Queue size: 5000** (increased from 1000)
+- Same memory limiter and file storage as Test 3
+
+**Results**:
+
+| Metric                  | Value          |
+| ----------------------- | -------------- |
+| **Total Requests**      | 47,751         |
+| **Successful Requests** | 47,751 (100%!) |
+| **Failed Requests**     | 0 (0%!)        |
+| **Throughput**          | 794.36 req/s   |
+| **Avg Response Time**   | 116.41ms       |
+| **P90 Response Time**   | 158.67ms       |
+| **P95 Response Time**   | 169.42ms       |
+
+**Analysis**:
+
+- **PERFECT 100% success rate achieved!**
+- Throughput improved to **794.36 req/s** (highest of all realistic tests)
+- Sustained **~796 successful traces/s** (47,751 / 60 seconds)
+- Increased queue size (1000 → 5000) provided sufficient buffer for ClickHouse
+- Lower average latency (116.41ms vs 119ms in Test 6)
+- Zero failures under continuous load - production ready!
+
+### Key Findings from Realistic Tests
+
+1. **Batch Processor is Critical**: Without batching, 85% of requests fail due to ClickHouse
+   bottleneck. With batching, success rate jumps to 93.67%+
+
+2. **Queue Size Matters**: Increasing queue size from 1000 to 5000 eliminated the remaining 6.32%
+   failures, achieving **100% success rate**
+
+3. **ClickHouse is the Bottleneck**: Collector can ingest 793.9 req/s, but ClickHouse can only
+   handle ~115 req/s without batching
+
+4. **Optimal Configuration Found (Test 7)**: 100ms timeout, 5000 batch size, 5000 queue size
+   achieves perfect reliability
+
+5. **Production Capacity**: With optimal config, the 3-pod deployment can reliably handle **~796
+   traces/s** (47,751/min) with realistic 6-8 span traces at **100% success rate**
+
+6. **Dramatic Performance Difference**: Realistic small traces (6-8 spans) achieve **24x higher
+   throughput** compared to heavy synthetic payloads (467 spans)
+
+7. **Memory Efficiency**: Collector maintains low memory usage even at 794 req/s throughput
+
+### Real-World Capacity Estimates
+
+Based on realistic load tests with optimal configuration (Test 7):
+
+**Validated Production Capacity** (with optimized batch processor and queue):
+
+- **~796 successful traces/s** (3-pod deployment)
+- **~47,751 traces/minute**
+- **~2.86M traces/hour**
+- **100% success rate** under continuous load
+
+The increased queue size (+5000) and larger batch size (5000) eliminated all failures and increased
+throughput by **9%**.
+
+This represents the **actual measured capacity** with production-like trace sizes, not theoretical
+estimates.
--- a/docker/configs/otel-collector/builder-config.yaml
+++ b/docker/configs/otel-collector/builder-config.yaml
@ -25,6 +25,15 @@ extensions:
  - gomod:
      github.com/open-telemetry/opentelemetry-collector-contrib/extension/healthcheckextension
      v0.140.0
+  - gomod:
+      github.com/open-telemetry/opentelemetry-collector-contrib/extension/pprofextension v0.140.0
+  - gomod: go.opentelemetry.io/collector/extension/zpagesextension v0.140.0
+  - gomod:
+      github.com/open-telemetry/opentelemetry-collector-contrib/extension/storage/filestorage
+      v0.140.0
  - gomod: github.com/graphql-hive/console/docker/configs/otel-collector/extension-hiveauth v0.0.0
    path: ./extension-hiveauth
    name: hiveauthextension # when using local extensions, package name is required, otherwise you get "missing import path"
+  - gomod: github.com/graphql-hive/console/docker/configs/otel-collector/extension-statsviz v0.0.0
+    path: ./extension-statsviz
+    name: statsvizextension
--- a/docker/configs/otel-collector/config.yaml
+++ b/docker/configs/otel-collector/config.yaml
@ -3,6 +3,22 @@ extensions:
    endpoint: ${HIVE_OTEL_AUTH_ENDPOINT}
  health_check:
    endpoint: '0.0.0.0:13133'
+  # pprof:
+  #   endpoint: '0.0.0.0:1777'
+  # statsviz:
+  #   endpoint: '0.0.0.0:8081'
+  # zpages:
+  #   endpoint: '0.0.0.0:55679'
+  file_storage:
+    directory: /var/lib/otelcol/file_storage
+    timeout: 2s
+    fsync: false
+    compaction:
+      directory: /var/lib/otelcol/file_storage
+      on_start: true
+      on_rebound: true
+      rebound_needed_threshold_mib: 5
+      rebound_trigger_threshold_mib: 3
 receivers:
  otlp:
    protocols:
@ -20,9 +36,6 @@ receivers:
        auth:
          authenticator: hiveauth
 processors:
-  batch:
-    timeout: 5s
-    send_batch_size: 5000
  attributes:
    actions:
      - key: hive.target_id
@ -30,15 +43,18 @@ processors:
        action: insert
  memory_limiter:
    check_interval: 1s
-    limit_percentage: 80
-    spike_limit_percentage: 20
+    limit_mib: 1000
+    spike_limit_mib: 200
+    # limit_percentage: 80
+    # spike_limit_percentage: 20
+  batch:
+    timeout: 100ms
+    send_batch_size: 5000
 exporters:
  debug:
-    verbosity: detailed
-    sampling_initial: 5
-    sampling_thereafter: 200
+    verbosity: basic
  clickhouse:
-    endpoint: ${CLICKHOUSE_PROTOCOL}://${CLICKHOUSE_HOST}:${CLICKHOUSE_PORT}?dial_timeout=10s&compress=lz4&async_insert=1
+    endpoint: ${CLICKHOUSE_PROTOCOL}://${CLICKHOUSE_HOST}:${CLICKHOUSE_PORT}?dial_timeout=10s&compress=lz4&async_insert=1&wait_for_async_insert=0
    database: default
    async_insert: true
    username: ${CLICKHOUSE_USERNAME}
@ -55,10 +71,19 @@ exporters:
      initial_interval: 5s
      max_interval: 30s
      max_elapsed_time: 300s
+    sending_queue:
+      enabled: true
+      num_consumers: 1
+      queue_size: 5000
+      storage: file_storage
 service:
  extensions:
    - hiveauth
    - health_check
+    # - pprof
+    # - statsviz
+    # - zpages
+    - file_storage
  telemetry:
    logs:
      level: DEBUG
--- a/docker/configs/otel-collector/extension-hiveauth/extension.go
+++ b/docker/configs/otel-collector/extension-hiveauth/extension.go
@ -18,10 +18,10 @@ import (
 	"go.opentelemetry.io/collector/component"
 	"go.opentelemetry.io/collector/extension"
 	"go.opentelemetry.io/collector/extension/extensionauth"
+	"go.opentelemetry.io/otel/attribute"
+	"go.opentelemetry.io/otel/metric"
 	"go.uber.org/zap"
 	"golang.org/x/sync/singleflight"
-	"go.opentelemetry.io/otel/metric"
-	"go.opentelemetry.io/otel/attribute"
 )

 var (
--- a/docker/configs/otel-collector/extension-statsviz/config.go
+++ b/docker/configs/otel-collector/extension-statsviz/config.go
@ -0,0 +1,20 @@
+package statsvizextension
+
+import (
+	"errors"
+
+	"go.opentelemetry.io/collector/component"
+)
+
+type Config struct {
+	Endpoint string `mapstructure:"endpoint"`
+}
+
+var _ component.Config = (*Config)(nil)
+
+func (cfg *Config) Validate() error {
+	if cfg.Endpoint == "" {
+		return errors.New("endpoint must be specified")
+	}
+	return nil
+}
--- a/docker/configs/otel-collector/extension-statsviz/doc.go
+++ b/docker/configs/otel-collector/extension-statsviz/doc.go
@ -0,0 +1 @@
+package statsvizextension
--- a/docker/configs/otel-collector/extension-statsviz/extension.go
+++ b/docker/configs/otel-collector/extension-statsviz/extension.go
@ -0,0 +1,65 @@
+package statsvizextension
+
+import (
+	"context"
+	"errors"
+	"net/http"
+
+	"github.com/arl/statsviz"
+	"go.opentelemetry.io/collector/component"
+	"go.uber.org/zap"
+)
+
+type statsvizExtension struct {
+	config *Config
+	logger *zap.Logger
+	server *http.Server
+}
+
+func (s *statsvizExtension) Start(_ context.Context, host component.Host) error {
+	s.logger.Info("Starting statsviz extension", zap.String("endpoint", s.config.Endpoint))
+
+	mux := http.NewServeMux()
+
+	if err := statsviz.Register(mux); err != nil {
+		s.logger.Error("Failed to register statsviz", zap.Error(err))
+		return err
+	}
+
+	s.server = &http.Server{
+		Addr:    s.config.Endpoint,
+		Handler: mux,
+	}
+
+	go func() {
+		if err := s.server.ListenAndServe(); err != nil && err != http.ErrServerClosed {
+			s.logger.Error("Statsviz server error", zap.Error(err))
+		}
+	}()
+
+	s.logger.Info("Statsviz available at", zap.String("url", "http://"+s.config.Endpoint+"/debug/statsviz"))
+	return nil
+}
+
+func (s *statsvizExtension) Shutdown(ctx context.Context) error {
+	s.logger.Info("Shutting down statsviz extension")
+	if s.server != nil {
+		return s.server.Shutdown(ctx)
+	}
+	return nil
+}
+
+func newStatsvizExtension(logger *zap.Logger, cfg *Config) (*statsvizExtension, error) {
+	if cfg == nil {
+		return nil, errors.New("config cannot be nil")
+	}
+
+	if err := cfg.Validate(); err != nil {
+		return nil, err
+	}
+
+	return &statsvizExtension{
+		config: cfg,
+		logger: logger,
+	}, nil
+}
--- a/docker/configs/otel-collector/extension-statsviz/factory.go
+++ b/docker/configs/otel-collector/extension-statsviz/factory.go
@ -0,0 +1,29 @@
+package statsvizextension
+
+import (
+	"context"
+
+	"go.opentelemetry.io/collector/component"
+	"go.opentelemetry.io/collector/extension"
+
+	"github.com/graphql-hive/console/docker/configs/otel-collector/extension-statsviz/internal/metadata"
+)
+
+func NewFactory() extension.Factory {
+	return extension.NewFactory(
+		metadata.Type,
+		createDefaultConfig,
+		createExtension,
+		metadata.ExtensionStability,
+	)
+}
+
+func createDefaultConfig() component.Config {
+	return &Config{
+		Endpoint: "0.0.0.0:8081",
+	}
+}
+
+func createExtension(_ context.Context, params extension.Settings, cfg component.Config) (extension.Extension, error) {
+	return newStatsvizExtension(params.Logger, cfg.(*Config))
+}
--- a/docker/configs/otel-collector/extension-statsviz/go.mod
+++ b/docker/configs/otel-collector/extension-statsviz/go.mod
@ -0,0 +1,26 @@
+module github.com/graphql-hive/console/docker/configs/otel-collector/extension-statsviz
+
+go 1.25
+
+require (
+	github.com/arl/statsviz v0.6.0
+	go.opentelemetry.io/collector/component v1.28.0
+	go.opentelemetry.io/collector/extension v0.28.0
+	go.uber.org/zap v1.27.0
+)
+
+require (
+	github.com/gogo/protobuf v1.3.2 // indirect
+	github.com/gorilla/websocket v1.5.0 // indirect
+	go.opentelemetry.io/collector/pdata v1.28.0 // indirect
+	go.opentelemetry.io/otel v1.35.0 // indirect
+	go.opentelemetry.io/otel/metric v1.35.0 // indirect
+	go.opentelemetry.io/otel/trace v1.35.0 // indirect
+	go.uber.org/multierr v1.11.0 // indirect
+	golang.org/x/net v0.37.0 // indirect
+	golang.org/x/sys v0.31.0 // indirect
+	golang.org/x/text v0.23.0 // indirect
+	google.golang.org/genproto/googleapis/rpc v0.0.0-20250115164207-1a7da9e5054f // indirect
+	google.golang.org/grpc v1.71.0 // indirect
+	google.golang.org/protobuf v1.36.5 // indirect
+)
--- a/docker/configs/otel-collector/extension-statsviz/go.sum
+++ b/docker/configs/otel-collector/extension-statsviz/go.sum
@ -0,0 +1,93 @@
+github.com/arl/statsviz v0.6.0 h1:jbW1QJkEYQkufd//4NDYRSNBpwJNrdzPahF7ZmoGdyE=
+github.com/arl/statsviz v0.6.0/go.mod h1:0toboo+YGSUXDaS4g1D5TVS4dXs7S7YYT5J/qnW2h8s=
+github.com/davecgh/go-spew v1.1.1 h1:vj9j/u1bqnvCEfJOwUhtlOARqs3+rkHYY13jYWTU97c=
+github.com/davecgh/go-spew v1.1.1/go.mod h1:J7Y8YcW2NihsgmVo/mv3lAwl/skON4iLHjSsI+c5H38=
+github.com/go-logr/logr v1.4.2 h1:6pFjapn8bFcIbiKo3XT4j/BhANplGihG6tvd+8rYgrY=
+github.com/go-logr/logr v1.4.2/go.mod h1:9T104GzyrTigFIr8wt5mBrctHMim0Nb2HLGrmQ40KvY=
+github.com/go-logr/stdr v1.2.2 h1:hSWxHoqTgW2S2qGc0LTAI563KZ5YKYRhT3MFKZMbjag=
+github.com/go-logr/stdr v1.2.2/go.mod h1:mMo/vtBO5dYbehREoey6XUKy/eSumjCCveDpRre4VKE=
+github.com/gogo/protobuf v1.3.2 h1:Ov1cvc58UF3b5XjBnZv7+opcTcQFZebYjWzi34vdm4Q=
+github.com/gogo/protobuf v1.3.2/go.mod h1:P1XiOD3dCwIKUDQYPy72D8LYyHL2YPYrpS2s69NZV8Q=
+github.com/golang/protobuf v1.5.4 h1:i7eJL8qZTpSEXOPTxNKhASYpMn+8e5Q6AdndVa1dWek=
+github.com/golang/protobuf v1.5.4/go.mod h1:lnTiLA8Wa4RWRcIUkrtSVa5nRhsEGBg48fD6rSs7xps=
+github.com/google/go-cmp v0.7.0 h1:wk8382ETsv4JYUZwIsn6YpYiWiBsYLSJiTsyBybVuN8=
+github.com/google/go-cmp v0.7.0/go.mod h1:pXiqmnSA92OHEEa9HXL2W4E7lf9JzCmGVUdgjX3N/iU=
+github.com/google/uuid v1.6.0 h1:NIvaJDMOsjHA8n1jAhLSgzrAzy1Hgr+hNrb57e+94F0=
+github.com/google/uuid v1.6.0/go.mod h1:TIyPZe4MgqvfeYDBFedMoGGpEw/LqOeaOT+nhxU+yHo=
+github.com/gorilla/websocket v1.5.0 h1:PPwGk2jz7EePpoHN/+ClbZu8SPxiqlu12wZP/3sWmnc=
+github.com/gorilla/websocket v1.5.0/go.mod h1:YR8l580nyteQvAITg2hZ9XVh4b55+EU/adAjf1fMHhE=
+github.com/kisielk/errcheck v1.5.0/go.mod h1:pFxgyoBC7bSaBwPgfKdkLd5X25qrDl4LWUI2bnpBCr8=
+github.com/kisielk/gotool v1.0.0/go.mod h1:XhKaO+MFFWcvkIS/tQcRk01m1F5IRFswLeQ+oQHNcck=
+github.com/pmezard/go-difflib v1.0.0 h1:4DBwDE0NGyQoBHbLQYPwSUPoCMWR5BEzIk/f1lZbAQM=
+github.com/pmezard/go-difflib v1.0.0/go.mod h1:iKH77koFhYxTK1pcRnkKkqfTogsbg7gZNVY4sRDYZ/4=
+github.com/rogpeppe/go-internal v1.11.0 h1:cWPaGQEPrBb5/AsnsZesgZZ9yb1OQ+GOISoDNXVBh4M=
+github.com/rogpeppe/go-internal v1.11.0/go.mod h1:ddIwULY96R17DhadqLgMfk9H9tvdUzkipdSkR5nkCZA=
+github.com/stretchr/testify v1.10.0 h1:Xv5erBjTwe/5IxqUQTdXv5kgmIvbHo3QQyRwhJsOfJA=
+github.com/stretchr/testify v1.10.0/go.mod h1:r2ic/lqez/lEtzL7wO/rwa5dbSLXVDPFyf8C91i36aY=
+github.com/yuin/goldmark v1.1.27/go.mod h1:3hX8gzYuyVAZsxl0MRgGTJEmQBFcNTphYh9decYSb74=
+github.com/yuin/goldmark v1.2.1/go.mod h1:3hX8gzYuyVAZsxl0MRgGTJEmQBFcNTphYh9decYSb74=
+go.opentelemetry.io/auto/sdk v1.1.0 h1:cH53jehLUN6UFLY71z+NDOiNJqDdPRaXzTel0sJySYA=
+go.opentelemetry.io/auto/sdk v1.1.0/go.mod h1:3wSPjt5PWp2RhlCcmmOial7AvC4DQqZb7a7wCow3W8A=
+go.opentelemetry.io/collector/component v1.28.0 h1:SQAGxxuyZ+d5tOsuEka8m9oE+wAroaYQpJ8NTIbl6Lk=
+go.opentelemetry.io/collector/component v1.28.0/go.mod h1:te8gbcKU6Mgu7ewo/2VYDSbCkLrhOYYy2llayXCF0bI=
+go.opentelemetry.io/collector/extension v1.28.0 h1:E3j6/EtcahF2bX9DvRduLQ6tD7SuZdXM9DzAi7NSAeY=
+go.opentelemetry.io/collector/extension v1.28.0/go.mod h1:3MW9IGCNNgjG/ngkALVH5epwbCwYuoZMTbh4523aYv0=
+go.opentelemetry.io/collector/pdata v1.28.0 h1:xSZyvTOOc2Wmz4PoxrVqeQfodLgs9k7gowLAnzZN0eU=
+go.opentelemetry.io/collector/pdata v1.28.0/go.mod h1:asKE8MD/4SOKz1mCrGdAz4VO2U2HUNg8A6094uK7pq0=
+go.opentelemetry.io/otel v1.35.0 h1:xKWKPxrxB6OtMCbmMY021CqC45J+3Onta9MqjhnusiQ=
+go.opentelemetry.io/otel v1.35.0/go.mod h1:UEqy8Zp11hpkUrL73gSlELM0DupHoiq72dR+Zqel/+Y=
+go.opentelemetry.io/otel/metric v1.35.0 h1:0znxYu2SNyuMSQT4Y9WDWej0VpcsxkuklLa4/siN90M=
+go.opentelemetry.io/otel/metric v1.35.0/go.mod h1:nKVFgxBZ2fReX6IlyW28MgZojkoAkJGaE8CpgeAU3oE=
+go.opentelemetry.io/otel/sdk v1.34.0 h1:95zS4k/2GOy069d321O8jWgYsW3MzVV+KuSPKp7Wr1A=
+go.opentelemetry.io/otel/sdk v1.34.0/go.mod h1:0e/pNiaMAqaykJGKbi+tSjWfNNHMTxoC9qANsCzbyxU=
+go.opentelemetry.io/otel/sdk/metric v1.34.0 h1:5CeK9ujjbFVL5c1PhLuStg1wxA7vQv7ce1EK0Gyvahk=
+go.opentelemetry.io/otel/sdk/metric v1.34.0/go.mod h1:jQ/r8Ze28zRKoNRdkjCZxfs6YvBTG1+YIqyFVFYec5w=
+go.opentelemetry.io/otel/trace v1.35.0 h1:dPpEfJu1sDIqruz7BHFG3c7528f6ddfSWfFDVt/xgMs=
+go.opentelemetry.io/otel/trace v1.35.0/go.mod h1:WUk7DtFp1Aw2MkvqGdwiXYDZZNvA/1J8o6xRXLrIkyc=
+go.uber.org/goleak v1.3.0 h1:2K3zAYmnTNqV73imy9J1T3WC+gmCePx2hEGkimedGto=
+go.uber.org/goleak v1.3.0/go.mod h1:CoHD4mav9JJNrW/WLlf7HGZPjdw8EucARQHekz1X6bE=
+go.uber.org/multierr v1.11.0 h1:blXXJkSxSSfBVBlC76pxqeO+LN3aDfLQo+309xJstO0=
+go.uber.org/multierr v1.11.0/go.mod h1:20+QtiLqy0Nd6FdQB9TLXag12DsQkrbs3htMFfDN80Y=
+go.uber.org/zap v1.27.0 h1:aJMhYGrd5QSmlpLMr2MftRKl7t8J8PTZPA732ud/XR8=
+go.uber.org/zap v1.27.0/go.mod h1:GB2qFLM7cTU87MWRP2mPIjqfIDnGu+VIO4V/SdhGo2E=
+golang.org/x/crypto v0.0.0-20190308221718-c2843e01d9a2/go.mod h1:djNgcEr1/C05ACkg1iLfiJU5Ep61QUkGW8qpdssI0+w=
+golang.org/x/crypto v0.0.0-20191011191535-87dc89f01550/go.mod h1:yigFU9vqHzYiE8UmvKecakEJjdnWj3jj499lnFckfCI=
+golang.org/x/crypto v0.0.0-20200622213623-75b288015ac9/go.mod h1:LzIPMQfyMNhhGPhUkYOs5KpL4U8rLKemX1yGLhDgUto=
+golang.org/x/mod v0.2.0/go.mod h1:s0Qsj1ACt9ePp/hMypM3fl4fZqREWJwdYDEqhRiZZUA=
+golang.org/x/mod v0.3.0/go.mod h1:s0Qsj1ACt9ePp/hMypM3fl4fZqREWJwdYDEqhRiZZUA=
+golang.org/x/net v0.0.0-20190404232315-eb5bcb51f2a3/go.mod h1:t9HGtf8HONx5eT2rtn7q6eTqICYqUVnKs3thJo3Qplg=
+golang.org/x/net v0.0.0-20190620200207-3b0461eec859/go.mod h1:z5CRVTTTmAJ677TzLLGU+0bjPO0LkuOLi4/5GtJWs/s=
+golang.org/x/net v0.0.0-20200226121028-0de0cce0169b/go.mod h1:z5CRVTTTmAJ677TzLLGU+0bjPO0LkuOLi4/5GtJWs/s=
+golang.org/x/net v0.0.0-20201021035429-f5854403a974/go.mod h1:sp8m0HH+o8qH0wwXwYZr8TS3Oi6o0r6Gce1SSxlDquU=
+golang.org/x/net v0.37.0 h1:1zLorHbz+LYj7MQlSf1+2tPIIgibq2eL5xkrGk6f+2c=
+golang.org/x/net v0.37.0/go.mod h1:ivrbrMbzFq5J41QOQh0siUuly180yBYtLp+CKbEaFx8=
+golang.org/x/sync v0.0.0-20190423024810-112230192c58/go.mod h1:RxMgew5VJxzue5/jJTE5uejpjVlOe/izrB70Jof72aM=
+golang.org/x/sync v0.0.0-20190911185100-cd5d95a43a6e/go.mod h1:RxMgew5VJxzue5/jJTE5uejpjVlOe/izrB70Jof72aM=
+golang.org/x/sync v0.0.0-20201020160332-67f06af15bc9/go.mod h1:RxMgew5VJxzue5/jJTE5uejpjVlOe/izrB70Jof72aM=
+golang.org/x/sys v0.0.0-20190215142949-d0b11bdaac8a/go.mod h1:STP8DvDyc/dI5b8T5hshtkjS+E42TnysNCUPdjciGhY=
+golang.org/x/sys v0.0.0-20190412213103-97732733099d/go.mod h1:h1NjWce9XRLGQEsW7wpKNCjG9DtNlClVuFLEZdDNbEs=
+golang.org/x/sys v0.0.0-20200930185726-fdedc70b468f/go.mod h1:h1NjWce9XRLGQEsW7wpKNCjG9DtNlClVuFLEZdDNbEs=
+golang.org/x/sys v0.31.0 h1:ioabZlmFYtWhL+TRYpcnNlLwhyxaM9kWTDEmfnprqik=
+golang.org/x/sys v0.31.0/go.mod h1:BJP2sWEmIv4KK5OTEluFJCKSidICx8ciO85XgH3Ak8k=
+golang.org/x/text v0.3.0/go.mod h1:NqM8EUOU14njkJ3fqMW+pc6Ldnwhi/IjpwHt7yyuwOQ=
+golang.org/x/text v0.3.3/go.mod h1:5Zoc/QRtKVWzQhOtBMvqHzDpF6irO9z98xDceosuGiQ=
+golang.org/x/text v0.23.0 h1:D71I7dUrlY+VX0gQShAThNGHFxZ13dGLBHQLVl1mJlY=
+golang.org/x/text v0.23.0/go.mod h1:/BLNzu4aZCJ1+kcD0DNRotWKage4q2rGVAg4o22unh4=
+golang.org/x/tools v0.0.0-20180917221912-90fa682c2a6e/go.mod h1:n7NCudcB/nEzxVGmLbDWY5pfWTLqBcC2KZ6jyYvM4mQ=
+golang.org/x/tools v0.0.0-20191119224855-298f0cb1881e/go.mod h1:b+2E5dAYhXwXZwtnZ6UAqBI28+e2cm9otk0dWdXHAEo=
+golang.org/x/tools v0.0.0-20200619180055-7c47624df98f/go.mod h1:EkVYQZoAsY45+roYkvgYkIh4xh/qjgUK9TdY2XT94GE=
+golang.org/x/tools v0.0.0-20210106214847-113979e3529a/go.mod h1:emZCQorbCU4vsT4fOWvOPXz4eW1wZW4PmDk9uLelYpA=
+golang.org/x/tools v0.21.1-0.20240508182429-e35e4ccd0d2d h1:vU5i/LfpvrRCpgM/VPfJLg5KjxD3E+hfT1SH+d9zLwg=
+golang.org/x/tools v0.21.1-0.20240508182429-e35e4ccd0d2d/go.mod h1:aiJjzUbINMkxbQROHiO6hDPo2LHcIPhhQsa9DLh0yGk=
+golang.org/x/xerrors v0.0.0-20190717185122-a985d3407aa7/go.mod h1:I/5z698sn9Ka8TeJc9MKroUUfqBBauWjQqLJ2OPfmY0=
+golang.org/x/xerrors v0.0.0-20191011141410-1b5146add898/go.mod h1:I/5z698sn9Ka8TeJc9MKroUUfqBBauWjQqLJ2OPfmY0=
+golang.org/x/xerrors v0.0.0-20191204190536-9bdfabe68543/go.mod h1:I/5z698sn9Ka8TeJc9MKroUUfqBBauWjQqLJ2OPfmY0=
+golang.org/x/xerrors v0.0.0-20200804184101-5ec99f83aff1/go.mod h1:I/5z698sn9Ka8TeJc9MKroUUfqBBauWjQqLJ2OPfmY0=
+google.golang.org/genproto/googleapis/rpc v0.0.0-20250115164207-1a7da9e5054f h1:OxYkA3wjPsZyBylwymxSHa7ViiW1Sml4ToBrncvFehI=
+google.golang.org/genproto/googleapis/rpc v0.0.0-20250115164207-1a7da9e5054f/go.mod h1:+2Yz8+CLJbIfL9z73EW45avw8Lmge3xVElCP9zEKi50=
+google.golang.org/grpc v1.71.0 h1:kF77BGdPTQ4/JZWMlb9VpJ5pa25aqvVqogsxNHHdeBg=
+google.golang.org/grpc v1.71.0/go.mod h1:H0GRtasmQOh9LkFoCPDu3ZrwUtD1YGE+b2vYBYd/8Ec=
+google.golang.org/protobuf v1.36.5 h1:tPhr+woSbjfYvY6/GPufUoYizxw1cF/yFoxJ2fmpwlM=
+google.golang.org/protobuf v1.36.5/go.mod h1:9fA7Ob0pmnwhb644+1+CVWFRbNajQ6iRojtC/QF5bRE=
+gopkg.in/yaml.v3 v3.0.1 h1:fxVm/GzAzEWqLHuvctI91KS9hhNmmWOoWu0XTYJS7CA=
+gopkg.in/yaml.v3 v3.0.1/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
--- a/docker/configs/otel-collector/extension-statsviz/internal/metadata/generated_status.go
+++ b/docker/configs/otel-collector/extension-statsviz/internal/metadata/generated_status.go
@ -0,0 +1,14 @@
+package metadata
+
+import (
+	"go.opentelemetry.io/collector/component"
+)
+
+var (
+	Type      = component.MustNewType("statsviz")
+	ScopeName = "statsvizextension"
+)
+
+const (
+	ExtensionStability = component.StabilityLevelDevelopment
+)
--- a/docker/configs/otel-collector/extension-statsviz/metadata.yaml
+++ b/docker/configs/otel-collector/extension-statsviz/metadata.yaml
@ -0,0 +1,5 @@
+type: statsviz
+status:
+  class: extension
+  stability:
+    development: [extension]
--- a/docker/docker-compose.dev.yml
+++ b/docker/docker-compose.dev.yml
@ -183,6 +183,7 @@ services:
    build:
      context: ./configs/otel-collector
      dockerfile: ./../../otel-collector.dockerfile
+    mem_limit: 1000m
    environment:
      HIVE_OTEL_AUTH_ENDPOINT: 'http://host.docker.internal:3001/otel-auth'
      CLICKHOUSE_PROTOCOL: 'http'
@ -196,6 +197,10 @@ services:
    ports:
      - '4317:4317'
      - '4318:4318'
+      - '10254:10254'
+      - '1777:1777'
+      - '8081:8081'
+      - '55679:55679'
    networks:
      - 'stack'

--- a/docker/otel-collector.dockerfile
+++ b/docker/otel-collector.dockerfile
@ -2,6 +2,7 @@ FROM scratch AS config

 COPY builder-config.yaml .
 COPY extension-hiveauth/ ./extension-hiveauth/
+COPY extension-statsviz/ ./extension-statsviz/

 FROM golang:1.25-bookworm AS builder

@ -14,6 +15,7 @@ RUN go install go.opentelemetry.io/collector/cmd/builder@v${OTEL_VERSION}
 # Copy the manifest file and other necessary files
 COPY --from=config builder-config.yaml .
 COPY --from=config extension-hiveauth/ ./extension-hiveauth/
+COPY --from=config extension-statsviz/ ./extension-statsviz/

 # Build the custom collector
 RUN CGO_ENABLED=0 builder --config=/build/builder-config.yaml
@ -27,8 +29,11 @@ WORKDIR /app
 COPY --from=builder /build/otelcol-custom .
 COPY config.yaml /etc/otel-config.yaml

+# Create directory for queue storage
+RUN mkdir -p /var/lib/otelcol/file_storage
+
 # Expose necessary ports
-EXPOSE 4317/tcp 4318/tcp 13133/tcp
+EXPOSE 4317/tcp 4318/tcp 13133/tcp 1777/tcp 8081/tcp 55679/tcp

 # Set the default command
 CMD ["./otelcol-custom", "--config=/etc/otel-config.yaml"]
--- a/load-tests/otel-traces/bru.ts
+++ b/load-tests/otel-traces/bru.ts
@ -0,0 +1,5 @@
+// Polyfill for Node.js globals that libraries expect
+// This must be imported FIRST before any other imports
+
+// @ts-ignore - k6 doesn't have process
+globalThis.process = globalThis.process || { env: {} };
--- a/load-tests/otel-traces/test.ts
+++ b/load-tests/otel-traces/test.ts
@ -1,29 +1,22 @@
 import './bru.ts';
-import { expect } from 'https://jslib.k6.io/k6-testing/0.5.0/index.js';
 import { randomIntBetween, randomString } from 'https://jslib.k6.io/k6-utils/1.2.0/index.js';
 import * as immer from 'https://unpkg.com/immer@10.1.3/dist/immer.mjs';
 import { check } from 'k6';
 import http from 'k6/http';

-// prettier-ignore
-globalThis.process = { env: {} };
-
 // Cardinality Variables Start
-const countUniqueErrorCodes = 1_000;
-const countUniqueClients = 1_000;
-const appVersionsPerClient = 1_000;
+const countUniqueErrorCodes = 200;
+const countUniqueClients = 200;
+const appVersionsPerClient = 100;

 // Cardinality Variables End
 //
 export const options = {
  scenarios: {
-    constant_rps: {
-      executor: 'constant-arrival-rate',
-      rate: __ENV.REQUESTS_PER_SECOND ?? 10, // requests per second
-      timeUnit: '1s', // 50 requests per 1 second
-      duration: __ENV.DURATION, // how long to run
-      preAllocatedVUs: 10, // number of VUs to pre-allocate
-      maxVUs: 50, // max number of VUs
+    example_scenario: {
+      executor: 'constant-vus', // Keeps a constant number of VUs
+      vus: 10, // 10 virtual users
+      duration: '1m', // Run for 10 minutes
    },
  },
 };
@ -38,7 +31,7 @@ if (!HIVE_ORGANIZATION_ACCESS_TOKEN) {
  throw new Error('Environment variable HIVE_ORGANIZATION_ACCESS_TOKEN is missing.');
 }

-const HIVE_TARGET_REF = __ENV.HIVE_TARGET_REF;
+const HIVE_TARGET_REF = __ENV.HIVE_TARGET_REF; //'debug/hive/dev';
 if (!HIVE_TARGET_REF) {
  throw new Error('Environment variable HIVE_TARGET_REF is missing.');
 }
@ -238,13 +231,13 @@ function createTrace(date: Date, reference: Reference) {
  return immer.produce(reference, draft => mutate(date, draft));
 }

-export default function () {
-  const data = new Array(50).fill(null).flatMap(() => {
-    const reference = randomArrayItem(references);
-    const tracePayloads = createTrace(new Date(), reference);
-    return tracePayloads.flatMap(payload => payload.resourceSpans);
-  });
+const data = new Array(50).fill(null).flatMap(() => {
+  const reference = randomArrayItem(references);
+  const tracePayloads = createTrace(new Date(), reference);
+  return tracePayloads.flatMap(payload => payload.resourceSpans);
+});

+export default function () {
  const response = http.post(otelEndpointUrl, JSON.stringify({ resourceSpans: data }), {
    headers: {
      'Content-Type': 'application/json',