Features

Sentinel is a next-generation reverse proxy built on Cloudflare’s Pingora framework. This page provides a comprehensive overview of all features available in the current version.

Version: This feature list reflects Sentinel v26.01. Features may vary between versions.

Core Architecture

Built on Pingora

crates/proxy/src/main.rs

Battle-tested foundation from Cloudflare
Async Rust with Tokio runtime
Memory-safe architecture with zero-copy operations
Work-stealing thread pool for optimal CPU utilization

Performance Optimizations

crates/proxy/src/memory_cache.rs

jemalloc allocator for improved memory allocation
Lock-free data structures (DashMap) for concurrent access
Connection pooling with configurable keepalive (default: 256 connections)
Memory-mapped file serving for large files (>10MB)
Route match caching with atomic operations

Configuration

Multiple Formats

File Format crates/config/src/lib.rs

KDL — Human-friendly primary format
JSON — Machine-readable alternative
TOML — Familiar to Rust developers

Hot Reload

Server Config crates/proxy/src/reload/

SIGHUP signal triggers reload
File watcher for automatic reload
Atomic configuration swap
Full validation before applying
Rollback on error
Zero request drops during reload

Validation & Linting

crates/proxy/src/main.rs

sentinel test — Syntax validation
sentinel validate — Full validation with connectivity checks
sentinel lint — Best practice recommendations
Schema versioning (current: 1.0)
Network connectivity checks (optional)
Certificate validation
Agent endpoint reachability checks

Environment Variables

SENTINEL_CONFIG for configuration path
Variable substitution in config files
Embedded default configuration fallback

Routing

Path Matching

Routes crates/proxy/src/routing.rs

Prefix matching — /api/ matches /api/users
Exact matching — /health matches only /health
Regex matching — Full regular expression support
Path variables — Extract dynamic segments

Host Matching

Exact host matching
Wildcard subdomains (*.example.com)
Multiple hosts per route

Advanced Matching

Header matching — Presence and value checks
Method filtering — GET, POST, PUT, DELETE, etc.
Query parameter matching
Priority-based evaluation — Highest priority wins
Default route fallback

Scope-Aware Routing

crates/proxy/src/scoped_routing.rs

Hierarchical routing (global → namespace → service)
Visibility rules between scopes
Qualified ID resolution

Load Balancing

Algorithms

Upstreams crates/proxy/src/upstream/

Round Robin — Default, simple rotation
Power of Two Choices (P2C) — Random selection with load comparison
Consistent Hash — Session persistence via request attributes
Least Tokens Queued — Optimized for inference/LLM workloads
Adaptive — Based on response times
Weighted — Per-target weight configuration

Health Checking

crates/proxy/src/health.rs

Active checks — HTTP, TCP, gRPC probes
Passive checks — Circuit breaker based
Configurable check intervals
Consecutive success/failure thresholds
Response time averaging
Automatic target ejection

Connection Management

Configurable pool size per upstream
Keep-alive connection reuse
HTTP/2 stream multiplexing (default: 100 streams)
H2 ping intervals for connection health

Timeouts

Connection timeout
Read/write timeouts
Request header timeout
Request body timeout
Per-upstream configuration

Service Discovery

Backend Sources

Upstreams crates/proxy/src/discovery.rs

Static — Fixed list of backends (default)
DNS — A/AAAA record resolution with refresh
DNS SRV — Service records with port discovery
Consul — HashiCorp Consul catalog integration
Kubernetes — Native endpoints discovery
File-based — Watch configuration files for changes

Service Types

Web Applications

HTML error pages
Session handling support
SPA routing with fallback

REST APIs

JSON error responses
JSON Schema validation
OpenAPI specification support
Request/response validation

Static Files

Direct file serving without upstream
Automatic MIME type detection
Configurable caching headers

Inference / LLM

Inference crates/proxy/src/inference/

Token-based rate limiting — Limit by tokens per minute, not just requests
Multi-provider support — OpenAI, Anthropic, and generic API adapters
Token counting — Tiktoken for accurate estimation, streaming SSE support
Model-based routing — Route to different upstreams based on model name
Fallback routing — Automatic failover with cross-provider model mapping
Token budget tracking — Cumulative usage limits with alerts (hourly/daily/monthly)
Cost attribution — Per-model pricing and spending metrics
Semantic guardrails — Prompt injection detection and PII scanning via agents
Inference load balancing — Least-tokens-queued algorithm for optimal distribution
Inference health checks — Verify model availability on backends

Built-in Handlers

crates/proxy/src/builtin_handlers.rs

/status — Service status
/health — Health check endpoint
/metrics — Prometheus metrics
/upstreams — Upstream health status
/cache-purge — Cache management

Static File Serving

Core Features

crates/proxy/src/static_files/mod.rs

High-performance file serving
Memory-mapped serving for large files (>10MB threshold)
In-memory caching for small files (<1MB)
Directory listing (configurable)
Index file support
Configurable root directory

Range Requests

HTTP 206 Partial Content support
Resumable downloads
Video seeking support

Compression

On-the-fly gzip compression
On-the-fly Brotli compression
Content negotiation (Accept-Encoding)
Pre-computed compression variants in cache

SPA Support

Fallback routing for client-side routing
Configurable fallback path

Caching

HTTP Response Cache

Cache crates/proxy/src/cache.rs

Pingora-based cache infrastructure
Per-route cache configuration
Cache-Control header parsing
TTL calculation from upstream headers
In-memory storage (default)
LRU eviction strategy
Configurable size (default: 100MB)
Thundering herd prevention (cache locks)

Memory Cache

crates/proxy/src/memory_cache.rs

S3-FIFO + TinyLFU eviction algorithm
Route matching result caching
Configuration fragment caching
Compiled regex pattern caching
Configurable max items (default: 10,000)
Hit/miss rate tracking

Protocol Support

HTTP Versions

HTTP/1.1 — Full support
HTTP/2 — Over TLS, configurable max streams
HTTP/3 / QUIC — Infrastructure ready (optional feature)

WebSocket

crates/proxy/src/websocket/

RFC 6455 compliant
HTTP 101 Upgrade handling
Frame parsing and encoding
Frame masking/unmasking
Configurable max frame size
Frame inspection — Individual frames sent to agents for security analysis
Per-route WebSocket enablement

Security

TLS / SSL

Listeners crates/proxy/src/tls.rs

SNI-based certificate selection
Multiple certificates per listener
Wildcard certificate support (*.api.example.com)
Default certificate fallback
Certificate hot-reload on SIGHUP
OCSP stapling
Modern cipher suites

Mutual TLS (mTLS)

Client certificate verification
Custom CA certificate loading
Per-listener client auth configuration

Rate Limiting

Limits crates/proxy/src/rate_limit.rs

Local rate limiting — Per-instance, lock-free
Distributed rate limiting — Redis-based (optional feature)
Memcached rate limiting — Alternative distributed backend
Token bucket algorithm
Configurable burst size
Multiple key types: client IP, API key, user, custom
Actions: Reject, Delay, Challenge
Per-route policies
Scope-aware limits (per namespace/service)

GeoIP Filtering

crates/proxy/src/geo_filter.rs

MaxMind GeoLite2/GeoIP2 support (.mmdb)
IP2Location support (.bin)
Blocklist and allowlist modes
Log-only mode for monitoring
IP→Country caching with TTL
Fail-open/fail-closed configuration
X-GeoIP-Country header injection
Database auto-reload on file change

Decompression Protection

crates/proxy/src/decompression.rs

Zip bomb prevention via ratio limiting
Supported: gzip, deflate, brotli
Configurable max compression ratio (default: 100x)
Configurable max output size (default: 10MB)
Incremental checking during decompression

Request Validation

crates/proxy/src/validation.rs

JSON Schema validation for API routes
OpenAPI specification support
Request and response validation
Schema compilation and caching

Circuit Breakers

Per-Upstream Breakers

crates/common/src/circuit_breaker.rs

Configurable failure threshold
Configurable success threshold
Timeout before half-open state
Half-open max requests
State tracking: Closed → Open → Half-Open → Closed

Scope-Aware Breakers

crates/proxy/src/scoped_circuit_breaker.rs

Per-namespace circuit breakers
Per-service circuit breakers
Independent failure tracking
Metrics per breaker

Observability

Access Logging

Observability crates/proxy/src/logging.rs

JSON format — Structured, machine-readable
Combined Log Format — Apache-compatible
Trace ID correlation
Fields: timestamp, method, path, status, latency, client IP, user-agent, upstream, instance ID

Metrics

crates/config/src/observability.rs

Prometheus-compatible endpoint
Configurable address and path
Per-route latency histograms
Status code distributions
Upstream health metrics
Retry metrics
Agent latency metrics
Circuit breaker state metrics
Cache hit/miss rates
Optional high-cardinality metrics

Distributed Tracing

crates/proxy/src/otel.rs

OpenTelemetry (OTLP) integration
W3C Trace Context propagation (traceparent/tracestate)
Export to Jaeger, Tempo, or any OTLP backend
Configurable sampling rates (default: 10%)
Request lifecycle spans
Semantic conventions compliance

Request Correlation

Trace ID generation (TinyFlake or UUID)
Request ID propagation
X-Request-Id header injection
Cross-service correlation

Traffic Management

Traffic Mirroring / Shadowing

crates/proxy/src/shadow.rs

Fire-and-forget request duplication
Sampling-based mirroring (0-100%)
Header-based selective mirroring
Optional request body buffering
Async execution (non-blocking to primary)
Per-route shadow configuration
Comprehensive shadow traffic metrics

Retry Policies

Configurable max retries
Backoff strategies
Idempotency key support
Per-route retry configuration

Header Manipulation

crates/config/src/filters.rs

Request header add/modify/remove
Response header add/modify/remove
Custom header injection (X-Request-Id, X-Trace-Id)
Header-based routing conditions

External Agents

Agent Protocol

Agents crates/agent-protocol/src/

SPOE-inspired external agent system
Unix Domain Sockets — Default transport
gRPC — Alternative transport
Protocol Buffers with auto-generated bindings

Agent Events

on_request_headers — Request phase inspection
on_request_body_chunk — Streaming request bodies
on_response_headers — Response phase inspection
on_response_body_chunk — Streaming response bodies
on_log — Final audit logging
WebSocket frame inspection events

Agent Decisions

ALLOW — Pass request through
BLOCK — Return custom status code
REDIRECT — Send redirect response
CHALLENGE — Authentication challenge

Agent Mutations

Add/modify/remove request headers
Add/modify/remove response headers
Set routing metadata
Audit tags and metadata

Per-Agent Configuration

crates/proxy/src/agents/

Individual circuit breakers
Concurrency limits (queue isolation)
Configurable timeouts
Failure mode: fail-open or fail-closed
Body streaming modes: Buffer, Stream, Hybrid
Max body size limits

Reference Agents

Echo agent — Request debugging
Denylist agent — IP blocking

Multi-Tenancy

Namespace Support

Namespaces crates/config/src/namespace.rs

Hierarchical organization (global → namespace → service)
Resource scoping and visibility
Per-namespace rate limits
Per-namespace circuit breakers
Per-namespace policies
Resource export for inter-namespace access

Error Handling

Custom Error Pages

crates/proxy/src/errors/mod.rs

Per-service-type error formats
Multiple formats: HTML, JSON, Text, XML
Per-status-code custom pages
Template-based with variable substitution
Request ID injection
Custom headers in error responses

Resource Limits

Global Limits

Limits crates/common/src/limits.rs

Max header size
Max header count
Max request body size
Max decompression ratio
Max connections per upstream
Max in-flight requests per worker
Connection limits per client

Per-Route Limits

Body size limits
Timeout overrides
Rate limit policies

Operational Features

Graceful Shutdown

Connection draining on SIGTERM/SIGINT
Configurable timeout (default: 30s)
Request completion before shutdown
Agent queue draining

CLI Commands

sentinel run — Start the proxy
sentinel test — Validate configuration syntax
sentinel validate — Full validation with checks
sentinel lint — Best practice recommendations

Feature Flags (Compile-time)

distributed-rate-limit — Redis-based rate limiting
distributed-rate-limit-memcached — Memcached rate limiting
kubernetes — Kubernetes service discovery
validation — Extended configuration validation

Filters & Pipelines

Filter System

Filters crates/config/src/filters.rs

Named filter instances (reusable)
Execution phases: Request, Response, Both
Chain execution order
Per-filter failure modes

Built-in Filters

Rate limit filters
Header manipulation filters
Agent filters
Compression filters

Core Architecture

Built on Pingora

Performance Optimizations

Configuration

Multiple Formats

Hot Reload

Validation & Linting

Environment Variables

Routing

Path Matching

Host Matching

Advanced Matching

Scope-Aware Routing

Load Balancing

Algorithms

Health Checking

Connection Management

Timeouts

Service Discovery

Backend Sources

Service Types

Web Applications

REST APIs

Static Files

Inference / LLM

Built-in Handlers

Static File Serving

Core Features

Range Requests

Compression

SPA Support

Caching

HTTP Response Cache

Memory Cache

Protocol Support

HTTP Versions

WebSocket

Security

TLS / SSL

Mutual TLS (mTLS)

Rate Limiting

GeoIP Filtering

Decompression Protection

Request Validation

Circuit Breakers

Per-Upstream Breakers

Scope-Aware Breakers

Observability

Access Logging

Metrics

Distributed Tracing

Request Correlation

Traffic Management

Traffic Mirroring / Shadowing

Retry Policies

Header Manipulation

External Agents

Agent Protocol

Agent Events

Agent Decisions

Agent Mutations

Per-Agent Configuration

Reference Agents

Multi-Tenancy

Namespace Support

Error Handling

Custom Error Pages

Resource Limits

Global Limits

Per-Route Limits

Operational Features

Graceful Shutdown

CLI Commands

Feature Flags (Compile-time)

Filters & Pipelines

Filter System

Built-in Filters

Feature Requests