LocalAI

mirror of https://github.com/mudler/LocalAI synced 2026-05-24 09:28:23 +00:00

History

LocalAI [bot] 61bf34ea2f Some checks are pending build backend container images / generate-matrix (push) Waiting to run Details build backend container images / backend-jobs-multiarch (push) Blocked by required conditions Details build backend container images / backend-jobs-singlearch (push) Blocked by required conditions Details build backend container images / backend-merge-jobs-multiarch (push) Blocked by required conditions Details build backend container images / backend-merge-jobs-singlearch (push) Blocked by required conditions Details build backend container images / backend-jobs-darwin (push) Blocked by required conditions Details Build test / build-test (push) Waiting to run Details Build test / launcher-build-darwin (push) Waiting to run Details Build test / launcher-build-linux (push) Waiting to run Details Explorer deployment / build-linux (push) Waiting to run Details GPU tests / ubuntu-latest (1.21.x) (push) Waiting to run Details generate and publish intel docker caches / generate_caches (intel/oneapi-basekit:2025.3.2-0-devel-ubuntu24.04, linux/amd64, arc-runner-set) (push) Waiting to run Details build container images / hipblas-jobs (rocm/dev-ubuntu-24.04:7.2.1, hipblas, --jobs=3 --output-sync=target, linux/amd64, ubuntu-latest, auto, -gpu-hipblas, noble, 2404) (push) Waiting to run Details build container images / core-image-build (intel/oneapi-basekit:2025.3.2-0-devel-ubuntu24.04, intel, --jobs=3 --output-sync=target, linux/amd64, ubuntu-latest, auto, -gpu-intel, noble, 2404) (push) Waiting to run Details build container images / gpu-nvidia-cuda-12-image-merge (push) Blocked by required conditions Details build container images / gpu-nvidia-cuda-13-image-merge (push) Blocked by required conditions Details build container images / gpu-intel-image-merge (push) Blocked by required conditions Details build container images / gpu-hipblas-image-merge (push) Blocked by required conditions Details build container images / nvidia-l4t-arm64-image-merge (push) Blocked by required conditions Details build container images / nvidia-l4t-arm64-cuda-13-image-merge (push) Blocked by required conditions Details build container images / gpu-vulkan-image-merge (push) Blocked by required conditions Details build container images / core-image-build (ubuntu:22.04, cublas, 13, 0, --jobs=4 --output-sync=target, linux/amd64, ubuntu-latest, false, auto, -gpu-nvidia-cuda-13, noble, 2404) (push) Waiting to run Details build container images / core-image-build (ubuntu:24.04, , --jobs=4 --output-sync=target, amd64, linux/amd64, ubuntu-latest, false, auto, , noble, 2404) (push) Waiting to run Details build container images / core-image-build (ubuntu:24.04, , --jobs=4 --output-sync=target, arm64, linux/arm64, ubuntu-24.04-arm, false, auto, , noble, 2404) (push) Waiting to run Details build container images / core-image-build (ubuntu:24.04, cublas, 12, 8, --jobs=4 --output-sync=target, linux/amd64, ubuntu-latest, false, auto, -gpu-nvidia-cuda-12, noble, 2404) (push) Waiting to run Details build container images / core-image-build (ubuntu:24.04, vulkan, --jobs=4 --output-sync=target, amd64, linux/amd64, ubuntu-latest, false, auto, -gpu-vulkan, noble, 2404) (push) Waiting to run Details build container images / core-image-build (ubuntu:24.04, vulkan, --jobs=4 --output-sync=target, arm64, linux/arm64, ubuntu-24.04-arm, false, auto, -gpu-vulkan, noble, 2404) (push) Waiting to run Details build container images / core-image-merge (push) Blocked by required conditions Details build container images / gh-runner (nvcr.io/nvidia/l4t-jetpack:r36.4.0, cublas, 12, 0, --jobs=4 --output-sync=target, linux/arm64, ubuntu-24.04-arm, true, auto, -nvidia-l4t-arm64, jammy, 2204) (push) Waiting to run Details build container images / gh-runner (ubuntu:24.04, cublas, 13, 0, --jobs=4 --output-sync=target, linux/arm64, ubuntu-24.04-arm, false, auto, -nvidia-l4t-arm64-cuda-13, noble, 2404) (push) Waiting to run Details lint / golangci-lint (push) Waiting to run Details Security Scan / tests (push) Waiting to run Details Tests extras backends / detect-changes (push) Waiting to run Details Tests extras backends / tests-whisper-grpc-transcription (push) Blocked by required conditions Details Tests extras backends / tests-sherpa-onnx-grpc-tts (push) Blocked by required conditions Details Tests extras backends / tests-ik-llama-cpp-grpc (push) Blocked by required conditions Details Tests extras backends / tests-turboquant-grpc (push) Blocked by required conditions Details Tests extras backends / tests-acestep-cpp (push) Blocked by required conditions Details Tests extras backends / tests-transformers (push) Blocked by required conditions Details Tests extras backends / tests-rerankers (push) Blocked by required conditions Details Tests extras backends / tests-diffusers (push) Blocked by required conditions Details Tests extras backends / tests-coqui (push) Blocked by required conditions Details Tests extras backends / tests-moonshine (push) Blocked by required conditions Details Tests extras backends / tests-pocket-tts (push) Blocked by required conditions Details Tests extras backends / tests-qwen-tts (push) Blocked by required conditions Details Tests extras backends / tests-sherpa-onnx-grpc-transcription (push) Blocked by required conditions Details Tests extras backends / tests-qwen3-tts-cpp (push) Blocked by required conditions Details Tests extras backends / tests-vibevoice-cpp-grpc-transcription (push) Blocked by required conditions Details Tests extras backends / tests-localvqe-grpc-transform (push) Blocked by required conditions Details Tests extras backends / tests-insightface-grpc (push) Blocked by required conditions Details tests-aio / tests-aio (push) Waiting to run Details E2E Backend Tests / tests-e2e-backend (1.25.x) (push) Waiting to run Details UI E2E Tests / tests-ui-e2e (1.26.x) (push) Waiting to run Details Tests extras backends / tests-qwen-asr (push) Blocked by required conditions Details Tests extras backends / tests-nemo (push) Blocked by required conditions Details Tests extras backends / tests-voxcpm (push) Blocked by required conditions Details Tests extras backends / tests-liquid-audio (push) Blocked by required conditions Details Tests extras backends / tests-llama-cpp-quantization (push) Blocked by required conditions Details Tests extras backends / tests-llama-cpp-grpc (push) Blocked by required conditions Details Tests extras backends / tests-llama-cpp-grpc-transcription (push) Blocked by required conditions Details Tests extras backends / tests-llama-cpp-smoke (push) Waiting to run Details Tests extras backends / tests-sherpa-onnx-realtime (push) Blocked by required conditions Details Tests extras backends / tests-vibevoice-cpp (push) Blocked by required conditions Details Tests extras backends / tests-vibevoice-cpp-grpc-tts (push) Blocked by required conditions Details Tests extras backends / tests-voxtral (push) Blocked by required conditions Details Tests extras backends / tests-kokoros (push) Blocked by required conditions Details Tests extras backends / tests-speaker-recognition-grpc (push) Blocked by required conditions Details tests / tests-linux (1.26.x) (push) Waiting to run Details tests / tests-apple (1.26.x) (push) Waiting to run Details fix(traces): cap captured body size to keep admin Traces UI responsive (#9946 ) The trace middleware buffered the full request and response bodies for every JSON exchange. With a chatty agent-pool RAG workload, /embeddings responses (large vector arrays) accumulated to tens of MB in the in-memory buffer; the admin Traces page would then download and parse 40+ MB on every load and on every 5s auto-refresh, locking the UI in a loading state. Add LOCALAI_TRACING_MAX_BODY_BYTES (default 64 KiB) that caps each captured body. The full payload still flows through to the real client; only the trace copy is bounded. Exchanges record body_truncated and original body_bytes so the dashboard can show that truncation happened. The cap is configurable via env, CLI, and runtime_settings.json. Also unblock recovery: the Traces page now keeps the Clear button enabled while loading, since "buffer too large to render" is exactly when the user needs to clear it. Assisted-by: Claude:claude-opus-4-7 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: Ettore Di Giacinto <mudler@localai.io>		2026-05-22 15:29:24 +02:00
..
gen_inference_defaults	feat: inferencing default, automatic tool parsing fallback and wire min_p (#9092 )	2026-03-22 00:57:15 +01:00
meta	feat(ui): Interactive model config editor with autocomplete (#9149 )	2026-04-07 14:42:23 +02:00
application_config.go	fix(traces): cap captured body size to keep admin Traces UI responsive (#9946 )	2026-05-22 15:29:24 +02:00
application_config_test.go	feat: backend versioning, upgrade detection and auto-upgrade (#9315 )	2026-04-11 22:31:15 +02:00
backend_capabilities.go	feat(realtime): Add Liquid Audio s2s model and assistant mode on talk page (#9801 )	2026-05-13 21:57:27 +02:00
backend_capabilities_test.go	feat(gallery): Speed up load times and clean gallery entries (#9211 )	2026-05-06 14:51:38 +02:00
backend_hooks.go	feat(vllm): parity with llama.cpp backend (#9328 )	2026-04-13 11:00:29 +02:00
config_suite_test.go	dependencies(grpcio): bump to fix CI issues (#2362 )	2024-05-21 14:33:47 +02:00
distributed_config.go	fix(distributed): cascade-clean stale node_models rows + filter routing by healthy status (#9754 )	2026-05-13 21:57:50 +02:00
gallery.go	feat(gallery): verify backend OCI images with keyless cosign (#9823 )	2026-05-18 08:02:20 +02:00
gguf.go	feat(llama-cpp): bump to MTP-merge SHA and automatically set MTP defaults (#9852 )	2026-05-16 22:42:48 +02:00
gguf_reasoning_test.go	Respect explicit reasoning config during GGUF thinking probe (#9463 )	2026-04-21 21:53:10 +02:00
hooks_llamacpp.go	feat(vllm): parity with llama.cpp backend (#9328 )	2026-04-13 11:00:29 +02:00
hooks_test.go	feat(vllm): expose AsyncEngineArgs via generic engine_args YAML map (#9563 )	2026-04-29 00:49:28 +02:00
hooks_vllm.go	feat(vllm): expose AsyncEngineArgs via generic engine_args YAML map (#9563 )	2026-04-29 00:49:28 +02:00
inference_defaults.go	feat: inferencing default, automatic tool parsing fallback and wire min_p (#9092 )	2026-03-22 00:57:15 +01:00
inference_defaults.json	chore: bump inference defaults from unsloth (#9396 )	2026-04-17 09:05:55 +02:00
inference_defaults_test.go	feat: inferencing default, automatic tool parsing fallback and wire min_p (#9092 )	2026-03-22 00:57:15 +01:00
model_config.go	feat(realtime): Add Liquid Audio s2s model and assistant mode on talk page (#9801 )	2026-05-13 21:57:27 +02:00
model_config_filter.go	feat: add distributed mode (#9124 )	2026-03-30 00:47:27 +02:00
model_config_loader.go	feat(concurrency-groups): per-model exclusive groups for backend loading (#9662 )	2026-05-05 08:42:50 +02:00
model_config_loader_test.go	feat(concurrency-groups): per-model exclusive groups for backend loading (#9662 )	2026-05-05 08:42:50 +02:00
model_config_test.go	feat(concurrency-groups): per-model exclusive groups for backend loading (#9662 )	2026-05-05 08:42:50 +02:00
model_test.go	fix(tests): inline model_test fixtures after tests/models_fixtures removal	2026-04-28 12:58:49 +00:00
mtp.go	feat(llama-cpp): bump to MTP-merge SHA and automatically set MTP defaults (#9852 )	2026-05-16 22:42:48 +02:00
mtp_test.go	feat(llama-cpp): bump to MTP-merge SHA and automatically set MTP defaults (#9852 )	2026-05-16 22:42:48 +02:00
parser_defaults.json	feat(vllm): parity with llama.cpp backend (#9328 )	2026-04-13 11:00:29 +02:00
runtime_settings.go	fix(traces): cap captured body size to keep admin Traces UI responsive (#9946 )	2026-05-22 15:29:24 +02:00
runtime_settings_persist.go	feat(branding): admin-configurable instance name, tagline, and assets (#9635 )	2026-05-02 15:51:36 +02:00
runtime_settings_persist_test.go	feat(branding): admin-configurable instance name, tagline, and assets (#9635 )	2026-05-02 15:51:36 +02:00