LocalAI/backend/index.yaml

---
## metas
- &llamacpp
  name: "llama-cpp"
  alias: "llama-cpp"
  license: mit
  icon: https://user-images.githubusercontent.com/1991296/230134379-7181e485-c521-4d23-a0d6-f7b3b61ba524.png
  description: |
    LLM inference in C/C++
  urls:
    - https://github.com/ggerganov/llama.cpp
  tags:
    - text-to-text
    - LLM
    - CPU
    - GPU
    - Metal
    - CUDA
    - HIP
  capabilities:
    default: "cpu-llama-cpp"
    nvidia: "cuda12-llama-cpp"
    intel: "intel-sycl-f16-llama-cpp"
    amd: "rocm-llama-cpp"
    metal: "metal-llama-cpp"
    vulkan: "vulkan-llama-cpp"
    nvidia-l4t: "nvidia-l4t-arm64-llama-cpp"
    nvidia-cuda-13: "cuda13-llama-cpp"
    nvidia-cuda-12: "cuda12-llama-cpp"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-llama-cpp"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-llama-cpp"
- &whispercpp
  name: "whisper"
  alias: "whisper"
  license: mit
  icon: https://user-images.githubusercontent.com/1991296/235238348-05d0f6a4-da44-4900-a1de-d0707e75b763.jpeg
  description: |
    Port of OpenAI's Whisper model in C/C++
  urls:
    - https://github.com/ggml-org/whisper.cpp
  tags:
    - audio-transcription
    - CPU
    - GPU
    - CUDA
    - HIP
  capabilities:
    default: "cpu-whisper"
    nvidia: "cuda12-whisper"
    intel: "intel-sycl-f16-whisper"
    metal: "metal-whisper"
    amd: "rocm-whisper"
    vulkan: "vulkan-whisper"
    nvidia-l4t: "nvidia-l4t-arm64-whisper"
    nvidia-cuda-13: "cuda13-whisper"
    nvidia-cuda-12: "cuda12-whisper"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-whisper"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-whisper"
- &voxtral
  name: "voxtral"
  alias: "voxtral"
  license: mit
  description: |
    Voxtral Realtime 4B Pure C speech-to-text inference engine
  urls:
    - https://github.com/mudler/voxtral.c
  tags:
    - audio-transcription
    - CPU
    - Metal
  capabilities:
    default: "cpu-voxtral"
    metal-darwin-arm64: "metal-voxtral"
- &stablediffusionggml
  name: "stablediffusion-ggml"
  alias: "stablediffusion-ggml"
  license: mit
  icon: https://github.com/leejet/stable-diffusion.cpp/raw/master/assets/cat_with_sd_cpp_42.png
  description: |
     Stable Diffusion and Flux in pure C/C++
  urls:
    - https://github.com/leejet/stable-diffusion.cpp
  tags:
    - image-generation
    - CPU
    - GPU
    - Metal
    - CUDA
    - HIP
  capabilities:
    default: "cpu-stablediffusion-ggml"
    nvidia: "cuda12-stablediffusion-ggml"
    intel: "intel-sycl-f16-stablediffusion-ggml"
    # amd: "rocm-stablediffusion-ggml"
    vulkan: "vulkan-stablediffusion-ggml"
    nvidia-l4t: "nvidia-l4t-arm64-stablediffusion-ggml"
    metal: "metal-stablediffusion-ggml"
    nvidia-cuda-13: "cuda13-stablediffusion-ggml"
    nvidia-cuda-12: "cuda12-stablediffusion-ggml"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-stablediffusion-ggml"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml"
- &rfdetr
  name: "rfdetr"
  alias: "rfdetr"
  license: apache-2.0
  icon: https://avatars.githubusercontent.com/u/53104118?s=200&v=4
  description: |
    RF-DETR is a real-time, transformer-based object detection model architecture developed by Roboflow and released under the Apache 2.0 license.
    RF-DETR is the first real-time model to exceed 60 AP on the Microsoft COCO benchmark alongside competitive performance at base sizes. It also achieves state-of-the-art performance on RF100-VL, an object detection benchmark that measures model domain adaptability to real world problems. RF-DETR is fastest and most accurate for its size when compared current real-time objection models.
    RF-DETR is small enough to run on the edge using Inference, making it an ideal model for deployments that need both strong accuracy and real-time performance.
  urls:
    - https://github.com/roboflow/rf-detr
  tags:
    - object-detection
    - rfdetr
    - gpu
    - cpu
  capabilities:
    nvidia: "cuda12-rfdetr"
    intel: "intel-rfdetr"
    #amd: "rocm-rfdetr"
    nvidia-l4t: "nvidia-l4t-arm64-rfdetr"
    metal: "metal-rfdetr"
    default: "cpu-rfdetr"
    nvidia-cuda-13: "cuda13-rfdetr"
    nvidia-cuda-12: "cuda12-rfdetr"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-rfdetr"
- &vllm
  name: "vllm"
  license: apache-2.0
  urls:
    - https://github.com/vllm-project/vllm
  tags:
    - text-to-text
    - multimodal
    - GPTQ
    - AWQ
    - AutoRound
    - INT4
    - INT8
    - FP8
  icon: https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-dark.png
  description: |
    vLLM is a fast and easy-to-use library for LLM inference and serving.
    Originally developed in the Sky Computing Lab at UC Berkeley, vLLM has evolved into a community-driven project with contributions from both academia and industry.
    vLLM is fast with:
        State-of-the-art serving throughput
        Efficient management of attention key and value memory with PagedAttention
        Continuous batching of incoming requests
        Fast model execution with CUDA/HIP graph
        Quantizations: GPTQ, AWQ, AutoRound, INT4, INT8, and FP8
        Optimized CUDA kernels, including integration with FlashAttention and FlashInfer
        Speculative decoding
        Chunked prefill
  alias: "vllm"
  capabilities:
    nvidia: "cuda12-vllm"
    amd: "rocm-vllm"
    intel: "intel-vllm"
    nvidia-cuda-12: "cuda12-vllm"
- &vllm-omni
  name: "vllm-omni"
  license: apache-2.0
  urls:
    - https://github.com/vllm-project/vllm-omni
  tags:
    - text-to-image
    - image-generation
    - text-to-video
    - video-generation
    - text-to-speech
    - TTS
    - multimodal
    - LLM
  icon: https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-dark.png
  description: |
    vLLM-Omni is a unified interface for multimodal generation with vLLM.
    It supports image generation (text-to-image, image editing), video generation
    (text-to-video, image-to-video), text generation with multimodal inputs, and
    text-to-speech generation. Only supports NVIDIA (CUDA) and ROCm platforms.
  alias: "vllm-omni"
  capabilities:
    nvidia: "cuda12-vllm-omni"
    amd: "rocm-vllm-omni"
    nvidia-cuda-12: "cuda12-vllm-omni"
- &mlx
  name: "mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx"
  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
  urls:
    - https://github.com/ml-explore/mlx-lm
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-mlx
  license: MIT
  description: |
      Run LLMs with MLX
  tags:
    - text-to-text
    - LLM
    - MLX
  capabilities:
    default: "cpu-mlx"
    nvidia: "cuda12-mlx"
    metal: "metal-mlx"
    nvidia-cuda-12: "cuda12-mlx"
    nvidia-cuda-13: "cuda13-mlx"
    nvidia-l4t: "nvidia-l4t-mlx"
    nvidia-l4t-cuda-12: "nvidia-l4t-mlx"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx"
- &mlx-vlm
  name: "mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-vlm"
  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
  urls:
    - https://github.com/Blaizzy/mlx-vlm
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-mlx-vlm
  license: MIT
  description: |
      Run Vision-Language Models with MLX
  tags:
    - text-to-text
    - multimodal
    - vision-language
    - LLM
    - MLX
  capabilities:
    default: "cpu-mlx-vlm"
    nvidia: "cuda12-mlx-vlm"
    metal: "metal-mlx-vlm"
    nvidia-cuda-12: "cuda12-mlx-vlm"
    nvidia-cuda-13: "cuda13-mlx-vlm"
    nvidia-l4t: "nvidia-l4t-mlx-vlm"
    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-vlm"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-vlm"
- &mlx-audio
  name: "mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-audio"
  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
  urls:
    - https://github.com/Blaizzy/mlx-audio
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-mlx-audio
  license: MIT
  description: |
      Run Audio Models with MLX
  tags:
    - audio-to-text
    - audio-generation
    - text-to-audio
    - LLM
    - MLX
  capabilities:
    default: "cpu-mlx-audio"
    nvidia: "cuda12-mlx-audio"
    metal: "metal-mlx-audio"
    nvidia-cuda-12: "cuda12-mlx-audio"
    nvidia-cuda-13: "cuda13-mlx-audio"
    nvidia-l4t: "nvidia-l4t-mlx-audio"
    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-audio"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-audio"
- &mlx-distributed
  name: "mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-distributed"
  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
  urls:
    - https://github.com/ml-explore/mlx-lm
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-mlx-distributed
  license: MIT
  description: |
      Run distributed LLM inference with MLX across multiple Apple Silicon Macs
  tags:
    - text-to-text
    - LLM
    - MLX
    - distributed
  capabilities:
    default: "cpu-mlx-distributed"
    nvidia: "cuda12-mlx-distributed"
    metal: "metal-mlx-distributed"
    nvidia-cuda-12: "cuda12-mlx-distributed"
    nvidia-cuda-13: "cuda13-mlx-distributed"
    nvidia-l4t: "nvidia-l4t-mlx-distributed"
    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-distributed"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-distributed"
- &rerankers
  name: "rerankers"
  alias: "rerankers"
  capabilities:
    nvidia: "cuda12-rerankers"
    intel: "intel-rerankers"
    amd: "rocm-rerankers"
    metal: "metal-rerankers"
- &transformers
  name: "transformers"
  icon: https://avatars.githubusercontent.com/u/25720743?s=200&v=4
  alias: "transformers"
  license: apache-2.0
  description: |
    Transformers acts as the model-definition framework for state-of-the-art machine learning models in text, computer vision, audio, video, and multimodal model, for both inference and training.
    It centralizes the model definition so that this definition is agreed upon across the ecosystem. transformers is the pivot across frameworks: if a model definition is supported, it will be compatible with the majority of training frameworks (Axolotl, Unsloth, DeepSpeed, FSDP, PyTorch-Lightning, ...), inference engines (vLLM, SGLang, TGI, ...), and adjacent modeling libraries (llama.cpp, mlx, ...) which leverage the model definition from transformers.
  urls:
    - https://github.com/huggingface/transformers
  tags:
    - text-to-text
    - multimodal
  capabilities:
    nvidia: "cuda12-transformers"
    intel: "intel-transformers"
    amd: "rocm-transformers"
    metal: "metal-transformers"
    nvidia-cuda-13: "cuda13-transformers"
    nvidia-cuda-12: "cuda12-transformers"
- &diffusers
  name: "diffusers"
  icon: https://raw.githubusercontent.com/huggingface/diffusers/main/docs/source/en/imgs/diffusers_library.jpg
  description: |
    🤗 Diffusers is the go-to library for state-of-the-art pretrained diffusion models for generating images, audio, and even 3D structures of molecules. Whether you're looking for a simple inference solution or training your own diffusion models, 🤗 Diffusers is a modular toolbox that supports both.
  urls:
    - https://github.com/huggingface/diffusers
  tags:
    - image-generation
    - video-generation
    - diffusion-models
  license: apache-2.0
  alias: "diffusers"
  capabilities:
    nvidia: "cuda12-diffusers"
    intel: "intel-diffusers"
    amd: "rocm-diffusers"
    nvidia-l4t: "nvidia-l4t-diffusers"
    metal: "metal-diffusers"
    default: "cpu-diffusers"
    nvidia-cuda-13: "cuda13-diffusers"
    nvidia-cuda-12: "cuda12-diffusers"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-diffusers"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-diffusers"
- &ace-step
  name: "ace-step"
  description: |
    ACE-Step 1.5 is an open-source music generation model. It supports simple mode (natural language description) and advanced mode (caption, lyrics, think, bpm, keyscale, etc.). Uses in-process acestep (LLMHandler for metadata, DiT for audio).
  urls:
    - https://github.com/ace-step/ACE-Step-1.5
  tags:
    - music-generation
    - sound-generation
  alias: "ace-step"
  capabilities:
    nvidia: "cuda12-ace-step"
    intel: "intel-ace-step"
    amd: "rocm-ace-step"
    metal: "metal-ace-step"
    default: "cpu-ace-step"
    nvidia-cuda-13: "cuda13-ace-step"
    nvidia-cuda-12: "cuda12-ace-step"
- !!merge <<: *ace-step
  name: "ace-step-development"
  capabilities:
    nvidia: "cuda12-ace-step-development"
    intel: "intel-ace-step-development"
    amd: "rocm-ace-step-development"
    metal: "metal-ace-step-development"
    default: "cpu-ace-step-development"
    nvidia-cuda-13: "cuda13-ace-step-development"
    nvidia-cuda-12: "cuda12-ace-step-development"
- &acestepcpp
  name: "acestep-cpp"
  description: |
    ACE-Step 1.5 C++ backend using GGML. Native C++ implementation of ACE-Step music generation with GPU support through GGML backends.
    Generates stereo 48kHz audio from text descriptions and optional lyrics via a two-stage pipeline: text-to-code (ace-qwen3 LLM) + code-to-audio (DiT-VAE).
  urls:
    - https://github.com/ace-step/acestep.cpp
  tags:
    - music-generation
    - sound-generation
  alias: "acestep-cpp"
  capabilities:
    default: "cpu-acestep-cpp"
    nvidia: "cuda12-acestep-cpp"
    nvidia-cuda-13: "cuda13-acestep-cpp"
    nvidia-cuda-12: "cuda12-acestep-cpp"
    intel: "intel-sycl-f16-acestep-cpp"
    metal: "metal-acestep-cpp"
    amd: "rocm-acestep-cpp"
    vulkan: "vulkan-acestep-cpp"
    nvidia-l4t: "nvidia-l4t-arm64-acestep-cpp"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-acestep-cpp"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-acestep-cpp"
- &faster-whisper
  icon: https://avatars.githubusercontent.com/u/1520500?s=200&v=4
  description: |
    faster-whisper is a reimplementation of OpenAI's Whisper model using CTranslate2, which is a fast inference engine for Transformer models.
    This implementation is up to 4 times faster than openai/whisper for the same accuracy while using less memory. The efficiency can be further improved with 8-bit quantization on both CPU and GPU.
  urls:
    - https://github.com/SYSTRAN/faster-whisper
  tags:
    - speech-to-text
    - Whisper
  license: MIT
  name: "faster-whisper"
  capabilities:
    nvidia: "cuda12-faster-whisper"
    intel: "intel-faster-whisper"
    amd: "rocm-faster-whisper"
    metal: "metal-faster-whisper"
    nvidia-cuda-13: "cuda13-faster-whisper"
    nvidia-cuda-12: "cuda12-faster-whisper"
- &moonshine
  description: |
    Moonshine is a fast, accurate, and efficient speech-to-text transcription model using ONNX Runtime.
    It provides real-time transcription capabilities with support for multiple model sizes and GPU acceleration.
  urls:
    - https://github.com/moonshine-ai/moonshine
  tags:
    - speech-to-text
    - transcription
    - ONNX
  license: MIT
  name: "moonshine"
  alias: "moonshine"
  capabilities:
    nvidia: "cuda12-moonshine"
    metal: "metal-moonshine"
    default: "cpu-moonshine"
    nvidia-cuda-13: "cuda13-moonshine"
    nvidia-cuda-12: "cuda12-moonshine"
- &whisperx
  description: |
    WhisperX provides fast automatic speech recognition with word-level timestamps, speaker diarization,
    and forced alignment. Built on faster-whisper and pyannote-audio for high-accuracy transcription
    with speaker identification.
  urls:
    - https://github.com/m-bain/whisperX
  tags:
    - speech-to-text
    - diarization
    - whisperx
  license: BSD-4-Clause
  name: "whisperx"
  alias: "whisperx"
  capabilities:
    nvidia: "cuda12-whisperx"
    amd: "rocm-whisperx"
    metal: "metal-whisperx"
    default: "cpu-whisperx"
    nvidia-cuda-13: "cuda13-whisperx"
    nvidia-cuda-12: "cuda12-whisperx"
- &kokoro
  icon: https://avatars.githubusercontent.com/u/166769057?v=4
  description: |
    Kokoro is an open-weight TTS model with 82 million parameters. Despite its lightweight architecture, it delivers comparable quality to larger models while being significantly faster and more cost-efficient. With Apache-licensed weights, Kokoro can be deployed anywhere from production environments to personal projects.
  urls:
    - https://huggingface.co/hexgrad/Kokoro-82M
    - https://github.com/hexgrad/kokoro
  tags:
    - text-to-speech
    - TTS
    - LLM
  license: apache-2.0
  alias: "kokoro"
  name: "kokoro"
  capabilities:
    nvidia: "cuda12-kokoro"
    intel: "intel-kokoro"
    amd: "rocm-kokoro"
    nvidia-l4t: "nvidia-l4t-kokoro"
    metal: "metal-kokoro"
    nvidia-cuda-13: "cuda13-kokoro"
    nvidia-cuda-12: "cuda12-kokoro"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-kokoro"
- &kokoros
  icon: https://avatars.githubusercontent.com/u/166769057?v=4
  description: |
    Kokoros is a pure Rust TTS backend using the Kokoro ONNX model (82M parameters).
    It provides fast, high-quality text-to-speech with streaming support, built on
    ONNX Runtime for efficient CPU inference. Supports English, Japanese, Mandarin
    Chinese, and German.
  urls:
    - https://huggingface.co/hexgrad/Kokoro-82M
    - https://github.com/lucasjinreal/Kokoros
  tags:
    - text-to-speech
    - TTS
    - Rust
    - ONNX
  license: apache-2.0
  alias: "kokoros"
  name: "kokoros"
  capabilities:
    default: "cpu-kokoros"
- &coqui
  urls:
    - https://github.com/idiap/coqui-ai-TTS
  description: |
    🐸 Coqui TTS is a library for advanced Text-to-Speech generation.

    🚀 Pretrained models in +1100 languages.

    🛠️ Tools for training new models and fine-tuning existing models in any language.

    📚 Utilities for dataset analysis and curation.
  tags:
    - text-to-speech
    - TTS
  license: mpl-2.0
  name: "coqui"
  alias: "coqui"
  capabilities:
    nvidia: "cuda12-coqui"
    intel: "intel-coqui"
    amd: "rocm-coqui"
    metal: "metal-coqui"
    nvidia-cuda-13: "cuda13-coqui"
    nvidia-cuda-12: "cuda12-coqui"
  icon: https://avatars.githubusercontent.com/u/1338804?s=200&v=4
- &outetts
  urls:
    - https://github.com/OuteAI/outetts
  description: |
    OuteTTS is an open-weight text-to-speech model from OuteAI (OuteAI/OuteTTS-0.3-1B).
    Supports custom speaker voices via audio path or default speakers.
  tags:
    - text-to-speech
    - TTS
  license: apache-2.0
  name: "outetts"
  alias: "outetts"
  capabilities:
    default: "cpu-outetts"
    nvidia-cuda-12: "cuda12-outetts"
- &chatterbox
  urls:
    - https://github.com/resemble-ai/chatterbox
  description: |
    Resemble AI's first production-grade open source TTS model. Licensed under MIT, Chatterbox has been benchmarked against leading closed-source systems like ElevenLabs, and is consistently preferred in side-by-side evaluations.
    Whether you're working on memes, videos, games, or AI agents, Chatterbox brings your content to life. It's also the first open source TTS model to support emotion exaggeration control, a powerful feature that makes your voices stand out.
  tags:
    - text-to-speech
    - TTS
  license: MIT
  icon: https://avatars.githubusercontent.com/u/49844015?s=200&v=4
  name: "chatterbox"
  alias: "chatterbox"
  capabilities:
    nvidia: "cuda12-chatterbox"
    metal: "metal-chatterbox"
    default: "cpu-chatterbox"
    nvidia-l4t: "nvidia-l4t-arm64-chatterbox"
    nvidia-cuda-13: "cuda13-chatterbox"
    nvidia-cuda-12: "cuda12-chatterbox"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-chatterbox"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-chatterbox"
- &vibevoice
  urls:
    - https://github.com/microsoft/VibeVoice
  description: |
    VibeVoice-Realtime is a real-time text-to-speech model that generates natural-sounding speech.
  tags:
    - text-to-speech
    - TTS
  license: mit
  name: "vibevoice"
  alias: "vibevoice"
  capabilities:
    nvidia: "cuda12-vibevoice"
    intel: "intel-vibevoice"
    amd: "rocm-vibevoice"
    nvidia-l4t: "nvidia-l4t-vibevoice"
    metal: "metal-vibevoice"
    default: "cpu-vibevoice"
    nvidia-cuda-13: "cuda13-vibevoice"
    nvidia-cuda-12: "cuda12-vibevoice"
    nvidia-l4t-cuda-12: "nvidia-l4t-vibevoice"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-vibevoice"
  icon: https://avatars.githubusercontent.com/u/6154722?s=200&v=4
- &qwen-tts
  urls:
    - https://github.com/QwenLM/Qwen3-TTS
  description: |
    Qwen3-TTS is a high-quality text-to-speech model supporting custom voice, voice design, and voice cloning.
  tags:
    - text-to-speech
    - TTS
  license: apache-2.0
  name: "qwen-tts"
  alias: "qwen-tts"
  capabilities:
    nvidia: "cuda12-qwen-tts"
    intel: "intel-qwen-tts"
    amd: "rocm-qwen-tts"
    nvidia-l4t: "nvidia-l4t-qwen-tts"
    metal: "metal-qwen-tts"
    default: "cpu-qwen-tts"
    nvidia-cuda-13: "cuda13-qwen-tts"
    nvidia-cuda-12: "cuda12-qwen-tts"
    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-tts"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-tts"
  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
- &fish-speech
  urls:
    - https://github.com/fishaudio/fish-speech
  description: |
    Fish Speech is a high-quality text-to-speech model supporting voice cloning via reference audio.
  tags:
    - text-to-speech
    - TTS
    - voice-cloning
  license: apache-2.0
  name: "fish-speech"
  alias: "fish-speech"
  capabilities:
    nvidia: "cuda12-fish-speech"
    intel: "intel-fish-speech"
    amd: "rocm-fish-speech"
    nvidia-l4t: "nvidia-l4t-fish-speech"
    metal: "metal-fish-speech"
    default: "cpu-fish-speech"
    nvidia-cuda-13: "cuda13-fish-speech"
    nvidia-cuda-12: "cuda12-fish-speech"
    nvidia-l4t-cuda-12: "nvidia-l4t-fish-speech"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-fish-speech"
  icon: https://avatars.githubusercontent.com/u/148526220?s=200&v=4
- &faster-qwen3-tts
  urls:
    - https://github.com/andimarafioti/faster-qwen3-tts
    - https://pypi.org/project/faster-qwen3-tts/
  description: |
    Real-time Qwen3-TTS inference using CUDA graph capture. Voice clone only; requires NVIDIA GPU with CUDA.
  tags:
    - text-to-speech
    - TTS
    - voice-clone
  license: apache-2.0
  name: "faster-qwen3-tts"
  alias: "faster-qwen3-tts"
  capabilities:
    nvidia: "cuda12-faster-qwen3-tts"
    default: "cuda12-faster-qwen3-tts"
    nvidia-cuda-13: "cuda13-faster-qwen3-tts"
    nvidia-cuda-12: "cuda12-faster-qwen3-tts"
    nvidia-l4t: "nvidia-l4t-faster-qwen3-tts"
    nvidia-l4t-cuda-12: "nvidia-l4t-faster-qwen3-tts"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts"
  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
- &qwen-asr
  urls:
    - https://github.com/QwenLM/Qwen3-ASR
  description: |
    Qwen3-ASR is an automatic speech recognition model supporting multiple languages and batch inference.
  tags:
    - speech-recognition
    - ASR
  license: apache-2.0
  name: "qwen-asr"
  alias: "qwen-asr"
  capabilities:
    nvidia: "cuda12-qwen-asr"
    intel: "intel-qwen-asr"
    amd: "rocm-qwen-asr"
    nvidia-l4t: "nvidia-l4t-qwen-asr"
    metal: "metal-qwen-asr"
    default: "cpu-qwen-asr"
    nvidia-cuda-13: "cuda13-qwen-asr"
    nvidia-cuda-12: "cuda12-qwen-asr"
    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-asr"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-asr"
  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
- &nemo
  urls:
    - https://github.com/NVIDIA/NeMo
  description: |
    NVIDIA NEMO Toolkit for ASR provides state-of-the-art automatic speech recognition models including Parakeet models for various languages and use cases.
  tags:
    - speech-recognition
    - ASR
    - NVIDIA
  license: apache-2.0
  name: "nemo"
  alias: "nemo"
  capabilities:
    nvidia: "cuda12-nemo"
    intel: "intel-nemo"
    amd: "rocm-nemo"
    metal: "metal-nemo"
    default: "cpu-nemo"
    nvidia-cuda-13: "cuda13-nemo"
    nvidia-cuda-12: "cuda12-nemo"
  icon: https://www.nvidia.com/favicon.ico
- &voxcpm
  urls:
    - https://github.com/ModelBest/VoxCPM
  description: |
    VoxCPM is an innovative end-to-end TTS model from ModelBest, designed to generate highly expressive speech.
  tags:
    - text-to-speech
    - TTS
  license: mit
  name: "voxcpm"
  alias: "voxcpm"
  capabilities:
    nvidia: "cuda12-voxcpm"
    intel: "intel-voxcpm"
    amd: "rocm-voxcpm"
    metal: "metal-voxcpm"
    default: "cpu-voxcpm"
    nvidia-cuda-13: "cuda13-voxcpm"
    nvidia-cuda-12: "cuda12-voxcpm"
  icon: https://avatars.githubusercontent.com/u/6154722?s=200&v=4
- &pocket-tts
  urls:
    - https://github.com/kyutai-labs/pocket-tts
  description: |
    Pocket TTS is a lightweight text-to-speech model designed to run efficiently on CPUs.
  tags:
    - text-to-speech
    - TTS
  license: mit
  name: "pocket-tts"
  alias: "pocket-tts"
  capabilities:
    nvidia: "cuda12-pocket-tts"
    intel: "intel-pocket-tts"
    amd: "rocm-pocket-tts"
    nvidia-l4t: "nvidia-l4t-pocket-tts"
    metal: "metal-pocket-tts"
    default: "cpu-pocket-tts"
    nvidia-cuda-13: "cuda13-pocket-tts"
    nvidia-cuda-12: "cuda12-pocket-tts"
    nvidia-l4t-cuda-12: "nvidia-l4t-pocket-tts"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-pocket-tts"
  icon: https://avatars.githubusercontent.com/u/151010778?s=200&v=4
- &piper
  name: "piper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-piper"
  icon: https://github.com/OHF-Voice/piper1-gpl/raw/main/etc/logo.png
  urls:
    - https://github.com/rhasspy/piper
    - https://github.com/mudler/go-piper
  mirrors:
    - localai/localai-backends:latest-piper
  license: MIT
  description: |
     A fast, local neural text to speech system
  tags:
    - text-to-speech
    - TTS
- &opus
  name: "opus"
  alias: "opus"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-opus"
  urls:
    - https://opus-codec.org/
  mirrors:
    - localai/localai-backends:latest-cpu-opus
  license: BSD-3-Clause
  description: |
    Opus audio codec backend for encoding and decoding audio.
    Required for WebRTC transport in the Realtime API.
  tags:
    - audio-codec
    - opus
    - WebRTC
    - realtime
    - CPU
- &silero-vad
  name: "silero-vad"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-silero-vad"
  icon: https://user-images.githubusercontent.com/12515440/89997349-b3523080-dc94-11ea-9906-ca2e8bc50535.png
  urls:
    - https://github.com/snakers4/silero-vad
  mirrors:
    - localai/localai-backends:latest-cpu-silero-vad
  description: |
    Silero VAD: pre-trained enterprise-grade Voice Activity Detector.
    Silero VAD is a voice activity detection model that can be used to detect whether a given audio contains speech or not.
  tags:
    - voice-activity-detection
    - VAD
    - silero-vad
    - CPU
- &local-store
  name: "local-store"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-local-store"
  mirrors:
    - localai/localai-backends:latest-cpu-local-store
  urls:
    - https://github.com/mudler/LocalAI
  description: |
    Local Store is a local-first, self-hosted, and open-source vector database.
  tags:
    - vector-database
    - local-first
    - open-source
    - CPU
  license: MIT
- &kitten-tts
  name: "kitten-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-kitten-tts"
  mirrors:
    - localai/localai-backends:latest-kitten-tts
  urls:
    - https://github.com/KittenML/KittenTTS
  description: |
    Kitten TTS is a text-to-speech model that can generate speech from text.
  tags:
    - text-to-speech
    - TTS
  license: apache-2.0
- &neutts
  name: "neutts"
  urls:
    - https://github.com/neuphonic/neutts-air
  description: |
    NeuTTS Air is the world’s first super-realistic, on-device, TTS speech language model with instant voice cloning. Built off a 0.5B LLM backbone, NeuTTS Air brings natural-sounding speech, real-time performance, built-in security and speaker cloning to your local device - unlocking a new category of embedded voice agents, assistants, toys, and compliance-safe apps.
  tags:
    - text-to-speech
    - TTS
  license: apache-2.0
  capabilities:
    default: "cpu-neutts"
    nvidia: "cuda12-neutts"
    amd: "rocm-neutts"
    nvidia-cuda-12: "cuda12-neutts"
- !!merge <<: *neutts
  name: "neutts-development"
  capabilities:
    default: "cpu-neutts-development"
    nvidia: "cuda12-neutts-development"
    amd: "rocm-neutts-development"
    nvidia-cuda-12: "cuda12-neutts-development"
- !!merge <<: *llamacpp
  name: "llama-cpp-development"
  capabilities:
    default: "cpu-llama-cpp-development"
    nvidia: "cuda12-llama-cpp-development"
    intel: "intel-sycl-f16-llama-cpp-development"
    amd: "rocm-llama-cpp-development"
    metal: "metal-llama-cpp-development"
    vulkan: "vulkan-llama-cpp-development"
    nvidia-l4t: "nvidia-l4t-arm64-llama-cpp-development"
    nvidia-cuda-13: "cuda13-llama-cpp-development"
    nvidia-cuda-12: "cuda12-llama-cpp-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-llama-cpp-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-llama-cpp-development"
- !!merge <<: *neutts
  name: "cpu-neutts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-neutts"
  mirrors:
    - localai/localai-backends:latest-cpu-neutts
- !!merge <<: *neutts
  name: "cuda12-neutts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-neutts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-neutts
- !!merge <<: *neutts
  name: "rocm-neutts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-neutts"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-neutts
- !!merge <<: *neutts
  name: "cpu-neutts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-neutts"
  mirrors:
    - localai/localai-backends:master-cpu-neutts
- !!merge <<: *neutts
  name: "cuda12-neutts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-neutts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-neutts
- !!merge <<: *neutts
  name: "rocm-neutts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-neutts"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-neutts
- !!merge <<: *mlx
  name: "mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-mlx
- !!merge <<: *mlx-vlm
  name: "mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-mlx-vlm
- !!merge <<: *mlx-audio
  name: "mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-audio"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-mlx-audio
- !!merge <<: *mlx-distributed
  name: "mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-mlx-distributed
## mlx
- !!merge <<: *mlx
  name: "cpu-mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx"
  mirrors:
    - localai/localai-backends:latest-cpu-mlx
- !!merge <<: *mlx
  name: "cpu-mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx"
  mirrors:
    - localai/localai-backends:master-cpu-mlx
- !!merge <<: *mlx
  name: "cuda12-mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx
- !!merge <<: *mlx
  name: "cuda12-mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx
- !!merge <<: *mlx
  name: "cuda13-mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx
- !!merge <<: *mlx
  name: "cuda13-mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx
- !!merge <<: *mlx
  name: "nvidia-l4t-mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-mlx
- !!merge <<: *mlx
  name: "nvidia-l4t-mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-mlx
- !!merge <<: *mlx
  name: "cuda13-nvidia-l4t-arm64-mlx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx
- !!merge <<: *mlx
  name: "cuda13-nvidia-l4t-arm64-mlx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx
## mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cpu-mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-vlm"
  mirrors:
    - localai/localai-backends:latest-cpu-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cpu-mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-cpu-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda12-mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-vlm"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda12-mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda13-mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-vlm"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda13-mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "nvidia-l4t-mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-vlm"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "nvidia-l4t-mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda13-nvidia-l4t-arm64-mlx-vlm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-vlm"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-vlm
- !!merge <<: *mlx-vlm
  name: "cuda13-nvidia-l4t-arm64-mlx-vlm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-vlm"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-vlm
## mlx-audio
- !!merge <<: *mlx-audio
  name: "cpu-mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-audio"
  mirrors:
    - localai/localai-backends:latest-cpu-mlx-audio
- !!merge <<: *mlx-audio
  name: "cpu-mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-audio"
  mirrors:
    - localai/localai-backends:master-cpu-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda12-mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-audio"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda12-mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-audio"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda13-mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-audio"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda13-mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-audio"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-audio
- !!merge <<: *mlx-audio
  name: "nvidia-l4t-mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-audio"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-mlx-audio
- !!merge <<: *mlx-audio
  name: "nvidia-l4t-mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-audio"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda13-nvidia-l4t-arm64-mlx-audio"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-audio"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-audio
- !!merge <<: *mlx-audio
  name: "cuda13-nvidia-l4t-arm64-mlx-audio-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-audio"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-audio
## mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cpu-mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-distributed"
  mirrors:
    - localai/localai-backends:latest-cpu-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cpu-mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-cpu-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda12-mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-distributed"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda12-mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda13-mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-distributed"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda13-mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "nvidia-l4t-mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-distributed"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "nvidia-l4t-mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda13-nvidia-l4t-arm64-mlx-distributed"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-distributed"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-distributed
- !!merge <<: *mlx-distributed
  name: "cuda13-nvidia-l4t-arm64-mlx-distributed-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-distributed"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-distributed
- !!merge <<: *kitten-tts
  name: "kitten-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-kitten-tts"
  mirrors:
    - localai/localai-backends:master-kitten-tts
- !!merge <<: *kitten-tts
  name: "metal-kitten-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-kitten-tts"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-kitten-tts
- !!merge <<: *kitten-tts
  name: "metal-kitten-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-kitten-tts"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-kitten-tts
- !!merge <<: *local-store
  name: "local-store-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-local-store"
  mirrors:
    - localai/localai-backends:master-cpu-local-store
- !!merge <<: *local-store
  name: "metal-local-store"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-local-store"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-local-store
- !!merge <<: *local-store
  name: "metal-local-store-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-local-store"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-local-store
- !!merge <<: *opus
  name: "opus-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-opus"
  mirrors:
    - localai/localai-backends:master-cpu-opus
- !!merge <<: *opus
  name: "metal-opus"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-opus"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-opus
- !!merge <<: *opus
  name: "metal-opus-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-opus"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-opus
- !!merge <<: *silero-vad
  name: "silero-vad-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-silero-vad"
  mirrors:
    - localai/localai-backends:master-cpu-silero-vad
- !!merge <<: *silero-vad
  name: "metal-silero-vad"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-silero-vad"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-silero-vad
- !!merge <<: *silero-vad
  name: "metal-silero-vad-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-silero-vad"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-silero-vad
- !!merge <<: *piper
  name: "piper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-piper"
  mirrors:
    - localai/localai-backends:master-piper
- !!merge <<: *piper
  name: "metal-piper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-piper"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-piper
- !!merge <<: *piper
  name: "metal-piper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-piper"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-piper
## llama-cpp
- !!merge <<: *llamacpp
  name: "nvidia-l4t-arm64-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "nvidia-l4t-arm64-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda13-nvidia-l4t-arm64-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda13-nvidia-l4t-arm64-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "cpu-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-cpu-llama-cpp
- !!merge <<: *llamacpp
  name: "cpu-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-llama-cpp"
  mirrors:
    - localai/localai-backends:master-cpu-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda12-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-llama-cpp
- !!merge <<: *llamacpp
  name: "rocm-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-llama-cpp
- !!merge <<: *llamacpp
  name: "intel-sycl-f32-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f32-llama-cpp
- !!merge <<: *llamacpp
  name: "intel-sycl-f16-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f16-llama-cpp
- !!merge <<: *llamacpp
  name: "vulkan-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-vulkan-llama-cpp
- !!merge <<: *llamacpp
  name: "vulkan-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-vulkan-llama-cpp
- !!merge <<: *llamacpp
  name: "metal-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "metal-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-llama-cpp"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda12-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-llama-cpp
- !!merge <<: *llamacpp
  name: "rocm-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-llama-cpp
- !!merge <<: *llamacpp
  name: "intel-sycl-f32-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f32-llama-cpp
- !!merge <<: *llamacpp
  name: "intel-sycl-f16-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f16-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda13-llama-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-llama-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-llama-cpp
- !!merge <<: *llamacpp
  name: "cuda13-llama-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-llama-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-llama-cpp
## whisper
- !!merge <<: *whispercpp
  name: "nvidia-l4t-arm64-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-whisper"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-whisper
- !!merge <<: *whispercpp
  name: "nvidia-l4t-arm64-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-whisper"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-whisper
- !!merge <<: *whispercpp
  name: "cuda13-nvidia-l4t-arm64-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-whisper"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-whisper
- !!merge <<: *whispercpp
  name: "cuda13-nvidia-l4t-arm64-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-whisper"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-whisper
- !!merge <<: *whispercpp
  name: "cpu-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-whisper"
  mirrors:
    - localai/localai-backends:latest-cpu-whisper
- !!merge <<: *whispercpp
  name: "metal-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisper"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-whisper
- !!merge <<: *whispercpp
  name: "metal-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisper"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-whisper
- !!merge <<: *whispercpp
  name: "cpu-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-whisper"
  mirrors:
    - localai/localai-backends:master-cpu-whisper
- !!merge <<: *whispercpp
  name: "cuda12-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-whisper
- !!merge <<: *whispercpp
  name: "rocm-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-whisper
- !!merge <<: *whispercpp
  name: "intel-sycl-f32-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f32-whisper
- !!merge <<: *whispercpp
  name: "intel-sycl-f16-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f16-whisper
- !!merge <<: *whispercpp
  name: "vulkan-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-vulkan-whisper
- !!merge <<: *whispercpp
  name: "vulkan-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-vulkan-whisper
- !!merge <<: *whispercpp
  name: "metal-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisper"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-whisper
- !!merge <<: *whispercpp
  name: "metal-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisper"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-whisper
- !!merge <<: *whispercpp
  name: "cuda12-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-whisper
- !!merge <<: *whispercpp
  name: "rocm-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-whisper
- !!merge <<: *whispercpp
  name: "intel-sycl-f32-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f32-whisper
- !!merge <<: *whispercpp
  name: "intel-sycl-f16-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f16-whisper
- !!merge <<: *whispercpp
  name: "cuda13-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-whisper
- !!merge <<: *whispercpp
  name: "cuda13-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-whisper
## stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cpu-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-cpu-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cpu-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-cpu-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "metal-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "metal-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "vulkan-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-gpu-vulkan-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "vulkan-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-gpu-vulkan-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda12-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "intel-sycl-f32-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-stablediffusion-ggml"
- !!merge <<: *stablediffusionggml
  name: "intel-sycl-f16-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f16-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda12-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "intel-sycl-f32-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f32-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "intel-sycl-f16-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f16-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "nvidia-l4t-arm64-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "nvidia-l4t-arm64-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda13-stablediffusion-ggml"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-stablediffusion-ggml
- !!merge <<: *stablediffusionggml
  name: "cuda13-stablediffusion-ggml-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-stablediffusion-ggml"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-stablediffusion-ggml
# vllm
- !!merge <<: *vllm
  name: "vllm-development"
  capabilities:
    nvidia: "cuda12-vllm-development"
    amd: "rocm-vllm-development"
    intel: "intel-vllm-development"
- !!merge <<: *vllm
  name: "cuda12-vllm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vllm"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vllm
- !!merge <<: *vllm
  name: "rocm-vllm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vllm"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-vllm
- !!merge <<: *vllm
  name: "intel-vllm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-vllm"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-vllm
- !!merge <<: *vllm
  name: "cuda12-vllm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vllm"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-vllm
- !!merge <<: *vllm
  name: "rocm-vllm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vllm"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-vllm
- !!merge <<: *vllm
  name: "intel-vllm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-vllm"
  mirrors:
    - localai/localai-backends:master-gpu-intel-vllm
# vllm-omni
- !!merge <<: *vllm-omni
  name: "vllm-omni-development"
  capabilities:
    nvidia: "cuda12-vllm-omni-development"
    amd: "rocm-vllm-omni-development"
    nvidia-cuda-12: "cuda12-vllm-omni-development"
- !!merge <<: *vllm-omni
  name: "cuda12-vllm-omni"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vllm-omni"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vllm-omni
- !!merge <<: *vllm-omni
  name: "rocm-vllm-omni"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vllm-omni"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-vllm-omni
- !!merge <<: *vllm-omni
  name: "cuda12-vllm-omni-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vllm-omni"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-vllm-omni
- !!merge <<: *vllm-omni
  name: "rocm-vllm-omni-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vllm-omni"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-vllm-omni
# rfdetr
- !!merge <<: *rfdetr
  name: "rfdetr-development"
  capabilities:
    nvidia: "cuda12-rfdetr-development"
    intel: "intel-rfdetr-development"
    #amd: "rocm-rfdetr-development"
    nvidia-l4t: "nvidia-l4t-arm64-rfdetr-development"
    metal: "metal-rfdetr-development"
    default: "cpu-rfdetr-development"
    nvidia-cuda-13: "cuda13-rfdetr-development"
- !!merge <<: *rfdetr
  name: "cuda12-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-rfdetr"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-rfdetr
- !!merge <<: *rfdetr
  name: "intel-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rfdetr"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-rfdetr
# - !!merge <<: *rfdetr
#   name: "rocm-rfdetr"
#   uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-hipblas-rfdetr"
#   mirrors:
#     - localai/localai-backends:latest-gpu-hipblas-rfdetr
- !!merge <<: *rfdetr
  name: "nvidia-l4t-arm64-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-rfdetr"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-rfdetr
- !!merge <<: *rfdetr
  name: "nvidia-l4t-arm64-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-rfdetr"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-rfdetr
- !!merge <<: *rfdetr
  name: "cpu-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-rfdetr"
  mirrors:
    - localai/localai-backends:latest-cpu-rfdetr
- !!merge <<: *rfdetr
  name: "cuda12-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-rfdetr"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-rfdetr
- !!merge <<: *rfdetr
  name: "intel-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-rfdetr"
  mirrors:
    - localai/localai-backends:master-gpu-intel-rfdetr
# - !!merge <<: *rfdetr
#   name: "rocm-rfdetr-development"
#   uri: "quay.io/go-skynet/local-ai-backends:master-gpu-hipblas-rfdetr"
#   mirrors:
#     - localai/localai-backends:master-gpu-hipblas-rfdetr
- !!merge <<: *rfdetr
  name: "cpu-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-rfdetr"
  mirrors:
    - localai/localai-backends:master-cpu-rfdetr
- !!merge <<: *rfdetr
  name: "intel-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rfdetr"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-rfdetr
- !!merge <<: *rfdetr
  name: "cuda13-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-rfdetr"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-rfdetr
- !!merge <<: *rfdetr
  name: "cuda13-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-rfdetr"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-rfdetr
- !!merge <<: *rfdetr
  name: "metal-rfdetr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-rfdetr"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-rfdetr
- !!merge <<: *rfdetr
  name: "metal-rfdetr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-rfdetr"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-rfdetr
## Rerankers
- !!merge <<: *rerankers
  name: "rerankers-development"
  capabilities:
    nvidia: "cuda12-rerankers-development"
    intel: "intel-rerankers-development"
    amd: "rocm-rerankers-development"
    metal: "metal-rerankers-development"
    nvidia-cuda-13: "cuda13-rerankers-development"
- !!merge <<: *rerankers
  name: "cuda12-rerankers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-rerankers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-rerankers
- !!merge <<: *rerankers
  name: "intel-rerankers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rerankers"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-rerankers
- !!merge <<: *rerankers
  name: "rocm-rerankers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-rerankers"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-rerankers
- !!merge <<: *rerankers
  name: "cuda12-rerankers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-rerankers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-rerankers
- !!merge <<: *rerankers
  name: "rocm-rerankers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-rerankers"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-rerankers
- !!merge <<: *rerankers
  name: "intel-rerankers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-rerankers"
  mirrors:
    - localai/localai-backends:master-gpu-intel-rerankers
- !!merge <<: *rerankers
  name: "cuda13-rerankers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-rerankers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-rerankers
- !!merge <<: *rerankers
  name: "cuda13-rerankers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-rerankers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-rerankers
- !!merge <<: *rerankers
  name: "metal-rerankers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-rerankers"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-rerankers
- !!merge <<: *rerankers
  name: "metal-rerankers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-rerankers"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-rerankers
## Transformers
- !!merge <<: *transformers
  name: "transformers-development"
  capabilities:
    nvidia: "cuda12-transformers-development"
    intel: "intel-transformers-development"
    amd: "rocm-transformers-development"
    metal: "metal-transformers-development"
    nvidia-cuda-13: "cuda13-transformers-development"
- !!merge <<: *transformers
  name: "cuda12-transformers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-transformers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-transformers
- !!merge <<: *transformers
  name: "rocm-transformers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-transformers"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-transformers
- !!merge <<: *transformers
  name: "intel-transformers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-transformers"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-transformers
- !!merge <<: *transformers
  name: "cuda12-transformers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-transformers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-transformers
- !!merge <<: *transformers
  name: "rocm-transformers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-transformers"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-transformers
- !!merge <<: *transformers
  name: "intel-transformers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-transformers"
  mirrors:
    - localai/localai-backends:master-gpu-intel-transformers
- !!merge <<: *transformers
  name: "cuda13-transformers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-transformers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-transformers
- !!merge <<: *transformers
  name: "cuda13-transformers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-transformers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-transformers
- !!merge <<: *transformers
  name: "metal-transformers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-transformers"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-transformers
- !!merge <<: *transformers
  name: "metal-transformers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-transformers"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-transformers
## Diffusers
- !!merge <<: *diffusers
  name: "diffusers-development"
  capabilities:
    nvidia: "cuda12-diffusers-development"
    intel: "intel-diffusers-development"
    amd: "rocm-diffusers-development"
    nvidia-l4t: "nvidia-l4t-diffusers-development"
    metal: "metal-diffusers-development"
    default: "cpu-diffusers-development"
    nvidia-cuda-13: "cuda13-diffusers-development"
- !!merge <<: *diffusers
  name: "cpu-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-diffusers"
  mirrors:
    - localai/localai-backends:latest-cpu-diffusers
- !!merge <<: *diffusers
  name: "cpu-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-diffusers"
  mirrors:
    - localai/localai-backends:master-cpu-diffusers
- !!merge <<: *diffusers
  name: "nvidia-l4t-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-diffusers"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-diffusers
- !!merge <<: *diffusers
  name: "nvidia-l4t-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-diffusers"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-diffusers
- !!merge <<: *diffusers
  name: "cuda13-nvidia-l4t-arm64-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-diffusers"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-diffusers
- !!merge <<: *diffusers
  name: "cuda13-nvidia-l4t-arm64-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-diffusers"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-diffusers
- !!merge <<: *diffusers
  name: "cuda12-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-diffusers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-diffusers
- !!merge <<: *diffusers
  name: "rocm-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-diffusers"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-diffusers
- !!merge <<: *diffusers
  name: "intel-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-diffusers"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-diffusers
- !!merge <<: *diffusers
  name: "cuda12-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-diffusers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-diffusers
- !!merge <<: *diffusers
  name: "rocm-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-diffusers"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-diffusers
- !!merge <<: *diffusers
  name: "intel-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-diffusers"
  mirrors:
    - localai/localai-backends:master-gpu-intel-diffusers
- !!merge <<: *diffusers
  name: "cuda13-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-diffusers"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-diffusers
- !!merge <<: *diffusers
  name: "cuda13-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-diffusers"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-diffusers
- !!merge <<: *diffusers
  name: "metal-diffusers"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-diffusers"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-diffusers
- !!merge <<: *diffusers
  name: "metal-diffusers-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-diffusers"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-diffusers
## ace-step
- !!merge <<: *ace-step
  name: "cpu-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-ace-step"
  mirrors:
    - localai/localai-backends:latest-cpu-ace-step
- !!merge <<: *ace-step
  name: "cpu-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-ace-step"
  mirrors:
    - localai/localai-backends:master-cpu-ace-step
- !!merge <<: *ace-step
  name: "cuda12-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-ace-step"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-ace-step
- !!merge <<: *ace-step
  name: "cuda12-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-ace-step"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-ace-step
- !!merge <<: *ace-step
  name: "cuda13-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-ace-step"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-ace-step
- !!merge <<: *ace-step
  name: "cuda13-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-ace-step"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-ace-step
- !!merge <<: *ace-step
  name: "rocm-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-ace-step"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-ace-step
- !!merge <<: *ace-step
  name: "rocm-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-ace-step"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-ace-step
- !!merge <<: *ace-step
  name: "intel-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-ace-step"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-ace-step
- !!merge <<: *ace-step
  name: "intel-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-ace-step"
  mirrors:
    - localai/localai-backends:master-gpu-intel-ace-step
- !!merge <<: *ace-step
  name: "metal-ace-step"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-ace-step"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-ace-step
- !!merge <<: *ace-step
  name: "metal-ace-step-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-ace-step"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-ace-step
## acestep-cpp
- !!merge <<: *acestepcpp
  name: "nvidia-l4t-arm64-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "nvidia-l4t-arm64-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda13-nvidia-l4t-arm64-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda13-nvidia-l4t-arm64-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cpu-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-cpu-acestep-cpp
- !!merge <<: *acestepcpp
  name: "metal-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "metal-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cpu-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-cpu-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda12-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-acestep-cpp
- !!merge <<: *acestepcpp
  name: "rocm-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-acestep-cpp
- !!merge <<: *acestepcpp
  name: "intel-sycl-f32-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f32-acestep-cpp
- !!merge <<: *acestepcpp
  name: "intel-sycl-f16-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-sycl-f16-acestep-cpp
- !!merge <<: *acestepcpp
  name: "vulkan-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-vulkan-acestep-cpp
- !!merge <<: *acestepcpp
  name: "vulkan-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-vulkan-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda12-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-acestep-cpp
- !!merge <<: *acestepcpp
  name: "rocm-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-acestep-cpp
- !!merge <<: *acestepcpp
  name: "intel-sycl-f32-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f32-acestep-cpp
- !!merge <<: *acestepcpp
  name: "intel-sycl-f16-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-intel-sycl-f16-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda13-acestep-cpp"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-acestep-cpp"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-acestep-cpp
- !!merge <<: *acestepcpp
  name: "cuda13-acestep-cpp-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-acestep-cpp"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-acestep-cpp
## kokoro
- !!merge <<: *kokoro
  name: "kokoro-development"
  capabilities:
    nvidia: "cuda12-kokoro-development"
    intel: "intel-kokoro-development"
    amd: "rocm-kokoro-development"
    nvidia-l4t: "nvidia-l4t-kokoro-development"
    metal: "metal-kokoro-development"
- !!merge <<: *kokoro
  name: "cuda12-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-kokoro"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-kokoro
- !!merge <<: *kokoro
  name: "rocm-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-kokoro"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-kokoro
- !!merge <<: *kokoro
  name: "intel-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-kokoro"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-kokoro
- !!merge <<: *kokoro
  name: "intel-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-kokoro"
  mirrors:
    - localai/localai-backends:master-gpu-intel-kokoro
- !!merge <<: *kokoro
  name: "nvidia-l4t-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-kokoro"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-kokoro
- !!merge <<: *kokoro
  name: "nvidia-l4t-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-kokoro"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-kokoro
- !!merge <<: *kokoro
  name: "cuda12-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-kokoro"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-kokoro
- !!merge <<: *kokoro
  name: "rocm-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-kokoro"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-kokoro
- !!merge <<: *kokoro
  name: "cuda13-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-kokoro"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-kokoro
- !!merge <<: *kokoro
  name: "cuda13-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-kokoro"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-kokoro
- !!merge <<: *kokoro
  name: "metal-kokoro"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-kokoro"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-kokoro
- !!merge <<: *kokoro
  name: "metal-kokoro-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-kokoro"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-kokoro
## kokoros (Rust)
- !!merge <<: *kokoros
  name: "kokoros-development"
  capabilities:
    default: "cpu-kokoros-development"
- !!merge <<: *kokoros
  name: "cpu-kokoros"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-kokoros"
  mirrors:
    - localai/localai-backends:latest-cpu-kokoros
- !!merge <<: *kokoros
  name: "cpu-kokoros-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-kokoros"
  mirrors:
    - localai/localai-backends:master-cpu-kokoros
## faster-whisper
- !!merge <<: *faster-whisper
  name: "faster-whisper-development"
  capabilities:
    nvidia: "cuda12-faster-whisper-development"
    intel: "intel-faster-whisper-development"
    amd: "rocm-faster-whisper-development"
    metal: "metal-faster-whisper-development"
    nvidia-cuda-13: "cuda13-faster-whisper-development"
- !!merge <<: *faster-whisper
  name: "cuda12-faster-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-faster-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-faster-whisper
- !!merge <<: *faster-whisper
  name: "rocm-faster-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-faster-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-faster-whisper
- !!merge <<: *faster-whisper
  name: "intel-faster-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-faster-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-faster-whisper
- !!merge <<: *faster-whisper
  name: "intel-faster-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-faster-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-intel-faster-whisper
- !!merge <<: *faster-whisper
  name: "cuda13-faster-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-faster-whisper"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-faster-whisper
- !!merge <<: *faster-whisper
  name: "cuda13-faster-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-faster-whisper"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-faster-whisper
- !!merge <<: *faster-whisper
  name: "metal-faster-whisper"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-faster-whisper"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-faster-whisper
- !!merge <<: *faster-whisper
  name: "metal-faster-whisper-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-faster-whisper"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-faster-whisper
## moonshine
- !!merge <<: *moonshine
  name: "moonshine-development"
  capabilities:
    nvidia: "cuda12-moonshine-development"
    default: "cpu-moonshine-development"
    nvidia-cuda-13: "cuda13-moonshine-development"
    nvidia-cuda-12: "cuda12-moonshine-development"
- !!merge <<: *moonshine
  name: "cpu-moonshine"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-moonshine"
  mirrors:
    - localai/localai-backends:latest-cpu-moonshine
- !!merge <<: *moonshine
  name: "cpu-moonshine-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-moonshine"
  mirrors:
    - localai/localai-backends:master-cpu-moonshine
- !!merge <<: *moonshine
  name: "cuda12-moonshine"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-moonshine"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-moonshine
- !!merge <<: *moonshine
  name: "cuda12-moonshine-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-moonshine"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-moonshine
- !!merge <<: *moonshine
  name: "cuda13-moonshine"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-moonshine"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-moonshine
- !!merge <<: *moonshine
  name: "cuda13-moonshine-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-moonshine"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-moonshine
- !!merge <<: *moonshine
  name: "metal-moonshine"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-moonshine"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-moonshine
- !!merge <<: *moonshine
  name: "metal-moonshine-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-moonshine"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-moonshine
## whisperx
- !!merge <<: *whisperx
  name: "whisperx-development"
  capabilities:
    nvidia: "cuda12-whisperx-development"
    amd: "rocm-whisperx-development"
    metal: "metal-whisperx-development"
    default: "cpu-whisperx-development"
    nvidia-cuda-13: "cuda13-whisperx-development"
    nvidia-cuda-12: "cuda12-whisperx-development"
- !!merge <<: *whisperx
  name: "cpu-whisperx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-whisperx"
  mirrors:
    - localai/localai-backends:latest-cpu-whisperx
- !!merge <<: *whisperx
  name: "cpu-whisperx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-whisperx"
  mirrors:
    - localai/localai-backends:master-cpu-whisperx
- !!merge <<: *whisperx
  name: "cuda12-whisperx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-whisperx"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-whisperx
- !!merge <<: *whisperx
  name: "cuda12-whisperx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-whisperx"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-whisperx
- !!merge <<: *whisperx
  name: "rocm-whisperx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-whisperx"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-whisperx
- !!merge <<: *whisperx
  name: "rocm-whisperx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-whisperx"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-whisperx
- !!merge <<: *whisperx
  name: "cuda13-whisperx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-whisperx"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-whisperx
- !!merge <<: *whisperx
  name: "cuda13-whisperx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-whisperx"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-whisperx
- !!merge <<: *whisperx
  name: "metal-whisperx"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisperx"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-whisperx
- !!merge <<: *whisperx
  name: "metal-whisperx-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisperx"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-whisperx
## coqui

- !!merge <<: *coqui
  name: "coqui-development"
  capabilities:
    nvidia: "cuda12-coqui-development"
    intel: "intel-coqui-development"
    amd: "rocm-coqui-development"
    metal: "metal-coqui-development"
- !!merge <<: *coqui
  name: "cuda12-coqui"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-coqui"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-coqui
- !!merge <<: *coqui
  name: "cuda12-coqui-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-coqui"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-coqui
- !!merge <<: *coqui
  name: "rocm-coqui-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-coqui"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-coqui
- !!merge <<: *coqui
  name: "intel-coqui"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-coqui"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-coqui
- !!merge <<: *coqui
  name: "intel-coqui-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-coqui"
  mirrors:
    - localai/localai-backends:master-gpu-intel-coqui
- !!merge <<: *coqui
  name: "rocm-coqui"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-coqui"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-coqui
- !!merge <<: *coqui
  name: "metal-coqui"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-coqui"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-coqui
- !!merge <<: *coqui
  name: "metal-coqui-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-coqui"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-coqui
## outetts
- !!merge <<: *outetts
  name: "outetts-development"
  capabilities:
    default: "cpu-outetts-development"
    nvidia-cuda-12: "cuda12-outetts-development"
- !!merge <<: *outetts
  name: "cpu-outetts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-outetts"
  mirrors:
    - localai/localai-backends:latest-cpu-outetts
- !!merge <<: *outetts
  name: "cpu-outetts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-outetts"
  mirrors:
    - localai/localai-backends:master-cpu-outetts
- !!merge <<: *outetts
  name: "cuda12-outetts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-outetts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-outetts
- !!merge <<: *outetts
  name: "cuda12-outetts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-outetts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-outetts
## chatterbox
- !!merge <<: *chatterbox
  name: "chatterbox-development"
  capabilities:
    nvidia: "cuda12-chatterbox-development"
    metal: "metal-chatterbox-development"
    default: "cpu-chatterbox-development"
    nvidia-l4t: "nvidia-l4t-arm64-chatterbox"
    nvidia-cuda-13: "cuda13-chatterbox-development"
    nvidia-cuda-12: "cuda12-chatterbox-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-chatterbox"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-chatterbox-development"
- !!merge <<: *chatterbox
  name: "cpu-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-chatterbox"
  mirrors:
    - localai/localai-backends:latest-cpu-chatterbox
- !!merge <<: *chatterbox
  name: "cpu-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-chatterbox"
  mirrors:
    - localai/localai-backends:master-cpu-chatterbox
- !!merge <<: *chatterbox
  name: "nvidia-l4t-arm64-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-arm64-chatterbox
- !!merge <<: *chatterbox
  name: "nvidia-l4t-arm64-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-arm64-chatterbox
- !!merge <<: *chatterbox
  name: "metal-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-chatterbox
- !!merge <<: *chatterbox
  name: "metal-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-chatterbox
- !!merge <<: *chatterbox
  name: "cuda12-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-chatterbox"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-chatterbox
- !!merge <<: *chatterbox
  name: "cuda12-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-chatterbox"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-chatterbox
- !!merge <<: *chatterbox
  name: "cuda13-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-chatterbox"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-chatterbox
- !!merge <<: *chatterbox
  name: "cuda13-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-chatterbox"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-chatterbox
- !!merge <<: *chatterbox
  name: "cuda13-nvidia-l4t-arm64-chatterbox"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-chatterbox
- !!merge <<: *chatterbox
  name: "cuda13-nvidia-l4t-arm64-chatterbox-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-chatterbox"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-chatterbox
## vibevoice
- !!merge <<: *vibevoice
  name: "vibevoice-development"
  capabilities:
    nvidia: "cuda12-vibevoice-development"
    intel: "intel-vibevoice-development"
    amd: "rocm-vibevoice-development"
    nvidia-l4t: "nvidia-l4t-vibevoice-development"
    metal: "metal-vibevoice-development"
    default: "cpu-vibevoice-development"
    nvidia-cuda-13: "cuda13-vibevoice-development"
    nvidia-cuda-12: "cuda12-vibevoice-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-vibevoice-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-vibevoice-development"
- !!merge <<: *vibevoice
  name: "cpu-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-vibevoice"
  mirrors:
    - localai/localai-backends:latest-cpu-vibevoice
- !!merge <<: *vibevoice
  name: "cpu-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-vibevoice"
  mirrors:
    - localai/localai-backends:master-cpu-vibevoice
- !!merge <<: *vibevoice
  name: "cuda12-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vibevoice"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vibevoice
- !!merge <<: *vibevoice
  name: "cuda12-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vibevoice"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-vibevoice
- !!merge <<: *vibevoice
  name: "cuda13-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-vibevoice"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-vibevoice
- !!merge <<: *vibevoice
  name: "cuda13-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-vibevoice"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-vibevoice
- !!merge <<: *vibevoice
  name: "intel-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-vibevoice"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-vibevoice
- !!merge <<: *vibevoice
  name: "intel-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-vibevoice"
  mirrors:
    - localai/localai-backends:master-gpu-intel-vibevoice
- !!merge <<: *vibevoice
  name: "rocm-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vibevoice"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-vibevoice
- !!merge <<: *vibevoice
  name: "rocm-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vibevoice"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-vibevoice
- !!merge <<: *vibevoice
  name: "nvidia-l4t-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-vibevoice"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-vibevoice
- !!merge <<: *vibevoice
  name: "nvidia-l4t-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-vibevoice"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-vibevoice
- !!merge <<: *vibevoice
  name: "cuda13-nvidia-l4t-arm64-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-vibevoice"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-vibevoice
- !!merge <<: *vibevoice
  name: "cuda13-nvidia-l4t-arm64-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-vibevoice"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-vibevoice
- !!merge <<: *vibevoice
  name: "metal-vibevoice"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-vibevoice"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-vibevoice
- !!merge <<: *vibevoice
  name: "metal-vibevoice-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-vibevoice"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-vibevoice
## qwen-tts
- !!merge <<: *qwen-tts
  name: "qwen-tts-development"
  capabilities:
    nvidia: "cuda12-qwen-tts-development"
    intel: "intel-qwen-tts-development"
    amd: "rocm-qwen-tts-development"
    nvidia-l4t: "nvidia-l4t-qwen-tts-development"
    metal: "metal-qwen-tts-development"
    default: "cpu-qwen-tts-development"
    nvidia-cuda-13: "cuda13-qwen-tts-development"
    nvidia-cuda-12: "cuda12-qwen-tts-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-tts-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-tts-development"
- !!merge <<: *qwen-tts
  name: "cpu-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-cpu-qwen-tts
- !!merge <<: *qwen-tts
  name: "cpu-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-qwen-tts"
  mirrors:
    - localai/localai-backends:master-cpu-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda12-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda12-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-qwen-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda13-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda13-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-qwen-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-qwen-tts
- !!merge <<: *qwen-tts
  name: "intel-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-qwen-tts
- !!merge <<: *qwen-tts
  name: "intel-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-qwen-tts"
  mirrors:
    - localai/localai-backends:master-gpu-intel-qwen-tts
- !!merge <<: *qwen-tts
  name: "rocm-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-qwen-tts
- !!merge <<: *qwen-tts
  name: "rocm-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-qwen-tts"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-qwen-tts
- !!merge <<: *qwen-tts
  name: "nvidia-l4t-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-qwen-tts
- !!merge <<: *qwen-tts
  name: "nvidia-l4t-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-qwen-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda13-nvidia-l4t-arm64-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-tts
- !!merge <<: *qwen-tts
  name: "cuda13-nvidia-l4t-arm64-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-tts
- !!merge <<: *qwen-tts
  name: "metal-qwen-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-qwen-tts"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-qwen-tts
- !!merge <<: *qwen-tts
  name: "metal-qwen-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-qwen-tts"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-qwen-tts
## fish-speech
- !!merge <<: *fish-speech
  name: "fish-speech-development"
  capabilities:
    nvidia: "cuda12-fish-speech-development"
    intel: "intel-fish-speech-development"
    amd: "rocm-fish-speech-development"
    nvidia-l4t: "nvidia-l4t-fish-speech-development"
    metal: "metal-fish-speech-development"
    default: "cpu-fish-speech-development"
    nvidia-cuda-13: "cuda13-fish-speech-development"
    nvidia-cuda-12: "cuda12-fish-speech-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-fish-speech-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-fish-speech-development"
- !!merge <<: *fish-speech
  name: "cpu-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-fish-speech"
  mirrors:
    - localai/localai-backends:latest-cpu-fish-speech
- !!merge <<: *fish-speech
  name: "cpu-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-fish-speech"
  mirrors:
    - localai/localai-backends:master-cpu-fish-speech
- !!merge <<: *fish-speech
  name: "cuda12-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-fish-speech"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-fish-speech
- !!merge <<: *fish-speech
  name: "cuda12-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-fish-speech"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-fish-speech
- !!merge <<: *fish-speech
  name: "cuda13-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-fish-speech"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-fish-speech
- !!merge <<: *fish-speech
  name: "cuda13-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-fish-speech"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-fish-speech
- !!merge <<: *fish-speech
  name: "intel-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-fish-speech"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-fish-speech
- !!merge <<: *fish-speech
  name: "intel-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-fish-speech"
  mirrors:
    - localai/localai-backends:master-gpu-intel-fish-speech
- !!merge <<: *fish-speech
  name: "rocm-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-fish-speech"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-fish-speech
- !!merge <<: *fish-speech
  name: "rocm-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-fish-speech"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-fish-speech
- !!merge <<: *fish-speech
  name: "nvidia-l4t-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-fish-speech"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-fish-speech
- !!merge <<: *fish-speech
  name: "nvidia-l4t-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-fish-speech"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-fish-speech
- !!merge <<: *fish-speech
  name: "cuda13-nvidia-l4t-arm64-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-fish-speech"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-fish-speech
- !!merge <<: *fish-speech
  name: "cuda13-nvidia-l4t-arm64-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-fish-speech"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-fish-speech
- !!merge <<: *fish-speech
  name: "metal-fish-speech"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-fish-speech"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-fish-speech
- !!merge <<: *fish-speech
  name: "metal-fish-speech-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-fish-speech"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-fish-speech
## faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "faster-qwen3-tts-development"
  capabilities:
    nvidia: "cuda12-faster-qwen3-tts-development"
    default: "cuda12-faster-qwen3-tts-development"
    nvidia-cuda-13: "cuda13-faster-qwen3-tts-development"
    nvidia-cuda-12: "cuda12-faster-qwen3-tts-development"
    nvidia-l4t: "nvidia-l4t-faster-qwen3-tts-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-faster-qwen3-tts-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts-development"
- !!merge <<: *faster-qwen3-tts
  name: "cuda12-faster-qwen3-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "cuda12-faster-qwen3-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "cuda13-faster-qwen3-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "cuda13-faster-qwen3-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "nvidia-l4t-faster-qwen3-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "nvidia-l4t-faster-qwen3-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts
- !!merge <<: *faster-qwen3-tts
  name: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts
## qwen-asr
- !!merge <<: *qwen-asr
  name: "qwen-asr-development"
  capabilities:
    nvidia: "cuda12-qwen-asr-development"
    intel: "intel-qwen-asr-development"
    amd: "rocm-qwen-asr-development"
    nvidia-l4t: "nvidia-l4t-qwen-asr-development"
    metal: "metal-qwen-asr-development"
    default: "cpu-qwen-asr-development"
    nvidia-cuda-13: "cuda13-qwen-asr-development"
    nvidia-cuda-12: "cuda12-qwen-asr-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-asr-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-asr-development"
- !!merge <<: *qwen-asr
  name: "cpu-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-cpu-qwen-asr
- !!merge <<: *qwen-asr
  name: "cpu-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-qwen-asr"
  mirrors:
    - localai/localai-backends:master-cpu-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda12-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda12-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-qwen-asr"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda13-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda13-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-qwen-asr"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-qwen-asr
- !!merge <<: *qwen-asr
  name: "intel-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-qwen-asr
- !!merge <<: *qwen-asr
  name: "intel-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-qwen-asr"
  mirrors:
    - localai/localai-backends:master-gpu-intel-qwen-asr
- !!merge <<: *qwen-asr
  name: "rocm-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-qwen-asr
- !!merge <<: *qwen-asr
  name: "rocm-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-qwen-asr"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-qwen-asr
- !!merge <<: *qwen-asr
  name: "nvidia-l4t-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-qwen-asr
- !!merge <<: *qwen-asr
  name: "nvidia-l4t-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-qwen-asr"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda13-nvidia-l4t-arm64-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-asr
- !!merge <<: *qwen-asr
  name: "cuda13-nvidia-l4t-arm64-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-asr"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-asr
- !!merge <<: *qwen-asr
  name: "metal-qwen-asr"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-qwen-asr"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-qwen-asr
- !!merge <<: *qwen-asr
  name: "metal-qwen-asr-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-qwen-asr"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-qwen-asr
## nemo
- !!merge <<: *nemo
  name: "nemo-development"
  capabilities:
    nvidia: "cuda12-nemo-development"
    intel: "intel-nemo-development"
    amd: "rocm-nemo-development"
    metal: "metal-nemo-development"
    default: "cpu-nemo-development"
    nvidia-cuda-13: "cuda13-nemo-development"
    nvidia-cuda-12: "cuda12-nemo-development"
- !!merge <<: *nemo
  name: "cpu-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-nemo"
  mirrors:
    - localai/localai-backends:latest-cpu-nemo
- !!merge <<: *nemo
  name: "cpu-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-nemo"
  mirrors:
    - localai/localai-backends:master-cpu-nemo
- !!merge <<: *nemo
  name: "cuda12-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-nemo"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-nemo
- !!merge <<: *nemo
  name: "cuda12-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-nemo"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-nemo
- !!merge <<: *nemo
  name: "cuda13-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-nemo"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-nemo
- !!merge <<: *nemo
  name: "cuda13-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-nemo"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-nemo
- !!merge <<: *nemo
  name: "intel-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-nemo"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-nemo
- !!merge <<: *nemo
  name: "intel-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-nemo"
  mirrors:
    - localai/localai-backends:master-gpu-intel-nemo
- !!merge <<: *nemo
  name: "rocm-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-nemo"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-nemo
- !!merge <<: *nemo
  name: "rocm-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-nemo"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-nemo
- !!merge <<: *nemo
  name: "metal-nemo"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-nemo"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-nemo
- !!merge <<: *nemo
  name: "metal-nemo-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-nemo"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-nemo
## voxcpm
- !!merge <<: *voxcpm
  name: "voxcpm-development"
  capabilities:
    nvidia: "cuda12-voxcpm-development"
    intel: "intel-voxcpm-development"
    amd: "rocm-voxcpm-development"
    metal: "metal-voxcpm-development"
    default: "cpu-voxcpm-development"
    nvidia-cuda-13: "cuda13-voxcpm-development"
    nvidia-cuda-12: "cuda12-voxcpm-development"
- !!merge <<: *voxcpm
  name: "cpu-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-voxcpm"
  mirrors:
    - localai/localai-backends:latest-cpu-voxcpm
- !!merge <<: *voxcpm
  name: "cpu-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-voxcpm"
  mirrors:
    - localai/localai-backends:master-cpu-voxcpm
- !!merge <<: *voxcpm
  name: "cuda12-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-voxcpm"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-voxcpm
- !!merge <<: *voxcpm
  name: "cuda12-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-voxcpm"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-voxcpm
- !!merge <<: *voxcpm
  name: "cuda13-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-voxcpm"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-voxcpm
- !!merge <<: *voxcpm
  name: "cuda13-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-voxcpm"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-voxcpm
- !!merge <<: *voxcpm
  name: "intel-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-voxcpm"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-voxcpm
- !!merge <<: *voxcpm
  name: "intel-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-voxcpm"
  mirrors:
    - localai/localai-backends:master-gpu-intel-voxcpm
- !!merge <<: *voxcpm
  name: "rocm-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-voxcpm"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-voxcpm
- !!merge <<: *voxcpm
  name: "rocm-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-voxcpm"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-voxcpm
- !!merge <<: *voxcpm
  name: "metal-voxcpm"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-voxcpm"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-voxcpm
- !!merge <<: *voxcpm
  name: "metal-voxcpm-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-voxcpm"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-voxcpm
## pocket-tts
- !!merge <<: *pocket-tts
  name: "pocket-tts-development"
  capabilities:
    nvidia: "cuda12-pocket-tts-development"
    intel: "intel-pocket-tts-development"
    amd: "rocm-pocket-tts-development"
    nvidia-l4t: "nvidia-l4t-pocket-tts-development"
    metal: "metal-pocket-tts-development"
    default: "cpu-pocket-tts-development"
    nvidia-cuda-13: "cuda13-pocket-tts-development"
    nvidia-cuda-12: "cuda12-pocket-tts-development"
    nvidia-l4t-cuda-12: "nvidia-l4t-pocket-tts-development"
    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-pocket-tts-development"
- !!merge <<: *pocket-tts
  name: "cpu-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-cpu-pocket-tts
- !!merge <<: *pocket-tts
  name: "cpu-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-pocket-tts"
  mirrors:
    - localai/localai-backends:master-cpu-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda12-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-12-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda12-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-pocket-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-12-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda13-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-nvidia-cuda-13-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda13-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-pocket-tts"
  mirrors:
    - localai/localai-backends:master-gpu-nvidia-cuda-13-pocket-tts
- !!merge <<: *pocket-tts
  name: "intel-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-intel-pocket-tts
- !!merge <<: *pocket-tts
  name: "intel-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-pocket-tts"
  mirrors:
    - localai/localai-backends:master-gpu-intel-pocket-tts
- !!merge <<: *pocket-tts
  name: "rocm-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-gpu-rocm-hipblas-pocket-tts
- !!merge <<: *pocket-tts
  name: "rocm-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-pocket-tts"
  mirrors:
    - localai/localai-backends:master-gpu-rocm-hipblas-pocket-tts
- !!merge <<: *pocket-tts
  name: "nvidia-l4t-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-pocket-tts
- !!merge <<: *pocket-tts
  name: "nvidia-l4t-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-pocket-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda13-nvidia-l4t-arm64-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-pocket-tts
- !!merge <<: *pocket-tts
  name: "cuda13-nvidia-l4t-arm64-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-pocket-tts"
  mirrors:
    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-pocket-tts
- !!merge <<: *pocket-tts
  name: "metal-pocket-tts"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-pocket-tts"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-pocket-tts
- !!merge <<: *pocket-tts
  name: "metal-pocket-tts-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-pocket-tts"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-pocket-tts
## voxtral
- !!merge <<: *voxtral
  name: "cpu-voxtral"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-voxtral"
  mirrors:
    - localai/localai-backends:latest-cpu-voxtral
- !!merge <<: *voxtral
  name: "cpu-voxtral-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-voxtral"
  mirrors:
    - localai/localai-backends:master-cpu-voxtral
- !!merge <<: *voxtral
  name: "metal-voxtral"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-voxtral"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-voxtral
- !!merge <<: *voxtral
  name: "metal-voxtral-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-voxtral"
  mirrors:
    - localai/localai-backends:master-metal-darwin-arm64-voxtral
- &trl
  name: "trl"
  alias: "trl"
  license: apache-2.0
  description: |
    HuggingFace TRL fine-tuning backend. Supports SFT, DPO, GRPO, RLOO, Reward, KTO, ORPO training methods.
    Works on CPU and GPU.
  urls:
    - https://github.com/huggingface/trl
  tags:
    - fine-tuning
    - LLM
    - CPU
    - GPU
    - CUDA
  capabilities:
    default: "cpu-trl"
    nvidia: "cuda12-trl"
    nvidia-cuda-12: "cuda12-trl"
    nvidia-cuda-13: "cuda13-trl"
## TRL backend images
- !!merge <<: *trl
  name: "cpu-trl"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-trl"
  mirrors:
    - localai/localai-backends:latest-cpu-trl
- !!merge <<: *trl
  name: "cpu-trl-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-trl"
  mirrors:
    - localai/localai-backends:master-cpu-trl
- !!merge <<: *trl
  name: "cuda12-trl"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cublas-cuda12-trl"
  mirrors:
    - localai/localai-backends:latest-cublas-cuda12-trl
- !!merge <<: *trl
  name: "cuda12-trl-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cublas-cuda12-trl"
  mirrors:
    - localai/localai-backends:master-cublas-cuda12-trl
- !!merge <<: *trl
  name: "cuda13-trl"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cublas-cuda13-trl"
  mirrors:
    - localai/localai-backends:latest-cublas-cuda13-trl
- !!merge <<: *trl
  name: "cuda13-trl-development"
  uri: "quay.io/go-skynet/local-ai-backends:master-cublas-cuda13-trl"
  mirrors:
    - localai/localai-backends:master-cublas-cuda13-trl
## llama.cpp quantization backend
- &llama-cpp-quantization
  name: "llama-cpp-quantization"
  alias: "llama-cpp-quantization"
  license: mit
  icon: https://user-images.githubusercontent.com/1991296/230134379-7181e485-c521-4d23-a0d6-f7b3b61ba524.png
  description: |
    Model quantization backend using llama.cpp. Downloads HuggingFace models, converts them to GGUF format,
    and quantizes them to various formats (q4_k_m, q5_k_m, q8_0, f16, etc.).
  urls:
    - https://github.com/ggml-org/llama.cpp
  tags:
    - quantization
    - GGUF
    - CPU
  capabilities:
    default: "cpu-llama-cpp-quantization"
    metal: "metal-darwin-arm64-llama-cpp-quantization"
- !!merge <<: *llama-cpp-quantization
  name: "cpu-llama-cpp-quantization"
  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-llama-cpp-quantization"
  mirrors:
    - localai/localai-backends:latest-cpu-llama-cpp-quantization
- !!merge <<: *llama-cpp-quantization
  name: "metal-darwin-arm64-llama-cpp-quantization"
  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-llama-cpp-quantization"
  mirrors:
    - localai/localai-backends:latest-metal-darwin-arm64-llama-cpp-quantization
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								---
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								## metas
 								- &llamacpp
 								  name: "llama-cpp"
 								  alias: "llama-cpp"
 								  license: mit
 								  icon: https://user-images.githubusercontent.com/1991296/230134379-7181e485-c521-4d23-a0d6-f7b3b61ba524.png
 								  description: |
 								    LLM inference in C/C++
 								  urls:
 								    - https://github.com/ggerganov/llama.cpp
 								  tags:
 								    - text-to-text
 								    - LLM
 								    - CPU
 								    - GPU
 								    - Metal
 								    - CUDA
 								    - HIP
 								  capabilities:
 								    default: "cpu-llama-cpp"
 								    nvidia: "cuda12-llama-cpp"
 								    intel: "intel-sycl-f16-llama-cpp"
 								    amd: "rocm-llama-cpp"
 								    metal: "metal-llama-cpp"
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								    vulkan: "vulkan-llama-cpp"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    nvidia-l4t: "nvidia-l4t-arm64-llama-cpp"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-llama-cpp"
 								    nvidia-cuda-12: "cuda12-llama-cpp"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-llama-cpp"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-llama-cpp"
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								- &whispercpp
 								  name: "whisper"
 								  alias: "whisper"
 								  license: mit
 								  icon: https://user-images.githubusercontent.com/1991296/235238348-05d0f6a4-da44-4900-a1de-d0707e75b763.jpeg
 								  description: |
 								    Port of OpenAI's Whisper model in C/C++
 								  urls:
 								    - https://github.com/ggml-org/whisper.cpp
 								  tags:
 								    - audio-transcription
 								    - CPU
 								    - GPU
 								    - CUDA
 								    - HIP
 								  capabilities:
 								    default: "cpu-whisper"
 								    nvidia: "cuda12-whisper"
 								    intel: "intel-sycl-f16-whisper"
-												chore(backends): add stablediffusion-ggml and whisper for metal (#6173)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-01 20:30:35 +00:00
+								    metal: "metal-whisper"
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								    amd: "rocm-whisper"
 								    vulkan: "vulkan-whisper"
 								    nvidia-l4t: "nvidia-l4t-arm64-whisper"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-whisper"
 								    nvidia-cuda-12: "cuda12-whisper"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-whisper"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-whisper"
-												feat(voxtral): add voxtral backend (#8451)

* feat(voxtral): add voxtral backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-09 08:12:05 +00:00
+								- &voxtral
 								  name: "voxtral"
 								  alias: "voxtral"
 								  license: mit
 								  description: |
 								    Voxtral Realtime 4B Pure C speech-to-text inference engine
 								  urls:
 								    - https://github.com/mudler/voxtral.c
 								  tags:
 								    - audio-transcription
 								    - CPU
 								    - Metal
 								  capabilities:
 								    default: "cpu-voxtral"
 								    metal-darwin-arm64: "metal-voxtral"
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- &stablediffusionggml
 								  name: "stablediffusion-ggml"
 								  alias: "stablediffusion-ggml"
 								  license: mit
 								  icon: https://github.com/leejet/stable-diffusion.cpp/raw/master/assets/cat_with_sd_cpp_42.png
 								  description: |
 								     Stable Diffusion and Flux in pure C/C++
 								  urls:
 								    - https://github.com/leejet/stable-diffusion.cpp
 								  tags:
 								    - image-generation
 								    - CPU
 								    - GPU
 								    - Metal
 								    - CUDA
 								    - HIP
 								  capabilities:
 								    default: "cpu-stablediffusion-ggml"
 								    nvidia: "cuda12-stablediffusion-ggml"
 								    intel: "intel-sycl-f16-stablediffusion-ggml"
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								    # amd: "rocm-stablediffusion-ggml"
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								    vulkan: "vulkan-stablediffusion-ggml"
 								    nvidia-l4t: "nvidia-l4t-arm64-stablediffusion-ggml"
-												chore(backends): add stablediffusion-ggml and whisper for metal (#6173)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-01 20:30:35 +00:00
+								    metal: "metal-stablediffusion-ggml"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-stablediffusion-ggml"
 								    nvidia-cuda-12: "cuda12-stablediffusion-ggml"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-stablediffusion-ggml"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml"
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								- &rfdetr
 								  name: "rfdetr"
 								  alias: "rfdetr"
 								  license: apache-2.0
 								  icon: https://avatars.githubusercontent.com/u/53104118?s=200&v=4
 								  description: |
 								    RF-DETR is a real-time, transformer-based object detection model architecture developed by Roboflow and released under the Apache 2.0 license.
 								    RF-DETR is the first real-time model to exceed 60 AP on the Microsoft COCO benchmark alongside competitive performance at base sizes. It also achieves state-of-the-art performance on RF100-VL, an object detection benchmark that measures model domain adaptability to real world problems. RF-DETR is fastest and most accurate for its size when compared current real-time objection models.
 								    RF-DETR is small enough to run on the edge using Inference, making it an ideal model for deployments that need both strong accuracy and real-time performance.
 								  urls:
 								    - https://github.com/roboflow/rf-detr
 								  tags:
 								    - object-detection
 								    - rfdetr
 								    - gpu
 								    - cpu
 								  capabilities:
 								    nvidia: "cuda12-rfdetr"
 								    intel: "intel-rfdetr"
 								    #amd: "rocm-rfdetr"
 								    nvidia-l4t: "nvidia-l4t-arm64-rfdetr"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-rfdetr"
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								    default: "cpu-rfdetr"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-rfdetr"
 								    nvidia-cuda-12: "cuda12-rfdetr"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-rfdetr"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- &vllm
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								  name: "vllm"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  license: apache-2.0
 								  urls:
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								    - https://github.com/vllm-project/vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  tags:
 								    - text-to-text
 								    - multimodal
 								    - GPTQ
 								    - AWQ
 								    - AutoRound
 								    - INT4
 								    - INT8
 								    - FP8
 								  icon: https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-dark.png
 								  description: |
 								    vLLM is a fast and easy-to-use library for LLM inference and serving.
 								    Originally developed in the Sky Computing Lab at UC Berkeley, vLLM has evolved into a community-driven project with contributions from both academia and industry.
 								    vLLM is fast with:
 								        State-of-the-art serving throughput
 								        Efficient management of attention key and value memory with PagedAttention
 								        Continuous batching of incoming requests
 								        Fast model execution with CUDA/HIP graph
 								        Quantizations: GPTQ, AWQ, AutoRound, INT4, INT8, and FP8
 								        Optimized CUDA kernels, including integration with FlashAttention and FlashInfer
 								        Speculative decoding
 								        Chunked prefill
 								  alias: "vllm"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								  capabilities:
 								    nvidia: "cuda12-vllm"
 								    amd: "rocm-vllm"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-vllm"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-12: "cuda12-vllm"
-												feat(vllm-omni): add new backend (#8188)

* feat(vllm-omni: add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* default to py3.12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-24 21:23:30 +00:00
+								- &vllm-omni
 								  name: "vllm-omni"
 								  license: apache-2.0
 								  urls:
 								    - https://github.com/vllm-project/vllm-omni
 								  tags:
 								    - text-to-image
 								    - image-generation
 								    - text-to-video
 								    - video-generation
 								    - text-to-speech
 								    - TTS
 								    - multimodal
 								    - LLM
 								  icon: https://raw.githubusercontent.com/vllm-project/vllm/main/docs/assets/logos/vllm-logo-text-dark.png
 								  description: |
 								    vLLM-Omni is a unified interface for multimodal generation with vLLM.
 								    It supports image generation (text-to-image, image editing), video generation
 								    (text-to-video, image-to-video), text generation with multimodal inputs, and
 								    text-to-speech generation. Only supports NVIDIA (CUDA) and ROCm platforms.
 								  alias: "vllm-omni"
 								  capabilities:
 								    nvidia: "cuda12-vllm-omni"
 								    amd: "rocm-vllm-omni"
 								    nvidia-cuda-12: "cuda12-vllm-omni"
-												feat(mlx): add mlx backend (#6049)

* chore: allow to install with pip

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make the backend to build and actually work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* List models from system only

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add script to build darwin python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Run protogen in libbackend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Detect if mps is available across python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI: try to build backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Index mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop CI test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-22 06:42:29 +00:00
+								- &mlx
 								  name: "mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx"
 								  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
 								  urls:
 								    - https://github.com/ml-explore/mlx-lm
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-mlx
 								  license: MIT
 								  description: |
 								      Run LLMs with MLX
 								  tags:
 								    - text-to-text
 								    - LLM
 								    - MLX
-												feat(mlx): Add support for CUDA12, CUDA13, L4T, SBSA and CPU (#8380)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 22:53:34 +00:00
+								  capabilities:
 								    default: "cpu-mlx"
 								    nvidia: "cuda12-mlx"
 								    metal: "metal-mlx"
 								    nvidia-cuda-12: "cuda12-mlx"
 								    nvidia-cuda-13: "cuda13-mlx"
 								    nvidia-l4t: "nvidia-l4t-mlx"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-mlx"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx"
-												Add mlx-vlm (#6119)

* Add mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to CI workflows

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add requirements-mps.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-23 21:05:30 +00:00
+								- &mlx-vlm
 								  name: "mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-vlm"
 								  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
 								  urls:
-												chore(docs): update list of supported backends (#6134)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-24 18:09:19 +00:00
+								    - https://github.com/Blaizzy/mlx-vlm
-												Add mlx-vlm (#6119)

* Add mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to CI workflows

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add requirements-mps.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-23 21:05:30 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-mlx-vlm
 								  license: MIT
 								  description: |
 								      Run Vision-Language Models with MLX
 								  tags:
 								    - text-to-text
 								    - multimodal
 								    - vision-language
 								    - LLM
 								    - MLX
-												feat(mlx): Add support for CUDA12, CUDA13, L4T, SBSA and CPU (#8380)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 22:53:34 +00:00
+								  capabilities:
 								    default: "cpu-mlx-vlm"
 								    nvidia: "cuda12-mlx-vlm"
 								    metal: "metal-mlx-vlm"
 								    nvidia-cuda-12: "cuda12-mlx-vlm"
 								    nvidia-cuda-13: "cuda13-mlx-vlm"
 								    nvidia-l4t: "nvidia-l4t-mlx-vlm"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-vlm"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-vlm"
-												feat(mlx-audio): Add mlx-audio backend (#6138)

* feat(mlx-audio): Add mlx-audio backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* improve loading

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: set C_INCLUDE_PATH to point to python install

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-26 13:27:06 +00:00
+								- &mlx-audio
 								  name: "mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-audio"
 								  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
 								  urls:
 								    - https://github.com/Blaizzy/mlx-audio
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-mlx-audio
 								  license: MIT
 								  description: |
 								      Run Audio Models with MLX
 								  tags:
 								    - audio-to-text
 								    - audio-generation
 								    - text-to-audio
 								    - LLM
 								    - MLX
-												feat(mlx): Add support for CUDA12, CUDA13, L4T, SBSA and CPU (#8380)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 22:53:34 +00:00
+								  capabilities:
 								    default: "cpu-mlx-audio"
 								    nvidia: "cuda12-mlx-audio"
 								    metal: "metal-mlx-audio"
 								    nvidia-cuda-12: "cuda12-mlx-audio"
 								    nvidia-cuda-13: "cuda13-mlx-audio"
 								    nvidia-l4t: "nvidia-l4t-mlx-audio"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-audio"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-audio"
-												feat(mlx-distributed): add new MLX-distributed backend (#8801)

* feat(mlx-distributed): add new MLX-distributed backend

Add new MLX distributed backend with support for both TCP and RDMA for
model sharding.

This implementation ties in the discovery implementation already in
place, and re-uses the same P2P mechanism for the TCP MLX-distributed
inferencing.

The Auto-parallel implementation is inspired by Exo's
ones (who have been added to acknowledgement for the great work!)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* expose a CLI to facilitate backend starting

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: make manual rank0 configurable via model configs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing features from mlx backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2026-03-09 16:29:32 +00:00
+								- &mlx-distributed
 								  name: "mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-mlx-distributed"
 								  icon: https://avatars.githubusercontent.com/u/102832242?s=200&v=4
 								  urls:
 								    - https://github.com/ml-explore/mlx-lm
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-mlx-distributed
 								  license: MIT
 								  description: |
 								      Run distributed LLM inference with MLX across multiple Apple Silicon Macs
 								  tags:
 								    - text-to-text
 								    - LLM
 								    - MLX
 								    - distributed
 								  capabilities:
 								    default: "cpu-mlx-distributed"
 								    nvidia: "cuda12-mlx-distributed"
 								    metal: "metal-mlx-distributed"
 								    nvidia-cuda-12: "cuda12-mlx-distributed"
 								    nvidia-cuda-13: "cuda13-mlx-distributed"
 								    nvidia-l4t: "nvidia-l4t-mlx-distributed"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-mlx-distributed"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-mlx-distributed"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &rerankers
 								  name: "rerankers"
 								  alias: "rerankers"
 								  capabilities:
 								    nvidia: "cuda12-rerankers"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-rerankers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-rerankers"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-rerankers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &transformers
 								  name: "transformers"
-												chore: fix backend icons

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2026-01-28 08:09:00 +00:00
+								  icon: https://avatars.githubusercontent.com/u/25720743?s=200&v=4
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								  alias: "transformers"
 								  license: apache-2.0
 								  description: |
 								    Transformers acts as the model-definition framework for state-of-the-art machine learning models in text, computer vision, audio, video, and multimodal model, for both inference and training.
 								    It centralizes the model definition so that this definition is agreed upon across the ecosystem. transformers is the pivot across frameworks: if a model definition is supported, it will be compatible with the majority of training frameworks (Axolotl, Unsloth, DeepSpeed, FSDP, PyTorch-Lightning, ...), inference engines (vLLM, SGLang, TGI, ...), and adjacent modeling libraries (llama.cpp, mlx, ...) which leverage the model definition from transformers.
 								  urls:
 								    - https://github.com/huggingface/transformers
 								  tags:
 								    - text-to-text
 								    - multimodal
 								  capabilities:
 								    nvidia: "cuda12-transformers"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-transformers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-transformers"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-transformers"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-transformers"
 								    nvidia-cuda-12: "cuda12-transformers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &diffusers
-												chore(backend gallery): add name to 'diffusers' meta

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-07-23 07:20:59 +00:00
+								  name: "diffusers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								  icon: https://raw.githubusercontent.com/huggingface/diffusers/main/docs/source/en/imgs/diffusers_library.jpg
 								  description: |
 								    🤗 Diffusers is the go-to library for state-of-the-art pretrained diffusion models for generating images, audio, and even 3D structures of molecules. Whether you're looking for a simple inference solution or training your own diffusion models, 🤗 Diffusers is a modular toolbox that supports both.
 								  urls:
 								    - https://github.com/huggingface/diffusers
 								  tags:
 								    - image-generation
 								    - video-generation
 								    - diffusion-models
 								  license: apache-2.0
 								  alias: "diffusers"
 								  capabilities:
 								    nvidia: "cuda12-diffusers"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-diffusers"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-diffusers"
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								    nvidia-l4t: "nvidia-l4t-diffusers"
-												feat(diffusers): add MPS version (#6121)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-22 21:14:54 +00:00
+								    metal: "metal-diffusers"
-												feat(backends): add CPU variant for diffusers backend (#6128)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-24 08:17:10 +00:00
+								    default: "cpu-diffusers"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-diffusers"
 								    nvidia-cuda-12: "cuda12-diffusers"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-diffusers"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-diffusers"
-												feat(musicgen): add ace-step and UI interface (#8396)

* feat(musicgen): add ace-step and UI interface

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly handle model dir

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop auto-download

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to models, fixup UIs icons

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* l4t13 is incompatbile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* avoid pinning version for cuda12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop l4t12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-05 11:04:53 +00:00
+								- &ace-step
 								  name: "ace-step"
 								  description: |
 								    ACE-Step 1.5 is an open-source music generation model. It supports simple mode (natural language description) and advanced mode (caption, lyrics, think, bpm, keyscale, etc.). Uses in-process acestep (LLMHandler for metadata, DiT for audio).
 								  urls:
 								    - https://github.com/ace-step/ACE-Step-1.5
 								  tags:
 								    - music-generation
 								    - sound-generation
 								  alias: "ace-step"
 								  capabilities:
 								    nvidia: "cuda12-ace-step"
 								    intel: "intel-ace-step"
 								    amd: "rocm-ace-step"
 								    metal: "metal-ace-step"
 								    default: "cpu-ace-step"
 								    nvidia-cuda-13: "cuda13-ace-step"
 								    nvidia-cuda-12: "cuda12-ace-step"
 								- !!merge <<: *ace-step
 								  name: "ace-step-development"
 								  capabilities:
 								    nvidia: "cuda12-ace-step-development"
 								    intel: "intel-ace-step-development"
 								    amd: "rocm-ace-step-development"
 								    metal: "metal-ace-step-development"
 								    default: "cpu-ace-step-development"
 								    nvidia-cuda-13: "cuda13-ace-step-development"
 								    nvidia-cuda-12: "cuda12-ace-step-development"
-												feat(backends): add ace-step.cpp (#8965)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-12 17:56:26 +00:00
+								- &acestepcpp
 								  name: "acestep-cpp"
 								  description: |
 								    ACE-Step 1.5 C++ backend using GGML. Native C++ implementation of ACE-Step music generation with GPU support through GGML backends.
 								    Generates stereo 48kHz audio from text descriptions and optional lyrics via a two-stage pipeline: text-to-code (ace-qwen3 LLM) + code-to-audio (DiT-VAE).
 								  urls:
 								    - https://github.com/ace-step/acestep.cpp
 								  tags:
 								    - music-generation
 								    - sound-generation
 								  alias: "acestep-cpp"
 								  capabilities:
 								    default: "cpu-acestep-cpp"
 								    nvidia: "cuda12-acestep-cpp"
 								    nvidia-cuda-13: "cuda13-acestep-cpp"
 								    nvidia-cuda-12: "cuda12-acestep-cpp"
 								    intel: "intel-sycl-f16-acestep-cpp"
 								    metal: "metal-acestep-cpp"
 								    amd: "rocm-acestep-cpp"
 								    vulkan: "vulkan-acestep-cpp"
 								    nvidia-l4t: "nvidia-l4t-arm64-acestep-cpp"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-acestep-cpp"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-acestep-cpp"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &faster-whisper
 								  icon: https://avatars.githubusercontent.com/u/1520500?s=200&v=4
 								  description: |
 								    faster-whisper is a reimplementation of OpenAI's Whisper model using CTranslate2, which is a fast inference engine for Transformer models.
 								    This implementation is up to 4 times faster than openai/whisper for the same accuracy while using less memory. The efficiency can be further improved with 8-bit quantization on both CPU and GPU.
 								  urls:
 								    - https://github.com/SYSTRAN/faster-whisper
 								  tags:
 								    - speech-to-text
 								    - Whisper
 								  license: MIT
 								  name: "faster-whisper"
 								  capabilities:
 								    nvidia: "cuda12-faster-whisper"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-faster-whisper"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-faster-whisper"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-faster-whisper"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-faster-whisper"
 								    nvidia-cuda-12: "cuda12-faster-whisper"
-												feat(backends): add moonshine backend for faster transcription (#7833)

* feat(backends): add moonshine backend for faster transcription

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend to CI, update AGENTS.md from this exercise

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-07 20:44:35 +00:00
+								- &moonshine
 								  description: |
 								    Moonshine is a fast, accurate, and efficient speech-to-text transcription model using ONNX Runtime.
 								    It provides real-time transcription capabilities with support for multiple model sizes and GPU acceleration.
 								  urls:
 								    - https://github.com/moonshine-ai/moonshine
 								  tags:
 								    - speech-to-text
 								    - transcription
 								    - ONNX
 								  license: MIT
 								  name: "moonshine"
 								  alias: "moonshine"
 								  capabilities:
 								    nvidia: "cuda12-moonshine"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-moonshine"
-												feat(backends): add moonshine backend for faster transcription (#7833)

* feat(backends): add moonshine backend for faster transcription

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend to CI, update AGENTS.md from this exercise

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-07 20:44:35 +00:00
+								    default: "cpu-moonshine"
 								    nvidia-cuda-13: "cuda13-moonshine"
 								    nvidia-cuda-12: "cuda12-moonshine"
-												feat(whisperx): add whisperx backend for transcription with speaker diarization (#8299)

* feat(proto): add speaker field to TranscriptSegment for diarization

Add speaker field to the gRPC TranscriptSegment message and map it
through the Go schema, enabling backends to return speaker labels.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx backend for transcription with diarization

Add Python gRPC backend using WhisperX for speech-to-text with
word-level timestamps, forced alignment, and speaker diarization
via pyannote-audio when HF_TOKEN is provided.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): register whisperx backend in Makefile

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx meta and image entries to index.yaml

Signed-off-by: eureka928 <meobius123@gmail.com>

* ci(whisperx): add build matrix entries for CPU, CUDA 12/13, and ROCm

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): unpin torch versions and use CPU index for cpu requirements

Address review feedback:
- Use --extra-index-url for CPU torch wheels to reduce size
- Remove torch version pins, let uv resolve compatible versions

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch ROCm variant to fix CI build failure

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch CPU variant to fix uv resolution failure

Pin torch==2.8.0+cpu so uv resolves the CPU wheel from the extra
index instead of picking torch==2.8.0+cu128 from PyPI, which pulls
unresolvable CUDA dependencies.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): use unsafe-best-match index strategy to fix uv resolution failure

uv's default first-match strategy finds torch on PyPI before checking
the extra index, causing it to pick torch==2.8.0+cu128 instead of the
CPU variant. This makes whisperx's transitive torch dependency
unresolvable. Using unsafe-best-match lets uv consider all indexes.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): drop +cpu local version suffix to fix uv resolution failure

PEP 440 ==2.8.0 matches 2.8.0+cpu from the extra index, avoiding the
issue where uv cannot locate an explicit +cpu local version specifier.
This aligns with the pattern used by all other CPU backends.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(backends): drop +rocm local version suffixes from hipblas requirements to fix uv resolution

uv cannot resolve PEP 440 local version specifiers (e.g. +rocm6.4,
+rocm6.3) in pinned requirements. The --extra-index-url already points
to the correct ROCm wheel index and --index-strategy unsafe-best-match
(set in libbackend.sh) ensures the ROCm variant is preferred.

Applies the same fix as 7f5d72e8 (which resolved this for +cpu) across
all 14 hipblas requirements files.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

* revert: scope hipblas suffix fix to whisperx only

Reverts changes to non-whisperx hipblas requirements files per
maintainer review — other backends are building fine with the +rocm
local version suffix.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

---------

Signed-off-by: eureka928 <meobius123@gmail.com>
Co-authored-by: Claude Opus 4.5 <noreply@anthropic.com>
											
										
										
											2026-02-02 15:33:12 +00:00
+								- &whisperx
 								  description: |
 								    WhisperX provides fast automatic speech recognition with word-level timestamps, speaker diarization,
 								    and forced alignment. Built on faster-whisper and pyannote-audio for high-accuracy transcription
 								    with speaker identification.
 								  urls:
 								    - https://github.com/m-bain/whisperX
 								  tags:
 								    - speech-to-text
 								    - diarization
 								    - whisperx
 								  license: BSD-4-Clause
 								  name: "whisperx"
-												fix(whisperx): add alias

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2026-04-08 14:40:08 +00:00
+								  alias: "whisperx"
-												feat(whisperx): add whisperx backend for transcription with speaker diarization (#8299)

* feat(proto): add speaker field to TranscriptSegment for diarization

Add speaker field to the gRPC TranscriptSegment message and map it
through the Go schema, enabling backends to return speaker labels.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx backend for transcription with diarization

Add Python gRPC backend using WhisperX for speech-to-text with
word-level timestamps, forced alignment, and speaker diarization
via pyannote-audio when HF_TOKEN is provided.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): register whisperx backend in Makefile

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx meta and image entries to index.yaml

Signed-off-by: eureka928 <meobius123@gmail.com>

* ci(whisperx): add build matrix entries for CPU, CUDA 12/13, and ROCm

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): unpin torch versions and use CPU index for cpu requirements

Address review feedback:
- Use --extra-index-url for CPU torch wheels to reduce size
- Remove torch version pins, let uv resolve compatible versions

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch ROCm variant to fix CI build failure

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch CPU variant to fix uv resolution failure

Pin torch==2.8.0+cpu so uv resolves the CPU wheel from the extra
index instead of picking torch==2.8.0+cu128 from PyPI, which pulls
unresolvable CUDA dependencies.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): use unsafe-best-match index strategy to fix uv resolution failure

uv's default first-match strategy finds torch on PyPI before checking
the extra index, causing it to pick torch==2.8.0+cu128 instead of the
CPU variant. This makes whisperx's transitive torch dependency
unresolvable. Using unsafe-best-match lets uv consider all indexes.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): drop +cpu local version suffix to fix uv resolution failure

PEP 440 ==2.8.0 matches 2.8.0+cpu from the extra index, avoiding the
issue where uv cannot locate an explicit +cpu local version specifier.
This aligns with the pattern used by all other CPU backends.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(backends): drop +rocm local version suffixes from hipblas requirements to fix uv resolution

uv cannot resolve PEP 440 local version specifiers (e.g. +rocm6.4,
+rocm6.3) in pinned requirements. The --extra-index-url already points
to the correct ROCm wheel index and --index-strategy unsafe-best-match
(set in libbackend.sh) ensures the ROCm variant is preferred.

Applies the same fix as 7f5d72e8 (which resolved this for +cpu) across
all 14 hipblas requirements files.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

* revert: scope hipblas suffix fix to whisperx only

Reverts changes to non-whisperx hipblas requirements files per
maintainer review — other backends are building fine with the +rocm
local version suffix.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

---------

Signed-off-by: eureka928 <meobius123@gmail.com>
Co-authored-by: Claude Opus 4.5 <noreply@anthropic.com>
											
										
										
											2026-02-02 15:33:12 +00:00
+								  capabilities:
 								    nvidia: "cuda12-whisperx"
 								    amd: "rocm-whisperx"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-whisperx"
-												feat(whisperx): add whisperx backend for transcription with speaker diarization (#8299)

* feat(proto): add speaker field to TranscriptSegment for diarization

Add speaker field to the gRPC TranscriptSegment message and map it
through the Go schema, enabling backends to return speaker labels.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx backend for transcription with diarization

Add Python gRPC backend using WhisperX for speech-to-text with
word-level timestamps, forced alignment, and speaker diarization
via pyannote-audio when HF_TOKEN is provided.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): register whisperx backend in Makefile

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx meta and image entries to index.yaml

Signed-off-by: eureka928 <meobius123@gmail.com>

* ci(whisperx): add build matrix entries for CPU, CUDA 12/13, and ROCm

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): unpin torch versions and use CPU index for cpu requirements

Address review feedback:
- Use --extra-index-url for CPU torch wheels to reduce size
- Remove torch version pins, let uv resolve compatible versions

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch ROCm variant to fix CI build failure

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch CPU variant to fix uv resolution failure

Pin torch==2.8.0+cpu so uv resolves the CPU wheel from the extra
index instead of picking torch==2.8.0+cu128 from PyPI, which pulls
unresolvable CUDA dependencies.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): use unsafe-best-match index strategy to fix uv resolution failure

uv's default first-match strategy finds torch on PyPI before checking
the extra index, causing it to pick torch==2.8.0+cu128 instead of the
CPU variant. This makes whisperx's transitive torch dependency
unresolvable. Using unsafe-best-match lets uv consider all indexes.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): drop +cpu local version suffix to fix uv resolution failure

PEP 440 ==2.8.0 matches 2.8.0+cpu from the extra index, avoiding the
issue where uv cannot locate an explicit +cpu local version specifier.
This aligns with the pattern used by all other CPU backends.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(backends): drop +rocm local version suffixes from hipblas requirements to fix uv resolution

uv cannot resolve PEP 440 local version specifiers (e.g. +rocm6.4,
+rocm6.3) in pinned requirements. The --extra-index-url already points
to the correct ROCm wheel index and --index-strategy unsafe-best-match
(set in libbackend.sh) ensures the ROCm variant is preferred.

Applies the same fix as 7f5d72e8 (which resolved this for +cpu) across
all 14 hipblas requirements files.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

* revert: scope hipblas suffix fix to whisperx only

Reverts changes to non-whisperx hipblas requirements files per
maintainer review — other backends are building fine with the +rocm
local version suffix.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

---------

Signed-off-by: eureka928 <meobius123@gmail.com>
Co-authored-by: Claude Opus 4.5 <noreply@anthropic.com>
											
										
										
											2026-02-02 15:33:12 +00:00
+								    default: "cpu-whisperx"
 								    nvidia-cuda-13: "cuda13-whisperx"
 								    nvidia-cuda-12: "cuda12-whisperx"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &kokoro
 								  icon: https://avatars.githubusercontent.com/u/166769057?v=4
 								  description: |
 								    Kokoro is an open-weight TTS model with 82 million parameters. Despite its lightweight architecture, it delivers comparable quality to larger models while being significantly faster and more cost-efficient. With Apache-licensed weights, Kokoro can be deployed anywhere from production environments to personal projects.
 								  urls:
 								    - https://huggingface.co/hexgrad/Kokoro-82M
 								    - https://github.com/hexgrad/kokoro
 								  tags:
 								    - text-to-speech
 								    - TTS
 								    - LLM
 								  license: apache-2.0
 								  alias: "kokoro"
 								  name: "kokoro"
 								  capabilities:
 								    nvidia: "cuda12-kokoro"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-kokoro"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-kokoro"
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								    nvidia-l4t: "nvidia-l4t-kokoro"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-kokoro"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-kokoro"
 								    nvidia-cuda-12: "cuda12-kokoro"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-kokoro"
-												feat: Add Kokoros backend (#9212)

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-04-08 17:23:16 +00:00
+								- &kokoros
 								  icon: https://avatars.githubusercontent.com/u/166769057?v=4
 								  description: |
 								    Kokoros is a pure Rust TTS backend using the Kokoro ONNX model (82M parameters).
 								    It provides fast, high-quality text-to-speech with streaming support, built on
 								    ONNX Runtime for efficient CPU inference. Supports English, Japanese, Mandarin
 								    Chinese, and German.
 								  urls:
 								    - https://huggingface.co/hexgrad/Kokoro-82M
 								    - https://github.com/lucasjinreal/Kokoros
 								  tags:
 								    - text-to-speech
 								    - TTS
 								    - Rust
 								    - ONNX
 								  license: apache-2.0
 								  alias: "kokoros"
 								  name: "kokoros"
 								  capabilities:
 								    default: "cpu-kokoros"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &coqui
 								  urls:
 								    - https://github.com/idiap/coqui-ai-TTS
 								  description: |
 								    🐸 Coqui TTS is a library for advanced Text-to-Speech generation.
 								    🚀 Pretrained models in +1100 languages.
 								    🛠️ Tools for training new models and fine-tuning existing models in any language.
 								    📚 Utilities for dataset analysis and curation.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: mpl-2.0
 								  name: "coqui"
 								  alias: "coqui"
 								  capabilities:
 								    nvidia: "cuda12-coqui"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-coqui"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								    amd: "rocm-coqui"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-coqui"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-coqui"
 								    nvidia-cuda-12: "cuda12-coqui"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								  icon: https://avatars.githubusercontent.com/u/1338804?s=200&v=4
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- &outetts
 								  urls:
 								    - https://github.com/OuteAI/outetts
 								  description: |
 								    OuteTTS is an open-weight text-to-speech model from OuteAI (OuteAI/OuteTTS-0.3-1B).
 								    Supports custom speaker voices via audio path or default speakers.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: apache-2.0
 								  name: "outetts"
 								  alias: "outetts"
 								  capabilities:
 								    default: "cpu-outetts"
 								    nvidia-cuda-12: "cuda12-outetts"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- &chatterbox
 								  urls:
 								    - https://github.com/resemble-ai/chatterbox
 								  description: |
 								    Resemble AI's first production-grade open source TTS model. Licensed under MIT, Chatterbox has been benchmarked against leading closed-source systems like ElevenLabs, and is consistently preferred in side-by-side evaluations.
 								    Whether you're working on memes, videos, games, or AI agents, Chatterbox brings your content to life. It's also the first open source TTS model to support emotion exaggeration control, a powerful feature that makes your voices stand out.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: MIT
-												chore: fix backend icons

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2026-01-28 08:08:03 +00:00
+								  icon: https://avatars.githubusercontent.com/u/49844015?s=200&v=4
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								  name: "chatterbox"
-												chore(model gallery): add chatterbox (#5999)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 10:53:13 +00:00
+								  alias: "chatterbox"
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								  capabilities:
 								    nvidia: "cuda12-chatterbox"
-												feat(chatterbox): add MPS, and CPU, pin version (#6242)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-09 15:58:07 +00:00
+								    metal: "metal-chatterbox"
 								    default: "cpu-chatterbox"
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								    nvidia-l4t: "nvidia-l4t-arm64-chatterbox"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-chatterbox"
 								    nvidia-cuda-12: "cuda12-chatterbox"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-chatterbox"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-chatterbox"
-												feat(vibevoice): add new backend (#7494)

* feat(vibevoice): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: add workflow and backend index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add vibevoice

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted for intel builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin python version for l4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-10 20:14:21 +00:00
+								- &vibevoice
 								  urls:
 								    - https://github.com/microsoft/VibeVoice
 								  description: |
 								    VibeVoice-Realtime is a real-time text-to-speech model that generates natural-sounding speech.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: mit
 								  name: "vibevoice"
 								  alias: "vibevoice"
 								  capabilities:
 								    nvidia: "cuda12-vibevoice"
 								    intel: "intel-vibevoice"
 								    amd: "rocm-vibevoice"
 								    nvidia-l4t: "nvidia-l4t-vibevoice"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-vibevoice"
-												feat(vibevoice): add new backend (#7494)

* feat(vibevoice): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: add workflow and backend index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add vibevoice

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted for intel builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin python version for l4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-10 20:14:21 +00:00
+								    default: "cpu-vibevoice"
 								    nvidia-cuda-13: "cuda13-vibevoice"
 								    nvidia-cuda-12: "cuda12-vibevoice"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-vibevoice"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-vibevoice"
 								  icon: https://avatars.githubusercontent.com/u/6154722?s=200&v=4
-												feat(qwen-tts): add Qwen-tts backend (#8163)

* feat(qwen-tts): add Qwen-tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update intel deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop flash-attn for cuda13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-23 14:18:41 +00:00
+								- &qwen-tts
 								  urls:
 								    - https://github.com/QwenLM/Qwen3-TTS
 								  description: |
 								    Qwen3-TTS is a high-quality text-to-speech model supporting custom voice, voice design, and voice cloning.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: apache-2.0
 								  name: "qwen-tts"
 								  alias: "qwen-tts"
 								  capabilities:
 								    nvidia: "cuda12-qwen-tts"
 								    intel: "intel-qwen-tts"
 								    amd: "rocm-qwen-tts"
 								    nvidia-l4t: "nvidia-l4t-qwen-tts"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-qwen-tts"
-												feat(qwen-tts): add Qwen-tts backend (#8163)

* feat(qwen-tts): add Qwen-tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update intel deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop flash-attn for cuda13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-23 14:18:41 +00:00
+								    default: "cpu-qwen-tts"
 								    nvidia-cuda-13: "cuda13-qwen-tts"
 								    nvidia-cuda-12: "cuda12-qwen-tts"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-tts"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-tts"
-												fix(qwen-tts): change icon URL in index.yaml

Updated the icon URL for the project.

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2026-01-23 21:00:14 +00:00
+								  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
-												feat: add fish-speech backend (#8962)

* feat: add fish-speech backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop portaudio

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-12 06:48:23 +00:00
+								- &fish-speech
 								  urls:
 								    - https://github.com/fishaudio/fish-speech
 								  description: |
 								    Fish Speech is a high-quality text-to-speech model supporting voice cloning via reference audio.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								    - voice-cloning
 								  license: apache-2.0
 								  name: "fish-speech"
 								  alias: "fish-speech"
 								  capabilities:
 								    nvidia: "cuda12-fish-speech"
 								    intel: "intel-fish-speech"
 								    amd: "rocm-fish-speech"
 								    nvidia-l4t: "nvidia-l4t-fish-speech"
 								    metal: "metal-fish-speech"
 								    default: "cpu-fish-speech"
 								    nvidia-cuda-13: "cuda13-fish-speech"
 								    nvidia-cuda-12: "cuda12-fish-speech"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-fish-speech"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-fish-speech"
 								  icon: https://avatars.githubusercontent.com/u/148526220?s=200&v=4
-												feat(backends): add faster-qwen3-tts (#8664)

* feat(backends): add faster-qwen3-tts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: this backend is CUDA only

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: add requirements-install.txt with setuptools for build isolation

The faster-qwen3-tts backend requires setuptools to build packages
like sox that have setuptools as a build dependency. This ensures
the build completes successfully in CI.

Signed-off-by: LocalAI Bot <localai-bot@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: LocalAI Bot <localai-bot@users.noreply.github.com>
Co-authored-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-27 07:16:51 +00:00
+								- &faster-qwen3-tts
 								  urls:
 								    - https://github.com/andimarafioti/faster-qwen3-tts
 								    - https://pypi.org/project/faster-qwen3-tts/
 								  description: |
 								    Real-time Qwen3-TTS inference using CUDA graph capture. Voice clone only; requires NVIDIA GPU with CUDA.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								    - voice-clone
 								  license: apache-2.0
 								  name: "faster-qwen3-tts"
 								  alias: "faster-qwen3-tts"
 								  capabilities:
 								    nvidia: "cuda12-faster-qwen3-tts"
 								    default: "cuda12-faster-qwen3-tts"
 								    nvidia-cuda-13: "cuda13-faster-qwen3-tts"
 								    nvidia-cuda-12: "cuda12-faster-qwen3-tts"
 								    nvidia-l4t: "nvidia-l4t-faster-qwen3-tts"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-faster-qwen3-tts"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts"
 								  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
-												feat(qwen-asr): add support to qwen-asr (#8281)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-29 20:50:35 +00:00
+								- &qwen-asr
 								  urls:
 								    - https://github.com/QwenLM/Qwen3-ASR
 								  description: |
 								    Qwen3-ASR is an automatic speech recognition model supporting multiple languages and batch inference.
 								  tags:
 								    - speech-recognition
 								    - ASR
 								  license: apache-2.0
 								  name: "qwen-asr"
 								  alias: "qwen-asr"
 								  capabilities:
 								    nvidia: "cuda12-qwen-asr"
 								    intel: "intel-qwen-asr"
 								    amd: "rocm-qwen-asr"
 								    nvidia-l4t: "nvidia-l4t-qwen-asr"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-qwen-asr"
-												feat(qwen-asr): add support to qwen-asr (#8281)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-29 20:50:35 +00:00
+								    default: "cpu-qwen-asr"
 								    nvidia-cuda-13: "cuda13-qwen-asr"
 								    nvidia-cuda-12: "cuda12-qwen-asr"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-asr"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-asr"
 								  icon: https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png
-												feat(nemo): add Nemo (only asr for now) backend (#8436)

* feat(nemo): add Nemo (only asr for now) backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat(nemo): add Nemo backend without Python version pins (#8438)

* Initial plan

* Remove Python version pins from nemo backend install.sh

Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

* Pin pyarrow to 20.0.0 in nemo requirements

Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

---------

Co-authored-by: copilot-swe-agent[bot] <198982749+Copilot@users.noreply.github.com>
Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Co-authored-by: Copilot <198982749+Copilot@users.noreply.github.com>
Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>
											
										
										
											2026-02-07 07:19:37 +00:00
+								- &nemo
 								  urls:
 								    - https://github.com/NVIDIA/NeMo
 								  description: |
 								    NVIDIA NEMO Toolkit for ASR provides state-of-the-art automatic speech recognition models including Parakeet models for various languages and use cases.
 								  tags:
 								    - speech-recognition
 								    - ASR
 								    - NVIDIA
 								  license: apache-2.0
 								  name: "nemo"
 								  alias: "nemo"
 								  capabilities:
 								    nvidia: "cuda12-nemo"
 								    intel: "intel-nemo"
 								    amd: "rocm-nemo"
 								    metal: "metal-nemo"
 								    default: "cpu-nemo"
 								    nvidia-cuda-13: "cuda13-nemo"
 								    nvidia-cuda-12: "cuda12-nemo"
 								  icon: https://www.nvidia.com/favicon.ico
-												feat: add VoxCPM tts backend (#8109)

* feat: add VoxCPM tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable voxcpm on arm64 cpu

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-28 13:44:04 +00:00
+								- &voxcpm
 								  urls:
 								    - https://github.com/ModelBest/VoxCPM
 								  description: |
 								    VoxCPM is an innovative end-to-end TTS model from ModelBest, designed to generate highly expressive speech.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: mit
 								  name: "voxcpm"
 								  alias: "voxcpm"
 								  capabilities:
 								    nvidia: "cuda12-voxcpm"
 								    intel: "intel-voxcpm"
 								    amd: "rocm-voxcpm"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-voxcpm"
-												feat: add VoxCPM tts backend (#8109)

* feat: add VoxCPM tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable voxcpm on arm64 cpu

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-28 13:44:04 +00:00
+								    default: "cpu-voxcpm"
 								    nvidia-cuda-13: "cuda13-voxcpm"
 								    nvidia-cuda-12: "cuda12-voxcpm"
 								  icon: https://avatars.githubusercontent.com/u/6154722?s=200&v=4
-												feat(tts): add pocket-tts backend (#8018)

* feat(pocket-tts): add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-13 22:35:19 +00:00
+								- &pocket-tts
 								  urls:
 								    - https://github.com/kyutai-labs/pocket-tts
 								  description: |
 								    Pocket TTS is a lightweight text-to-speech model designed to run efficiently on CPUs.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: mit
 								  name: "pocket-tts"
 								  alias: "pocket-tts"
 								  capabilities:
 								    nvidia: "cuda12-pocket-tts"
 								    intel: "intel-pocket-tts"
 								    amd: "rocm-pocket-tts"
 								    nvidia-l4t: "nvidia-l4t-pocket-tts"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-pocket-tts"
-												feat(tts): add pocket-tts backend (#8018)

* feat(pocket-tts): add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-13 22:35:19 +00:00
+								    default: "cpu-pocket-tts"
 								    nvidia-cuda-13: "cuda13-pocket-tts"
 								    nvidia-cuda-12: "cuda12-pocket-tts"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-pocket-tts"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-pocket-tts"
-												chore: fix backend icons

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2026-01-28 08:08:03 +00:00
+								  icon: https://avatars.githubusercontent.com/u/151010778?s=200&v=4
-												feat: split piper from main binary (#5858)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 06:31:33 +00:00
+								- &piper
 								  name: "piper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-piper"
 								  icon: https://github.com/OHF-Voice/piper1-gpl/raw/main/etc/logo.png
 								  urls:
 								    - https://github.com/rhasspy/piper
 								    - https://github.com/mudler/go-piper
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-piper
-												feat: split piper from main binary (#5858)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 06:31:33 +00:00
+								  license: MIT
 								  description: |
 								     A fast, local neural text to speech system
 								  tags:
 								    - text-to-speech
 								    - TTS
-												feat(realtime): WebRTC support (#8790)

* feat(realtime): WebRTC support

Signed-off-by: Richard Palethorpe <io@richiejp.com>

* fix(tracing): Show full LLM opts and deltas

Signed-off-by: Richard Palethorpe <io@richiejp.com>

---------

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-03-13 20:37:15 +00:00
+								- &opus
 								  name: "opus"
-												fix(realtime): Set the alias for opus so the development backend can be selected (#9083)

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-03-20 14:08:07 +00:00
+								  alias: "opus"
-												feat(realtime): WebRTC support (#8790)

* feat(realtime): WebRTC support

Signed-off-by: Richard Palethorpe <io@richiejp.com>

* fix(tracing): Show full LLM opts and deltas

Signed-off-by: Richard Palethorpe <io@richiejp.com>

---------

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-03-13 20:37:15 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-opus"
 								  urls:
 								    - https://opus-codec.org/
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-opus
 								  license: BSD-3-Clause
 								  description: |
 								    Opus audio codec backend for encoding and decoding audio.
 								    Required for WebRTC transport in the Realtime API.
 								  tags:
 								    - audio-codec
 								    - opus
 								    - WebRTC
 								    - realtime
 								    - CPU
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								- &silero-vad
 								  name: "silero-vad"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-silero-vad"
 								  icon: https://user-images.githubusercontent.com/12515440/89997349-b3523080-dc94-11ea-9906-ca2e8bc50535.png
 								  urls:
 								    - https://github.com/snakers4/silero-vad
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-cpu-silero-vad
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								  description: |
 								    Silero VAD: pre-trained enterprise-grade Voice Activity Detector.
 								    Silero VAD is a voice activity detection model that can be used to detect whether a given audio contains speech or not.
 								  tags:
 								    - voice-activity-detection
 								    - VAD
 								    - silero-vad
 								    - CPU
 								- &local-store
 								  name: "local-store"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-local-store"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-cpu-local-store
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								  urls:
 								    - https://github.com/mudler/LocalAI
 								  description: |
 								    Local Store is a local-first, self-hosted, and open-source vector database.
 								  tags:
 								    - vector-database
 								    - local-first
 								    - open-source
 								    - CPU
 								  license: MIT
-												feat(backends): add KittenTTS (#5977)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-06 10:38:45 +00:00
+								- &kitten-tts
 								  name: "kitten-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-kitten-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-kitten-tts
 								  urls:
 								    - https://github.com/KittenML/KittenTTS
 								  description: |
 								    Kitten TTS is a text-to-speech model that can generate speech from text.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: apache-2.0
-												feat(neutts): add backend (#6404)

* feat(neutts): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): add images to CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add Neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make it work with quantized versions

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-10-09 19:51:28 +00:00
+								- &neutts
 								  name: "neutts"
 								  urls:
 								    - https://github.com/neuphonic/neutts-air
 								  description: |
 								    NeuTTS Air is the world’s first super-realistic, on-device, TTS speech language model with instant voice cloning. Built off a 0.5B LLM backbone, NeuTTS Air brings natural-sounding speech, real-time performance, built-in security and speaker cloning to your local device - unlocking a new category of embedded voice agents, assistants, toys, and compliance-safe apps.
 								  tags:
 								    - text-to-speech
 								    - TTS
 								  license: apache-2.0
 								  capabilities:
 								    default: "cpu-neutts"
 								    nvidia: "cuda12-neutts"
 								    amd: "rocm-neutts"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-12: "cuda12-neutts"
-												feat(neutts): add backend (#6404)

* feat(neutts): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): add images to CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add Neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make it work with quantized versions

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-10-09 19:51:28 +00:00
+								- !!merge <<: *neutts
 								  name: "neutts-development"
 								  capabilities:
 								    default: "cpu-neutts-development"
 								    nvidia: "cuda12-neutts-development"
 								    amd: "rocm-neutts-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-12: "cuda12-neutts-development"
 								- !!merge <<: *llamacpp
 								  name: "llama-cpp-development"
 								  capabilities:
 								    default: "cpu-llama-cpp-development"
 								    nvidia: "cuda12-llama-cpp-development"
 								    intel: "intel-sycl-f16-llama-cpp-development"
 								    amd: "rocm-llama-cpp-development"
 								    metal: "metal-llama-cpp-development"
 								    vulkan: "vulkan-llama-cpp-development"
 								    nvidia-l4t: "nvidia-l4t-arm64-llama-cpp-development"
 								    nvidia-cuda-13: "cuda13-llama-cpp-development"
 								    nvidia-cuda-12: "cuda12-llama-cpp-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-llama-cpp-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-llama-cpp-development"
-												feat(neutts): add backend (#6404)

* feat(neutts): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): add images to CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add Neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make it work with quantized versions

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-10-09 19:51:28 +00:00
+								- !!merge <<: *neutts
 								  name: "cpu-neutts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-neutts"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-neutts
 								- !!merge <<: *neutts
 								  name: "cuda12-neutts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-neutts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-neutts
 								- !!merge <<: *neutts
 								  name: "rocm-neutts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-neutts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-neutts
 								- !!merge <<: *neutts
 								  name: "cpu-neutts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-neutts"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-neutts
 								- !!merge <<: *neutts
 								  name: "cuda12-neutts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-neutts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-neutts
 								- !!merge <<: *neutts
 								  name: "rocm-neutts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-neutts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-neutts
-												feat(mlx): add mlx backend (#6049)

* chore: allow to install with pip

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make the backend to build and actually work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* List models from system only

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add script to build darwin python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Run protogen in libbackend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Detect if mps is available across python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI: try to build backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Index mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop CI test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-22 06:42:29 +00:00
+								- !!merge <<: *mlx
 								  name: "mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-mlx
-												Add mlx-vlm (#6119)

* Add mlx-vlm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to CI workflows

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add requirements-mps.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-23 21:05:30 +00:00
+								- !!merge <<: *mlx-vlm
 								  name: "mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-mlx-vlm
-												feat(mlx-audio): Add mlx-audio backend (#6138)

* feat(mlx-audio): Add mlx-audio backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* improve loading

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: set C_INCLUDE_PATH to point to python install

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-26 13:27:06 +00:00
+								- !!merge <<: *mlx-audio
 								  name: "mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-mlx-audio
-												feat(mlx-distributed): add new MLX-distributed backend (#8801)

* feat(mlx-distributed): add new MLX-distributed backend

Add new MLX distributed backend with support for both TCP and RDMA for
model sharding.

This implementation ties in the discovery implementation already in
place, and re-uses the same P2P mechanism for the TCP MLX-distributed
inferencing.

The Auto-parallel implementation is inspired by Exo's
ones (who have been added to acknowledgement for the great work!)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* expose a CLI to facilitate backend starting

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: make manual rank0 configurable via model configs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing features from mlx backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2026-03-09 16:29:32 +00:00
+								- !!merge <<: *mlx-distributed
 								  name: "mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-mlx-distributed
-												feat(mlx): Add support for CUDA12, CUDA13, L4T, SBSA and CPU (#8380)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 22:53:34 +00:00
+								## mlx
 								- !!merge <<: *mlx
 								  name: "cpu-mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-mlx
 								- !!merge <<: *mlx
 								  name: "cpu-mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-mlx
 								- !!merge <<: *mlx
 								  name: "cuda12-mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx
 								- !!merge <<: *mlx
 								  name: "cuda12-mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx
 								- !!merge <<: *mlx
 								  name: "cuda13-mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx
 								- !!merge <<: *mlx
 								  name: "cuda13-mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx
 								- !!merge <<: *mlx
 								  name: "nvidia-l4t-mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-mlx
 								- !!merge <<: *mlx
 								  name: "nvidia-l4t-mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-mlx
 								- !!merge <<: *mlx
 								  name: "cuda13-nvidia-l4t-arm64-mlx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx
 								- !!merge <<: *mlx
 								  name: "cuda13-nvidia-l4t-arm64-mlx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx
 								## mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cpu-mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cpu-mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda12-mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda12-mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda13-mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda13-mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "nvidia-l4t-mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "nvidia-l4t-mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda13-nvidia-l4t-arm64-mlx-vlm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-vlm
 								- !!merge <<: *mlx-vlm
 								  name: "cuda13-nvidia-l4t-arm64-mlx-vlm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-vlm"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-vlm
 								## mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cpu-mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cpu-mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda12-mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda12-mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda13-mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda13-mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "nvidia-l4t-mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "nvidia-l4t-mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda13-nvidia-l4t-arm64-mlx-audio"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-audio
 								- !!merge <<: *mlx-audio
 								  name: "cuda13-nvidia-l4t-arm64-mlx-audio-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-audio"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-audio
-												feat(mlx-distributed): add new MLX-distributed backend (#8801)

* feat(mlx-distributed): add new MLX-distributed backend

Add new MLX distributed backend with support for both TCP and RDMA for
model sharding.

This implementation ties in the discovery implementation already in
place, and re-uses the same P2P mechanism for the TCP MLX-distributed
inferencing.

The Auto-parallel implementation is inspired by Exo's
ones (who have been added to acknowledgement for the great work!)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* expose a CLI to facilitate backend starting

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: make manual rank0 configurable via model configs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing features from mlx backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Apply suggestion from @mudler

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2026-03-09 16:29:32 +00:00
+								## mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cpu-mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cpu-mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda12-mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda12-mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda13-mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda13-mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "nvidia-l4t-mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "nvidia-l4t-mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda13-nvidia-l4t-arm64-mlx-distributed"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-mlx-distributed
 								- !!merge <<: *mlx-distributed
 								  name: "cuda13-nvidia-l4t-arm64-mlx-distributed-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-distributed"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-mlx-distributed
-												feat(backends): add KittenTTS (#5977)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-06 10:38:45 +00:00
+								- !!merge <<: *kitten-tts
 								  name: "kitten-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-kitten-tts"
 								  mirrors:
 								    - localai/localai-backends:master-kitten-tts
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *kitten-tts
 								  name: "metal-kitten-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-kitten-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-kitten-tts
 								- !!merge <<: *kitten-tts
 								  name: "metal-kitten-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-kitten-tts"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-kitten-tts
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								- !!merge <<: *local-store
 								  name: "local-store-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-local-store"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-cpu-local-store
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *local-store
 								  name: "metal-local-store"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-local-store"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-local-store
 								- !!merge <<: *local-store
 								  name: "metal-local-store-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-local-store"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-local-store
-												feat(realtime): WebRTC support (#8790)

* feat(realtime): WebRTC support

Signed-off-by: Richard Palethorpe <io@richiejp.com>

* fix(tracing): Show full LLM opts and deltas

Signed-off-by: Richard Palethorpe <io@richiejp.com>

---------

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-03-13 20:37:15 +00:00
+								- !!merge <<: *opus
 								  name: "opus-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-opus"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-opus
 								- !!merge <<: *opus
 								  name: "metal-opus"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-opus"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-opus
 								- !!merge <<: *opus
 								  name: "metal-opus-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-opus"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-opus
-												feat: refactor build process, drop embedded backends (#5875)

* feat: split remaining backends and drop embedded backends

- Drop silero-vad, huggingface, and stores backend from embedded
  binaries
- Refactor Makefile and Dockerfile to avoid building grpc backends
- Drop golang code that was used to embed backends
- Simplify building by using goreleaser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): be specific with llama-cpp backend templates

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(docs): update

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(ci): minor fixes

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: drop all ffmpeg references

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: run protogen-go

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Always enable p2p mode

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update gorelease file

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(stores): do not always load

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix linting issues

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Mac OS fixup

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-22 14:31:04 +00:00
+								- !!merge <<: *silero-vad
 								  name: "silero-vad-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-silero-vad"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-cpu-silero-vad
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *silero-vad
 								  name: "metal-silero-vad"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-silero-vad"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-silero-vad
 								- !!merge <<: *silero-vad
 								  name: "metal-silero-vad-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-silero-vad"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-silero-vad
-												feat: split piper from main binary (#5858)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 06:31:33 +00:00
+								- !!merge <<: *piper
 								  name: "piper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-piper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-piper
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *piper
 								  name: "metal-piper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-piper"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-piper
 								- !!merge <<: *piper
 								  name: "metal-piper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-piper"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-piper
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								## llama-cpp
 								- !!merge <<: *llamacpp
 								  name: "nvidia-l4t-arm64-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-arm64-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "nvidia-l4t-arm64-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-arm64-llama-cpp
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cuda13-nvidia-l4t-arm64-llama-cpp"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-llama-cpp"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-llama-cpp
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cuda13-nvidia-l4t-arm64-llama-cpp-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-llama-cpp"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cpu-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-cpu-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cpu-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-cpu-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cuda12-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "rocm-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "intel-sycl-f32-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f32-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "intel-sycl-f16-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f16-llama-cpp
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *llamacpp
 								  name: "vulkan-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-vulkan-llama-cpp
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *llamacpp
 								  name: "vulkan-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-vulkan-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "metal-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "metal-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cuda12-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "rocm-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
 								  name: "intel-sycl-f32-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f32-llama-cpp
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								- !!merge <<: *llamacpp
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								  name: "intel-sycl-f16-llama-cpp-development"
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-llama-cpp"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f16-llama-cpp
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *llamacpp
 								  name: "cuda13-llama-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-llama-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-llama-cpp
 								- !!merge <<: *llamacpp
 								  name: "cuda13-llama-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-llama-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-llama-cpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								## whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "nvidia-l4t-arm64-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-arm64-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "nvidia-l4t-arm64-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-arm64-whisper
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *whispercpp
 								  name: "cuda13-nvidia-l4t-arm64-whisper"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-whisper"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-whisper
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *whispercpp
 								  name: "cuda13-nvidia-l4t-arm64-whisper-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-whisper"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "cpu-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-cpu-whisper
-												chore(backends): add stablediffusion-ggml and whisper for metal (#6173)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-01 20:30:35 +00:00
+								- !!merge <<: *whispercpp
 								  name: "metal-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisper"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-whisper
 								- !!merge <<: *whispercpp
 								  name: "metal-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisper"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "cpu-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-cpu-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "cuda12-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "rocm-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "intel-sycl-f32-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f32-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "intel-sycl-f16-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f16-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "vulkan-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-vulkan-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "vulkan-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-vulkan-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "metal-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "metal-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "cuda12-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "rocm-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "intel-sycl-f32-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f32-whisper
-												Update index.yaml

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-07-20 20:54:12 +00:00
+								- !!merge <<: *whispercpp
-												feat: split whisper from main binary (#5863)

* feat: split whisper from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Cleanup makefile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend builds (missing only darwin)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper backend to test runs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Make sure we have runtime libs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Less grpc on the main Dockerfile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add whisper to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Re-enable CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-20 20:52:45 +00:00
+								  name: "intel-sycl-f16-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f16-whisper
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *whispercpp
 								  name: "cuda13-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-whisper"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-whisper
 								- !!merge <<: *whispercpp
 								  name: "cuda13-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-whisper"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-whisper
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								## stablediffusion-ggml
 								- !!merge <<: *stablediffusionggml
 								  name: "cpu-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-cpu-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cpu-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-cpu-stablediffusion-ggml
-												chore(backends): add stablediffusion-ggml and whisper for metal (#6173)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-01 20:30:35 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "metal-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-stablediffusion-ggml"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-stablediffusion-ggml
 								- !!merge <<: *stablediffusionggml
 								  name: "metal-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-stablediffusion-ggml"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "vulkan-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-vulkan-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "vulkan-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-vulkan-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cuda12-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "intel-sycl-f32-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-stablediffusion-ggml"
 								- !!merge <<: *stablediffusionggml
 								  name: "intel-sycl-f16-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f16-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cuda12-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "intel-sycl-f32-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f32-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "intel-sycl-f16-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f16-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "nvidia-l4t-arm64-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-arm64-stablediffusion-ggml
-												feat: remove stablediffusion-ggml from main binary (#5861)

* feat: split stablediffusion-ggml from main binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt ci tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to support nvidial4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Latest fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-19 19:58:53 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "nvidia-l4t-arm64-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-stablediffusion-ggml"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-arm64-stablediffusion-ggml
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cuda13-nvidia-l4t-arm64-stablediffusion-ggml-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-stablediffusion-ggml
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *stablediffusionggml
 								  name: "cuda13-stablediffusion-ggml"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-stablediffusion-ggml"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-stablediffusion-ggml
 								- !!merge <<: *stablediffusionggml
 								  name: "cuda13-stablediffusion-ggml-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-stablediffusion-ggml"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-stablediffusion-ggml
-												feat: do not bundle llama-cpp anymore (#5790)

* Build llama.cpp separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Start to try to attach some tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add git and small fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: correctly autoload external backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run AIO tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Slightly update the Makefile helps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt auto-bumper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run linux test

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add llama-cpp into build pipelines

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add default capability (for cpu)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop llama-cpp specific logic from the backend loader

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop grpc install in ci for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pass by backends path for tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build protogen at start

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(tests): set backends path consistently

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly configure the backends path

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to build for darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* WIP

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Compile for metal on arm64/darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to run build off from cross-arch

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the backend index nvidia-l4t and cpu's llama-cpp backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Build also darwin-x86 for llama-cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable arm64 builds temporary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Test backend build on PR

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup build backend reusable workflow

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pass by skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use crane

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Skip drivers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* x86 darwin

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add packaging step for llama.cpp

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix leftover from bark-cpp extraction

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Try to fix hipblas build

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-18 11:24:12 +00:00
+								# vllm
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *vllm
 								  name: "vllm-development"
 								  capabilities:
 								    nvidia: "cuda12-vllm-development"
 								    amd: "rocm-vllm-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-vllm-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
 								  name: "cuda12-vllm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
 								  name: "rocm-vllm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-vllm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-vllm-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-vllm-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-vllm
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								- !!merge <<: *vllm
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-vllm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-vllm"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-vllm
-												feat(vllm-omni): add new backend (#8188)

* feat(vllm-omni: add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* default to py3.12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-24 21:23:30 +00:00
+								# vllm-omni
 								- !!merge <<: *vllm-omni
 								  name: "vllm-omni-development"
 								  capabilities:
 								    nvidia: "cuda12-vllm-omni-development"
 								    amd: "rocm-vllm-omni-development"
 								    nvidia-cuda-12: "cuda12-vllm-omni-development"
 								- !!merge <<: *vllm-omni
 								  name: "cuda12-vllm-omni"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vllm-omni"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vllm-omni
 								- !!merge <<: *vllm-omni
 								  name: "rocm-vllm-omni"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vllm-omni"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-vllm-omni
 								- !!merge <<: *vllm-omni
 								  name: "cuda12-vllm-omni-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vllm-omni"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-vllm-omni
 								- !!merge <<: *vllm-omni
 								  name: "rocm-vllm-omni-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vllm-omni"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-vllm-omni
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								# rfdetr
 								- !!merge <<: *rfdetr
 								  name: "rfdetr-development"
 								  capabilities:
 								    nvidia: "cuda12-rfdetr-development"
 								    intel: "intel-rfdetr-development"
 								    #amd: "rocm-rfdetr-development"
 								    nvidia-l4t: "nvidia-l4t-arm64-rfdetr-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-rfdetr-development"
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								    default: "cpu-rfdetr-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-rfdetr-development"
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								- !!merge <<: *rfdetr
 								  name: "cuda12-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "intel-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-rfdetr
 								# - !!merge <<: *rfdetr
 								#   name: "rocm-rfdetr"
 								#   uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-hipblas-rfdetr"
 								#   mirrors:
 								#     - localai/localai-backends:latest-gpu-hipblas-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "nvidia-l4t-arm64-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-arm64-rfdetr
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *rfdetr
 								  name: "nvidia-l4t-arm64-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-arm64-rfdetr
-												feat(rfdetr): add object detection API (#5923)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-27 20:02:51 +00:00
+								- !!merge <<: *rfdetr
 								  name: "cpu-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "cuda12-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "intel-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-rfdetr
 								# - !!merge <<: *rfdetr
 								#   name: "rocm-rfdetr-development"
 								#   uri: "quay.io/go-skynet/local-ai-backends:master-gpu-hipblas-rfdetr"
 								#   mirrors:
 								#     - localai/localai-backends:master-gpu-hipblas-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "cpu-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "intel-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-rfdetr
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *rfdetr
 								  name: "cuda13-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "cuda13-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-rfdetr
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *rfdetr
 								  name: "metal-rfdetr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-rfdetr
 								- !!merge <<: *rfdetr
 								  name: "metal-rfdetr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-rfdetr"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-rfdetr
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## Rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
 								  name: "rerankers-development"
 								  capabilities:
 								    nvidia: "cuda12-rerankers-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-rerankers-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-rerankers-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-rerankers-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-rerankers-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
 								  name: "cuda12-rerankers"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-rerankers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
 								  name: "rocm-rerankers"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
 								  name: "cuda12-rerankers-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
 								  name: "rocm-rerankers-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-rerankers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *rerankers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-rerankers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-rerankers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-rerankers
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *rerankers
 								  name: "cuda13-rerankers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-rerankers"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-rerankers
 								- !!merge <<: *rerankers
 								  name: "cuda13-rerankers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-rerankers"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-rerankers
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *rerankers
 								  name: "metal-rerankers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-rerankers"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-rerankers
 								- !!merge <<: *rerankers
 								  name: "metal-rerankers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-rerankers"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-rerankers
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## Transformers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *transformers
 								  name: "transformers-development"
 								  capabilities:
 								    nvidia: "cuda12-transformers-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-transformers-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-transformers-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-transformers-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-transformers-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *transformers
 								  name: "cuda12-transformers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-transformers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *transformers
 								  name: "rocm-transformers"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-transformers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *transformers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-transformers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-transformers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *transformers
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-transformers-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-transformers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *transformers
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-transformers-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-transformers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *transformers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-transformers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-transformers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-transformers
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *transformers
 								  name: "cuda13-transformers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-transformers"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-transformers
 								- !!merge <<: *transformers
 								  name: "cuda13-transformers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-transformers"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-transformers
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *transformers
 								  name: "metal-transformers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-transformers"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-transformers
 								- !!merge <<: *transformers
 								  name: "metal-transformers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-transformers"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-transformers
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## Diffusers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *diffusers
 								  name: "diffusers-development"
 								  capabilities:
 								    nvidia: "cuda12-diffusers-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-diffusers-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-diffusers-development"
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								    nvidia-l4t: "nvidia-l4t-diffusers-development"
-												feat(diffusers): add MPS version (#6121)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-22 21:14:54 +00:00
+								    metal: "metal-diffusers-development"
-												feat(backends): add CPU variant for diffusers backend (#6128)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-24 08:17:10 +00:00
+								    default: "cpu-diffusers-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-diffusers-development"
-												feat(backends): add CPU variant for diffusers backend (#6128)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-24 08:17:10 +00:00
+								- !!merge <<: *diffusers
 								  name: "cpu-diffusers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-diffusers"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-diffusers
 								- !!merge <<: *diffusers
 								  name: "cpu-diffusers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-diffusers"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-diffusers
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								- !!merge <<: *diffusers
 								  name: "nvidia-l4t-diffusers"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-diffusers"
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-diffusers
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								- !!merge <<: *diffusers
 								  name: "nvidia-l4t-diffusers-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-diffusers"
-												feat(diffusers): add builds for nvidia-l4t (#6004)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-08 20:48:38 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-diffusers
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *diffusers
 								  name: "cuda13-nvidia-l4t-arm64-diffusers"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-diffusers"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-diffusers
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *diffusers
 								  name: "cuda13-nvidia-l4t-arm64-diffusers-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-diffusers"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-diffusers
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *diffusers
 								  name: "cuda12-diffusers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-diffusers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *diffusers
 								  name: "rocm-diffusers"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-diffusers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *diffusers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-diffusers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-diffusers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *diffusers
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-diffusers-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-diffusers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *diffusers
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-diffusers-development"
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-diffusers
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *diffusers
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-diffusers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-diffusers"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-diffusers
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *diffusers
 								  name: "cuda13-diffusers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-diffusers"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-diffusers
 								- !!merge <<: *diffusers
 								  name: "cuda13-diffusers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-diffusers"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-diffusers
-												feat(diffusers): add MPS version (#6121)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-08-22 21:14:54 +00:00
+								- !!merge <<: *diffusers
 								  name: "metal-diffusers"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-diffusers"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-diffusers
 								- !!merge <<: *diffusers
 								  name: "metal-diffusers-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-diffusers"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-diffusers
-												feat(musicgen): add ace-step and UI interface (#8396)

* feat(musicgen): add ace-step and UI interface

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Correctly handle model dir

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop auto-download

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to models, fixup UIs icons

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* l4t13 is incompatbile

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* avoid pinning version for cuda12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop l4t12

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-05 11:04:53 +00:00
+								## ace-step
 								- !!merge <<: *ace-step
 								  name: "cpu-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-ace-step
 								- !!merge <<: *ace-step
 								  name: "cpu-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-ace-step
 								- !!merge <<: *ace-step
 								  name: "cuda12-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-ace-step
 								- !!merge <<: *ace-step
 								  name: "cuda12-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-ace-step
 								- !!merge <<: *ace-step
 								  name: "cuda13-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-ace-step
 								- !!merge <<: *ace-step
 								  name: "cuda13-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-ace-step
 								- !!merge <<: *ace-step
 								  name: "rocm-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-ace-step
 								- !!merge <<: *ace-step
 								  name: "rocm-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-ace-step
 								- !!merge <<: *ace-step
 								  name: "intel-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-ace-step
 								- !!merge <<: *ace-step
 								  name: "intel-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-ace-step
 								- !!merge <<: *ace-step
 								  name: "metal-ace-step"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-ace-step"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-ace-step
 								- !!merge <<: *ace-step
 								  name: "metal-ace-step-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-ace-step"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-ace-step
-												feat(backends): add ace-step.cpp (#8965)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-12 17:56:26 +00:00
+								## acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "nvidia-l4t-arm64-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "nvidia-l4t-arm64-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda13-nvidia-l4t-arm64-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda13-nvidia-l4t-arm64-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cpu-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "metal-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "metal-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cpu-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda12-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "rocm-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "intel-sycl-f32-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f32-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f32-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "intel-sycl-f16-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-sycl-f16-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-sycl-f16-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "vulkan-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-vulkan-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-vulkan-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "vulkan-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-vulkan-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-vulkan-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda12-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "rocm-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "intel-sycl-f32-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f32-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f32-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "intel-sycl-f16-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-sycl-f16-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-sycl-f16-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda13-acestep-cpp"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-acestep-cpp
 								- !!merge <<: *acestepcpp
 								  name: "cuda13-acestep-cpp-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-acestep-cpp"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-acestep-cpp
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## kokoro
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *kokoro
 								  name: "kokoro-development"
 								  capabilities:
 								    nvidia: "cuda12-kokoro-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-kokoro-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-kokoro-development"
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								    nvidia-l4t: "nvidia-l4t-kokoro-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-kokoro-development"
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *kokoro
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-kokoro-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-kokoro
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *kokoro
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-kokoro-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-kokoro
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *kokoro
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-kokoro"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-kokoro
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *kokoro
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-kokoro-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-kokoro
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								- !!merge <<: *kokoro
 								  name: "nvidia-l4t-kokoro"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-kokoro"
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-kokoro
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								- !!merge <<: *kokoro
 								  name: "nvidia-l4t-kokoro-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-kokoro"
-												feat(kokoro): add support for l4t devices (#6322)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-22 08:33:26 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-kokoro
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *kokoro
 								  name: "cuda12-kokoro"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-kokoro
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *kokoro
 								  name: "rocm-kokoro"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-kokoro"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-kokoro
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *kokoro
 								  name: "cuda13-kokoro"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-kokoro"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-kokoro
 								- !!merge <<: *kokoro
 								  name: "cuda13-kokoro-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-kokoro"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-kokoro
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *kokoro
 								  name: "metal-kokoro"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-kokoro"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-kokoro
 								- !!merge <<: *kokoro
 								  name: "metal-kokoro-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-kokoro"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-kokoro
-												feat: Add Kokoros backend (#9212)

Signed-off-by: Richard Palethorpe <io@richiejp.com>
											
										
										
											2026-04-08 17:23:16 +00:00
+								## kokoros (Rust)
 								- !!merge <<: *kokoros
 								  name: "kokoros-development"
 								  capabilities:
 								    default: "cpu-kokoros-development"
 								- !!merge <<: *kokoros
 								  name: "cpu-kokoros"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-kokoros"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-kokoros
 								- !!merge <<: *kokoros
 								  name: "cpu-kokoros-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-kokoros"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-kokoros
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## faster-whisper
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *faster-whisper
 								  name: "faster-whisper-development"
 								  capabilities:
 								    nvidia: "cuda12-faster-whisper-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-faster-whisper-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-faster-whisper-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-faster-whisper-development"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-faster-whisper-development"
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *faster-whisper
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-faster-whisper-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-faster-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-faster-whisper
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *faster-whisper
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-faster-whisper-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-faster-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-faster-whisper
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *faster-whisper
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-faster-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-faster-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-faster-whisper
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *faster-whisper
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-faster-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-faster-whisper"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-faster-whisper
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *faster-whisper
 								  name: "cuda13-faster-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-faster-whisper"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-faster-whisper
 								- !!merge <<: *faster-whisper
 								  name: "cuda13-faster-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-faster-whisper"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-faster-whisper
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *faster-whisper
 								  name: "metal-faster-whisper"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-faster-whisper"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-faster-whisper
 								- !!merge <<: *faster-whisper
 								  name: "metal-faster-whisper-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-faster-whisper"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-faster-whisper
-												feat(backends): add moonshine backend for faster transcription (#7833)

* feat(backends): add moonshine backend for faster transcription

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backend to CI, update AGENTS.md from this exercise

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-07 20:44:35 +00:00
+								## moonshine
 								- !!merge <<: *moonshine
 								  name: "moonshine-development"
 								  capabilities:
 								    nvidia: "cuda12-moonshine-development"
 								    default: "cpu-moonshine-development"
 								    nvidia-cuda-13: "cuda13-moonshine-development"
 								    nvidia-cuda-12: "cuda12-moonshine-development"
 								- !!merge <<: *moonshine
 								  name: "cpu-moonshine"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-moonshine"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-moonshine
 								- !!merge <<: *moonshine
 								  name: "cpu-moonshine-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-moonshine"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-moonshine
 								- !!merge <<: *moonshine
 								  name: "cuda12-moonshine"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-moonshine"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-moonshine
 								- !!merge <<: *moonshine
 								  name: "cuda12-moonshine-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-moonshine"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-moonshine
 								- !!merge <<: *moonshine
 								  name: "cuda13-moonshine"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-moonshine"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-moonshine
 								- !!merge <<: *moonshine
 								  name: "cuda13-moonshine-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-moonshine"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-moonshine
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *moonshine
 								  name: "metal-moonshine"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-moonshine"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-moonshine
 								- !!merge <<: *moonshine
 								  name: "metal-moonshine-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-moonshine"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-moonshine
-												feat(whisperx): add whisperx backend for transcription with speaker diarization (#8299)

* feat(proto): add speaker field to TranscriptSegment for diarization

Add speaker field to the gRPC TranscriptSegment message and map it
through the Go schema, enabling backends to return speaker labels.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx backend for transcription with diarization

Add Python gRPC backend using WhisperX for speech-to-text with
word-level timestamps, forced alignment, and speaker diarization
via pyannote-audio when HF_TOKEN is provided.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): register whisperx backend in Makefile

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx meta and image entries to index.yaml

Signed-off-by: eureka928 <meobius123@gmail.com>

* ci(whisperx): add build matrix entries for CPU, CUDA 12/13, and ROCm

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): unpin torch versions and use CPU index for cpu requirements

Address review feedback:
- Use --extra-index-url for CPU torch wheels to reduce size
- Remove torch version pins, let uv resolve compatible versions

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch ROCm variant to fix CI build failure

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch CPU variant to fix uv resolution failure

Pin torch==2.8.0+cpu so uv resolves the CPU wheel from the extra
index instead of picking torch==2.8.0+cu128 from PyPI, which pulls
unresolvable CUDA dependencies.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): use unsafe-best-match index strategy to fix uv resolution failure

uv's default first-match strategy finds torch on PyPI before checking
the extra index, causing it to pick torch==2.8.0+cu128 instead of the
CPU variant. This makes whisperx's transitive torch dependency
unresolvable. Using unsafe-best-match lets uv consider all indexes.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): drop +cpu local version suffix to fix uv resolution failure

PEP 440 ==2.8.0 matches 2.8.0+cpu from the extra index, avoiding the
issue where uv cannot locate an explicit +cpu local version specifier.
This aligns with the pattern used by all other CPU backends.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(backends): drop +rocm local version suffixes from hipblas requirements to fix uv resolution

uv cannot resolve PEP 440 local version specifiers (e.g. +rocm6.4,
+rocm6.3) in pinned requirements. The --extra-index-url already points
to the correct ROCm wheel index and --index-strategy unsafe-best-match
(set in libbackend.sh) ensures the ROCm variant is preferred.

Applies the same fix as 7f5d72e8 (which resolved this for +cpu) across
all 14 hipblas requirements files.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

* revert: scope hipblas suffix fix to whisperx only

Reverts changes to non-whisperx hipblas requirements files per
maintainer review — other backends are building fine with the +rocm
local version suffix.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

---------

Signed-off-by: eureka928 <meobius123@gmail.com>
Co-authored-by: Claude Opus 4.5 <noreply@anthropic.com>
											
										
										
											2026-02-02 15:33:12 +00:00
+								## whisperx
 								- !!merge <<: *whisperx
 								  name: "whisperx-development"
 								  capabilities:
 								    nvidia: "cuda12-whisperx-development"
 								    amd: "rocm-whisperx-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-whisperx-development"
-												feat(whisperx): add whisperx backend for transcription with speaker diarization (#8299)

* feat(proto): add speaker field to TranscriptSegment for diarization

Add speaker field to the gRPC TranscriptSegment message and map it
through the Go schema, enabling backends to return speaker labels.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx backend for transcription with diarization

Add Python gRPC backend using WhisperX for speech-to-text with
word-level timestamps, forced alignment, and speaker diarization
via pyannote-audio when HF_TOKEN is provided.

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): register whisperx backend in Makefile

Signed-off-by: eureka928 <meobius123@gmail.com>

* feat(whisperx): add whisperx meta and image entries to index.yaml

Signed-off-by: eureka928 <meobius123@gmail.com>

* ci(whisperx): add build matrix entries for CPU, CUDA 12/13, and ROCm

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): unpin torch versions and use CPU index for cpu requirements

Address review feedback:
- Use --extra-index-url for CPU torch wheels to reduce size
- Remove torch version pins, let uv resolve compatible versions

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch ROCm variant to fix CI build failure

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): pin torch CPU variant to fix uv resolution failure

Pin torch==2.8.0+cpu so uv resolves the CPU wheel from the extra
index instead of picking torch==2.8.0+cu128 from PyPI, which pulls
unresolvable CUDA dependencies.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): use unsafe-best-match index strategy to fix uv resolution failure

uv's default first-match strategy finds torch on PyPI before checking
the extra index, causing it to pick torch==2.8.0+cu128 instead of the
CPU variant. This makes whisperx's transitive torch dependency
unresolvable. Using unsafe-best-match lets uv consider all indexes.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(whisperx): drop +cpu local version suffix to fix uv resolution failure

PEP 440 ==2.8.0 matches 2.8.0+cpu from the extra index, avoiding the
issue where uv cannot locate an explicit +cpu local version specifier.
This aligns with the pattern used by all other CPU backends.

Signed-off-by: eureka928 <meobius123@gmail.com>

* fix(backends): drop +rocm local version suffixes from hipblas requirements to fix uv resolution

uv cannot resolve PEP 440 local version specifiers (e.g. +rocm6.4,
+rocm6.3) in pinned requirements. The --extra-index-url already points
to the correct ROCm wheel index and --index-strategy unsafe-best-match
(set in libbackend.sh) ensures the ROCm variant is preferred.

Applies the same fix as 7f5d72e8 (which resolved this for +cpu) across
all 14 hipblas requirements files.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

* revert: scope hipblas suffix fix to whisperx only

Reverts changes to non-whisperx hipblas requirements files per
maintainer review — other backends are building fine with the +rocm
local version suffix.

Signed-off-by: eureka928 <meobius123@gmail.com>

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Signed-off-by: eureka928 <meobius123@gmail.com>

---------

Signed-off-by: eureka928 <meobius123@gmail.com>
Co-authored-by: Claude Opus 4.5 <noreply@anthropic.com>
											
										
										
											2026-02-02 15:33:12 +00:00
+								    default: "cpu-whisperx-development"
 								    nvidia-cuda-13: "cuda13-whisperx-development"
 								    nvidia-cuda-12: "cuda12-whisperx-development"
 								- !!merge <<: *whisperx
 								  name: "cpu-whisperx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-whisperx"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-whisperx
 								- !!merge <<: *whisperx
 								  name: "cpu-whisperx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-whisperx"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-whisperx
 								- !!merge <<: *whisperx
 								  name: "cuda12-whisperx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-whisperx"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-whisperx
 								- !!merge <<: *whisperx
 								  name: "cuda12-whisperx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-whisperx"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-whisperx
 								- !!merge <<: *whisperx
 								  name: "rocm-whisperx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-whisperx"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-whisperx
 								- !!merge <<: *whisperx
 								  name: "rocm-whisperx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-whisperx"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-whisperx
 								- !!merge <<: *whisperx
 								  name: "cuda13-whisperx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-whisperx"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-whisperx
 								- !!merge <<: *whisperx
 								  name: "cuda13-whisperx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-whisperx"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-whisperx
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *whisperx
 								  name: "metal-whisperx"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-whisperx"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-whisperx
 								- !!merge <<: *whisperx
 								  name: "metal-whisperx-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-whisperx"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-whisperx
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## coqui
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *coqui
 								  name: "coqui-development"
 								  capabilities:
 								    nvidia: "cuda12-coqui-development"
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    intel: "intel-coqui-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								    amd: "rocm-coqui-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-coqui-development"
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *coqui
 								  name: "cuda12-coqui"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-coqui
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *coqui
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-coqui-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-coqui
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *coqui
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "rocm-coqui-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-coqui
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *coqui
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-coqui"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:latest-gpu-intel-coqui
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *coqui
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								  name: "intel-coqui-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
-												fix(backend gallery): intel images for python-based backends, re-add exllama2 (#5928)

chore(backend gallery): fix intel images for python-based backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-28 13:15:19 +00:00
+								    - localai/localai-backends:master-gpu-intel-coqui
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *coqui
 								  name: "rocm-coqui"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-coqui"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-coqui
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *coqui
 								  name: "metal-coqui"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-coqui"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-coqui
 								- !!merge <<: *coqui
 								  name: "metal-coqui-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-coqui"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-coqui
 								## outetts
 								- !!merge <<: *outetts
 								  name: "outetts-development"
 								  capabilities:
 								    default: "cpu-outetts-development"
 								    nvidia-cuda-12: "cuda12-outetts-development"
 								- !!merge <<: *outetts
 								  name: "cpu-outetts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-outetts"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-outetts
 								- !!merge <<: *outetts
 								  name: "cpu-outetts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-outetts"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-outetts
 								- !!merge <<: *outetts
 								  name: "cuda12-outetts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-outetts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-outetts
 								- !!merge <<: *outetts
 								  name: "cuda12-outetts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-outetts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-outetts
-												chore(backend gallery): re-order and add description for vLLM (#5676)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 15:31:53 +00:00
+								## chatterbox
-												feat(backends): add metas in the gallery (#5784)

* chore(backends): add metas in the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: correctly handle aliases and metas with same names

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-03 16:01:55 +00:00
+								- !!merge <<: *chatterbox
 								  name: "chatterbox-development"
 								  capabilities:
 								    nvidia: "cuda12-chatterbox-development"
-												feat(chatterbox): add MPS, and CPU, pin version (#6242)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-09 15:58:07 +00:00
+								    metal: "metal-chatterbox-development"
 								    default: "cpu-chatterbox-development"
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								    nvidia-l4t: "nvidia-l4t-arm64-chatterbox"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								    nvidia-cuda-13: "cuda13-chatterbox-development"
 								    nvidia-cuda-12: "cuda12-chatterbox-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-arm64-chatterbox"
-												fix(chatterbox): add support for cuda13/aarch64 (#8653)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-25 20:51:44 +00:00
+								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-chatterbox-development"
-												feat(chatterbox): add MPS, and CPU, pin version (#6242)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-09 15:58:07 +00:00
+								- !!merge <<: *chatterbox
 								  name: "cpu-chatterbox"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-chatterbox
 								- !!merge <<: *chatterbox
 								  name: "cpu-chatterbox-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-chatterbox
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								- !!merge <<: *chatterbox
 								  name: "nvidia-l4t-arm64-chatterbox"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-arm64-chatterbox"
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-arm64-chatterbox
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								- !!merge <<: *chatterbox
 								  name: "nvidia-l4t-arm64-chatterbox-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-arm64-chatterbox"
-												feat(chatterbox): support multilingual (#6240)

* feat(chatterbox): support multilingual

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add l4t support

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: switch to fork

Until https://github.com/resemble-ai/chatterbox/pull/295 is merged

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-24 16:37:37 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-arm64-chatterbox
-												feat(chatterbox): add MPS, and CPU, pin version (#6242)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-09-09 15:58:07 +00:00
+								- !!merge <<: *chatterbox
 								  name: "metal-chatterbox"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-chatterbox
 								- !!merge <<: *chatterbox
 								  name: "metal-chatterbox-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-chatterbox
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *chatterbox
-												chore(backends): move `bark-cpp` to the backend gallery (#5682)

chore(bark-cpp): move outside from binary

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-18 17:48:50 +00:00
+								  name: "cuda12-chatterbox-development"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-chatterbox"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-chatterbox
-												chore(backend gallery): add description for remaining backends (#5679)

* chore(backend gallery): add description for remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(backend gallery): add linter

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-06-17 20:21:44 +00:00
+								- !!merge <<: *chatterbox
 								  name: "cuda12-chatterbox"
-												feat: Add backend gallery (#5607)

* feat: Add backend gallery

This PR add support to manage backends as similar to models. There is
now available a backend gallery which can be used to install and remove
extra backends.
The backend gallery can be configured similarly as a model gallery, and
API calls allows to install and remove new backends in runtime, and as
well during the startup phase of LocalAI.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add backends docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* wip: Backend Dockerfile for python backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat: drop extras images, build python backends separately

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixup on all backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* test CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Tweaks

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop old backends leftovers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixup CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Move dockerfile upper

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix proto

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Feature dropped for consistency - we prefer model galleries

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add missing packages in the build image

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* exllama is ponly available on cublas

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* pin torch on chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups to index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Debug CI

* Install accellerators deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add target arch

* Add cuda minor version

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted runners

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* ci: use quay for test images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups for vllm and chatterbox

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Small fixups on CI

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chatterbox is only available for nvidia

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Simplify CI builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Adapt test, use qwen3

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(model gallery): add jina-reranker-v1-tiny-en-gguf

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use reranker from llama.cpp in AIO images

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Limit concurrent jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
											
										
										
											2025-06-15 12:56:52 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-chatterbox"
-												feat(backend gallery): add mirrors (#5910)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-07-25 17:20:08 +00:00
+								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-chatterbox
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *chatterbox
 								  name: "cuda13-chatterbox"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-chatterbox
 								- !!merge <<: *chatterbox
 								  name: "cuda13-chatterbox-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-chatterbox"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-chatterbox
 								- !!merge <<: *chatterbox
 								  name: "cuda13-nvidia-l4t-arm64-chatterbox"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-chatterbox"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-chatterbox
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								- !!merge <<: *chatterbox
 								  name: "cuda13-nvidia-l4t-arm64-chatterbox-development"
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-chatterbox"
-												feat: add cuda13 images (#7404)

* chore(ci): add cuda13 jobs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to pipelines and to capabilities. Start to work on the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* capabilities: try to detect by looking at /usr/local

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* backends.yaml

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 l4t requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add cuda13 requirements.txt

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin vllm

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Not all backends are compatible

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add vllm to requirements

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* vllm is not pre-compiled for cuda 13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-02 13:24:35 +00:00
+								  mirrors:
-												Fixup tags

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

											
										
										
											2025-12-02 14:15:41 +00:00
+								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-chatterbox
-												feat(vibevoice): add new backend (#7494)

* feat(vibevoice): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: add workflow and backend index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add vibevoice

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted for intel builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin python version for l4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-10 20:14:21 +00:00
+								## vibevoice
 								- !!merge <<: *vibevoice
 								  name: "vibevoice-development"
 								  capabilities:
 								    nvidia: "cuda12-vibevoice-development"
 								    intel: "intel-vibevoice-development"
 								    amd: "rocm-vibevoice-development"
 								    nvidia-l4t: "nvidia-l4t-vibevoice-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-vibevoice-development"
-												feat(vibevoice): add new backend (#7494)

* feat(vibevoice): add backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore: add workflow and backend index

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* chore(gallery): add vibevoice

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Use self-hosted for intel builds

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Pin python version for l4t

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2025-12-10 20:14:21 +00:00
+								    default: "cpu-vibevoice-development"
 								    nvidia-cuda-13: "cuda13-vibevoice-development"
 								    nvidia-cuda-12: "cuda12-vibevoice-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-vibevoice-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-vibevoice-development"
 								- !!merge <<: *vibevoice
 								  name: "cpu-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cpu-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda12-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda12-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda13-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda13-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "intel-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "intel-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "rocm-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "rocm-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "nvidia-l4t-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "nvidia-l4t-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda13-nvidia-l4t-arm64-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "cuda13-nvidia-l4t-arm64-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-vibevoice
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *vibevoice
 								  name: "metal-vibevoice"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-vibevoice
 								- !!merge <<: *vibevoice
 								  name: "metal-vibevoice-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-vibevoice"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-vibevoice
-												feat(qwen-tts): add Qwen-tts backend (#8163)

* feat(qwen-tts): add Qwen-tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update intel deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop flash-attn for cuda13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-23 14:18:41 +00:00
+								## qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "qwen-tts-development"
 								  capabilities:
 								    nvidia: "cuda12-qwen-tts-development"
 								    intel: "intel-qwen-tts-development"
 								    amd: "rocm-qwen-tts-development"
 								    nvidia-l4t: "nvidia-l4t-qwen-tts-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-qwen-tts-development"
-												feat(qwen-tts): add Qwen-tts backend (#8163)

* feat(qwen-tts): add Qwen-tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update intel deps

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Drop flash-attn for cuda13

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-23 14:18:41 +00:00
+								    default: "cpu-qwen-tts-development"
 								    nvidia-cuda-13: "cuda13-qwen-tts-development"
 								    nvidia-cuda-12: "cuda12-qwen-tts-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-tts-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-tts-development"
 								- !!merge <<: *qwen-tts
 								  name: "cpu-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cpu-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda12-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda12-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda13-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda13-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "intel-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "intel-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "rocm-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "rocm-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "nvidia-l4t-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "nvidia-l4t-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda13-nvidia-l4t-arm64-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "cuda13-nvidia-l4t-arm64-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-tts
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *qwen-tts
 								  name: "metal-qwen-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-qwen-tts
 								- !!merge <<: *qwen-tts
 								  name: "metal-qwen-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-qwen-tts"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-qwen-tts
-												feat: add fish-speech backend (#8962)

* feat: add fish-speech backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* drop portaudio

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-12 06:48:23 +00:00
+								## fish-speech
 								- !!merge <<: *fish-speech
 								  name: "fish-speech-development"
 								  capabilities:
 								    nvidia: "cuda12-fish-speech-development"
 								    intel: "intel-fish-speech-development"
 								    amd: "rocm-fish-speech-development"
 								    nvidia-l4t: "nvidia-l4t-fish-speech-development"
 								    metal: "metal-fish-speech-development"
 								    default: "cpu-fish-speech-development"
 								    nvidia-cuda-13: "cuda13-fish-speech-development"
 								    nvidia-cuda-12: "cuda12-fish-speech-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-fish-speech-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-fish-speech-development"
 								- !!merge <<: *fish-speech
 								  name: "cpu-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cpu-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda12-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda12-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda13-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda13-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "intel-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "intel-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "rocm-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "rocm-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "nvidia-l4t-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "nvidia-l4t-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda13-nvidia-l4t-arm64-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "cuda13-nvidia-l4t-arm64-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "metal-fish-speech"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-fish-speech
 								- !!merge <<: *fish-speech
 								  name: "metal-fish-speech-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-fish-speech"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-fish-speech
-												feat(backends): add faster-qwen3-tts (#8664)

* feat(backends): add faster-qwen3-tts

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: this backend is CUDA only

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fix: add requirements-install.txt with setuptools for build isolation

The faster-qwen3-tts backend requires setuptools to build packages
like sox that have setuptools as a build dependency. This ensures
the build completes successfully in CI.

Signed-off-by: LocalAI Bot <localai-bot@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Signed-off-by: LocalAI Bot <localai-bot@users.noreply.github.com>
Co-authored-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-27 07:16:51 +00:00
+								## faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "faster-qwen3-tts-development"
 								  capabilities:
 								    nvidia: "cuda12-faster-qwen3-tts-development"
 								    default: "cuda12-faster-qwen3-tts-development"
 								    nvidia-cuda-13: "cuda13-faster-qwen3-tts-development"
 								    nvidia-cuda-12: "cuda12-faster-qwen3-tts-development"
 								    nvidia-l4t: "nvidia-l4t-faster-qwen3-tts-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-faster-qwen3-tts-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts-development"
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda12-faster-qwen3-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda12-faster-qwen3-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda13-faster-qwen3-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda13-faster-qwen3-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "nvidia-l4t-faster-qwen3-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "nvidia-l4t-faster-qwen3-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts
 								- !!merge <<: *faster-qwen3-tts
 								  name: "cuda13-nvidia-l4t-arm64-faster-qwen3-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-faster-qwen3-tts
-												feat(qwen-asr): add support to qwen-asr (#8281)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-29 20:50:35 +00:00
+								## qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "qwen-asr-development"
 								  capabilities:
 								    nvidia: "cuda12-qwen-asr-development"
 								    intel: "intel-qwen-asr-development"
 								    amd: "rocm-qwen-asr-development"
 								    nvidia-l4t: "nvidia-l4t-qwen-asr-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-qwen-asr-development"
-												feat(qwen-asr): add support to qwen-asr (#8281)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-29 20:50:35 +00:00
+								    default: "cpu-qwen-asr-development"
 								    nvidia-cuda-13: "cuda13-qwen-asr-development"
 								    nvidia-cuda-12: "cuda12-qwen-asr-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-qwen-asr-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-qwen-asr-development"
 								- !!merge <<: *qwen-asr
 								  name: "cpu-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cpu-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda12-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda12-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda13-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda13-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "intel-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "intel-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "rocm-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "rocm-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "nvidia-l4t-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "nvidia-l4t-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda13-nvidia-l4t-arm64-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "cuda13-nvidia-l4t-arm64-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-qwen-asr
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *qwen-asr
 								  name: "metal-qwen-asr"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-qwen-asr
 								- !!merge <<: *qwen-asr
 								  name: "metal-qwen-asr-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-qwen-asr"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-qwen-asr
-												feat(nemo): add Nemo (only asr for now) backend (#8436)

* feat(nemo): add Nemo (only asr for now) backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat(nemo): add Nemo backend without Python version pins (#8438)

* Initial plan

* Remove Python version pins from nemo backend install.sh

Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

* Pin pyarrow to 20.0.0 in nemo requirements

Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

---------

Co-authored-by: copilot-swe-agent[bot] <198982749+Copilot@users.noreply.github.com>
Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
Co-authored-by: Copilot <198982749+Copilot@users.noreply.github.com>
Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>
											
										
										
											2026-02-07 07:19:37 +00:00
+								## nemo
 								- !!merge <<: *nemo
 								  name: "nemo-development"
 								  capabilities:
 								    nvidia: "cuda12-nemo-development"
 								    intel: "intel-nemo-development"
 								    amd: "rocm-nemo-development"
 								    metal: "metal-nemo-development"
 								    default: "cpu-nemo-development"
 								    nvidia-cuda-13: "cuda13-nemo-development"
 								    nvidia-cuda-12: "cuda12-nemo-development"
 								- !!merge <<: *nemo
 								  name: "cpu-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-nemo
 								- !!merge <<: *nemo
 								  name: "cpu-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-nemo
 								- !!merge <<: *nemo
 								  name: "cuda12-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-nemo
 								- !!merge <<: *nemo
 								  name: "cuda12-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-nemo
 								- !!merge <<: *nemo
 								  name: "cuda13-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-nemo
 								- !!merge <<: *nemo
 								  name: "cuda13-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-nemo
 								- !!merge <<: *nemo
 								  name: "intel-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-nemo
 								- !!merge <<: *nemo
 								  name: "intel-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-nemo
 								- !!merge <<: *nemo
 								  name: "rocm-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-nemo
 								- !!merge <<: *nemo
 								  name: "rocm-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-nemo
 								- !!merge <<: *nemo
 								  name: "metal-nemo"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-nemo"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-nemo
 								- !!merge <<: *nemo
 								  name: "metal-nemo-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-nemo"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-nemo
-												feat: add VoxCPM tts backend (#8109)

* feat: add VoxCPM tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable voxcpm on arm64 cpu

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-28 13:44:04 +00:00
+								## voxcpm
 								- !!merge <<: *voxcpm
 								  name: "voxcpm-development"
 								  capabilities:
 								    nvidia: "cuda12-voxcpm-development"
 								    intel: "intel-voxcpm-development"
 								    amd: "rocm-voxcpm-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-voxcpm-development"
-												feat: add VoxCPM tts backend (#8109)

* feat: add VoxCPM tts backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Disable voxcpm on arm64 cpu

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-28 13:44:04 +00:00
+								    default: "cpu-voxcpm-development"
 								    nvidia-cuda-13: "cuda13-voxcpm-development"
 								    nvidia-cuda-12: "cuda12-voxcpm-development"
 								- !!merge <<: *voxcpm
 								  name: "cpu-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "cpu-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "cuda12-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "cuda12-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "cuda13-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "cuda13-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "intel-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "intel-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "rocm-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "rocm-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-voxcpm
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *voxcpm
 								  name: "metal-voxcpm"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-voxcpm
 								- !!merge <<: *voxcpm
 								  name: "metal-voxcpm-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-voxcpm"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-voxcpm
-												feat(tts): add pocket-tts backend (#8018)

* feat(pocket-tts): add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-13 22:35:19 +00:00
+								## pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "pocket-tts-development"
 								  capabilities:
 								    nvidia: "cuda12-pocket-tts-development"
 								    intel: "intel-pocket-tts-development"
 								    amd: "rocm-pocket-tts-development"
 								    nvidia-l4t: "nvidia-l4t-pocket-tts-development"
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								    metal: "metal-pocket-tts-development"
-												feat(tts): add pocket-tts backend (#8018)

* feat(pocket-tts): add new backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Add to the gallery

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* fixups

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Update docs

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-01-13 22:35:19 +00:00
+								    default: "cpu-pocket-tts-development"
 								    nvidia-cuda-13: "cuda13-pocket-tts-development"
 								    nvidia-cuda-12: "cuda12-pocket-tts-development"
 								    nvidia-l4t-cuda-12: "nvidia-l4t-pocket-tts-development"
 								    nvidia-l4t-cuda-13: "cuda13-nvidia-l4t-arm64-pocket-tts-development"
 								- !!merge <<: *pocket-tts
 								  name: "cpu-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cpu-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda12-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-12-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-12-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda12-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-12-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-12-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda13-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-nvidia-cuda-13-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-nvidia-cuda-13-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda13-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-nvidia-cuda-13-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-nvidia-cuda-13-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "intel-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-intel-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-intel-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "intel-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-intel-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-intel-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "rocm-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-gpu-rocm-hipblas-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-gpu-rocm-hipblas-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "rocm-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-gpu-rocm-hipblas-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-gpu-rocm-hipblas-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "nvidia-l4t-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "nvidia-l4t-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda13-nvidia-l4t-arm64-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-nvidia-l4t-cuda-13-arm64-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-nvidia-l4t-cuda-13-arm64-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "cuda13-nvidia-l4t-arm64-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-nvidia-l4t-cuda-13-arm64-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-nvidia-l4t-cuda-13-arm64-pocket-tts
-												feat(metal): try to extend support to remaining backends (#8374)

* feat(metal): try to extend support to remaining backends

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* neutts doesn't work

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* split outetts out of transformers

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Remove torch pin to whisperx

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-03 20:57:50 +00:00
+								- !!merge <<: *pocket-tts
 								  name: "metal-pocket-tts"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-pocket-tts
 								- !!merge <<: *pocket-tts
 								  name: "metal-pocket-tts-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-pocket-tts"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-pocket-tts
-												feat(voxtral): add voxtral backend (#8451)

* feat(voxtral): add voxtral backend

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* simplify

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-02-09 08:12:05 +00:00
+								## voxtral
 								- !!merge <<: *voxtral
 								  name: "cpu-voxtral"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-voxtral"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-voxtral
 								- !!merge <<: *voxtral
 								  name: "cpu-voxtral-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-voxtral"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-voxtral
 								- !!merge <<: *voxtral
 								  name: "metal-voxtral"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-voxtral"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-voxtral
 								- !!merge <<: *voxtral
 								  name: "metal-voxtral-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-metal-darwin-arm64-voxtral"
 								  mirrors:
 								    - localai/localai-backends:master-metal-darwin-arm64-voxtral
-												feat: add (experimental) fine-tuning support with TRL (#9088)

* feat: add fine-tuning endpoint

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* feat(experimental): add fine-tuning endpoint and TRL support

This changeset defines new GRPC signatues for Fine tuning backends, and
add TRL backend as initial fine-tuning engine. This implementation also
supports exporting to GGUF and automatically importing it to LocalAI
after fine-tuning.

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* commit TRL backend, stop by killing process

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* move fine-tune to generic features

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* add evals, reorder menu

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

* Fix tests

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

---------

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-21 01:08:02 +00:00
+								- &trl
 								  name: "trl"
 								  alias: "trl"
 								  license: apache-2.0
 								  description: |
 								    HuggingFace TRL fine-tuning backend. Supports SFT, DPO, GRPO, RLOO, Reward, KTO, ORPO training methods.
 								    Works on CPU and GPU.
 								  urls:
 								    - https://github.com/huggingface/trl
 								  tags:
 								    - fine-tuning
 								    - LLM
 								    - CPU
 								    - GPU
 								    - CUDA
 								  capabilities:
 								    default: "cpu-trl"
 								    nvidia: "cuda12-trl"
 								    nvidia-cuda-12: "cuda12-trl"
 								    nvidia-cuda-13: "cuda13-trl"
 								## TRL backend images
 								- !!merge <<: *trl
 								  name: "cpu-trl"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-trl"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-trl
 								- !!merge <<: *trl
 								  name: "cpu-trl-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cpu-trl"
 								  mirrors:
 								    - localai/localai-backends:master-cpu-trl
 								- !!merge <<: *trl
 								  name: "cuda12-trl"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cublas-cuda12-trl"
 								  mirrors:
 								    - localai/localai-backends:latest-cublas-cuda12-trl
 								- !!merge <<: *trl
 								  name: "cuda12-trl-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cublas-cuda12-trl"
 								  mirrors:
 								    - localai/localai-backends:master-cublas-cuda12-trl
 								- !!merge <<: *trl
 								  name: "cuda13-trl"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cublas-cuda13-trl"
 								  mirrors:
 								    - localai/localai-backends:latest-cublas-cuda13-trl
 								- !!merge <<: *trl
 								  name: "cuda13-trl-development"
 								  uri: "quay.io/go-skynet/local-ai-backends:master-cublas-cuda13-trl"
 								  mirrors:
 								    - localai/localai-backends:master-cublas-cuda13-trl
-												feat(quantization): add quantization backend (#9096)

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
											
										
										
											2026-03-21 23:56:34 +00:00
+								## llama.cpp quantization backend
 								- &llama-cpp-quantization
 								  name: "llama-cpp-quantization"
 								  alias: "llama-cpp-quantization"
 								  license: mit
 								  icon: https://user-images.githubusercontent.com/1991296/230134379-7181e485-c521-4d23-a0d6-f7b3b61ba524.png
 								  description: |
 								    Model quantization backend using llama.cpp. Downloads HuggingFace models, converts them to GGUF format,
 								    and quantizes them to various formats (q4_k_m, q5_k_m, q8_0, f16, etc.).
 								  urls:
 								    - https://github.com/ggml-org/llama.cpp
 								  tags:
 								    - quantization
 								    - GGUF
 								    - CPU
 								  capabilities:
 								    default: "cpu-llama-cpp-quantization"
 								    metal: "metal-darwin-arm64-llama-cpp-quantization"
 								- !!merge <<: *llama-cpp-quantization
 								  name: "cpu-llama-cpp-quantization"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-cpu-llama-cpp-quantization"
 								  mirrors:
 								    - localai/localai-backends:latest-cpu-llama-cpp-quantization
 								- !!merge <<: *llama-cpp-quantization
 								  name: "metal-darwin-arm64-llama-cpp-quantization"
 								  uri: "quay.io/go-skynet/local-ai-backends:latest-metal-darwin-arm64-llama-cpp-quantization"
 								  mirrors:
 								    - localai/localai-backends:latest-metal-darwin-arm64-llama-cpp-quantization