LocalAI

mirror of https://github.com/mudler/LocalAI synced 2026-05-24 09:28:23 +00:00

Author	SHA1	Message	Date
Ettore Di Giacinto	031a36c995	feat: inferencing default, automatic tool parsing fallback and wire min_p (#9092 ) * feat: wire min_p Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat: inferencing defaults Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(refactor): re-use iterative parser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: generate automatically inference defaults from unsloth Instead of trying to re-invent the wheel and maintain here the inference defaults, prefer to consume unsloth ones, and contribute there as necessary. Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: apply defaults also to models installed via gallery Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: be consistent and apply fallback to all endpoint Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-03-22 00:57:15 +01:00
LocalAI [bot]	aa3e82976e	chore: ⬆️ Update ggml-org/llama.cpp to `4cb7e0bd61e7e1101e8ab10db5dee70c5717a386` (#9087 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-21 09:41:11 +01:00
Ettore Di Giacinto	c3174f9543	chore(deps): bump llama-cpp to 'a0bbcdd9b6b83eeeda6f1216088f42c33d464e38' (#9079 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-03-20 08:12:21 +01:00
LocalAI [bot]	9a9da062e1	chore: ⬆️ Update ggml-org/llama.cpp to `5744d7ec430e2f875a393770195fda530560773f` (#9063 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-19 07:58:30 +01:00
LocalAI [bot]	a58475dbef	chore: ⬆️ Update ggml-org/llama.cpp to `ee4801e5a6ee7ee4063144ab44ab4e127f76fba8` (#9044 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-18 08:46:12 +01:00
LocalAI [bot]	118bcee196	chore: ⬆️ Update ggml-org/llama.cpp to `9b342d0a9f2f4892daec065491583ec2be129685` (#9039 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-17 10:22:42 +01:00
LocalAI [bot]	b2030255ca	chore: ⬆️ Update ggml-org/llama.cpp to `88915cb55c14769738fcab7f1c6eaa6dcc9c2b0c` (#9020 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-16 00:10:11 +01:00
LocalAI [bot]	87525109f1	chore: ⬆️ Update ggml-org/llama.cpp to `3a6f059909ed5dab8587df5df4120315053d57a4` (#9009 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-15 09:46:45 +01:00
LocalAI [bot]	977063c4ba	chore: ⬆️ Update ggml-org/llama.cpp to `e30f1fdf74ea9238ff562901aa974c75aab6619b` (#8997 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-14 01:16:42 +01:00
LocalAI [bot]	46a8941a2c	chore: ⬆️ Update ggml-org/llama.cpp to `57819b8d4b39d893408e51520dff3d47d1ebb757` (#8983 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-13 07:59:15 +01:00
Richard Palethorpe	b24ca51287	fix(llama-cpp): Set enable_thinking in the correct place (#8973 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2026-03-12 13:32:29 +01:00
LocalAI [bot]	270eb956c7	chore: ⬆️ Update ggml-org/llama.cpp to `10e5b148b061569aaee8ae0cf72a703129df0eab` (#8946 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-11 08:04:09 +01:00
LocalAI [bot]	b48920ecf6	chore: ⬆️ Update ggml-org/llama.cpp to `23fbfcb1ad6c6f76b230e8895254de785000be46` (#8921 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-10 07:30:43 +01:00
LocalAI [bot]	f06c02d10e	chore: ⬆️ Update ggml-org/llama.cpp to `35bee031e17ed2b2e8e7278b284a6c8cd120d9f8` (#8872 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-08 22:25:04 +01:00
Ettore Di Giacinto	b2f81bfa2e	feat(functions): add peg-based parsing and allow backends to return tool calls directly (#8838 ) * feat(functions): add peg-based parsing Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat: support returning toolcalls directly from backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: do run PEG only if backend didn't send deltas Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-03-08 22:21:57 +01:00
LocalAI [bot]	1296167f84	chore: ⬆️ Update ggml-org/llama.cpp to `c5a778891ba0ddbd4cbb507c823f970595b1adc2` (#8837 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-07 23:28:06 +01:00
LocalAI [bot]	e1df6807dc	chore: ⬆️ Update ggml-org/llama.cpp to `566059a26b0ce8faec4ea053605719d399c64cc5` (#8822 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-06 23:53:23 +01:00
Ettore Di Giacinto	580517f9db	feat: pass-by metadata to predict options (#8795 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-03-05 22:50:10 +01:00
LocalAI [bot]	0cf7c18177	chore: ⬆️ Update ggml-org/llama.cpp to `a0ed91a442ea6b013bd42ebc3887a81792eaefa1` (#8797 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-05 22:49:45 +01:00
LocalAI [bot]	f25e450414	chore: ⬆️ Update ggml-org/llama.cpp to `24d2ee052795063afffc9732465ca1b1c65f4a28` (#8777 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-04 23:25:48 +01:00
LocalAI [bot]	6002c940a9	chore: ⬆️ Update ggml-org/llama.cpp to `ecd99d6a9acbc436bad085783bcd5d0b9ae9e9e9` (#8762 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-03-04 08:08:37 +01:00
LocalAI [bot]	d846ad3a84	chore: ⬆️ Update ggml-org/llama.cpp to `4d828bd1ab52773ba9570cc008cf209eb4a8b2f5` (#8727 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-02 23:22:28 +01:00
LocalAI [bot]	b61536c0f4	chore: ⬆️ Update ggml-org/llama.cpp to `319146247e643695f94a558e8ae686277dd4f8da` (#8707 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-02 10:08:51 +01:00
LocalAI [bot]	ddb36468ed	chore: ⬆️ Update ggml-org/llama.cpp to `05728db18eea59de81ee3a7699739daaf015206b` (#8683 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-03-01 00:48:26 +01:00
Ettore Di Giacinto	1c5dc83232	chore(deps): bump llama.cpp to 'ecbcb7ea9d3303097519723b264a8b5f1e977028' (#8672 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-02-28 00:33:56 +01:00
LocalAI [bot]	8ad40091a6	chore: ⬆️ Update ggml-org/llama.cpp to `723c71064da0908c19683f8c344715fbf6d986fd` (#8660 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-26 21:34:47 +00:00
LocalAI [bot]	fb86f6461d	chore: ⬆️ Update ggml-org/llama.cpp to `3769fe6eb70b0a0fbb30b80917f1caae68c902f7` (#8655 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-26 00:05:03 +01:00
LocalAI [bot]	1331e23b67	chore: ⬆️ Update ggml-org/llama.cpp to `418dea39cea85d3496c8b04a118c3b17f3940ad8` (#8649 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-25 00:04:48 +00:00
LocalAI [bot]	9a5b5ee8a9	chore: ⬆️ Update ggml-org/llama.cpp to `b68a83e641b3ebe6465970b34e99f3f0e0a0b21a` (#8628 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-23 22:02:40 +00:00
LocalAI [bot]	f40c8dd0ce	chore: ⬆️ Update ggml-org/llama.cpp to `2b6dfe824de8600c061ef91ce5cc5c307f97112c` (#8622 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-23 09:30:58 +00:00
LocalAI [bot]	91f2dd5820	chore: ⬆️ Update ggml-org/llama.cpp to `f75c4e8bf52ea480ece07fd3d9a292f1d7f04bc5` (#8619 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-22 13:20:08 +01:00
LocalAI [bot]	fcecc12e57	chore: ⬆️ Update ggml-org/llama.cpp to `ba3b9c8844aca35ecb40d31886686326f22d2214` (#8613 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-02-21 09:57:04 +01:00
LocalAI [bot]	bb0924dff1	chore: ⬆️ Update ggml-org/llama.cpp to `b908baf1825b1a89afef87b09e22c32af2ca6548` (#8612 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-20 23:47:47 +01:00
LocalAI [bot]	b1c434f0fc	chore: ⬆️ Update ggml-org/llama.cpp to `11c325c6e0666a30590cde390d5746a405e536b9` (#8607 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-19 23:32:35 +01:00
LocalAI [bot]	68c7077491	chore: ⬆️ Update ggml-org/llama.cpp to `b55dcdef5dcd74dc75c4921090e928d43453c157` (#8599 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-18 22:33:25 +01:00
LocalAI [bot]	ed832cf0e0	chore: ⬆️ Update ggml-org/llama.cpp to `2b089c77580d347767f440205103e4da8ec33d89` (#8592 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-02-17 22:35:07 +00:00
Richard Palethorpe	9e692967c3	fix(llama-cpp): Pass parameters when using embedded template (#8590 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2026-02-17 18:50:05 +01:00
LocalAI [bot]	067a255435	chore: ⬆️ Update ggml-org/llama.cpp to `d612901116ab2066c7923372d4827032ff296bc4` (#8588 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-17 00:57:32 +01:00
LocalAI [bot]	109f29cc24	chore: ⬆️ Update ggml-org/llama.cpp to `27b93cbd157fc4ad94573a1fbc226d3e18ea1bb4` (#8577 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-15 23:42:36 +01:00
LocalAI [bot]	d784851337	chore: ⬆️ Update ggml-org/llama.cpp to `01d8eaa28d57bfc6d06e30072085ed0ef12e06c5` (#8567 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-14 22:52:32 +01:00
Austen	42cb7bda19	fix(llama-cpp): populate tensor_buft_override buffer so llama-cpp properly performs fit calculations (#8560 ) fix auto-fit for llama-cpp	2026-02-14 10:07:37 +01:00
LocalAI [bot]	2ff0ad4190	chore: ⬆️ Update ggml-org/llama.cpp to `05a6f0e8946914918758db767f6eb04bc1e38507` (#8553 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-13 22:48:01 +01:00
LocalAI [bot]	08718b656e	chore: ⬆️ Update ggml-org/llama.cpp to `338085c69e486b7155e5b03d7b5087e02c0e2528` (#8538 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-12 23:21:53 +01:00
LocalAI [bot]	79a25f7ae9	chore: ⬆️ Update ggml-org/llama.cpp to `4d3daf80f8834e0eb5148efc7610513f1e263653` (#8513 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-11 21:48:39 +00:00
LocalAI [bot]	0ee92317ec	chore: ⬆️ Update ggml-org/llama.cpp to `57487a64c88c152ac72f3aea09bd1cc491b2f61e` (#8499 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-10 21:32:46 +00:00
LocalAI [bot]	df04843f34	chore: ⬆️ Update ggml-org/llama.cpp to `262364e31d1da43596fe84244fba44e94a0de64e` (#8479 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-10 15:14:33 +01:00
LocalAI [bot]	3b1b08efd6	chore: ⬆️ Update ggml-org/llama.cpp to `e06088da0fa86aa444409f38dff274904931c507` (#8464 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-09 09:09:32 +01:00
LocalAI [bot]	944874d08b	chore: ⬆️ Update ggml-org/llama.cpp to `8872ad2125336d209a9911a82101f80095a9831d` (#8448 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-07 21:22:18 +00:00
LocalAI [bot]	ae2689936a	chore: ⬆️ Update ggml-org/llama.cpp to `b83111815e9a79949257e9d4b087206b320a3063` (#8434 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-06 21:22:33 +00:00
LocalAI [bot]	bcd927da6e	chore: ⬆️ Update ggml-org/llama.cpp to `22cae832188a1f08d18bd0a707a4ba5cd03c7349` (#8419 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-06 09:21:33 +01:00
LocalAI [bot]	c30866ba95	chore: ⬆️ Update ggml-org/llama.cpp to `b536eb023368701fe3564210440e2df6151c3e65` (#8399 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-04 23:08:08 +01:00
LocalAI [bot]	8cae99229c	chore: ⬆️ Update ggml-org/llama.cpp to `2634ed207a17db1a54bd8df0555bd8499a6ab691` (#8336 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-02-01 21:23:57 +00:00
LocalAI [bot]	3445415b3d	chore: ⬆️ Update ggml-org/llama.cpp to `41ea26144e55d23f37bb765f88c07588d786567f` (#8317 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-31 21:18:31 +00:00
LocalAI [bot]	b05e110aa6	chore: ⬆️ Update ggml-org/llama.cpp to `1488339138d609139c4400d1b80f8a5b1a9a203c` (#8306 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-31 08:59:09 +01:00
LocalAI [bot]	2c44b06a67	chore: ⬆️ Update ggml-org/llama.cpp to `4fdbc1e4dba428ce0cf9d2ac22232dc170bbca82` (#8283 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-29 23:43:29 +01:00
Ettore Di Giacinto	48e08772f3	chore(llama.cpp): bump to 'f6b533d898ce84bae8d9fa8dfc6697ac087800bf' (#8275 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-29 00:22:25 +01:00
LocalAI [bot]	9916811a79	chore: ⬆️ Update ggml-org/llama.cpp to `2b4cbd2834e427024bc7f935a1f232aecac6679b` (#8258 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-01-28 08:50:16 +01:00
LocalAI [bot]	3c1f823c47	chore: ⬆️ Update ggml-org/llama.cpp to `8f80d1b254aef70a0959e314be368d05debe7294` (#8229 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-26 21:19:43 +00:00
LocalAI [bot]	f76958d761	chore: ⬆️ Update ggml-org/llama.cpp to `0440bfd1605333726ea0fb7a836942660bf2f9a6` (#8216 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-26 00:50:35 +01:00
LocalAI [bot]	05a332cd5f	chore: ⬆️ Update ggml-org/llama.cpp to `bb02f74c612064947e51d23269a1cf810b67c9a7` (#8196 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-24 21:19:43 +00:00
LocalAI [bot]	4019094111	chore: ⬆️ Update ggml-org/llama.cpp to `557515be1e93ed8939dd8a7c7d08765fdbe8be31` (#8183 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-24 08:57:08 +01:00
Ettore Di Giacinto	c0b21a921b	feat: detect thinking support from backend automatically if not explicitly set (#8167 ) detect thinking support from backend automatically if not explicitly set Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-23 00:38:28 +01:00
LocalAI [bot]	b10045adc2	chore: ⬆️ Update ggml-org/llama.cpp to `a5eaa1d6a3732bc0f460b02b61c95680bba5a012` (#8165 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-01-22 23:32:05 +00:00
LocalAI [bot]	c12b310028	chore: ⬆️ Update ggml-org/llama.cpp to `c301172f660a1fe0b42023da990bf7385d69adb4` (#8151 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-22 00:51:22 +01:00
LocalAI [bot]	5687df4535	chore: ⬆️ Update ggml-org/llama.cpp to `ad8d85bd94cc86e89d23407bdebf98f2e6510c61` (#8145 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-21 15:41:36 +00:00
Ettore Di Giacinto	f6daaa7c35	chore(deps): Bump llama.cpp to '1c7cf94b22a9dc6b1d32422f72a627787a4783a3' (#8136 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-21 00:12:13 +01:00
LocalAI [bot]	d3525b7509	chore: ⬆️ Update ggml-org/llama.cpp to `959ecf7f234dc0bc0cd6829b25cb0ee1481aa78a` (#8122 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-19 22:50:47 +01:00
LocalAI [bot]	ab8ed24358	chore: ⬆️ Update ggml-org/llama.cpp to `287a33017b32600bfc0e81feeb0ad6e81e0dd484` (#8100 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-18 22:40:14 +01:00
LocalAI [bot]	1cd33047b4	chore: ⬆️ Update ggml-org/llama.cpp to `2fbde785bc106ae1c4102b0e82b9b41d9c466579` (#8087 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-17 21:10:18 +00:00
LocalAI [bot]	d4fd0c0609	chore: ⬆️ Update ggml-org/llama.cpp to `388ce822415f24c60fcf164a321455f1e008cafb` (#8073 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-16 21:22:33 +00:00
LocalAI [bot]	cb8616c7d1	chore: ⬆️ Update ggml-org/llama.cpp to `785a71008573e2d84728fb0ba9e851d72d3f8fab` (#8053 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-15 22:53:17 +01:00
LocalAI [bot]	49d6305509	chore: ⬆️ Update ggml-org/llama.cpp to `d98b548120eecf98f0f6eaa1ba7e29b3afda9f2e` (#8040 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-15 08:39:46 +01:00
LocalAI [bot]	d6e698876b	chore: ⬆️ Update ggml-org/llama.cpp to `e4832e3ae4d58ac0ecbdbf4ae055424d6e628c9f` (#8015 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-14 08:09:37 +01:00
LocalAI [bot]	7e35ec6c4f	chore: ⬆️ Update ggml-org/llama.cpp to `bcf7546160982f56bc290d2e538544bbc0772f63` (#7991 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-12 21:14:33 +00:00
LocalAI [bot]	bc180c2638	chore: ⬆️ Update ggml-org/llama.cpp to `0c3b7a9efebc73d206421c99b7eb6b6716231322` (#7978 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-11 22:06:30 +01:00
LocalAI [bot]	5bfc3eebf8	chore: ⬆️ Update ggml-org/llama.cpp to `b1377188784f9aea26b8abde56d4aee8c733eec7` (#7965 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-10 22:24:26 +01:00
LocalAI [bot]	fdc2c0737c	chore: ⬆️ Update ggml-org/llama.cpp to `593da7fa49503b68f9f01700be9f508f1e528992` (#7946 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-09 21:13:04 +00:00
Ettore Di Giacinto	f4b0a304d7	chore(llama.cpp): propagate errors during model load (#7937 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-09 07:52:49 +01:00
Ettore Di Giacinto	d16ec7aa9e	chore(deps): Bump llama.cpp to '480160d47297df43b43746294963476fc0a6e10f' (#7933 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-09 07:52:32 +01:00
LocalAI [bot]	c03e532a18	chore: ⬆️ Update ggml-org/llama.cpp to `ae9f8df77882716b1702df2bed8919499e64cc28` (#7915 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-07 23:24:01 +01:00
Copilot	fd53978a7b	feat: package GPU libraries inside backend containers for unified base image (#7891 ) * Initial plan * Add GPU library packaging for isolated backend environments - Create scripts/build/package-gpu-libs.sh for packaging CUDA, ROCm, SYCL, and Vulkan libraries - Update llama-cpp, whisper, stablediffusion-ggml package.sh to include GPU libraries - Update Dockerfile.python to package GPU libraries into Python backends - Update libbackend.sh to set LD_LIBRARY_PATH for GPU library loading Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> * Address code review feedback: fix variable consistency and quoting Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> * Fix code review issues: improve glob handling and remove redundant variable Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> * Simplify main Dockerfile and workflow to use unified base image - Remove GPU-specific driver installation from Dockerfile (CUDA, ROCm, Vulkan, Intel) - Simplify image.yml workflow to build single unified base image for linux/amd64 and linux/arm64 - GPU libraries are now packaged in individual backend containers Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> --------- Co-authored-by: copilot-swe-agent[bot] <198982749+Copilot@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-01-07 15:48:51 +01:00
LocalAI [bot]	fb9879949c	chore: ⬆️ Update ggml-org/llama.cpp to `ccbc84a5374bab7a01f68b129411772ddd8e7c79` (#7894 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-06 22:18:35 +01:00
Ettore Di Giacinto	26c4f80d1b	chore(llama.cpp/flags): simplify conditionals (#7887 ) If ggml handle conditionals correctly we don't need to handle it here. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-06 15:02:20 +01:00
coffeerunhobby	5add7b47f5	fix: BMI2 crash on AVX-only CPUs (Intel Ivy Bridge/Sandy Bridge) (#7864 ) * Fix BMI2 crash on AVX-only CPUs (Intel Ivy Bridge/Sandy Bridge) Signed-off-by: coffeerunhobby <coffeerunhobby@users.noreply.github.com> * Address feedback from review Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: coffeerunhobby <coffeerunhobby@users.noreply.github.com> Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: coffeerunhobby <coffeerunhobby@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2026-01-06 00:13:48 +00:00
LocalAI [bot]	4f7b6b0bff	chore: ⬆️ Update ggml-org/llama.cpp to `e443fbcfa51a8a27b15f949397ab94b5e87b2450` (#7881 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-05 22:55:40 +01:00
LocalAI [bot]	9d3da0bed5	chore: ⬆️ Update ggml-org/llama.cpp to `4974bf53cf14073c7b66e1151348156aabd42cb8` (#7861 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-05 00:10:18 +01:00
LocalAI [bot]	a7e155240b	chore: ⬆️ Update ggml-org/llama.cpp to `e57f52334b2e8436a94f7e332462dfc63a08f995` (#7848 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-04 10:27:45 +01:00
coffeerunhobby	666d110714	fix: Prevent BMI2 instruction crash on AVX-only CPUs (#7817 ) * Fix: Prevent BMI2 instruction crash on AVX-only CPUs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: apply no-bmi flags on non-darwin Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Co-authored-by: coffeerunhobby <coffeerunhobby@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-03 08:36:55 +01:00
LocalAI [bot]	641606ae93	chore: ⬆️ Update ggml-org/llama.cpp to `706e3f93a60109a40f1224eaf4af0d59caa7c3ae` (#7836 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-02 21:26:37 +00:00
Ettore Di Giacinto	5f6c941399	fix(llama.cpp/mmproj): fix loading mmproj in nested sub-dirs different from model path (#7832 ) fix(mmproj): fix loading mmproj in nested sub-dirs Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2026-01-02 20:17:30 +01:00
LocalAI [bot]	949de04052	chore: ⬆️ Update ggml-org/llama.cpp to `ced765be44ce173c374f295b3c6f4175f8fd109b` (#7822 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2026-01-02 08:44:49 +01:00
LocalAI [bot]	bc3e8793ed	chore: ⬆️ Update ggml-org/llama.cpp to `13814eb370d2f0b70e1830cc577b6155b17aee47` (#7809 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-31 23:04:01 +01:00
LocalAI [bot]	218f3a126a	chore: ⬆️ Update ggml-org/llama.cpp to `0f89d2ecf14270f45f43c442e90ae433fd82dab1` (#7795 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-31 08:53:41 +01:00
LocalAI [bot]	bc8ec5cb39	chore: ⬆️ Update ggml-org/llama.cpp to `c9a3b40d6578f2381a1373d10249403d58c3c5bd` (#7778 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-30 08:27:16 +01:00
LocalAI [bot]	1a6fd0f7fc	chore: ⬆️ Update ggml-org/llama.cpp to `4ffc47cb2001e7d523f9ff525335bbe34b1a2858` (#7760 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-28 21:10:39 +00:00
LocalAI [bot]	c95c482f36	chore: ⬆️ Update ggml-org/llama.cpp to `a4bf35889eda36d3597cd0f8f333f5b8a2fcaefc` (#7751 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-27 21:09:12 +00:00
LocalAI [bot]	ddf0281785	chore: ⬆️ Update ggml-org/llama.cpp to `7ac8902133da6eb390c4d8368a7d252279123942` (#7740 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-26 21:44:34 +00:00
LocalAI [bot]	86c68c9623	chore: ⬆️ Update ggml-org/llama.cpp to `85c40c9b02941ebf1add1469af75f1796d513ef4` (#7731 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-25 21:10:28 +00:00
LocalAI [bot]	2fe6e278c8	chore: ⬆️ Update ggml-org/llama.cpp to `c18428423018ed214c004e6ecaedb0cbdda06805` (#7718 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-12-25 10:00:40 +01:00
Ettore Di Giacinto	0a168830ea	chore(deps): Bump llama.cpp to '5b6c9bc0f3c8f55598b9999b65aff7ce4119bc15' and refactor usage of base params (#7706 ) * chore(deps): Bump llama.cpp to '5b6c9bc0f3c8f55598b9999b65aff7ce4119bc15' and refactor usage of base params Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: update AGENTS.md Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-24 00:28:27 +01:00

1 2 3 4 5 ...

328 commits