LocalAI

mirror of https://github.com/mudler/LocalAI synced 2026-05-09 02:00:44 +00:00

Author	SHA1	Message	Date
Ettore Di Giacinto	ce5662ba90	chore(deps): bump llama.cpp to '72b24d96c6888c609d562779a23787304ae4609c' (#6349 ) * chore(deps): bump llama.cpp to '72b24d96c6888c609d562779a23787304ae4609c' Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Disable OPENSSL (just introduced upstream) Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-27 13:55:51 +02:00
Ettore Di Giacinto	9878f27813	chore(deps): bump llama.cpp to '835b2b915c52bcabcd688d025eacff9a07b65f52' (#6347 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-26 23:26:14 +02:00
jongames	f2b9452ec4	fix: reranking models limited to 512 tokens in llama.cpp backend (#6344 ) Fix reranking models being limited to 512 tokens input in llama.cpp backend Signed-off-by: JonGames <18472148+jongames@users.noreply.github.com>	2025-09-25 23:32:07 +00:00
LocalAI [bot]	238c68c57b	chore: ⬆️ Update ggml-org/llama.cpp to `4ae88d07d026e66b41e85afece74e88af54f4e66` (#6339 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-25 08:47:02 +02:00
LocalAI [bot]	737248256e	chore: ⬆️ Update ggml-org/llama.cpp to `1d0125bcf1cbd7195ad0faf826a20bc7cec7d3f4` (#6335 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-22 21:13:34 +00:00
LocalAI [bot]	6afcb932b7	chore: ⬆️ Update ggml-org/llama.cpp to `da30ab5f8696cabb2d4620cdc0aa41a298c54fd6` (#6321 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-21 21:28:27 +00:00
LocalAI [bot]	e74ade9ebb	chore: ⬆️ Update ggml-org/llama.cpp to `7f766929ca8e8e01dcceb1c526ee584f7e5e1408` (#6319 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-20 21:05:25 +00:00
LocalAI [bot]	75eb98f8bd	chore: ⬆️ Update ggml-org/llama.cpp to `f432d8d83e7407073634c5e4fd81a3d23a10827f` (#6316 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-20 09:41:45 +02:00
LocalAI [bot]	ae3d8fb0c4	chore: ⬆️ Update ggml-org/llama.cpp to `3edd87cd055a45d885fa914d879d36d33ecfc3e1` (#6308 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-18 21:09:14 +00:00
LocalAI [bot]	902e47f0b0	chore: ⬆️ Update ggml-org/llama.cpp to `0320ac5264279d74f8ee91bafa6c90e9ab9bbb91` (#6306 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-18 09:27:18 +02:00
LocalAI [bot]	e4ac7b14a3	chore: ⬆️ Update ggml-org/llama.cpp to `8ff206097c2bf3ca1c7aa95f9d6db779fc7bdd68` (#6292 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-16 21:09:47 +00:00
LocalAI [bot]	e89b5cc0e3	chore: ⬆️ Update ggml-org/llama.cpp to `b907255f4bd169b0dc7dca9553b4c54af5170865` (#6287 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-16 08:10:37 +02:00
LocalAI [bot]	2a18206033	chore: ⬆️ Update ggml-org/llama.cpp to `6c019cb04e86e2dacfe62ce7666c64e9717dde1f` (#6265 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-14 21:19:41 +00:00
LocalAI [bot]	39798d734e	chore: ⬆️ Update ggml-org/llama.cpp to `0fa154e3502e940df914f03b41475a2b80b985b0` (#6263 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-14 19:59:58 +00:00
Ettore Di Giacinto	6410c99bf2	fix(llama-cpp): correctly calculate embeddings (#6259 ) * chore(tests): check embeddings differs in llama.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(llama.cpp): use the correct field for embedding Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(llama.cpp): use embedding type none Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(tests): add test-cases in aio-e2e suite Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-13 23:11:54 +02:00
LocalAI [bot]	55766d269b	chore: ⬆️ Update ggml-org/llama.cpp to `aa0c461efe3603639af1a1defed2438d9c16ca0f` (#6261 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-13 21:11:18 +00:00
LocalAI [bot]	623789a29e	chore: ⬆️ Update ggml-org/llama.cpp to `40be51152d4dc2d47444a4ed378285139859895b` (#6260 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-12 21:10:39 +00:00
LocalAI [bot]	f8b71dc5d0	chore: ⬆️ Update ggml-org/llama.cpp to `0e6ff0046f4a2983b2c77950aa75960fe4b4f0e2` (#6235 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-11 21:21:49 +00:00
LocalAI [bot]	08432d49e5	chore: ⬆️ Update ggml-org/llama.cpp to `3976dfbe00f02a62c0deca32c46138e4f0ca81d8` (#6214 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-08 08:33:33 +02:00
LocalAI [bot]	59af928379	chore: ⬆️ Update ggml-org/llama.cpp to `c4df49a42d396bdf7344501813e7de53bc9e7bb3` (#6209 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-06 21:05:07 +00:00
LocalAI [bot]	dbc2bb561b	chore: ⬆️ Update ggml-org/llama.cpp to `408ff524b40baf4f51a81d42a9828200dd4fcb6b` (#6207 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-06 09:09:57 +02:00
LocalAI [bot]	1956681d4c	chore: ⬆️ Update ggml-org/llama.cpp to `fb15d649ed14ab447eeab911e0c9d21e35fb243e` (#6202 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-05 08:42:50 +02:00
LocalAI [bot]	9e6685ac9c	chore: ⬆️ Update ggml-org/llama.cpp to `0fce7a1248b74148c1eb0d368b7e18e8bcb96809` (#6193 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-04 07:35:28 +02:00
LocalAI [bot]	d82922786a	chore: ⬆️ Update ggml-org/llama.cpp to `3de008208b9b8a33f49f979097a99b4d59e6e521` (#6185 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-02 21:07:53 +00:00
LocalAI [bot]	4330fdce33	chore: ⬆️ Update ggml-org/llama.cpp to `d4d8dbe383e8b9600cbe8b42016e3a4529b51219` (#6172 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-02 09:12:03 +02:00
LocalAI [bot]	969922ffec	chore: ⬆️ Update ggml-org/llama.cpp to `e92d53b29e393fc4c0f9f1f7c3fe651be8d36faa` (#6169 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-01 08:06:54 +00:00
Ettore Di Giacinto	739573e41b	feat(flash_attention): set auto for flash_attention in llama.cpp (#6168 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-31 17:59:09 +02:00
LocalAI [bot]	dbdf2908ad	chore: ⬆️ Update ggml-org/llama.cpp to `3d16b29c3bb1ec816ac0e782f20d169097063919` (#6165 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-29 21:14:03 +00:00
LocalAI [bot]	723f01c87e	chore: ⬆️ Update ggml-org/llama.cpp to `c97dc093912ad014f6d22743ede0d4d7fd82365a` (#6163 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-28 21:16:18 +00:00
LocalAI [bot]	6a4ab3c1e0	chore: ⬆️ Update ggml-org/llama.cpp to `fbef0fad7a7c765939f6c9e322fa05cd52cf0c15` (#6155 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-27 21:09:34 +00:00
LocalAI [bot]	21faa4114b	chore: ⬆️ Update ggml-org/llama.cpp to `8b696861364360770e9f61a3422d32941a477824` (#6151 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-26 22:07:38 +00:00
LocalAI [bot]	0fc88b3cdf	chore: ⬆️ Update ggml-org/llama.cpp to `c4e9239064a564de7b94ee2b401ae907235a8fca` (#6139 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-26 12:18:58 +02:00
LocalAI [bot]	1a0d06f3db	chore: ⬆️ Update ggml-org/llama.cpp to `043fb27d3808766d8ea8195bbd12359727264402` (#6137 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-25 08:57:09 +02:00
LocalAI [bot]	057248008f	chore: ⬆️ Update ggml-org/llama.cpp to `710dfc465a68f7443b87d9f792cffba00ed739fe` (#6126 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-24 08:41:39 +02:00
Ettore Di Giacinto	9f2c9cd691	feat(llama.cpp): Add gfx1201 support (#6125 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-23 23:06:01 +02:00
Ettore Di Giacinto	259383cf5e	chore(deps): bump llama.cpp to '45363632cbd593537d541e81b600242e0b3d47fc' (#6122 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-23 08:39:10 +02:00
LocalAI [bot]	6dccfb09f8	chore: ⬆️ Update ggml-org/llama.cpp to `cd36b5e5c7fed2a3ac671dd542d579ca40b48b54` (#6118 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-22 07:57:27 +02:00
LocalAI [bot]	e4d9cf8349	chore: ⬆️ Update ggml-org/llama.cpp to `7a6e91ad26160dd6dfb33d29ac441617422f28e7` (#6116 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-20 21:05:39 +00:00
LocalAI [bot]	2e4dc6456f	chore: ⬆️ Update ggml-org/llama.cpp to `fb22dd07a639e81c7415e30b146f545f1a2f2caf` (#6112 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-20 09:01:36 +02:00
LocalAI [bot]	e44ff8514b	chore: ⬆️ Update ggml-org/llama.cpp to `6d7f1117e3e3285d0c5c11b5ebb0439e27920082` (#6088 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-19 08:09:49 +02:00
LocalAI [bot]	7920d75805	chore: ⬆️ Update ggml-org/llama.cpp to `21c17b5befc5f6be5992bc87fc1ba99d388561df` (#6084 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-18 08:26:58 +00:00
LocalAI [bot]	9eed5ef872	chore: ⬆️ Update ggml-org/llama.cpp to `1fe00296f587dfca0957e006d146f5875b61e43d` (#6079 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-16 21:10:03 +00:00
LocalAI [bot]	243e86176e	chore: ⬆️ Update ggml-org/llama.cpp to `5e6229a8409ac786e62cb133d09f1679a9aec13e` (#6070 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-16 08:38:57 +02:00
Ettore Di Giacinto	22067e3384	chore(rocm): bump rocm image, add gfx1200 support (#6065 ) Fixes: https://github.com/mudler/LocalAI/issues/6044 Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-15 16:36:54 +02:00
Ettore Di Giacinto	4fbd639463	chore(ci): fixup builds for darwin and hipblas Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-15 15:58:02 +02:00
Ettore Di Giacinto	576e821298	chore(deps): bump llama.cpp to 'df36bce667bf14f8e538645547754386f9516326 (#6062 ) chore(deps): bump llama.cpp to 'df36bce667bf14f8e538645547754386f9516326' Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-15 13:28:15 +02:00
Ettore Di Giacinto	8ab51509cc	Update Makefile Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-15 08:33:25 +02:00
Ettore Di Giacinto	b3384e5428	Update Makefile Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-15 08:08:24 +02:00
Ettore Di Giacinto	253b7537dc	fix(llama-cpp/darwin): make sure to bundle `libutf8` libs (#6060 ) fix(darwin): make sure to bundle libutf8_validity Plus some refactoring, use makefile Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-14 17:56:35 +02:00
Ettore Di Giacinto	bf60ca5bf0	Update Makefile Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-14 11:53:43 +02:00
LocalAI [bot]	2b44467bd1	chore: ⬆️ Update ggml-org/llama.cpp to `29c8fbe4e05fd23c44950d0958299e25fbeabc5c` (#6054 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-14 09:19:15 +02:00
LocalAI [bot]	72f4d541d0	chore: ⬆️ Update ggml-org/llama.cpp to `f4586ee5986d6f965becb37876d6f3666478a961` (#6048 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-13 08:33:48 +02:00
Ettore Di Giacinto	18fcd8557c	fix(llama.cpp): support gfx1200 (#6045 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-12 22:04:30 +02:00
LocalAI [bot]	b2e8b6d1aa	chore: ⬆️ Update ggml-org/llama.cpp to `be48528b068111304e4a0bb82c028558b5705f05` (#6012 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-11 21:06:10 +00:00
LocalAI [bot]	6db19c5cb9	chore: ⬆️ Update ggml-org/llama.cpp to `79c1160b073b8148a404f3dd2584be1606dccc66` (#6006 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-11 12:54:21 +02:00
LocalAI [bot]	def7cdc0bf	chore: ⬆️ Update ggml-org/llama.cpp to `cd6983d56d2cce94ecb86bb114ae8379a609073c` (#6003 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-09 08:41:58 +02:00
LocalAI [bot]	4e40a8d1ed	chore: ⬆️ Update ggml-org/llama.cpp to `a0552c8beef74e843bb085c8ef0c63f9ed7a2b27` (#5992 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-07 21:13:14 +00:00
Ettore Di Giacinto	ec1276e5a9	fix(llama.cpp): do not default to linear rope (#5982 ) This seems to somehow sneaked in during the initial pass to gRPC server, instead of setting linear rope when required, we did default to it if not specified. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-06 23:20:28 +02:00
LocalAI [bot]	61ba98d43d	chore: ⬆️ Update ggml-org/llama.cpp to `e725a1a982ca870404a9c4935df52466327bbd02` (#5984 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-06 21:17:20 +00:00
LocalAI [bot]	03e8592450	chore: ⬆️ Update ggml-org/llama.cpp to `fd1234cb468935ea087d6929b2487926c3afff4b` (#5972 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-05 23:14:43 +02:00
LocalAI [bot]	2913676157	chore: ⬆️ Update ggml-org/llama.cpp to `41613437ffee0dbccad684fc744788bc504ec213` (#5968 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-04 23:16:30 +02:00
LocalAI [bot]	4d90971424	chore: ⬆️ Update ggml-org/llama.cpp to `d31192b4ee1441bbbecd3cbf9e02633368bdc4f5` (#5965 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-03 21:03:20 +00:00
LocalAI [bot]	2a9d675d62	chore: ⬆️ Update ggml-org/llama.cpp to `5c0eb5ef544aeefd81c303e03208f768e158d93c` (#5959 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-02 23:35:24 +02:00
LocalAI [bot]	0b085089b9	chore: ⬆️ Update ggml-org/llama.cpp to `daf2dd788066b8b239cb7f68210e090c2124c199` (#5951 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-01 08:25:36 +02:00
Richard Palethorpe	c07bc55fee	fix(intel): Set GPU vendor on Intel images and cleanup (#5945 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2025-07-31 19:44:46 +02:00
LocalAI [bot]	8b1e8b4cda	chore: ⬆️ Update ggml-org/llama.cpp to `e9192bec564780bd4313ad6524d20a0ab92797db` (#5940 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-31 09:26:02 +02:00
LocalAI [bot]	eb5c3670f1	chore: ⬆️ Update ggml-org/llama.cpp to `aa79524c51fb014f8df17069d31d7c44b9ea6cb8` (#5934 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-29 21:05:00 +00:00
LocalAI [bot]	60726d16f2	chore: ⬆️ Update ggml-org/llama.cpp to `8ad7b3e65b5834e5574c2f5640056c9047b5d93b` (#5931 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-29 08:01:03 +02:00
LocalAI [bot]	d25145e641	chore: ⬆️ Update ggml-org/llama.cpp to `bf78f5439ee8e82e367674043303ebf8e92b4805` (#5927 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-27 21:08:32 +00:00
LocalAI [bot]	932360bf7e	chore: ⬆️ Update ggml-org/llama.cpp to `11dd5a44eb180e1d69fac24d3852b5222d66fb7f` (#5921 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-27 09:50:56 +02:00
LocalAI [bot]	5ce982b9c9	chore: ⬆️ Update ggml-org/llama.cpp to `c7f3169cd523140a288095f2d79befb20a0b73f4` (#5913 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-25 23:08:20 +02:00
LocalAI [bot]	813cb4296d	chore: ⬆️ Update ggml-org/llama.cpp to `3f4fc97f1d745f1d5d3c853949503136d419e6de` (#5900 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-25 08:39:44 +02:00
LocalAI [bot]	61c2304638	chore: ⬆️ Update ggml-org/llama.cpp to `a86f52b2859dae4db5a7a0bbc0f1ad9de6b43ec6` (#5894 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-24 15:02:37 +02:00
Ettore Di Giacinto	b7b3164736	chore: try to speedup build Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-23 21:21:23 +02:00
LocalAI [bot]	b5be867e28	chore: ⬆️ Update ggml-org/llama.cpp to `acd6cb1c41676f6bbb25c2a76fa5abeb1719301e` (#5882 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-22 21:12:06 +00:00
Ettore Di Giacinto	98e5291afc	feat: refactor build process, drop embedded backends (#5875 ) * feat: split remaining backends and drop embedded backends - Drop silero-vad, huggingface, and stores backend from embedded binaries - Refactor Makefile and Dockerfile to avoid building grpc backends - Drop golang code that was used to embed backends - Simplify building by using goreleaser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(gallery): be specific with llama-cpp backend templates Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(docs): update Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(ci): minor fixes Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: drop all ffmpeg references Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: run protogen-go Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Always enable p2p mode Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Update gorelease file Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(stores): do not always load Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix linting issues Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Mac OS fixup Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-22 16:31:04 +02:00
LocalAI [bot]	e29b2c3aff	chore: ⬆️ Update ggml-org/llama.cpp to `6c9ee3b17e19dcc82ab93d52ae46fdd0226d4777` (#5877 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-22 08:25:43 +02:00
LocalAI [bot]	fa284f7445	chore: ⬆️ Update ggml-org/llama.cpp to `2be60cbc2707359241c2784f9d2e30d8fc7cdabb` (#5867 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-21 09:14:09 +02:00
LocalAI [bot]	7659461036	chore: ⬆️ Update ggml-org/llama.cpp to `a979ca22db0d737af1e548a73291193655c6be99` (#5862 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-20 08:43:36 +02:00
Ettore Di Giacinto	580687da46	feat: remove stablediffusion-ggml from main binary (#5861 ) * feat: split stablediffusion-ggml from main binary Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Test CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt ci tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to support nvidial4t Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Latest fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-19 21:58:53 +02:00
LocalAI [bot]	1929eb2894	chore: ⬆️ Update ggml-org/llama.cpp to `bf9087f59aab940cf312b85a67067ce33d9e365a` (#5860 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-07-19 08:52:07 +02:00
Ettore Di Giacinto	b29544d747	feat: split piper from main binary (#5858 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-19 08:31:33 +02:00
Ettore Di Giacinto	294f7022f3	feat: do not bundle llama-cpp anymore (#5790 ) * Build llama.cpp separately Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Start to try to attach some tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add git and small fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: correctly autoload external backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to run AIO tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Slightly update the Makefile helps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt auto-bumper Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to run linux test Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add llama-cpp into build pipelines Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add default capability (for cpu) Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop llama-cpp specific logic from the backend loader Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * drop grpc install in ci for tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Pass by backends path for tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Build protogen at start Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(tests): set backends path consistently Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Correctly configure the backends path Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to build for darwin Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Compile for metal on arm64/darwin Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to run build off from cross-arch Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add to the backend index nvidia-l4t and cpu's llama-cpp backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Build also darwin-x86 for llama-cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Disable arm64 builds temporary Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Test backend build on PR Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixup build backend reusable workflow Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * pass by skip drivers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use crane Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Skip drivers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * x86 darwin Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add packaging step for llama.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix leftover from bark-cpp extraction Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to fix hipblas build Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-18 13:24:12 +02:00

1 2 3

133 commits