Michael Yang
|
e40145a39d
lint
|
před 7 měsíci |
Daniel Hiltgen
|
34b9db5afc
Request and model concurrency
|
před 9 měsíci |
Daniel Hiltgen
|
de2fbdec99
Merge pull request #1819 from dhiltgen/multi_variant
|
před 1 rokem |
Daniel Hiltgen
|
39928a42e8
Always dynamically load the llm server library
|
před 1 rokem |
Fabian Preiß
|
3bc8b9832b
fix gpu_test.go Error (same type) uint64->uint32 (#1921)
|
před 1 rokem |
Jeffrey Morgan
|
c336693f07
calculate overhead based number of gpu devices (#1875)
|
před 1 rokem |
Daniel Hiltgen
|
a2ad952440
Fix windows system memory lookup
|
před 1 rokem |
Daniel Hiltgen
|
d966b730ac
Switch windows build to fully dynamic
|
před 1 rokem |
Daniel Hiltgen
|
35934b2e05
Adapted rocm support to cgo based llama.cpp
|
před 1 rokem |