Jeffrey Morgan
|
f8241bfba3
gpu: report system free memory instead of 0 (#5521)
|
před 6 měsíci |
Daniel Hiltgen
|
6f351bf586
review comments and coverage
|
před 7 měsíci |
Daniel Hiltgen
|
fc37c192ae
Refine CPU load behavior with system memory visibility
|
před 7 měsíci |
Daniel Hiltgen
|
30a7d7096c
Bump VRAM buffer back up
|
před 8 měsíci |
Michael Yang
|
4736391bfb
llm: add minimum based on layer size
|
před 8 měsíci |
Jeffrey Morgan
|
f0c454ab57
gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068)
|
před 9 měsíci |
Daniel Hiltgen
|
34b9db5afc
Request and model concurrency
|
před 10 měsíci |
Michael Yang
|
26df674785
scale graph based on gpu count
|
před 9 měsíci |
Michael Yang
|
41a272de9f
darwin: no partial offloading if required memory greater than system
|
před 9 měsíci |
Michael Yang
|
7e33a017c0
partial offloading
|
před 9 měsíci |
Daniel Hiltgen
|
be330174dd
Allow setting max vram for workarounds
|
před 10 měsíci |
peanut256
|
a189810df6
Determine max VRAM on macOS using `recommendedMaxWorkingSetSize` (#2354)
|
před 11 měsíci |
Daniel Hiltgen
|
7427fa1387
Fix up the CPU fallback selection
|
před 1 rokem |
Daniel Hiltgen
|
39928a42e8
Always dynamically load the llm server library
|
před 1 rokem |
Daniel Hiltgen
|
d88c527be3
Build multiple CPU variants and pick the best
|
před 1 rokem |
Jeffrey Morgan
|
c336693f07
calculate overhead based number of gpu devices (#1875)
|
před 1 rokem |
Jeffrey Morgan
|
08f1e18965
Offload layers to GPU based on new model size estimates (#1850)
|
před 1 rokem |
Jeffrey Morgan
|
c7ea8f237e
set `num_gpu` to 1 only by default on darwin arm64 (#1771)
|
před 1 rokem |
Daniel Hiltgen
|
a2ad952440
Fix windows system memory lookup
|
před 1 rokem |
Daniel Hiltgen
|
d966b730ac
Switch windows build to fully dynamic
|
před 1 rokem |
Daniel Hiltgen
|
7555ea44f8
Revamp the dynamic library shim
|
před 1 rokem |
Daniel Hiltgen
|
6558f94ed0
Fix darwin intel build
|
před 1 rokem |
Daniel Hiltgen
|
35934b2e05
Adapted rocm support to cgo based llama.cpp
|
před 1 rokem |