Историја ревизија

Аутор SHA1 Порука Датум
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs пре 6 месеци
  Daniel Hiltgen 359b15a597 Handle models with divergent layer sizes пре 6 месеци
  Daniel Hiltgen 7784ca33ce Tighten up memory prediction logging пре 6 месеци
  Daniel Hiltgen 17df6520c8 Remove mmap related output calc logic пре 7 месеци
  Daniel Hiltgen 6f351bf586 review comments and coverage пре 7 месеци
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit пре 7 месеци
  Michael Yang 6297f85606 gofmt, goimports пре 7 месеци
  Michael Yang e40145a39d lint пре 7 месеци
  Patrick Devine 4cc3be3035 Move envconfig and consolidate env vars (#4608) пре 7 месеци
  Michael Yang 1d359e737e typo пре 8 месеци
  Michael Yang 50b9056e09 count memory up to NumGPU пре 8 месеци
  Jeffrey Morgan bb6fd02298 Don't clamp ctx size in `PredictServerFit` (#4317) пре 8 месеци
  Daniel Hiltgen bee2f4a3b0 Record GPU usage information пре 8 месеци
  Michael Yang 4736391bfb llm: add minimum based on layer size пре 8 месеци
  Daniel Hiltgen f56aa20014 Centralize server config handling пре 8 месеци
  Jeffrey Morgan f0c454ab57 gpu: add 512MiB to darwin minimum, metal doesn't have partial offloading overhead (#4068) пре 8 месеци
  Michael Yang f81f308118 fix gemma, command-r layer weights пре 8 месеци
  Michael Yang 7bb7cb8a60 only count output tensors пре 8 месеци
  Daniel Hiltgen 5445aaa94e Add back memory escape valve пре 8 месеци
  Daniel Hiltgen 34b9db5afc Request and model concurrency пре 9 месеци