Историја ревизија

Аутор SHA1 Порука Датум
  Michael Yang 5a739ff4cb chatglm graph пре 6 месеци
  Michael Yang de2163dafd gemma2 graph пре 7 месеци
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) пре 7 месеци
  Michael Yang 8e0641a9bf handle asymmetric embedding KVs пре 7 месеци
  Michael Yang e873841cbb deepseek v2 graph пре 7 месеци
  Daniel Hiltgen 6fd04ca922 Improve multi-gpu handling at the limit пре 8 месеци
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" пре 7 месеци
  Michael Yang 620d5c569e fix parsing big endian gguf пре 7 месеци
  Michael Yang 9b6c2e6eb6 detect chat template from KV пре 7 месеци
  Michael Yang d51f15257c Update llm/ggml.go пре 8 месеци
  Michael Yang 8f440d579a fix q5_0, q5_1 пре 8 месеци
  Bruce MacDonald d6f692ad1a Add support for IQ1_S, IQ3_S, IQ2_S, IQ4_XS. IQ4_NL (#4322) пре 8 месеци
  Michael Yang 171eb040fc simplify safetensors reading пре 8 месеци
  Michael Yang 1eb382da5a add phi2 mem пре 8 месеци
  Michael Yang eeb695261f skip if same quantization пре 8 месеци
  Michael Yang 01811c176a comments пре 9 месеци
  Michael Yang 9685c34509 quantize any fp16/fp32 model пре 9 месеци
  Michael Yang 435cc866a3 fix: mixtral graph пре 9 месеци
  Michael Yang 3cf483fe48 add stablelm graph calculation пре 9 месеци
  Michael Yang a8b9b930b4 account for all non-repeating layers пре 9 месеци
  Michael Yang 3397eff0cd mixtral mem пре 9 месеци
  Michael Yang 7e33a017c0 partial offloading пре 9 месеци
  Michael Yang 8b2c10061c refactor tensor query пре 9 месеци
  Michael Yang 01f77ae25d add command-r graph estimate пре 9 месеци
  Michael Yang 12e923e158 update graph size estimate пре 9 месеци
  Michael Yang 90f071c658 default head_kv to 1 пре 9 месеци
  Michael Yang 91b3e4d282 update memory calcualtions пре 10 месеци
  Michael Yang d338d70492 refactor model parsing пре 10 месеци
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) пре 10 месеци
  Michael Yang 0085297928 refactor readseeker пре 10 месеци