Commit History

Автор SHA1 Съобщение Дата
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) преди 6 месеца
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" преди 6 месеца
  Michael Yang 620d5c569e fix parsing big endian gguf преди 6 месеца
  Michael Yang 030e765e76 fix create model when template detection errors преди 6 месеца
  Michael Yang e40145a39d lint преди 7 месеца
  Michael Yang 171eb040fc simplify safetensors reading преди 7 месеца
  Michael Yang bbbd9f20f3 cleanup преди 7 месеца
  Michael Yang 547132e820 bpe pretokenizer преди 7 месеца
  Patrick Devine c8cf0d94ed llama3 conversion преди 7 месеца
  Patrick Devine 14476d48cc fixes for gguf (#3863) преди 8 месеца
  Michael Yang e74163af4c fix padding to only return padding преди 8 месеца
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding преди 8 месеца
  Michael Yang 969238b19e fix padding in decode преди 8 месеца
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) преди 8 месеца
  Michael Yang 8b2c10061c refactor tensor query преди 8 месеца
  Michael Yang d338d70492 refactor model parsing преди 9 месеца
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) преди 9 месеца
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) преди 9 месеца
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker преди 9 месеца
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) преди 9 месеца
  Michael Yang 0085297928 refactor readseeker преди 9 месеца
  Michael Yang 76bdebbadf decode ggla преди 9 месеца
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) преди 9 месеца
  Michael Yang 949d7b1c48 add gguf file types (#2532) преди 10 месеца
  Michael Yang cd22855ef8 refactor tensor read преди 11 месеца
  Michael Yang eaed6f8c45 add max context length check преди 11 месеца
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) преди 11 месеца
  Michael Yang 56ffc3023a remove per-model types преди 1 година
  Michael Yang 5a5dca13b2 comments преди 1 година
  Michael Yang 72e7a49aa9 seek instead of copyn преди 1 година