Commit History

Auteur SHA1 Bericht Datum
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 6 maanden geleden
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" 6 maanden geleden
  Michael Yang 620d5c569e fix parsing big endian gguf 6 maanden geleden
  Michael Yang 030e765e76 fix create model when template detection errors 6 maanden geleden
  Michael Yang e40145a39d lint 7 maanden geleden
  Michael Yang 171eb040fc simplify safetensors reading 7 maanden geleden
  Michael Yang bbbd9f20f3 cleanup 7 maanden geleden
  Michael Yang 547132e820 bpe pretokenizer 7 maanden geleden
  Patrick Devine c8cf0d94ed llama3 conversion 7 maanden geleden
  Patrick Devine 14476d48cc fixes for gguf (#3863) 8 maanden geleden
  Michael Yang e74163af4c fix padding to only return padding 8 maanden geleden
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding 8 maanden geleden
  Michael Yang 969238b19e fix padding in decode 8 maanden geleden
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) 8 maanden geleden
  Michael Yang 8b2c10061c refactor tensor query 8 maanden geleden
  Michael Yang d338d70492 refactor model parsing 9 maanden geleden
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) 9 maanden geleden
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) 9 maanden geleden
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker 9 maanden geleden
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) 9 maanden geleden
  Michael Yang 0085297928 refactor readseeker 9 maanden geleden
  Michael Yang 76bdebbadf decode ggla 9 maanden geleden
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) 9 maanden geleden
  Michael Yang 949d7b1c48 add gguf file types (#2532) 10 maanden geleden
  Michael Yang cd22855ef8 refactor tensor read 11 maanden geleden
  Michael Yang eaed6f8c45 add max context length check 11 maanden geleden
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) 11 maanden geleden
  Michael Yang 56ffc3023a remove per-model types 1 jaar geleden
  Michael Yang 5a5dca13b2 comments 1 jaar geleden
  Michael Yang 72e7a49aa9 seek instead of copyn 1 jaar geleden