Commit History

Auteur SHA1 Bericht Datum
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 9 maanden geleden
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" 10 maanden geleden
  Michael Yang 620d5c569e fix parsing big endian gguf 10 maanden geleden
  Michael Yang 030e765e76 fix create model when template detection errors 10 maanden geleden
  Michael Yang e40145a39d lint 10 maanden geleden
  Michael Yang 171eb040fc simplify safetensors reading 10 maanden geleden
  Michael Yang bbbd9f20f3 cleanup 10 maanden geleden
  Michael Yang 547132e820 bpe pretokenizer 10 maanden geleden
  Patrick Devine c8cf0d94ed llama3 conversion 11 maanden geleden
  Patrick Devine 14476d48cc fixes for gguf (#3863) 11 maanden geleden
  Michael Yang e74163af4c fix padding to only return padding 11 maanden geleden
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding 11 maanden geleden
  Michael Yang 969238b19e fix padding in decode 11 maanden geleden
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) 11 maanden geleden
  Michael Yang 8b2c10061c refactor tensor query 1 jaar geleden
  Michael Yang d338d70492 refactor model parsing 1 jaar geleden
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) 1 jaar geleden
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) 1 jaar geleden
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker 1 jaar geleden
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) 1 jaar geleden
  Michael Yang 0085297928 refactor readseeker 1 jaar geleden
  Michael Yang 76bdebbadf decode ggla 1 jaar geleden
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) 1 jaar geleden
  Michael Yang 949d7b1c48 add gguf file types (#2532) 1 jaar geleden
  Michael Yang cd22855ef8 refactor tensor read 1 jaar geleden
  Michael Yang eaed6f8c45 add max context length check 1 jaar geleden
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) 1 jaar geleden
  Michael Yang 56ffc3023a remove per-model types 1 jaar geleden
  Michael Yang 5a5dca13b2 comments 1 jaar geleden
  Michael Yang 72e7a49aa9 seek instead of copyn 1 jaar geleden