Commitin historia

Tekijä SHA1 Viesti Päivämäärä
  Blake Mizerany cb42e607c5 llm: speed up gguf decoding by a lot (#5246) 6 kuukautta sitten
  Michael Yang 7bdcd1da94 Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order" 6 kuukautta sitten
  Michael Yang 620d5c569e fix parsing big endian gguf 6 kuukautta sitten
  Michael Yang 030e765e76 fix create model when template detection errors 6 kuukautta sitten
  Michael Yang e40145a39d lint 7 kuukautta sitten
  Michael Yang 171eb040fc simplify safetensors reading 7 kuukautta sitten
  Michael Yang bbbd9f20f3 cleanup 7 kuukautta sitten
  Michael Yang 547132e820 bpe pretokenizer 7 kuukautta sitten
  Patrick Devine c8cf0d94ed llama3 conversion 7 kuukautta sitten
  Patrick Devine 14476d48cc fixes for gguf (#3863) 8 kuukautta sitten
  Michael Yang e74163af4c fix padding to only return padding 8 kuukautta sitten
  Michael Yang 6d53b67c2c Merge pull request #3663 from ollama/mxyng/fix-padding 8 kuukautta sitten
  Michael Yang 969238b19e fix padding in decode 8 kuukautta sitten
  Patrick Devine 9f8691c6c8 Add llama2 / torch models for `ollama create` (#3607) 8 kuukautta sitten
  Michael Yang 8b2c10061c refactor tensor query 8 kuukautta sitten
  Michael Yang d338d70492 refactor model parsing 9 kuukautta sitten
  Patrick Devine 5a5efee46b Add gemma safetensors conversion (#3250) 9 kuukautta sitten
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) 9 kuukautta sitten
  Michael Yang 22f326464e Merge pull request #3083 from ollama/mxyng/refactor-readseeker 9 kuukautta sitten
  Blake Mizerany 6ce37e4d96 llm,readline: use errors.Is instead of simple == check (#3161) 9 kuukautta sitten
  Michael Yang 0085297928 refactor readseeker 9 kuukautta sitten
  Michael Yang 76bdebbadf decode ggla 9 kuukautta sitten
  Patrick Devine 2c017ca441 Convert Safetensors to an Ollama model (#2824) 9 kuukautta sitten
  Michael Yang 949d7b1c48 add gguf file types (#2532) 10 kuukautta sitten
  Michael Yang cd22855ef8 refactor tensor read 11 kuukautta sitten
  Michael Yang eaed6f8c45 add max context length check 11 kuukautta sitten
  Jeffrey Morgan 08f1e18965 Offload layers to GPU based on new model size estimates (#1850) 11 kuukautta sitten
  Michael Yang 56ffc3023a remove per-model types 1 vuosi sitten
  Michael Yang 5a5dca13b2 comments 1 vuosi sitten
  Michael Yang 72e7a49aa9 seek instead of copyn 1 vuosi sitten