Blake Mizerany
|
cb42e607c5
llm: speed up gguf decoding by a lot (#5246)
|
6 mesiacov pred |
Michael Yang
|
7bdcd1da94
Revert "Merge pull request #4938 from ollama/mxyng/fix-byte-order"
|
6 mesiacov pred |
Michael Yang
|
620d5c569e
fix parsing big endian gguf
|
6 mesiacov pred |
Michael Yang
|
030e765e76
fix create model when template detection errors
|
6 mesiacov pred |
Michael Yang
|
e40145a39d
lint
|
7 mesiacov pred |
Michael Yang
|
171eb040fc
simplify safetensors reading
|
7 mesiacov pred |
Michael Yang
|
bbbd9f20f3
cleanup
|
7 mesiacov pred |
Michael Yang
|
547132e820
bpe pretokenizer
|
7 mesiacov pred |
Patrick Devine
|
c8cf0d94ed
llama3 conversion
|
7 mesiacov pred |
Patrick Devine
|
14476d48cc
fixes for gguf (#3863)
|
8 mesiacov pred |
Michael Yang
|
e74163af4c
fix padding to only return padding
|
8 mesiacov pred |
Michael Yang
|
6d53b67c2c
Merge pull request #3663 from ollama/mxyng/fix-padding
|
8 mesiacov pred |
Michael Yang
|
969238b19e
fix padding in decode
|
8 mesiacov pred |
Patrick Devine
|
9f8691c6c8
Add llama2 / torch models for `ollama create` (#3607)
|
8 mesiacov pred |
Michael Yang
|
8b2c10061c
refactor tensor query
|
8 mesiacov pred |
Michael Yang
|
d338d70492
refactor model parsing
|
9 mesiacov pred |
Patrick Devine
|
5a5efee46b
Add gemma safetensors conversion (#3250)
|
8 mesiacov pred |
Patrick Devine
|
1b272d5bcd
change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347)
|
9 mesiacov pred |
Michael Yang
|
22f326464e
Merge pull request #3083 from ollama/mxyng/refactor-readseeker
|
9 mesiacov pred |
Blake Mizerany
|
6ce37e4d96
llm,readline: use errors.Is instead of simple == check (#3161)
|
9 mesiacov pred |
Michael Yang
|
0085297928
refactor readseeker
|
9 mesiacov pred |
Michael Yang
|
76bdebbadf
decode ggla
|
9 mesiacov pred |
Patrick Devine
|
2c017ca441
Convert Safetensors to an Ollama model (#2824)
|
9 mesiacov pred |
Michael Yang
|
949d7b1c48
add gguf file types (#2532)
|
10 mesiacov pred |
Michael Yang
|
cd22855ef8
refactor tensor read
|
11 mesiacov pred |
Michael Yang
|
eaed6f8c45
add max context length check
|
11 mesiacov pred |
Jeffrey Morgan
|
08f1e18965
Offload layers to GPU based on new model size estimates (#1850)
|
11 mesiacov pred |
Michael Yang
|
56ffc3023a
remove per-model types
|
1 rok pred |
Michael Yang
|
5a5dca13b2
comments
|
1 rok pred |
Michael Yang
|
72e7a49aa9
seek instead of copyn
|
1 rok pred |