Historial de Commits

Autor SHA1 Mensaje Fecha
  Daniel Hiltgen b51e3b63ac Statically link c++ and thread lib hace 6 meses
  jmorganca a08f20d910 release: remove unwanted mingw dll.a files hace 6 meses
  jmorganca 6cea036027 Revert "llm: only statically link libstdc++" hace 6 meses
  jmorganca 5796bfc401 llm: only statically link libstdc++ hace 6 meses
  jmorganca f1a379aa56 llm: statically link pthread and stdc++ dependencies in windows build hace 6 meses
  Jeffrey Morgan 5304b765b2 llm: put back old include dir (#5507) hace 6 meses
  Jeffrey Morgan 78fb33dd07 fix typo in cgo directives in `llm.go` (#5501) hace 6 meses
  Jeffrey Morgan 8f8e736b13 update llama.cpp submodule to `d7fd29f` (#5475) hace 6 meses
  Michael Yang 829ff87bd1 revert tokenize ffi (#4761) hace 7 meses
  Jeffrey Morgan 763bb65dbb use `int32_t` for call to tokenize (#4738) hace 7 meses
  Michael Yang bf54c845e9 vocab only hace 7 meses
  Michael Yang 26a00a0410 use ffi for tokenizing/detokenizing hace 8 meses
  Michael Yang 01811c176a comments hace 8 meses
  Michael Yang 9685c34509 quantize any fp16/fp32 model hace 9 meses
  Hernan Martinez 86e67fc4a9 Add import declaration for windows,arm64 to llm.go hace 8 meses
  Michael Yang 9502e5661f cgo quantize hace 9 meses
  Daniel Hiltgen 58d95cc9bd Switch back to subprocessing for llama.cpp hace 10 meses
  Michael Yang 91b3e4d282 update memory calcualtions hace 9 meses
  Michael Yang d338d70492 refactor model parsing hace 10 meses
  Patrick Devine 1b272d5bcd change `github.com/jmorganca/ollama` to `github.com/ollama/ollama` (#3347) hace 9 meses
  Jeffrey Morgan f9cd55c70b disable gpu for certain model architectures and fix divide-by-zero on memory estimation hace 10 meses
  Daniel Hiltgen 6c5ccb11f9 Revamp ROCm support hace 11 meses
  Daniel Hiltgen a1dfab43b9 Ensure the libraries are present hace 11 meses
  Jeffrey Morgan 4458efb73a Load all layers on `arm64` macOS if model is small enough (#2149) hace 11 meses
  Daniel Hiltgen fedd705aea Mechanical switch from log to slog hace 11 meses
  Michael Yang eaed6f8c45 add max context length check hace 1 año
  Daniel Hiltgen 7427fa1387 Fix up the CPU fallback selection hace 1 año
  Daniel Hiltgen de2fbdec99 Merge pull request #1819 from dhiltgen/multi_variant hace 1 año
  Michael Yang f4f939de28 Merge pull request #1552 from jmorganca/mxyng/lint-test hace 1 año
  Daniel Hiltgen 39928a42e8 Always dynamically load the llm server library hace 1 año