Skip to main content
David Loor
Over MijDienstenProjectenBlogContact
←Back to Blog

#Gemma

1 post with this tag

Gevonden 1 bericht
2026-06-08
13 min read

Lokale Gemma was te traag met AIdaemon totdat ik llama.cpp en de promptgrootte heb aangepast

Ik wilde AIdaemon op lokale Gemma 4 26B via llama.cpp, niet Ollama. Generatie draaide op ~45 tok/s op een M4 Pro. Agent-beurten voelden nog steeds vastgelopen omdat prefill op 14k-token prompts 8 tot 9 seconden duurde voordat het model een enkel woord schreef.

aisoftware-developmentopen-source

Blijf Op de Hoogte

Ontvang de nieuwste berichten en inzichten rechtstreeks in uw inbox.

Unsubscribe anytime. No spam, ever.

Blog archive
  • Lokale Gemma was te traag met AIdaemon totdat ik llama.cpp en de promptgrootte heb aangepast
David Loor

AI, Cloud & Web Solutions Architect

AboutServicesProjectsBlogBookshelf

© 2026 David Loor. All rights reserved.

davo20019@gmail.com