Skip to main content
David Loor
Обо мнеУслугиПроектыБлогКонтакты
←Back to Blog

#Gemma

1 post with this tag

Найдено 1 пост
2026-06-08
13 min read

Локальная Gemma была слишком медленной с AIdaemon, пока я не исправил llama.cpp и размер промпта

Я хотел использовать AIdaemon с локальной Gemma 4 26B через llama.cpp, а не Ollama. Генерация работала со скоростью ~45 токенов/с на M4 Pro. Взаимодействие с агентом всё ещё казалось заторможенным, потому что предварительное заполнение промптов размером 14k токенов занимало от 8 до 9 секунд, прежде чем модель написала хотя бы одно слово.

aisoftware-developmentopen-source

Будьте в курсе

Получайте последние посты и аналитику на вашу почту.

Unsubscribe anytime. No spam, ever.

Blog archive
  • Локальная Gemma была слишком медленной с AIdaemon, пока я не исправил llama.cpp и размер промпта
David Loor

AI, Cloud & Web Solutions Architect

AboutServicesProjectsBlogBookshelf

© 2026 David Loor. All rights reserved.

davo20019@gmail.com