Skip to main content
David Loor
关于服务项目博客联系方式
←Back to Blog

#Llm

3 posts with this tag

找到 3 篇文章
2026-06-08
13 min read

本地 Gemma 在 AIdaemon 上运行缓慢,直到我修复了 llama.cpp 和提示词大小

我想在本地 Gemma 4 26B 上通过 llama.cpp 运行 AIdaemon,而不是 Ollama。在 M4 Pro 上,生成速度约为 45 token/s。由于 14k token 的提示词预填充需要 8 到 9 秒才能让模型写出第一个字,代理回合仍然感觉很卡顿。

aisoftware-developmentopen-source
2026-03-15
5 min read

我从构建 AIdaemon中学到的AI代理模式

七种著名的AI代理模式及其在AIdaemon(我用Rust构建的一个自托管AI代理守护进程)中的实际工作原理。

aisoftware-development
2025-12-08
3 min read

为什么 AI 聊天机器人会说 Markdown

你是否曾好奇过为什么 ChatGPT、Claude 和其他 AI 模型会使用 **粗体文本** 和 [链接](url) 来格式化它们的回复?这就是 Markdown,而且背后有充分的理由。

aiweb-development

保持更新

将最新文章和见解发送到您的收件箱。

Unsubscribe anytime. No spam, ever.

Blog archive
  • 本地 Gemma 在 AIdaemon 上运行缓慢,直到我修复了 llama.cpp 和提示词大小
  • 我从构建 AIdaemon中学到的AI代理模式
  • 为什么 AI 聊天机器人会说 Markdown
David Loor

AI, Cloud & Web Solutions Architect

AboutServicesProjectsBlogBookshelf

© 2026 David Loor. All rights reserved.

davo20019@gmail.com