3 posts with this tag
AIdaemon 可以保存一个事实,然后在我询问时找不到它。语义搜索根据同一主题进行排名,因此包含真正答案的简短事实会被附近更冗长的内容所掩盖。一个重排器会根据问题逐个候选地阅读,并将正确的一个重新排到顶部。
我想在本地 Gemma 4 26B 上通过 llama.cpp 运行 AIdaemon,而不是 Ollama。在 M4 Pro 上,生成速度约为 45 token/s。由于 14k token 的提示词预填充需要 8 到 9 秒才能让模型写出第一个字,代理回合仍然感觉很卡顿。
受 OpenClaw 的启发,我构建了 AIdaemon,它是一个 Rust 二进制文件,作为后台守护进程在您的机器上运行,可通过 Telegram、Slack 或 Discord 访问,具有持久化内存、40 多种工具和多渠道支持。
将最新文章和见解发送到您的收件箱。
Unsubscribe anytime. No spam, ever.