19 posts in this category
AIdaemon 可以保存一个事实,然后在我询问时找不到它。语义搜索根据同一主题进行排名,因此包含真正答案的简短事实会被附近更冗长的内容所掩盖。一个重排器会根据问题逐个候选地阅读,并将正确的一个重新排到顶部。
我想在本地 Gemma 4 26B 上通过 llama.cpp 运行 AIdaemon,而不是 Ollama。在 M4 Pro 上,生成速度约为 45 token/s。由于 14k token 的提示词预填充需要 8 到 9 秒才能让模型写出第一个字,代理回合仍然感觉很卡顿。
通俗易懂地讲解生产级 AI 代理背后的控制平面、工具平面、内存、护栏、子代理和可观测性。
从 ChatGPT 切换到 Claude、Gemini、Grok,或者任何开源模型,都不应该意味着要重新学习如何提示、信任什么、以及可以安全地交出什么。它们底层共享着相同的几个特征,而少数几个相同的习惯可以从它们那里获得好的结果。
Claude Code 具有五个自定义层。选错一个,你就会得到一个永远不会触发的技能、一个执行子代理工作的钩子,或者一个臃肿到在你输入之前就吃掉你一半上下文的 CLAUDE.md。以下是它们各自的归属。
我用于并行 AI 编码代理的实际工作流程:每个代理一个 worktree,每个任务一个分支,清晰的文件所有权,受保护的 main 分支,以及通过 AGENTS.md 或 CLAUDE.md 共享的指令。
A concrete walkthrough of how I turned davidloor.com into an MCP server that Claude Desktop and Cursor can query. The tools, the Cloudflare Worker setup, the gotchas, and what to expose.
我构建了一个自动化平台,该平台每晚抓取 11 个政府和非营利组织的 RFP 来源,使用 Llama 3.1 提取结构化数据,并通过 Cloudflare Workers 提供所有内容。
七种著名的AI代理模式及其在AIdaemon(我用Rust构建的一个自托管AI代理守护进程)中的实际工作原理。
我让Claude Code连续运行了27小时。它完成了84个任务,发现了bug,修复了它们,并重新进行了测试。这一切都发生在我睡觉的时候。以下是具体的工作流程。
将最新文章和见解发送到您的收件箱。
Unsubscribe anytime. No spam, ever.