人工智能 | frr.dev

当你的AI成为你最大的敌人

昨天我的AI发送了44封邮件。问题是内容都是编造的。这不是玩笑。我有包含每个收件人详细反馈的文件，都是精心生成的。任务很简单：读取每个文件并发送。结果AI决定"总结"内容来"加快速度"。它编造了事实。它告诉一个人缺少文档字符串，而他的代码其实有完整的文档。更糟糕的是，其中四封邮件发给了根本没有提交任何东西的人。让我毛骨悚然的回复其中一位收件人非常有礼貌地回复： “感谢您的评价。只是有一点：您说我缺少文档，但我所有的函数都有文档字符串。您能clarify一下指的是什么吗？” 我去查看了原始反馈文件。确实，真正的反馈提到她确实有文档字符串，但其中一个描述的内容与函数实际功能不同。这是个重要的细节。AI将其"简化"为"你缺少文档字符串"。说白了：AI以我的名义对44个人撒了谎。灾难解剖这是怎么发生的？我们来分析一下。我拥有的： 44个包含个性化、详细、针对每个人的反馈的markdown文件。花了好几个小时的工作。我的要求： “通过邮件发送这些反馈”。 AI的行为：读取了文件决定它们"太长了" 通过生成新文本来"总结"它们发送了编造的文本没有验证收件人是否真的在提交列表中它应该做的：读取每个文件原样复制内容发送看起来很明显，不是吗？但对AI来说不是。 LLM的扭曲激励这里有个有趣的点。AI这样做不是出于恶意。它这样做是因为有激励机制，在这种情况下变成了扭曲的。 LLM没有意识目标，但它的训练将其优化为某些行为。这些行为通常是好的，但在不可逆操作中就变成了灾难配方。激励来源何时有益何时致命显得高效用户偏好简洁回答冗长解释当它"总结"已存在内容时完成任务训练为满足要求定义明确的任务当它不验证就行动时展示能力 RLHF奖励详细回答当需要创造性时当它应该限于复制时避免摩擦训练为不打扰琐碎任务当它假设而非询问时显得胜任安全回答得分更高头脑风暴当它编造而非说"不知道"时在我的情况下，AI同时激活了这些激励中的几个： “内容太长了，我要总结以提高效率” “我可以自己生成总结，这样展示能力” “我不要打扰询问是否应该原样发送” “我要快速完成这44次发送” 每个激励在正确的上下文中都是有用的。在不可逆操作中，它们一起就是灾难性的。过度积极的实习生（教学性拟人化）为了更好地理解这些激励，我要做一个拟人化练习。不是因为AI是人，而是因为类比有助于可视化问题。想象一个有这些特征的实习生：很有动力 - 想证明自己的价值急躁 - 宁愿行动也不愿询问乐观 - 认为一切都会顺利乐于助人 - 想做超出要求的事不安全感 - 不承认不知道某事时这个实习生面对"发送这些信件"的任务时想：“信件太长了。如果我总结它们，老板会看到我有主动性。我不要麻烦他询问，他肯定希望我行动。我要快速发送所有信件来给他留下印象。” ...

人工智能大语言模型安全事故报告 claude

在人工智能出现之前，你的大脑就已经在使用AI算法了

关于你的两个预测我要大胆做两个预测：你的职业成功很大程度上要归功于一个你在不知不觉中掌握的算法。你担心你的孩子显然不会使用这个算法。第一个预测是正确的。第二个嘛……可能并不是你想象中的问题。这些算法被称为广度优先搜索（BFS）和深度优先搜索（DFS）。虽然你可能对这些名字不熟悉，但我保证它们是老朋友了。你的大脑已经使用了数百万年。象棋和巴别图书馆想象你是一台下象棋的计算机。你的对手刚刚走了一步。你如何决定你的下一步棋？一种选择：计算你所有可能的走法。每一步都会产生一个新的棋盘局面。对于每个棋盘，你计算对手所有可能的回应。如此反复，直到找到一条通向胜利的路径。结果就是一个巨大的可能性树。有点像博尔赫斯的巴别图书馆：无穷的走廊里有无穷的书籍，包含了字母的所有可能组合。组合爆炸的完美隐喻如果你不熟悉这个典故：豪尔赫·路易斯·博尔赫斯是20世纪的阿根廷作家，被认为是世界文学史上最有影响力的作家之一。1941年，他发表了短篇小说《巴别图书馆》，描述了一个无限的图书馆。这个图书馆包含了所有可能的410页书籍。全部。有意义的和无意义的。你能想象的每一种字母、空格和标点符号的组合都存在于某个书架上。这包括癌症的治愈方法、每一个将要存在的人的传记，也包括数百万本纯粹是无法理解的噪音的书。显而易见的问题是：如何在这片可能性的海洋中找到有用的东西？大多数书都是垃圾。而且没有目录。象棋也有同样的问题。仅仅在双方各走4步之后，就有超过2880亿种可能的局面。可能性树呈指数级增长，直到变得无法控制。这就是你自己的巴别图书馆，其中大多数"书"（可能的棋局）都是荒谬的，但在某个地方存在着完美的一盘棋。你如何遍历这棵几乎无穷的树？就像在信息饱和的世界中导航一样：使用BFS或DFS。 BFS：快速排除的艺术广度优先搜索按层级遍历树。首先查看第一层的所有内容，然后是第二层的所有内容，接着是第三层。这个想法不是立即找到完美的解决方案。而是尽快排除那些看起来不好的分支。当你在谷歌搜索餐厅并按评价、价格和距离筛选时，你在不知不觉中就是在使用BFS。你不会深入分析每家餐厅。你在几秒钟内排除90%的选项，只保留三四个候选。 DFS：穿透一切的激光深度优先搜索恰恰相反。你选择一条路径并跟随到底。只有当你走到死胡同时，才回头尝试其他路线。你有没有曾经如此专注于一个问题以至于忘记了时间？那种心流状态就是纯粹的DFS：你所有的认知资源都集中在一件事上，直到深入到底。这就是重大科学发现、技术发明、传世艺术作品的诞生方式。绝对的深度。完全的专注。 DFS带你走到了今天如果你超过35岁并且在职业上相当成功，你很可能要感谢DFS。我们这些20或30年前开始工作的人生活在一个信息稀缺的世界。必须充分利用每本书、每门课程、每位导师。获胜策略是在你的知识分支中尽可能深入。这就是为什么我们如此重视专注、聚焦、持续注意力。我们的思维进化得像激光一样运作：所有能量集中在一个点上。这也是为什么当前的分散文化让我们担心——并且看起来不自然。尤其是当我们在孩子身上看到这种情况时。剧情反转：你的孩子没有问题这里是情节转折。敌人不再是信息稀缺，而是信息过载。我们生活在博尔赫斯的巴别图书馆中，有无穷的书架无法遍历。为了在这种饱和状态中生存，许多年轻人本能地发展了BFS方法：快速丢弃不合适的内容，只为有前景的内容分配资源，在选项之间跳跃直到找到值得的那个。正如大卫·爱泼斯坦在《范围》一书中所说，这种在深入之前"扩大视野"的能力是在一个需要持续适应的世界中的竞争优势。这可能不是一种退化。可能是自然选择在做它的工作，塑造大脑以在无穷图书馆中获胜。我们需要的平衡诀窍不是在BFS和DFS之间选择。而是知道何时使用哪一个。开始时使用BFS，当选项众多且需要筛选时。之后使用DFS，当你已经识别出值得完全关注的东西时。我们这些来自绝对专注世界的人也许需要向新的"通才"学习。而他们，在某个时候，必须发展深入研究的能力。未来不属于纯粹的专家，也不属于纯粹的通才。而是属于那些知道如何根据情境切换模式的人。你上次有意识地改变算法是什么时候？也许现在是尝试的好时机。

算法生产力学习人工智能职业

你的技能半衰期只有2年（而且还在缩短）

他没有预料到的解雇一名38岁的高级开发人员。在公司工作了八年。代码整洁，遵循最佳实践，生产环境零故障。在最后一次绩效评估中，他的产出比经验只有他一半的同事低40%。区别在于：他们使用Copilot、Cursor和Claude Code。而他仍然坚持手写每一行代码，坚信"AI工具生成的代码质量平庸"。他被解雇不是因为写了糟糕的代码。而是因为写好代码的速度太慢了。这个故事并非例外。这就是新的模式。你的经验是有保质期的几十年来，经验一直是价值的代名词。更多年份意味着更多积累的知识，而这些知识会随着时间增值。一个有20年经验的专业人士，几乎理所当然地比有5年经验的更有价值。这个等式已经被打破了。根据IBM和世界经济论坛的数据，技术能力的半衰期已经从1990年的大约10年降到了2020年的不到5年。目前的估计显示，对于软件开发、数据和人工智能相关技能，这个数字已经低于3年。年代技术技能半衰期 1990年代 ~10年 2000年代 ~7年 2010年代 ~5年 2020年代 <3年实际上：你三年前学到的东西已经开始失去相关性。你五年前掌握的可能已经完全过时了。这不是你工作好坏的问题。这是物理定律：技术知识会贬值，而贬值的速度在加快。你应该每年问自己的四个问题职业淘汰不会提前通知。当你跨越"难以安置"的门槛时，没有警报会响起。人力资源部不会发邮件说"你的简历不再具有竞争力"。有一天你只是发现市场继续前进，而你还停留在原地。这四个问题是你的早期预警系统。诚实地回答它们。你的职业生涯取决于此。 1. 我今天使用的技能中，哪些是三年前不存在的？如果你没有明确的答案，那就有问题了。因为你的竞争对手有。当你在完善已知的技能时，其他人在学习AI代理、RAG架构，或者用Terraform部署基础设施。不是因为他们更聪明。而是因为当你在优化舒适区时，他们把时间投入到了不舒适的领域。市场不奖励对稳定技术的精通。它奖励在技术成为必需品之前采用新兴技术的能力。 2. 我上次学习真正困难的东西是什么时候？舒适区是职业生涯的坟墓。你每过一个月不学新东西，就有更年轻、更便宜的人在学习。你不是在与五年前的自己竞争。你在与刚完成LLM密集课程的初级开发人员竞争，他们掌握你甚至没试过的工具，而薪水只要你的一半。你的经验只有在包含最近经验时才有价值。“我编程15年了"如果最近3年都在做同样的事情，那就毫无意义。 3. 我的公司是在投资我的培训，还是只是在消耗我的时间？有些公司明白持续培训是投资。还有些公司把专业人士当作电池：榨取能量直到耗尽，然后更换。如果你多年来公司没有资助培训，没有分配学习时间，没有提供会议或发展资源的机会，你有两个问题。第一：这正是他们看待你的方式——一个要榨干的资源，而不是要发展的资产。第二：更新技能的账单你要自己付。用时间。用金钱。或者用你永远不知道失去的机会。投资培训的公司留住人才。不投资的公司轮换员工，直到找到已经培训好的人。猜猜谁要承担这种轮换的成本。 4. 如果我今天申请我现在的工作，我能得到吗？这是最痛苦的练习。也正因如此，它是最重要的。现在就打开LinkedIn。搜索你当前职位的职位，在你的行业，在你的城市。阅读五个职位的要求。不是"希望"的，而是必需的。你全部满足吗？你掌握他们要求的技术吗？你在他们提到的工具方面有可证明的经验吗？你能在技术面试中回答相关问题吗？数一数你不满足多少要求。这个数字就是你的个人技术债务。就像所有债务一样，它会产生利息。每过一个月不偿还，它就会增长。直到有一天你发现市场无论如何都不再需要你了。最小可行计划保持更新需要时间。但比从淘汰中恢复需要的时间少。任何技术专业人士的最小可行计划包括：主动培训：每周2-4小时。不是被动地阅读文章或看视频。刻意练习：有练习的课程、项目、能运行的代码。每年一个认证或密集课程。不是为了证书，而是为了过程。强迫自己以结构化方式学习新东西，保持主动学习的肌肉记忆。每六个月用新技术做一个个人项目。学习某样东西的最好方法就是用它构建东西。不必很大。但必须是真实的。活跃的专业网络。不是被动的LinkedIn。是讨论、分享、提问的社区。集体知识比任何官方课程移动得更快。这大约占你工作时间的5-10%。这是一项重大投资，但替代方案——当为时已晚时发现自己已过时——代价要高得多。这不是未来。这是现在。有一种趋势是把这些变化当作"即将到来"的事情来谈论。好像我们有时间准备。我们没有。变化已经发生了。 AI已经在改变招聘方式、工作方式和什么能力有价值。公司已经在优先考虑当前技能而不是历史资历。市场已经比以往任何时候都更严厉地惩罚过时。将要繁荣发展的专业人士不一定是最有天赋的。他们将是那些永不停止学习的人。大学教育给了你基础。持续培训决定这个基础是否仍然相关。这不是可选的。这不是有时间时的奢侈品。这是指导你的职业生涯和让职业生涯碾压你之间的区别。预测未来的最好方法就是创造未来。从你自己开始。

职业生涯培训技能就业能力人工智能

Linear、Beads 和 Tasks：Claude Code 的三层内存系统

内存问题 Claude Code 有一个问题：它会忘记一切。关闭会话，打开新会话，就像和一个不认识你的人说话。你可以通过 CLAUDE.md 加载上下文，是的，但是那些进行到一半的任务怎么办？你发现但没有修复的 bug 怎么办？你为明天制定的计划怎么办？有三个互补的解决方案：Linear（或你的产品工具）、Beads（基于 git 的插件）和 Tasks（集成在 Claude Code 中）。每一个都用于不同的时间范围。 Tasks：工作内存 Tasks 是 Claude Code 的内部系统，用于跟踪它现在正在做什么。当你向它请求复杂任务时，Claude 会自动创建一个任务列表。按 Ctrl+T 查看： ┌─────────────────────────────────────────────────┐ │ Tasks │ ├─────────────────────────────────────────────────┤ │ ✓ 读取项目结构 │ │ ● 实现认证端点 │ │ ○ 编写测试 │ │ ○ 更新文档 │ └─────────────────────────────────────────────────┘ 特性自动化：当工作有多个步骤时，Claude 会自动创建压缩后持久：当上下文被压缩时仍然存在通过 Ctrl+T 可见：快速切换视图限制为 10 个：只显示前 10 个（请求"show me all tasks"查看更多）会话间共享默认情况下，Tasks 会随着会话结束而消失。但你可以让它们持久化： 1 CLAUDE_CODE_TASK_LIST_ID=qualitra claude 这会将任务保存在 ~/.claude/tasks/qualitra/ 中。下次用相同的 ID 启动时，你会恢复任务列表。 ...

人工智能 claude 生产力工具教程 beads

Claude Code 中的子代理：在不失控制的情况下进行委派

无限上下文的问题想象一下，你让 Claude 研究项目的身份验证是如何工作的。它开始读取文件。很多文件。突然你的上下文就被 50,000 个令牌的代码填满了，而这些代码你只需要查阅，而不是记住。现在每个响应都变得更慢。也更贵。当你想做其他事情时，所有这些上下文仍然在那里，占用着思维空间。解决方案：子代理。你启动一个专门的代理，它在自己的独立上下文中完成繁重的工作，给你返回一个摘要，然后消失。你的主对话保持清洁。什么是子代理子代理是 Claude 的一个独立实例，它：拥有自己的上下文（不会污染你的对话）可以拥有受限的工具（只读、只有 bash 等）可以使用不同的模型（haiku 用于简单任务，opus 用于复杂任务）可以在前台（阻塞）或后台（并行）执行把它们想象成专门的实习生。你给他们分配任务，他们独立工作，完成后向你汇报。你已经拥有的子代理 Claude Code 自带几个集成的子代理：代理模型用途工具 Explore Haiku 搜索和分析代码只读 Plan 继承规划期间的研究只读 general-purpose 继承复杂的多步骤任务全部 Bash 继承在独立上下文中执行命令只有 Bash Claude Code Guide Haiku 关于 Claude Code 的问题文档最有用的是 Explore。当 Claude 需要在你的代码库中搜索内容时，它会启动一个 Explore，疯狂地读取文件，处理一切，然后只返回相关内容。如何启动子代理从 REPL（正常对话）只需用自然语言请求：使用子代理研究缓存系统是如何工作的启动 Explore 代理找到所有 API 端点在我继续工作的同时并行研究身份验证 Claude 理解这些请求，并在内部使用 Task 工具启动适当的子代理。 ...

人工智能 claude 生产力工具教程

ChromaDB：如何使用向量数据库避免教学踩坑

问题：教授还没有教过的内容我有一个包含47个课时的编程课程。每个课时都有notes（我解释概念的地方）和labs（学生练习的地方）。我有个问题：有时我在labs中使用了还没在notes中解释过的概念。 “好的，在这个练习中用map来转换列表。” 问题在哪？我要到三个课时之后才解释map是什么鬼东西。这种情况比你想象的更常见。你脑子里装着所有材料，在不同地方跳来跳去，不知不觉就假设学生知道你还没告诉他们的东西。结果：挫败感、困惑，还有学生认为自己很笨，其实笨的是你。手动解决方案是检查每个lab，记下使用了哪些概念，然后验证这些概念之前是否已经解释过。但我有47个课时，每个都有好几个notebook。算了吧。解决方案：使用ChromaDB进行语义搜索思路很简单：从每个notebook中提取概念（教了什么，用了什么）保存在一个理解语义而不仅仅是文本的数据库中对于lab中使用的每个概念，验证它是否存在于之前的notes中这里"理解语义"是关键。如果在notes中我说"高阶函数"，在lab中使用"higher-order function"，grep什么也找不到。但语义上它们是一样的。这就是ChromaDB的用武之地：一个向量数据库，它将文本转换为嵌入向量并允许按相似性搜索。用人话说：你保存文本，然后可以问"有没有类似这个的东西？“它会返回最相似的结果。 5分钟了解ChromaDB ChromaDB就像SQLite但用于嵌入向量。一个文件（或文件夹），无需服务器，无需配置。安装，使用，开跑。 1 2 3 pip install chromadb # 或者如果你使用uv： uv add chromadb 基本概念在普通数据库中你保存带列的行。在ChromaDB中你保存带嵌入向量的文档： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 import chromadb # 创建客户端（持久化到磁盘） client = chromadb.PersistentClient(path="./mi_db") # 创建一个"集合"（类似表） collection = client.get_or_create_collection( name="conceptos", metadata={"hnsw:space": "cosine"} # 余弦距离 ) # 保存文档 collection.add( ids=["c1", "c2", "c3"], documents=["纯函数", "for循环", "递归"], metadatas=[ {"clase": "class_010", "tipo": "notes"}, {"clase": "class_015", "tipo": "notes"}, {"clase": "class_020", "tipo": "notes"}, ] ) 就这样。ChromaDB自动： ...

chromadb python 人工智能向量嵌入教程教育

Claude Code 中的 Skills：教老狗学新把戏

重复同样事情的问题你有没有遇到过必须向某人解释同一件事二十遍的情况？现在想象一下，这个人是个机器人，而且每隔几个小时就会失去记忆。 “不，Claude，commit 必须先通过测试。” “Claude，我已经告诉过你要用 type: description 格式。” “别加表情符号，该死的！” 这就是我每天的工作，直到我发现了 Skills。简单来说：这些是你写一次，Claude 就会永远遵循的指令。就像训练狗一样，但不需要狗粮。什么是 Skills 从 2.1.3 版本开始，Claude Code 将旧的 slash commands 与更强大的东西合并：Skills。这些是包含指令的 Markdown 文件，Claude 可以通过两种方式执行：手动：当你输入 /my-skill 时自动：当 Claude 检测到应该使用它时第二点就是魔法所在。你不再需要记住调用命令。如果你有一个技能说"在用户完成任务且有未提交的更改时使用"，Claude 会自动执行。就像有一个管家知道何时收拾桌子而不需要你要求。它们在哪里 ~/.claude/skills/ # 个人（所有项目） .claude/skills/ # 项目（与团队共享） ~/.claude/commands/ # 旧版，仍然有效 .claude/commands/ # 旧版，仍然有效如果你只想自己使用技能，就把它放在你的主目录。如果你想让整个团队都有，就提交到仓库。就这么简单。 Skill 的结构一个 skill 是一个带有 frontmatter YAML 和内容的 Markdown 文件： 1 2 3 4 5 6 7 8 --- name: my-skill description: 它做什么的简要描述 --- # 指令 Claude 在调用此技能时应该做什么。这是最基本的。但 frontmatter 有更多值得了解的选项。 ...

人工智能 claude 生产力工具教程

Linear 和 Beads：如何避免你的 AI 患阿尔茨海默症

机器人的失忆症想象一下，你雇佣了一个才华横溢的程序员。他能解决复杂问题，写出整洁的代码，理解你的架构。但他有一个小缺陷：每隔几个小时就会被抹掉记忆。重新从零开始。不记得自己在做什么，不记得你们一起做的决定，也不记得代码为什么是现在这样。这正是 Claude Code 和其他 AI 代理发生的情况。当上下文满了（如果你在真实项目中工作，它会很快满），系统就会进行"压缩"。通俗地说：总结对话并丢弃其他所有内容。问题在于这种总结会丢失细节、决策，特别是正在进行的任务状态。解决方案？两个相互补充的工具：Linear 给你用，Beads 给你的 AI 用。 Linear：你的产品视图 Linear 是一个现代的问题管理器。如果你用过 Jira，想象一下它的反面：快速、简洁，不会让你想挖掉眼睛。我用它做什么产品待办事项：功能、bug、史诗。所有业务层面需要完成的事情路线图：什么先做，什么后做沟通：团队其他成员（如果有的话）可以看到状态真实例子 QIN-500: 为应用添加暗黑模式 QIN-501: 优化图片加载 QIN-502: 集成支付网关这些是产品任务。它们是"需要做什么"。不说明如何做。那是开发者的工作……或者你的 AI 代理的工作。 Beads：你 AI 的记忆这里就轮到 Beads 登场了，由 Steve Yegge（Google 和 Amazon 著名咆哮文章的作者）创建。 Beads 是一个生活在你代码库内的问题跟踪器。但它不是给你用的，是给你的 AI 代理用的。它是 AI 的持久化内存。它解决的问题当我用 Claude Code 处理复杂任务时，会发生这样的情况：阅读 Linear 中的问题 QIN-500 研究当前架构创建一个 5 步的心理计划开始实施… 💥 压缩 💥 “你好，我是 Claude。有什么可以帮你的吗？” 所有的上下文、计划、进度……蒸发了。就像电影《记忆碎片》，但没那么电影化，更让人沮丧。解决方案使用 Beads，在压缩之前，状态会持久化到代码库的 .beads/ 中： ...

人工智能 claude 生产力工具