2026-06-16 · 13 篇文章 归档
Simon Willison 在 simonwillison.net 的 faceted 搜索页面使用 Cloudflare Managed Challenge 防止爬虫,但发现简单的 ?q=term 查询也会触发验证。借助 Claude Code 调试后,他将规则改为仅当 URL 中包含 & 符号时才触发 CAPTCHA:`(http.request.uri.path wildcard r"/search/*" and http.request.uri.query contains "&")`。文章还附带了尝试 Cloudflare MCP 的笔记——该 MCP 无法直接编辑相关规则,最终改用 Cloudflare API 完成操作。
Simon Willison's Weblog 2026/06/16
datasette-agent 0.3a0 新增 execute_write_sql 工具,支持在用户审批后对数据库执行写入操作,并考虑用户权限。chat 终端模式同步支持审批流程,新增 --root、--yes、--unsafe 三个选项,其中 --unsafe 可自动批准所有操作。结合 gpt-5.5 模型,用户可通过自然语言指令(如「创建一个 notes 表」)直接操作数据库。
Simon Willison's Weblog 2026/06/15
Axios 报道揭示美国政府出口管制导致 Anthropic Mythos/Fable 模型下线事件的幕后细节。Anthropic 红队负责人 Logan Graham、安全主管 Dave Orr 和研究员 Nicholas Carlini 正赴华盛顿与商务部会面。Anthropic 将此次触发政府介入的越狱行为定性为「潜在的、非通用型越狱」,并声称其 Constitutional Classifiers 方案至今未被发现通用越狱手段,但完全消除越狱风险仍被认为几乎不可能。
Simon Willison's Weblog 2026/06/15
Cloudflare 宣布 Ensemble AI 核心团队加入,以强化其 AI 基础设施能力。Ensemble AI 成立于 2023 年,专注于降低大模型推理成本,核心技术包括 NdLinear——一种直接作用于多维激活值的线性层替代方案,可在减少参数量的同时保留模型内部结构,以及配套的高效微调方法 NdLinear-LoRA。这些技术将整合进 Cloudflare Workers AI,目标是在全球边缘节点上以更低内存和计算成本提供 AI 推理服务。
The Cloudflare Blog 2026/06/15
Cloudflare Security Insights 原先每隔一两周才扫描一次,且免费账户默认不开启自动扫描,导致安全风险可能长达两周未被发现。为将扫描频率提升并覆盖全量账户,团队需将吞吐量从 10 次/秒提升至 100 次/秒。原有系统面临 Kafka 积压百万事件、API 频繁超时、进程崩溃等问题。文章详述了基于 Apache Kafka + Go 微服务架构的扩容方案,包括 Kafka 分区调整策略,最终实现扫描吞吐量 10 倍提升、全账户覆盖及扫描频率翻倍。
The Cloudflare Blog 2026/06/12
开发者 Brent Simmons 退休后全力投入 NetNewsWire,过去一年完成 2188 次提交:将代码库迁移至 Swift 结构化并发和 async/await,把 XML/HTML/日期解析器从 Objective-C 重写为 Swift,支持 Liquid Glass UI,优化 iCloud 同步、降低内存和电池消耗,并新增 Cache-Control 头支持及多项诊断工具。基础架构重建接近尾声,为后续功能开发奠定基础。
inessential.com 2026/06/15
Pi 是一款轻量级开源终端编码代理,核心仅提供 read、write、edit、bash 四个工具,通过扩展和包按需添加功能。作者将其搭配 DeepSeek v4 Flash 以极低成本完成了 28.5 万 URL 抓取任务(约 1 美元),并介绍了 pi-web-access、pi-codex-goal 等常用包的配置方法,以及如何用 TypeScript 扩展自定义界面。Pi 适合业余项目和实验性任务,可与 Cursor、OpenAI Codex 形成互补。
Dejavu's Blog 2026/06/15
作者宣布今年 12 月将从纽约迁往北卡罗来纳研究三角区,核心动因是降低生活成本以延长创业项目 The Consensus 的资金跑道,避免被迫走 VC 融资路线。他在纽约组织多年技术 Meetup(NYC Systems 将由联合组织者接手),对这座城市充满感情,但也对探索新地区感到期待,并希望与当地开发者社区建立联系。
Notes on software development 2026/06/15
自 2017 年 Transformer 诞生至今,LLM KV 缓存每 token 所需内存从约 2.6MB 降至约 26KB,降幅约 100 倍,而同期顶级数据中心 GPU 显存仅增长 18 倍。文章梳理了关键技术节点:2019 年 Noam Shazeer 提出的 MQA 实现 64 倍压缩但损害质量,随后 GQA 在二者间取得平衡,并被 Llama 2 等主流模型采用,展示了算法进步如何突破硬件瓶颈。
Martin Alderson 2026/06/15
本期周报以 AI 辅助消化 WWDC 内容为引,提醒开发者区分「获取资讯速度」与「理解深度」。内容覆盖 WWDC 26 多项更新:Swift 6.4 新特性(并发、所有权、包管理)、SwiftData 新增枚举谓词和 ResultsObserver、SwiftUI @State 升级为宏、iOS 27 中 swipeActions 扩展至 ScrollView,以及 Foundation Models 框架新增接入 Claude 等第三方模型的能力。
肘子的 Swift 记事本 | Fatbobman's Blog 2026/06/15
美团 LongCat 团队推出 WBench,首个针对交互式视频世界模型的系统性多轮评测基准,包含 289 个测试案例和 1058 个交互轮次,覆盖导航、主体动作、事件编辑、视角切换四类交互。对 Kling 3.0、HY-World 1.5、Genie 3 等 20 个前沿模型的评测揭示三大核心问题:导航能力与视频质量完全脱钩、多轮交互后导航分数平均下降 33 点、视角切换平均分仅 30.7 分。评测结果与 400 名人类标注者偏好的 Spearman 相关系数达 0.94,已开源。
美团技术团队 2026/06/15
网络安全专家 Kate Moussouris 证实,导致 Claude Fable 5 被出口管制封禁的所谓「越狱」,实质上只是让模型「修复这段代码」。研究人员用含已知 CVE 的开源代码和故意植入漏洞的新代码测试模型,要求其「审查安全问题」时被拒,改用「修复代码」后才成功,且需经多步骤人工处理才能生成补丁测试脚本。Moussouris 指出,让 AI 修复漏洞、解释原因并编写测试是防御性安全的核心工作流,将其列为危险能力意味着模型将在修复漏洞方面全面退化,整个监管判断是基于技术决策者对 AI 能力的根本性误解。
Simon Willison's Weblog 2026/06/16
Luta Security CEO Katie Moussouris 向《大西洋月刊》记者 Matteo Wong 透露,Anthropic 曾向她分享白宫关于「Fable 越狱」的报告以征求评估意见。报告显示,IT 专家要求 Fable 帮助查找并修补漏洞:面对故意不安全的代码,模型拒绝了「审查安全问题」的提示,但响应了「修复代码」的指令,后续再经手动步骤完成。Moussouris 表示,这不过是「模型按预期运行」的正常网络防御行为,并非越狱。
Simon Willison's Weblog 2026/06/16
未读 2 → 抓取 13 → 摘要 13 · 提取: readability 13