RSS 每日摘要

2026-06-18 · 11 篇文章 归档

GLM-5.2 可能是目前最强的纯文本开源权重大模型

Z.ai 于6月16日以 MIT 协议开放 GLM-5.2 全量权重。该模型参数量达753B(40B激活,MoE架构),上下文窗口从20万扩展至100万 token。在 Artificial Analysis Intelligence Index 上以51分领先 MiniMax-M3(44)、DeepSeek V4 Pro(44)等模型,位居开源榜首;Code Arena WebDev 编程榜单排名第二,仅次于 Claude Fable 5。OpenRouter 定价为输入$1.40/百万、输出$4.40/百万,显著低于 GPT-5.5 和 Claude Opus 4.5。需注意该模型输出 token 消耗偏高,每任务平均43k token。
Simon Willison's Weblog 2026/06/17

引用 Charity Majors:AI 要求更强的工程纪律,而非更弱

Honeycomb CTO Charity Majors 指出,2025年代码生产的经济逻辑被彻底颠覆:代码生成从昂贵耗时变为近乎免费且即时,代码行从被珍视、复用和精心维护,变成了可随时丢弃和重新生成的消耗品。这一转变发生得几乎是一夜之间,并由此对工程师的工程纪律提出了更高而非更低的要求。
Simon Willison's Weblog 2026/06/17

Datasette 1.0a34 发布:支持在 UI 中直接插入、编辑和删除行

Datasette 1.0a34 的核心新特性是在表格页面和行页面直接提供增删改操作入口,用户无需借助 SQL 或 API 即可编辑数据。这一功能的直接灵感来自 Datasette Agent——作者在为其添加 SQL 写入支持后,发现通过聊天界面能做到的事情在正式 UI 里反而无法实现,这一反差推动了此功能的落地。
Simon Willison's Weblog 2026/06/16

OpenAI 发布 LifeSciBench:面向真实生命科学研究的 AI 评测基准

LifeSciBench 是由173位拥有博士背景的执业生命科学家参与编写、453位专家审核的评测基准,包含750个任务,覆盖7类工作流(证据处理、分析、实验设计、科学推理、验证操作、转化研究、科学传播)和7个生物领域,共19,020条评分标准。其设计目标是测量 AI 能否处理真实研究级任务,如解读不完整证据、调和矛盾结果、设计实验和评估转化风险,而非仅回答简单问答题。
OpenAI News 2026/06/17

近自主 AI 化学家利用 GPT-5.4 改进了药物化学中的关键反应

OpenAI 与 Molecule.one 合作展示了一个基于 GPT-5.4 的近自主 AI 化学家系统,成功优化了药物合成中一步具有挑战性的反应,推进了medicinal chemistry 研究。这一案例展示了 AI Agent 在真实科研场景中执行多步骤化学任务的实际能力。
OpenAI News 2026/06/17

<click-to-play> — 点击即播的静态图片组件

一个渐进增强式 Web Component,将包含 GIF 链接的普通 `<a>` + `<img>` 标签转换为「静帧预览 + 按需加载」模式:默认只显示 GIF 第一帧静态图,用户点击播放按钮后才加载完整 GIF,避免页面无谓消耗带宽。作者为 Datasette 的行编辑功能演示文章专门构建了该组件。
Simon Willison's Weblog 2026/06/17

Cloudflare One Stack 发布:用 AI Agent 自动化部署 Zero Trust 环境

Cloudflare 发布 One Stack,这是一套可赋予 AI Agent 的技能集,用于自动化配置、部署和管理 Zero Trust 网络安全环境。该工具包凝聚了 Cloudflare 团队数万小时的客户迁移经验,内置从 Zscaler、Palo Alto Networks 等传统厂商迁移的逻辑,并可与 Cloudflare MCP Server 结合,让 Agent 通过类型化接口查询账户配置、执行变更,大幅降低 SASE 迁移门槛。
The Cloudflare Blog 2026/06/17

你变快了,公司却没有——AI 生产力的隐形代价

AI 让每个人自我感觉更高效,但组织整体速度并未提升。问题在于:AI 生成的文档篇幅更长、可信度存疑,迫使每位评审者对每个细节逐一核实,把作者省下的时间转嫁给了所有读者。文档的本质是服务——作者应花时间压缩内容,让读者节省时间。作者提出一个原则:如果无法解释 AI 生成代码的每处改动,就不应提交;同理,AI 生成的内容必须经过真正的编辑才算完成工作。
Terrible Software 2026/06/17

Tailscale 日志流新增 Azure Blob Storage 目标,至此覆盖三大云平台

Tailscale 新增 Azure Blob Storage 作为日志流目标,现已支持 AWS S3、Google Cloud Storage 和 Azure Blob Storage 三大主流云对象存储。此前,配置日志流需在模态框内操作,现已迁移至独立全页面,支持配置审计日志和网络流日志的流式传输,便于合规留存与 SIEM 分析。该功能面向 Premium 和 Enterprise 计划用户。
Blog on Tailscale 2026/06/17

英国性侵团伙调查报告:25 万名女孩受害,机构系统性失职

英国议员 Rupert Lowe 发布《强奸团伙调查报告》,估计数十年间约 25 万名英国女孩遭受以巴基斯坦裔穆斯林为主的性侵团伙迫害。报告揭示警察、社会服务、NHS、学校、出租车监管机构等多部门系统性失职:销毁证据、惩罚举报人、将受害者遣返施害者处。DHH 同时援引 BBC 数据指出英国民众对传统媒体信任度的急剧下滑,认为机构性压制信息是根本原因之一。
David Heinemeier Hansson 2026/06/17

从 Size Class 到可用空间:WWDC 26 之后 horizontalSizeClass 还可靠吗?

WWDC 26 宣布 iPhone 应用在 iPhone Mirroring 及 iPad 上将支持自由调整窗口尺寸,这使得 horizontalSizeClass、userInterfaceIdiom、UIScreen.main 等传统布局依据不再可靠。作者通过实测发现,iPhone host 下窗口拉宽后 horizontalSizeClass 仍保持 compact,并经 Session 278 确认这是 Apple 有意设计:系统将「宿主语义」与「可用几何空间」拆分。正确做法是以 window scene 的 effective geometry 或 view 的实际可用尺寸作为布局断点依据,horizontalSizeClass 仅适合表达系统容器级粗粒度语义。文章梳理了 2014 年至今 Apple 布局系统的演进脉络。
肘子的 Swift 记事本 | Fatbobman's Blog 2026/06/17
未读 11 → 抓取 11 → 摘要 11 · 提取: readability 9 / browser-rendering 1 / rss 1