RSS 每日摘要

2026-05-16 · 15 篇文章 归档

Databricks 将 GPT-5.5 引入企业级 Agent 工作流

Databricks 宣布在企业 Agent 工作流中采用 GPT-5.5,该模型在 OfficeQA Pro 基准测试中创下新的最优成绩。此举标志着 GPT-5.5 开始进入企业级智能体应用场景,Databricks 成为率先将其整合进生产工作流的头部企业数据平台之一。
OpenAI News 2026/05/15

ChatGPT 推出全新个人财务管理功能

OpenAI 面向美国 Pro 用户推出 ChatGPT 个人财务功能预览版,用户可安全连接银行账户,通过可视化仪表盘追踪资金流向,并基于真实财务数据向 ChatGPT 提问。该功能依托 GPT-5.5 的增强推理能力,与 Intuit 等生态合作伙伴集成,支持预算规划、投资咨询等场景,目前已有逾 2 亿用户每月使用 ChatGPT 处理财务问题。
OpenAI News 2026/05/15

iNaturalist 观测记录聚合工具 inaturalist-clumper 发布 0.1 版

Simon Willison 发布 inaturalist-clumper 0.1,这是他用于将 iNaturalist 自然观测记录发布到个人博客的基础设施组件。该工具已在生产环境运行数周,经过多轮迭代后正式发布首个版本,输出结果为 JSON 格式,可在其博客中查看示例数据。
Simon Willison's Weblog 2026/05/15

datasette-llm-limits 0.1a0:为 Datasette 中的 LLM 用量设置周期性限额

Simon Willison 发布 datasette-llm-limits 0.1a0,这是一个 Datasette 插件,可配合 datasette-llm 和 datasette-llm-accountant 使用,支持按用户或全局维度设置 LLM 调用费用上限。配置示例支持滚动 24 小时窗口、按 actor 粒度限制,每日每用户上限可设为固定美元金额,适用于控制多用户场景下的 LLM 成本。
Simon Willison's Weblog 2026/05/15

借助 Claude 构建的 QR 码在线生成工具

Simon Willison 借助 Claude 构建了一个 QR 码生成工具,支持将任意 URL、文本或 WiFi 网络信息编码为 QR 码。工具提供方形、液态等多种样式,可自定义尺寸、颜色和边框,生成结果可下载为 PNG 或直接复制到剪贴板,是一个典型的 AI 辅助快速构建小工具的案例。
Simon Willison's Weblog 2026/05/15

在 Strix Halo 上运行 DramaBox TTS 模型

DramaBox 是 Resemble AI 基于 LTX-2.3 3.3B DiT 的表达性 TTS 模型,通过剧本式 Prompt 控制说话人情感与语气,总推理占用约 16.5 GB。作者在无 NVIDIA GPU 的 Strix Halo(Radeon 8060S)上成功运行该 CUDA-only 模型:CPU 路径通过修补 LTX-2 框架中硬编码的 CUDA 调用、统一 fp32 精度解决类型不匹配;ROCm GPU 路径复用了此前 Unsloth Studio 的 TheRock gfx1151 nightly 栈,绕过 bitsandbytes 的 AMD 兼容性限制。
Sleeping Robots 2026/05/15

欲速则不达:AI Agent 治理与成本控制实践

Manulife 全球 CAIO Jodie Wallis 分享了 AI 落地的核心教训:缺乏治理的 Agent 原型往往卡在 UAT 数月无法上线。解法是从第一天起嵌入自动化治理——自我风险评估、准确性审计与对抗防御。EU AI Act 将于年内开始执法,合规要求覆盖可解释性与实时干预能力。Manulife 通过三支柱成本治理方案(基于 Akka 平台)实现了处理速度提升 30–50%、并发量提升 300%,支撑其对外承诺的 10 亿美元 AI 价值目标。
AKKA Blogs 2026/05/15

Forward Deployed Engineer:AI 时代的新宠岗位,到底干什么?

FDE(前线部署工程师)是介于工程师、架构师与咨询顾问之间的实操岗位,核心工作是驻场客户公司,用 AI 技术解决真实业务问题(约 25% 写代码、50% 集成调试、25% 沟通)。该模式起源于 Palantir 2010 年代的军情客户实践。当前 Google、OpenAI、Anthropic 同时押注 FDE:OpenAI 成立估值 140 亿美元的独立部署公司并收购英国 FDE 团队,Anthropic 联合黑石等华尔街机构成立合资公司,Google 则直接雇佣并给予母公司股权。三种模式在反馈闭环和利益绑定上存在本质差异。
宝玉的分享 2026/05/15

语言包注册表在设计上默认处于「不稳定」状态

pip、npm 等语言包管理器的公共注册表在结构上等同于 Debian sid(不稳定池):任何经认证的发布者随时可推送新版本,解析器默认选取最新版,没有任何晋升门控。而 apt、dnf、pacman 等系统包管理器均默认指向稳定通道,bleeding-edge 需主动开启。event-stream、xz、GitHub Actions 蠕虫等供应链攻击事件频发,本质上是将不稳定池直连生产环境的必然结果,而非偶发漏洞。作者呼吁语言生态引入类似系统包管理器的稳定通道机制。
Andrew Nesbitt 2026/05/15

美团 LongCat 开源 General 365:树立推理评测新标尺

美团 LongCat 团队发布通用推理基准 General 365,包含 365 道原创种子题与 1095 个变体,知识范围严格限定在 K-12,旨在解耦推理能力与专业知识记忆。测试 26 款主流模型后发现,Gemini 3 Pro 以 62.8% 勉强夺冠,仅 2 款模型达到及格线,GPT-5-Thinking 在 BBH 上准确率 92%,在此基准上仅得 58.6%。模型在「语义干扰」与「最优策略」两个维度表现最差。Gemini 3 Pro 以约 14k tokens 实现最高分,同等准确率的其他模型输出达 25k–30k tokens。项目已全面开源。
美团技术团队 2026/05/15

理解 Linux 文件系统层级结构

/bin、/usr/bin、/usr/local/bin 到底有何区别?Linux 文件系统层级标准(FHS)是一份由 Linux 基金会工作组制定的 43 页文档,规定了各目录的用途,但现实使用与标准之间存在落差。本文梳理了 /bin、/usr、/var、/run、/opt 等易混淆目录的设计历史与实际用法,指出这些约定更像语言语法而非硬性技术规则,帮助需要从源码安装或打包软件的开发者做出正确的目录选择。
Sinclair Target 2024/11/14

我为何如此喜爱 Myst 中的日志设计

重玩经典解谜游戏 Myst 后,作者最念念不忘的不是那些谜题,而是主角 Atrus 的手写日志——以优雅的草书记录洞穴探索、地热能利用与天文观测,兼具航海日志与科学笔记的气质,并附有风景、建筑和机械的素描。这些日志以克制而具体的细节构建出独特的世界感,恰是 Myst 有别于其他游戏的精髓所在。
Sinclair Target 2024/10/22

配置 Bash 让命令历史真正好用

Bash 的默认历史记录配置沿用数十年前的设定,HISTSIZE 仅 500 条,跨窗口无法共享历史,导致频繁搜索不到近期命令。将 HISTSIZE 调至 100,000 是第一步,此外还需理解 HISTFILESIZE、多实例并发写入冲突、HISTCONTROL 去重等机制。相比 Fish 等现代 shell 开箱即用,Bash 需要手动调优,但配置到位后同样可以满足日常需求。
Sinclair Target 2024/10/12

如何让 Python 日志不再嘈杂

Python logging 模块的 basicConfig() 会将日志级别设置到根 logger 上,导致所有第三方依赖库的日志一并涌出,DEBUG 级别下尤为混乱。正确做法是为应用自身的 logger 单独设置级别,而非操作根 logger,从而将第三方库的日志噪声与业务日志隔离。本文给出了一套可直接复用的配置模式,避免每次新项目都要重翻文档。
Sinclair Target 2024/03/13

Cambridgeport 一栋我喜欢的房子

作者以《美国住宅田野指南》为索引,尝试用建筑术语描述马萨诸塞州剑桥市 Cambridgeport 街区一栋令其多次驻足的老宅。最显眼的特征是转角处的仿石隅石(faux quoins)——以木材模仿大型石块交错砌筑,甚至做了倒角细节,配合黄色墙面与绿色装饰,为立面带来一丝古典庄严感。参考书的价值在于赋予人命名事物的能力,从而更敏锐地感知日常环境。
Sinclair Target 2022/11/25
未读 5 → 抓取 15 → 摘要 15 · 提取: rss 1 / browser-rendering 1 / readability 13