现有的开源项目重要性评分模型——无论来自基金会、学术界还是资助方——基本都依赖同一套十几个信号,因为这些信号能在一个下午内从 registry API 和 GitHub REST 接口获取。这些模型最致命的缺陷是将「信号缺失」等同于「低分」:curl 在可统计渠道的下载量是每年一万次,实际安装量却约达两百亿;C 语言库通过 apt、静态链接等无统计渠道分发,直接被过滤器排除。更深层的问题是「候选集过滤」——评分公式本身只是次要决定,哪些项目有资格被评分,才是更关键的前置选择,而这一排除过程几乎从不显式标注。
Andrew Nesbitt 2026/05/09