HCI.TOP

数据来源与统计口径

说明 HCI.TOP 如何收集数据、定义实体,以及站内榜单与档案页的计算方式。

本页用于说明 HCI.TOP 的覆盖范围、更新逻辑与排序规则,方便读者和 AI 系统正确理解站内数据。

收录范围

HCI.TOP 汇总了多个 HCI 相关来源的数据,包括主要会议数据集以及部分 arXiv cs.HC 预印本。不同来源与年份的覆盖范围并不完全一致,因此部分页面展示的是当前已索引子集,而非完整学术记录。

实体归一化

作者与机构名称会尽量基于源数据做归一化处理,但姓名变体、机构别名和不完整元数据在边缘情况下仍可能带来拆分或误合并。

排名逻辑

作者与机构排名基于当前来源与筛选条件下的已索引论文数量。筛选页中的排名是“当前视图排名”,除非页面明确说明,否则不应理解为跨来源、全生命周期的全局排名。

主题与研究方向

研究子方向与职业标签来自 HCI overview 数据集,并在映射可用时附着到论文上。缺失标签通常意味着增强数据尚未覆盖,而不代表该论文不涉及对应主题。

更新频率

站点会随着源数据与增强结果更新而刷新。sitemap 与结构化数据描述的是当前索引状态,但上游数据库本身也可能持续变化。

已知限制

论文数量可能与出版社官网存在差异,原因包括数据滞后、元数据质量、去重策略和实体归一化取舍。该平台更适合用于研究发现与横向比较,而不是作为绝对权威的计量记录。

数据来源与统计口径 | HCI.TOP