Criticality:基于交互式批判性思维与循证推理痕迹的决策支持脚手架决策需要检查底层假设和概念,考虑多元视角,并用清晰、准确的推理权衡潜在后果。最近的大型语言模型(LLM)有望通过结合推理能力与从大型文档中检索相关信息的能力来辅助决策者。然而,我们与五位专业决策者的形成性研究揭示了在工作流中使用LLM的关键限制:耗时的用户目标对齐、缺乏循证依据、过长输出、以及未浮出的假设,这些都削弱了用户对LLM输出和最终决策有效性的信任。我们引入Criticality,一个将Paul-Elder批判性思维框架操作化的系统,将推理结构化为交互式思维元素(如目的、假设、观点、含义),并使用智力标准(如清晰性、公平性、逻辑性)评估和指导推理。它还为每个主张检索证据,将其分类为支持、中立或矛盾,并解释主张-证据链接。一项将Criticality与ChatGPT 5 Pro(对话接口中最先进的推理模型)比较的Within-subjects研究(n=13)发现,Criticality改善了用户在决策过程中驾驭和修复推理的交互,产生了比基线更好的决策理由。2026MCMinsuk Chang et al.Georgia Institute of Technology大语言模型(LLM)的人机协作可解释人工智能(XAI)用户研究方法(访谈、调查、观察)IUI
我需要找到那张图表:数据工作者如何导航、总结和传达分析对话Gu 等人设计了一款补充结构化元素的分析对话界面,通过视觉回忆、顺序和抽象化等导航策略,帮助数据工作者高效回顾和传达分析对话。2026KGKen Gu et al.University of Washington用户研究方法(访谈、调查、观察)原型设计与用户测试交互式数据可视化CHI
Lexara:用于评估对话式可视化分析中大语言模型的用户中心化工具包Palani 等人开发 Lexara 工具包,通过可解释指标和无需编程的交互界面,评估对话式可视化分析中大语言模型的表现。2026SPSrishti Palani et al.Tableau Research大语言模型(LLM)的人机协作交互式数据可视化可解释人工智能(XAI)CHI
DesignWeaver: 文本到图像产品设计的维度架构Tao 等人设计 DesignWeaver 界面,通过提取产品设计维度到调色板,帮助初学者生成更专业的文本到图像提示,但发现用户期望超出模型实际能力。2025STSirui Tao et al.University of California San Diego, Department of Computer Science and Engineering/ University of California San Diego/ ProtoLab生成式AI(文本、图像、音乐、视频)运动障碍辅助输入技术可定制与个性化物件CHI
AI写作能否被挽救?通过编辑来缓解特异性并提高写作过程中的人机一致性Chakrabarty 等人分析专业作家对LLM生成文本的编辑,创建1057段LAMP语料库,发现自动编辑可改善人机一致性2025TCTuhin Chakrabarty et al.Salesforce Research; Columbia University, Computer Science大语言模型(LLM)的人机协作AI 辅助创意写作CHI
具有内心想法的主动对话代理Liu等人提出主动对话代理的内心想法框架,为AI配备与显式沟通并行的隐秘思想流,经24名参与者实验验证,显著提升拟人化与智能表现。2025XLXingyu "Bruce" Liu et al.UCLA, HCI Research对话式聊天机器人会话代理的人格与拟人化大语言模型(LLM)的人机协作CHI
SonicVista:通过声化技术创建远程场景感知Gupta 等人开发 SonicVista 系统,通过声化技术将远程场景信息转换为声音,增强用户对远处环境的感知能力。2024CGChitralekha Gupta et al.环境感知与上下文计算UbiComp
超越聊天:利用大型语言模型实现可执行且可验证的文本编辑Laban 等人提出 InkSync 文本编辑界面,集成了可执行编辑建议及警告-验证-审计三级机制来减轻 LLM 事实错误风险,提升编辑准确性和效率。2024PLPhilippe Laban et al.大语言模型(LLM)的人机协作UIST
艺术还是人工制品?大型语言模型与创造力的虚假承诺Chakrabarty等人提出TTCW评估写作创造力,发现LLM生成故事得分仅为专业作者1/3至1/10,且LLM无法作为有效评估工具。2024TCTuhin Chakrabarty et al.Columbia University大语言模型(LLM)的人机协作AI 辅助创意写作CHI
设计和评估使用Discord问题突出新闻报道多样性的界面Laban 等人设计三种界面帮助新闻读者发现报道多样性,其中注释文章界面使问题回答完整度提升34%。2023PLPhilippe Laban et al.Salesforce Research虚假信息与事实核查用户研究方法(访谈、调查、观察)CHI
iSEA:NLP模型语义错误分析的交互式管道Yuan 等人提出 iSEA 交互式管道,自动发现NLP模型中高错误率的语义子群体,支持交互式错误验证与假设检验,辅助模型开发者理解和分析模型错误。2022JYJun Yuan et al.可解释人工智能(XAI)AI 辅助决策与自动化系统交互式数据可视化IUI