NBER:人们如何使用ChatGPT

到2025年7月,ChatGPT的用户超过7亿,占全球成年人口的约10%,每周处理180亿条消息。然而,尽管其普及速度惊人,对其使用方式和用户群体的实证数据却一直匮乏——直到最近。

NBER:人们如何使用ChatGPT

在人工智能迅猛发展的时代背景下,很少有创新能像ChatGPT那样迅速吸引全球关注。这款由OpenAI于2022年11月推出的基于大型语言模型(LLM)的聊天机器人,已彻底改变了人们与技术的互动方式,从简单的事实查询到复杂的创意任务,应有尽有。

到2025年7月,ChatGPT的用户超过7亿,占全球成年人口的约10%,每周处理180亿条消息。然而,尽管其普及速度惊人,对其使用方式和用户群体的实证数据却一直匮乏——直到最近。

NBER工作论文《人们如何使用ChatGPT》,由Aaron Chatterji、Thomas Cunningham、David J. Deming、Zoe Hitzig、Christopher Ong、Carl Yan Shan和Kevin Wadman合著,于2025年9月发布(NBER工作论文编号34255)。

这份研究首次对ChatGPT的消费者使用情况进行了全面分析,利用OpenAI消费者计划(免费、Plus和Pro)的海量去标识化消息数据集,时间跨度从产品发布至2025年中期。研究者采用自动化分类器对使用模式进行分类,同时严格遵守隐私协议,确保无人查看单个消息内容。

本文将深入探讨该研究的 方法论、关键发现及其更广泛的经济和社会含义,揭示ChatGPT如何重塑生产力、教育和日常生活。

1、ChatGPT的起源与机制

为了更好地理解研究的发现,首先需了解ChatGPT是什么及其运作原理。正如论文所述,ChatGPT是一个聊天机器人,由LLM驱动,这些模型是基于统计训练生成文本响应的,旨在最大化响应的“质量”,质量通过多种指标衡量。在典型交互中,用户提交纯文本提示,系统从底层LLM(如GPT-3.5、GPT-4或更先进的GPT-5)生成响应。

训练过程分为两个主要阶段:预训练阶段,模型在海量文本语料库上预测下一个词,以构建世界的潜在表示;后训练阶段,通过微调和强化学习优化模型,以产生高质量响应。同时融入安全约束,避免有害输出。随着时间推移,ChatGPT添加了网络搜索、图像生成和多模态功能,但文本交换仍是核心。

论文强调ChatGPT与传统搜索引擎的区别:它能生成定制化的长形式输出。这项多功能性支撑了其快速普及,超过了互联网或智能手机的先例(Bick et al., 2024)。通过分析实际使用数据,该研究超越了自我报告调查(可能存在偏差),揭示真实世界模式。

2、数据与隐私:创新方法

论文的一项创新在于其隐私保护方法论。研究者未访问原始消息,符合OpenAI隐私政策。分析基于三个数据集:(1) 从2022年11月至2025年9月的总日常消息量及基本自我报告人口统计信息;(2) 从2024年5月至2025年7月的约110万去标识化对话的分类消息;(3) 约13万用户的聚合就业和教育类别,通过安全数据洁净室(DCR)处理。

采样排除选择退出用户、未成年人、删除对话和禁用账户。消息经内部LLM工具去除个人标识信息(PII),然后通过提示输入模型如GPT-5-mini进行分类。分类包括工作/非工作、对话主题、用户意图(询问/执行/表达)和O*NET工作活动。与公开WildChat数据集的验证显示模型与人类标签高度一致,Cohen's κ在0.56至0.83之间。

就业数据来自公开来源,在DCR中聚合以防止用户级访问。查询需委员会批准,并强制最小组大小为100,确保匿名。该方法扩展了Handa et al. (2025)和Tomlinson et al. (2025)等先前的研究,但适用于ChatGPT更大的用户群。

3、爆炸性增长与使用模式转变

研究记录了ChatGPT的惊人增长。从发布到2025年7月,周活跃用户(WAU)从零飙升至超过7亿,日消息从微不足道增至2025年6月的26亿——一年内增长六倍。表1显示:非工作消息从2024年6月的2.38亿(53%)增长到2025年6月的19.11亿(73%),超过工作相关消息(2.13亿至7.16亿)。

这一转变主要源于每个用户群体的内部变化,而非新用户组成变化。早期采用者(2023年Q2前)最初专注于工作,但逐渐转向非工作活动,与后续群体类似。图4按注册群体分解消息量,显示所有群体持续增长。用户平均消息也上升,归因于模型改进和用户发现新应用(图5)。

非工作主导挑战了AI经济分析对职场生产力的关注。正如论文所述,家庭生产影响规模类似或更大,呼应Collis and Brynjolfsson (2025)对2024年美国生成AI消费者剩余至少970亿美元的估计。

4、主导对话主题与用户意图

约80%的对话落入三个主题:实用指导(29%)、寻求信息(24%)和写作(24%),根据OpenAI的产品分类器(图7)。

实用指导是最常见,包括辅导、各种如何建议和创意构想;寻求信息类似于网络搜索,涉及人物、事件、产品和食谱;写作包括自动化生成邮件、文档,以及用户文本的编辑、批评、总结和翻译。

工作相关消息中,写作最常见(2025年6月平均40%),突出生成AI相对于搜索引擎的输出生成优势(图8)。写作消息中约三分之二请求修改用户文本而非从零创建。约10%的消息为辅导或教学请求,表明教育是关键用例。

两项发现与其他工作相悖。首先,计算机编程相关消息份额较小:仅4.2%,而Handa et al. (2025)在Claude数据中为33%,可能由于用户差异。其次,伴侣或社会情感主题份额小:关系与个人反思占1.9%,游戏与角色扮演占0.4%,与Zao-Sanders (2025)的估计相反。

新型询问/执行/表达分类显示49%为询问(寻求建议)、40%为执行(任务执行)和11%为表达(无意图)。然而,2025年7月工作相关消息中执行占56%,其中近四分之三为写作任务(图11)。

写作频率突出两点:它是几乎所有白领工作的通用任务,良好写作技能是雇主需求的顶级“软”技能(National Association of Colleges and Employers, 2024);生成AI的独特之处在于产生长形式输出,如写作和代码。

O*NET映射显示工作相关消息81%与两个广义活动相关:1) 获取、记录和解释信息;2) 决策、建议、解决问题和创意思考(图14)。这些活动在不同职业中高度类似,例如获取信息和决策解决问题几乎在所有职业中排名前五,从管理到STEM到行政和销售(图15、表24)。这表明ChatGPT在大多数工作中主要用于信息寻求和决策支持。

5、人口统计变异:差距缩小与持久差异

早期采用者80%为男性姓名,但到2025年6月降至48%,略倾向女性姓名(图18)。女性偏好写作和实用指导;男性偏好技术帮助和多媒体(图19)。

年龄方面,成人消息中46%来自18-25岁用户,但工作使用随年龄增加(至66+岁),尽管整体下降(图20)。

全球而言,低/中收入国家(GDP/人1万-4万美元)采用增长最快,从0.1%到0.4%互联网用户(图21)。

受教育用户和高薪专业职业用户更可能用于工作(图22)。研究生用户工作相关消息48%,而低教育用户37%。专业职业如计算机为57%,非专业为40%(图23)。职业特定主题明显,如管理偏写作,计算机偏技术帮助。

6、经济价值:知识密集工作的决策支持

ChatGPT的价值在于决策支持,根据Ide and Talamas (2025),尤其在知识密集工作中提升生产力(Deming, 2021; Caplin et al., 2023)。这解释了询问在受教育专业用户中更常见,可能扩大不平等(Humlum and Vestergaard, 2025a,b)。

非工作剩余暗示更广福利收益,可能匹敌工作影响。未来研究可量化生产力提升或社会风险。

7、结束语:变革性技术的肖像

这份NBER论文照亮了ChatGPT的使用,揭示一个超越工作的指导和创建工具。其隐私导向方法为AI研究设标杆。随着三年内全球采用10%,ChatGPT预示AI的经济转变——民主化知识、提升决策、重塑人类-AI协作。


汇智网编辑整理,转载请标明出处