1 引言
隐私越来越多地出现在媒体和监管讨论的主题中。对隐私的关注度上升源于数据实用性的增加。数字化降低了数据收集、存储、传输和分析的成本(Goldfarb 和 Tucker (2019))。反过来,这导致了数字数据在决策中的广泛使用(Brynjolfsson 和 McElheran (2016))。对于消费者来说,数据能够以更低的成本提供个性化的服务和产品,从而显著提高消费者的福利。使用这些数据可以帮助公司提高利润,并可以帮助个人获得更符合他们需求的更高质量的产品和服务。然而,使用此类数据会产生一些负面后果。其中一些负面后果是直接的。个人对收集和使用有关他们的信息有一种内在的厌恶。公司面临着获取和保护消费者数据的直接成本。个人和公司也可能发现这些信息被用来对付他们。
其中一些负面后果来自外部性。关于一个人的信息可以提供有关另一个人的信息。例如,Erlich 等人(2018 年)表明,基因数据库只需覆盖 2% 的目标人群即可识别几乎所有人。这种负外部性类似于 Tucker 等人(2018 年)描述的数据溢出。当人们使用地理编码为他们的汽车拍照以记录他们的停车位时,他们可以记录其他人和汽车。此信息可能会以伤害未拍照的人的方式使用。这些负面的外部性引发了人们对数字隐私的许多担忧。
简而言之,隐私会影响经济结果。
隐私是一个很难定义的术语。在 19 世纪,隐私表示“独处的权利”,这被认为是人类存在的基础,也是人性中固有的(Warren 和 Brandeis (1890))。第二次世界大战后,技术发展引发了关于隐私和监控之间权衡的辩论。Westin (1967) 将隐私描述为对个人信息的保护及控制。Altman (1975) 指的是自我与他人之间、私人与共享或公共生活特征之间的界限。最近,Solove (2008) 强调隐私有许多不同的方面,包括信息收集、信息处理、信息传播和侵犯。相比之下,Nissenbaum (2009) 将隐私描述为“挪用个人信息流的权利”。信息流的适当性取决于与上下文相关的信息规范,它决定了信息在特定社会环境中应该如何流动(Bleier et al. (2020))。
从经济学的角度来看,数字隐私文献主要集中在限制信息流动的好处和成本上(参见 Acquisti 等人(2016 年),全面总结了与隐私相关的权衡的经济分析历史)。数据从根本上说是信息(Farboodi et al. (2019)),它是减少未知结果不确定性的工具。在以下部分中,我们将互换使用数据和信息,并使用术语“数字隐私”来表示对数字数据流的限制。因为数字信息可以以接近零的边际成本复制而不会降低质量,所以在没有努力排除的情况下它是非竞争性的(Goldfarb 和 Tucker (2019))。这种非竞争可以从数据流中产生正外部性和负外部性。我们以经济学为重点的数字隐私讨论将远离经典隐私文献中的“控制”、“自主”、“保密”和“独处权”等概念。相反,我们专注于消费者和企业的权衡,包括直接权衡和外部性权衡。
在下一节中,我们将讨论数据流向使用者的直接好处和成本。随后,我们将对公司进行类似的讨论。然后我们转向外部性,包括消极的和积极的。接下来,我们将注意力转向对当前隐私监管和工程方法的讨论,根据收益、成本和外部性讨论后果。最后,我们简要总结并讨论开放性问题。
2 消费者在隐私下的决策
2.1 隐私的好处
2.1.1 隐私评估
隐私偏好可分为两种类型。那些将隐私本身视为内在权利(Warren 和 Brandeis (1890)))的案件,以及那些将隐私作为保护代理人免于以可能影响其经济活动回报的方式透露其类型的工具(Stigler (1980);波斯纳 (1981))。2000 年代初开始出现的正式的隐私微观经济模型侧重于后一种类型,即消费者关心隐私以避免重复购买场景中的价格歧视(Taylor (2004);Acquisti 和 Varian (2005);Hann 等人 (2008) )。
具体来说,在线零售商拥有丰富的购买历史、地址和浏览历史数据。此信息可用于价格歧视。有大量的文献研究了如何利用消费者信息的提取和存储来设计个性化定价和有针对性的广告策略(Villas-Boas (1999, 2004);泰勒 (2004);Zhang 和 Krishnamurthi (2004))。例如,Taylor (2004) 为分析消费者隐私和客户信息市场提供了一个早期且有影响力的观点。他将客户信息的价值定义为公司识别个人以获得个性化价格的能力。这可能会伤害或使消费者受益,具体取决于公司是否具有市场力量。
隐私还与广告技术相互作用。消费者对隐私的偏好取决于该公司广告定位技术的复杂程度。Johnson (2013) 发现,如果没有任何内在的隐私偏好,消费者对增加目标的偏好并不是单调的。相反,消费者效用在定位准确性方面呈 U 形。这种形状突出了随着技术的进步,消费者对广告的态度发生了变化。当定位不准确时,定位准确性的逐步提高只会导致进一步的挫败感,并促使消费者屏蔽广告。当定向得到充分改善时,消费者可能会欢迎它。因此,定位技术的阶段极大地影响了消费者对隐私的态度和偏好。
在 Becker (1980) 的框架的基础上,Lin (2022) 对消费者隐私偏好的内在和工具性组成部分进行建模,并通过实验室实验对它们进行实证估计。“品味”的内在组成部分包括需要保密的消费者特征或行为。工具部分来自消费者预期的盈余或因向公司披露私人信息而造成的经济损失。在 Lin 的模型中,消费者 i 有一个个人变量 D\_\{i\}=\[d\_\{i 1\}, d\_\{i 2\}, \.\.\., d\_\{i k\}\] 的向量,其中包含 k 种数据类型,以及一个长度相等的共享决策 : 每个共享决策 ( \(s\_\{i 1\}, \.\.\., s\_\{i k\}\) ) 表示个人是否共享关联变量。决策 带来了内在隐私成本 C\_\{i\}=\[c\_\{1\}, c\_\{2\}, \.\.\., c\_\{k\}\] ,来自共享的类型诱导收益、基线补偿以及随机效用冲击 到消费者的效用规范:
F818532E-E693-41DE-B8A2-18DBAA519572
在上述实用程序规范中,每个本征隐私成本 可以扩展为observables X 在第 1 行。在第 2 行中, 是工具隐私问题的指示器,而 表示受工具激励影响的信息共享决策。虽然数据类型 k 可以包括许多类型,但 Lin 强调并衡量两种类型——收入和购买意愿。在类型诱导的收益中,消费者 i 有两种类型的信念——一阶信念和高阶信念。消费者的一阶信念是 – 他们对相邻的更高类型的百分比获胜概率的预期增加;而 AEE31EA9-31B3-4F08-888F-782CA181E4B3 是他们的高阶信念——消费者对公司对其类型的期望。此外,β 代表货币奖励的边际效用, 代表为数据提供的补偿。在第 3 行中,实用程序从基线补偿是 ,在 Lin 的规范中,它与共享变量 的数量成正比
该论文发现了消费者的异质性和右偏的内在偏好,共享人口统计资料的平均估值为 10 美元,97.5% 的分位数为 30 美元。消费者是否以及如何选择共享数据取决于他们偏好中两个主要组成部分的异质性和相关性。这个框架明确承认消费者隐私偏好的内在和工具性方面,是我们解释其他大部分文献的基础。
Tang (2019) 使用大规模现场实验估计了隐私对在线借款人的价值。她的结构模型通过将个人的披露、借款和还款决策联系起来,能够量化个人数据的货币价值。她表明个人重视隐私,并衡量隐私的内在部分:社交网络 ID 和雇主联系信息价值 32 美元,占放弃贷款价值的 8%。
2.1.2 数字隐私悖论
Lin (2022)、Tang (2019) 和其他人提供了消费者确实关心数字隐私的证据。然而,隐私偏好取决于上下文,并且随着时间的推移而变化。例如,Goldfarb 和 Tucker (2012b) 使用 2001 年至 2008 年有 300 万份回复的调查数据来记录老年消费者比年轻消费者更敏感,并且总体隐私问题随着时间的推移而上升。隐私敏感度是通过拒绝在调查中提供有关收入、年龄或邮政编码的个人信息来衡量的。随着时间的推移,隐私问题的变化似乎是由于消费者扩大了被视为隐私的数据类型。具体来说,与 Nissenbaum (2004) 的上下文完整性概念一致,随着跨上下文数据交换变得越来越普遍,非个人上下文(例如娱乐、消费包装商品)中的隐私问题增长得更快。Acquisti 等人(2015 年)还测量了Privacy 使用拒绝在调查中提供信息,同样表明随着时间的推移对隐私的日益关注。这两项研究都记录了随着消费者在使用数字产品和服务时沉浸在更复杂的数据共享实践中,隐私问题会加剧。
尽管隐私对个人有这些有衡量的好处,并且尽管有证据表明人们对隐私的担忧日益增加,但消费者仍在继续提供大量个人信息。消费者声明和透露的隐私偏好之间通常存在差距。这种现象被称为“隐私悖论”(Norberg et al. (2007))。个人对隐私的评价受环境和非规范因素的影响。Acquisti 等人(2013 年)在现场实验中确定了个人接受意愿 (WTA) 和支付意愿 (WTP) 之间的显着差距。他们表明,当个人考虑通过交易数据来赚钱时,现金换隐私的交易规模更大,而当人们为隐私付费时,现金换隐私的交易规模较小。Athey 等人(2017 年)通过三个主要的实证发现令人信服地建立了数字隐私悖论——即“小钱”、“小成本”和“闲聊”。“小额资金”认识到,当人们面临小额激励时,他们很容易愿意放弃私人数据,尽管他们声称他们关心隐私。在这项研究中,人们放弃了朋友的电子邮件地址,以换取一片披萨。“小成本”是指导航成本中的小摩擦可以有效地减少技术的采用,即使其后果是透明的。当隐私保护选项位于列表底部时,人们通常不会从四个列表中选择隐私保护选项。“闲聊”表明,在所研究的特定环境中,隐私的一个不相关的方面,即加密,可以提供一种保护的错觉,并减少增强隐私的行为。
隐私文献提出了几种解释来理解隐私悖论。Burtch et al. (2015) 强调消费者对如何使用数据的无知或缺乏关注,这表明延迟提交隐私政策会增加在线筹款环境中的收入。Adjerid 等人(2016 年)还发现,有关隐私政策的提醒往往会导致个人选择退出。他们指出,隐私提醒减少了健康信息交换的使用,除非与收养补贴相结合。
与消费者无知在解释隐私悖论中的作用相关的是赋予消费者控制权感的影响。Tucker (2014) 研究了用户对其个人数据的控制权感知与他们点击 Facebook 广告的可能性之间的关系。如图 1 所示,转载自 Tucker (2014),在引入增加消费者对个人数据流动的感知控制的政策之前,个性化广告相对无效。该政策出台后,个性化广告在吸引用户方面的效果几乎翻了一番,尽管这些控制措施与数据的使用方式没有直接关系。
Chen 等人(2021 年)强调从数据流中受益与保护隐私的愿望之间的相关偏好。支付宝平台是中国最大的在线支付和生活方式平台之一,截至 2022 年拥有超过 9 亿活跃用户,他们结合支付宝平台的调查和行为数据,发现调查中隐私问题较强的用户倾向于授权并更频繁、更广泛地使用应用程序服务。他们认为,这是由隐私的工具性价值驱动的。正是最活跃的用户对数字服务的大量使用产生了更强烈的隐私偏好。这种相关性是外生的,还是数字偏好会导致隐私问题增加,这是一个悬而未决的问题。
Solove (2021) 强调了一种方法论解释。观察到的行为是在非常具体的情况下衡量的,而自我报告的隐私问题往往来自一般调查。因此,后者可能与前者没有密切关联。
文献总体上表明了一个隐私悖论,从某种意义上说,个人声称非常关心他们的数据是如何被使用的,但似乎他们表现得好像并不关心。已经提出了许多与消费者无知、隐私与数据好处之间的相关偏好以及方法问题有关的解释。
2.2 数据流向消费者的好处
数字世界中的数据流直接为消费者带来可观的经济利益。消费者喜欢新的服务,例如搜索引擎和推荐系统、个性化广告和优惠以及有针对性的产品和服务。此外,定制的通信可以减少信息过载并帮助客户做出明智的决定(Ansari 和 Mela (2003))。当公司能够访问数据时,价格可能会下跌。例如,Kummer 和 Schulte (2019) 使用了来自 Google Play 商店中 300,000 个应用程序的数据,并记录了付费应用程序比免费应用程序需要更少的消费者数据。除了经济利益外,消费者还可能从共享数据中获得直接的心理利益。Tamir 和 Mitchell (2012) 发现,人类通过与他人分享信息进行自我披露活动,参与与奖励相关的神经和认知机制。
2.2.1 更好的服务和个性化
开放式数据流为公司提供更多信息,以便为个人客户定制其产品、服务和通信,我们称之为个性化。个性化可以减少信息过载,从而帮助消费者做出有效的决策。通过允许公司了解他们的偏好,消费者可以从降低的客户搜索成本中受益(Goldfarb 和 Tucker (2019)),从而可以在正确的时间将正确的产品和信息传递给正确的人。
为了了解个性化对消费者的价值,Sun et al. (2021) 在阿里巴巴电子商务平台上进行了一项大规模的实地实验,涉及 555,800 名客户的随机样本。通过禁止在主页推荐算法中使用个人数据,他们观察到客户参与度(点击率和产品浏览)和市场交易(销量和金额)急剧下降。具体来说,客户对推荐产品的点击率立即下降了 75%,客户在主页上的浏览行为随后下降了 33%。由于这两种综合影响,购买量下降了 81%。分析表明,个性化在电子商务中的价值对整个消费群体来说都很大。此外,它不成比例地使新客户受益,而购买力、女性和来自发展中地区的女性。
此外,Chan 等人(2022 年)显示了从数字验证数据中扩大信贷访问的巨大好处。他们记录了经过更好的验证数据,平均贷款发放率提高了 35.5%,而没有大幅提高这些贷款的利率。这种影响对深度次级和次级消费者尤其显着,贷款利率分别提高了 146% 和 44%。在贷方方面,他们还从扩大的信贷准入中获得了估计 19.6% 的利润增长。
在医疗保健领域也发现了类似的结果。当数据流更容易时,电子病历 (EMR) 的采用率会更高,患者也会受益。Miller 和 Tucker (2011) 表明,采用 EMR 带来的监测能力的提高可以降低新生儿死亡率。此外,Derksen 等人(2021 年)发现,在马拉维引入 EMR 系统来追踪 HIV 患者会立即增加积极接受护理的患者数量并降低患者死亡率。此系统的使用受隐私权限限制。因此,患者的隐私偏好会显着抑制 EMR 系统的有效性。从这个意义上说,数据流可以改善患者的健康状况。
2.2.2 价格歧视和数据流
价格歧视是消费者从隐私中获得的工具价值的核心。然而,在均衡状态下,在某些情况下,数据流可以增加消费者剩余。
Conitzer 等人(2012 年)认识到,数据流增加消费者剩余的一种方式与 Coase 猜想 (Coase (1972)) 有关。考虑一个垄断者,他们可以跟踪个人过去的购买模式以区分价格,而消费者反过来可以隐藏他们的个人数据,但需要付出代价。当保持匿名的成本很高时,卖家有更好的能力来识别老客户和进行价格歧视。知道这一点,消费者会犹豫是否进行初始购买。预料到这一点,卖方被迫提供较低的初始价格。这主导了未来价格歧视产生的利润增长。因此,卖家更愿意承诺无价格歧视案例。当保持匿名的成本较低时,比如消费者可以自由地匿名化自己,所有个体都会选择这样做,从而为公司带来最高的利润。因此,在这个“捉迷藏”游戏中,Conitzer 等人(2012 年)为辩论提供了一个独特的视角。当隐私对消费者来说代价高昂时,他们的生活可能会更好。因此,在保持匿名的成本较低时,提供隐私保护可以减少消费者剩余和社会剩余。
如果没有这些动态考虑,竞争可以通过个性化定价来防止价格歧视。虽然可以访问消费者数据的垄断公司可以通过提高匹配值和更激进的定价使消费者的处境变得更糟,但 Loertscher 和 Marx (2020) 表明,在这种情况下,如果价格受到监管,隐私的减少总是会因为匹配的改进而使消费者受益。在这种模式下,为了促进消费者剩余,维持竞争比保护隐私更重要。此外,Mikl’os-Thal 和 Tucker (2019) 证明,更好的消费者信息可以减少串通并促进市场竞争。随着需求预测的改善,串通企业面临更大的诱惑,偏离更低的价格。总体效应表明,从数据流中获得更好的预测会导致更低的价格和更高的消费者剩余。
数据流还可以以降低价格和最大化消费者剩余的方式激励亲社会行为。基于使用量的汽车保险 (UBI) 可以根据驾驶行为提供个性化的价格折扣。安全的司机自行选择加入 UBI 计划以支付较低的保费。该计划及其经济激励措施可以激励 UBI 参与者养成更好的驾驶习惯(Jin 和 Vasserman (2021))。从长远来看,UBI 对减少致命车祸(Reimers 和 Shiller (2019))和促进良好的驾驶习惯具有可衡量的效果。六个月后,UBI 客户的平均每日硬刹车频率下降了 21%。年轻司机和女性司机表现出更多的进步,并从该计划中受益更多(Soleymanian 等人(2019 年))。当消费者选择更安全驾驶以获得更低的价格时,他们也会增加总社会福利,在安全驾驶产生正外部性的程度上。
因此,虽然价格歧视会引起工具性的隐私问题,但在某些情况下,即使这些数据流动促进了价格歧视,开放的数据流也可能会增加消费者的剩余。归根结底,数据流对消费者剩余(在工具隐私意义上)的影响取决于特定环境。
3 公司
3.1 数据对公司的好处
来自消费者的数据流为公司创造了新的机会。公司可以设置个性化定价、发送有针对性的广告并改进客户关系管理。数据创造了新的市场,在某些情况下,还增加了市场力量。
3.1.1 个性化定价
消费者数据允许个性化。这表明可能存在一级价格歧视(Shapiro 和 Varian (1998);Smith et al. (2001))。围绕着提出数字价格歧视给公司带来的机会(以及消费者的福利损失)已经出现了广泛的理论文献(Acquisti 和 Varian (2005);Chen 和 Iyer (2002);泰勒 (2004);Hermalin 和 Katz (2006))。然而,正如 Goldfarb 和 Tucker (2019) 所指出的,关于使用数据实现数字价格歧视的理论文献似乎比实证研究和行业实践都更加成熟。有据可查的一级价格歧视的例子是有限的。
3.1.2 目标广告
数据流使有针对性的广告成为可能,这使公司受益,尤其是小公司(Goldfarb (2014))。与个性化定价不同,有大量证据表明公司使用数据流将在线广告定位到消费者。定向使公司能够内生地增加市场差异化并避免“浪费”的广告。换句话说,定向可以提高广告效果 (Iyer et al. (2005))。例如,Rafieian 和 Yoganarasimhan (2021) 探讨了移动应用内广告环境中的定向广告。据估计,他们提出的高效定位策略机器学习框架可将平均点击率提高 66.80%。
定向广告可以以牺牲公司利益为代价的方式影响市场力量,使广告商(也许还有消费者)受益。Athey 和 Gans (2010) 使用本地和一般媒体的模型来分析定位对广告供应和价格的影响。作者指出,通过定位实现信息分配的效率提高会导致需求增加。但是,如果广告空间或广告商容量不受限制,它可能会降低每个出版商的市场力量。Bergemann 和 Bonatti (2011) 对线上和线下媒体之间的竞争进行建模,其主要区别在于基于消费者数据的定位能力。更好的定位可以提高消费者与产品的匹配度,从而提高广告的社交价值。同时,更大的定位放大了公司在每个市场投放广告的集中度,最终导致广告市场由于广告商之间缺乏竞争而获得的广告价格降低。
3.1.3 客户关系管理
数据使公司能够了解客户需求。消费者的精细活动数据可以帮助公司实施主动的留存策略。例如,在订阅服务中,消费者数据可以揭示客户有停止订阅的风险。这些数据还可以揭示旨在留住客户的不同干预措施的边际影响(Ascarza (2018))。
3.1.4 新型企业
数字数据流促成了数据市场,其中一种新型公司,即数据中介,发挥着重要作用。除了来自消费者的直接数据流外,公司还受益于数据中介机构收集、汇总和组织的第三方数据。Bergemann 和 Bonatti (2019) 调查了越来越多的关于数据市场的文献,并强调了数据的作用出售用户信息的中介,从直接销售具有某些特征的消费者名单到通过赞助搜索和重新定位间接销售数据。越来越多的理论文献对这些数据中介及其与消费者和广告商互动的最佳机制进行建模(Bergemann 和 Bonatti (2015);Bergemann 等人(2018 年);杨 (2022))。
除了作为第三方数据经纪人之外,数据卖家还可以是一个双方都有广告商和消费者的平台。De Corniere 和 De Nijs (2016) 考虑了平台对披露或隐私做出决定的环境——即是否将从平台一侧收集的消费者信息出售给平台另一侧的广告商。该模型表明,信息披露改善了广告主和消费者之间的匹配度,但即使没有价格歧视,也会提高价格。在某些情况下,披露信息可能会增加平台和广告商的总利润,同时将信息租金留给中标者。结果与 Bergemann 和 Bonatti (2015) 一致,即数据中介向公司披露最好的消费者信息并不是最佳选择,因为信息租金已传递给公司。在某些情况下,中介以中等级别的隐私优化其利润。
3.2 隐私对公司的好处
如果消费者重视隐私并从具有强大隐私政策的公司购买产品,那么公司会直接从隐私中受益。此外,公司可以通过降低与数据相关的成本和市场力量而受益。
3.2.1 数据流的直接成本
收集和安全存储数据的成本很高。公司面临着具有挑战性的法律义务和合规性要求。它们需要昂贵的投资来保护存储的消费者数据免受第三方的恶意访问,例如网络攻击。数据保护以 API 更新、改进的防火墙和公司雇佣的黑客的漏洞检查的形式出现。相对于这一成本,数据的好处可能很小Shy 和 Stenbacka (2016)。例如,Chiou和 Tucker (2017) 调查了大量历史数据是否会影响后续搜索的准确性,从而影响公司保持市场份额的能力。历史数据的存储成本很高,并且会带来安全风险。他们没有发现任何实证证据表明缩短数据保留时间会损害搜索结果的准确性。同样,Yoganarasimhan (2020) 表明,搜索个性化的回报率随着用户历史数据的长度而凹陷增加。在一项实地研究中,Neumann 等人(2019 年)发现,由于定位解决方案的高额外成本和有限的准确性,第三方消费者分析在经济上往往没有吸引力。Bajari 等人(2019 年)为数据收益递减的抵消力量提供了理论指导和实证支持。
3.2.2 市场力量
尽管数据流有助于公司获得消费者,但过多的数据会降低公司的市场力量。因此,公司为消费者保持中等级别的隐私可能是有益的。Choe et al. (2018) 考虑了一个两期模型,其中两家公司通过在第一阶段购买时获取消费者信息并在第二阶段提供个性化定价来动态竞争。无论产品差异化是外生选择还是内生选择,与使用更简单的定价策略或致力于实质性产品差异化时相比,两家公司最终的处境都更糟。当客户信息仅用于定价时,由于信息收集第一阶段的竞争加剧,更多的客户信息通常对竞争公司不利。
启用数据的价格投放可能会加剧价格竞争,这可能会损害质量更高的竞争卖家。如果采用个性化定价,质量较高的公司可能会变得更糟(Choudhary 等人 (2005))。Casadesus-Masanell 和 Hervas-Drane (2015) 表明,数据市场的存在也会导致低质量公司将其竞争压力转化为消费者数据披露。当公司有两个收入来源时——来自产品的销售收入和来自交易消费者数据的披露收入,来自数据销售的额外收入流的存在会损害质量改进的激励措施。消费者数据削弱了当消费者是异质的时,竞争,公司专注于区分他们的隐私政策。
4 外部性
4.1 数据的负外部性
“数据是信息时代的污染问题,保护隐私是环境挑战。”–Schneier (2015)
数据的负面外部性为回答以下问题提供了见解:为什么消费者倾向于允许某些形式的数据收集,即使他们完全意识到数据可能会造成伤害?在什么情况下,公司会为客户和他们自己收集过多的个人数据?策略在监管数据流方面的作用是什么?
一个人的数据以三种可能的方式提供有关其他人的信息。第一个是直接的。一个人的联系人列表包括有关该人(他们的朋友是谁)的信息,但也包括有关其联系人的信息。同样,社交媒体源包含有关帐户所有者的帖子和点赞的信息,但也包含其联系人的帖子和点赞,有时还包含其联系人的联系人。因此,个人共享数据的决定可能会直接影响其他人。第二个和第三个是间接的。第二种方式是个人偏好和行为是相关的。因此,有关一个人的信息提供有关其他人的概率信息。第三种方式不在于数据本身,而在于数据生成过程。通过选择隐瞒信息,消费者可能会在市场活动中透露自己的类型一个人的数据以三种可能的方式提供有关其他人的信息。第一个是直接的。一个人的联系人列表包括有关该人(他们的朋友是谁)的信息,但也包括有关其联系人的信息。同样,社交媒体源包含有关帐户所有者的帖子和点赞的信息,但也包含其联系人的帖子和点赞,有时还包含其联系人的联系人。因此,个人共享数据的决定可能会直接影响其他人。第二个和第三个是间接的。第二种方式是个人偏好和行为是相关的。因此,有关一个人的信息提供有关其他人的概率信息。第三种方式不在于数据本身,而在于数据生成过程。通过选择隐瞒信息,消费者可能会在市场活动中透露自己的类型总体而言,关于强调相关行为和偏好的外部性的文献强调,相对于福利最大化基准,公司通常会收集太多数据。
选择不提供数据也有信息。例如,通过不提供数据,消费者可能会在广告响应和支付意愿方面揭示他们的类型(Bergemann 和 Bonatti (2015))。这种影响取决于由于数据的内在隐私价值而保留数据的消费者比例。如果有足够多的消费者具有隐私的内在价值,公司就无法根据保留个人数据的决定来推断个人数据的工具价值。
尽管进行了广泛的理论工作,但仍然缺乏关于数据外部性的实证证据来指导政策辩论。实证记录大量且不断增长的理论文献中强调的数据的负外部性是未来研究的一个有前途的领域。
4.2 数据的正外部性
数据也具有积极的外部性。这可以使消费者和企业受益,提高整体福利。例如,Google 搜索结果的好处来自所有用户搜索活动的数据流。同样,Spotify 上的推荐功能和零售网站上的 “经常一起购买 ”部分是由于其他用户的消费模式数据而可用的。
4.2.1 生产力与数据经济
越来越多的宏观经济文献强调数据经济(参见 Veldkamp 和 Chung (2019) 的调查)。Jones 和 Tonetti (2020) 研究了数据的产权如何决定其在经济中的使用。数据是高质量想法开发的输入,而数据的非竞争性质意味着数据的广泛使用会带来社会收益。如果公司拥有财产对数据的权利,那么数据可能会被囤积,社会收益将无法实现。相比之下,如果消费者控制财产权,数据可能会被更广泛地使用。虽然本文没有强调上面强调的对消费者的负外部性,一个关键的含义是消费者从隐私中获得的直接利益,以及公司从数据中获得的外部性,可以通过赋予消费者财产权来解决。
Farboodi和Veldkamp(2022)强调数据作为经济活动副产品对生产力和经济增长的作用。数据有助于改善预测,从而优化业务流程。在短期内,随着拥有许多客户的公司收集数据,从而提高生产率,数据可能会产生越来越多的回报。这使得公司能够吸引更多的客户。然而,从长期来看,数据经济不会产生持续增长。数据对改善预测的回报递减。关于数据的外部性,Farboodi和Veldkamp(2022)的核心收获是一对对立的力量——增加和减少数据回报——尽管不竞争,增加回报,并且数据的生产在短期内是经济活动的副产品,但数据生产在平衡中是有效的。由于预测错误的自然界限,数据在长期内的回报递减。因此,正外部性不会产生补贴数据的动机。正如预期的那样,负外部性会在均衡中产生过多的数据。
4.2.2 社会有益行为
信息(数据)披露并不总是对个人有害。在某些情况下,它可能会减少信息失真,激励亲社会行为,改善社会福利。与探索个人在追求亲社会活动中的激励机制的B’enabou和梯若尔(2006)相关,Daughty和Reinganum(2010)开发了一个隐私经济学模型,其中个人的行为产生外部性。在隐私制度下,代理人选择他们的全部信息最优行动;而在公开情况下,他们扭曲以增强他人对自己的看法。在信号预期的不利作用和对公共利益的增加贡献之间进行权衡。该模型考虑了三个主要因素:内在价值对于所有其他个人的总体活动所产生的活动、尊重(以及相反的社会反对)和公共产品消费。当扭曲的反效用相对于公共产品的边际效用较低时,宣传政策是最佳的。当然,使用数据来激励亲社会行为可能会产生负面后果,这一问题与梯若尔(2021)所称的“数字反乌托邦”有关。
5 含义
5.1 监管模式
隐私法规限制数据流。在这个过程中,它们可以保护消费者免受数据流的直接和间接伤害。它们还可以鼓励公司避免可能降低消费者隐私和安全的竞争压力。隐私法规还可能对市场结果产生负面影响,特别是在竞争、创新以及生产者和消费者剩余方面。
5.1.1 消费者行为因素
大多数当前的隐私保护法规都是本着消费者不确定且容易受到公司行为影响的精神设计的。大量的文献已经证实,信任可以减少隐私问题。Kummer和Schulte(2019)详细说明了消费者在应用程序安装过程中的隐私问题受到那些应用程序开发人员声誉的影响。同样,Chen等人(2021)通过一项实验表明,信任在人们在支付宝平台上的数据共享意图中起着重要作用。由于支付宝徽标移除,选择加入率下降,这并没有改变任何实际合同,而是信任的感知。由于消费者对控制的感知水平不同,法规的有效性也不同。Miller和Tucker(2018)
5.1.2 竞争与创新
隐私法规可能会提高市场集中度。Campbell et al. (2015) 从理论上研究了隐私保护与市场结构之间的关系。该模型的结果表明,与专业公司相比,常用的基于同意的方法可能使通才公司不成比例地受益。由于其交易成本的性质,隐私法规可能具有反竞争性。这种负面影响在价格灵活性不高的行业中最为严重,例如广告支持的互联网。
数据是创新的输入(Goldfarb 和 Tucker (2012a))。在在线广告、医疗保健和许多其他领域,数字数据可以产生更好的产品和服务以及更高效的生产。因此,对数据流的限制将对创新的速度和方向产生影响。例如,对患者的隐私保护可能会阻碍医疗保健 IT 的采用工作,从而导致更糟糕的健康结果(Adjerid 等人(2016 年);Derksen 等人(2021 年))。
5.1.3 缓解负外部性
如上所述,越来越多的文献研究了负外部性如何意味着即使是充分知情和理性的消费者向公司提供的数据也超过了福利最大化的金额((Bergemann 等人(2022 年);Acemoglu 等人(2019 年);Choi et al. (2019))。因此,仅仅赋予消费者对其数据的控制权是不够的,这是许多现有和拟议法规的精神,包括欧洲的《通用数据保护条例》(GDPR) 和《加州消费者隐私法案》(CCPA)。然而,完全禁止出售数据也将对消费者有害(Jones 和 Tonetti (2020))。文献提出了许多替代工具。Bergemann 等人(2022 年)直接谈到负外部性,呼吁消费者工会在与强大的数字平台讨价还价时,在细分市场层面而不是个人层面上将数据外部性内化。Fainmesser 等人(2022 年)倡导双管齐下的监管政策,将最低数据保护要求和与收集的数据成比例的税收相结合,以恢复最佳效率。Jones 和 Tonetti (2020) 强调了消费者财产权对数据的价值。Ali 等人(2022 年)强调授予消费者精细控制权,而不是像 GDPR 中的选择加入选项那样全有或全无的形式。消费者选择性地披露数据可能会扩大竞争或促使垄断者降低价格。Montes et al. (2019) 主张监管机构将重点放在信息如何交易(例如数据提供者和用户之间的数据合同)上,而不是直接促进消费者隐私。
5.2 监管的实证影响
存在许多隐私法规。这些法规的影响已经在各种背景下进行了研究。Goldfarb 和 Tucker (2011) 研究了 2004 年生效的早期数字隐私法规,即欧盟电子隐私指令。作者使用 300 万名随机接触过近 1 万次在线展示(横幅)广告活动的调查参与者的回复来探索隐私法规如何影响广告的有效性。他们记录了根据 ePrivacy 指令,横幅广告在改变治疗组和对照组在陈述购买意向方面的差异方面的有效性降低了 65% 以上。因此,隐私法规似乎奏效了。公司可能使用的数据较少,因此广告的效果会降低。然而,就广告支持软件是一个重要行业而言,相对于美国,该法规可能会降低该行业在欧洲的增长。许多论文都关注 GDPR 的影响。这项工作的实证挑战是 GDPR 旨在产生全球影响,因此没有直接的对照组。因此,这一流中最好的论文利用监管对不同类型公司和不同类型数据流的异质影响来构建令人信服的论点。表 1 提供了文献中各种论文的摘要。总体而言,这些论文的结论是,GDPR 导致网络访问量和收入立即减少(Goldberg 等人(2022 年);Aridor et al. (2022)) 和在线搜索效率的降低 (Zhao et al. (2021))。它似乎还降低了公司定位广告和跟踪消费者的能力(Godinho de Matos 和 Adjerid (2022);Peukert 等人(2022 年))。在线广告市场的竞争似乎有所减少(Johnson 等人(2022 年);Zhao et al. (2021)),新公司、风险投资和新应用程序有所下降(Jia et al. (2021);Janssen 等人(2022 年))。总之,GDPR 之后的早期证据表明它奏效了,从某种意义上说,公司在该法律通过后的一年里使用的数据更少。这在公司利润、消费者在线体验、创新和竞争方面都有成本。有一些暗示性的证据表明,这种影响随着时间的推移而下降,消费者保护较少,对浓度的影响也较小(Johnson 等人(2022 年))。
5.3 非监管隐私保护
公司有动力保护消费者隐私,即使没有监管。例如,Jullien 等人(2020 年)调查了通过向第三方收取用户信息费用来产生收入的网站的均衡隐私政策。因此,客户保留会激励网站注意其货币化工作或投入资源来筛选第三方。此外,公司的隐私保护选择可以作为一种缓解竞争的策略(Lee et al. (2011))。虽然实证工作仍处于起步阶段,但苹果和谷歌最近的变化可能会导致对隐私保护的坚定激励措施有更丰富的理解。具体来说,Apple 和 Google 已将来自其设备和操作系统的某些类型的数据流限制为第三派对 2.Apple 的 App Tracking Transparency (ATT) 功能要求用户允许被跟踪来自广告商在 iPhone 上下载的每个应用程序。同样,Google 推出了其隐私计划——针对 cookie 的隐私沙盒。这些限制可以保护他们的客户免受来自第三方的数据相关危害(无论是内在的还是工具性的),但可能对其他公司的数据驱动创新产生负面影响。衡量这些影响仍然是一个悬而未决的问题。
隐私技术解决方案可以补充监管流程。全有或全无形式的消费者控制——例如跟踪/不跟踪——需要更丰富、更复杂的技术才能使消费者受益(Ali 等人(2022 年))。为了实现数据驱动的创新,同时限制个人身份数据的流动,人们投入了大量的工程工作。其中一项发展是使用“差分隐私”,它保留了数据的匿名性,同时试图确保数据可用于统计分析(参见 Dwork 和 Roth (2014) 的综述,以及 Abowd 和 Schmutte (2019) 的经济学示例)。另一项发展包括通过分布式账本(Zyskind et al. (2015))或通过匿名交易(B ̈ohme et al. (2015))进行去中心化数据管理。隐私保护机器学习解决方案的创新正在增长,其中消费者的隐私得到保护,同时仍然可以提取一些有价值的信息以改进产品和服务(Sutanto 等人(2013 年);周 et al. (2020))。
6 总结
对隐私的日益关注与数字数据使用的增加直接相关。经济学中的数字隐私文献主要关注限制数据流的成本和收益。数据流非常有用。它们允许公司在消费者需要的时间为他们提供他们想要的产品和服务。数据流也会产生负面后果。许多消费者对隐私具有内在价值,因此本质上受到数据流的伤害。数据流也可能以伤害消费者的方式使用,因此隐私具有工具价值。
最近的理论文献强调了数据流的正外部性和负外部性。然而,到目前为止,实证文献主要集中在监管对消费者和企业的直接影响上。展望未来,一个关键的悬而未决的问题是在确定隐私法规的性质和后果以及在没有监管的情况下主动限制数据流对公司的战略利益时,数据外部性的各种理论。
理论和实证文献都暗示数字竞争是我们理解数字隐私的核心。早期的理论工作提供了乐观的理由,即增加的竞争可能会产生福利最大化的隐私水平。最近关于外部性的研究表明,竞争可能不足。关于 GDPR 后果的实证工作广泛表明竞争减少。然而,目前尚不清楚这在多大程度上是一种短期现象,还是由 GDPR 作为隐私法规的特殊方面驱动的。关于隐私监管将如何影响竞争以及竞争(和竞争政策)将如何影响消费者隐私,理论和实证工作仍然存在各种悬而未决的问题。
总而言之,经济学文献强调,数据流和隐私对消费者和公司都有好处。隐私不是免费的,但它很有价值。它影响经济结果。随着政府考虑新的隐私法规,随着公司制定隐私战略,我们希望经济学家的观点(强调成本、收益、外部性和竞争)将成为讨论的核心。