首页 > 其他分享> 文章详细

深度学习中的公平性

2021-04-02 18:05:45 阅读：298 来源： 互联网

标签：公平性偏差学习平等性深度属性 hat 度量

介绍

深度学习十分流行，在许多领域有着不错的表现。然而，深度学习算法中的公平性(fairness) 亦是重要的研究方向。这次，我们以Du的一篇文章为例，给大家介绍一下深度学习中的公平性。

Fairness in Deep Learning: A Computational Perspective

如何度量公平性？

这里介绍几种比较常见的度量指标：

人口学平等性 (Demographic Parity)
机会平等性 (Equality of Opportunity)
预测质量平等性 (Predictive Quality Parity)

人口学平等性

该度量指标能够保证算法的决策对于不同群体而言是相似的。比如：
p ( y ^ = 1 ∣ z = 0 ) p ( y ^ = 1 ∣ z = 1 ) ≥ τ \frac{p(\hat{y}=1|z=0)}{p(\hat{y}=1|z=1)}\geq \tau p(y^=1∣z=1)p(y^=1∣z=0)≥τ
其中 τ \tau τ 是一个给定的阈值，通常设置成0.8。 z z z 代表需要保护的属性，比如种族、性别等。

机会平等性

该度量指标考虑了不同群体当中，标签 y y y 的分布是有差异的。具体形式为：
p ( y ^ = 1 ∣ z = 0 , y = 1 ) − p ( y ^ = 1 ∣ z = 1 , y = 1 ) p(\hat{y}=1|z=0,y=1)-p(\hat{y}=1|z=1,y=1) p(y^=1∣z=0,y=1)−p(y^=1∣z=1,y=1)
以及
p ( y ^ = 1 ∣ z = 0 , y = 0 ) − p ( y ^ = 1 ∣ z = 1 , y = 0 ) p(\hat{y}=1|z=0,y=0)-p(\hat{y}=1|z=1,y=0) p(y^=1∣z=0,y=0)−p(y^=1∣z=1,y=0)
类似于真阳性 (true positive) 以及假阳性 (false positive) 的概念。

预测质量平等性

该度量指标主要是不同群体下的正确率或者精度。

与可解释性之间的联系

可解释性

如图所示，由于人类的造成的偏差，我们的数据集会产生偏差，在神经网络训练的时候，就会放大这个偏差。我们可以通过可解释性来发现数据中可能产生的偏差并且减轻这种偏差。

举个例子，比如贷款系统，如下图所示：

loan

我们可以通过可解释性，发现拒绝贷款的原因反映在输入的哪一些方面上，进而发现这种歧视。

更为细粒度地，我们可以通过神经元来进行解释，如下图所示：

global interpretation

通过神经元的激活状态，我们判断其预测的依据，比如低语义的眼球颜色，以及高语义的种族等。

对偏差进行检测和修复

bias detection

如上图所示，将女性医生和男性医生的照片输入网络，判别是否是医生，结果出现了明显的差异。我们通过构建不同的输入集合，可以发现一些决定性的因素，而这些因素，有可能反映了模型中的歧视。

我们可以参照对抗训练 (Adversarial Training) 的方式对模型中的偏差进行修复，比如：

mitigation

我们通过模型输出，构建一个输出对敏感属性的预测器，反向地回传梯度，使得我们没有办法通过模型输出去预测那些敏感的属性。

同时，我们可以直接在数据的源头上进行公平的标注，然后再在这些数据上进行训练。

fairness annotation

研究上的挑战

Benchmark Dataset

目前仍然是需要一个比较完备的数据集平台来评估不同的去偏差方法。

属性交集的公平性 (Intersectional Fairness)

比如一系列敏感属性的组合的公平性等，目前的工作仍然比较少

公平性和可用性的取舍

如何在保持高的可用性下，做到公平性，仍然是个开放性的问题。

公平性的形式化

比如公平度量指标的形式化，可能需要一些更加精细的指标来度量深度学习里面的偏差。

大规模训练下的公平性

现如今，训练数据的规模越来越大。如何在大规模的训练数据下，保证公平性或者检查出其中的偏差，也是一个开放性的问题。

标签：公平性,偏差,学习,平等性,深度,属性,hat,度量
来源： https://blog.csdn.net/qq_34206952/article/details/115405055

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

深度学习中的公平性

介绍

分类

如何度量公平性？

与可解释性之间的联系

对偏差进行检测和修复

相关数据集

研究上的挑战