机器学习公平性指标小结-FreeNAS中文网

admin 管理员组

文章数量: 887021

文章目录

前言
一、Unawareness
二、individual fairness
三、group fairness
- 1. disparate impact
- 2. predictive equality
- 3. equal opportunity
- 4. disparate mistreatment
- 5. Predictive parity
四、causal fairness
- 1. proxy discrimination
- 2. unresolved discrimination
- 3. conterfectual fairness
一些参考文献

前言

机器学习系统中，如果模型的表现或模型的预测结果与敏感属性(性别、肤色等)有统计上的关联，那么这个机器学习系统就可能是不公平的：(1) Timbru等人发现一些商业的性别分类API中，白人的准确率明显高于有色人种；(2) Propublica等发现USA的犯罪预测系统COMPAS存在歧视黑人的现象，黑人的FPR高于白人。

一、Unawareness

Unawareness也叫blindness，既然敏感属性和预测结果有关联，不把敏感属性作为分类器的输入，能获得一定程度的公平，这种公平建立在“看不见”的基础上。当敏感属性与预测结果统计独立时，满足disparate treatment：
P ( y ^ ∣ x ) = P ( y ^ ∣ x , z ) P(\hat{y}|x)=P(\hat{y}|x,z) P(y^∣x)=P(y^∣x,z)

二、individual fairness

Dwork除了做差分隐私外，还提出了individual fairness的定义，与差分隐私定义类似，“相似的人应该被分类器相似地对待”， d d d为距离度量：
P ( Y ^ = y ∣ X ) ≈ P ( Y ^ = y ∣ X ′ ) , i f d ( X , X ′ ) ≈ 0 P(\hat{Y}=y|X)\approx P(\hat{Y}=y|X^{\prime}), \; if \; d(X,X^{\prime}) \approx0 P(Y^=y∣X)≈P(Y^=y∣X′),ifd(X,X′)≈0
什么是相似，多相似才是相似，是后来的工作主要研究点。

三、group fairness

相比于individual fairness相似性的难以描述，group fairness比较直白。group fairness考虑的场景是，样本依照敏感属性 Z Z Z分组， Y ∈ { − 1 , 1 } , Z ∈ { − 1 , 1 } Y\in \{-1,1\},Z\in \{-1,1\} Y∈{−1,1},Z∈{−1,1}，预测结果 Y ^ = 1 \hat{Y}=1 Y^=1被认为是优势， Z = 1 Z=1 Z=1的组被认为是优势组别（容易被预测为 Y ^ = 1 \hat{Y}=1 Y^=1）， Z = − 1 Z=-1 Z=−1的组别被认为是劣势组别。

1. disparate impact

disparate impace(DI)是一个比值形式的定义，一般认为该值大于0.8，表示分类器是比较公平的。
D I = P ( Y ^ = 1 ∣ Z = − 1 ) P ( Y ^ = 1 ∣ Z = 1 ) ≥ 0.8 DI=\frac{P(\hat{Y}=1|Z=-1)}{P(\hat{Y}=1|Z=1)}\geq0.8 DI=P(Y^=1∣Z=1)P(Y^=1∣Z=−1)≥0.8
除此之外，也有工作将二者的差值定义为demographic parity，若较小，则分类器比较公平。这个指标的缺陷是，强制满足该指标，会让 Z = − 1 Z=-1 Z=−1的群体预测为 Y ^ = 1 \hat{Y}=1 Y^=1的概率大致相同，但是可能存在有的群体本身 P ( Y ^ = 1 ) P(\hat{Y}=1) P(Y^=1)非常低，满足该指标是对 Z = 1 Z=1 Z=1的群体的歧视。
D P = ∣ P ( Y ^ = 1 ∣ Z = − 1 ) − P ( Y ^ = 1 ∣ Z = 1 ) ∣ DP = |P(\hat{Y}=1|Z=-1) - P(\hat{Y}=1|Z=1)| DP=∣P(Y^=1∣Z=−1)−P(Y^=1∣Z=1)∣

2. predictive equality

如果分类器满足下式，则认为其满足predictive equality：
P ( Y ^ = 1 ∣ Y = − 1 , Z = − 1 ) = P ( Y ^ = 1 ∣ Y = − 1 , Z = 1 ) P(\hat{Y}=1|Y=-1, Z=-1) = P(\hat{Y}=1|Y = -1, Z=1) P(Y^=1∣Y=−1,Z=−1)=P(Y^=1∣Y=−1,Z=1)

3. equal opportunity

如果分类器满足下式，则认为其满足equal opportunity：
P ( Y ^ = 1 ∣ Y = 1 , Z = − 1 ) = P ( Y ^ = 1 ∣ Y = 1 , Z = 1 ) P(\hat{Y}=1|Y=1, Z=-1) = P(\hat{Y}=1|Y = 1, Z=1) P(Y^=1∣Y=1,Z=−1)=P(Y^=1∣Y=1,Z=1)
除此之外，也有工作将predictive equality和equal opportunity相交定义equalized odds，equalized odds越大，分类器越不公平：
E O D = ∑ y ∈ { − 1 , 1 } ∣ P ( Y ^ = 1 ∣ Y = y , Z = − 1 ) − P ( Y ^ = 1 ∣ Y = y , Z = 1 ) ∣ , EOD = \sum_{y \in\{-1,1\}}|P(\hat{Y}=1|Y=y, Z=-1) - P(\hat{Y}=1|Y = y, Z=1)|, EOD=y∈{−1,1}∑∣P(Y^=1∣Y=y,Z=−1)−P(Y^=1∣Y=y,Z=1)∣,

4. disparate mistreatment

侧重于不同群体上错误率相同，包括相同的FPR、FNR等：
o v e r a l l m i s c l a s s i f i c a t i o n r a t e ( O M R ) : overall \;misclassification \;rate(OMR): overallmisclassificationrate(OMR):
P ( Y ^ ≠ Y ∣ Z = − 1 ) = P ( Y ^ ≠ Y ∣ Z = 1 ) P(\hat{Y}\neq Y|Z=-1)=P(\hat{Y}\neq Y|Z=1) P(Y^=Y∣Z=−1)=P(Y^=Y∣Z=1)
f a l s e p o s i t i v e r a t e ( F P R ) : false\;positive \;rate(FPR): falsepositiverate(FPR):
P ( Y ^ ≠ Y ∣ Y = − 1 , Z = − 1 ) = P ( Y ^ ≠ Y ∣ Y = − 1 , Z = 1 ) P(\hat{Y}\neq Y|Y=-1,Z=-1)=P(\hat{Y}\neq Y|Y=-1,Z=1) P(Y^=Y∣Y=−1,Z=−1)=P(Y^=Y∣Y=−1,Z=1)
f a l s e n e g t i v e r a t e ( F N R ) : false\;negtive\;rate(FNR): falsenegtiverate(FNR):
P ( Y ^ ≠ Y ∣ Y = 1 , Z = − 1 ) = P ( Y ^ ≠ Y ∣ Y = 1 , Z = 1 ) P(\hat{Y}\neq Y|Y=1,Z=-1)=P(\hat{Y}\neq Y|Y=1,Z=1) P(Y^=Y∣Y=1,Z=−1)=P(Y^=Y∣Y=1,Z=1)
f a l s e o m i s s i o n r a t e ( F O R ) : false\;omission\;rate(FOR): falseomissionrate(FOR):
P ( Y ^ ≠ Y ∣ Y ^ = − 1 , Z = − 1 ) = P ( Y ^ ≠ Y ∣ Y ^ = − 1 , Z = 1 ) P(\hat{Y}\neq Y|\hat{Y}=-1,Z=-1)=P(\hat{Y}\neq Y|\hat{Y}=-1,Z=1) P(Y^=Y∣Y^=−1,Z=−1)=P(Y^=Y∣Y^=−1,Z=1)
f a l s e d i s c o v e r y r a t e ( F D R ) : false\;discovery\;rate(FDR): falsediscoveryrate(FDR):
P ( Y ^ ≠ Y ∣ Y ^ = 1 , Z = − 1 ) = P ( Y ^ ≠ Y ∣ Y ^ = 1 , Z = 1 ) P(\hat{Y}\neq Y|\hat{Y}=1,Z=-1)=P(\hat{Y}\neq Y|\hat{Y}=1,Z=1) P(Y^=Y∣Y^=1,Z=−1)=P(Y^=Y∣Y^=1,Z=1)

5. Predictive parity

不同组拥有相同的Positive Predictive Value（真阳率）：
P ( Y = 1 ∣ Y ^ = 1 , Z = − 1 ) = P ( Y = 1 ∣ Y ^ = 1 , Z = 1 ) P(Y=1|\hat{Y}=1,Z=-1)=P(Y=1|\hat{Y}=1,Z=1) P(Y=1∣Y^=1,Z=−1)=P(Y=1∣Y^=1,Z=1)

四、causal fairness

1. proxy discrimination

2. unresolved discrimination

3. conterfectual fairness

直接干预A的不足: 直接干预A，求取的是在A中的平均效应。如果群体中一半人被“正向”歧视，一半人被反向歧视，直接干预A不能发现这个问题
P ( Y ^ = 1 ∣ d o ( A = a ) ) = P ( Y ^ = 1 ∣ d o ( A = a ′ ) ) P(\hat{Y}=1|do(A=a))=P(\hat{Y}=1|do(A=a^{\prime})) P(Y^=1∣do(A=a))=P(Y^=1∣do(A=a′))
因而有人提出反事实公平性，反事实的直观表达是，在某件事情已经发生的情况下，假如当时XXX，这件事情还会是这个结果吗？例如下面的例子，来自《Causal Inference in Statistics：A Primer》，摘自知乎用户望止洋。先通过事实计算出模型的参数，接着强制干预，计算出反事实。

反事实公平性：
P ( Y ^ z = y ∣ X = x ) = P ( Y ^ z ′ = y ∣ X = x ) ∀ y , z , z ′ P(\hat{Y}_z=y|X=x)=P(\hat{Y}_{z^{\prime}}=y|X=x) \;\; \forall y,z,z^{\prime} P(Y^z=y∣X=x)=P(Y^z′=y∣X=x)∀y,z,z′
反事实公平性的直观上理解，比如同一个人，只改变一下性别，看看分类器的输出结果有没有改变很多，若改变了很多，则不满足反事实公平性

一些参考文献

[1] Fairness-Aware Machine Learning——An Extensive Overview, Jannik Dunkelau and Michael Leuschel
[2] Joon Sik Kim, Jiahao Chen, Ameet Talwalkar: FACT: A Diagnostic for Group Fairness Trade-offs. ICML 2020: 5264-5274
[3] Niki Kilbertus, Mateo Rojas-Carulla, Giambattista Parascandolo, Moritz Hardt, Dominik Janzing, Bernhard Schölkopf: Avoiding Discrimination through Causal Reasoning. NIPS 2017: 656-666

(未完待续&期待大佬们指出错误)

本文标签：公平性小结机器指标

版权声明：本文标题：机器学习公平性指标小结内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1725942689h896474.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

机器学习公平性指标小结

文章目录

前言

一、Unawareness

二、individual fairness

三、group fairness

1. disparate impact

2. predictive equality

3. equal opportunity

4. disparate mistreatment

5. Predictive parity

四、causal fairness

1. proxy discrimination

2. unresolved discrimination

3. conterfectual fairness

一些参考文献

更多相关文章

机器狗木马源文件!

人工智能编程机器学习入门

Java机器学习实战使用TensorFlow和Python进行数据分析

机器学习中的正则化是什么?

kubernetes 指标

群晖nas基础操作

FreeNAS-8.2.0升级

RTD1073芯片高清播放机强刷固件办法大全

虚拟机教程

监控配置方案

电商推荐系统论文：基于Spark机器学习的电商推荐系统的设计与实现，大数据电商推荐系统毕设论文，Spring MLlib电商推荐系统

积累小结-系统从win7升级win10后vss连接提示invalid handle错误解决办法

机器学习模型的衡量指标_在机器学习模型中衡量公平性

WIN7 特有的功能小结

Win7下用什么虚拟机软件好？看小结

SaltStack连接Linux&amp;Windows机器

【机器学习】《ChatGPT速通手册》笔记

3.机器学习—数据科学包3.2pandas基础

从机器学习谈起

机器学习该怎么入门？

发表评论

推荐文章

c盘local文件太大_为什么你的c盘空间越来越小？

NO.23

基于Zynq7000平台VxWorks6.9开发应用——SMP多核任务篇

Windows 10 使用 PowerShell 7 + Windows Terminal 及乱码、不显示 python环境问题

Xerox Phaser 3117激光打印机在windows 7 64bit版下安装驱动的问题

热门文章

Linux 的文件和目录结构

html5 手把手教你做游戏《熊和蘑菇》(三)

企业微信会话存档是怎么收费的？收费明细是怎样的？

Java 字符串 正则表达式

30个python常用代码大全

windows 系统密码破解工具（适合各种版本windows）

MikroTik(RouteOS)有线路由器快速设置教程

win7 做无盘服务器配置,两种方法轻松实现无盘安装Win7系统

Windows7 64 位系统安装Oracle VM VirtualBox 后没有UbuntuLinux 64-bit选项

笔记本电脑系统优选：专为各大品牌定制的装机版系统推荐

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

SaltStack连接Linux&Windows机器

Java 字符串正则表达式

（Windows系统）详细介绍Windows系统含有英文版