1.7 基于组条件的校准度量 p(Y = 1|Yˆ = p) =p Yˆ

正在加载图片...

·580· 智能系统学报第15卷 1.7基于组条件的校准度量 l.9事前公平(ex-ante fairness)及事后公平(ex- 在敏感值均衡中引入校准的概念，即如果 post fairness) p(Y=1P=p)=p,则输出事件概率？的预测因子事前公平指一个算法A满足对于任意一对候被称为经过良好校准。可以通过调节校准功能来选人x和xn,其累积分布函数F(x)>F(x),则确定公平性测量s2。概率满足E[A(X)]≥E[A(Xxr小。 l.8反事实公平(counterfactual fairness) 事后公平指一个算法A满足对于任意一对候由Kusner等提出，建立在给定结构方程模选人xg和x,其累积分布函数F(x)>F(x),个型(U,V,F)的基础上，其中U表示潜变量，V三体只当xy也被选中时才被选中阿 SUX,F为一系列方程。如果预测值氵满足式 1.10综合分析比较 (1),则称为反事实公平：许多不同公平性定义方法在本质上是相关 P(Ps;(U)=ylX=x.S=s)= 的。Friedler等w通过分析许多算法的公平性度 P(Ys(U)=ylX=x,S=s) (1) 量，度量了不同定义的相关性，发现不同的公平该定义针对个体层面，如果在现实世界和反性指标之间有着非常密切的相关性，分别在Ricci 事实世界中预测相同，那么对个人是公平的。和Adut数据集上进行了实验，如图1所示。 ■1.0 1-accuracy TPR 0 Race-TPR TNR 0-accuracy 0 Race-TNR calibration+ BCR 0 accuracy -0.2 Ice-accuracy -0.4 e-calibration- CV -0.6 Dlbinary -0.8 Dlavgall (a)Ricci,Zafar (b)Adult,Feldman -1.0 图1不同公平性标准之间的关系 Fig.1 Examining the relationships between different measures of fairness 图1表示数据集和算法的相关性分析，展示在某些情况下，期望在不同的公平性度了不同的公平性度量如何相互关联。各种群体条量之间进行权衡。Chouldechova!2s1和Klein- 件下的公平指标之间的关系非常密切。值得注意 berg等研究表明，假设不同人群比率不相的是，对负结果的群条件校准测量(s-calibration) 等，则不可能同时实现校准和错误率平衡（组与其他组条件测量相比，它与基准率测量的关系间相同的假阳性率和相同的假阴性率)。Friedler 更为密切。等通过一个实例检验了这种权衡。每种算此外准确性指标与群体条件下的公平指标相法的s-calibration与s-TPR之间存在明显的权关性，表明公平性-准确性的权衡与基准率公平衡，且不同的算法位于不同的权衡线上，如图2 度量更相关。所示。算法 0.16F Beldman-Decision Tre 0.14 Feldman-GaussianNB-Dlavgall 0.12 Feldman-GaussianNB-accuracy Feldman-LR Feldman-SVM 0.10 Feldman-SVM-Dlavgall Feldman-SVM-accuracy 0.08 GaussianNB Kamishima 0.06 Kamishima-Dlavgall Kamishima-accuracy 0.4 0.5 0.6 0.7 0.8 sex-TPR ZafarFairness 图2对于所有算法在Adult数据集中sex-calibration和sex-TPR指标之间的权衡 Fig.2 Trade-off between s-calibration and s-TPR for all algorithms on the Adult dataset1.7 基于组条件的校准度量 p(Y = 1|Yˆ = p) =p Yˆ 在敏感值均衡中引入校准的概念，即如果，则输出事件概率的预测因子被称为经过良好校准。可以通过调节校准功能来确定公平性测量[25-26]。 1.8 反事实公平 (counterfactual fairness) Yˆ 由 Kusner 等 [15] 提出，建立在给定结构方程模型 (U,V,F) 的基础上，其中 U 表示潜变量，V ≡ S∪X，F 为一系列方程。如果预测值满足式 (1)，则称为反事实公平： P(Yˆ S←s (U) = y|X = x,S = s) = P(Yˆ S←s ′ (U) = y|X = x,S = s) (1) 该定义针对个体层面，如果在现实世界和反事实世界中预测相同，那么对个人是公平的。 1.9 事前公平 (ex-ante fairness) 及事后公平 (expost fairness) xi ′ j ′ F ′ j ( xi ′ j ′ ) E [ A ( X, xi j) ]⩾ E[A ( X, xi ′ j ′ )] 事前公平指一个算法 A 满足对于任意一对候选人 xij 和，其累积分布函数 Fj (xij) > ，则概率满足。 xi ′ j ′ F ′ j ( xi ′ j ′ ) xi ′ j ′ 事后公平指一个算法 A 满足对于任意一对候选人 xij 和，其累积分布函数 Fj (xij) > ，个体只当 xij 也被选中时才被选中[27]。 1.10 综合分析比较许多不同公平性定义方法在本质上是相关的。Friedler 等 [14] 通过分析许多算法的公平性度量，度量了不同定义的相关性，发现不同的公平性指标之间有着非常密切的相关性，分别在 Ricci 和 Adult 数据集上进行了实验，如图 1 所示。 1-accuracy TPR Race-TPR TNR 0-accuracy Race-TNR calibration+ BCR accuracy Ice-accuracy e-calibrationCV Dlbinary Dlavgall (a) Ricci, Zafar (b) Adult, Feldman 1.0 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1.0 图 1 不同公平性标准之间的关系 Fig. 1 Examining the relationships between different measures of fairness 图 1 表示数据集和算法的相关性分析，展示了不同的公平性度量如何相互关联。各种群体条件下的公平指标之间的关系非常密切。值得注意的是，对负结果的群条件校准测量 (s-calibration) 与其他组条件测量相比，它与基准率测量的关系更为密切。此外准确性指标与群体条件下的公平指标相关性，表明公平性−准确性的权衡与基准率公平度量更相关。在某些情况下，期望在不同的公平性度量之间进行权衡。 Chouldechova[25] 和 Kleinberg 等 [28] 研究表明，假设不同人群比率不相等，则不可能同时实现校准和错误率平衡 (组间相同的假阳性率和相同的假阴性率)。Friedler 等 [14] 通过一个实例检验了这种权衡。每种算法的 s-calibration 与 s-TPR 之间存在明显的权衡，且不同的算法位于不同的权衡线上，如图 2 所示。 sex-calibration 0.16 0.14 0.12 0.10 0.08 0.06 0.4 0.5 0.6 0.7 0.8 sex-TPR 算法 Calders DecisionTree Feldman-DecisionTree Feldman-GaussianNB Feldman-GaussianNB-Dlavgall Feldman-GaussianNB-accuracy Feldman-LR Feldman-SVM Feldman-SVM-Dlavgall Feldman-SVM-accuracy GaussianNB Kamishima Kamishima-Dlavgall Kamishima-accuracy LR SVM ZafarFairness 图 2 对于所有算法在 Adult 数据集中 sex-calibration 和 sex-TPR 指标之间的权衡 Fig. 2 Trade-off between s-calibration and s-TPR for all algorithms on the Adult dataset ·580· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：【人工智能】公平性机器学习研究综述