正在加载图片...
·580· 智能系统学报 第15卷 1.7基于组条件的校准度量 l.9事前公平(ex-ante fairness)及事后公平(ex- 在敏感值均衡中引入校准的概念,即如果 post fairness) p(Y=1P=p)=p,则输出事件概率?的预测因子 事前公平指一个算法A满足对于任意一对候 被称为经过良好校准。可以通过调节校准功能来 选人x和xn,其累积分布函数F(x)>F(x),则 确定公平性测量s2。 概率满足E[A(X)]≥E[A(Xxr小。 l.8反事实公平(counterfactual fairness) 事后公平指一个算法A满足对于任意一对候 由Kusner等提出,建立在给定结构方程模 选人xg和x,其累积分布函数F(x)>F(x),个 型(U,V,F)的基础上,其中U表示潜变量,V三 体只当xy也被选中时才被选中阿 SUX,F为一系列方程。如果预测值氵满足式 1.10综合分析比较 (1),则称为反事实公平: 许多不同公平性定义方法在本质上是相关 P(Ps;(U)=ylX=x.S=s)= 的。Friedler等w通过分析许多算法的公平性度 P(Ys(U)=ylX=x,S=s) (1) 量,度量了不同定义的相关性,发现不同的公平 该定义针对个体层面,如果在现实世界和反 性指标之间有着非常密切的相关性,分别在Ricci 事实世界中预测相同,那么对个人是公平的。 和Adut数据集上进行了实验,如图1所示。 ■1.0 1-accuracy TPR 0 Race-TPR TNR 0-accuracy 0 Race-TNR calibration+ BCR 0 accuracy -0.2 Ice-accuracy -0.4 e-calibration- CV -0.6 Dlbinary -0.8 Dlavgall (a)Ricci,Zafar (b)Adult,Feldman -1.0 图1不同公平性标准之间的关系 Fig.1 Examining the relationships between different measures of fairness 图1表示数据集和算法的相关性分析,展示 在某些情况下,期望在不同的公平性度 了不同的公平性度量如何相互关联。各种群体条 量之间进行权衡。Chouldechova!2s1和Klein- 件下的公平指标之间的关系非常密切。值得注意 berg等研究表明,假设不同人群比率不相 的是,对负结果的群条件校准测量(s-calibration) 等,则不可能同时实现校准和错误率平衡(组 与其他组条件测量相比,它与基准率测量的关系 间相同的假阳性率和相同的假阴性率)。Friedler 更为密切。 等通过一个实例检验了这种权衡。每种算 此外准确性指标与群体条件下的公平指标相 法的s-calibration与s-TPR之间存在明显的权 关性,表明公平性-准确性的权衡与基准率公平 衡,且不同的算法位于不同的权衡线上,如图2 度量更相关。 所示。 算法 0.16F Beldman-Decision Tre 0.14 Feldman-GaussianNB-Dlavgall 0.12 Feldman-GaussianNB-accuracy Feldman-LR Feldman-SVM 0.10 Feldman-SVM-Dlavgall Feldman-SVM-accuracy 0.08 GaussianNB Kamishima 0.06 Kamishima-Dlavgall Kamishima-accuracy 0.4 0.5 0.6 0.7 0.8 sex-TPR ZafarFairness 图2对于所有算法在Adult数据集中sex-calibration和sex-TPR指标之间的权衡 Fig.2 Trade-off between s-calibration and s-TPR for all algorithms on the Adult dataset1.7 基于组条件的校准度量 p(Y = 1|Yˆ = p) =p Yˆ 在敏感值均衡中引入校准的概念,即如果 ,则输出事件概率 的预测因子 被称为经过良好校准。可以通过调节校准功能来 确定公平性测量[25-26]。 1.8 反事实公平 (counterfactual fairness) Yˆ 由 Kusner 等 [15] 提出,建立在给定结构方程模 型 (U,V,F) 的基础上,其中 U 表示潜变量,V ≡ S∪X,F 为一系列方程。如果预测值 满足式 (1),则称为反事实公平: P(Yˆ S←s (U) = y|X = x,S = s) = P(Yˆ S←s ′ (U) = y|X = x,S = s) (1) 该定义针对个体层面,如果在现实世界和反 事实世界中预测相同,那么对个人是公平的。 1.9 事前公平 (ex-ante fairness) 及事后公平 (ex￾post fairness) xi ′ j ′ F ′ j ( xi ′ j ′ ) E [ A ( X, xi j) ]⩾ E[A ( X, xi ′ j ′ )] 事前公平指一个算法 A 满足对于任意一对候 选人 xij 和 ,其累积分布函数 Fj (xij) > ,则 概率满足 。 xi ′ j ′ F ′ j ( xi ′ j ′ ) xi ′ j ′ 事后公平指一个算法 A 满足对于任意一对候 选人 xij 和 ,其累积分布函数 Fj (xij) > ,个 体 只当 xij 也被选中时才被选中[27]。 1.10 综合分析比较 许多不同公平性定义方法在本质上是相关 的。Friedler 等 [14] 通过分析许多算法的公平性度 量,度量了不同定义的相关性,发现不同的公平 性指标之间有着非常密切的相关性,分别在 Ricci 和 Adult 数据集上进行了实验,如图 1 所示。 1-accuracy TPR Race-TPR TNR 0-accuracy Race-TNR calibration+ BCR accuracy Ice-accuracy e-calibration￾CV Dlbinary Dlavgall (a) Ricci, Zafar (b) Adult, Feldman 1.0 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1.0 图 1 不同公平性标准之间的关系 Fig. 1 Examining the relationships between different measures of fairness 图 1 表示数据集和算法的相关性分析,展示 了不同的公平性度量如何相互关联。各种群体条 件下的公平指标之间的关系非常密切。值得注意 的是,对负结果的群条件校准测量 (s-calibration) 与其他组条件测量相比,它与基准率测量的关系 更为密切。 此外准确性指标与群体条件下的公平指标相 关性,表明公平性−准确性的权衡与基准率公平 度量更相关。 在某些情况下,期望在不同的公平性度 量之间进行权衡。 Chouldechova[25] 和 Klein￾berg 等 [28] 研究表明,假设不同人群比率不相 等,则不可能同时实现校准和错误率平 衡 (组 间相同的假阳性率和相同的假阴性率)。Friedler 等 [14] 通过一个实例检验了这种权衡。每种算 法 的 s-calibration 与 s-TPR 之间存在明显的权 衡,且不同的算法位于不同的权衡线上,如图 2 所示。 sex-calibration 0.16 0.14 0.12 0.10 0.08 0.06 0.4 0.5 0.6 0.7 0.8 sex-TPR 算法 Calders DecisionTree Feldman-DecisionTree Feldman-GaussianNB Feldman-GaussianNB-Dlavgall Feldman-GaussianNB-accuracy Feldman-LR Feldman-SVM Feldman-SVM-Dlavgall Feldman-SVM-accuracy GaussianNB Kamishima Kamishima-Dlavgall Kamishima-accuracy LR SVM ZafarFairness 图 2 对于所有算法在 Adult 数据集中 sex-calibration 和 sex-TPR 指标之间的权衡 Fig. 2 Trade-off between s-calibration and s-TPR for all algorithms on the Adult dataset ·580· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有