Causal Adversarial Perturbations for Individual Fairness and Robustness in Heterogeneous Data Spaces

Ahmad-Reza Ehyaei; Kiarash Mohammadi; Amir-Hossein Karimi; Samira Samadi; Golnoosh Farnadi

doi:10.1609/aaai.v38i10.29070

Authors

Ahmad-Reza Ehyaei Max Planck Institute for Intelligent Systems
Kiarash Mohammadi Université de Montréal, Montréal, Canada Mila - Québec AI Institute, Montréal, Canada
Amir-Hossein Karimi Max Planck Institute for Intelligent Systems Germany
Samira Samadi Max Planck Institute for Intelligent Systems
Golnoosh Farnadi Université de Montréal, Montréal, Canada Mila - Québec AI Institute, Montréal, Canada McGill University, Montréal, Canada

DOI:

https://doi.org/10.1609/aaai.v38i10.29070

Keywords:

ML: Ethics, Bias, and Fairness, ML: Adversarial Learning & Robustness

Abstract

As responsible AI gains importance in machine learning algorithms, properties like fairness, adversarial robustness, and causality have received considerable attention in recent years. However, despite their individual significance, there remains a critical gap in simultaneously exploring and integrating these properties. In this paper, we propose a novel approach that examines the relationship between individual fairness, adversarial robustness, and structural causal models (SCMs) in heterogeneous data spaces, particularly when dealing with discrete sensitive attributes. We use SCMs and sensitive attributes to create a fair metric and apply it to measure semantic similarity among individuals. By introducing a novel causal adversarial perturbation (CAP) and applying adversarial training, we create a new regularizer that combines individual fairness, causality, and robustness in the classifier. Our method is evaluated on both real-world and synthetic datasets, demonstrating its effectiveness in achieving an accurate classifier that simultaneously exhibits fairness, adversarial robustness, and causal awareness.

Causal Adversarial Perturbations for Individual Fairness and Robustness in Heterogeneous Data Spaces

Authors

DOI:

Keywords:

Abstract

Downloads

Published

How to Cite

Issue

Section

Information

Subscription