AI Chat AI Image Generator AI Video Text to Speech

Is AmI (Attacks Meet Interpretability) Robust to Adversarial Examples?

02/06/2019

∙

by Nicholas Carlini, et al.

∙

No.

READ FULL TEXT

research

∙ 11/22/2017

MagNet and "Efficient Defenses Against Adversarial Attacks" are Not Robust to Adversarial Examples

MagNet and "Efficient Defenses..." were recently proposed as a defense t...

0 Nicholas Carlini, et al. ∙

research

∙ 06/26/2020

Proper Network Interpretability Helps Adversarial Robustness in Classification

Recent works have empirically shown that there exist adversarial example...

11 Akhilan Boopathy, et al. ∙

research

∙ 10/25/2018

Evading classifiers in discrete domains with provable optimality guarantees

Security-critical applications such as malware, fraud, or spam detection...

0 Bogdan Kulynych, et al. ∙

research

∙ 07/23/2020

Scalable Inference of Symbolic Adversarial Examples

We present a novel method for generating symbolic adversarial examples: ...

4 Dimitar I. Dimitrov, et al. ∙

research

∙ 04/03/2019

Interpreting Adversarial Examples by Activation Promotion and Suppression

It is widely known that convolutional neural networks (CNNs) are vulnera...

0 Kaidi Xu, et al. ∙

research

∙ 07/03/2023

Interpretability and Transparency-Driven Detection and Transformation of Textual Adversarial Examples (IT-DT)

Transformer-based text classifiers like BERT, Roberta, T5, and GPT-3 hav...

0 Bushra Sabir, et al. ∙

research

∙ 10/27/2018

Attacks Meet Interpretability: Attribute-steered Detection of Adversarial Samples

Adversarial sample attacks perturb benign inputs to induce DNN misbehavi...

0 Guanhong Tao, et al. ∙

Is AmI (Attacks Meet Interpretability) Robust to Adversarial Examples?

Related Research

MagNet and "Efficient Defenses Against Adversarial Attacks" are Not Robust to Adversarial Examples

Proper Network Interpretability Helps Adversarial Robustness in Classification

Evading classifiers in discrete domains with provable optimality guarantees

Scalable Inference of Symbolic Adversarial Examples

Interpreting Adversarial Examples by Activation Promotion and Suppression

Interpretability and Transparency-Driven Detection and Transformation of Textual Adversarial Examples (IT-DT)

Attacks Meet Interpretability: Attribute-steered Detection of Adversarial Samples