Patrick Judd | DeepAI

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Hao Wu
145 publications
Raquel Urtasun
135 publications
Mohammad Shoeybi
29 publications
Pradeep Dubey
18 publications
Alexander Heinecke
17 publications
Andreas Moshovos
16 publications
Milos Nikolic
14 publications
Naveen Mellempudi
9 publications
Mostafa Mahmoud
8 publications
Paulius Micikevicius
7 publications
Sayeh Sharify
7 publications

research

∙ 09/12/2022

FP8 Formats for Deep Learning

FP8 is a natural progression for accelerating deep learning training inf...

0 Paulius Micikevicius, et al. ∙

research

∙ 04/20/2020

Integer Quantization for Deep Learning Inference: Principles and Empirical Evaluation

Quantization techniques can reduce the size of Deep Neural Networks and ...

10 Hao Wu, et al. ∙

research

∙ 04/17/2018

DPRed: Making Typical Activation Values Matter In Deep Learning Computing

We show that selecting a fixed precision for all activations in Convolut...

0 Alberto Delmas, et al. ∙

research

∙ 03/09/2018

Bit-Tactical: Exploiting Ineffectual Computations in Convolutional Neural Networks: Which, Why, and How

We show that, during inference with Convolutional Neural Networks (CNNs)...

0 Alberto Delmas, et al. ∙

research

∙ 07/27/2017

Tartan: Accelerating Fully-Connected and Convolutional Layers in Deep Learning Networks by Exploiting Numerical Precision Variability

Tartan (TRT), a hardware accelerator for inference with Deep Neural Netw...

0 Alberto Delmas, et al. ∙

research

∙ 06/23/2017

Loom: Exploiting Weight and Activation Precisions to Accelerate Convolutional Neural Networks

Loom (LM), a hardware inference accelerator for Convolutional Neural Net...

0 Sayeh Sharify, et al. ∙

research

∙ 06/01/2017

Dynamic Stripes: Exploiting the Dynamic Precision Requirements of Activation Values in Neural Networks

Stripes is a Deep Neural Network (DNN) accelerator that uses bit-serial ...

0 Alberto Delmas, et al. ∙

research

∙ 11/17/2015

Reduced-Precision Strategies for Bounded Memory in Deep Neural Nets

This work investigates how using reduced precision data in Convolutional...

0 Patrick Judd, et al. ∙

Success!

An error occurred