Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 24 von 1742

Details

Autor(en) / Beteiligte
Titel
OpenCNN: A Winograd Minimal Filtering Algorithm Implementation in CUDA
Ist Teil von
  • Mathematics (Basel), 2021-09, Vol.9 (17), p.2033
Ort / Verlag
Basel: MDPI AG
Erscheinungsjahr
2021
Link zum Volltext
Quelle
EZB Electronic Journals Library
Beschreibungen/Notizen
  • Improving the performance of the convolution operation has become a key target for High Performance Computing (HPC) developers due to its prevalence in deep learning applied mainly to video processing. The improvement is being pushed by algorithmic and implementation innovations. Algorithmically, the convolution can be solved as it is mathematically enunciated, but other methods allow to transform it into a Fast Fourier Transform (FFT) or a GEneral Matrix Multiplication (GEMM). In this latter group, the Winograd algorithm is a state-of-the-art variant that is specially suitable for smaller convolutions. In this paper, we present openCNN, an optimized CUDA C++ implementation of the Winograd convolution algorithm. Our approach achieves speedups of up to 1.76× on Turing RTX 2080Ti and up to 1.85× on Ampere RTX 3090 with respect to Winograd convolution in cuDNN 8.2.0. OpenCNN is released as open-source software.
Sprache
Englisch
Identifikatoren
ISSN: 2227-7390
eISSN: 2227-7390
DOI: 10.3390/math9172033
Titel-ID: cdi_doaj_primary_oai_doaj_org_article_94dfd902241449c5b05c51c05f97e4ed

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX