Kein Cover

An efficient quantized GEMV implementation for large language models inference with matrix core

Zhang, Yu ; Lu, Lu ; Zhao, Rong ; Guo, Yijie ; Yang, Zhanyu

Titel
An efficient quantized GEMV implementation for large language models inference with matrix core
Art des Inhalts
Teil eines Werks
Verfassangaben
by Yu Zhang, Lu Lu, Rong Zhao, Yijie Guo, Zhanyu Yang
Autor(en)
  • Zhang, Yu
  • Lu, Lu
  • Zhao, Rong
  • Guo, Yijie
  • Yang, Zhanyu
Organisation(en)
  • SpringerLink (Online service)
Zeitliche Einordnung
Erscheinungsdatum: 2025
Umfang/Format
1 Online-Ressource.
DOI
10.1007/s11227-025-06993-6
Online
https://doi.org/10.1007/s11227-025-06993-6
Sprache
eng
Schlagwörter
Frühere/spätere Titel
  • Enthalten in: ˜Theœ journal of supercomputing
  • Enthalten in: ˜Theœ journal of supercomputing
  • Enthalten in: ˜Theœ journal of supercomputing
Stand
06.05.2025 03:07
Im Katalog seit
07.03.2026

Beschreibung vom Verlag

← Zurück zur Startseite