An efficient quantized GEMV implementation for large language models inference with matrix core
Zhang, Yu ; Lu, Lu ; Zhao, Rong ; Guo, Yijie ; Yang, Zhanyu
- Link zu diesem Datensatz
- https://d-nb.info/1364542293
- Titel
- An efficient quantized GEMV implementation for large language models inference with matrix core
- Art des Inhalts
- Teil eines Werks
- Verfassangaben
- by Yu Zhang, Lu Lu, Rong Zhao, Yijie Guo, Zhanyu Yang
- Autor(en)
-
- Zhang, Yu
- Lu, Lu
- Zhao, Rong
- Guo, Yijie
- Yang, Zhanyu
- Organisation(en)
-
- SpringerLink (Online service)
- Zeitliche Einordnung
- Erscheinungsdatum: 2025
- Umfang/Format
- 1 Online-Ressource.
- DOI
- 10.1007/s11227-025-06993-6
- Online
- https://doi.org/10.1007/s11227-025-06993-6
- Sprache
- eng
- Schlagwörter
- Frühere/spätere Titel
-
- Enthalten in: The journal of supercomputing
- Enthalten in: The journal of supercomputing
- Enthalten in: The journal of supercomputing
- Stand
- 06.05.2025 03:07
- Im Katalog seit
- 07.03.2026