中文 / EN

最新发布

FlashAttention 拥有比 PyTorch 标准注意力快 2~4 倍的运行速度,所需内存还减少了 5~20 倍。

October 19, 2023  author: Vachel