Awesome System Papers Wiki

标签: transformer

此标签下有6条笔记。

  • 2026年6月20日

    Attention

    • transformer
    • deep-learning
    • llm
  • 2026年6月20日

    FlashAttention-2-ICLR24

    • attention
    • gpu-kernel
    • transformer
    • long-context
    • llm-training
  • 2026年6月20日

    FlashAttention-3-NeurIPS24

    • attention
    • gpu-kernel
    • hopper
    • fp8
    • transformer
  • 2026年6月20日

    FlashAttention-NeurIPS22

    • attention
    • gpu-kernel
    • io-aware
    • transformer
    • long-context
  • 2026年6月20日

    FlexPipe-ATC25

    • pipeline-parallelism
    • llm-training
    • variable-length
    • dynamic-reconfiguration
    • transformer
  • 2026年6月20日

    Transformer-NeurIPS17

    • foundation
    • attention
    • sequence-modeling
    • transformer
    • self-attention

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community