Awesome System Papers Wiki

标签: autoscaling

此标签下有5条笔记。

  • 2026年6月20日

    Aegaeon-SOSP25

    • multi-model-serving
    • gpu-pooling
    • serverless
    • llm-marketplace
    • autoscaling
  • 2026年6月20日

    BlitzScale-OSDI25

    • llm-serving
    • autoscaling
    • model-as-a-service
    • multicast
    • serverless
  • 2026年6月20日

    BreakingTheIce-MLSys26

    • vllm
    • cold-start
    • serverless
    • inference
    • profiling
    • autoscaling
  • 2026年6月20日

    DeepServe-ATC25

    • llm-serving
    • serverless
    • npu-cluster
    • pd-disaggregation
    • autoscaling
    • kv-cache
  • 2026年6月20日

    MorphServe-MLSys26

    • llm-serving
    • dynamic-quantization
    • kv-cache
    • autoscaling
    • slo

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Discord Community