STORM: a Multipath QUIC Scheduler for Quick Streaming Media Transport under Unstable Mobile Networks (ATC 2025)

一句话总结:通过 signal-watermark 机制 + reliability-aware 调度,让 MPQUIC 在移动不稳定网络下尾包延迟降低 98.2%、流媒体帧率提升 1.95×。

问题

移动设备上 MPQUIC 用多条无线链路(WiFi、4G/5G)聚合带宽,但当某条路径信号变差时,端到端尾延迟反而比单路径更糟(实测车载场景 4.59s,单路径的 6.38×)。两个根因:1) 现有调度器只看 RTT/拥塞滑窗,对突发链路退化反应迟缓——「最后一公里」无线链路才是真正瓶颈,core network 不是;2) MPQUIC 同时承载可靠(关键帧)与不可靠(非关键帧)数据,但调度器不区分,重传可靠包阻塞不可靠包,再被排队的不可靠包反过来阻塞后续可靠包。

核心方法

两大组件 + 工作流:

  • Signal-Watermark Mechanism (SWM):与 WiFi/蜂窝模块 co-design,在 adapter layer 用 100ms 周期采集 RSRP/SINR/RSSI,通过加权几何平均 + 丢包趋势调制因子算出 quality index 。设三档 watermark(Good 0.45 / Warning 0.32 / Outage 0.21),低于 Warning 触发警告反馈调整流量比例,低于 Outage 触发 path 停用。Fast Suppression / Slow Recovery 防抖:跌落立即反馈,恢复需在 Good 之上稳定 =400ms。Watermark 自适应——根据后续实际 burst loss 微调阈值。
  • Reliability-Aware Scheduling (RAS):Dual-Q 架构。Reliable Queue (RQ) 把关键数据按 block 管理,每 block 独立 priority/deadline;Unreliable Queue (UQ) 把不可靠数据按 stream 管理,按 deadline 排序。可靠 block 跨双路径分配满足 ,其中 由 SWM 反馈降低问题路径的份额。基于带宽 gap + priority 计算 weight。不可靠 stream 只在快路径 block 完成、慢路径仍空闲的「time hole」中注入,避免和可靠流互堵。
  • Dynamic Multipath Management + 新增 PATH_ALERT 帧承载 SWM 反馈,path 被停用时对未确认数据做 deadline-aware 重注入。

基于 Alibaba XQUIC 实现,新增 1342 行 C 代码 + 102 行 Java 适配层(用 WifiManager/TelephonyManager),无需 root。深度细节回 atc2025-hu-liekun

关键结果

  • 不稳定网络下尾包延迟降低 98.2%
  • 流媒体帧率提升 1.95×(vs minRTT/DAMS)
  • 重传率平均降低 12.8%
  • 视频会议 1080p@30Mbps 下移动场景仍稳定
  • SWM 反馈延迟仅 ~1.14% 偏差(caputred vs actual)
  • RAS 平均处理时间 5.03ms(占总传输 7.4%),SWM 反馈 O(1),JNI 每秒额外 CPU 仅 780µs

相关