Running Consistent Applications Closer to Users with Radical for Lower Latency (SOSP 2025)

一句话总结：强一致应用靠近用户部署时，要么远程访问中心存储要么 geo-replicated 协调都慢；Radical 用静态分析提取 read/write set，单轮 LVI（Lock-Validate-WriteIntent）与 speculative execution 重叠，在五地域部署获 84–89% 理论边缘延迟收益且保证 Linearizability。

问题与动机

新 edge/datacenter 让应用可靠近用户，但 social/booking/forum 等 强一致 应用仍放中心：remote primary storage 每次访问都远；geo-replicated store（Spanner/DynamoDB global）受 PRAM 下界——read+write 延迟 ≥ 副本间最大距离。图 1 显示 geo-replication 对远端用户常不如中心化。

Radical 思路：storage 留 primary，edge 放 eventually consistent cache + speculative execution，并行发单轮 LVI 协调，成功则返回 speculative 结果，否则 fallback primary。

关键观察 / 隐含假设

观察 1：要重叠 speculative execution 与协调，不能边执行边 validate read——需 事先知道 read/write set。
- 依赖假设：handler 可静态分析为 serverless function；存储访问显式；read/write set 可精确提取。
- 可能失效场景：动态 SQL/反射/间接存储访问使分析不全，需 fallback primary。
观察 2：speculative write 不能等成功后再第二 RTT 写 storage；LVI 用 write lock + write intent + deterministic re-execution 在单请求内完成。
- 依赖假设：应用编译为 deterministic WebAssembly 子集；handler 确定性重放产生相同写。
- 可能失效场景：非确定性（时间、随机）破坏 re-execution；intent timer 误触发额外 primary 执行。
观察 3：只有 execution time 足够长（论文：≥20ms）才能 hide LVI RTT。
- 依赖假设：microservice handler 常达 tens of ms。
- 可能失效场景：极短 handler 无收益甚至更慢。

核心方法

Static analyzer：per serverless handler 提取 read/write set。
Speculative execution：对 edge cache 执行；并行 LVI 到 primary storage。
LVI protocol：acquire read/write locks；validate cache 版本；setup write intents；失败则 primary 重执行。
Deterministic Wasm：保证 intent 触发的 re-execution 一致。
Eventual cache at edge；linearizable 语义相对 primary。

设计取舍

Single primary storage vs geo-replication：降 storage 复杂度，edge 仍付一次 WAN RTT（与 speculation 重叠）。
Static analysis vs runtime tracking：零 runtime 开销，但 expressiveness 受限。
Deterministic Wasm vs native code：可验证一致性，限制语言特性。
Write intents + locks：避免双 RTT，但 failure 时可能短暂 locking——依赖 intent 超时恢复。

实验与结果

三 microservices（social/booking/forum）→ 15 serverless functions；五地域部署。
达可能边缘延迟改善的 84–89%（实际改善 28–35% 依应用）。
成本约 baseline 1.3×（edge cache）。
静态分析成功提取所有 handler read/write set（评估集）。

Critical Analysis

论证链条

「PRAM 下界不可消但可重叠」+「LVI 单 RTT」+「static RW set」在 15 个函数上闭合。到任意 Java Spring/ORM 应用的推广需重新验证分析覆盖率。

假设压力测试

20ms 阈值下短 handler 占主导则 Radical 无意义。
Edge cache stale + validator bug 可能违反 linearizability——依赖 protocol 正确性（论文有论证，非 machine-checked）。
1.3× 成本在轻流量 edge PoP 可能不经济。

实验可信度

真实 geo latency setting；三应用有代表性。
对比 centralized vs geo-replicated 动机图清晰；与最新 edge-DB 产品对比有限。
Wasm determinism 限制使 baseline 非「原样应用」。

系统性缺陷

论文未讨论 cache 失效风暴、primary 故障时 intent 行为。
Multi-tenant edge 节点 fair-share 未讨论。
静态分析维护成本随代码变更增长。

局限与 Future Work

局限：≥20ms handler；deterministic Wasm；静态 RW set；成本 1.3×。
Future work：partial dynamic tracking；弱化 determinism 需求；与 CRDT/transactional memory 比较。

Awesome System Papers Wiki

探索

Radical-SOSP25