Emulating Space Computing Networks with Rhone (ATC 2025)
一句话总结:面向 SCN(Space Computing Network)的两阶段 emulator——离线建模 + 在线容器执行;单节点 700 卫星,power/computation 误差 <5%、温度误差 1.3–2.5°C。
问题
LEO 卫星正从单纯通信节点演化为 COTS 计算 + 星座组网(Starlink、Planet Dove 等),出现「Space Computing Network」新范式。但 SCN 应用难设计、难评估:真实卫星贵(小卫星发射 ~$150K);现有平台都欠 fidelity——物理 setup 不可扩、analytical simulator(Cote、StarPerf、Hypatia)缺真实软硬件栈、emulator(Celestial、StarryNet)不建模能耗/热/COTS 异构性。SCN 独特的两个特征——能耗+热约束、星座网络动态性——是评估应用的关键。
核心方法
两阶段架构:
- 离线建模:用 Tiansuan / BUPT-1 真卫星 telemetry(800K+ 时间戳条目)拟合 5 个模型。
- Power Model:harvest 端 ;consumer 端按 Markov-based(多功率档随机切换)和 function-based(X-band 链路 、计算 )两种 pattern。
- Thermal Model:Finite Element Analysis (FEA) 在 SolidWorks 解 ,用 implicit time discretization。
- Computation Model:hardware-in-the-loop chip mirroring——拆掉散热风扇的真 COTS 板(Raspberry Pi、Atlas 200 DK)跑应用,cyclic stress 收 satPerfTable(温度↔延迟),容器内重做收 emuPerfTable(资源↔延迟),Earth-based overheat 与 in-space 误差小。
- Orbit + Network Model:与 StarryNet 类似的 ISL/GSL 可见性 + 时延。
- 在线容器执行:每颗卫星 = 1 个 state manager + 多个容器(每容器代表一颗 COTS chip)。Satellite COTS Aligner (SCA) 查 satPerfTable 拿到目标延迟、再查 emuPerfTable 决定 cgroup CPU/GPU share;GPU 通过拦截 CUDA driver API 限速。Satellite Network Aligner (SNA) 在 StarryNet docker network 之上加节点粒度内部多 SoC、用 power/thermal model 决定 node failure(替代 StarryNet 的随机 failure)。
关键结果
- 单物理节点(双 Xeon E5-2670 v3、64GB RAM)支持 172/348/720 颗卫星,CPU/内存开销与 StarryNet 持平或更低(720 颗时 37.7% CPU、24.5% mem)。
- power 与 computation 模型误差 <5%,thermal 模型平均误差 1.3–2.5°C。
- 两个 case study:satellite network energy drain attack(malicious traffic 触发电池快速耗尽)、real-time Earth observation(直传 vs 压缩 vs onboard filter vs onboard inference 4 策略对比)。
- 4500 行 Python/C# 实现。
相关
- 相关概念:Satellite Constellation、LEO Network、COTS Hardware、Container Emulation、Finite Element Analysis
- 同类系统:StarryNet、Celestial、Hypatia、Cote、StarPerf
- 同会议:ATC-2025