Wiki Log

每条条目格式固定：## [YYYY-MM-DD] {Page or Action}，便于 grep "^## \[" wiki/log.md | head -20 解析。倒序排列，最新在上。

[2026-06-20] EventTensor duplicate cleanup

修正：EventTensor-MLSys26 source_pdf / source_md → canonical uid 07e1cd7dca89a1678042477183b7ac3f（md5(sourceid=119)，OpenReview camera-ready）
删除：orphan 07e1cd7dca891345f7ba84e9b0bc6f44 PDF + markdown（4 月 arXiv 预印本，不在官方 JSON）
更新：plans/wiki_rebuild_manifest.json（paper_count 443→442，去重复条目）

[2026-06-20] Wiki quality pass

修复：graph hygiene、正文 source 字段误链、并行概念别名、index scope
新建：LLM-Inference
验证：broken wikilink scan、frontmatter YAML parse、wiki-lint、git diff —check

[2026-06-20] Lint follow-up: 9 papers + 6 concepts

修复 Critical Analysis 结构：ADR-MLSys26、Behdin-SemanticJobSearch-MLSys26、FlashAgents-MLSys26、Flashlight-MLSys26、IntAttention-MLSys26、Meta-LLM-Deploy-MLSys26、PyLO-MLSys26、XPROF-MLSys26、fabric-lib-MLSys26
新建 concept：LLM、CXL、Data-Parallelism、NVMe、F2FS、eBPF
更新：index

[2026-06-20] DeepSpeed / Mooncake / TensorRT-LLM / Megatron entity pages

新建：DeepSpeed、Mooncake、TensorRT-LLM、Megatron
更新：index

[2026-06-20] Critical wiki full rebuild

重建：443 篇 paper wiki（442 唯一页 + EventTensor 重复 PDF 合并）、5 会议综述、4 topic 综述、4 entity、19 concept
目录块：ai-infra、atc-2025、autoresearch、fast-2026、finance、foundation、mlsys-2026、osdi-2025、sosp-2025
新格式：每篇 paper 含 关键观察 / 隐含假设 + Critical Analysis
更新：index

[2026-06-18] Prefix-Caching / RAG concept pages

新建：Prefix-Caching、RAG
更新：index

[2026-06-18] MLSys26 batch-h4 (13 stems, —force) wiki-update

生成（—force）：PyLO-MLSys26、fabric-lib-MLSys26、XPROF-MLSys26、Meta-LLM-Deploy-MLSys26、FlashInfer-Bench-MLSys26、AttributionSparseActivation-MLSys26、Charon-MLSys26、G-HEMP-MLSys26、FCP-MLSys26、MPG-MLSys26、PLayer-FL-MLSys26、db-SP-MLSys26、HIPPOCAMPUS-MLSys26
命名依据：PyLO / fabric-lib / XPROF / FlashInfer-Bench / Charon / G-HEMP / FCP / MPG / PLayer-FL / db-SP / HIPPOCAMPUS 为系统名；AttributionSparseActivation 为方法名；Meta-LLM-Deploy 为作者-主题 fallback
补 wikilink：Attention、Sparse-Attention、LoRA、MoE、TP、EP
更新：Disaggregation、MoE、vLLM、SGLang、KV-Cache、Sparse-Attention、Quantization、Continuous-Batching、Tensor-Parallelism、Expert-Parallelism、LoRA

[2026-06-18] MLSys26 batch-h3 (13 stems, —force) wiki-update

生成（—force）：EventTensor-MLSys26、ExecuTorch-MLSys26、Quirk-Sparing-MLSys26、Spira-MLSys26、BatchLLM-MLSys26、CORE-MLSys26、CATWILD-MLSys26、SakuraONE-MLSys26、Flashlight-MLSys26、FlashAgents-MLSys26、ADR-MLSys26、Behdin-SemanticJobSearch-MLSys26、IntAttention-MLSys26
新建：ExecuTorch / Quirk-Sparing / CORE / CATWILD / FlashAgents / ADR / Behdin-SemanticJobSearch；其余 6 页 —force 重写
命名依据：系统名；Quirk-Sparing、Behdin-SemanticJobSearch 为作者-主题 fallback
补 wikilink：Quantization（ExecuTorch）
更新：vLLM、SGLang、KV-Cache、RadixAttention、Continuous-Batching、Tensor-Parallelism、Quantization
说明：stem 07e1cd7dca89a1678042477183b7ac3f 更新 EventTensor 页 source 指向本 stem

[2026-06-18] MLSys26 batch-h2 (10 stems, —force) wiki-update

生成（—force）：Guard-MLSys26、RaidServe-MLSys26、SpecDecodeBench-MLSys26、SwiftGS-MLSys26、Matrix-MLSys26、DynaFlow-MLSys26、DAS-MLSys26、MoE-Serving-Tax-MLSys26、MorphServe-MLSys26、BOOST-MLSys26
新建：Guard / RaidServe / SwiftGS / DynaFlow / MoE-Serving-Tax；其余 5 页 —force 重写
命名依据：系统名 Guard/RaidServe/SwiftGS/Matrix/DynaFlow/DAS/MorphServe/BOOST；SpecDecodeBench、MoE-Serving-Tax 为方法/概念名
更新：vLLM、SGLang、MoE、Speculative-Decoding、KV-Cache、Tensor-Parallelism

[2026-06-18] MLSys26 batch-h (13 stems, —force) wiki-update

生成（—force）：CAGE-MLSys26、BLASST-MLSys26、BOUTE-MLSys26、DP-ZeRO-MLSys26、MTraining-MLSys26、TritorX-MLSys26、Kitty-MLSys26、TokenWeave-MLSys26、Catur-MLSys26、PipelinedSharding-MLSys26、LAPS-MLSys26、StreamDiffusionV2-MLSys26、FLoRIST-MLSys26
新建：TokenWeave-MLSys26、Catur-MLSys26、PipelinedSharding-MLSys26；其余 10 页 —force 重写
命名依据：CAGE / BLASST / BOUTE / DP-ZeRO / MTraining / TritorX / Kitty / TokenWeave / Catur / LAPS / StreamDiffusionV2 / FLoRIST 为系统名；PipelinedSharding 为方法名
补 wikilink：Quantization、Sparse-Attention
更新：vLLM、SGLang、KV-Cache、Tensor-Parallelism、Chunked-Prefill、Sparse-Attention、Flash-Attention、MoE、Disaggregation

[2026-06-18] MLSys26 batch-g (15 stems, —force) wiki-update

生成（—force）：ProfInfer-MLSys26、SparseSpec-MLSys26、Tag2Graph-MLSys26、FlashAttention-4-MLSys26、Hawkeye-MLSys26、ZK-APEX-MLSys26、SHIP-MLSys26、FlexiCache-MLSys26、CDLM-MLSys26、RLVR-LowData-MLSys26、HetRL-MLSys26、AIRS-MLSys26、GPU-CC-Security-MLSys26、OptiKit-MLSys26、ReSpec-MLSys26
命名依据：ProfInfer / SparseSpec / SHIP / FlexiCache / ZK-APEX / HetRL / AIRS / OptiKit / ReSpec 为系统名；FlashAttention-4 / CDLM / Tag2Graph 为方法名；RLVR-LowData / GPU-CC-Security 为作者-主题 fallback
补 wikilink：MoE、KV-Cache、SGLang、LoRA、vLLM
更新：vLLM、SGLang、KV-Cache、Speculative-Decoding、Sparse-Attention、MoE、PagedAttention、Pipeline-Parallelism、Chunked-Prefill、Continuous-Batching、Tensor-Parallelism、RDMA、Expert-Parallelism、Flash-Attention、Quantization、LoRA

[2026-06-18] MLSys26 batch-f (16 stems, —force) wiki-update

生成（—force）：SuperInfer-MLSys26、SkipKV-MLSys26、DistCA-MLSys26、RocketPPA-MLSys26、Shannonic-MLSys26、AgenticCache-MLSys26、HexiScale-MLSys26、QBL-MLSys26、EarthSight-MLSys26、DreamDDP-MLSys26、SONAR-MLSys26、DISAGG-MLSys26、TeleRAG-MLSys26、ProTrain-MLSys26、LLaMEA-KernelTuner-MLSys26、ApproxMLIR-MLSys26
命名依据：系统名 / 方法名 / 论文标题（QBL、SONAR、DISAGG、TeleRAG、ApproxMLIR、LLaMEA-KernelTuner）
补 wikilink：vLLM（SuperInfer）、Flash-Attention（DistCA）
更新：KV-Cache、PagedAttention、vLLM、SGLang、Quantization、Pipeline-Parallelism、Tensor-Parallelism、Continuous-Batching

[2026-06-18] MLSys26 batch-e (15 stems, —force) wiki-update

生成（—force）：SpanQueries-MLSys26、Chakra-MLSys26、VeriMoA-MLSys26、NEST-MLSys26、ContextPilot-MLSys26、ProToken-MLSys26、Acela-MLSys26、PARROT-MLSys26、ScaleSearch-MLSys26、Collective-NoC-MLSys26、BEAM-MLSys26、LocalityAwareBeamScheduling-MLSys26、Terminus-MLSys26、DriftBench-MLSys26、Privatar-MLSys26
命名依据：系统/方法名；LocalityAwareBeamScheduling 为方法名 fallback
补 wikilink：vLLM、SGLang（DriftBench、ScaleSearch）
更新：vLLM、SGLang、KV-Cache、Quantization、Flash-Attention、MoE、Continuous-Batching、Chunked-Prefill、Speculative-Decoding、Disaggregation
说明：stem 45c48cce…=Terminus，4c56ff4c…=DriftBench；43ec517d…=BEAM，44f683a8…=LocalityAwareBeamScheduling

[2026-06-18] MLSys26 batch-d (15 stems, —force) wiki-update

生成（—force）：PIKE-MLSys26、MAC-Attention-MLSys26、OutOfCoreUMAP-MLSys26、OpenHands-SDK-MLSys26、OSWorld-Human-MLSys26、veScale-FSDP-MLSys26、HyperTinyPW-MLSys26、Reparo-MLSys26、PRISM-MLSys26、BOA-MLSys26、TiDAR-MLSys26、WAVE-MLSys26、TriInfer-MLSys26、FarSkip-Collective-MLSys26、CSLE-MLSys26
命名依据：系统名 PIKE / Reparo / PRISM / BOA / TiDAR / WAVE / TriInfer / CSLE / OpenHands-SDK / veScale-FSDP / HyperTinyPW / FarSkip-Collective / MAC-Attention / OSWorld-Human；OutOfCoreUMAP 为方法-主题 fallback
补 wikilink：MoE、Quantization
更新：vLLM、SGLang、KV-Cache、Speculative-Decoding、MoE、Disaggregation、PagedAttention
TODO：考虑建 Mooncake 页（在 TriInfer-MLSys26 中被引用，但 wiki 暂无）

[2026-06-18] MLSys26 batch (6 stems) wiki-update

生成（—force）：AXLearn-MLSys26、HipKittens-MLSys26、MoEBlaze-MLSys26、ParallelKittens-MLSys26、BreakingTheIce-MLSys26、DataflowIsAllYouNeed-MLSys26
命名依据：系统名 AXLearn / HipKittens / MoEBlaze / ParallelKittens；BreakingTheIce（论文标题）、DataflowIsAllYouNeed（论文标题）
补 wikilink：Pipeline-Parallelism、Flash-Attention、Expert-Parallelism、Disaggregation、Tensor-Parallelism
更新：vLLM、KV-Cache、Speculative-Decoding、MoE

[2026-06-18] MLSys26 batch-c (7 stems, —force)

生成：LEANN-MLSys26、SpecDiff-2-MLSys26、GriNNder-MLSys26、CRAFT-MLSys26、Gohil-UncertaintyAware-MLSys26、AccelOpt-MLSys26、OPKV-MLSys26
命名依据：LEANN / SpecDiff-2 / GriNNder / CRAFT / AccelOpt / OPKV 为系统名；Gohil-UncertaintyAware 为作者-主题 fallback
更新：Speculative-Decoding、MoE、KV-Cache、PagedAttention、vLLM、SGLang、Continuous-Batching、Sparse-Attention

[2026-06-18] MLSys26 batch-b (7 stems) wiki-update

生成（—force）：Stream2LLM-MLSys26、LayeredPrefill-MLSys26、PROMPTS-MLSys26、FlexTrain-MLSys26、FP8FlowMoE-MLSys26、EventTensor-MLSys26
说明：stem 07e1cd7dca89a1678042477183b7ac3f 与 07e1cd7dca891345f7ba84e9b0bc6f44 为同一 Event Tensor 论文，共用 EventTensor-MLSys26
更新：vLLM、SGLang、MoE、Pipeline-Parallelism、Disaggregation、KV-Cache、Tensor-Parallelism

[2026-06-18] MLSys26 batch (7 stems) wiki-update

生成（—force）：GhostServe-MLSys26、FaaScale-MLSys26、Zorse-MLSys26、FreeScale-MLSys26、HELIOS-MLSys26、NVIDIA-Disagg-Study-MLSys26、MixLLM-MLSys26
补 wikilink：PagedAttention（GhostServe）、Pipeline-Parallelism（FaaScale）
更新：SGLang、vLLM、KV-Cache、Disaggregation、Chunked-Prefill、Pipeline-Parallelism、RDMA、Tensor-Parallelism
TODO：考虑建 Mooncake 页（在 FaaScale / NVIDIA-Disagg-Study 中被引用，但 wiki 暂无）

[2026-06-17] MLSys-2026 综述生成

生成：MLSys-2026
聚合 135 篇 paper wiki 页（136 PDF 含 1 份 EventTensor 重复稿，—skip-papers）
分类 15 个

[2026-06-17] LayeredPrefill-MLSys26 wiki-update (batch aa)

生成（—force）：LayeredPrefill-MLSys26 — 命名依据：方法名 Layered Prefill
补 wikilink：Continuous-Batching（正文首次出现）
更新：MoE、vLLM
跳过：batch aa 其余 33 个 stem 尚无 markdown

[2026-06-09] KTransformers entity + link update

新建 entity：KTransformers（kvcache-ai CPU/GPU heterogeneous MoE inference engine）
链接论文页：KTransformers-SOSP25
更新：index、FluxMoE-arXiv26、moe-kv-cache-offload、ElasticMoEP2P

[2026-06-09] DwarfStar entity + probe link update

新建 entity：DwarfStar（antirez/ds4，本地 DeepSeek V4 Flash / PRO inference engine）
更新 probe：moe-kv-cache-offload 中 MOE-INFINITY-arXiv24 / CoX-MoE-DAC26 / MoE-nD-arXiv26 / IceCache-arXiv26 / ContextAwareMoE-CXLNDP-arXiv25 / OD-MoE-arXiv25 改为内部 wiki link；本地 ds4 引用改为 DwarfStar
更新：index

[2026-06-09] AI-Infra MoE/KV offload 新论文入库

mineru：解析 6 篇新 PDF，0 失败；Markdown 放入 markdowns/ai-infra/
生成 wiki paper：MOE-INFINITY-arXiv24、ContextAwareMoE-CXLNDP-arXiv25、OD-MoE-arXiv25、CoX-MoE-DAC26、IceCache-arXiv26、MoE-nD-arXiv26
更新：MoE、KV-Cache、AI-Infra、index
论文主线：personal-machine expert cache、CXL-NDP context-aware placement、cacheless edge MoE、AMX CPU-GPU co-execution、semantic KV page selection、per-layer multi-axis KV compression

[2026-06-03] AlphaProofNexus-arXiv26 入库

下载 arXiv PDF + mineru + wiki paper：AlphaProofNexus-arXiv26
更新：Auto-Research、index
论文：DeepMind 的 LLM + Lean 形式化证明搜索框架 AlphaProof Nexus，Gemini 3.1 Pro 驱动 Ralph loop + 进化算法 + AlphaProof 工具调用；自主解决 9/353 个开放 Erdős 问题（含 2 个 56 年悬案，每个几百美元），44/492 OEIS 猜想
归档：PDF 放入 papers/autoresearch/arxiv26-tsoukalas-lean-formal-proof.pdf，Markdown 放入 markdowns/autoresearch/arxiv26-tsoukalas-lean-formal-proof/
TODO: 考虑建 Lean 实体页（在 AlphaProofNexus-arXiv26 中多次作为核心工具出现，但 wiki 暂无）

[2026-06-01] BES-arXiv26 入库

下载 arXiv PDF + mineru + wiki paper：BES-arXiv26
更新：Auto-Research、index
论文：Bidirectional Evolutionary Search 将 self-improving LLM/agent 的采样问题拆成 forward evolutionary search + backward goal decomposition；MuSiQue post-training 让 Llama-3.2-3B 从 4.0% 到 7.0%、Llama-3.1-8B 从 6.6% 到 10.4%，open problem solving 三个 benchmark 均超过 OpenEvolve / GEPA / ShinkaEvolve
归档：PDF 放入 papers/autoresearch/arxiv26-xu-bes.pdf，Markdown 放入 markdowns/autoresearch/arxiv26-xu-bes/

[2026-06-01] AutoScientists-arXiv26 入库

下载 arXiv PDF + mineru + wiki paper：AutoScientists-arXiv26
更新：Auto-Research、index
论文：无中心 coordinator 的自组织 agent team，用 shared state / forum / dead-end registry / noise-aware champion validation 支撑 long-running scientific experimentation；BioML-Bench 平均 percentile 74.40%（比 Autoresearch +8.33），GPT nanochat 达到同一 val_bpb 只需 34 vs 65 次实验，ProteinGym 217 assays 平均 Spearman ρ 从 0.657 提到 0.700
补充开源实现解读：澄清 BioML-Bench 上的 “Autoresearch” 是 Autoresearch-style single-agent coding loop baseline，不是 Karpathy 原版 nanoGPT repo 直接迁移；记录 hook-based runbook / task-profile / heartbeat 实现和公平性 caveat
补充 ClawInstitute 与单个 GPU agent 生命周期：ClawInstitute 是本地 Express/PGlite 协作后端；GPU agent 是 orchestrator 周期性启动的一次性 Claude Code subagent invocation，heartbeat 是每次启动执行的状态机，恢复依赖 result_latest.json、gpu_claim、workspace 文件版本和 stale-claim sweep

[2026-05-26] FlashAttention-3-NeurIPS24 入库

下载 NeurIPS 官方 PDF + mineru + wiki paper：FlashAttention-3-NeurIPS24
更新：Flash-Attention、Attention、Continuous-Batching、Foundation、index
论文：面向 Hopper H100 重写 FA kernel，利用 TMA/WGMMA warp specialization、GEMM-softmax overlap、FP8 block quantization + incoherent processing；BF16 forward 最高 840 TFLOPs/s，FP8 forward 1.3 PFLOPs/s

[2026-05-25] FlashAttention-2-ICLR24 入库

下载 arXiv PDF + mineru + wiki paper：FlashAttention-2-ICLR24
修复本地 MinerU：安装 socksio，脚本默认清理代理变量；Mac 上默认 MINERU_DEVICE_MODE=cpu 且关闭 formula/table 重模型，避免 MPS / formula / table 初始化卡住
更新：Flash-Attention、Attention、Continuous-Batching、Foundation、index
论文：在 FA1 exact attention 语义上优化 work partitioning，减少非 matmul FLOPs、沿 sequence length 并行、warp 内 split-Q；A100 attention forward 最高 230 TFLOPs/s，GPT-style 训练最高 225 TFLOPs/s/GPU

[2026-05-24] FlashAttention-NeurIPS22 入库

下载 NeurIPS 官方 PDF + mineru + wiki paper：FlashAttention-NeurIPS22
更新：Flash-Attention、Attention、Sparse-Attention、Foundation、index
论文：IO-aware exact attention kernel，用 tiling + online softmax + backward recomputation 避免物化 N x N attention matrix，A100 上 attention 最高 7.6x 加速，显存线性随序列长度增长

[2026-05-06] Finance 综述更新

更新：Finance 从 4 篇扩到 5 篇，新增 News Shock 分类 + 综述段落 + 方向 #5（News Shock 接入自动化 quant pipeline）
index.md 已更新

[2026-05-06] NewsShock-NBER26 入库

下载 PDF + mineru + wiki paper：NewsShock-NBER26
论文：将新闻 LLM embedding 正交分解为可预测部分与 news shock，后者构建的多空组合 Sharpe 3.1，为已知最大资产定价异常
未匹配到现有 entity/concept（金融 NLP 论文，与 AI 系统概念无交集）

[2026-04-30] vLLM + SGLang 论文入库 + Foundation 综述更新

下载 PDF + mineru + wiki paper：vLLM-SOSP23、SGLang-NeurIPS24
新增 concept 页：RadixAttention
更新 entity 页：vLLM、SGLang 链接到 paper wiki
更新综述：Foundation 从 2 篇扩到 3 篇，新增 vLLM/SOSP 2023 作为「LLM Serving 基础设施」milestone

[2026-04-30] AI-Infra 综述更新 + 6 篇新 paper wiki 页

新增 paper wiki：CacheGen-SIGCOMM24、CacheBlend-EuroSys25、LMCache-arXiv25、PASTA-ICLR24、LLMSteer-NeurIPSW24、Cartridges-ICLR26
更新综述：AI-Infra 从 5 篇扩到 12 篇，新增两条主线：KV Cache 跨请求复用与传输（CacheGen→CacheBlend→LMCache 三部曲）+ KV Cache 后处理与可编辑性（PASTA→LLMSteer→Cartridges 演化轨迹）
六篇均下载 PDF 到 papers/ai-infra/、mineru 解析到 markdowns/ai-infra/

[2026-04-30] fabric-lib-MLSys26 arXiv v1→v2 更新

arXiv 2510.27656 v2 (2026-04-13) 替换 v1
项目更名为 fabric-lib（TransferEngine 为其核心引擎），开源在 https://github.com/perplexityai/pplx-garden
新增：KvCache TTFT 端到端数据（Qwen3-235B A100）、RL 权重传输 latency breakdown、端到端 MoE decode speed 表、dual-batch overlap 分析、host-proxy CPU overhead 分解
新增：IMMCOUNTER PCIe ordering 正确性论证、Section 8 Discussion（GPU-initiated RDMA + 新 NIC 支持）、附录 A/B 伪代码
重跑 mineru + wiki-paper 覆盖

[2026-04-25] ATC-2025 综述生成

生成：ATC-2025
聚合 100 篇 paper wiki 页
分类 11 个：LLM 推理与服务 / LLM/MoE 训练与 Checkpoint / GPU/加速器调度与 Kernel / 网络协议 CC 与在网计算 / 流媒体 RTC 云网关 / 卫星与空间计算 / OS 虚拟化 Container 内存 / 存储与文件系统 / 数据库与大数据 / 安全可靠性与故障 / 编译器 Shell 其他工具
此前 ATC 2025 无 paper wiki 页；13 个并行 agent 批量生成全部 100 篇
主线信号：LLM serving 多模型多租户托管 + 国内 hyperscaler 生产论文集中曝光 + SmartNIC/DPU/CXL/PIM/Tofino 异构硬件横贯 + Rust framekernel + model checking 工程交付（Asterinas/Converos）

[2026-04-25] FAST-2026 综述生成

生成：FAST-2026
聚合 44 篇 paper wiki 页
分类 7 个：LLM 推理与训练存储 / 生产规模云存储经验 / CXL 解聚存储与跨虚拟化 I/O / SSD I/O 路径与内核栈 / 纠删码 GC 与数据放置 / 缓存分层与多资源调度 / 文件系统创新 / 索引同步时序与可信存储
此前 FAST 2026 无 paper wiki 页；8 个并行 agent 批量生成全部 44 篇

[2026-04-25] SOSP-2025 综述生成

生成：SOSP-2025
聚合 66 篇 paper wiki 页
分类 11 个：LLM 推理与服务 / LLM 训练与多 GPU 系统 / GPU OS 与加速器抽象 / SmartNIC·RDMA·CXL·FPGA / 存储与文件系统 / 分布式系统·事务·规划 / 内存管理·远程内存 / OS 基础·嵌入式·教学 / 形式化验证·应用安全 / eBPF·可靠性·Fuzzing / Serverless·恢复·弹性
此前 SOSP 2025 无 paper wiki 页；9 个并行 agent 批量生成全部 66 篇

[2026-04-24] wiki-lint

Broken: 402（绝大多数是未建页橘色链接） | Hybrid paren: 2 | 缺页建议: 21 | Orphan: 0 | Frontmatter: 0 | Log 违规: 0 | Alias 冲突: 0 | 命名违规: 1
需人工修 hybrid paren：wiki/papers/T2C-OSDI25.md:44、wiki/papers/TrainCheck-OSDI25.md:45
高优先建页：LLM-Inference (inbound 13)、Prefix-Caching (13)、Transformer (8)、RAG (7)、RadixAttention (7)
模式：read-only

[2026-04-24] OSDI-2025 综述生成

生成：OSDI-2025
聚合 53 篇 paper wiki 页
分类 10 个：LLM 推理与服务 / 分布式训练 / GPU Kernel·Compiler·Profiling / 存储与 I/O / 分布式系统与数据库 / 网络 / 内存管理与虚拟化 / 安全·沙箱·隐私 / 形式验证与可靠性 / 异构加速·Serverless·其他
此前 OSDI 2025 无 paper wiki 页；9 个并行 agent 批量生成全部 53 篇

[2026-04-24] 补齐 Top 10 缺页 concept

背景：lint 发现 141 个”被引用但无文档”的 wiki 页，inbound 最高的 10 条全部是核心 concept
新建 concept 页 10 篇（均在 wiki/concepts/）：
- Flash-Attention（inbound 26，aliases 含 FlashAttention 系列）
- Tensor-Parallelism（inbound 21）
- Continuous-Batching（inbound 21）
- Attention（inbound 18，foundational）
- Quantization（inbound 16）
- Expert-Parallelism（inbound 16）
- Pipeline-Parallelism（inbound 15）
- Chunked-Prefill（inbound 15）
- RDMA（inbound 10）
- LoRA（inbound 9）
每页 frontmatter 齐全（aliases / parent / introduced_by / tags）+ “引用本概念的论文” 节点名对齐实际 wikilink
concept 目录从 5 页扩到 15 页，剩余 131 个缺页由后续 /wiki-lint 按阈值分批补

[2026-04-24] Finance 综述生成

生成：Finance
聚合 4 篇 paper wiki 页(全部新建,从 markdowns/finance 提取):101-Alphas-arXiv15、151-Trading-Strategies-SSRN18、TimesFM-Fin-arXiv24、RD-Agent-Quant-arXiv25
分类 3 个:Formulaic alpha 与策略参考库 / LLM-driven 多 agent 自动化 quant R&D / Time-series foundation model 金融适配
主题综述 3 段:从封闭披露到公开自动化 10 年 / agent 路线 vs foundation-model 路线 / Kakushadze 2015 在 2025 仍是基线的信息论解释
值得关注方向 4 条,聚焦小团队可做:大规模 formulaic alpha 语料扩写 / TimesFM-Fin 金融 scaling 曲线 / agent+foundation joint system / Kakushadze 公式集的独立复现基准

[2026-04-24] TransferEngine: arXiv 版并入 MLSys26 版

背景：fabric-lib-MLSys26 正式发表，arXiv preprint 2510.27656v1 为同文早版本
清理 raw 层：删除 papers/ai-infra/2510.27656v1.pdf、markdowns/ai-infra/2510.27656v1/
清理 wiki 层：删除 wiki/papers/TransferEngine-arXiv25.md
重定向 wikilink：所有 [[TransferEngine-arXiv25]] → [[fabric-lib-MLSys26]]
- index.md（arXiv / AI-Infra 专题列表 6→5 篇，TransferEngine 转入 MLSys-2026）
- DeepSeek-V4-arXiv26、Libra-ICLR26、LatencyOptimal-MoELB-INET4AI25（同期/基础设施引用）
- concepts: MoE / PagedAttention / KV-Cache / Disaggregation / Speculative-Decoding
- themes/AI-Infra（主线二综述段 + 值得关注方向第 3 条）
- entities/vLLM（演进时间线 / 相关论文 / 开放问题）
MLSys26 paper 页「同类系统」删去对 arXiv25 的自引用

[2026-04-24] Auto-Research 综述生成

生成：Auto-Research
聚合 11 篇 paper wiki 页（全部新建，从 markdowns/autoresearch 提取）:MLAgentBench-ICML24、OpenHands-ICLR25、AI-Scientist-arXiv24、MLE-Bench-ICLR25、AI-Scientist-v2-arXiv25、Auto-Research-arXiv25、MLR-Bench-arXiv25、AlphaEvolve-arXiv25、ASI-ARCH-arXiv25、Kosmos-AI-Scientist-arXiv25、FunSearch-Nature24
分类 4 个：端到端自主科研系统 / Evolutionary 算法与架构发现 / ML Agent 评测基准 / 通用 Agent 平台
主题综述 5 段：从 benchmark 到真 discovery 的 arc / LLM-as-agent vs LLM-as-mutator 两条范式 / Benchmark 三层递进与可信度危机 / AlphaEvolve+OpenHands 部署即试金石 / “科学发现 scaling law” 是最激进 claim
值得关注方向 5 条，聚焦小团队可做：verifiable 窄域 discovery / integrity-first verifier / 领域特化 mini-AI-Scientist / compute-efficient scaling law 对照验证 / reproducibility infrastructure

[2026-04-24] FluxMoE-arXiv26 paper wiki + wiki-update

生成：FluxMoE-arXiv26
命名：系统名 FluxMoE（论文自命名，abstract & intro 反复使用）
补 wikilink：paper 页首次出现 MoE、vLLM、KV-Cache、SGLang、PagedAttention、Disaggregation 均在写入时直接加 link，无需二次补
更新：wiki/concepts/MoE.md、wiki/concepts/KV-Cache.md、wiki/concepts/PagedAttention.md、wiki/concepts/Disaggregation.md、wiki/entities/vLLM.md 的「引用本概念的论文」/「相关论文」节
无新 TODO 缺页（watchlist 里 Mooncake/DistServe/ZeRO-Infinity/FlexGen 等虽提及，本已在其他 log 条目中登记；lossless-compression 出现在 paper 但未列入 watchlist，暂不升级）
追加「批判与局限」节：7 点批判 + 定位——thesis 被 DeepSeek-V4 等模型侧 FP4 + KV 压缩釜底抽薪；context 只测 4K 无法外推；claim target PD-disaggregated decode 但没测 PD 分离；L40 硬件选择偏向自己；baseline 弱；无精度实证；规划器稳定性证据薄。定位：工程扎实但 thesis 适用窗口在快速收窄，不宜作 2026+ SOTA 对比基线

[2026-04-24] Foundation 综述生成

生成：Foundation
聚合 2 篇 paper wiki 页（Transformer-NeurIPS17、DeepSeek-V4-arXiv26，均为新建）
分类 2 个:架构基石 / 开源 Frontier 综合
主题综述聚焦 2017→2026 的 9 年架构传承线
值得关注方向 3 条:Transformer future work 富矿、foundation 可复现 benchmark、方法反向投射到小模型

[2026-04-24] MLSys-2026 综述生成

生成：MLSys-2026
聚合 79 篇 paper wiki 页（全部新建，从 markdowns/mlsys-2026 提取）
分类 13 个：LLM 推理 / Attention-KV / Speculative / MoE / 分布式训练 / GPU Kernel / AI4AI / 量化 / Agent / 扩散视频 / 联邦隐私 / 可复现基准 / 边缘应用
研究趋势 6 段，均带具体 paper wikilink 作证据
值得关注方向 6 条，聚焦小团队可做

[2026-04-24] Phase 4 局部：删除旧产物

打 git tag pre-wiki-migration 留 rollback 锚点
删除：reports/（484 篇旧报告 + 各级 README）
删除：ideas/（7 篇研究方向）
删除：.claude/skills/paper-report/ 和 .claude/skills/papers-digest/
触发：用户确认后立刻执行，不等 Phase 3 全量

[2026-04-24] Phase 2: ai-infra theme + index 更新

生成：AI-Infra，3 主线综述 + 3 个 open problems direction
更新：index 加入 7 个 seed 页 + 1 个 theme 页 + 5 篇 paper 索引

[2026-04-24] Phase 2: 7 个 seed entity/concept 页

entities: vLLM、SGLang
concepts: KV-Cache、MoE、PagedAttention、Speculative-Decoding、Disaggregation
数据来源：从 5 篇 ai-infra paper wiki 页 + 已读 markdown 提取
这些页存在后，5 篇 paper 里的 wikilink 自动解析（橘色 → 蓝色）

[2026-04-24] Phase 1 mini pilot：ai-infra 5 篇 wiki paper 页

生成：
- fabric-lib-MLSys26（系统名；原 arXiv 版已于 2026-04-24 合并至 MLSys26 版）
- Libra-ICLR26（系统名）
- AttnRes-arXiv26（方法名）
- MSA-arXiv26（方法名）
- LatencyOptimal-MoELB-INET4AI25（方法名 + workshop）
命名验证：3 个用系统名/方法名，1 个用 workshop 简写做后缀
暂未做：自动 wiki-update（wiki/entities, wiki/concepts 还是空的，无可补 wikilink 的目标页）—— 已在下一条 Phase 2 中通过补 seed 页解决

[2026-04-24] wiki 初始化

新建目录结构：papers/、conferences/、entities/、concepts/、comparisons/、themes/
新建占位：index.md、log.md
触发：落地 Karpathy 风格 LLM Wiki 架构，废弃旧 reports/ 和 ideas/

Awesome System Papers Wiki

探索

log

Wiki Log

[2026-06-20] EventTensor duplicate cleanup

[2026-06-20] Wiki quality pass

[2026-06-20] Lint follow-up: 9 papers + 6 concepts

[2026-06-20] DeepSpeed / Mooncake / TensorRT-LLM / Megatron entity pages

[2026-06-20] Critical wiki full rebuild

[2026-06-18] Prefix-Caching / RAG concept pages

[2026-06-18] MLSys26 batch-h4 (13 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-h3 (13 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-h2 (10 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-h (13 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-g (15 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-f (16 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-e (15 stems, —force) wiki-update

[2026-06-18] MLSys26 batch-d (15 stems, —force) wiki-update

[2026-06-18] MLSys26 batch (6 stems) wiki-update

[2026-06-18] MLSys26 batch-c (7 stems, —force)

[2026-06-18] MLSys26 batch-b (7 stems) wiki-update

[2026-06-18] MLSys26 batch (7 stems) wiki-update

[2026-06-17] MLSys-2026 综述生成

[2026-06-17] LayeredPrefill-MLSys26 wiki-update (batch aa)

[2026-06-09] KTransformers entity + link update

[2026-06-09] DwarfStar entity + probe link update

[2026-06-09] AI-Infra MoE/KV offload 新论文入库

[2026-06-03] AlphaProofNexus-arXiv26 入库

[2026-06-01] BES-arXiv26 入库

[2026-06-01] AutoScientists-arXiv26 入库

[2026-05-26] FlashAttention-3-NeurIPS24 入库

[2026-05-25] FlashAttention-2-ICLR24 入库

[2026-05-24] FlashAttention-NeurIPS22 入库

[2026-05-06] Finance 综述更新

[2026-05-06] NewsShock-NBER26 入库

[2026-04-30] vLLM + SGLang 论文入库 + Foundation 综述更新

[2026-04-30] AI-Infra 综述更新 + 6 篇新 paper wiki 页

[2026-04-30] fabric-lib-MLSys26 arXiv v1→v2 更新

[2026-04-25] ATC-2025 综述生成

[2026-04-25] FAST-2026 综述生成

[2026-04-25] SOSP-2025 综述生成

[2026-04-24] wiki-lint

[2026-04-24] OSDI-2025 综述生成

[2026-04-24] 补齐 Top 10 缺页 concept

[2026-04-24] Finance 综述生成

[2026-04-24] TransferEngine: arXiv 版并入 MLSys26 版

[2026-04-24] Auto-Research 综述生成

[2026-04-24] FluxMoE-arXiv26 paper wiki + wiki-update

[2026-04-24] Foundation 综述生成

[2026-04-24] MLSys-2026 综述生成

[2026-04-24] Phase 4 局部：删除旧产物

[2026-04-24] Phase 2: ai-infra theme + index 更新

[2026-04-24] Phase 2: 7 个 seed entity/concept 页

[2026-04-24] Phase 1 mini pilot：ai-infra 5 篇 wiki paper 页

[2026-04-24] wiki 初始化

关系图谱

目录