Awesome System Papers Wiki
Search
搜索
暗色模式
亮色模式
探索
标签: benchmark
此标签下有7条笔记。
2026年4月24日
Chakra-MLSys26
benchmark
trace
simulator
distributed-training
co-design
2026年4月24日
FlashInfer-Bench-MLSys26
benchmark
llm-inference
gpu-kernels
ai-code-generation
flashinfer
2026年4月24日
MLAgentBench-ICML24
auto-research
agent
benchmark
ml-experimentation
react
2026年4月24日
MLE-Bench-ICLR25
benchmark
ml-engineering
kaggle
agent
evaluation
2026年4月24日
MLR-Bench-arXiv25
auto-research
benchmark
llm-judge
research-agent
evaluation
2026年4月24日
OSWorld-Human-MLSys26
agent
computer-use
benchmark
latency
gui-agent
2026年4月24日
PARROT-MLSys26
llm-evaluation
sycophancy
benchmark
alignment
robustness