Awesome System Papers Wiki
Search
搜索
暗色模式
亮色模式
探索
标签: benchmark
此标签下有8条笔记。
2026年6月20日
Chakra-MLSys26
benchmark
distributed-training
co-design
execution-trace
simulation
2026年6月20日
FlashInfer-Bench-MLSys26
gpu-kernels
llm-inference
benchmark
agent
flashinfer
2026年6月20日
Koala-ATC25
benchmark
shell
posix
characterization
reproducibility
2026年6月20日
MLAgentBench-ICML24
auto-research
agent
benchmark
ml-experimentation
react
2026年6月20日
MLE-Bench-ICLR25
benchmark
ml-engineering
kaggle
agent
evaluation
2026年6月20日
MLR-Bench-arXiv25
auto-research
benchmark
llm-judge
research-agent
evaluation
2026年6月20日
OSWorld-Human-MLSys26
computer-use-agent
benchmark
latency
osworld
efficiency
2026年6月20日
PARROT-MLSys26
llm-safety
sycophancy
benchmark
alignment
calibration