本周扫描 86 个 HF 组织 · 50 个 GitHub 组织 · 71 个博客 · 125 个 X 账户
本周 5 条高商业价值发现
阿里 Qwen 团队发布 Qwen3-Coder-Next(80B MoE,3B active),专为 coding agent 和本地开发设计。SWE-Bench Pro 44.3 分,vLLM 和 SGLang 均提供 Day-0 支持,Together AI 已上线推理服务。
NVIDIA 发布 RoboCasa-Cosmos-Policy 和 LIBERO-Cosmos-Policy 两个机器人仿真数据集,配合 Isaac GR00T N1.6 基础模型(GitHub ⭐6143)。同时发布 Numb3rs 语音文本规范化数据集。5 个数据集 + 35 个模型,是本周最活跃的 Lab。
deepseek-ai/DeepSeek-OCR-2 在一周内达到 661,725 次下载、712 次点赞,成为本周下载量最高的中国模型。同期智谱发布 GLM-OCR(被 SGLang 报道),Mistral 发布 OCR 3。
本周 7 篇 RLHF 相关论文,涵盖法语偏好数据收集(compar:IA)、民主化偏好对齐(DemPO)、Rubric 改进、GenRM 推理质量(R-Align)、LLM 评委去偏(FairJudge)、DPO 过优化防护(PEPO)、视频流匹配(Euphonium)。Qwen 发布 RationaleRM 数据集(2026-02-02),提出 Rationale Consistency 新评估维度。
stepfun-ai/Step-3.5-Flash 228,406 次下载,同时发布竞争编程基准 CF-Div2-Stepfun。Step3-VL-10B(82,755 次下载)聚焦机器人视觉-语言交互。
从模型发布反推训练数据需求
本周下载量变化最大的数据集
| 数据集 | 下载量 | 周增长 |
|---|---|---|
| nvidia/Numb3rs | 232 | +139.2% |
| amazon/doc_split | 1,566 | +25.9% |
| Qwen/RationaleRM | 754 | +16.9% |
| nvidia/LIBERO-Cosmos-Policy | 2,173 | +7.0% |
| google/WaxalNLP | 7,277 | +1.9% |
本周高价值数据集逆向分析(由 DataRecipe 自动生成)
本周共分析 3 个数据集 · 总复刻成本 $3,374 · 人工占比 83.9% · 全部 Hard 难度
由 AI Dataset Radar 自动生成 · 每周更新
github.com/liuxiaotong/ai-dataset-radar →