WhynotTV × 翁家翌 · 2:02:44 · INTERACTIVE BRIEFING

卖铲子的人:从清华作业到 OpenAI 后训练 Infra

先用「重点导读」理解开源、Tianshou、impact、OpenAI RLO infra 与 AI Lab 的 cycle time;再到「原文」检索完整转写并从任意时间点收听。

00:00:00读判断;需要时回到原文和音频

开源作业:把代码当成信息平权工具

翁家翌早期最鲜明的行动,是把清华课程资料和作业开源,让后来者少被信息差消耗。

    模型发布是金矿;真正放大所有人的,是隐藏在背后的铲子、管线、reward、eval 与 debug loop。

    如果只看三分钟,记住这些

    01

    这不是“OpenAI 大模型开发者履历”页,而是一条高杠杆工具链:开源资料、RL 框架、签证工具、后训练基础设施。

    02

    他反复强调的核心不是 idea,而是 consistency、bug、吞吐、cycle time:谁能更快修对系统,谁就能把模型训得更好。

    03

    “卖铲子”是这期访谈的钥匙:不只是自己挖金矿,而是让更多 researcher 能够更快地做实验、评估和发布。

    原文音频

    完整访谈音频 + 时间轴原文

    点击任意时间戳会跳到对应位置并播放。音频来自原 Bilibili 视频抽取压缩,仅用于原文对照。

    00:00 / 02:02:44