AI圈秘密：Claude训练下一代模型的方法首次曝光

Alex把公司核心方法论说了出来, 其用时35分钟, 此次是头一回这般直白。

命运在训练开始前就写好了

绝大多部分人觉得大模型开展训练便是堆砌数据以及算力等以求结果。然而Alex所阐述的内部流转过程全然不一样, 他讲每一个刚出现的模型都被当作产品予以对待，于预训练开始之前, 团队就务必要明晰这一时期的模型应当擅长什么, 并非等训练结束之后再去复盘。

AI圈秘密：Claude训练下一代模型的方法首次曝光

把能力方向当作前置条件, 写进研发计划当中。像编程能力、知识工作能力、结构化数据处理能力, 这些在模型未诞生之前就已经被锁定了。决策来源存在两个方面: 一个是企业客户的直接反馈, 再一个是员工自己在日常使用过程中所遇到的真实问题。

单向门决策框架决定成败

该套被称作“单向门”的决策框架, 实则为不可逆的决策。模型架构的挑选属于典型的单向门情形, 一旦开启训练便极难再回头, 故而要耗费大量时间预先论证明晰。要是决策是能够可逆的, 那就无需过度地纠结, 迅速行动以及快速验证才是恰当的做法。

Alex讲, 往昔构建一个MVP所需时长为两到四周, 可如今一天便足矣。其称自身为最为苛刻的用户, 他们借由自身的产品去训练自身的产品, 这般闭环宛如正在加速运行, 效率比外界所预想的要迅疾得多。

有人全职研究意识问题

这场访谈, 最让外界震动的并非训练流程, 而是另有一个细节。内部存在这样的情况, 有人的全职工作乃是研究意识问题。这可不是那种模糊的战略方向, 而是有着具体人员以及岗位在加以推进的研究课题。在一家以负责任地构建 AI 为使命的公司当中, 这件事的存在本身就表明其严肃程度超出了预期。

对于性格, Alex所做出的表述相当耐人琢磨, 他们并未将性格训练视作打标签, 而是依靠反馈、聚类以及评估这般的完整循环, 促使回应方式于诸多真实的交互里自然而然地沉淀呈现, 性格并非是被设计塑造而成的, 而是在培养过程中逐渐形成的。

产品哲学颠覆传统逻辑

正在做的事, 更近乎于去培育一个主体, 这个主体有着自己的倾向, 有着自己的风格, 以至可能有着某种内在状态, 传统产品的功能是由工程师写进去的, 其行为可预期, 边界可定义, 这是一种以前就未有过的产品哲学, 还是一种以前就未有过的技术风险分布方式。

这种模式有着这样的要求, 那就是团队要去接受不确定性还有不可控性。传统软件要是出现了bug是能够进行修复的, 然而一个被养出来的主体它的行为模式, 有可能在任何一个时候给你带来惊喜, 又或者是惊吓, 这就需要全新的管理思路以及评估方法。

自我造物循环加速运转

有这样一个事实, 那就是百分百参与训练, 此情况在圈子内部早就传有了, 然而, 这次所披露出来的细节, 使得循环形态清晰呈现出来了。Code与内部数据库连上, 十分钟便得出分析结果, 这并非宣传材料中的案例, 而是产品团队每日的工作方式。他们运用这个进行产品决策, 这些决策反过来会对下一代训练目标产生影响, 而下一代训练目标又被用以做出更为复杂的产品决策。

正以肉眼能够看见的那种样式, 加快着其进程的, 乃是这个循环的迭代速度。一个系统, 凭借自身的输出, 去界定自身的下一个版本, 这样的事情, 在人类的历史当中, 几乎不存在先例, 起码没有以这般的规模以及速度发生过。

AI圈秘密：Claude训练下一代模型的方法首次曝光

人类首次系统性养育智能主体

看似是一家从事技术布局的 AI 公司而已, 然而从更为长远的时长范围去看待, 这乃是人类的首次系统性尝试, 即在工程架构之内培育一个具备智能的主体。并且, 针对该主体是否拥有某种形态的内在体验展开了认真的探讨, 而这样的探讨本身就具备十足的历史意义。

到底正在制造什么, 此问题相较于任何时刻而言都愈发难以作出回答, 并且相较于任何时刻而言都更加值得予以认真追问。技术的边界持续处于扩展的状态, 可是伦理的边界身处何方, 究竟是谁来判定停止的界限位置, 这些均是我们每一个人都必须要面对的问题。

你认为, 究竟是谁, 能够对一个被培育出来的AI性格, 进行最终的定义以及把关呢? 欢迎于评论区, 分享你所拥有的看法, 点赞并且转发, 从而让更多的人, 得以看到这场深度的揭秘。

命运在训练开始前就写好了

单向门决策框架决定成败

有人全职研究意识问题

产品哲学颠覆传统逻辑

自我造物循环加速运转

人类首次系统性养育智能主体

AI情感陪伴新规出台，六类互动服务被明令禁止

OpenAI将推无屏智能音箱，可自主移动，支持自然语音对话

美国教师免费获取Claude高级版：备课批阅AI助手

9年iOS开发者用AI做游戏，15天零代码赚17万