华为管理培训
数字化转型培训

字节大模型全员会:涉及团队调整、AI研发方向、组织变革与改进

1

版权声明

来源:极客公园(geekpark)、第一财经、南方都市报,书享界(readsharecn)

导语

据媒体报道,3月18日,字节跳动豆包大模型部门(Seed)召开全员会,刚加入字节负责AI基础研究探索的吴永辉与模型应用负责人朱文佳共同主持。会议再次强调字节CEO梁汝波提出的探索智能上限,以及充足算力的配合。吴永辉表示对Seed
Edge项目(大模型团队内部组建的AGI长期研究团队)取消季度 OKR 和半年考核,字节内部知情人士向记者确认上述会议内容。

值得一提的是,就在近日的字节跳动全员会上,谈及最近爆火的DeepSeek,梁汝波表示,去年9月OpenAI发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但没有特别觉得一定要马上复现,早1个月晚1个月差别不大,“如果一开始重大问题就争先,我们有机会更早实现。”针对AI业务,梁汝波提出了2025年的重点目标,包括追求“智能”上限、探索新的交互和加强规模效应。

 

3月18日上午,字节跳动豆包大模型部门(Seed)召开全员会,由负责模型应用相关工作的朱文佳,与新近加入的负责AI基础研究探索工作的吴永辉共同主持。

 

两人谈到了未来的目标,明确Seed部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

 

 

1

模型和应用长期不矛盾,

最重要的是探索智能上限

 

全员会上明确了Seed部门最重要的目标是探索智能上限,这是一个长期目标,会围绕此前公布的AGI研究计划「Seed Edge」展开,鼓励有能力、有想法的同学,探索更长周期的、具有不确定性和大胆的AI研究课题。

吴永辉强调了长期研究的重要性,对SeedEdge的投入将进一步加大,会为SeedEdge提供充足的算力,并将持续在内外部招募最具潜力和好奇心的研究人才。同时,对Edge项目取消季度OKR和半年考核,保障长期稳定的研究环境。
朱文佳则提到,模型应用会更多从用户视角出发,把用户最关心的任务,比如问答、创作、解题、代码等做好,真正理解用户需求,符合用户偏好。还要在搜索、Agent等应用中使用好工具,并充分发挥预训练模型的潜力。

朱文佳觉得,模型不但要答对问题,还要讲的清楚,让人很快能看懂,要有情商。拿创作来说,他认为不管是格式、文采还是深度,每个方面的天花板都很高,需要不断试验分析。

关于模型研究和模型应用的资源投入问题,吴永辉认为长期来看两者并不矛盾,智能不提升无法服务用户,同时应用才能支持持久的投入,且给模型带来更多的反馈,以及带来更大的成就感。朱文佳也表示,最关键的还是智能上限,因为,「模型应用长期要贴着模型能力去做」。

 

2

字节AI布局

 

2016年,内部团队A1Lab成立,设立了包括计算机视觉、自然语言处理、语音和音频处理、机器学习等多个子团队。
因为抖音等核心应用的绝对市场优势地位,AILab侧重点变
成了服务于应用端的技术团队;

 

这也导致字节一开始在大模型领域反应迟钝,在2023年才成立Seed团队,开始重新部署投入。

 

字节AI部门架构分为三层:Stone(技术支持)、Seed(专注大模型研发)、Flow(专注AI应用开发)。目前字节已形成算力、算法、模型、应用的全产业链布局:

 

(1)算力层

 

火山引擎为字节的云基础设施层,字节此前在算卡购买上较为积极,有着充沛的算力储备为模型训练和推理提供支持。
GPU万卡集群建设:2023年9月,字节建立万卡Ampere架构GPU(A100/A800)集群,并推进Hopper架构(H100/H800)集群。

 

自研芯片:启动了多个芯片自研项目,包括AI芯片、服务器芯片、FPGANIC、RISC-V项目

 

(2)模型层

 

以豆包大模型为核心,发布了通用模型、视觉理解模型、3D生成模型、音乐模型、文生图模型等。

 

(3)应用层

 

豆包(AI助手)、猫箱(AI虚拟陪伴)、星绘(AI修图)、即梦AI(AI图片、视频生成)等。

 

3

关于AI,字节的多重尝试与反思

 

2025年2月13日上午,字节跳动举办了新一期的AllHands全员会,字节CEO梁汝波、CFO高准、人力资源负责人华巍、电商业务负责人康泽宇、AI业务负责人朱文佳、TikTokCEO周受资与全体员工交流。全员会期间,梁汝波与AI团队对于春节期间DEEPSEEK进行了深度思考

DeepSeekR1创新点之一的长链思考模式不是业界首创。全员会上,梁汝波反思说去年9月OpenAI发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但“没有觉得要马上复现出来……现在回头看,如果一开始重大问题就争先,我们有机会更早实现。”

 

他随后提出2025年的重点目标:

 

  • 追求“智能”上限。相比追求某个具体产品——比如豆包——的DAU,把智能本身作为最重要的目标可以激发更多尝试、不忽略关键技术节点。

  • 探索新的交互。“新的交互应该是会更可穿戴、更便携、更自然的。”去年上线的OlaFriend耳机只是初步尝试。

     

  • 加强规模效应。这是指AI产品应该越多人用越好用,“现在豆包上这个特点还不明确。”

“去年(2024年)年初时我们的情况是比较差的。”字节AI负责人朱文佳在2025年2月的全员会上说,当时字节语言、视觉理解、图片生成等模型都处于行业第二梯队。为此字节做了较大幅度的组织调整。例如负责AI的Flow部门被提为与抖音、飞书等平级的主要业务部门,需求往往被优先考虑。原先分散在各个业务的高管也向AI集中——包括之前管战略的朱俊、抖音集团原CEO张楠、字节工程技术负责人洪定坤。

 

2025年1月底,字节宣布启动SeedEdge项目,要做比预训练和大模型迭代更长线、更基础的通用人工智能(AGI)前沿研究。SeedEdge项目员工考核周期超过同事、过程指标考核也被放宽。这是为“鼓励探索更长周期、不确定的和大胆的课题。”一位接近SeedEdge项目的人士评价。

 

4

加强内外部技术开放程度,

考虑推进开源

 

在3月18日举行的全员会中,进一步加强组织文化,打造开放、包容、自信的团队研究氛围,则是Seed今年工作的另外一个重心。

 

吴永辉提到他加入字节的原因,是想做第一流的研究,也想打造一个第一流的AI研究团队。他表示,希望Seed成为一个能培养人才的组织:「我们希望把世界上最好的人才吸引到Seed来。但更重要的是我们要把内部人才用好,把我们的潜力股识别出来,给他们足够的机会,培养成顶级的人才。」

 

朱文佳也提到,过去两年,大模型团队的很多应届生、实习生和年轻同学,或者独立负责重要的方向,或成为技术突破的关键贡献者,成长非常快。

 

为了更好地培养人才,Seed正在改进内部反映的一些问题,比如让信息更透明,包括扩大文档、代码和数据的权限,尽可能共享,消除信息孤岛。同时,打破部门壁垒,提升跨团队的沟通与协作,建立跨部门的专项研究小组。

 

吴永辉还表示,Seed做了很多很好的工作,但外面不太了解。未来会加强提升research的影响力,鼓励员工以research paper或者blog的形式把这些工作发表出来。

此外,未来Seed也会考虑开源,可能会开源中小尺寸的Dense模型,这样尺寸的模型对社区也是最友好的,目前细节还在讨论中。

 

5

640 (2)
88

书享界保留所有权 |书享界 » 字节大模型全员会:涉及团队调整、AI研发方向、组织变革与改进

扩展阅读请点击
分享到:更多 ()

评论区 抢沙发

华为管理培训 · 数字化转型培训

服务案例联系书享界