Scaler 2 - 搜索 News

资讯

4 天

苹果发现多模态模型Scaling Laws 早融合比后融合好MoE胜密集模型

目前我们见到的很多多模态大模型应用是「组合式」的：其中集成了数个单独预训练的组件，例如将视觉编码器连接到 LLM 上并继续进行多模态训练；而在谷歌 Gemin 2.0 推出之后，原生多模态模型（NMM）被认为是正确的方向。

4 天

RL for LLMs，强化学习的 Scaling Law 才刚刚起步？

2、在 o1 模型推出后，LLM 的 Scaling Laws 范式从预训练阶段转向后训练即推理阶段，通过更多的强化学习（训练时计算）和更多的思考时间（测试时计算）来持续提高 o1 的性能。

5 天

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集 ...

2 小时

可灵AI全球发布2.0模型，史上最强视觉模型来了！网友：人人都能手 ...

得益于此，视频生成大模型的用户规模也迎来爆发式增长。截至目前，可灵 AI 全球用户规模突破 2200 万。过去的 10 个月里，月活用户量增长 25 倍，累计生成超过 1.68 亿个视频及 3.44 亿张图片。

知乎专栏 on MSN1 天

DeepSeek通用任务GenRM新作：Inference-Time Scaling for Generalist Reward Modeling

这篇DS的新作提出了一个 pointwise Generalist RMs的训练框架，仔细读下来有很多的细节可以回味，且该文有很大概率是DS主线上迭代的一篇工作（从DS-R1 -> R2）, 因为R1其实挖了个坑并没有把通用类的RL给做充分，后续 ...

1 天

科学发现也有Scaling Laws：agent+具身机器人，击败人类顶尖科学家？

机器人科学家为将科学研究扩展到地球边界以外的太空探索，以及人类无法进入或危险的其他极端环境提供了巨大潜力。它可以在月球和火星上建立研究能力，然后这些自主系统可以有条不紊地将业务扩展到整个太阳系，甚至可能扩展到更远的地方，还可以彻底改变我们对地球深海的 ...

1 天

Gemini 2.5编程全球霸榜，谷歌重回AI王座，神秘模型曝光，奥特曼迎战

aider多语言编程基准测试显示，Gemini 2.5 Pro近出世半个多月，编程能力已经是全球第一，口碑一众超越Claude 3.7 Sonnet。为了强调Gemini 2.5 Pro成本优势，Jeff Dean还附上了超详细TOP ...

十轮网科技资讯 on MSN2 小时

微软发布首个超过20亿参数的1-bit模型更省电、不占内存

微软本周发布20亿参数的1-bit模型BitNet b1.58 LLM家族，称此新型模型比主流Transformer LLM更不占内存且更少能耗，适合在CPU或较小型硬件平台上执行。微软研究院与中国科学院研究人员2023年发布名为《BitNet: ...

腾讯网1 天

“字节暗示我太穷”：Seed团队1000张H100训练7B模型，发布全球首个25秒 ...

整理 | Tina这是全球首个由 AI 生成的 25 秒视频，由字节跳动发布的 Seaweed-7B 模型生成。字节跳动近日宣布在视频生成领域取得重大突破——Seaweed-7B。这是一个参数量仅为 70 ...

上游新闻 on MSN21 小时

字节Seedream 3.0追平GPT-4o 入文生图第一梯队！即梦、豆包全量上线 ...

文生图领域权威的第三方榜单Artificial Analysis竞技场发布消息称，字节跳动Seed团队图像生成模型Seedream 3.0综合性能已追平文生图SOTA模型GPT-4o，进入全球第一梯队。 Seedream ...

腾讯网1 天

可灵2.0成“最强视觉生成模型”？自称遥遥领先OpenAI、谷歌，技术 ...

可灵 AI 创作者作品整理 | 褚杏娟、华卫刚刚，可灵 AI 面向全球正式发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型。即日起，可灵 2.0 和可图 2.0 在全球范围上线。“这是你能用到的，世界上最强大的视觉生成模型。”快手高级副总裁、社区科学线负责人盖坤说道。根据对比测试，可灵 2.0 文生视频大模型与 Veo2 ...

2 天

小鹏汽车启动VLA基模研发，2亿Clips训练720亿超大规模模型

小鹏汽车在新X9发布上市之前，做了一场AI技术分享会，再次强调了自己是一家AI驱动的技术公司。而这次技术分享会的一个核心内容就是：小鹏汽车正在研发VLA基座模型，也在研发“世界模型”，而且小鹏汽车已经拥有10 EFLOPS的算力。可以说，小鹏汽车整个智驾技术路线也已经向业界下一代主流路线VLA开始迭代。 1、正在研发的“小鹏世界基座模型”是一个720亿参数的超大规模自动驾驶大模型，可以理解为一个 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果