CONTEXT - 搜索 News

11 小时

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

北京时间周一上午 9 点，刚一上班（同时是硅谷即将下班的时候），DeepSeek 兑现了自己的诺言，开源了一款用于 Hopper GPU 的高效型 MLA 解码核：FlashMLA。众所周知，MLA是 ...

腾讯网1 小时

阶跃星辰押注智能终端Agent

作者 | 刘宝丹编辑 | 黄昱DeepSeek凭一己之力带火中国AI资产的同时，也加重了国内AI创业公司们的危机感。作为“AI六小强”之一的阶跃星辰一贯低调，如今也开始秀肌肉了。近日，阶跃星辰创始人、CEO 姜大昕在首届Step ...

腾讯网3 小时

新加坡投资9亿新元升级巴士网络，新建组屋区优先受益

▲ ...

12 小时

不到1美元，打造全球第3超强AI助手！港大3人开源最强Deep Research

为推动这项技术的普及，来自香港大学黄超教授实验室的三位研究员开源了创新型Agent框架Auto-Deep-Research，并一举在General AI Assistant benchmark GAIA评测中夺得第三，是开源方案中的最优解。

6 天

月之暗面：一年前就验证过长思维链，因成本高先搞了长文本

2 月 18 日上午消息，月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程，并透露称， 2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果，令自己陷入了 Long-CoT 的有效性反思中。因为 ...

2 天

本地 AI 终极对决！DeepSeek、Llama、千问谁才是你的最佳选择？

DeepSeek R1 可能是推动本地 AI 领域飞速发展的最大功臣。这款来自中国的 AI 模型免费、开源且功能强大，是任何想要尝试新 AI 应用的人的完美工具。从基本的聊天搜索（例如“如何去除棉质 T 恤上的污渍”），到处理税务问题或其他个人事务 ...

来自MSN14 小时

首篇多模态 RAG 全栈技术综述出炉~

跨模态对齐和推理为 Multimodal RAG：多模态RAG 带来了独特的挑战：提出了一个多模态RAG系统的通用框架；并对多模态RAG系统进行了系统且全面的分析，涵盖了数据集、评估指标、基准测试、评估方法以及检索、融合、增强和生成方面的创新多模态检索增强生成（RAG）通用框架，突出展示了每个阶段所采用的先进技术和方法。查询预处理、多模态数据库、检索策略（模态为中心）、融合机制、增强技术、生 ...

2 天

杨植麟和梁文锋，论文撞车了

杨植麟最初创办月之暗面受到关注的一个重要原因，是他的论文影响力和引用量，但 K1.5 论文之前，他最后一篇论文类的研究停留在 2024 年 1 月。而梁文锋虽然作为作者出现在 DeepSeek 最重要的模型技术报告里，但这些报告的作者名录几乎相当于 ...

7 天

月之暗面分析员分享k1.5 模型背后的完整思考过程：一年前就验证过 ...

2月17日上午，月之暗面研究员Flood Sung分享了k1.5模型背后的思考过程，并表示2024年OpenAI o1发布的效果让他思考了Long-CoT的有效性。月之暗面Kimi联合创始人Tim周昕宇在一年多前验证过，通过训练小模型做运算并合成长的CoT数据，可以获得良好效果。公司意识到Long Context的重要性，开始考虑将Context搞长。尽管Long-CoT成本较高且速度慢，但Flo ...

智东西 on MSN5 天

最强开源短剧创作模型来了！33种表情、400种肢体动作，好莱坞级AI ...

当下大模型的焦点无疑是火遍全球的DeepSeek，但其本质上是纯语言模型，多模态大模型赛道的战火同样火热。

财富中文网1 天

越来越多美国人将体育博彩视为一种投资工具

许多购彩者却不这么认为。NerdWallet本月发布的一份报告称，31%的体育购彩者将其视为一种投资方式。这一比例较去年调查中的14%有所上升。最新调查还发现，美国人参与体育博彩的最常见原因是为了赚取额外收入（65%），这一比例略高于出于娱乐目的（61%），以及与亲朋好友玩乐（53%）的投注动机。

6 天

RWKV 开发者大会 2025，研讨 RWKV-7 架构与未来趋势

新一代大模型架构RWKV将于2025年2月22日在上海举办首届主题为《RWKV-7架构与未来趋势》的开发者大会，大会将深入探讨RWKV-7的独家技术亮点、应用场景以及未来趋势，展示RWKV在推动全球AI发展中的前瞻性与领导力。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果