First GPU - 搜索 News

资讯

9 天

该联盟于2024 年 5 月由一群供应商成立，其中包括 AMD、AWS、博通、思科、谷歌、HPE、英特尔、Meta、微软和 Astera Labs，他们认为世界需要一个 Nvidia NVLink 技术的开放替代方案，以允许创建运行大规模 AI ...

11 天

实测焱融存储：推理性能提升13倍，延时缩短超4倍

测试结论：在长上下文场景中，使用YRCloudFileKVCache可实现高达 13 倍的 TTFT 性能提升。这一显著优化得益于其高效缓存命中率和对大规模数据的快速处理能力，为大模型推理提供了更优的性能支持。

14 天

推理性能提升13倍，延时缩短超4倍｜实测 YRCloudFile KVCache

DeepSeek 引爆大模型在千行百业落地的背景下，存储与计算的协同优化正成为企业提升 AI 推理效率、降低运营成本的关键。KVCache 技术通过“以存换算”的创新模式，显著提升了推理性能，成为企业构建大模型基础设施的必要选择。此前，焱融科技率先推出 YRCloudFile 分布式文件系统的 KVCache 特性，支持 PB 级缓存扩展，大幅提高 KV ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

资讯

今日热点