GPU Device - 搜索 News

PyTorch Profiler 性能优化示例：定位 TorchMetrics 指标收集瓶颈，优化代码 ...

在本文中，我们探讨了 TorchMetrics 的简单用法如何引入 CPU-GPU 同步事件，并显著降低 PyTorch 训练性能。通过使用 PyTorch Profiler，我们识别了导致这些同步事件的代码行，并应用了有针对性的优化来消除它们： ...

腾讯网6 天

DeepSeek绕过CUDA！为适配中国国产GPU做准备

2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified ...

6 天

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。

6 天

科学家开发快速近场动力学算法，比现有算法加速800倍

与串行程序（Serial）和 OpenMP 并行程序相比，本次算法可以分别实现高达 800 倍和 100 倍的加速。（注：串行程序，指的是按照指令顺序一个一个地执行的程序，前一个任务完成后下一个任务才会开始；OpenMP（Open ...

7 天

绕过英伟达CUDA框架！DeepSeek或将兼容国产GPU，迎接AI技术新纪元

近年来，人工智能技术发展迅猛，尤其在大语言模型（Large Language Models, LLMs）领域，各大公司纷纷角逐。近日，外媒Tom’s Hardware报道，DeepSeek公司在其最新研发的大语言模型中，成功绕过了英伟达的CUDA框架 ...

7 天

DeepSeek积极筹备适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

来自MSN7 天

DeepSeek 绕开 CUDA 垄断，针对英伟达 PTX 进行优化实现最大性能，英伟 ...

这个内容已经在X上讨论过了，很火热的问题我先翻译一下国外教授的详细回答，再讲清楚CUDA、PTX的关系。中文翻译：人们说“Deepseek 使用了 PTX，它打破了 CUDA 的护城河！”从根本上误解了这里发生的事情，以及 CUDA ...

腾讯网8 天

无需英伟达GPU！科学家开发快速近场动力学算法，比现有算法加速800倍

随着 DeepSeek 的大火，也让人们对于英伟达 GPU 及其配套的统一计算设备架构 CUDA（Compute Unified Device Architecture）有了更多了解。而在近日，深圳北理莫斯科大学杨杨副教授和合作者，围绕英伟达 GPU ...

8 天

无需购买英伟达高级GPU也能提升计算速度，科学家开发快速近场动力 ...

PD-General 能够充分利用英伟达 GPU 中的内部结构，通过读取 GPU 内部寄存器显卡，在无需更换更高级显卡的同时，就能提升计算效率，从而能够减少对于更高水平的硬件。哪怕使用普通的家用 ...

See Hua Daily News8 天

DeepSeek传为改用中国国产GPU做准备

（北京4日讯）中国AI新创公司“深度求索”（DeepSeek）开发的大语言模型绕过美国人工智慧巨头英伟达（Nvidia）的CUDA框架，据报导，DeepSeek正为未来适配中国国产GPU晶片做准备。香港星岛日报网引述中媒报导，英伟达的“统一运算架构”（Compute Unified Devi ...

orientaldaily8 天

DeepSeek传为改用中国国产GPU做准备跳出英伟达限制

（北京4日讯）中国AI新创公司“深度求索”（DeepSeek）开发的大语言模型绕过美国人工智慧巨头英伟达（Nvidia）的CUDA框架，据报导，DeepSeek正为未来适配中国国产GPU晶片做准备。香港星岛日报网引述中媒报导，英伟达的“统一运算架构”（Compute Unified Device Architecture，CUDA）能大幅降低研发大模型的难度，获全球开发商使用，让英伟达在人工智慧（ ...

星島網9 天

DeepSeek︱传为改用国产GPU做准备跳出NVIDIA限制

内地AI新创公司深度求索（DeepSeek），开发的大语言模型时，绕过美国人工智能巨头辉达（NVIDIA）的CUDA框架，有内媒报道，DeepSeek正为未来适配国产GPU晶片做准备。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果