DeepSeek以“AI大模型圈黑马“迅猛崛起,如何以低成本推出顶级模型?开源与闭源的选择会成为AI行业未来趋势吗?DeepSeek的成功是否意味着中国在AI领域赶超美国?欧洲AI领域为何相对落后?Jina AI创始人肖涵博士在德国之声专访中分享了他对DeepSeek在技术创新、商业策略上的看法,并探讨了中美在AI发展中的角色与分工。
随着Qwen(吴恩达团队已经用了几个月)、Kimi、InternVL和DeepSeek等模型的推出,中国在文本模型上的差距正在缩小,而在视频生成等领域,中国甚至已经展现出了一些领先优势。 受到美国AI芯片禁令的影响,DeepSeek团队不得不在性能相对较低的H800 GPU上跑模型,而这也推动了他们在优化方面的大量创新。最终,模型训练成本(不包括研究成本)不到600万美元。
一开始便对DeepSeek赞赏有加的英伟达,刚刚宣布:「DeepSeek-R1正式登陆NVIDIA NIM」。 据介绍,在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达3,872 Token/秒。
Zhaoyang Wang | Chief Editor, GenAI Assembling Zack Li | Co-founder & CTO, Nexa AI Xiyue (Anderson) Xiang | Principle Member ...