《动手学大模型》系列编程实践教程,由上海交通大学2024年春季《人工智能安全技术》课程(NIS3353)讲义拓展而来(教师:张倬胜),旨在提供大模型相关的入门编程参考。通过简单实践,帮助同学快速入门大模型,更好地开展课程设计或学术研究。 微调与 ...
在探索知识的海洋中,简单性的力量与优雅是人类永恒的追求。14世纪的方济会修士威廉·奥卡姆,以其著名的“奥卡姆剃刀”原理,向世界展示了这一真理的核心。这一原理,源自拉丁语:“Numquam ponenda est pluralitas sine ...
近日,英伟达开源了一款名为 Sana 的图像生成模型,这一模型仅有0.6亿个参数,极大降低了运行门槛。 据了解,Sana 能够生成4096×4096分辨率的图像,并且可以在16GB 的显卡上运行,不到1秒的时间内生成1024×1024分辨率的高质量图片,这一速度在同类模型中表现突出。
恭喜你的孩子已经拥有了媲美古代先贤们的思维。古代世界的大部分智者都倾向认为不是地球自转,而是日月群星,整个宇宙都在围绕地球转,为此还发展出许多有意思的解释。可以把相关的故事分享给ta,让ta结合现代解释细品其中的奥妙所在~ 日月五星的左、右旋 ...
但若从物理的现实层面去考量,难题远比数学模型复杂 ... 一个显而易见的例子便是“地心说”。现代人对这一观点感到不可思议,然而对于古人 ...
中国的 OpenAI,出现了。 对标 OpenAI o1 正式版的国产大模型来了! 1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源 ...
今天是假期的最后一天,许多人或许已经在返工的路上,你是在回味过年的幸福点滴,还是在思考新一年的目标与规划?在这承上启下的时刻,小北想为你的新一年带来一些精神食粮——那些在过去一年荣登各大年度榜单的好书。它们不仅凝聚了作者和编辑的思想与创意,也反映了一 ...
近日,中国初创企业DeepSeek开发的大语言模型(LLM)DeepSeek-V3引发美欧业界广泛关注,该模型在技术性能、开源模式、成本效益等方面的突出表现获得 ...
大模型行业面临商业价值验证,探索盈利模式。 能带来收入增长和利润的商业模式是新的行业焦点,大模型公司都要做好准备。 如果用一些关键词 ...
2025年,大模型产业在争议中进入新的一年。 一方面,过去一年,大模型深入到人们的生活和工作,每个人都感受到它的威力。OpenAI的月活已达到5-6 ...
国产AI视频生成平台Vidu近日正式揭晓了其最新研发成果——Vidu 2.0大模型。该平台宣布,Vidu 2.0在视频生成效率上取得了显著突破,能够在10秒内完成一段4秒长、分辨率为512P的视频制作,且针对这一规格,即Vidu 2.0-4s-512模型,每秒钟的视频生成成本仅为4分钱。