近日,英伟达开源了一款名为 Sana 的图像生成模型,这一模型仅有0.6亿个参数,极大降低了运行门槛。 据了解,Sana 能够生成4096×4096分辨率的图像,并且可以在16GB 的显卡上运行,不到1秒的时间内生成1024×1024分辨率的高质量图片,这一速度在同类模型中表现突出。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态 ...
近日,中国初创企业DeepSeek开发的大语言模型(LLM)DeepSeek-V3引发美欧业界广泛关注,该模型在技术性能、开源模式、成本效益等方面的突出表现获得 ...
简单来说,Cosmos 是一个世界模型平台,上面有一系列开源、开放权重的视频世界模型,参数量从 4B 到 14B 不等。这些模型的作用非常明确,就是为 ...
IT之家1 月 8 日消息,科技媒体 The Verge 昨日(1 月 7 日)发布博文,报道称谷歌 DeepMind 正计划组建一支专业团队,全力打造能够模拟真实物理环境的“世界模型”。 该项目由前 OpenAI Sora 项目联合负责人 Tim Brooks 领衔,他于今年 10 月加入 DeepMind,负责谷歌的视频 ...
2025年,大模型产业在争议中进入新的一年。 一方面,过去一年,大模型深入到人们的生活和工作,每个人都感受到它的威力。OpenAI的月活已达到5-6 ...
国产AI视频生成平台Vidu近日正式揭晓了其最新研发成果——Vidu 2.0大模型。该平台宣布,Vidu 2.0在视频生成效率上取得了显著突破,能够在10秒内完成一段4秒长、分辨率为512P的视频制作,且针对这一规格,即Vidu 2.0-4s-512模型,每秒钟的视频生成成本仅为4分钱。