2025年2月26日,微软在其官方网站上正式开源了一款名为Magma的多模态AI Agent,这是一个具有突破性意义的基础模型,与传统的智能体相比,Magma聚焦于跨越数字与物理世界的多模态能力。它不仅能够处理图像、视频和文本等多种形式的数据,还能够自动执行多种复杂任务,比如下电商订单、查询天气,甚至可以操控实体机器人,辅佐用户在线下进行真实象棋比赛。此举无疑为人工智能的应用领域注入了一剂强心针。
据介绍,Magma使用大规模异构视觉语言(VL)数据集预训练,包含3900多万条样本,覆盖图像、视频以及机器人动作轨迹等多种形式,并采用ConvNeXt-XXL作为视觉骨干网络和Llama-3-8B作为语言模型。
微软开源的多模态AI Magma模型最近引发了广泛关注。这款模型不仅能够处理图像、视频和文本等多种数据类型,还能够跨越数字和物理世界,实现复杂任务的自动化处理。例如,用户可以利用Magma自动下单购物、查询天气,甚至操控实体机器人。这种跨领域的信息融合能力,让Magma在多个场景中展现了强大的应用潜力。那么,这款AI模型到底有哪些值得关注的亮点?它又将如何改变我们的生活?让我们一起来探讨一下。
(吉隆坡22日讯)联大集团(MAGMA,7243,主板消费股)宣布获得股东批准, 以8000万令吉收购吉隆坡Persiaran ...
IT之家 2 月 26 日消息,北京时间今日凌晨,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多 ...
IT之家 2 月 26 日消息,北京时间今日凌晨,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多 ...
来自MSN24 天
微软推出Magma:多模态AI Agent,跨越数字物理世界的新助手微软在科技界再次投下震撼弹,于近日凌晨三点,于其官方网站上宣布了一项重大决定:将多模态AI Agent基础模型Magma面向全球开源。这一举措不仅 ...
来自MSN24 天
微软开源Magma AI模型:跨数字物理世界,多模态能力引关注微软在科技领域再度迈出重要一步,近日在其官方网站上宣布开源了一款名为Magma的多模态AI Agent基础模型。这款模型的问世,标志着AI技术在处理跨 ...
在米兰的秀场上,Etro品牌以“Etro Magma”这一主题展现了设计师Marco DeVincenzo对传统时尚的重塑。这场秀将古罗马斗兽场的穹顶投影在地面,模特们则 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果