Llama 2 7B - 搜索 News

6 天on MSN

Meta AI的Llama语言模型经修改后可在有20年历史的Xbox 360上运行

开源项目llama2.c旨在完全使用C代码运行轻量级版本的Llama 2模型。这个"婴儿"Llama 2 模型受到 llama.cpp 的启发，llama.cpp 是一个为在从本地设备到云平台等各种硬件上实现 LLM 推理而创建的项目。

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

来自MSN10 天

清华团队靠强化学习让 7B 模型打败GPT-4o数学推理

近日，清华大学 NLP 实验室联合上海 AI Lab，清华大学电子系及 OpenBMB 社区提出一种新的结合过程奖励的强化学习方法—— PRIME（Process Reinforcement through IMplicit REwards），采用 PRIME 方法，研究人员不依赖任何蒸馏数据和模仿学习，仅用 8 张 A100，花费一万块钱左右，不到 10天时间，就能高效训练出一个数学能力超过 ...

10 天

清华团队依靠强化学习成功打造超越GPT-4o的7B模型Eurus-2-7B-PRIME

近日，清华大学自然语言处理（NLP）实验室联合上海AILab和清华大学电子系，以及OpenBMB社区，成功提出了一种新的强化学习方法——PRIME（Process Reinforcement through Implicit ...

13 天

AI机器人会考试，不会看病

一项新研究发现，虽然先进的人工智能（AI）模型在专业医学考试中得分很高，但在通过与患者交谈从而诊断疾病方面仍然不及格。1月2日，相关研究成果发表于《自然-医学》。美国哈佛大学的Pranav ...

13 天

先进的人工智能模型居然不会“问诊”

一项新研究发现，虽然先进的人工智能（AI）模型在专业医学考试中得分很高，但在医生最重要的任务之一 ——与患者交谈以收集相关医疗信息并提供准确诊断方面，仍然表现不佳。1月2日，相关研究成果发表于《自然-医学》。

13 天

仅需一万块钱！清华团队靠强化学习让7B模型数学打败GPT-4o

采用PRIME方法，研究人员不依赖任何蒸馏数据和模仿学习，仅用8张A100，花费一万块钱左右，不到10天时间，就能高效训练出一个数学能力超过 GPT-4o、Llama-3.1-70B的7B模型 Eurus-2-7B-PRIME。

新浪网23 天

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10 ...

直观地从钱上来对比就是，训练671B的DeepSeek V3的成本是557.6万美元（约合4070万人民币），而只是训练一个7B的Llama 2，就要花费76万美元（约合555万 ...

eeworld.com.cn26 天

2025年，自动驾驶即将开“卷”的端到端大模型2.0 - VLA

Llama 2 7B作为语言模型的主干，根据对接上的信息，预测标记化的输出动作。这些标记被解码为可直接在机器人上执行的连续输出动作。 OpenVLA 是开源的，目前不少公司应该都基于他在进行研究，来找VLA应用和商业落地的方法。以上两个为影响比较大的，除了上面 ...

51CTO1 个月

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

图2：扩展一致性左图展示7B和0.5B与其他规模的LLM的相关系数 ... 在多项多模态榜单上超越了其他同级模型。 Meta的LLaMA模型开源，让文本大模型迎来了StableDiffustion时刻。今天，斯坦福发布了一个由LLaMA7B微调的模型Alpaca，训练3小时，性能比肩GPT3.5。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果