搜索优化
English
搜索
图片
Copilot
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
6 天
on MSN
Meta AI的Llama语言模型经修改后可在有20年历史的Xbox 360上运行
开源项目llama2.c旨在完全使用C代码运行轻量级版本的Llama 2模型。 这个"婴儿"Llama 2 模型受到 llama.cpp 的启发,llama.cpp 是一个为在从本地设备到云平台等各种硬件上实现 LLM 推理而创建的项目。
腾讯网
9 天
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
来自MSN
10 天
清华团队靠强化学习让 7B 模型打败GPT-4o数学推理
近日,清华大学 NLP 实验室联合上海 AI Lab,清华大学电子系及 OpenBMB 社区提出一种新的结合过程奖励的强化学习方法—— PRIME(Process Reinforcement through IMplicit REwards),采用 PRIME 方法,研究人员不依赖任何蒸馏数据和模仿学习,仅用 8 张 A100,花费一万块钱左右,不到 10天 时间,就能高效训练出一个数学能力超过 ...
10 天
清华团队依靠强化学习成功打造超越GPT-4o的7B模型Eurus-2-7B-PRIME
近日,清华大学自然语言处理(NLP)实验室联合上海AILab和清华大学电子系,以及OpenBMB社区,成功提出了一种新的强化学习方法——PRIME(Process Reinforcement through Implicit ...
13 天
AI机器人会考试,不会看病
一项新研究发现,虽然先进的人工智能(AI)模型在专业医学考试中得分很高,但在通过与患者交谈从而诊断疾病方面仍然不及格。1月2日,相关研究成果发表于《自然-医学》。 美国哈佛大学的Pranav ...
13 天
先进的人工智能模型居然不会“问诊”
一项新研究发现,虽然先进的人工智能(AI)模型在专业医学考试中得分很高,但在医生最重要的任务之一 ——与患者交谈以收集相关医疗信息并提供准确诊断方面,仍然表现不佳。1月2日,相关研究成果发表于《自然-医学》。
13 天
仅需一万块钱!清华团队靠强化学习让7B模型数学打败GPT-4o
采用PRIME方法,研究人员不依赖任何蒸馏数据和模仿学习,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过 GPT-4o、Llama-3.1-70B的7B模型 Eurus-2-7B-PRIME。
新浪网
23 天
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10 ...
直观地从钱上来对比就是,训练671B的DeepSeek V3的成本是557.6万美元(约合4070万人民币),而只是训练一个7B的Llama 2,就要花费76万美元(约合555万 ...
eeworld.com.cn
26 天
2025年,自动驾驶即将开“卷”的端到端大模型2.0 - VLA
Llama 2 7B作为语言模型的主干,根据对接上的信息,预测标记化的输出动作。这些标记被解码为可直接在机器人上执行的连续输出动作。 OpenVLA 是开源的,目前不少公司应该都基于他在进行研究,来找VLA应用和商业落地的方法。以上两个为影响比较大的,除了上面 ...
51CTO
1 个月
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B
图2:扩展一致性 左图展示7B和0.5B与其他规模的LLM的相关系数 ... 在多项多模态榜单上超越了其他同级模型。 Meta的LLaMA模型开源,让文本大模型迎来了StableDiffustion时刻。今天,斯坦福发布了一个由LLaMA7B微调的模型Alpaca,训练3小时,性能比肩GPT3.5。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈