资讯
新智元报道 编辑:LRS 【新智元导读】Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度 ...
【新智元导读】谷歌发布首款混合推理模型Gemini 2.5 Flash,引入了革命性「思考预算」,可灵活控制推理深度,性能一举击败Claude 3.7,比肩o4-mini。而且,关闭思考模式成本直降600%。
凤凰网科技讯(作者/杨睿琪)4月15日,国内人工智能公司智谱(Zhipu AI)正式推出新一代开源大模型GLM-4-32B-0414系列。该系列 ...
上线的推理模型分为三个版本,分别满足不同场景需求: GLM-Z1-AirX(极速版):定位国内最快推理模型,推理速度可达 200 tokens/秒,比常规快 8 倍 ...
一、前言经过长达五个月的“供货紧张”后,AMD锐龙7 9800X3D处理器终于迎来现货供应,目前我们已经无需预约即可直接购买这款备受期待的“游戏神U”,至于是否与近期GS大战直接相关我们就不去乱加猜测了。最近,我也攒了一台心水已久的9800X3D主机 ...
黄仁勋在会上表示,作为深耕中国市场三十载的企业,英伟达与中国市场共同成长、相互成就。其还认为,中国不仅是全球最具规模的消费市场之一,其蓬勃发展的产业生态与领先的软件实力,更成为公司持续创新的重要动力。黄仁勋还表示,英伟达将继续不遗余力优化符合监管要求 ...
万车网 on MSN3 天
上海车展上汽大众前瞻:首款增程概念车来袭,定位全尺寸SUV!2025年上海车展即将拉开帷幕,作为两年举办一次的汽车行业盛会,此次车展吸引了众多车企携重磅新车亮相。上汽大众… ...
近日,科技巨头 OpenAI 宣布收购初创公司 Context.ai 团队,这一举措旨在提升其 AI 模型的评估与分析能力。Context.ai 成立于2023年,由前谷歌员工 Henry Scott-Green 和 Alex Gamble 共同创办 ...
该服务在保证单用户20 TPS水平前提下,单卡Decode吞吐突破1920 Tokens/s,可比肩H100部署性能 ... 或蒸发冷干冷器、管路预制、二次侧的CDU、二次侧环网、Manifold等产品。此外,与H公司合作紧密,预期随着H公司的Al算力设备出货量的增加,申菱环境液冷产品的应用 ...
近日,一段京东创始人、董事会主席刘强东2024年内部讲话的线上会议视频流出。刘强东谈到:“我给京东外卖定一条规矩,京东外卖永远赚的净利润不允许超过5%。超过5%,我要处分人的。我们一定要在行业里面,按照三毛五的理论,来约束自己的赚钱能力、赚钱欲望。” ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果