Token H - 搜索 News

资讯

新智元报道编辑：LRS 【新智元导读】Nemotron-H模型混合了Transformer和Mamba架构，使长文本推理速度提升3倍，同时还能保持高性能，开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术，进一步提高了20%推理速度 ...

2 天

谷歌首款混合推理Gemini 2.5登场，成本暴降600%！思考模式一开，直追o4 ...

【新智元导读】谷歌发布首款混合推理模型Gemini 2.5 Flash，引入了革命性「思考预算」，可灵活控制推理深度，性能一举击败Claude 3.7，比肩o4-mini。而且，关闭思考模式成本直降600%。

凤凰网5 天

智谱发布新一代开源大模型推理速度最高达200 tokens/秒

凤凰网科技讯（作者/杨睿琪）4月15日，国内人工智能公司智谱（Zhipu AI）正式推出新一代开源大模型GLM-4-32B-0414系列。该系列 ...

36氪5 天

刚刚，智谱一口气开源6款模型，200 tokens/秒解锁商用速度之最

上线的推理模型分为三个版本，分别满足不同场景需求： GLM-Z1-AirX（极速版）：定位国内最快推理模型，推理速度可达 200 tokens/秒，比常规快 8 倍 ...

腾讯网13 小时

内外兼修，9800X3D+华硕TUF X870PLUS+RTX 5080装机体验

一、前言经过长达五个月的“供货紧张”后，AMD锐龙7 9800X3D处理器终于迎来现货供应，目前我们已经无需预约即可直接购买这款备受期待的“游戏神U”，至于是否与近期GS大战直接相关我们就不去乱加猜测了。最近，我也攒了一台心水已久的9800X3D主机 ...

爱范儿2 天

英伟达黄仁勋：希望继续与中国合作

黄仁勋在会上表示，作为深耕中国市场三十载的企业，英伟达与中国市场共同成长、相互成就。其还认为，中国不仅是全球最具规模的消费市场之一，其蓬勃发展的产业生态与领先的软件实力，更成为公司持续创新的重要动力。黄仁勋还表示，英伟达将继续不遗余力优化符合监管要求 ...

万车网 on MSN3 天

上海车展上汽大众前瞻：首款增程概念车来袭，定位全尺寸SUV！

2025年上海车展即将拉开帷幕，作为两年举办一次的汽车行业盛会，此次车展吸引了众多车企携重磅新车亮相。上汽大众… ...

4 天

OpenAI收购Context.ai团队，助力AI模型评估技术升级

近日，科技巨头 OpenAI 宣布收购初创公司 Context.ai 团队，这一举措旨在提升其 AI 模型的评估与分析能力。Context.ai 成立于2023年，由前谷歌员工 Henry Scott-Green 和 Alex Gamble 共同创办 ...

搜狐5 天

华为云技术或终结算力焦虑自主可控将助力供应链放量

该服务在保证单用户20 TPS水平前提下，单卡Decode吞吐突破1920 Tokens/s，可比肩H100部署性能 ... 或蒸发冷干冷器、管路预制、二次侧的CDU、二次侧环网、Manifold等产品。此外，与H公司合作紧密，预期随着H公司的Al算力设备出货量的增加，申菱环境液冷产品的应用 ...

5 天on MSN

投资界24h | 刘强东内部讲话曝光；敦煌网在美爆火；1000亿，杭州投向 ...

近日，一段京东创始人、董事会主席刘强东2024年内部讲话的线上会议视频流出。刘强东谈到：“我给京东外卖定一条规矩，京东外卖永远赚的净利润不允许超过5%。超过5%，我要处分人的。我们一定要在行业里面，按照三毛五的理论，来约束自己的赚钱能力、赚钱欲望。” ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果