该模型不仅在视频深度估计中(空间和时间上)获得了新的SOTA(最先进技术),而且在计算效率上也是最高的。 Depth Anything在单目深度估计中表现出色,但在视频应用中存在时间不一致性的问题,限制了其实用性。现有方法虽然尝试解决这一问题,但仅适用于短 ...
通过结合模型剪枝、知识蒸馏、细粒度合并等技术,相比传统方法以 1/30 的成本完成了 23B 宽 MoE 架构代码续写模型的训练,并在多个代码领域评测集上实现了新的 SOTA。 高质量数据:我们强调筛选和整理高质量代码、文本与合成数据,而非单纯扩大数据集规模 ...