资讯

【新智元导读】悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。
在科技日新月异的今天,人工智能(AI)正以惊人的速度影响着社会的方方面面。尤其是在推理能力方面,不同模型的竞争愈演愈烈。近日,UCSD研究团队通过经典游戏《逆转裁判》将当前顶级AI模型置于法庭上进行较量,作为评测推理极限的舞台。这场AI之间的推理对决如同悬疑小说的最后一页,真相在谎言的交织中逐渐浮现。
Google周三(4/16)宣布视频生成模型Veo 2提供给Gemini Advanced,以图片生成8秒视频的Whisk Animate服务也上线。Google One AI Premium方案已可使用两种服务。 Veo是Google对OpenAI ...
IT之家 4 月 17 日消息,谷歌今日宣布,其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。该功能能够实时识别并回应关于用户手机摄像头和屏幕上的内容,本月早些时候为所有 Pixel 9 和三星 Galaxy S25 ...
以上demo中,不难看出GPT-4.1的编码性能确实非常惊艳,但从宏观来看,仍不如Gemini 2.5 Pro、Claude 3.7 Sonnet。 Abacus.AI创始人Bindu ...
aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球第一,口碑一众超越Claude 3.7 Sonnet。 为了强调Gemini 2.5 Pro成本优势,Jeff Dean还附上了超详细TOP ...
近期,科技领域迎来了一波新的模型发布高潮,其中OpenAI推出的GPT-4.1系列模型尤为引人注目。据bleepingcomputer报道,这一最新版本相较于其前身GPT-4o,在性能上实现了显著飞跃。
IT之家 4 月 16 日消息,科技媒体 bleepingcomputer 昨日(4 月 15 日)发布博文,报道称 OpenAI 最新发布的 GPT-4.1 系列模型,其性能相比 GPT-4o 虽然实现重大飞跃,但多项跑分未能超越谷歌的 ...
编辑:桃子 好困 【新智元导读】DeepMind内部研究要「封箱」了!为保谷歌在AI竞赛领先优势,生成式AI相关论文设定6个月禁发期。不仅如此,创新成果不发,Gemini短板不提。 DeepMind研究成果,已被按下暂停键。 FT爆料称,由Demis Hassabis领导的谷歌AI部门,正对研究论文发布实施更严格的审查机制。 总结来说,有这么几种论文不发: ...