Navigation menu

新闻中心

基米

6月21日,它是从Kimi(Agent)Kimi-Researcher在20日发起的第一刻度灰度测试的月球黑暗面的官方黑暗面所学到的。 Kim-Researcher是一种新一代的代理模型,该模型基于端到端自主强化学习(端到端代理RL)技术,也是专门设计用于深入研究活动的代理产品。后来,月球的黑暗部分将逐渐打开刷新研究人员的反映,这是一种主要的预训练模型和增强研究模型。对于每个问题,研究人员都在独立计划任务实施过程,最后提供完整的结果:澄清:在理解问题时积极询问并开发更清晰的空间;深思熟虑:每项任务都是gumaabsy,平均是23个步骤,独立分类和解决需求;主动搜索:每个任务,平均74个关键字,找到206 URL,判断模型和FIL占信息质量最高内容的前3.2%,消除了冗余和低质量的信息;呼叫工具,交付结果:自由调用浏览器,代码和其他工具,原始数据过程,自动生成审核结论以及完整的交付结束。为了确保产出质量和信息范围,研究人员采用了异步实现的方法,该方法花费了更多时间来逐步推理,提取和写作内容。用户最终将获得2次交货。深度研究报告的平均长度和详细的信息和监控为10,000个单词。平均引文约为26个高质量,可追溯的资源;所有引用嵌入了主文本中,单击以跳跃,并突出显示原始文本,以便于验证和可追溯性。互动和共享的动态视觉报告结构化布局和心理图,因此可以在趋势和异常之类的重要信息上看到一眼您可以在不阅读整个文本的情况下快速理解总体结构和基本结论。支持在线生成链接和共享,以便于显示。官员宣布,在为AI设计的困难基准“人类的最后考试”中,Kim-Researcher在完全零的结构且没有过程设置下以合规性得分:Pass@1准确性:26.9%PASS@4准确性:40.17%此绩效超过Claude 4 Opus(10.7%)和Gemini 2.5 Pro(Gemini 2.5 Pro(21.6%),深度研究了。 。 Xbench Benchmark在红杉中国发行,这是一套AI审查与实际工作情况保持一致的系统的能力。 Kimi-Crookearcher在DeepSearch的工作中的平均通过率达到了69%,这导致了名单上的其他模型。 【来源:这在家】