
5月9日的Home报道说,阿里巴巴开设了零核心模型,该模型正式表示可以激发搜索功能而无需查看。它附在该模型的引入到该模型上:我们建议对称为Zerosarch的强化研究来提高大语模型(LLM)的搜索功能,而不是依靠真实的搜索引擎。基于管理的微调,我们将LLM更改为搜索模块,该模块可以生成相关或嘈杂的文档以响应查询。为了更好地刺激该模型的推理能力,我们引入了一种课程开发机制,通过允许该模型处理更复杂的采集任务来逐渐发展其思考能力。我们在许多领域内外进行了在数据集上进行了广泛的实验,结果表明,ZeroSarch表明,Zerosarch优于基于搜索引擎的模型,而无需任何API费用。此外,它通常与不同的llms的基本和教学良好ENT鳞片并支持不同的增强研究算法。正式披露的信息表明,在7架问答数据集评论中,其性能比Google搜索相当甚至超过Google搜索(与Google 32.47相比,70亿款参数标记为33.06),并且成本降低了87.93%。通过SEPAPI对Google搜索进行64,000个查询的培训近586.70美元,而使用模拟的LLM在四个A100 GPU上进行培训,其中14B参数的价值仅增加了70.80美元。目前,ZeroSearch已被许多基本家庭(例如QWEN-2.5,LLAMA-3.2等)证明。打开源地址:https://github.com/alibaba-nlp/zerosarch