【资料图】
1月13日,记者从南京农业大学(以下简称“南农”)获悉,该校主导研发出国内首个面向通用农业领域的开源垂直大语言模型“司农”。这标志着南农在农业领域的人工智能基础模型研究与应用取得新突破。
据悉,研究团队依托南农学科优势,收集了包括动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等学科数据,涵盖了近9000册书籍、24万余篇学术论文和近2万份政策、标准,构建了体系相对完整的农业基础数据集。
针对大语言模型在专业领域应用中常见的“幻觉问题”和知识滞后性,团队在模型训练阶段,除微调传统指令外,还引入了思维链和上下文参考等多维训练数据,显著提升了模型对于农业专业知识的理解与生成能力。
针对文献知识利用效率问题,团队推出多智能体检索增强框架。该框架通过优化知识库构建、智能查询改写、混合检索等策略,使模型能够精准调用专业知识,有效保障了生成内容的准确性与时效性。
目前,司农大语言模型已在魔塔社区和GitHub社区全面开源,发布了8B和32B两种参数规模的版本。这一开源开放策略,旨在降低农业AI应用门槛,助力广大科研机构、企业和开发者基于司农大语言模型进行二次开发与创新应用,共同培育智慧农业的应用生态。