百川智能发布Baichuan 2开源大模型_科技

　　9月6日，百川智能召开主题为“百川汇海，开源共赢”的大模型发布会，正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。

　　据介绍，Baichuan2-7B-Base和Baichuan2-13B-Base均基于2.6万亿高质量多语言数据进行训练，在保留了上一代开源模型良好的生成与创作能力，流畅的多轮对话能力以及部署门槛较低等众多特性的基础上，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

　　其中Baichuan2-13B-Base相比上一代13B模型，数学能力提升49%，代码能力提升46%，安全能力提升37%，逻辑推理能力提升25%，语义理解能力提升15%。

　　Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放，开发者通过邮件申请获得官方商用许可后，即可以免费商用。

　　大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节。每个环节都需要大量人才、算力等资源的投入，从零到一完整训练一个模型的高昂成本，阻碍了学术界对大模型训练的深入研究。

　　百川智能本次开源了模型训练从220B到2640B全过程的Check Ponit，并宣布将发布 Baichuan 2技术报告，详细介绍Baichuan 2的训练细节，帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程，更好地推动大模型学术研究和社区的技术发展。

　　百川智能由前搜狗CEO王小川创办于今年4月，已相继发布Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型，以及一款搜索增强大模型Baichuan-53B。8月31日，百川智能宣布百川大模型通过《生成式人工智能服务管理暂行办法》备案，面向公众开放。

(责任编辑：谭梦桐)

版权声明：
1.凡本网站注明“来源：中国网科技”的所有作品，均为本网合法拥有版权或有权使用的作品。
2.未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源及作者”。违反上述声明者，本网将追究其相关法律责任。

奋斗春风里

编辑推荐

浙江：科技迎新春

飞机工程师守护春运安全

高铁上添“新乘务员”

湖南首家机器人9S店开放

中国网是国务院新闻办公室领导，中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版，24小时对外发布信息，是中国进行国际传播、信息交流的重要窗口。

凡本网站注明“来源：中国网科技”的所有作品，均为本网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。

电话：0086-10-82081166-6059

传真：0086-10-82081900

邮箱：alltech@china.org.cn

官方微信

官方微博