近日,百川智能与中国人民大学共同成立“中国人民大学—百川智能大模型联合实验室”。高瓴人工智能学院、信息学院院长文继荣教授受聘担任百川智能“首席科学家”。未来双方将发挥各自优势,持续探索大模型预训练、检索增强、智能体、多模态等多个方向的技术突破和应用创新。
据介绍,文继荣教授是国内人工智能领域里产学研“跨界”顶级AI专家之一,既拥有丰富的产业实操经验,又拥有顶尖的学术科研能力。曾任职于微软亚洲研究院,转入学界后,牵头创立了人大高瓴人工智能学院;早在2020年便带领人大团队研发了国内首个中文超大规模多模态预训练模型——“文澜”,不仅研发时间上与OpenAI的Clip同期,效果也非常接近;2023年带领团队自主研发“玉兰”系列大模型,有力地支撑了中国人民大学的跨学科研究。
此次以“首席科学家”的职务加入百川智能后,依托“大模型联合实验室”,文教授将充分发挥他多年的跨界经验,推动高瓴人工智能学院的科研能力与百川智能的技术创新应用能力深度融合,更好地探索通用人工智能的技术突破和产业价值。
高瓴人工智能学院自成立以来深耕人工智能基础理论、智能信息检索、自然语言处理、大模型等领域,其在互联网与信息检索方向连续两年位居CSrankings排行榜世界第一,人工智能领域整体实力在计算机国际权威排行榜CSRankings中位列世界第七。2023年,学院举全院之力“All in”大模型,不断完善大模型领域研究布局,目前在大模型预训练、检索增强大模型、大模型解释及对齐、大模型工具学习及大模型智能体等方向的研究上已取得一系列成果。
学院的师资力量由来自麻省理工学院、剑桥大学、卡内基梅隆大学、杜克大学等国际院校以及微软研究院、腾讯等科技企业的优秀青年科学家和国家高层次人才组成,海外名校背景师资占比约70%,其中70%的学院老师年龄小于38岁。这种年轻化的顶级研究人员配置,非常适合大模型这类变革性技术研究。
而百川智能作为国内头部大模型创业企业之一,具备从数据集构建到预训练再到应用落地的全流程创新能力,能够为模型技术创新和价值转化提供真实落地场景。成立以来,百川智能先后发布了Baichuan-7B/13B,Baichuan2-7B/13B、Baichuan2-192K、Baichuan 4、“鹏城-百川·脑海33B”等12款大模型。其中,Baichuan 4在国内权威大模型评测机构SuperCLUE的评测中,模型能力行业领先,处于国内大模型第一梯队。
双方各展所长,共同打造“大模型联合实验室”,不仅能够充分发挥高瓴人工智能研究院在人才培养和技术创新等方面的优势,还能通过百川智能丰富的产业经验和资源迅速对技术创新进行价值转化,从而形成产学研融合的良性循环,对构建国内健康的大模型生态,提升国内大模型整体竞争力都具有积极作用。
(责任编辑:王晨曦)