当前位置:首页 > 股市动态 > 360智脑7B参数大模型正式开源

360智脑7B参数大模型正式开源

2024年04月12日49313

  4月12日,三六零自研人工智能大模型360智脑7B参数模型正式开源,包括4K、32K、360K三种文本长度,现已上线Github开源社区,在360K长度下,可支持50万字左右输入,三秒钟即可读完《三体》。经过与国内外同参数模型进行权威测评对比,该模型综合能力位居前三。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”,大模型行业借此可正式告别“长文本内卷”。

360智脑7B参数大模型正式开源
图片来源于网络,如有侵权,请联系删除

  目前,“长文本”已成为国产大模型技术突破点,受到行业普遍关注。据了解,360智脑此次开源的7B 360k模型,为当前国产开源模型中文本长度最长。“定360K主要是为了讨个彩头”,此前,360集团创始人周鸿祎在与知名投资人朱啸虎的对谈中透露过该大模型的相关信息,并称自己相信开源的力量。

  通过使用OpenCompass与国内外同参数模型进行对比,360智脑7B模型综合平均分可达到前三,在C-Eval、MMLU、HellaSwag、LAMBADA四个评测数据集上达到第一,充分反应出该模型在中英文知识和理解推理能力方面的能力。当前,百度“弱智吧”帖子中的问题已成为验证大模型智能性的重要参考,360智脑7B模型在相关评测中表现亮眼,侧面印证了该模型的逻辑推理能力。

  360智脑7B与同级别参数大模型能力对比评测中位居前三

  据了解,360智脑7B模型在技术实现上抛弃滑动窗口attention、跳跃attetion等有损压缩路线,采用的是超长文本的无损压缩技术。为了解决随着序列长度的增长,模型训练的复杂度平方增长的挑战,360智脑在训练长文本模型时采用了两阶段的方式进行,采用了ABF+继续预训练,以及有监督的微调加以解决,有效解决了长文本模型在训练长度和训练效率上的问题,实现了高效的长文本拓展方法。在训练效率提升之下,综合智能性多项指标测评,360智脑7B在同等参数规模的情况下拿到了国内最高分。此外,在英文原版360k大海捞针效果同样取得了98.27%的高分。

  360智脑7B大模型LongBench长文本评测得分最高

  相关人士称,360智脑7B等国产自研大模型的开源,使“长文本”成为大模型的标配,进而推动国内大模型的场景化落地,为大模型在应用层创新提供重要支撑。随着以360为代表的互联网大公司将自研大模型开源,中国大模型产业将获得进一步发展。

【责任编辑:周靖杰】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由经济快讯网发布,如需转载请注明出处。

              “360智脑7B参数大模型正式开源” 的相关文章

              权威专家支招防治“百日咳”

              权威专家支招防治“百日咳”

                新华社北京4月1日电 题:权威专家支招防治“百日咳”图片来源于网络,如有侵权,请联系删除  新华社记者李恒图片来源于网络,如有侵权,请联系删除  伴随痉挛性咳嗽和鸡鸣样吸气吼声、咳嗽持续时间长……近日,作为急性呼吸道传染病的百日咳备受关注,部分医院儿科已出现相关病例。什么是百日咳、如何传播?临床...

              世界帕金森病日:科学治疗 促进“帕友”身心健康

              世界帕金森病日:科学治疗 促进“帕友”身心健康

                新华社北京4月11日电 题:世界帕金森病日:科学治疗 促进“帕友”身心健康图片来源于网络,如有侵权,请联系删除  新华社记者徐鹏航、顾天成图片来源于网络,如有侵权,请联系删除  在我们的身边,有这样一些“帕友”——他们可能行动迟缓、肢体不协调,还可能出现手抖等症状。每年的4月11日是世界帕金森病...

              5.5G来了,你准备好了吗

              5.5G来了,你准备好了吗

                5.5G是5G到6G的过渡阶段,发挥着重要的承前启后作用。产业链上下游要做好标准、频谱、产品、应用、生态等各方面准备,让5.5G真正落地,带来更多新产品、新体验,推动行业升级,加快数智化转型。图片来源于网络,如有侵权,请联系删除  3GPP(第三代合作伙伴计划)日前敲定6G标准化时间表,第一批6...

              新华社权威快报|我国公民具备科学素质的比例达14.14%

              新华社权威快报|我国公民具备科学素质的比例达14.14%

                科学素质是国民素质的重要组成部分、社会文明进步的基础图片来源于网络,如有侵权,请联系删除  中国科协4月16日发布的第十三次中国公民科学素质抽样调查结果显示  2023年我国公民具备科学素质的比例达到14.14%  比2022年的12.93%提高了1.21个百分点  呈现提速增长趋势  多项数...

              星空有约|科普专家解析“热门”彗星的“冷知识”

              星空有约|科普专家解析“热门”彗星的“冷知识”

                新华社南京4月19日电 题:科普专家解析“热门”彗星的“冷知识”图片来源于网络,如有侵权,请联系删除  新华社记者王珏玢、邱冰清图片来源于网络,如有侵权,请联系删除  编号为12P/Pons-Brooks的彗星将于4月21日通过近日点,到达距太阳最近的位置,随后它将逐渐远离太阳,这颗彗星的观赏期...

              隔夜外盘:欧美股市收涨 纳指、标普涨超1% 大型科技股普涨

              隔夜外盘:欧美股市收涨 纳指、标普涨超1% 大型科技股普涨

                美股市场:美股三大指数集体上涨,纳指、标普涨超1%。截至当天收盘,道琼斯工业平均指数比前一交易日上涨263.71点,收于38503.69点,涨幅为0.69%;500种股票指数上涨59.95点,收于5070.55点,涨幅为1.20%;综合指数上涨245.34点,收于15696.64点,涨幅为1.5...