国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10

2024-10-16 14:00:50 来源：用户：

相信很多大家对国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10还不知道吧，今天菲菲就带你们一起去了解一下~.~！

国产大模型首次在公开榜单上超过GPT-4o!

就在刚刚，“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning（闪电）。

在大模型竞技场（Chatbot Arena）上，Yi-Lightning性能直冲总榜单并列第6，数学分榜并列第3，代码等其它分榜也名列前茅。

总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平，超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude3.5Sonnet等顶流。同时，国内清华系大模型公司智谱AI的GLM-4-Plus也杀进了总榜，位居第9位。

该榜单结果来自全球累积超千万次的人类用户盲测投票。

前段时间大模型竞技场还刚刚更新了规则，新榜单对AI回答的长度和风格等特征做了降权处理，分数更能反映模型真正解决问题的能力。

这次Yi-Lightning杀出重围，Lmsys团队特意发帖子，称这是竞技场上的大新闻:

大模型竞技场总榜第六、国产第一

细看大模型竞技场分类榜上的“赛况”，Yi-Lightning各项能力都排在前头。

在中文能力上，Yi-Lightning和GLM-4-Plus两个国产大模型都名列前位。

Yi-Lightning跃居并列第二，和o1-mini相差无几。

数学能力，Yi-Lightning和Gemini-1.5-Pro-002并列第3，仅次于o1-preview、o1-mini。

代码能力Yi-Lightning排名并列第4。

另外在Hard Prompts和Longer Query分榜，Yi-Lightning也都排在第4位。

最后同样值得关注的是，竞技场新功能风格控制过滤，确保分数反映模型真正解决问题的能力，而不是用漂亮的格式、增加回答长度。

在对长度和风格等特征做了降权处理后，所有模型分数均有下降，Yi-Lightning排名变化不大，整体还与GPT-4o、Grok-2同一梯队。

发布会上，零一万物创始人兼CEO李开复博士展示了Yi-Lightning在不同场景上的能力。

Yi-Lightning主打一个“推理速度更快，生成质量更好”。

相比上半年Yi-Large，Yi-Lightning首包速度提升1倍，推理速度也提升了4成。

像是翻译下面这种文学作品，Yi-Lightning不仅速度更快:

而且用词更精准，更具文学色彩:

那么Yi-Lightning是如何做到的?

好用还得极速

Yi-Lightning采用MoE混合专家模型架构。

底层技术上，Yi-Lightning在以下方面进行了提升。

首先是优化混合注意力机制（Hybrid Attention），只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention)。

由此以来，模型在保证处理长序列数据高性能表现的同时，还能大大降低推理成本。

Yi-Lightning还引入了跨层注意力（Cross-Layer Attention， CLA），允许模型在不同的层次之间共享键(Key)和值(Value)头，减少对存储需求。

这使得Yi-Lightning能在不同层次之间更有效地共享信息。

总的来说，KV cache缩小了2-4倍，同时将计算的复杂度从O（L²）降至O(L)。

其次，Yi-Lightning还采用了动态Top-P路由机制。

也就是说，Yi-Lightning可以根据任务的难度动态自动选择最合适的专家网络组合——

训练过程中会激活所有专家网络，使模型能学习到所有专家知识;而推理阶段，根据任务的难度，模型会选择性激活更匹配的专家网络。

另外，之前有一些传言称国内大模型“六小强”，有一些已经不做预训练了，李开复博士这次在发布会上直接“辟谣”:

而且在模型预训练阶段，团队还积累了丰富的多阶段训练方法，将整个训练分为两块，一块做好以后就把它固定起来，然后在这个固定的模型上再做后段训练。

训练前期，更注重数据多样性，使得Yi-Lightning尽可能学习不同的知识;训练后期更重内容更丰富、知识性更强的数据。

同时团队还在不同阶段采用不同的batch size和LR schedule保证训练速度和稳定性。

李开复博士还表示，零一万物开发模型讲究“模基共建”，也就是共建模型和基础架构。

模型的训练、服务、推理设计，与底层的AIInfra架构和模型结构必须高度适配。

这样做的目的，不仅是让模型更好，而且让它在推理的时候能够更便宜。

再加上以上种种抬升“性价比”的技术加持，所以Yi-Lightning这次也是打到了白菜价——

0.99元每1M token

在中文等方面，Yi-Lightning比肩OpenAI的o1-mini，o1-mini的定价是每百万输入3美元，每百万输出12美元。

Yi-Lightning每百万token只需0.99RMB也是打到了骨折。

但李开复博士表示，即便这样也:不亏钱。

除了发布新模型，零一万物这次还首发了AI2.0数字人方案。

目前该数字人已接入Yi-Lightning，实时互动效果相比以往更强更自然了，belike:

最后谈起和国外头部大模型的差距，李开复博士表示这次Yi-Lightning的排名证明了国产大模型跟硅谷最顶尖模型的差距缩小到了五个月。

参考链接:

[1]https://x.com/lmarena_ai/status/1846245604890116457

[2]https://x.com/01AI_Yi/status/1845776529185476613

以上就是关于【国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10】的相关内容，希望对大家有帮助！

标签：国产大模型竞技场首超GPT-4o！零一万物GLM共同跻身Top10

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

分享：

相关阅读

董明珠曾喊话雷军给股民分多少钱！格力：拟分红超55亿

Epic喜+1：动作游戏《师父》免费领立省139元

雷军辟谣只招聘35岁以下员工：仅针对未来之星项目

普华永道发布2025年AI预测：AI Agents将劳动力提升1倍

雷军回应股价暴跌：年年难过年年过

一天100座！理想汽车第1700座超充站正式建成

《守望先锋》国服宣布2月19日回归：账号数据完整保留

雷军建议创业者要多留点钱给员工：别到山穷水尽才讲问题

雷军新年第一天收到200元红包自侃年入百万的开始

雷军亲自展示REDMI Turbo 4！2025年第一款新机

雷军：小米未来10年建至少20座世界顶级工厂

雷军辟谣只招聘35岁以下员工：只有招聘未来之星时才有年龄限制

雷军回应100亿造车：没有好到“封神” 不要神话我

雷军表态：一心做好小米汽车大家可以在“许愿池”寻找商机

雷军：中国汽车产业应少些歪门邪道不要发黑稿、背后捅刀子

小米SU7选配色都是7000元为什么璀璨洋红却需要9000元

最新文章

空调外机声音大是什么问题

【空调外机声音大是什么问题】空调在使用过程中，如果发现外机发出异常的噪音，可能会让人感到困扰。空调外机...浏览全文>>

空调外机声音大如何解决

【空调外机声音大如何解决】空调在使用过程中，外机发出较大的噪音是很多用户遇到的常见问题。这不仅影响居住...浏览全文>>

空调外机清洗方法是什么

【空调外机清洗方法是什么】空调外机是空调系统中非常重要的组成部分，它的清洁程度直接影响到空调的制冷效果...浏览全文>>

空调突然不制冷的原因

【空调突然不制冷的原因】当家中的空调突然不再制冷时，不仅影响使用体验，还可能带来一定的安全隐患。了解空...浏览全文>>

空调铜管什么作用

【空调铜管什么作用】空调在现代生活中扮演着越来越重要的角色，尤其是在夏季高温时，它为我们提供了舒适的室...浏览全文>>

空调铜管结霜怎么回事

【空调铜管结霜怎么回事】空调在使用过程中，有时会出现铜管结霜的现象，这不仅影响制冷效果，还可能对设备造...浏览全文>>

空调铜管结霜是什么原因

【空调铜管结霜是什么原因】当空调运行时，如果发现室内机的铜管出现结霜现象，这不仅影响制冷效果，还可能对...浏览全文>>

空谷幽兰是什么意思

【空谷幽兰是什么意思】“空谷幽兰”是一个富有诗意的成语，常用来形容在偏僻、冷清的地方生长的兰花。它不仅...浏览全文>>

空格怎么打出来

【空格怎么打出来】在日常使用电脑或手机输入文字时，经常会遇到需要输入“空格”的情况。虽然看似简单，但很...浏览全文>>

空格怎么打

【空格怎么打】在日常使用电脑或手机时，很多人会遇到“空格怎么打”的问题。其实，“空格”是一个非常基础的...浏览全文>>

大家爱看

空调铜管什么作用

空格怎么打

空格键是指的哪一个

可微与可导的关系

科技感十足的公司名称公司起名

考研难考吗

康复医院是做什么的

康复学专业考研学校

开通国际漫游多少钱一个月

开通电信Volte功能免费吗

频道推荐

空调铜管结霜是什么原因

空格名字怎么打

可微与可导之间的联系是什么

科技工业是什么

科技发展给生活带来的好处

考研歧视最严重的高校

康复理疗师证书哪里颁发

康复考研最好的学校有哪些

卡姐新歌wap原版歌词介绍

卡机嘛韩语的意思

站长推荐

空调突然不制冷的原因

空格怎么打出来

空城旧梦是情侣网名吗

可吸收线是什么颜色

可微与可导之间有什么联系

康复是什么意思

康复评定包括哪5个方面

开通QQ十周年黄钻是不是可以永久使用十周年黄钻标志

卡路里和焦耳怎么换算

卡乐购是什么意思

卡拉瓦乔代表作

巨鳄的电影有什么

巨大的英语是什么

禁闭岛的结局真相

靳东个人资料

靳东的妹妹为什么叫高露

金枝玉叶繁殖方法

金针菜和黄花菜是一种吗

金吉鸟健身私教一般多少

戒指戴什么手指好