发布日期:2024-10-18 17:52 点击次数:149
国产大模子初次在公开榜单上越过GPT-4o!丝袜 内射
就在刚刚,“大模子六小强”之一的零一万物空闲对外发布新旗舰模子——Yi-Lightning(闪电)。
在大模子竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单比肩第6,数学分榜比肩第3,代码等其它分榜也名列三甲。
总收货简直与马斯克最新xAI大模子Grok-2-08-13握平,格外GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等顶流。
同期,国内清华系大模子公司智谱AI的GLM-4-Plus也杀进了总榜,位居第9位。
该榜单收尾来骄矜众累积超千万次的东说念主类用户盲测投票。
前段时刻大模子竞技场还刚刚更新了礼貌,新榜单对AI回复的长度和立场等特征作念了降权处理,分数更能反应模子真实处治问题的才智。
此次Yi-Lightning杀出重围,Lmsys团队专诚发帖子,称这是竞技场上的大新闻:
大模子竞技场总榜第六、国产第一
细看大模子竞技场分类榜上的“赛况”,Yi-Lightning各项才智齐排在前头。
在中语才智上,Yi-Lightning和GLM-4-Plus两个国产大模子齐名列前位。
Yi-Lightning跃居比肩第二,和o1-mini出入无几。
数学才智,Yi-Lightning和Gemini-1.5-Pro-002比肩第3,仅次于o1-preview、o1-mini。
代码才智Yi-Lightning名次比肩第4。
另外皮Hard Prompts和Longer Query分榜,Yi-Lightning也齐排在第4位。
终末相似值得热心的是,竞技场新功能立场界限过滤丝袜 内射,确保分数反应模子真实处治问题的才智,而不是用漂亮的体式、加多回复长度。
在对长度和立场等特征作念了降权处理后,通盘模子分数均有下落,Yi-Lightning名次变化不大,全体还与GPT-4o、Grok-2并吞梯队。
发布会上,零一万物首创东说念主兼CEO李开复博士展示了Yi-Lightning在不同场景上的才智。
Yi-Lightning主打一个“推理速率更快,生成质料更好”。
比拟上半年Yi-Large,Yi-Lightning首包速率提高1倍,推理速率也提高了4成。
像是翻译底下这种文体作品,Yi-Lightning不仅速率更快:
并且用词更精确,更具文体颜色:
探花91那么Yi-Lightning是怎么作念到的?
好用还得极速
Yi-Lightning接受MoE夹杂行家模子架构。
底层技艺上,Yi-Lightning在以下方面进行了提高。
领先是优化夹杂凝视力机制(Hybrid Attention),只在模子的部分头绪中将传统的全凝视力(Full Attention)替换为滑动窗口凝视力(Sliding Window Attention)。
由此以来,模子在保证处理长序列数据高性能阐发的同期,还能大大责备推理本钱。
Yi-Lightning还引入了跨层凝视力(Cross-Layer Attention, CLA),允许模子在不同的头绪之间分享键(Key)和值(Value)头,减少对存储需求。
这使得Yi-Lightning能在不同头绪之间更灵验地分享信息。
总的来说,KV cache减轻了2-4倍,同期将测度的复杂度从O(L²)降至O(L)。
其次,Yi-Lightning还接受了动态Top-P路由机制。
也便是说,Yi-Lightning不错把柄任务的难度动态自动遴荐最符合的行家麇集组合——
检会经由中会激活通盘行家麇集,使模子能学习到通盘行家常识;而推理阶段,把柄任务的难度,模子会遴荐性激活更匹配的行家麇集。
另外,之前有一些传言称国内大模子“六小强”,有一些照旧不作念预检会了,李开复博士此次在发布会上凯旋“辟谣”:
零一万物毫不毁灭预检会。
并且在模子预检会阶段,团队还积攒了丰富的多阶段检会关节,将通盘这个词检会分为两块,一块作念好以后就把它固定起来,然后在这个固定的模子上再作念后段检会。
检会前期,更戒备数据各种性,使得Yi-Lightning尽可能学习不同的常识;检会后期更重实质更丰富、常识性更强的数据。
同期团队还在不同阶段接受不同的batch size和LR schedule保证检会速率和强健性。
李开复博士还示意,零一万物成立模子弘扬“模基共建”,也便是共建模子和基础架构。
模子的检会、做事、推理缱绻,与底层的AIInfra架构和模子结构必须高度适配。
这么作念的场合,不仅是让模子更好,并且让它在推理的时候大约更低廉。
再加上以上各种抬升“性价比”的技艺加握,是以Yi-Lightning此次亦然打到了白菜价——
0.99元每1M token
在中语等方面,Yi-Lightning比肩OpenAI的o1-mini,o1-mini的订价是每百万输入3好意思元,每百万输出12好意思元。
Yi-Lightning每百万token只需0.99RMB亦然打到了骨折。
但李开复博士示意,即便这么也:不亏钱。
除了发布新模子,零一万物此次还首发了AI2.0数字东说念主决策。
现在该数字东说念主已接入Yi-Lightning,及时互动成果比拟以往更强更当然了,belike:
终末谈起和海外头部大模子的差距,李开复博士示意此次Yi-Lightning的名次解释了国产大模子跟硅谷最顶尖模子的差距减轻到了五个月。
去跟追上好意思国最顶尖的模子,裁减这个时刻差尽头鬈曲,要付出很大的奋勉和有独到的嘱咐。在国内不少公司齐在奋勉,“模基共建”则是零一万物我方摸索的独到旅途。
参考流通:
[1]https://x.com/lmarena_ai/status/1846245604890116457
[2]https://x.com/01AI_Yi/status/1845776529185476613
— 完 —丝袜 内射