GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅
相信很多大家对GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅还不知道吧,今天菲菲就带你们一起去了解一下~.~!
Llama3.1405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。
Llama3.1开源的同一天,OpenAI也open了一回。
收到邮件的开发者们激动地奔走相告,这么大的羊毛一定要赶快薅。
另一边,GPT-4o mini在大模型竞技场LMSYS排名也出来了。
总榜单中,GPT-4o mini与GPT-4o并列第一。
Altman本尊激动地表示,我从未对任何一次评估如此兴奋过,GPT-4o mini与GPT-4o性能如此接近,而价格仅有其1/20!
同时,他表示,GPT-4o mini的微调现在上线了。
OpenAI能把如此强大的模型,放出来让大家免费用,实在是出人意料。
网友一度以为,这可能是最高级的钓鱼邮件。
每天200万token,GPT-4o mini免费微调
邮件中,OpenAI宣布现正式推出GPT-4o mini微调功能,为的是让最新小模型在特定用例上,表现更加出色。
7月23日-9月23日期间,开发者们每天可以免费使用200万训练token。
超过的部分,将会按3美元百万token收费。
到了2个月免费使用截止后,微调训练也将按照3美元百万token收费。
此外,OpenAI在邮件中给出了,每个人值得从GPT-3.5Turbo切换到GPT-4o mini的原因:
- 更实惠:GPT-4o mini的输入Token费用比GPT-3.5Turbo低90%,输出Tokens费用低80%。即使在免费期结束后,GPT-4o mini的训练成本也比GPT-3.5Turbo低一半。
- 更长的上下文:GPT-4o mini的训练上下文长度为65k Token,是GPT-3.5Turbo的4倍,推理上下文长度为128k Token,是GPT-3.5Turbo的8倍。
- 更聪明且更有能力:GPT-4o mini比GPT-3.5Turbo更聪明,并且支持视觉功能(尽管目前微调仅限于文本)。
最后,邮件中还提到,GPT-4o mini微调功能将向企业客户,以及Tier4和Tier5开发者开放,未来将逐渐扩大访问权限,扩展至所有级别的用户。
想要动手操作的小伙伴们,OpenAI已经放出了微调指南,可参见:
https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples
一部分网友对此并不看好,他们正在保存我们的数据,来训练和改进AI模型。
「又名,把你的私人数据给我,我会收你很少的钱」。
网友用例
拿到资格的网友,已经迫不及待上手测试了。
开发者使用《经济学人》风格的头条数据集,对gpt-4o mini进行了微调。
然后,他比较了gpt-4o、gpt-4o min原始模型和微调后的模型在生成头条方面的表现。
小模型霸榜,堪比GPT-4o
GPT-4o mini发布一周后,在大模型排行榜中的成绩终于出来了。
共收到了4K+用户投票,GPT-4o mini小模型直接攀升至榜首,与GPT-4o并列第一。
最最重要的是,便宜20倍!
这对于众多开发者来说,是个好消息,能够以更低的成本,搭建更强大的应用。
在数学细分领域中,GPT-4o mini的性能有所下降,排在第9。
此外,在hard prompt评测中,GPT-4o mini依旧保持了稳健的性能,实力仅次于GPT-4o、Claude3.5Sonnet。
在编码领域,GPT-4o mini同样展现出强大的能力。
关于GPT-4o mini在Arena中排名如此高的原因,很多人提出了疑问。
官方对此解释是:
- Chatbot Arena根据不同领域的人类偏好进行评估。鼓励大家不仅关注总排行榜,还要查看各个类别的排名(如数学、编码等)。
- Arena评估是实时进行的。鼓励大家在Arena中亲自对比模型,实时验证自己的假设。
- 透明性是我们的核心价值;所有代码和分析都是开源的(https://github.com/lm-sys/FastChat)。我们定期发布20%的数据,保留其余数据以避免过拟合,维护基准测试的完整性。
- 我们将根据政策发布随机的20% GPT-4o mini对战数据,大家可以亲自查看答案。
不过,另有网友认为,gpt-4o-mini的胜利是一个实质性的证据,证明了普通人并不那么聪明。
而且,这是历史上首次,AI变得足够聪明可以愚弄我们。有点疯狂,也有点具有历史意义。
参考资料:
https://x.com/moyix/status/1815840634013639086
https://x.com/HamelHusain/status/1815848198927434019
https://x.com/sama/status/1815877987696533897
https://x.com/0xSMW/status/1815869241205350641
以上就是关于【GPT-4o mini实力霸榜,限时2个月微调不花钱,每天200万训练token免费薅】的相关内容,希望对大家有帮助!
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
奔驰GLE作为豪华SUV市场中的佼佼者,凭借其卓越的性能、豪华的内饰以及宽敞的空间,吸引了众多消费者的关注。...浏览全文>>
-
在2025年,安徽阜阳地区的帕萨特新能源汽车市场表现非常活跃。作为一款备受关注的新能源车型,帕萨特新能源凭...浏览全文>>
-
近日,滁州地区的大众汽车经销商传来好消息:备受瞩目的2025款T-ROC探歌正式上市,并且以极具竞争力的价格吸引...浏览全文>>
-
在选择一款新能源汽车时,了解其价格和配置是非常重要的一步。安徽淮南地区的长安启源E07作为2024款的新车型,...浏览全文>>
-
阜阳长安启源A05作为长安汽车旗下的全新车型,自推出以来便凭借其独特的设计风格和丰富的配置吸引了众多消费者...浏览全文>>
-
阜阳长安启源A07作为一款备受瞩目的新能源车型,以其豪华配置和亲民的价格在市场上引起了广泛关注。这款车型不...浏览全文>>
-
安徽淮南威然2024款价格及配置详解随着汽车市场的不断更新换代,上汽大众旗下的MPV车型——威然(Viloran)凭...浏览全文>>
-
QQ多米新车报价2025款,买车省钱秘籍随着汽车市场的不断发展,消费者在选购车辆时不仅关注车型的性能和配置,...浏览全文>>
-
滁州途观X 2024款最新价格及买车省钱秘籍随着汽车市场的不断发展,大众途观X作为一款兼具时尚与性能的中型SUV...浏览全文>>
-
随着汽车市场的不断发展,大众蔚揽以其优雅的设计和卓越的性能赢得了众多消费者的青睐。作为一款兼具实用性和...浏览全文>>
- Nvidia DLSS 4 有望将游戏性能提高 8 倍
- 人工智能在预测自身免疫性疾病进展方面显示出良好的前景
- 心理物理实验揭示皮肤水分感知是如何改变的
- 科茨沃尔德公司庆祝圣诞节圆满成功
- 南法纳姆学校被评为萨里郡表现最好的小学
- 约克区九所小学将削减招生人数
- 松下新款电动汽车电池为 Lucid Gravity 带来 450 英里续航里程
- 泰国旅游呈现新趋势
- 研究人员找到在细胞水平上饿死前列腺癌肿瘤的新方法
- 领先的人工智能聊天机器人在测试中表现出类似痴呆症的认知能力下降
- 庞大的 Project Zomboid build 42 终于可以玩了
- Steam Replay 回归向您展示 2024 年您玩得最多的 PC 游戏
- Jollyes 推出强化的人才支持和招聘措施
- Karen Millen 与 Simon Harrison 共同推出全新高级珠宝系列
- 奇瑞风云A8L电动轿车刷新续航里程世界纪录
- 虚拟艺术家将别克 Cascada 带回 2026 款车型
- OnePlus 宣布推出新计划解决绿线问题
- OnePlus Watch 3 将拥有更大的电池和更薄的机身
- 研究人员发现可变剪接与自身免疫性疾病遗传之间的细胞类型特异性联系
- 科学家确定脑细胞类型是排尿的主要控制者