首页 >> 今日更新 >

大型科技公司拥才有承担 AI 训练数据成本的能力

2024-06-03 10:01:06 来源: 用户: 

相信很多大家对大型科技公司拥才有承担 AI 训练数据成本的能力还不知道吧,今天菲菲就带你们一起去了解一下~.~!

站长之家(ChinaZ.com)6月3日 消息:AI 的发展离不开数据,而这种数据的成本越来越高,这使得除了最富有的科技公司外,其他公司难以承担这一成本。根据去年 OpenAI 的研究人员 James Betker 的文章,AI 模型的训练数据是决定模型能力的关键因素。传统的 AI 系统主要是基于统计机器,通过大量示例来猜测最 “合理” 的数据分布,因此模型所依赖的数据量越大,性能就越好。

AI 研究非营利机构 AI2的高级研究科学家 Kyle Lo 指出,Meta 的 Llama3模型在数据量方面明显优于 AI2的 OLMo 模型,这解释了其在许多流行 AI 基准测试中的优势。然而,并不是数据量越大,模型性能就会线性提升,数据质量和整理同样重要,有时甚至比数量更重要。一些 AI 模型是通过让人类标注数据来进行训练的,质量较高的标注对模型性能有巨大影响。

然而,Lo 等专家担心,对大型、高质量训练数据集的需求将 AI 发展集中在少数具备数十亿美元预算的公司手中。尽管一些非法甚至犯罪行为可能会对数据获取方式提出质疑,但技术巨头凭借资金实力能够获取数据许可。这些数据交易的过程并未促进一个公平开放的生成式 AI 生态系统,让整个 AI 研究社区备受其害。

一些独立、非营利性的组织尝试开放大规模数据集,如 EleutherAI 和 Hugging Face,但它们是否能赶上大型科技公司的步伐仍是一个未知数。只有当研究突破技术壁垒,数据收集和整理成本不再是问题时,这些开放性的数据集才有希望与科技巨头竞争。

以上就是关于【大型科技公司拥才有承担 AI 训练数据成本的能力】的相关内容,希望对大家有帮助!

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
  • 【空谷幽兰是什么意思】“空谷幽兰”是一个富有诗意的成语,常用来形容在偏僻、冷清的地方生长的兰花。它不仅...浏览全文>>
  • 【空格怎么打出来】在日常使用电脑或手机输入文字时,经常会遇到需要输入“空格”的情况。虽然看似简单,但很...浏览全文>>
  • 【空格怎么打】在日常使用电脑或手机时,很多人会遇到“空格怎么打”的问题。其实,“空格”是一个非常基础的...浏览全文>>
  • 【空格名字怎么打】在日常使用电脑或手机时,很多人会遇到“空格名字怎么打”的问题。尤其是在输入法设置、文...浏览全文>>
  • 【空格键是指的哪一个】在日常使用电脑或手机的过程中,我们经常接触到各种按键,其中“空格键”是一个非常基...浏览全文>>
  • 【空挡是什么意思】“空挡”是一个在多个领域中常见的术语,尤其在汽车驾驶、机械操作以及一些比喻性表达中使...浏览全文>>
  • 【空城旧梦是情侣网名吗】“空城旧梦”这个词语,听起来充满了诗意和情感色彩。它常被用于表达一种孤独、怀念...浏览全文>>
  • 【可吸收线是什么颜色】在医学领域,尤其是外科手术中,可吸收线是一种常见的缝合材料。它主要用于缝合伤口,...浏览全文>>
  • 【可为是什么意思】“可为”一词源自中文,常用于表达“可以做”、“值得做”或“有作为”的含义。在不同语境...浏览全文>>
  • 【可微与可导之间有什么联系】在微积分的学习过程中,“可导”和“可微”是两个经常被提到的概念,它们看似相...浏览全文>>