首页 >> 今日更新 >
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
相信很多大家对有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍还不知道吧,今天菲菲就带你们一起去了解一下~.~!
10月20日消息,据媒体报道,NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。
这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。
nGPT架构的核心在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。
这种归一化处理使得输入的token在超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。
实验结果表明,nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍,具体加速效果取决于序列长度。
例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。
研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的输出预测,其中位移量由MLP和注意力模块定义。
这种方法不仅提高了训练速度,还增强了模型的稳定性。
以上就是关于【有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍】的相关内容,希望对大家有帮助!
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
分享:
相关阅读
最新文章
-
【孔子的成就简单点】孔子(公元前551年-公元前479年),名丘,字仲尼,是中国古代著名的思想家、教育家、政...浏览全文>>
-
【孔子的成就】孔子(公元前551年-公元前479年),名丘,字仲尼,是中国古代著名的思想家、教育家、政治家,...浏览全文>>
-
【空调外机声音大是什么问题】空调在使用过程中,如果发现外机发出异常的噪音,可能会让人感到困扰。空调外机...浏览全文>>
-
【空调外机声音大如何解决】空调在使用过程中,外机发出较大的噪音是很多用户遇到的常见问题。这不仅影响居住...浏览全文>>
-
【空调外机清洗方法是什么】空调外机是空调系统中非常重要的组成部分,它的清洁程度直接影响到空调的制冷效果...浏览全文>>
-
【空调突然不制冷的原因】当家中的空调突然不再制冷时,不仅影响使用体验,还可能带来一定的安全隐患。了解空...浏览全文>>
-
【空调铜管什么作用】空调在现代生活中扮演着越来越重要的角色,尤其是在夏季高温时,它为我们提供了舒适的室...浏览全文>>
-
【空调铜管结霜怎么回事】空调在使用过程中,有时会出现铜管结霜的现象,这不仅影响制冷效果,还可能对设备造...浏览全文>>
-
【空调铜管结霜是什么原因】当空调运行时,如果发现室内机的铜管出现结霜现象,这不仅影响制冷效果,还可能对...浏览全文>>
-
【空谷幽兰是什么意思】“空谷幽兰”是一个富有诗意的成语,常用来形容在偏僻、冷清的地方生长的兰花。它不仅...浏览全文>>
频道推荐