微软发布Phi-3 Vision等最新大模型系列
相信很多大家对微软发布Phi-3 Vision等最新大模型系列还不知道吧,今天菲菲就带你们一起去了解一下~.~!
站长之家(ChinaZ.com)5月22日 消息:微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。
Phi-3Medium14B 型号的性能与Mixtral8x22B和Llama370B相当,甚至超过了Command R+104B和GPT3.5。这表明微软的这个模型在大型模型领域具有较强的竞争力。
Phi-3Small7B 型号虽然规模较小,但其性能依然超过了Mistral7B和Llama38B,这使得它在需要处理大量数据但计算资源有限的场景下具有潜在的应用价值。
Phi-3系列模型支持的上下文长度为4K和128K,这为处理长文本数据提供了灵活性。模型规模方面,Medium版本为14B参数,Small版本为7.5B参数,而Vision版本则为4.2B参数。
在训练数据方面,微软使用了4.8T(万亿)令牌对模型进行训练,训练过程持续了42天,使用了512个H100GPU。训练数据集包含了10%的多语言数据,并且采用了经过严格过滤的数据和合成数据,特别是科学和编程教材,这可能有助于模型在这些领域的特定任务上表现更好。
微软还为Phi-3系列引入了一个新的分词器,拥有10万词汇量,这有助于模型更好地理解和生成语言。此外,Phi-3模型的权重兼容AWQ、INT4、ONNX和transformers,这为开发者提供了在不同平台上部署和运行模型的灵活性。
总体而言,微软的Phi-3系列模型在大型语言模型领域展现了强大的性能和灵活性,为研究人员和开发者提供了新的工具和可能性。随着这些模型的发布,我们可以期待在自然语言处理和相关领域出现新的创新和应用。
模型地址:https://top.aibase.com/tool/phi-3-vision-128k-instruct
以上就是关于【微软发布Phi-3 Vision等最新大模型系列】的相关内容,希望对大家有帮助!
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【空谷幽兰是什么意思】“空谷幽兰”是一个富有诗意的成语,常用来形容在偏僻、冷清的地方生长的兰花。它不仅...浏览全文>>
-
【空格怎么打出来】在日常使用电脑或手机输入文字时,经常会遇到需要输入“空格”的情况。虽然看似简单,但很...浏览全文>>
-
【空格怎么打】在日常使用电脑或手机时,很多人会遇到“空格怎么打”的问题。其实,“空格”是一个非常基础的...浏览全文>>
-
【空格名字怎么打】在日常使用电脑或手机时,很多人会遇到“空格名字怎么打”的问题。尤其是在输入法设置、文...浏览全文>>
-
【空格键是指的哪一个】在日常使用电脑或手机的过程中,我们经常接触到各种按键,其中“空格键”是一个非常基...浏览全文>>
-
【空挡是什么意思】“空挡”是一个在多个领域中常见的术语,尤其在汽车驾驶、机械操作以及一些比喻性表达中使...浏览全文>>
-
【空城旧梦是情侣网名吗】“空城旧梦”这个词语,听起来充满了诗意和情感色彩。它常被用于表达一种孤独、怀念...浏览全文>>
-
【可吸收线是什么颜色】在医学领域,尤其是外科手术中,可吸收线是一种常见的缝合材料。它主要用于缝合伤口,...浏览全文>>
-
【可为是什么意思】“可为”一词源自中文,常用于表达“可以做”、“值得做”或“有作为”的含义。在不同语境...浏览全文>>
-
【可微与可导之间有什么联系】在微积分的学习过程中,“可导”和“可微”是两个经常被提到的概念,它们看似相...浏览全文>>