网站首页

b体育产品中心

智能终端处理器 智能云服务器 软件开发环境

b体育新闻中心

关于b体育

公司概况 核心优势 核心团队 发展历程

联系我们b体育

官方微信

官方微博

b体育·(中国)官方入口在线登录网站 > b体育新闻中心

15T内存挑战英伟达8枚芯片撑起3个GPT-B体育4华人AI芯片独角兽估值365亿

发布时间：2023-09-22 19:38浏览次数：来源于：网络

　　B体育高端GPU持续缺货之下，一家要挑战英伟达的芯片初创公司成为行业热议焦点。
　　型号中40代表是他们第四代产品，L代表专为大模型（LLM）优化：高达1.5T的内存，支持25.6万个token的序列长度。
　　CEORodrigo Liang表示，当前行业标准做法下运行万亿参数大模型需要数百枚芯片，我们的方法使总拥有成本只有标准方法的1/25。
　　SambaNova目前估值50亿美元（约365亿人民币），累计完成了6轮总计11亿美元的融资，投资方包括英特尔、软银、三星、GV等。
　　他们不仅在芯片上要挑战英伟达，业务模式上也说要比英伟达走的更远：直接参与帮助企业训练私有大模型。
　　最新产品SN40L，由台积电5纳米工艺制造，包含1020亿晶体管，峰值速度638TeraFLOPS。
　　Rodrigo Liang表示，虽然DRAM速度更慢，但专用的软件编译器可以智能地分配三个内存层之间的负载，还允许编译器将8个芯片视为单个系统。
　　除了硬件指标，SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速。
　　他们找到一种软件层面的加速办法，与调度和数据传输有关，但没有透露细节B体育，“我们还没准备好向公布是如何做到这一点的”。
　　GPU的架构非常严格，面对图像、视频、文本等多样数据时可能不够灵活，而SambaNova可以调整硬件来满足工作负载的要求。
　　目前，SambaNova的芯片和系统已获得不少大型客户，包括世界排名前列的超算实验室，日本富岳、美国阿贡国家实验室、劳伦斯国家实验室，以及咨询公司埃森哲等。
　　业务模式也比较特别，芯片不单卖，而是出售其定制技术堆栈，从芯片到服务器系统，甚至包括部署大模型。
　　为此，他们与TogetherML联合开发了BloomChat，一个1760亿参数的多语言聊天大模型。
　　训练过程中，它使用了SambaNova独特的可重配置数据流架构，然后在SambaNova DataScale系统进行训练。
　　这也是这家公司最大被投资者热捧之外的最大争议点之一，很多人不看好一家公司既做芯片又做大模型。
　　他认为大模型与生成式AI商业化的下一个战场是企业的私有数据B体育，尤其是大企业。
　　他们认为最终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型，而是根据不同数据子集创建150个独特的模型，聚合参数超过万亿。
　　在企业运转的每个节点运行一个完整且经过专门调整的基础模型，分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库B体育、客户支持语料库等等不同数据训练。
　　这些专家模型之间通过一种软件路由或负载平衡器联在一起，收到推理请求后决定具体向哪个模型推送提示词。
　　这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比，巨头大多希望创建一个能泛化到数百万个任务的巨型模型。
　　分析师认为技术上可能谷歌的做法性能更强，但SambaNova的方法对企业来说更实用。
　　没有任何一个模型或人能完整访问企业的所有数据，限制每个部门能访问的专家模型，就能限制他们能访问的数据。
　　联创3人都是斯坦福背景，连产品系列名Cardinal（深红色）都是斯坦福的昵称与代表颜色。
　　CEO Rodrigo Liang是前Sun/甲骨文工程副总裁，也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue（深蓝）。
　　CTOKunle Olukotun是电气工程教授，因多核芯片架构方面的研究而闻名，开发了首批支持线程级推测 (TLS) 的芯片之一。
　　Christopher Ré是计算机科学副教授，重点研究方向机器学习和数据分析的速度和可扩展性B体育。
　　Jonathan Chang，拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。
　　他在构建高增长方面拥有20多年的经验。加入SambaNova之前，Chang在特斯拉工作了近9年。
　　Marshall Choy，此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁，监督了数十个行业的企业硬件和软件产品的上市。
　　Penny Li，在EDA工具和微处理器设计方面拥有超过27年的经验。此前B体育，她曾在IBM和甲骨文工作过。
　　目前SambaNova包含SN40L芯片的人工智能引擎已上市，但定价没有公开。
　　根据Rodrigo Liang的说法，8个SN40L组成的集群总共可处理5万亿参数，相当于70个700亿参数大模型。
　　全球2000强的企业只需购买两个这样的8芯片集群，就能满足所有大模型需求。

下一篇：B体育欧洲传来芯片大消息！美股跳水全球市场下挫…俄罗斯突发：限制汽油、柴油出口
上一篇：高端芯片国产化能带来什么？B体育

咨询我们

输入您的疑问及需求发送邮箱给我们

相关新闻推荐

隔离器／固B体育态继电器 2023-10-04

B体育用10分钟为你科普芯片的知识 2023-10-04

B体育什么叫芯片芯片的作用 2023-10-04

芯B体育片是什么？ 2023-10-04

theme=liB体育 2023-10-04

芯片B体育是什么做的是干什么用的 2023-10-04

简历投递

admin@jlhaixin.com

商务合作

admin@jlhaixin.com

媒体垂询

admin@jlhaixin.com

b体育产品中心: 智能终端处理器智能云服务器软件开发环境

b体育新闻中心

关于b体育: 公司概况核心优势核心团队发展历程

关注腾讯

微信二维码

微博二维码

Copyright © 2002-2023 b体育·(中国)官方入口在线登录网站版权所有备案号：吉ICP备2021007224号