Databricks声称DBRX为开源大型语言模型设定了“一个新标准”

news/2024/7/10 21:22:08 标签: 开源, 语言模型, 人工智能

Databricks宣布推出DBRX,这是一款强大的新开源大型语言模型,据称它通过在行业基准测试中超越了像GPT-3.5这样的既定选项,为开放模型设定了新的标准。

该公司表示,具有1320亿参数的DBRX模型在语言理解、编程和数学任务上超越了流行的开源LLM,如LLaMA 2 70B、Mixtral和Grok-1。它甚至在某些基准测试中超过了Anthropic的闭源模型Claude。

DBRX在编码任务中展示了开放模型中的最先进性能,即使作为一个通用LLM,也击败了像CodeLLaMA这样的专业模型。它在几乎所有评估的基准测试中匹配或超过了GPT-3.5。

这种最先进的能力得益于更高效的专家混合架构,使DBRX的推理速度比LLaMA 2 70B快达2倍,尽管活跃参数更少。Databricks声称训练该模型的计算效率也比密集型替代品高出约2倍。

“DBRX为开源LLM设定了一个新标准——它为企业提供了一个平台,基于他们自己的数据构建定制化的推理能力,”Databricks联合创始人兼CEO Ali Ghodsi表示。

DBRX在预训练上使用了大约12万亿个“精心策划”的文本和代码数据,挑选这些数据是为了提高质量。它在预训练期间利用了旋转位置编码和课程学习等技术。

客户可以通过API与DBRX交互,或使用公司的工具在其专有数据上微调模型。它已经开始整合到Databricks的AI产品中。

“我们的研究显示,企业计划将一半的AI预算用于生成式AI,”Ventana Research的执行董事Dave Menninger表示,Ventana Research是ISG的一部分。“他们面临的前三大挑战之一是数据安全和隐私。

“通过端到端的数据智能平台和DBRX的引入,Databricks使企业能够构建受管控、安全且根据其业务背景定制的生成式AI应用程序,同时在整个过程中保持对其知识产权的控制和所有权。”

包括埃森哲、Block、纳斯达克、Prosus、Replit和Zoom在内的合作伙伴称赞DBRX有助于加速企业采用开放、定制化的大型语言模型。分析师表示,这可能促使从闭源向开源转变,因为经过微调的开放模型达到了专有性能。

纳斯达克的AI和数据服务负责人Mike O’Rourke评论道:“Databricks是纳斯达克在一些最重要的数据系统上的关键合作伙伴。他们继续处于管理数据和利用AI行业的前沿,我们对DBRX的发布感到兴奋。

“强大的模型性能和有利的服务经济学是我们在纳斯达克增长我们对生成式AI使用时所寻求的那种创新。”

你可以在Hugging Face上找到DBRX的基础和微调模型。项目的GitHub还有更多资源和代码示例。


http://www.niftyadmin.cn/n/5464457.html

相关文章

Python 潮流周刊#44:Mojo 本周开源了;AI 学会生成音乐了

△△请给“Python猫”加星标 ,以免错过文章推送 你好,我是猫哥。这里每周分享优质的 Python、AI 及通用技术内容,大部分为英文。本周刊开源,欢迎投稿[1]。另有电报频道[2]作为副刊,补充发布更加丰富的资讯,…

vue记事本渲染以及交互

以下是记事本的源码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>记事本</title><styl…

Meta Pixel:助你实现高效地Facebook广告追踪

Meta Pixel 像素代码是用來衡量Facebook广告效果的一个官方数据工具&#xff0c;只要商家有在Facebook上投放广告就需要串联Meta Pixel 像素代码来查看相关数据。 它本质上是一段 JavaScript 代码&#xff0c;安装后可以让用户在自己网站上查看到访客活动。它的工作原理是加载…

2024最新GPT4.0使用教程:GPTs,AI绘画,AI换脸,AI绘画,文档分析一站式解决

一、前言 ChatGPT3.5、GPT4.0、相信对大家应该不感到陌生吧&#xff1f;简单来说&#xff0c;GPT-4技术比之前的GPT-3.5相对来说更加智能&#xff0c;会根据用户的要求生成多种内容甚至也可以和用户进行创作交流。 然而&#xff0c;GPT-4对普通用户来说都是需要额外付费才可以…

华为数通方向HCIP-DataCom H12-821题库(多选题:241-260)

第241题 [RTAospf100 [RTA-ospf-100]silent-intefaceGigabitEthernet 1/0/0上面是路由器RTA的部分配置,对于此部分的配置描述,正确的是: A、接口gigabitethemet 1/0/0的直连路由仍然可以发布出去 B、无法与该接口的直连邻居形成邻居关系 C、禁止接口gigabi tethemet 1/0/0发…

Rust---有关介绍

目录 Rust---有关介绍变量的操作Rust 数值库&#xff1a;num某些基础数据类型序列(Range)字符类型单元类型 发散函数表达式&#xff08;&#xff01; 语句&#xff09; Rust—有关介绍 得益于各种零开销抽象、深入到底层的优化潜力、优质的标准库和第三方库实现&#xff0c;Ru…

【核心复现】同时考虑考虑孤岛与重构的配电网故障恢复运行策略

目录 主要内容 内容详情 1.问题引出 2.可控负荷 3.网络拓扑约束 4.算法流程 结果一览 1.原文结果 2.程序运行结果 下载链接 主要内容 该模型复现文章《同时考虑考虑孤岛与重构的配电网故障恢复运行策略》&#xff0c;以IEEE33配电网为分析对象&#xff0c;…

Linux查询mac物理地址

方法一&#xff1a;通过/sys文件系统 /sys文件系统提供了一种访问和控制硬件设备的方法。 可以在/sys/class/net/目录下找到每个网络接口的详细信息。 cat /sys/class/net/eth0/address 将eth0替换为您想要查询的网络接口名称。这将输出该接口的MAC地址。 方法二&#xff1a;…