Databend 开源周报第 100 期

news/2024/7/10 21:08:04 标签: 开源

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

Databend v1.2 正式发布

Databend v1.2.0 已于 2023 年 6 月 29 日正式发布!感谢各位社区伙伴的参与,以及每一个让 Databend 变得更好的你!

新版本有许多新功能,包括:

  • BITMAP 数据类型
  • 使用列号直接查询 CSV/TSV/NDJSON 文件
  • 设计并实现全新哈希表大幅提升 Join 的性能
  • AI Functions
  • 计算列
  • VACUUM TABLE
  • Serverless Background Service
  • 开箱即用的 Databend Python 绑定
  • BendSQL - Databend 原生命令行工具
  • 与 Apache DolphinScheduler、Apache Flink CDC 以及 Tableau 等数据集成/商业智能工具的无缝集成

如果你想要了解更多信息,请查看下面列出的资源。

  • What's Fresh in Databend v1.2! Data + AI | Blog | Databend

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

Databend 长期运行测试

Databend 新近引入长期运行测试方案,旨在验证系统在重负载和高并发下的性能和正确性。这些测试包括并发大规模数据摄取、表维护(优化、重聚类和清理)以及查询。

测试将运行一系列 SQL 和验证命令以验证结果。整个测试从执行预测试脚本(_before.sh)开始,然后重复运行并发测试脚本,最后执行后测试脚本(_after.sh)。所有事件日志都将存储在 Databend 中,以供进一步分析。

                      +-------------------+
                      |     Long Run      |
                      +-------------------+
                               |
                               |
                               v
                  +-----------------------+
                  |  Before Test Scripts  |
                  +-----------------------+
                               |
                               |
                               v
        +----------------------------------+
        |     Concurrent Test Scripts      |
        +----------------------------------+
        |              |                   |
        |              |                   |
        v              v                   v
+----------------+ +----------------+ +----------------+
|  Test Script 1 | |  Test Script 2 | |  Test Script 3 |
+----------------+ +----------------+ +----------------+
                               |
                               |
                               v
              +-----------------------+
              |   After Test Scripts  |
              +-----------------------+

如果你想要了解更多信息,请查看下面列出的资源。

  • Databend Long Run Tests

亮点

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 为系统表 system.query_profile 增加更多执行信息,使查询调优更加方便。
  • 初步支持读取 Iceberg 表。
  • 新增 ntile 窗口函数。
  • 初步实现分布式 COPY INTO 。
  • 阅读文档 Docs | Loading Data with Tools - Addax 和 Docs | Loading Data with Tools - DataX 了解如何高效便捷导入数据。
  • 阅读文档 Docs | Working with Stages - Staging Files 了解如何使用预签名 URL 将文件上传到 Stage 中。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

发布提案:Nightly v1.3

Databend v1.3 计划于 8 月 1 日发布,主要关注稳定性提高。预期包括以下功能:

TaskStatus
(Query) JSON indexing#6994IN PROGRESS
(Query+Storage) Create index featureIN PROGRESS
(Query+Storage)Distributed COPY#8594IN PROGRESS
(Query+Storage) Distributed REPLACEPLAN
COPY returns more statusPLAN
(Query+Storage) Query apache/icebergIN PROGRESS
(Processor) OrderBy SpillIN PROGRESS
(Stability) Fast update/delete with fuse engineIN PROGRESS
(Stability) Query profilingIN PROGRESS
(Test) Longrun framework:BendRunIN PROGRESS

发布计划可能会根据开发进度有一些调整。欢迎参与讨论并提供反馈。

Issue #11868 | Release proposal: Nightly v1.3

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 Feature: Before return presign url add file exist judgement · Issue #8702 · datafuselabs/databend · GitHub 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:Releases · datafuselabs/databend · GitHub

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • Databend Website
  • GitHub Discussions
  • Twitter
  • Slack Channel

 


http://www.niftyadmin.cn/n/1561935.html

相关文章

关于Alluxio中元数据同步的设计、实现和优化

元数据同步(sync)是Alluxio中的核心功能,它使文件和目录与所在存储系统下真实的来源保持一致,进而使用户能够轻松地从Alluxio中检索出最新版的数据。同时了解内部流程对调整性能也非常重要。本文介绍了Alluxio中保持元数据同步的设计和实现。 元数据同步…

面试干货——年底干货大放送,你准备好了吗?(转)

转自:http://www.cnblogs.com/landeanfen/p/4955891.html 前言:年底了,骚年们有没有很鸡冻——年终奖有盼头了。之前在介绍事件的这篇 C#基础系列——再也不用担心面试官问我“事件”了 也 聊到了面试,引起了很多园友的共鸣。在不…

seafile学习五 之 Office文件在线编辑

生产环境下我们推荐和Office Online Server集成,支持 Office Online Server 2016 及其以上版本。在seahub_setting.py中# 先使能Office Online Server ENABLE_OFFICE_WEB_APP True填写你实际Office Online的服务器地址 OFFICE_WEB_APP_BASE_URL http://example.of…

SQL 查询尽量避免使用 IN 和 NOT IN

在编写 SQL 语句的时候大部分开发人员都会用到 IN 和 NOT IN 来辅助查询多个内容,例如查询 包含在 b 表中的 a 表数据,通常会这么来编写语句: select * from a where id in (select aid from b)这么写看似没错但世界上存在两个问题&#xff…

RavenDB 文档建模--使用 RavenDB 作为键/值存储

RavenDB 非常适合键/值存储,为了确保快速存取数据库,RavenDB 在设计的时候降低了存储和加载文档的成本,这是 RavenDB 和其他数据库相比最大的有点。 由于数据限制必须是 JSON ,因此使用 RavenDB 作为键/值存储是完全没问题的。使用…

seafile学习(六) 文件搜索、全文搜索

在seafevents.conf中,[INDEX FILES] 开启搜索功能 enabled true索引更新间隔,也就是你修改之后,10分钟后才能查到 ## The interval the search index is updated. Can be s(seconds), m(minutes), h(hours), d(days) interval10m## If true,…

RavenDB 文档建模--建模注意事项

我们在开始讲解如何在 RavenDB 中建模之前,先来看看注意事项,这些内容与我们将要辨析的模型有着直接的关系。 这里需要注意的第一点是 不要在不同应用之间建立共享数据库。很多设计者会建立共享数据库,用以在不同的应用之间共享相同的数据&am…

seafile学习(七)病毒扫描

添加以下配置项到 seafile.conf:[virus_scan] scan_command (command for checking virus) virus_code (command exit codes when file is virus) nonvirus_code (command exit codes when file is not virus) scan_interval (scanning interval, in unit of mi…