电商运营干活分享,短视频运营,抖音运营,淘宝运营方案思路分析!

如何看待yandex开源clickhouse这个列式文档数据库?

跨境电商运营 dianshang 2℃ 0评论

如何看待yandex开源clickhouse这个列式文档数据库?

其实只是查询支持下推到各个节点,并不是真正的分布式,我猜测先做好单机在考虑完善分布式,使用和维护纯手动挡,成本略高,入坑需谨慎,数据副本确实需要zk来维护同步,数据写入基本只能batch,并且大批量数据batch 插入,如果插入频繁,容易导致数据合并功能异常,至于性能强,目前确实是单表查询比较快,列式存储,有索引相关支持,基本可以跳过大量无用数据,快那是肯定的,聚合操作单机汇总,容易蹦,c++开发也有些性能优势。

而大数据相关引擎这块做得较差,起初都是暴力扫描,近几年开始关注索引和一些信息收集统计,由于存储层用hdfs导致存储层优化有限,所以没那么彻底在存储层设计加速。

最后,任何技术都要理性看待,都有应用场景,不是万能药基本不存在,任何系统的诞生都有历史缘故,解决某类具体问题而设计,都有边界,最近社区吹的有些过了吧,对比大数据各种引擎,其实大数据数据库引擎今天来看已经比较完善,性能已经今非昔比,多年研发,那个系统引擎都在进步,都在解决难题。
https://ds.fanyaozu.com/tag/%e4%b8%ad%e5%9b%bd%e4%ba%92%e8%81%94%e7%bd%91%e7%bb%8f%e6%b5%8e%e5%b0%86%e8%bf%8e%e6%9d%a5%e7%9c%9f%e6%ad%a3%e7%9a%84%e6%98%a5%e5%a4%a9%ef%bc%81

转载请注明:电商实战教程 » 如何看待yandex开源clickhouse这个列式文档数据库?

喜欢 (0)

文章评论已关闭!