• NoSQL 和数据仓库

    NoSQL and Data Warehousing | Architects Zone 数据仓库是将从多个不同来源的数据结合成一个综合且易于操作的数据库,访问数据仓库系统普通方式是查询,分析

    10 年 前

  • 数据湖 vs 数据仓库 vs 数据库

    对于外行来说,数据存储通常在传统数据库中处理。但是对于大数据,公司使用数据仓库和数据湖。   什么是数据库? 数据库是存储结构化数据的存储位置。我们通常会想到计算机上的数据库——保存数据

    2 年 前

  • 数据仓库正在消亡 - John Foley

    沃尔玛建立了一个成为业界热议的数据仓库,部分原因是它是世界上最大的数据仓库之一,还因为沃尔玛正在使用该系统进行市场购物篮分析、销售历史、库存和其他商业智能,这家零售商以超前的战略与供应商和合作伙伴

    1 年 前

  • Netflix如何使用bulldozer从数据仓库批处理数据转移到键值存储?

    AWS S3中的数据仓库表。 Iceberg 在Netflix中作为数据仓库表格式被广泛采用,该格式解决了Hive表的许多 可用性 和性能问题。 在Netflix,我们还广泛采用强调关注点分离的

    3 年 前

  • 转享:MapReduce vs Data Warehouse

    MapReduce云计算和数据仓库比较 MapReduce vs Data Warehouse : on target 现在使用 Hadoop 进行数据挖掘和计算已经是下一步新选择,这篇

    10 年 前

  • 数据仓库中维度建模

    数据仓库有很多定义,现在最重要的两个是: Ralph Kimball 对数据仓库的定义 数据仓库是专门为查询和分析而构建的事务数据的副本。 Bill Inmon 对数据仓库

    1 年 前

  • 数据湖+数据仓库 = 数据湖库架构

    传统OLAP和OLTP是分离,数据是从业务数据存储库中提取,然后将其存储在数据湖中,下一步就是进行ETL数据提取转换和分析,然后,将这些数据的关键子集转移到数据仓库中,以生成用于决策的业务洞察力

    2 年 前

  • 亚马逊 Redshift 死了吗?

    AWS Redshift 是最早的云数据仓库之一,可以说是 Hadoop 之后的一代。Amazon Redshift 是云中完全托管的 PB 级数据仓库服务。该服务适用于小至几百 GB 的

    1 年 前

  • 使用PostgreSQL作为数据仓库 - narrator

    在人工智能公司 Narrator 支持许多数据仓库,包括Postgres。尽管它是为生产系统而设计的,但稍作调整后,Postgres可以非常好地用作数据仓库。   总结: 不要使用与生产系统

    3 年 前

  • 什么是反向 ETL?概述、用例和主要优点

    在不断发展的数据工程领域,反向 ETL 已成为企业利用其数据仓库和其他数据平台超越传统分析的关键流程。反向 ETL 或反向“提取、转换、加载”是将数据从集中式数据仓库或数据湖移动到数据管道内的

    3 周 前

  • Claimforce为何使用湖仓统一数据湖和数据仓库?

    在 Claimforce,我们最初的大数据方法是一个两层 架构 ,包括 Amazon S3 中的数据湖阶段和 Amazon Redshift 中的数据仓库阶段( 此处 概述)。随着时间的推移

    1 年 前

  • 机器学习的静态特征和动态特征

    应用中发射事件。我们将这些数据推送到Kafka主题。 数据被推送到一个对象存储中,以加载到数据仓库。 数据被加载到数据仓库中,进行转换。 我们对数据仓库内的数据进行建模,为特征工程做准备

    1 年 前

  • 使用Slonik框架基于Node.js和PostgreSQL处理大量数据

    几次迭代,但是它是PostgreSQL的最佳Node.js客户端。 Slonik已通过大数据量和从简单的CRUD操作到数据仓库需求的查询进行了严格的测试。 点击标题见原文

    4 年 前

  • 使用Hadoop+Hbase+Hive+SpringBatch实现数据仓库

    使用 Hadoop +Hbase+Hive+SpringBatch实现数据仓库(Datawarehouse implementation using

    10 年 前

  • ETL专业人员应该学习Hadoop的5个理由

    作为提取、转换和加载 (ETL) 处理的临时平台,Hadoop 在数据仓库中的重要性正在迅速发展。提到 ETL,Hadoop 被视为数据准备和转换的逻辑平台,因为它允许他们完美地管理大量、多样性和

    2 年 前