关于数据网格
这个词是由Zhamak Dehghani创造的, 数据网格是基于现代的一种新方法, 用于分析数据管理的分布式架构.
开始学习
学习OS Trino
开源分布式SQL引擎,用于对各种数据源(从千兆字节到pb)运行快速分析查询.
开始学习
学习OS Presto®
Presto最初是由脸谱网开发的,用于扩展他们所需的数据大小和性能.
开始学习
数据湖
什么是数据湖? 数据湖是一个数据存储库,它可以包括结构化数据、半结构化数据和…
了解更多
数据Lakehouse
什么是数据湖? 数据湖是一种数据平台架构范例,它结合了数据湖的各个方面……
了解更多
ETL /英语教学
什么是ETL和ELT? ETL(提取、转换、加载)和ELT(提取、加载、转换)是两种常见的数据处理方法。
了解更多
数据管道
数据管道通过执行一系列处理步骤将数据从一个位置移动到另一个位置.
了解更多
工程数据
数据工程师设计, 构建, 并支持数据管道,将原始数据从收集点移动到...
了解更多
查询引擎
查询引擎接受对数据的请求, 把它从人类语言翻译成机器语言, 然后满足请求...
了解更多
数据产品
数据产品将精心策划的数据集与api结合起来,将原始数据转换为适合下游用户使用的产品.
什么是数据产品?
数据民主化
数据民主化使员工能够快速安全地访问数据,以便他们能够分析数据并做出数据驱动的决策.
了解更多
数据质量
数据质量是指数据的状态, 反映在它的准确性上, 完整性, 可靠性, 相关性, 和及时性.
了解更多
SQL
结构化查询语言(SQL)是一种查询语言,用于访问和管理存储在数据库管理系统(DBMS)和几乎所有关系数据库管理系统(RDBMS)中的数据。.
了解更多
数据库
数据库是为计算机快速搜索和检索而组织的大量数据集合.
了解更多
数据库管理系统(DBMS)
数据库管理系统(DBMS)用于管理数据库,并允许用户创建数据库, 读, 更新, 删除, 并在数据库中保护数据.
了解更多
数据仓库
数据仓库是专门构建的数据库系统,它帮助数据使用者使用当前和历史数据来生成洞察,从而为业务决策提供信息, 包括商业活动的报告和预测.
数据仓库
云对象存储vs HDFS
对象存储与HDFS形成对比,应该被理解为一种替代技术. 重要的是,对象存储不是文件系统. 与HDFS不同,它不将数据存储在文件中.
了解更多
蜂巢
Apache 蜂巢是一个建立在Apache Hadoop之上的数据仓库系统,它使数据消费者能够查询和分析存储在Hadoop分布式文件系统和其他文件系统中的大型数据集.
了解更多
分布式数据
分布式数据是一种将数据存储在其所在位置的实践, 通过单点访问增强业务分析能力.
了解更多
数据治理
数据治理是数据管理学科中的一个概念,它对组织的数据及其生命周期采取了一种全面的方法:数据摄取, 数据目录, 保留, 存储管理, 分享, 存档, 备份, 复苏, 损失预防, 删除和删除.
了解更多
数据沿袭
数据沿袭是在原始数据从其源流出时生成的元数据, 通过中间数据库, 数据仓库或数据湖, 然后是商业报告和分析.
了解更多
Hadoop
Apache Hadoop是一个用于存储和处理大型数据集的开源框架.
了解更多