下一代 Kylin:更强大和易用的 OLAP
01 Apache Kylin 的今天目前,Apache Kylin 的最新发布版本是 4.0.1。 Apache Kylin 4.0 是 Kylin 3.x(HBase Storage)版本后的一次重大版本更新,Kylin 4 使用 Parquet 这种真正的列式存储来代替 HBase 存储,从而提升文件扫描性能;同时,Kylin 4 重新实现了基于 Spark...
View ArticleThe future of Apache Kylin:More powerful and easy-to-use OLAP
01 Apache Kylin TodayCurrently, the latest release of Apache Kylin is 4.0.1. Apache Kylin 4.0 is a major version update after Kylin 3.x (HBase Storage). Kylin 4.0 uses Parquet to replace HBase as...
View ArticleKylin 4 now is supporting AWS Glue Catalog
Why does installing Kylin on EMR need to support AWS Glue?What is AWS Glue?AWS Glue is a fully hosted ETL (Extract, Transform, and Load) service that enables AWS users to easily and cost-effectively...
View Article安排!Kylin 4 现已支持 AWS Glue Catalog
为什么在 EMR 部署 Kylin 需要支持 Glue ?什么是 AWS Glue?AWS Glue 是一项完全托管的 ETL(提取、转换和加载)服务,使 AWS 用户能够轻松而经济高效地对数据进行分类、清理和扩充,并在各种数据存储之间可靠地移动数据。AWS Glue 由一个称为 AWS Glue 数据目录的中央元数据存储库、一个自动生成代码的 ETL...
View ArticleHow to use Excel to query Kylin? MDX for Kylin!
AbstractDuring the Kylin community discussion at the beginning of this year, we talked about the positioning of multidimensional databases and the idea of building a Kylin-based business semantic...
View Article如何使用 Excel 查询 Kylin?MDX for Kylin!
Kylin 为什么需要 MDX?多维数据库和业务语义层多维数据库与关系型数据库的关键区别在于业务表达能力。尽管 SQL 表达能力很强,是数据分析师的基本技能,但如果以 “人人都是分析师” 为目标,SQL 和关系数据库对非技术人员还是太难了。从非技术人员的视角,数据湖和数据仓库就好似一个黑暗的房间,知道其中有很多数据,却因为不懂数据库理论和...
View ArticleKylin on Cloud —— 两小时快速搭建云上数据分析平台(上)
背景Apache Kylin 是基于预计算和多维模型的多维数据库,支持 SQL 标准查询接口,在 Kylin 中用户可以通过创建 Model 定义表关系,通过创建 Cube 定义维度和度量,然后构建 Cube 对需要聚合的数据进行预计算,将预计算好的数据保存起来,用户执行查询时便可以直接在经过预计算的数据上进行进一步的聚合或者直接返回查询结果,成倍提升查询效率。随着 Kylin 4.0...
View ArticleKylin on Cloud —— 两小时快速搭建云上数据分析平台(下)
以下部分为 Kylin on Cloud —— 两小时快速搭建云上数据分析平台的下篇,上篇请查看:Kylin on Cloud —— 两小时快速搭建云上数据分析平台(上)Kylin 查询集群启动 Kylin 查询集群1.在启动构建集群时使用的 kylin_configs.yaml 的基础上,打开 mdx 开关:ENABLE_MDX: &ENABLE_MDX...
View ArticleKylin on Cloud — Build A Data Analysis Platform on the Cloud in Two Hours Part 1
Video TutorialsKylin on Cloud — Build A Data Analysis Platform on the Cloud in Two Hours Part 1BackgroundApache Kylin is a multidimensional database based on pre-computation and multidimensional...
View ArticleKylin on Cloud — Build A Data Analysis Platform on the Cloud in Two Hours Part 2
This is the second part of the blog series, for part 1, see :Kylin on Cloud — Build A Data Analysis Platform on the Cloud in Two Hours Part 1Video TutorialsKylin on Cloud — Build A Data Analysis...
View Article