以往的数据仓库会还是使用关系型数据库的思路像目前用的多的是redshift就基本和Postgres数据库类似当然功能更强大
数据湖是非结构化的分布式存储比如presto就是你可以把数据按照文件形式存储在文件系统上然后使用Hadoop的生态结构就可以做查询相比数据仓库的做法这种非结构化的存储比较自由给业务的数据分析提供了一些技术上的便利性
在应用方面数据湖的角色和数据仓库一样是拉平业务数据库的数据支持后续的数据建模的
首页 >
以往的数据仓库会还是使用关系型数据库的思路像目前用的多的是redshift就基本和Postgres数据库类似当然功能更强大
数据湖是非结构化的分布式存储比如presto就是你可以把数据按照文件形式存储在文件系统上然后使用Hadoop的生态结构就可以做查询相比数据仓库的做法这种非结构化的存储比较自由给业务的数据分析提供了一些技术上的便利性
在应用方面数据湖的角色和数据仓库一样是拉平业务数据库的数据支持后续的数据建模的