postgres_data_modeling

时间:2024-04-05 01:42:09
【文件属性】:

文件名称:postgres_data_modeling

文件大小:1.08MB

文件格式:ZIP

更新时间:2024-04-05 01:42:09

JupyterNotebook

Udacity数据工程师项目1 为“ Sparkify”创建一个postgres数据库 Sparkify是一家(虚构的)初创公司,提供音乐流媒体服务。 它们累积数据,但尚未利用它们。 该存储库中记录的我的工作是建立ETL管道。 数据存储在文件夹data/中的json文件中。 有两种文件, log_file和songs_file 。 我建立了一个星形架构,其中包含四个维度表和一个事实表。 数据库是关系型的; 我正在使用PostgreSQL。 我将从json文件中获取原始数据,并将它们组织成四个表。 这四个表将成为尺寸表。 它们将成为中间事实表的基础:Songplays表。 以下是数据和架构的概述: 原始数据 图表 song_data log_data ETL流程 尺寸表 基于两个原始表,我将创建四个维度表: 使用者 歌曲 艺术家 时间 users和songs均基于songs_dat


网友评论