从零开始的 dbt 入门教程 (dbt cloud 自动化篇)-五、dbt cloud 环境配置

时间:2024-03-31 19:09:39

为什么要介绍环境配置呢?因为 dbt cloud 的自动化任务的载体就是环境,后续所有的自动化任务都是在某个环境中创建,毕竟任务总得区分环境,以及知道要基于哪个分支拉取代码等等。

5.1 关于 dev 环境

前文已经提到,dbt cloud 默认已经为你创建了一个 dev 环境,而且你至多只能拥有这一个 dev 环境,如果你喜欢在 cloud IDE 做项目开发,那么 dev 环境你还是需要做少许配置。
请添加图片描述
请添加图片描述
让我们进入 dev 环境配置,在这里你可以设置默认的项目分支,因为我们提到 IDE 也能自动同步 GitHub 代码,那么这里的默认分支就是告诉 IDE 默认拉取哪个分支的代码,其次让我们把目光看到 profile page,点击此配置,你可以看到在我们创建第一个 dbt cloud 项目时关于继承 bigquery 的相关配置,所以前文也说, 如果你需要后续再修改那么可以在这里进行修改,比如你希望修改 dev 模式下 Dataset 的字段。

5.2 关于 production 环境

现在,让我们直接创建属于自己的 production 环境,由于与 dev 配置选项大体相同,这里我就不再截图展示了,你需要将 Custom branch 设置为你希望的 GitHub 主分支,比如你是 main 就设置为 mian,是 master 就设置 master,后面当自动化脚本运行时,所做的第一件事就是基于你在这配置的分支名做代码领取,再基于这个分支的 model 做更新。

其次,关于 Dataset 我们也介绍了,如果你有做项目工程化配置需要做 model 写入的数据集区分,这里你需要将 Dataset 设置成与你 profiles 中完全相同的字段。