tableau关于数据源的保存和发布的要点

介绍:保存和发布数据源、关于文件类型的注释、联接类型及并集

保存和发布数据源

编辑发布的数据源

  • 要注意在编辑已发布数据源,我们需要连接到原始数据源。

关于文件类型的注释

  • twb 是一种工作簿,其信息仅涉及如何连接数据和生成视图。不包含数据
  • .tde 是一种数据提取文件。这种文件在从 .twb 工作簿创建数据提取的时候生成,系统会提示用户选择.tde 的保存位置
  • .tde 几乎可以连接到任何其他数据源,并可以独立于工作簿
  • .tde 仅仅是数据的本地副本,以便于在 Tableau 中分析的格式保存。
  • .twbx 是一种打包工作簿。仅仅保存 .twbx 并不能自动包含数据。但如果将工作簿保存为 .twbx 且随后提取数据,则打包工作簿将包含数据提取而不生成独立的 .tde。数据是“包”的一部分。
  • .tds 文件是一种 Tableau 数据源。它并不包含真实数据,而是包含关于数据连接(例如联接和数据源的位置)和元数据(例如分层结构、计算和颜色)的信息。
  • .tds 在用户将内容“添加到已保存数据源”时生成。与 .tde 一样,系统也会提示用户选择 .tds的保存位置
  • 保存 .tds 文件时,用户可以选择将文件类型更改为 .tdsx。这是打包数据源,本质上是一个 .tds 和一个.tde。打包数据源包含所有元数据信息和数据本身。将 .tdsx 发送给某人就意味着同时向此人发送了数据(未加密)和元数据
  • 但共享数据访问权限的最简单方法就是发布数据源。

联接类型及并集

联接类型

  • 内联接:内联接仅保留具有相同关键字段的行
  • 左联接:左联接是拉取左侧表中的所有行,然后在适当时填充右侧表;如果右侧表中没有对应数据,则填入 null。
  • 右联接:与左联接呈现相反。
  • 外联接:外联接将合并所有表中列出的所有数据,如果该行的给定列上没有对应信息,则填入null。

并集

  • 并集是合并两个或以上表的另一种方法。联接以水平方式将列添加到现有表,并集则以垂直方式将行添加到现有表。
  • 注意,可对引入数据源页面的特定文件执行并集,或通过目录执行通配符搜索。
  • Tableau 执行“全部并集”操作,就是说即使某些行存在重复值,也将在并集中返回所有行。
  • 在 Tableau 中,会生成带表名的新字段,用于指示并集数据源的相关元数据。
  • 如果并集数据源中的字段名称不匹配,Tableau 将发挥类似外联接的作用,即追加新行和新列,必要时插入 null。如果新列应归为同一字段,则可将这些列合并在数据网格中。

参考来源


YouYou-Chen

陈柔银,学生(网络与新媒体专业)中山大学南方学院