怎样将表格从网站导入到 Google 表格

如果您想从网络上收集信息,您不必手动将每个详细信息输入到 Google 表格中。 我们可以使用 Google 表格功能,这将使此过程更容易,任何人都可以在几秒钟内将表格从网站导入 Google 表格。 如果需要,我们还可以选择仅显示特定的列或行。 此外,我们可以过滤表格并仅将我们想要的数据添加到 Google 表格中。

所以让我们开始吧。

怎样将表格从网站导入到 Google 表格

我正在提取的数据来自 维基百科页面,但您可以在任何网站上执行相同的步骤。

1. 打开您要从中获取表格的网站。 在此处检查要从该页面复制的表的索引。 如果是页面的第五张表,则索引为5。记下这个索引,我们稍后会用到。

2. 现在从浏览器的地址栏中复制页面的 URL。

3. 打开 谷歌表格 要将表导入到的文件。

4. 将光标放在单元格上以从该位置开始导入表格。

5. 现在我们可以使用函数 =IMPORTHTML(网址、查询、索引、语言环境) 抓住那张桌子。 首先进入 =IMPORTHTML() 接着:

  • 在 URL 的位置,粘贴您之前复制的网页的 URL。
  • 在查询的地方,输入单词“table”。
  • 在索引的位置,输入该网页上表格的索引。
  • 在语言环境的位置,您可以输入您的语言偏好,例如“en_US”。 但这是可选的,您不必指定网站是否已经使用您喜欢的语言。

最终结果将如下所示。 请注意,您必须为 URL、查询和语言环境使用引号,如下所示。

=IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2)
在 Google 表格上使用 IMPORTHTML 功能

6. 完成后,按 Enter 因此 Google 表格可以从网页中获取所需的数据。

将表格从网站导入 Google 表格

就是这样,现在应该将表格导入 Google 表格。 您可以轻松导入任意数量的表格。 如果有两个以上的表并且它导入了错误的一个,则表的索引可能是错误的。 重新检查并相应地更改表的索引。

怎样重塑 Google 表格上的表格

在之前的方法中,我们已经从网站上抓取了整个表格。 但是如果你想重塑数据呢? 为了 example,您只想将部分行或列导入 Google 表格。 如果您只想过滤数据或更改表格的方向怎么办? 同样,您可以使用 Google 表格功能轻松完成所有操作。

我们将使用 QUERY(数据、查询、标题) 此处的函数可在将数据导入表格之前对其进行操作:

  • 其中data是表数据
  • 其中 query 是我们想要对该数据执行的功能
  • 其中标题是可选数字,表示数据中有多少标题行

1. 只需粘贴整个 导入HTML 作为数据发挥作用。 它应该看起来像这样。

=QUERY(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2))

3. 要仅选择特定列,请对要使用的列使用“选择”选项。 就像是 选择 col1,col2. 您需要在关闭引号中的 QUERY 函数之前添加它。 完成后,按 Enter 仅显示选定列中的数据。 我在这里不包括可选的标题编号。

=QUERY(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2), "SELECT col1, col2" )
选择要在 Google 表格上显示的列

4. 要仅选择几行,您可以使用 QUERTY 中的 Limit 和 Offset 选项。 就像是 选择 * 限制 4 偏移 2. 这里*代表所有列,LIMIT代表要复制的表数据行,OFFSET代表要在开始时留下的数据行。 因此,使用下面的函数,我们抓取所有列中的数据,但只复制 4 行,在开始时留下 2 作为偏移量。

=QUERY(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2), "SELECT * LIMIT 4 OFFSET 2")
怎样将表格从网站导入到 Google 表格 1

5. 您也可以将两者结合起来,像这样只选择几行和几列。

=QUERY(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2), "SELECT col1, col2  LIMIT 4 OFFSET 2")
选择要在 Google 表格上显示的行

6. 有一种方法可以使用 QUERY 中的 WHERE 选项过滤数据。 使用下面的函数,它将检查第 5 列,并且只包括有 Kevin Feige 的行。

=QUERY(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2), "SELECT * WHERE col5 = Kevin Feige")
过滤 Google 表格上的数据

7. 要将表格横向翻转以将行转换为列,反之亦然,请使用 转置() 功能。

=TRANSPOSE(IMPORTHTML("https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films", "table", 2))
在 Google 表格上转置表格

您还可以使用 QUERY 函数过滤数据,然后通过将两者结合使用 TRANSPOSE 函数来翻转表格。

常见问题

您可以从 Google 表格移动应用中的网页导入表格吗?

是的,所有公式和函数也适用于 Google 表格移动应用程序。 唯一的区别是您必须在页面底部编辑公式。

我们可以从所有网站导入表格吗?

不,某些网站会阻止网页抓取功能,因此您无法解析数据。 但是,大多数网站都允许您将表格从他们的页面导入到您的 Google 表格中。

如果网站宕机了怎么办?

此功能将表格与网站同步。 因此,如果网站出现故障,您也无法访问 Google 表格中的数据。 不仅如此,如果网站所有者决定在您导入的表格上方添加另一个表格,则表格的索引将发生变化,而表格将从不同的表格中导入数据。 除非您拥有该网站,否则您无法控制表格数据。

将表格从 Web 导入到 Google 表格

您可以通过网页的 URL、该网页上的表格索引和 ImportHTML 功能轻松地从网站导入表格。 您还可以使用 Transpose 和 Query 函数来重塑数据以仅查询特定的行和列,甚至过滤数据。 导入后,数据将保持同步。 因此,如果网页上的表格更新了新信息,这些更改也会反映在您的 Google 表格表格中。 但是,如果您稍后手动更改任何单元格,它将不会同步。

在相关说明中,您可以通过以下方式在 Google 表格中创建日历。 我们列出了几个有用的 Google 表格插件,以帮助您进一步处理数据。