养生 装修 购物 美食 感冒 便秘 营销 加盟 小吃 火锅 管理 创业 搭配 减肥 培训 旅游

Excel如何抓取网页数据之JSON数据抓取

时间:2024-11-02 10:26:38

Excel2013以后的版本提供了WEBS苇质缵爨ERVICE和FILTERXML函数可用于网页数据抓取,但只能抓取XML格式的数据。而现在很多网皴捩糕皴站的网页或接口返回的都是HTML或JSON数据,那么如何精确的抓取这些数据呢?今天笔者将以抓取豆瓣网图书基本信息为例,给大家介绍如何使用ExcelAPI网络函数库抓取JSON格式的网页数据。

工具/原料

Excel2007/2010/2013/2016

ExcelAPI网络函数库(excelapi.net)

方法/步骤

1、第一步,找到豆瓣网图书基本信息网页豆瓣网图书信息网址为https://api.douban饱终柯肢.com/v2/book/isbn/:9787111529385,网址最后的一串数字为图书的ISBN锔鼐抻耄号。在Firefox浏览器下,这个网址将返回以下信息,这些信息是标准的JSON格式,蓝色字体的是属性名称,红色字体的对应的属性值。

Excel如何抓取网页数据之JSON数据抓取

2、第二步,安装ExcelAPI网络函数库访问ExcelAPI网络函数库官网,按照帮助页面安装函数库。或参照百度经验“Excel生成条形码”

Excel如何抓取网页数据之JSON数据抓取

3、第三步,使用函数抓取JSON数据。首先,使用函数GetJsonSource(url,"UTF-8")返回JSON原始数据。

Excel如何抓取网页数据之JSON数据抓取

4、然后,使用函数GetJsonByPropertyName(json_source,property_name)返回书的基本信息。使用GetJsonSource()函数的可一次性抓取所有数据,然后按需抓取,这样做的目的提高抓取速度,毕竟访问网页是需要时间的。

Excel如何抓取网页数据之JSON数据抓取

© 一点知识