利用openpyxl将数据写入excel表格中
利用openpyxl将数据存储在excel表格中
·
前面两篇博客介绍了如何利用爬虫爬取京东商城销量最高大衣的评论,以及如何将这些杂乱的数据转化为json数据从而得到用户尺码以及购买颜色,详细的博客见下,本篇博客主要记录如何利用openpyxl将得到的用户尺码以及衣服颜色保存到excel表格中。
爬虫入门demo_keep_humble的博客-CSDN博客https://blog.csdn.net/qq_43270444/article/details/123002685
如何借用josn解析杂乱无章的数据_keep_humble的博客-CSDN博客https://blog.csdn.net/qq_43270444/article/details/123017990
我利用的是pycharm,首先我们要导入相关的包openpyxl,昨天学到了一个小技巧,我们可以直接在Terminal下利用如下命令直接导入openpyxl
pip install openpyxl
将用户数据写到excel表格中主要分为以下几步:
(1)创建一个excel表格;
(2)在excel表格中创建一个sheet,数据会存储在我们创建的这个sheet中;
(3)将数据保存在sheet中;
(4)将excel表格保存在指定路径,指定文件名
下面是我的代码,其中还包含获取用户数据的代码,是前两篇博客的内容,如果不理解,建议先看一下前两篇文章。
import requests
import json
import openpyxl
# 创建一个excel表格
wk = openpyxl.Workbook()
# 创建一个sheet,命名为my_sheet,默认名称为“sheet1”
sheet = wk.create_sheet('my_sheet')
# 在my_sheet中写入相关属性
sheet.cell(row=1, column=1).value = '大衣颜色'
sheet.cell(row=1, column=2).value = '大衣尺码'
# 根据指定的url获得相应的数据
resp = requests.get('https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=10020517258568&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1')
content = resp.text
# json数据必须以大括号开头,大括号结尾,借用replace修改数据
# 实现大括号开头以及结尾,这里可以有多个空格,不影响
content = content.replace('fetchJSON_comment98(',' ')
new_content = content.replace(');',' ')
# print(new_content)
# 将替换后的数据传给josn工具,注意是loads而不是load
json_data = json.loads(new_content)
# 获取comments数据,comments是一个字典
comments = json_data['comments']
# 获取键值对,comments字典里面存储的数据也是以字典形式存储
for item in comments:
# item 是一个字典,通过“键”获取“值”
color = item['productColor']
size = item['productSize']
# print(color)
# print(size)
# 往sheet中保存数据,第一列保存的是大衣颜色,第二列保存大衣尺码
sheet.append([color,size])
# 表格保存在磁盘上,下面为指定的保存路径以及文件名
wk.save('F:\\jd销量最高大衣数据.xlsx')
print('保存成功')
下面是excel表格中存储的用户数据,和直接输出color和size信息相符。
更多推荐
已为社区贡献3条内容
所有评论(0)