真的是很气啊!!!今天写一个大数据的项目,想将结果生成excel,于是寻求百度帮助。发现现在百度的博客风气十分让人难受。我先附上我的解决算法,再发牢骚。

import os
import re
import csv
import jieba
import numpy as np
import pandas as pd

# 生成的字典
cont = {}
for txt in csv_reader:
    stopwords = get_stopwords_list()
    sentence_depart = seg_depart(txt[1])
    sentence_depart = move_stopwords(sentence_depart, stopwords)

    for s in sentence_depart:
        if s not in cont.keys():
            cont[s] = 1
        else:
            cont[s] += 1
# 提取字典中的两列值key是键值,value是cont【key】对应的值   
key = list(cont.keys())
value = list(cont.values())

# 利用pandas模块先建立DateFrame类型,然后将两个上面的list存进去
result_excel = pd.DataFrame()
result_excel["词向量"] = key
result_excel["词频"] = value
# 写入excel
result_excel.to_excel(result_excel_location)

看看结果:
Alt
学习者看到这里就可以了,接下来我要开始发牢骚。我觉得现在发博客的人真的是一言难尽,要么给个大代码注释也没有自己看。要么就是一堆名词简单问题复杂化,彰显大佬气息。解决实际问题的人越来越少。真的很气。这样最后让学习的搜索时间无限延长。今天是我尝试自己写了一篇博客。我也是第一次编辑,肯定有很多有不好的地方,希望大家留言。我会尝试作出改进,尽快熟悉这个环境。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐