相关动态
2月16日学习记录
2024-11-11 02:49

1,背诵单词:vice 邪恶;恶习 drop滴;落下;微量  otherwise 另样,用别的方法 bind捆,绑,包括,束缚   eligible 符合条件的 narrative 叙述性的 叙述 tile 瓦片,瓷砖bundle 捆,包,束 mill 磨粉机,磨坊 heave (用力)举,提 gay 快乐的,愉快的 statistical统计的,统计学的 fence 篱笆;围栏;剑术 magnify 放大,扩大 graceful优美的,文雅的,大方的 analyse 分析,分解   artificial 人工的,人造的 privacy 独处,自由,隐私;私生活 tub 木盆,澡盆 feedback 反馈;反应;回授 property 财产,资产upper 上面的;上部的

2月16日学习记录

2,完善了北京信件统计系统的一些功能,爬取了百度信息领域热词并存入mysql并简单实现了词云图功能:

  1,爬取百度热词的URL,存入citiao_list.txt中

 

  2,通过citiao_list.txt文件中的URL爬取词条名称和简介并存入citiao.txt中

  3,对citiao.txt中内容进行分词,根据每个词的出现频率展示词云图

 

 

  

 

 3,遇到的问题:

  1,爬取百度百科词条URL时发现百度百科的词条是通过Ajax传的json数据在前端渲染展示的,而且是通过post方式传的数据,因此网上查找,通过requests库的post方法,将参数设置好就能访问到json数据了,然后通过json库的loads方法将json数据转为list类型,从而取得每个词条的URL链接

  2,生成词云图的代码我看的不是太懂

  3,关于对词条分类我初步猜想可以通过对特定的分类根据词条的简介进行模糊查询进行分类

  4,对词条与词条之间的关系图不知道怎么实现

4,明天就上课了,希望在新的学期能学到很多知识

    以上就是本篇文章【2月16日学习记录】的全部内容了,欢迎阅览 ! 文章地址:http://mip.xhstdz.com/quote/79595.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://mip.xhstdz.com/mobile/ , 查看更多   
发表评论
0评