Python 对新浪微博的博文元素 (Word, Screen Name)的频率分析

CODE:

#!/usr/bin/python
# -*- coding: utf-8 -*-  

'''''
Created on 2014-7-9
@author: guaguastd
@name: weiboFrequencyAnalysis.py
'''

if __name__ == '__main__':  

    # get weibo_api to access sina api
    from sinaWeiboLogin import sinaWeiboLogin
    sinaWeiboApi = sinaWeiboLogin()  

    # import sinaWeibo
    from sinaWeibo import extractWeiboEntities  

    # import sinaWeoboStatuses
    from sinaWeiboStatuses import publicTimeline  

    # import sinaWeiboFrequency
    from sinaWeiboFrequency import weiboFrequencyAnalysis  

    # get the new 5 weibo
    weiboNum = 5
    statuses = publicTimeline(sinaWeiboApi, weiboNum)
    status_texts,screen_names,words = extractWeiboEntities(statuses)    

    for label, data in (('Word', words),
                        ('Screen Name', screen_names)):
        weiboFrequencyAnalysis(label, data, weiboNum)

RESULT:

+------------------------------------------+-------+
| Word                                     | Count |
+------------------------------------------+-------+
| http://t.cn/8snKY0S                      |     1 |
| [围观]CANNCI千姿百袋2014新款牛皮菱格女包 |     1 |
| 时尚潮流单肩包                           |     1 |
| 浪漫RI系「喜欢请赞                       |     1 |
|                              |     1 |
+------------------------------------------+-------+
+--------------------+-------+
| Screen Name        | Count |
+--------------------+-------+
| 马傻强             |     1 |
| 手机用户2360148561 |     1 |
| 潮流爆款搭V        |     1 |
| star爱上泡面猫     |     1 |
| 美容潮搭健康       |     1 |
+--------------------+-------+

返回栏目页:http://www.bianceng.cnhttp://www.bianceng.cn/Programming/extra/

以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索import
, screen
, from
python新浪微博
博文收藏帅帅新浪博客、博文王橙宇 新浪博客、博文阻击手新浪博客、新浪博文、博文收藏雄男新浪博客,以便于您获取更多的相关知识。

时间: 2016-08-23

Python 对新浪微博的博文元素 (Word, Screen Name)的频率分析的相关文章

python下如何让web元素的生成更简单的分析_python

1. 引用css.这可能是最常见的做法了,对一些特定的元素定义特定的样式.那么使用它,你需要在HTML 页面中加入<link>标签. 2. 引入js.许多特效也可以通过javascript来进行处理,比如动态显示效果,或对元素进行封装.使用 它你需要在HTML页面加入<script>标签,必要时还要加一些javascript代码. 3. HTML元素.需要设定一些特殊的属性,比如class=某个属性.这块还相对简单. 因此从上面的分析可以看出,在通常情况下,加入一个好看的web元素

Python模拟新浪微博登录

看到一篇Python模拟新浪微博登录的文章,想熟悉一下其中实现方式,并且顺便掌握python相关知识点. 代码 下面的代码是来自上面这篇文章,并稍作修改添加了一些注释. # -*- coding: utf-8 -* import urllib2 import urllib import cookielib import lxml.html as HTML class Fetcher(object): def __init__(self, username=None, pwd=None, cook

python实现在windows下操作word的方法

  本文实例讲述了python实现在windows下操作word的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 import win32com from win32com.client import Dispatch, constants w =

Python解析xml中dom元素的方法_python

本文实例讲述了Python解析xml中dom元素的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: from xml.dom import minidom try:     xmlfile = open("path.xml", "a+")     #xmldoc = minidom.parse( sys.argv[1])     xmldoc = minidom.parse(xmlfile) except :     #updatelogger.

Python去除列表中重复元素的方法_python

本文实例讲述了Python去除列表中重复元素的方法.分享给大家供大家参考.具体如下: 比较容易记忆的是用内置的set l1 = ['b','c','d','b','c','a','a'] l2 = list(set(l1)) print l2 还有一种据说速度更快的,没测试过两者的速度差别 l1 = ['b','c','d','b','c','a','a'] l2 = {}.fromkeys(l1).keys() print l2 这两种都有个缺点,祛除重复元素后排序变了: ['a', 'c',

解决Python 遍历字典时删除元素报异常的问题_python

错误的代码① d = {'a':1, 'b':0, 'c':1, 'd':0} for key, val in d.items(): del(d[k]) 错误的代码② -- 对于Python3 d = {'a':1, 'b':0, 'c':1, 'd':0} for key, val in d.keys(): del(d[k]) 正确的代码 d = {'a':1, 'b':0, 'c':1, 'd':0} keys = list(d.keys()) for key, val in keys: d

基于Python的新浪微博数据爬虫

基于Python的新浪微博数据爬虫 周中华; 张惠然; 谢江 目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析.为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具.该工具可以实时抓取微博中指定用户的粉丝信息.微博正文等内容;该工具利用关键字匹配技术,匹配符合规定条件的微博,并抓取相关内容;该工具支持并行抓取,可以同时抓取多个用户的信息.最后将串行微博爬虫工具和其并行版本进行对比,并使用该工具对部分微博数据作了一个关于流感问题

Python使用新浪微博API发送微博的例子_python

1.注册一个新浪应用,得到appkey和secret,以及token,将这些信息写入配置文件sina_weibo_config.ini,内容如下,仅举例: 复制代码 代码如下: [userinfo]CONSUMER_KEY=8888888888CONSUMER_SECRET=777777f3feab026050df37d711200000TOKEN=2a21b19910af7a4b1962ad6ef9999999TOKEN_SECRET=47e2fdb0b0ac983241b0caaf45555

如何利用python对新浪微博用户标签进行分词并推荐相关用户

新浪微博的开放平台的开发者日益活跃,除了商业因素外还有很大的一股民间工程师力量:大量热衷于群体行为研究与自然语言处理以及机器学习和数据挖掘的研究者 and 攻城师们开始利用新浪真实的数据和平台为用户提供更好的应用或者发现群体的行为规律包括一些统计信息,本文就是利用新浪开放平台提供的API对微博的用户标签进行分词处理,然后根据分词后的关键字给用户推荐感兴趣的人,在此记录下以备后用. requisition: python+sinaWeibo python SDK+ICTCLAS 备注:ICTCLA