这里有新鲜出炉的 Python3 官方中文指南,程序狗速度看过来!
Python 是一种面向对象、解释型计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。Python 语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。
这篇文章主要介绍了 Python 实现抓取网页生成 Excel 文件的方法, 涉及 PyQuery 模块的使用及 Excel 文件相关操作技巧, 需要的朋友可以参考下
本文实例讲述了 Python 实现抓取网页生成 Excel 文件的方法。分享给大家供大家参考,具体如下:
Python 抓网页,主要用到了 PyQuery,这个跟 jQuery 用法一样,超级给力
示例代码如下:
- #-*- encoding:utf-8 -*-
- import sys
- import locale
- import string
- import traceback
- import datetime
- import urllib2
- from pyquery import PyQuery as pq
- # 确定运行环境的encoding
- reload(sys);
- sys.setdefaultencoding('utf8');
- f = open('gongsi.csv', 'w');
- for i in range(1,24):
- d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
- itemsa=d('dl dt a') #取title元素
- itemsb=d('dl dd') #取title元素
- for j in range(0,len(itemsa)):
- f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
- #end for
- #end for
- f.close();
接下来就是用 Notepad++ 打开 gongsi.csv,然后转成 ANSI 编码格式,保存。再用 Excel 软件打开这个 csv 文件,另存为 Excel 文件
希望本文所述对大家 Python 程序设计有所帮助。
来源: http://www.phperz.com/article/17/0817/344569.html