博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【py分析】
阅读量:5301 次
发布时间:2019-06-14

本文共 1606 字,大约阅读时间需要 5 分钟。

pyQuery

 是 jQuery 在 python 中的实现,能够以 jQuery 的语法来操作解析 HTML 文档,十分方便。使用前需要安装,easy_install pyquery 即可,或者 Ubuntu 下

sudo apt-get install python-pyquery

以下例子:

from pyquery import PyQuery as pyqdoc=pyq(url=r'http://list.taobao.com/browse/cat-0.htm')cts=doc('.market-cat') for i in cts:	print '====',pyq(i).find('h4').text() ,'===='	for j in pyq(i).find('.sub'):		print pyq(j).text() ,	print '\n'

--------------- my code --------------------

for i in cts:    print '-'*10,pyq(i).find('h4').text()    for j in pyq(i).find('.subtitle'):        print pyq(j).text()    print '\n'    for j in pyq(i).find('.sublist'):        print '\t',pyq(j).text()    print '\n'

------------------------------------------------

You can use the PyQuery class to load an xml document from a string, a lxml document, from a file or from an url:

>>> from pyquery import PyQuery as pq>>> from lxml import etree>>> import urllib>>> d = pq("")>>> d = pq(etree.fromstring(""))>>> d = pq(url=your_url)>>> d = pq(url=your_url,...        opener=lambda url, **kw: urlopen(url).read())>>> d = pq(filename=path_to_html_file)

 

支持大部分jQuwey转换方法。这里是一些实例。

  • 用字符选择器来进行过滤:
>>> d('p').filter('.hello')[
]
  • 也可以对单一元素使用 eq 方法:
>>> d('p').eq(0)[
]
  • 用户也可以寻找内嵌元素:
>>> d('p').find('a')[, ]>>> d('p').eq(1).find('a')[]
>>> d('p').find('a').end()[
,
]>>> d('p').eq(0).end()[
,
]>>> d('p').filter(lambda i: i == 1).end()[
,
]

转载于:https://www.cnblogs.com/lizunicon/p/3515983.html

你可能感兴趣的文章
ubuntu 安装后的配置
查看>>
web前端之路,js的一些好书(摘自聂微东 )
查看>>
【模板】对拍程序
查看>>
【转】redo与undo
查看>>
解决升级系统导致的 curl: (48) An unknown option was passed in to libcurl
查看>>
Java Session 介绍;
查看>>
spoj TBATTLE 质因数分解+二分
查看>>
Django 模型层
查看>>
dedecms讲解-arc.listview.class.php分析,列表页展示
查看>>
Extjs6 经典版 combo下拉框数据的使用及动态传参
查看>>
【NodeJS】http-server.cmd
查看>>
研磨JavaScript系列(五):奇妙的对象
查看>>
面试题2
查看>>
selenium+java iframe定位
查看>>
P2P综述
查看>>
第五章 如何使用Burp Target
查看>>
Sprint阶段测试评分总结
查看>>
sqlite3经常使用命令&语法
查看>>
linux下编译openjdk8
查看>>
【python】--迭代器生成器装饰器
查看>>