python

当前位置:中华考试网 >> python >> python爬虫 >> 文章内容

Python3爬虫lxml解析库该怎么安装?

来源:中华考试网  [2020年12月4日]  【

  lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。本节中,我们了解一下lxml的安装方式,这主要从Windows、Linux和Mac三大平台来介绍。

  1. 相关链接

  官方网站:http://lxml.de

  GitHub:https://github.com/lxml/lxml

  PyPI:https://pypi.python.org/pypi/lxml

  2. Windows下的安装

  在Windows下,可以先尝试利用pip安装,此时直接执行如下命令即可:

  pip3 install lxml

  如果没有任何报错,则证明安装成功。

  如果出现报错,比如提示缺少libxml2库等信息,可以采用wheel方式安装。

  推荐直接到这里(链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下载对应的wheel文件,找到本地安装Python版本和系统对应的lxml版本,例如Windows 64位、Python 3.6,就选择lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl,将其下载到本地。

  然后利用pip安装即可,命令如下:

  pip3 install lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl

  这样我们就可以成功安装lxml了。

  3. Linux下的安装

  在Linux平台下安装问题不大,同样可以先尝试pip安装,命令如下:

  pip3 install lxml

  如果报错,可以尝试下面的解决方案。

  CentOS、Red Hat

  对于此类系统,报错主要是因为缺少必要的库。

  执行如下命令安装所需的库即可:

  sudo yum groupinstall -y development tools

  sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

  主要是libxslt-devel和libxml2-devel这两个库,lxml依赖它们。安装好之后,重新尝试pip安装即可。

  Ubuntu、Debian和Deepin

  在这些系统下,报错的原因同样可能是缺少了必要的类库,执行如下命令安装:

  sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev

  安装好之后,重新尝试pip安装即可。

  4. Mac下的安装

  在Mac平台下,仍然可以首先尝试pip安装,命令如下:

  pip3 install lxml

  如果产生错误,可以执行如下命令将必要的类库安装:

  xcode-select --install

  之后再重新尝试pip安装,就没有问题了。

  lxml是一个非常重要的库,后面的Beautiful Soup、Scrapy框架都需要用到此库,所以请一定安装成功。

  5. 验证安装

  安装完成之后,可以在Python命令行下测试:

  $ python3

  >>> import lxml

  如果没有错误报出,则证明库已经安装好了。

  如今python编程语言市场需求大,薪资待遇上万尽在咫尺!如果你也想学习python技术可以填写下面表单,Python学习资料限时免费领取!

责编:fushihao
  • 会计考试
  • 建筑工程
  • 职业资格
  • 医药考试
  • 外语考试
  • 学历考试