Python Web Scraping 简明教程
Getting Started with Python
在第一章中,我们学习了网络抓取是什么。在本章中,让我们看看如何使用Python来实现网络抓取。
Why Python for Web Scraping?
Python是实现网络抓取的流行工具。Python编程语言也用于与网络安全、渗透测试以及数字取证应用程序相关的其他有用的项目。使用Python的基本编程,可以在不使用任何其他第三方工具的情况下执行网络抓取。
Python编程语言正获得巨大的欢迎,使Python非常适合网络抓取项目的理由如下:
Installation of Python
Python发行版适用于Windows、MAC和Unix/Linux等平台。我们只需要下载适用于我们平台的二进制代码即可安装Python。但是如果我们平台的二进制代码不可用,则我们必须有一个C编译器,以便可以手工编译源代码。
我们可在不同平台上安装 Python,方法如下 −
Installing Python on Unix and Linux
您需要执行以下步骤才能在 Unix/Linux 机器上安装 Python −
Step 1 − 访问链接 https://www.python.org/downloads/
Step 2 − 下载适用于 Unix/Linux 的压缩源代码,这是在上述链接中提供的。
Step 3 − 将这些文件解压到您的机器上。
Step 4 − 使用以下命令完成安装 −
run ./configure script
make
make install
您可以在标准位置 /usr/local/bin 中找到已安装的 Python,其库位于 /usr/local/lib/pythonXX ,其中 XX 是 Python 的版本。
Installing Python on Windows
您需要执行以下步骤才能在 Windows 机器上安装 Python −
Step 1 − 访问链接 https://www.python.org/downloads/
Step 2 − 下载 Windows 安装程序 python-XYZ.msi 文件,其中 XYZ 是我们需要安装的版本。
Step 3 − 现在,将安装程序文件保存在您的本地机器中并运行 MSI 文件。
Step 4 − 最后,运行下载的文件,调出 Python 安装向导。
Installing Python on Macintosh
我们必须使用 Homebrew 来在 Mac OS X 上安装 Python 3。Homebrew 易于安装且是一个出色的软件包安装程序。
也可以使用以下命令安装 Homebrew −
$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"
为更新软件包管理器,我们可以使用以下命令 −
$ brew update
借助以下命令,我们可在我们的 MAC 机器上安装 Python3 −
$ brew install python3
Running Python
我们可以通过以下三种方式中的任何一种启动 Python −
Interactive Interpreter
可使用提供命令行解释器或 shell 的操作系统,如 UNIX 和 DOS 来启动 Python。
我们可以按照以下方式在交互解释器中开始编码:
Step 1 − 在命令行中输入 python 。
Step 2 - 然后,我们可以在交互解释器中立即开始编码。
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS