在本教程中,我们将向您展示如何使用 Beautiful Soup 4 在 Python 中执行网络爬取,以从 HTML、XML 和其他标记语言中获取数据。在这里,我们将尝试从各种不同网站(包括 IMDB)中爬取网页。我们将介绍 beautiful soup 4、python 基本工具,用于有效且清晰地导航、搜索和解析 HTML 网页。
在本教程中,我们已尝试介绍 Beautiful Soup 4 的几乎所有功能。你可以将本教程中介绍的多个功能整合到一个更大的程序中,从网站中捕获多个有意义的数据,作为输入放入其他子程序。