步骤 1:安装 Python PIP(如果尚未安装)
安装 Python 库的最简单和最好的方法是使用其名为 PIP 的包管理器。因此,如果您已经安装了该设备,则可以跳过此步骤。
要检查它是否可用,请使用:
pip -V
如果输出显示版本详细信息,则 PIP 存在于您的系统上。
但是,如果您尚未安装 PIP(Python 包安装程序),则可以使用以下命令获取它。
sudo apt update -y
sudo apt install python3-pip
第 2 步:在 Ubuntu 上安装 BeautifulSoup
一旦您确认 PIP 在您的 Ubuntu Linux 系统上可用,我们就可以使用它来安装各种 Python 库,包括 BeautifulSoup。因此,在您的 Ubuntu 命令终端上运行:
pip install beautifulsoup4 --user
或者,那些不想使用 PIP 的人可以选择 APT 包管理器,这是命令:
sudo apt install python3-bs4
第 3 步:检查 BeautifulSoup 版本
为了确认,使用上一步命令,BeautifulSoup是否真的安装在您的系统上以在Python脚本中使用,我们可以使用给定的命令。它将为我们提供指定库的版本详细信息以及它的安装位置。
python3 -m pip show beautifulsoup4
步骤 4:运行简单的测试脚本
让我们创建一个简单的脚本文件,在其中导入 BeeatuifulSoup 来解析一个简单的 HTML 代码。
使用任何文本编辑器并创建新的 Python 文件。例如,这里我们使用 nano test_beautifulsoup.py。
将以下代码添加到该文件中:
from bs4 import BeautifulSoup
html_doc = """
<html>
<head>
<title>Example HTML Page</title>
</head>
<body>
<h1>Welcome to Beautiful Soup</h1>
<p>This is an example paragraph.</p>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.prettify())
按 Ctrl+X,键入 Y,然后按 Enter 键保存创建的文件。
运行创建的 Python 文件:
python test_beautifulsoup.py
您将在 Ubuntu 终端的输出中看到解析和美化的 HTML。
如何升级
将来,如果 Beautifulsoup 库有一些新的更新可用,那么要升级它,请使用:
pip install --upgrade beautifulsoup4 --user
卸载(可选)
如果一段时间后,您将不再需要 Ubuntu Linux 系统上的 Python 的 BeatuifulSoup 库,只需将其删除,我们可以再次使用 PIP,这是命令:
pip uninstall beautifulsoup4