怎么使用BeautifulSoup解析表格数据

BeautifulSoup

小亿

232

2024-05-14 12:53:16

栏目: 编程语言

要使用BeautifulSoup解析表格数据，首先需要使用BeautifulSoup库来解析HTML页面，然后找到包含表格数据的标签，最常见的是<table>标签。接着可以通过遍历表格中的行和列来提取数据。

以下是一个简单的示例，演示如何使用BeautifulSoup解析网页中的表格数据：

from bs4 import BeautifulSoup

# 假设html是一个包含表格数据的HTML页面
html = """
<table>
  <tr>
    <th>姓名</th>
    <th>年龄</th>
  </tr>
  <tr>
    <td>张三</td>
    <td>25</td>
  </tr>
  <tr>
    <td>李四</td>
    <td>30</td>
  </tr>
</table>
"""

# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html, 'html.parser')

# 找到表格标签
table = soup.find('table')

# 遍历表格中的行和列
for row in table.find_all('tr'):
    cells = row.find_all('td')
    if cells:
        name = cells[0].get_text()
        age = cells[1].get_text()
        print(f'姓名：{name}, 年龄：{age}')

上述代码首先使用BeautifulSoup解析了一个包含表格数据的HTML页面，然后找到了表格标签，并遍历了表格中的行和列，提取并打印了姓名和年龄数据。

通过类似的方法，您可以根据实际情况修改代码来解析更复杂的表格数据。

怎么使用BeautifulSoup解析表格数据

最新问答

相关标签