温馨提示×

怎么使用BeautifulSoup解析表格数据

小亿
154
2024-05-14 12:53:16
栏目: 编程语言

要使用BeautifulSoup解析表格数据,首先需要使用BeautifulSoup库来解析HTML页面,然后找到包含表格数据的标签,最常见的是<table>标签。接着可以通过遍历表格中的行和列来提取数据。

以下是一个简单的示例,演示如何使用BeautifulSoup解析网页中的表格数据:

from bs4 import BeautifulSoup

# 假设html是一个包含表格数据的HTML页面
html = """
<table>
  <tr>
    <th>姓名</th>
    <th>年龄</th>
  </tr>
  <tr>
    <td>张三</td>
    <td>25</td>
  </tr>
  <tr>
    <td>李四</td>
    <td>30</td>
  </tr>
</table>
"""

# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html, 'html.parser')

# 找到表格标签
table = soup.find('table')

# 遍历表格中的行和列
for row in table.find_all('tr'):
    cells = row.find_all('td')
    if cells:
        name = cells[0].get_text()
        age = cells[1].get_text()
        print(f'姓名:{name}, 年龄:{age}')

上述代码首先使用BeautifulSoup解析了一个包含表格数据的HTML页面,然后找到了表格标签,并遍历了表格中的行和列,提取并打印了姓名和年龄数据。

通过类似的方法,您可以根据实际情况修改代码来解析更复杂的表格数据。

0