利用ASP.NET怎么抓取网页内容

发布时间：2021-06-25 15:26:02 来源：亿速云阅读：211 作者：Leah 栏目：编程语言

今天就跟大家聊聊有关利用ASP.NET怎么抓取网页内容，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

asp.net 抓取网页内容需要三个类：WebRequest、WebResponse、StreamReader。

WebRequest、WebResponse 的名称空间是：

System.Net

StreamReader 的名称空间是：

System.IO

ASP.NET抓取网页内容核心代码

WebRequest request = WebRequest.Create("http://www.cftea.com/");  WebResponse response = request.GetResponse();  StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));

WebRequest 类的 Create 为静态方法，参数为要抓取的网页的网址；

Encoding 指定编码，Encoding 中有属性 ASCII、UTF32、UTF8 等全球通用的编码，但没有 gb2312 这个编码属性，所以我们使用 GetEncoding 获得 gb2312 编码。

示例

< %@ Page Language="C#" %>  < %@ Import Namespace="System.Net" %>  < %@ Import Namespace="System.IO" %>  < !DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">< script runat="server">      void Page_Load(object sender, EventArgs e)      {          try         {              WebRequest request = WebRequest.Create("http://www.cftea.com/");              WebResponse response = request.GetResponse();              StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));                            tb.Text = reader.ReadToEnd();                             reader.Close();               reader.Dispose();              response.Close();          }          catch (Exception ex)          {              tb.Text = ex.Message;          }      }  < /script>< html xmlns="http://www.w3.org/1999/xhtml" >  < head runat="server">      < title>抓取网页内容 - 千一网络< /title>  < /head>  < body>      < form id="form1" runat="server">      < div>      < asp:TextBox ID="tb" runat="server" Width="500" Height="300" TextMode="multiLine">< /asp:TextBox>      < /div>      < /form>  < /body>  < /html>

看完上述内容，你们对利用ASP.NET怎么抓取网页内容有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注亿速云行业资讯频道，感谢大家的支持。

向AI问一下细节

利用ASP.NET怎么抓取网页内容

猜你喜欢

最新资讯

相关推荐

相关标签