怎么在python中使用urlretriev获取远程文件?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易入门、功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,Web开发等。
1、函数说明
这个函数不返回一个类似于文件的对象,而返回一个格式为 (filename, headers) 的元组,其中 filename 是本地文件的名称(由 urllib 自动创建),而 headers 包含一些有关远程文件的信息(这里不会介绍 headers,如果想要更深入的了解它,请在有关 urllib 的标准库文档中查找 urlretrieve)。如果要给下载的副本指定文件名,可通过第二个参数来提供。
2、获取步骤
(1)获取 python 官网的主页,并将其存储到文件 C:\python_webpage.html 中。
urlretrieve('http://www.python.org', 'C:\\python_webpage.html')
(2)使用完毕后,你可能想将其删除,以免占用磁盘空间。要清空这样的临时文件,可调用函数 urlcleanup 且不提供任何参数,它将负责替你完成清空工作。
拓展:
urllib 提供了一些用于操作URL的函数:
(1)quote(string[, safe]):返回一个字符串,其中所有的特殊字符(在 URL 中有特殊意义的字符)都已替换为对 URL 友好的版本(如将 ~ 替换为 %7E)。如果要将包含特殊字符的字符串用作 URL,这很有用。参数 safe 是一个字符串(默认为 '/'),包含不应该像这样对其进行编码的字符。
(2)quote_plus(string[, safe]):类似于 quote,但也将空格替换为加号。
(3)unquote(string):与 quote 相反。
(4)unquote_plus(string):与 quote_plus 相反。
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。