温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何整理HTML5中支持的URL编码与字符编码

发布时间:2021-09-15 17:08:17 来源:亿速云 阅读:139 作者:柒染 栏目:web开发

本篇文章给大家分享的是有关如何整理HTML5中支持的URL编码与字符编码,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

URL 编码
URL 编码就是将 URLs 中不宜打印的字符或者具有特殊意义的字符转换为 Web 浏览器和服务器明白且普遍接受的表示法。 这些字符包括:

ASCII 控制字符 - 不宜打印的字符通常用于输出控制。字符范围是十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)。下面提供了完整的编码表。

非 ASCII 控制字符 - 这些字符超出了 128 个 ASCII 字符集的范围。这个范围是 ISO-拉丁字符集的一部分以及包含整个十六进制的 ISO-拉丁字符集 00-FF (十进制的 128-255)的“前半部分”。下面提供了完整的编码表。

保留字符 - 诸如美元符号,和号,加号,通用符号,正斜杠,冒号,分好,等号,问号以及 “at”这类符号。所有这些符号在 URL 内都有不同的意义,因此需要编码。下面提供了完整的编码表。

不安全字符 - 包括空格,问号,小于符号,大于符号,磅字符,百分比符号,大括号左边部分,大括号右边部分,管道符,反斜杠,插入符号,波浪线。左方括号,右方括号,沉音符。出于某些原因,这些字符出现在 URLs 中存在被误解的可能性。这些字符也应该始终被编码。下面提供了完整的编码表。
编码表示法需要三个字符替换期望的字符:一个百分号,两个在 ASCII 字符集中表示字符位置的十六进制数字、

示例
最常见的特殊字符之一便是空格。我们不能在 URL 中直接输入一个空格。空格在字符集中就是十六进制的 20。因此请求服务器时可以使用 %20 表示空格。

这个 URL 实际上是从 www.example.com 检索一个名为 new pricing.html 的文档。

ASCII 控制字符编码
包括十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)字符码。

十进制格式十六进制值字符URL 编码
000
%00
101
%01
202
%02
303
%03
404
%04
505
%05
606
%06
707
%07
808退格符%08
909tab%09
100a换行符%0a
110b
%0b
120c
%0c
130d回车符%0d
140e
%0e
150f
%0f
1610
%10
1711
%11
1812
%12
1913
%13
2014
%14
2115
%15
2216
%16
2317
%17
2418
%18
2519
%19
261a
%1a
271b
%1b
281c
%1c
291d
%1d
301e
%1e
311f
%1f
1277f
%7f


非 ASCII 控制字符编码
包括整个十六进制的 ISO-拉丁字符集 80-FF(十进制的 128-255)编码的“前半部分”。

十进制格式十六进制值字符URL 编码
12880€%80
12981?%81
13082?%82
13183?%83
13284?%84
13385…%85
13486?%86
13587?%87
13688?%88
13789‰%89
1388a?%8a
1398b?%8b
1408c?%8c
1418d?%8d
1428e?%8e
1438f?%8f
14490?%90
14591‘%91
14692’%92
14793%93
14894%94
14995?%95
15096–%96
15197—%97
15298?%98
15399?%99
1549a?%9a
1559b?%9b
1569c?%9c
1579d?%9d
1589e?%9e
1599f?%9f
160a0
%a0
161a1?%a1
162a2%a2
163a3%a3
164a4¤%a4
165a5%a5
166a6|%a6
167a7§%a7
168a8¨%a8
169a9?%a9
170aaa%aa
171ab?%ab
172ac?%ac
173ad-%ad
174ae?%ae
175afˉ%af
176b0°%b0
177b1±%b1
178b22%b2
179b33%b3
180b4′%b4
181b5μ%b5
182b6?%b6
183b7·%b7
184b8?%b8
185b91%b9
186bao%ba
187bb?%bb
188bc?%bc
189bd?%bd
190be?%be
191bf?%bf
192c0à%c0
193c1á%c1
194c2?%c2
195c3?%c3
196c4?%c4
197c5?%c5
198c6?%v6
199c7?%c7
200c8è%c8
201c9é%c9
202caê%ca
203cb?%cb
204ccì%cc
205cdí%cd
206ce?%ce
207cf?%cf
208d0D%d0
209d1?%d1
210d2ò%d2
211d3ó%d3
212d4?%d4
213d5?%d5
214d6?%d6
215d7×%d7
216d8?%d8
217d9ù%d9
218daú%da
219db?%db
220dcü%dc
221ddY%dd
222deT%de
223df?%df
224e0à%e0
225e1á%e1
226e2a%e2
227e3?%e3
228e4?%e4
229e5?%e5
230e6?%e6
231e7?%e7
232e8è%e8
233e9é%e9
234eaê%ea
235eb?%eb
236ecì%ec
237edí%ed
238ee?%ee
239ef?%ef
240f0e%f0
241f1?%f1
242f2ò%f2
243f3ó%f3
244f4?%f4
245f5?%f5
246f6?%f6
247f7÷%f7
248f8?%f8
249f9ù%f9
250faú%fa
251fb?%fb
252fcü%fc
253fdy%fd
254fet%fe
255ff?%ff


保留字符编码
下表用于编码保留字符。

十进制格式十六进制值字符URL 编码
3624$%24
3826&%26
432b+%2b
442c,%2c
472f/%2f
583a:%3a
593b;%3b
613d=%3d
633f?%3f
6440@%40


不安全字符编码
下表用于编码不安全字符。

十进制格式十六进制值字符URL 编码
3220space%20
3422"%22
603c<%3c
623e>%3e
3523#%23
3725%%25
1237b{%7b
1257d}%7d
1247c|%7c
925c\%5c
945e^%5e
1267e~%7e
915b[%5b
935d]%5d
9660`%60


字符编码

字符编码就是将字节转换为字符的一种方法。要验证或者显示一个 HTML 文档,程序必须选择一个字符编码。HTML5 作者有三种方式设置字符编码:

HTTP Content-Type 头:
如果你在编写 cgi 程序或者类似的程序,那么可以使用 HTTP Content-Type 头设置任意字符编码:

下面是一个简单的例子:

XML/HTML Code复制内容到剪贴板

  1. print "Content-Type: text/html; charset=utf-8\r\n";  

<meta> 元素:
可以使用带有 charset 属性的 <meta> 元素指定 HTML5 文档前 512 个字节的编码:

下面是简化的例子:

XML/HTML Code复制内容到剪贴板

  1. <meta charset="UTF-8">  

尽管这种语法是被允许的,但上述语法需要使用 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 替换。

Unicode 字节顺序标记(BOM)
一个字节顺序标记(BOM)由数据流开头的 U+FEFF 字符码组成,它可以用作定义字节顺序和编码形式的签名,主要是未标记的明文文件。

许多 Windows 程序(包括 Windows 记事本)都会在保存为 UTF-8 的任意文档开头添加 0xEF, 0xBB, 0xBF。这就是 Unicode 字节顺序标记(BOM)的 UTF-8 编码,通常被称为 UTF-8 BOM,尽管它和字节顺序没有关系。

对于 HTML5 文档,我们可以在文件的开头使用 Unicode 字节顺序标记(BOM)字符。这个字符为使用的编码提供了签名。

以上就是如何整理HTML5中支持的URL编码与字符编码,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI