HTML 中的字符集、ASCII、 ISO-8859-1、符号之间的关系和 HTML URL 编码注意的事项

时间:2023-02-22 07:59:08

一、HTML 实体

1.什么是HTML 实体?

在 HTMl 中,某些字符是保留的。小于号 (<) 和 大于号 (>), 浏览器会误认为是标签

如果希望正确地显示预留字符,必须在 HTML 源代码中使用字符实体(HTML entities).

2.字符实体类

&entity_name 或者 &#entity_number;

提示:
使用实体名而不是数字的好处是,名字易于记忆。
不过坏处,浏览器也许并不支持所有实体名称(对实体数字的支持却很好)

3.不间断空格(non-breaking space)

4.HTML 中的常用字符实体体是不间断空格(&nbsp)

5.HTML 中有用的字符实体

详细地址:http://www.w3school.com.cn/html/html_entities.asp

二、HTMl 字符集

如果正确地显示 HTML 页面,浏览器必须知道使用何种字符集。

1.万维网早起使用的字符集是 ASCII。 ASCII 支持 0-9 的数字,大写和小写英文字母,以及一些特殊字符。

由于很多国际使用的字符并不属于 ASCII,现代浏览器的默认字符集是 ISO-8859-1;

如果网页使用不同于 ISO-8859-1 的字符,就应该在 <meta> 标签进行指定。

2.ISO 字符集
   ISO 字符集是国际标准组织(ISO) 针对不同的字母表/语言定义的标准字符集。

3.Unicode 标准   

Unicode 的出现就是解决,由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准

Unicode 标准涵盖了世界上的所有字符、标点和符号。不论是何种平台、程序或者语言,Unicode 都能够进行文本数据的处理、存储和交换。

Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF=16.

UTF-8 中的字符可以使 1-4 个字节长。 UTF-8 可以表示 Unicode 标准中的任意字符。 UTF-8 向后兼容 ASCII.

UTF-8 是网页和电子邮箱常用的编码。

注意:所有 HTML 4 处理器均已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16

三、HTML ASCII

HTML 和 XHTML 用标准的 7 比特 ASCII 代码在网络上传输数据。
7 比特 ASCII 代码可以提供 128 个不同的字符值。

四、HTML ISO-88591

HTML 4.01 支持 ISO 8859-1 字符集

ISO 8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 7 比特 ASCII;

ISO 8859-1 的较高部分(从 160 到 255 之间的代码)全部有实体名称。

这些符号中的大多数可以在不进行实体引用的情况下使用,但是实体名称或者实体比编号为那些不容易通过键盘输入的符号提供了表达的方法。

五、HTML 4.01 符号实体

包括了数学符号、希腊字符、各种箭头符号、科技符号以及形状

六、HTMl URL 编码

url 编码形式表示的是 ASCII 字符(十六进制格式)
十六进制格式用于在浏览器和插件中显示非标准的字母和字符。

URL 编码会将字符转换为可通过因特网传输的格式。

URL 统一资源定位器
WEb 浏览器通过 URL 从 web 服务器请求页面

URL 编码
URL 只能使用 ASCII 字符集 来通过因特网进行发送。

由于 URL 常常会包含 ASCII 集合之外的字符, URL 必须转换为有效的 ASCII 格式.

URL 编码使用 %其后跟随两位的 十六进制来代替非 ASCII 字符。

URL 不能包含空格,URL 编码通常使用 "+" 来替换空格。

参考资料:

http://www.oschina.net/translate/what-every-web-developer-must-know-about-url-encoding#Thereservedcharactersarenotwhatyouthinktheyare
http://www.w3schools.com/html/html_entities.asp
http://www.w3school.com.cn/tags/html_ref_language_codes.asp
http://www.w3school.com.cn/html/html_entities.asp
http://en.wikipedia.org/wiki/Percent-encoding
http://blog.csdn.net/wusuopubupt/article/details/8817826
http://blog.163.com/chenzhenhua_007/blog/static/12849264920108119449881/
http://www.qianxingzhem.com/post-1989.html
http://unicode-table.com/en/#cherokee

总结:对 HTMl 基础背景、标准有了初步的了解,还需要在深入的学习。

HTML 中的字符集、ASCII、 ISO-8859-1、符号之间的关系和 HTML URL 编码注意的事项的更多相关文章

  1. Linux中的文件描述符与打开文件之间的关系

    Linux中的文件描述符与打开文件之间的关系 导读 内核(kernel)利用文件描述符(file descriptor)来访问文件.文件描述符是非负整数.打开现存文件或新建文件时,内核会返回一个文件描 ...

  2. Unity3D 中 Generic 动画导入设置和 Root Motion 之间的关系

    2条评论 Unity3D 的 Mecanim 动画系统可以直接复用 3DS MAX 中制作的动画文件中的位移,这个就是通过 applyRootMotion 来达成的,我们只需要在使用 Animator ...

  3. Linux中的文件描述符与打开文件之间的关系------------每天进步一点点系列

    http://blog.csdn.net/cywosp/article/details/38965239 1. 概述     在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件.目录文件. ...

  4. JavaScript中的 原型 property 构造函数 和实例对象之间的关系

    1 为什么要使用原型? /* * javascript当中 原型 prototype 对象 * * */ //首先引入 prototype的意义,为什么要使用这个对象 //先来写一个构造函数的面向对象 ...

  5. 通俗易懂理清mybatis中SqlSessionSql、SqlSessionTemplate、SessionFactory和SqlSessionFactoryBean之间的关系

    我潇洒的灰大狼又回来啦.今天送大家的一句话是: 保持耐心,永远年轻,永远热泪盈眶. 前言 先容我哭一会儿,呜呜呜~昨晚写了一半的文章,还没保存就盖上盖子准备回家,拔下电源准备把电脑塞进书包带回家完成时 ...

  6. (转)Linux中的文件描述符与打开文件之间的关系

    转:http://blog.csdn.net/cywosp/article/details/38965239 1. 概述     在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件.目录文 ...

  7. 【编码】彻底弄懂ASCII、Unicode、UTF-8之间的关系

    计算机中的所有字符,说到底都是用二进制的0.1的排列组合来表示的,因此就需要有一个规范,来枚举规定每个字符对应哪个0.1的排列组合,这样的规范就是字符集. ASCII 全称是“美国信息交换标准码”(A ...

  8. 数据库中char、varchar、varchar2、nvarchar之间的关系

    符串“abc",对于CHAR (20),表示你存储的字符将占20个字节(包括17个空字符),而同样的VARCHAR2 (20)则只占用3个字节的长度,20只是最大值,当你存储的字符小于20时 ...

  9. 请解释下在单线程模型中Message、Handler、MessageQueue、Looper之间的关系

    对于面试,每个职场人士都经历过,面试官更看中你对于技术的理解是否透彻,需要知其所以然,而实际工作中看中的工作效率,都是在使用API的角度来完成任务,当在一家公司呆久了有跳槽的想法时,个人的亲身经历就是 ...

随机推荐

  1. 线程池QueueUserWorkItem

    // Test1.cpp : Defines the entry point for the console application. // #include "stdafx.h" ...

  2. ios水果风暴游戏源码下载

    游戏源码是从那个IOS教程网IOS.662p.com分享给大家的. 这是一款ios水果风暴游戏源码下载,介绍给大家一下,喜欢的朋友可以下载学习一下吧.应用介绍:这是一个以获得高分和挑战更高难度为目的的 ...

  3. Js中数据类型判断的几种方法

    判断js中的数据类型有一下几种方法:typeof.instanceof. constructor. prototype. $.type()/jquery.type(),接下来主要比较一下这几种方法的异 ...

  4. IDEA的优质使用博客资源

    intelliJ idea 使用技巧&方法 IntelliJ IDEA 常用设置讲解 IntelliJ IDEA 详细图解最常用的配置 ,适合刚刚用的新人. IntelliJ IDEA 常见文 ...

  5. SIM900A设备在保加利亚无法正常使用GPRS问题

    1.      SIM900A设备在保加利亚GPRS功能无法正常使用 我们一款手持设备采用SIM900A模块,在发货之前测试正常,但到了保加利亚,客户发现无法正常上网,我们技术支持反馈的邮件反馈的现象 ...

  6. eclipse发布到tomcat

    1.用maven集成的工程,在发布的时候,发现其中的变量没有改变,类似${}不存在之类 解决方式:这个类问题是由于缓存导致,基本方法就是clean一下,重启eclipse,最后不行重启电脑 2.今天遇 ...

  7. maridb 10&period;3 主从复制&comma;待机情况下从库 cpu 占用率高的处理方法

    发现两台从库,一直都在CPU 占用率 60% 90% 中浮动, 但是写库却很正常.搜了一大把没找到答案,把参数测试了一下得出以下结论 slave  my.cnf 添加如下参数 #只读模式 read_o ...

  8. Django模型层&lpar;2&rpar;

    <!DOCTYPE html><html lang="zh-cn"><head><meta charset="utf-8&quo ...

  9. MyBatis &num;&lbrace;&rcub; 和 &dollar;&lbrace;&rcub; 引用值的用法

    1.#{} 引用值的用法 UserMapper配置文件: <select id="queryOne" resultType="cn.tedu.mybatis.bea ...

  10. scapy学习笔记(1)

    转载请注明:小五义 http://www.cnblogs.com/xiao* scapy是python写的一个功能强大的交互式数据包处理程序,可用来发送.嗅探.解析和伪造网络数据包,常常被用到网 ...