简介:
一般来说,乱码的出现有2种原因:
一种是由于网页编码格式设置错误,导致浏览器以错误的编码来解析,产生乱码;
第二种就是文件被以错误的编码打开,然后保存,比如一个文本文件原先是GB2312 编码的,却以UTF-8 编码打开再保存,就会出现乱码的问题。
编码相关:
编码(encode)是把数据从一种形式转换为另外一种形式的过程,它是一套算法,比如这里的字符 A 转换成 01000001 就是一次编码的过程,解码(decode)就是编码的逆过程。
常见分类:
ASCII,EASCII(扩展的ASCII),GB2312,Unicode,GBK,UTF-8,BIG5等