突然看到发表文章的温馨提示:1汉字 = 3字节
想想印象里好象都是1汉字 = 2字节的,不理解,只好百度了一下,出来的东西有点杂。
“在GB2312编码中一个汉字占2个字节,而在UTF-8中,一个汉字要占3个字节”。“UTF-8编码(其实是一种Unicode编码) 或Unicode编码 本身就支持了,简体字. 繁体字, 英文,俄文,日文,韩文...等等..”
网站用UTF-8显然多占了一半的空间,但是这样就应该能够保证在不同语言版本的系统中不会变成乱码吧。
又看到一篇说汉UTF-8字占4字节的。。。吐血,不明所以中。。。