当你输出第一个程序代码“helloworld!”的时候,刚开始对于编程懵懂状态下,只单纯地认为这是一句英文,如果在编程老手的内心,则会想到这是输出了字符串类型的数据!
是的,不论是数字还是英文字母,亦或是其他形式的东西,到了计算机的大脑中都会把它们区分成不同的数据类型进行存储。
从上图可以大概先了解一下,数据类型都是什么。在PHP中数据类型大致分为了String(字符串),Integer(整型),Float(浮点型),Boolean(布尔型),Array(数组),Object(对象),NULL(空值)这七种常用的数据类型,还有一种名为resource资源类型,是一种特殊的变量,感兴趣可以进行了解一下。
String(字符串)
了解字符串先得明白字符是什么!在PHP官方文档中定义中,这么表示:一个字符串就是由一系列的字符组成,其中每个字符等同一个字节,这意味着PHP只能支持的字符集,因此不支持Unicode。
这是一串中文字,每一个字都认识,连在一起却不知道是什么意思。很多人有这种困惑,倒也可以理解,字符字节这些到底是什么意思呢?
字节:英文名Byte,是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。
字符:字符指类字形单位或符号,包括字母、数字、运算符号、标点符号和其他符号,以及一些功能性符号。
越看越迷糊,还是听绕的。用大白话说,字节是字符存储到计算机中占用多少的计量单位。那么就可以认定“1,QEW,、,\,
,我”,双引号之内的符号都属于字符的一种,但是由于解码程序的问题,它们这些在不同的编码形态中,占用计算机存储的字节数量多少是不一样的。之前有说过机器是无法识别人类的语言,所以想要让机器得知我们在干什么,就得转换成机器语言。机器语言就是开闭,也就是二进制0或1。
如何存储这些开闭二进制的数据呢?就是用字节来表示,通常一个字节有八位,就是能一个字节能存八个开或闭之和。每一个开闭的存储之地又叫位元组,8个位元组的内容存储大家为一个字节。
说到这里,相信有一部分朋友已经大概了解了。没明白的可以反复阅读,加深概念。
那么字符和字节如果理解清楚了,字符集又是什么呢?粗浅理解,字符的集合就是字符集!
没毛病铁子,字符的集合就是字符集,但是如果有面试官问你的时候,这么说显得很浅薄,深入了解之后,说的科学性一点,入职邀请就到手了。
既然字符是符号,字节是存储这种符号的计量单位,而每个字节的位元组只有8位,不论如何排列也就是2的8次方中组合,西方字母一共就26个,大小写加在一起也就是52个,即使加上!,
等特殊符号,中排列组合是足足有余了。更是因为最早的电脑本来就是美国发明创造的,率先用自己的第一语言去研究使用电脑也是正常的,所以最早出现字符集的地区自然是美国了,研究这个字符集的机构把它取名为AmericanStandardCodeforInformationInterchange(美国信息交换标准代码),简称ASCLL,传到国内谐音阿斯克码。
科技大发展,ascll码的确满足了美国西欧等一些国家对电脑的使用,可是对于全世界的普及却显得捉襟见肘。
光一个中国汉字数量就远超欧美字母数量,研发新的字符集是大势所趋。后面也相继在世界各国机构的努力下,Unicode字符集编码的诞生,支持现今世界各种不同语言的书面文本的交换、处理及显示。
我国国家标准总局发布的字符集为《信息交换用汉字编码字符集·基本集》,又名GB。不过目前主流使用的编码格式为UTF-8,是Unicode的一个使用方式。
其实一个系统中加载什么样的字符集去解析字符的操作,还是需要看需求是什么,只有多多了解不同的编码特性,才会写出性能高超的代码!如果你也想开启自己的人生BUG,赶紧