UPDATE 2018-08-02
其实,
的全称是 Non-Breaking SPace,即不换行空格,也称为硬空格;顾名思义,它的最主要的作用就是确保其两边不会被自动换行,比如有门牌号
5 单元,102 室
,可以改为5 单元,102 室
,这样将确保数字与后缀之间不会被换行。另外,不像普通的空格,连续的多个不换行空格不会被合并成一个。
这两天在做一个正则验证器,要从页面里的编辑器中获取正则表达式和匹配文本,一般情况下还好,可只要两者中包含空格,就会匹配失败,哪怕它们的内容都是一样的。后来才发现,正则中的空格是只是普通空格,而匹配文本因为是即时处理的,它包含的空格在匹配之前已经被处理成了
;
普通空格在utf-8里的编码是 \u0020
,而
的编码是 \u00A0
;这俩压根就不是同一个字,自然会匹配失败了。
p.s.
shit! shit! shit!