在最近的一個項目中遇到了一個奇怪的事情,代碼中沒有,可是一打開網(wǎng)頁就多出了一行代碼:
這一行代碼導(dǎo)致div之間存在縫隙,
網(wǎng)上找了很久原因,發(fā)現(xiàn)原來是因為編碼的原因?qū)е碌?在保存代碼的時候保存成UTF+BOM格式,所導(dǎo)致的原因,為什么加上BOM就會這樣呢?
UTF-8 編碼的文件可以分為no BOM 和 BOM兩種格式。
何謂BOM? "EF BB BF" 這三個字節(jié)就叫BOM,BOM的全稱叫做"Byte Order Mard".在utf-8文件中常用BOM來表明這個文件是UTF-8文件,而BOM的本意實在utf16中用來表示高低字節(jié)序列的。在字節(jié)流之前有BOM表示采用低字節(jié)序列(低字節(jié)在前面),而utf8不用考慮字節(jié)序列,所以其實有無BOM都可以。UTF-8以字節(jié)為編碼單元,沒有字節(jié)序的問題。UTF-16以兩個字節(jié)為編碼單元,在解釋一個UTF-16文本前,首先要弄清楚每個編碼單元的字節(jié)序。
在 UCS編碼中有一個叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實際傳輸中。UCS規(guī)范建議我們在傳輸字節(jié)流前,先傳輸 字符"ZERO WIDTH NO-BREAK SPACE"。 這樣如果接收者收到FEFF,就表明這個字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個字節(jié)流是Little-Endian的。因此字 符"ZERO WIDTH NO-BREAK SPACE"又被稱作BOM。
UTF-8不需要BOM來表明字節(jié)順序,但可以用BOM 來表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF(讀者可以用我們前面介紹的編碼方法驗證一下)。所以如果接收者收到以EF BB BF開頭的字節(jié)流,就知道這是UTF-8編碼了。