VIM和BOM
最近发现个怪现象, 从Vim中复制的文本(xsel的方式)和实际文本有点点区别, 会在头部加几个不可见的字节(0xEF 0xBB 0xBF), 粘贴到别的程序里有时会引发错误.
查了下, 原来这几个字节是Unicode的BOM(Byte order mark), 用来标记UTF-16和UTF-32编码文件的字节序, UTF-8并不需要. 但因为这个文件我曾经用Windows的记事本保存过, 它自作聪明地加了个BOM, 而Vim识别到文件有BOM就会自动打开bomb这个选项(具体解释请看Vim中bomb和fileencodings的帮助), so…
于是, 这样, 然后保存就好了:
1 |
:set nobomb |
小提示, 查看当前bomb是否打开可以这样:
1 |
:set bomb? |
——————————–
创建一个文件,输入一行中文,执行
:set fileencoding=utf-8
设置文件编码,并执行
:w
保存,然后执行
:e
重新加载,接着插入BOM头
:1s/^/\="\xef\xbb\xbf"
最后保存并退出:
😡
成功了!
xialulee@xialulee-pc3 ~/lab
$ xxd bom1.txt
0000000: efbb bfe6 b58b e8af 95e4 b880 e4b8 8b42
0000010: 4f4d 0d0a
前三个字节正是ef bb bf。
xialulee@xialulee-pc3 ~/lab
$ vim -c ‘set encoding=shift_jis | set fileencoding=utf-8 | w | e | 1s/^/\="\xef\xbb\xbf"/ | x’ CDImage.ape.cue
可以以非交互的方式使用,配合bash或者cmd的for循环,就可以搞定一堆cue文件了。