2008年6月22日星期日

Linux下乱码问题解决(文件名,文件,mp3,pdf)

如果是刚刚从windows转到Linux下的,通常都会因为一些中文的问题而放弃,我就是这样装上,卸载搞过好几次,其实这种心态是永远都学不到东西的,真正的学者都具有一颗大无畏的精神,在他们的字典里是找不到退缩的,好了,不扯了,下面转入正题。
这里我用到了三个工具,convmv, iconv, python-mutagen.分别处理上述三个问题,下面一一介绍:

convmv 实现文件名字的转换:


sudo apt-get install convmv
convmv -f code1 -t code2 -r


code1:目录原来使用的字符集编码。支持gb2312, gbk, big5,不支持gb18030和big5-hkscs
code2:预转换到的字符集编码。对于ubuntu,这里填写utf8
-r 参数:转换子目录
-f : from
-t : to
dir:要转换的目录
man convmv查看帮助文件,这个非常有用,学会看Linux的帮助文档对于Linux和英语的学习都有很大益处,强烈建议大家多使用man命令:)

iconv实现文件内容的转换:

iconv -f code1 -t code2 oldfile > newfile


其他命令和参数请大家使用man进行查阅,并不是我懒,我是不想让大家变懒,不管怎样,我们都应该自己去体会这个过程,这样才能把它真正学会。

python-mutagen---mp3 ID3 tags设置工具

Mutagen 是一个用来处理声音相关数据的 Python 模块.它支持 ID3(所有版本),APEv2,Ogg Vorbis,FLAC和Ogg FLAC读取,以及ID3v1.1,ID3v2.4,APEv2,Ogg Vorbis,FLAC还有Ogg FLAC信息写入.也可以用来读取MPEG音频和Xing标题.FLAC流信息块,以及Ogg vorbis,Ogg FLAG流标题.最后,它包含一个处理Ogg 流的模块.

mid3v2 -a artist -A album -t title -c comment -g genre mp3file

设置mp3file的ID3 tags

find . -iname "*.mp3" -execdir mid3iconv -e GBK {} \;

这会转换当前目录其子目录中的 mp3 文件标签编码为正确的 utf8,-execdir意思是对查到的每个文件执行后面的shell脚本,脚本中-e GBK意思是文件原来使用的字符集编码,读者还可以man find一下,看看-iname和-name的区别,呵呵,总是喜欢给你们卖关子:)

PDF乱码问题解决:

第一步,安装中文语言支持包:

sudo apt-get install xpdf-chinese-simplified xpdf-chinese-traditional


安装完后打开pdf文档,如果发现仍然是乱码,进行第二步,安装安装poppler-data:从8.04开始,源中开始提供poppler-data安装包的支持,可以直接输入命令


sudo apt-get install poppler-data


或者去官方下载tar.gz压缩包自己安装,网址是
http://poppler.freedesktop.org/,自己编译安装,在此不在熬述

若第一,二步完成后,打开pdf文档中文乱码都变成方块的话,就进行第三步,删除字体


sudo rm /etc/fonts/conf.d/49-sansserif.conf

好了,到这里,相信大家可以开心的使用Linux了,我是很开心啦,一次性解决了乱码问题是一方面,另一方面,今天我的blog被Google收录了,呵 呵,这就意味这我的这些笔记可以给更多的人提供参考了,同样我的笔记也借鉴了很多人的笔记,正所谓取之于民,用之于民也 :)

没有评论: