locale把按照所涉及到的文化傳統(tǒng)的各個(gè)方面分成12個(gè)大類,這12個(gè)大類分別是:
語(yǔ)言符號(hào)及其分類(LC_CTYPE)
數(shù)字(LC_NUMERIC)
比較和排序習(xí)慣(LC_COLLATE)
時(shí)間顯示格式(LC_TIME)
貨幣單位(LC_MONETARY)
信息主要是提示信息,錯(cuò)誤信息,狀態(tài)信息,標(biāo)題,標(biāo)簽,按鈕和菜單等(LC_MESSAGES)
姓名書(shū)寫(xiě)方式(LC_NAME)
地址書(shū)寫(xiě)方式(LC_ADDRESS)
電話號(hào)碼書(shū)寫(xiě)方式(LC_TELEPHONE)
度量衡表達(dá)方式 (LC_MEASUREMENT)
默認(rèn)紙張尺寸大小(LC_PAPER)
對(duì)locale自身包含信息的概述(LC_IDENTIFICATION)。
所以說(shuō),locale就是某一個(gè)地域內(nèi)的人們的語(yǔ)言習(xí)慣和文化傳統(tǒng)和生活習(xí)慣。一個(gè)地區(qū)的locale就是根據(jù)這幾大類的習(xí)慣定義的,這些locale定 義文件放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義文件,這些文件都是用文本格式書(shū)寫(xiě)的,你可以用寫(xiě)字板打開(kāi),看看里邊的內(nèi)容,當(dāng)然出了有限的注釋以外,大部分 東西可能你都看不懂,因?yàn)槭怯玫腢nicode的字符索引方式。
對(duì)于de_DE@euro的一點(diǎn)說(shuō)明,@后邊是修正項(xiàng),也就是說(shuō)你可以看到兩個(gè)德國(guó)的locale:/usr/share/i18n/locales /de_DE@euro和/usr/share/i18n/locales/de_DE。打開(kāi)這兩個(gè)locale定義,你就會(huì)知道它們的差別在于 de_DE@euro使用的是歐洲的排序、比較和縮進(jìn)習(xí)慣,而de_DE用的是德國(guó)的標(biāo)準(zhǔn)習(xí)慣。
上面我們說(shuō)到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用戶都知道是系統(tǒng)采用的字符集。
zh_CN.GB2312到底是在說(shuō)什么?Locale是軟件在運(yùn)行時(shí)的語(yǔ)言環(huán)境, 它包括語(yǔ)言(Language), 地域 (Territory) 和字符集(Codeset)。一個(gè)locale的書(shū)寫(xiě)格式為: 語(yǔ)言[_地域[.字符集]]。所以說(shuō)呢,locale總是和一定的字符集相聯(lián)系的。下面舉幾個(gè)例子:
我說(shuō)中文,身處中華人民共和國(guó),使用國(guó)標(biāo)2312字符集來(lái)表達(dá)字符。zh_CN.GB2312=中文_中華人民共和國(guó)+國(guó)標(biāo)2312字符集。
我說(shuō)中文,身處中華人民共和國(guó),使用國(guó)標(biāo)18030字符集來(lái)表達(dá)字符。zh_CN.GB18030=中文_中華人民共和國(guó)+國(guó)標(biāo)18030字符集。
我說(shuō)中文,身處中華人民共和國(guó)臺(tái)灣省,使用國(guó)標(biāo)Big5字符集來(lái)表達(dá)字符。zh_TW.BIG5=中文_臺(tái)灣.大五碼字符集
我說(shuō)英文,身處大不列顛,使用ISO-8859-1字符集來(lái)表達(dá)字符。en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集
我說(shuō)德語(yǔ),身處德國(guó),使用UTF-8字符集,習(xí)慣了歐洲風(fēng)格。de_DE.UTF-8@euro=德語(yǔ)_德國(guó).UTF-8字符集@按照歐洲習(xí)慣加以修正,注意不是de_DE@euro.UTF-8,所以完全的locale表達(dá)方式是 [語(yǔ)言[_地域][.字符集] [@修正值]。
其中,與中文輸入關(guān)系最密切的就是LC_CTYPE,LC_CTYPE規(guī)定了系統(tǒng)內(nèi)有效的字符以及這些字符的分類, 諸如什么是大寫(xiě)字母,小寫(xiě)字母,大小寫(xiě)轉(zhuǎn)換,標(biāo)點(diǎn)符號(hào)、可打印字符和其他的字符屬性等方面。而locale定 義zh_CN中最最重要的一項(xiàng)就是定義了漢字(Class“hanzi”)這一個(gè)大類,當(dāng)然也是用Unicode描述的,這就讓中文字符在Linux系統(tǒng) 中成為合法的有效字符,而且不論它們是用什么字符集編碼的。
怎樣設(shè)定locale呢?
設(shè)定locale就是設(shè)定12大類的locale分類屬性,即12個(gè)LC_。除了這12個(gè)變量可以設(shè)定以外,為了簡(jiǎn)便起見(jiàn),還有兩個(gè)變量:LC_ALL和LANG。它們之間有一個(gè)優(yōu)先級(jí)的關(guān)系:LC_ALL > LC_ >LANG??梢赃@么說(shuō),LC_ALL是最上級(jí)設(shè)定或者強(qiáng)制設(shè)定,而LANG是默認(rèn)設(shè)定值。
如果你設(shè)定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG設(shè)定成什么值,它們都會(huì)被強(qiáng)制服從LC_ALL的設(shè)定,成為 zh_CN.UTF-8。
假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_=en_US.UTF-8,并且沒(méi)有設(shè)定LC_ALL的話,那么系統(tǒng)的locale設(shè)定以LC_=en_US.UTF-8。
假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_,和LC_ALL均未設(shè)定的話,系統(tǒng)會(huì)將LC_設(shè)定成默認(rèn)值,也就是LANG的值z(mì)h_CN.UTF-8。
假如你設(shè)定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設(shè)定的話, 那么系統(tǒng)的locale設(shè)定將是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均會(huì)采用默認(rèn)值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。
所以,locale是這樣設(shè)定的:
如果你需要一個(gè)純中文的系統(tǒng)的話,設(shè)定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當(dāng)然你可以兩個(gè)都設(shè)定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設(shè)定,不要作無(wú)用功。
如果你只想要一個(gè)可以輸入中文的環(huán)境,而保持菜單、標(biāo)題,系統(tǒng)信息等等為英文界面,那么只需要設(shè)定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。
假如你高興的話,可以把12個(gè)LC_*一一設(shè)定成你需要的值,打造一個(gè)古靈精怪的系統(tǒng):LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內(nèi)碼GBK字符集);LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數(shù)字系統(tǒng)) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國(guó)的度量衡使用ISO-8859-15字符集) 羅馬的地址書(shū)寫(xiě)方式,美國(guó)的紙張?jiān)O(shè)定……。估計(jì)沒(méi)人這么干吧。
假如你什么也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統(tǒng)將采用POSIX作為lcoale,也就是C locale。
另外LANG和LANGUAGE有什么區(qū)別呢?
LANG - Specifies the default locale for all unset locale variables
LANGUAGE - Most programs use this for the language of its interface
LANGUAGE是設(shè)置應(yīng)用程序的界面語(yǔ)言。而LANG是優(yōu)先級(jí)很低的一個(gè)變量,它指定所有與locale有關(guān)的變量的默認(rèn)值。
評(píng)論