Windows教程網 >> Linux系統教程 >> 關於Linux >> Linux系統查找替換非UTF-8編碼文件的方法

Linux系統查找替換非UTF-8編碼文件的方法

日期：2017/1/25 10:14:32 編輯：關於Linux

　　UTF-8是Linux系統下的一種可變長度的字符萬國碼，使用UTF-8碼就可以支持多種語言。但是某些文件並不是UTF-8編碼的，這個時候我們可以用命令來查找替換非UTF-8碼，下面就來介紹一下Linux系統查找替換非UTF-8編碼文件的方法。

　　開始之前，請先安裝enca這個軟件包。enca是Linux等系統下用來查看文件編碼和轉換文件編碼的工具。

　　下面一行Linux命令能夠查找當前目錄下所有文件中，哪些文件不是UTF-8編碼。我對文件加了些限制，用find命令時候，排除了所有目錄下的.svn目錄，且只查找後綴為.php的文件。

　　命令1：

　　jw@~/sqlite>

　　find 。！ -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {}|grep GB2312 》 /dev/null && echo {}” \;

　　./sqlite_utility.php

　　./sqlite_result.php

　　./sqlite_forge.php

　　./sqlite_driver.php

　　既然找到了這些非UTF8編碼的文件，接下來再用一條命令將他們都轉換成UTF8編碼。

　　命令2：

　　jw@~/sqlite>

　　find . ！ -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} | grep GB2312 》/dev/null && enconv -L zh_CN -x UTF-8 {}” \;

　　當你用命令2 全部轉換完成後，如果你期待命令1的輸出為空，那麼你就錯了。實際上英語字母的utf8編碼和ASCII編碼是一樣的。當一個全是英文字母的文件用UTF8 w/o BOM編碼保存，那麼enca會識別他是一個ACSII編碼的文件。所以，你猜到了，命令2做了一些無用功。

　　以上就是Linux系統查找替換非UTF-8編碼文件的方法了，這樣一來就不用擔心Linux文件不是UTF-8編碼而無法顯示其他語言了。

上一頁:Linux系統下的Java進程無故消失怎麼辦？
下一頁:Linux下打開Emacs出現亂碼怎麼解決？

關於Linux

Windows教程網

Linux系統設置自動調整屏幕亮度的方法

　　現在很多電腦或者手機，

Ubuntu安裝aira2的步驟

　　aira2是Ubunt

SUSE創建共享文件夾的步驟

　　SUSE是一款Linu

Linux命令rmdir和rm有什麼不同？

　　Linux系統下rmd

Linux安裝使用Axel的步驟

　　當文件太大的時候可采用

Linux下文件I/O操作的相關知識

　　Linux文件I/O主

Linux系統常見問題解答 Linux教程關於Linux

熱讀排行

RedHat下載安裝JDK的方法

如何辨別Ubuntu中useradd和adduser命令

如何在Linux系統下查找可執行文件

Linux中Firefox安裝Flash插件的具體步驟

怎樣通過VNC遠程連接到Linux系統桌面

Linux屏蔽浏覽器上http請求警報的方法

進入Linux終端界面的方法匯總

在Ubuntu上U盤文件只讀且無法刪除怎麼辦？

Linux信號機制解析

Linux如何通過修改參數優化性能

查看Linux磁盤空間的八大方法

CentOS 6.0如何安裝配置Kamailio

Windows XP	Windows 7	Windows 2003	Windows Vista	Windows教程綜合	Linux 系統教程
Windows 10	Windows 8	Windows 2008	Windows NT	Windows Server	電腦軟件教程