問題:在用Java程序進行讀寫含中文的txt文件時,經常會出現讀出或寫入的內容會出現亂碼。原因其實很簡單,就是系統的編碼和程序的編碼采用了不同的編碼格式。通常,假如自己不修改的話,windows自身采用的編碼格式是gbk(而gbk和gb2312基本上是一樣的編碼方式),而IDE中Encode不修改的話,默認是utf-8的編碼,這就是為什么會出現亂碼的原因。當在OS下手工創建并寫入的txt文件(gbk),用程序直接去讀(utf-8),就會亂碼。為了避免可能的中文亂碼問題,最好在文件寫入和讀出的時候顯式指定編碼格式。
1、寫文件:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
public static void writeFile(String fileName, String fileContent) { try { File f = new File(fileName); if (!f.exists()) { f.createNewFile(); } OutputStreamWriter write = new OutputStreamWriter( new FileOutputStream(f), "gbk" ); BufferedWriter writer= new BufferedWriter(write); writer.write(fileContent); writer.close(); } catch (Exception e) { e.printStackTrace(); } } |
2、讀文件:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
public static String readFile(String fileName) { String fileContent = "" ; try { File f = new File(fileName); if (f.isFile()&&f.exists()) { InputStreamReader read = new InputStreamReader( new FileInputStream(f), "gbk" ); BufferedReader reader= new BufferedReader(read); String line; while ((line = reader.readLine()) != null ) { fileContent += line; } read.close(); } } catch (Exception e) { e.printStackTrace(); } return fileContent; } |