今天下午用Java读取从淘宝助理 V4.3 Beta1导出的csv文件,出现中文乱码情况。
一看就是文件编码引起的,不清楚淘宝助理导出的csv文件使用了什么编码,到百度搜索了一下,看到一些相关文章,但测试发现都没有解决这个问题。
最后,我抱着试试看的态度,使用了 utf-16 ,我晕,正常显示中文了。
关于 utf-16 这种编码,这么多看来我还是第一次使用,之前最常用的是 gb2312 和 utf-8 之间的转换。
下面是一个简单的例子:
try { DataInputStream in = new DataInputStream(new FileInputStream(new File("sd.csv"))); BufferedReader br = new BufferedReader(new InputStreamReader(in,"utf-16")); while(br.ready()) { System.out.println(br.readLine()); } br.close(); } catch(IOException err) { err.printStackTrace(); }
2010-05-11