今天寫代碼時需要實現獲取文件大小的功能,目前有兩種實現方法,一種是使用File的length()方法;另外一種是使用FileInputStream的available()方法,當InputStream未進行read操作時,available()的大小應該是等于文件大小的。但是在處理大文件時,后者會發生問題。我們來看一下:
在例子中,我使用了CentOS 6.5 的安裝鏡像文件,主要是考慮到這個文件足夠大(大于2GB)。
1.使用File的length()方法
1
2
3
4
5
6
7
8
|
public static void main(String[] args) { File f= new File( "D:\\CentOS-6.5-x86_64-bin-DVD1.iso" ); if (f.exists() && f.isFile()){ logger.info(f.length()); } else { logger.info( "file doesn't exist or is not a file" ); } } |
我們看一下輸出結果:
4467982336
結果是4.16GB,與Windows上顯示的結果一致。
接下來我們看一下通過FileInputStream來獲取的文件大小:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
public static void main(String[] args) { FileInputStream fis= null ; try { File f= new File( "D:\\CentOS-6.5-x86_64-bin-DVD1.iso" ); fis= new FileInputStream(f); logger.info(fis.available()); } catch (Exception e){ logger.error(e); } finally { if ( null !=fis){ try { fis.close(); } catch (IOException e) { logger.error(e); } } } } |
下面是運行結果:
2147483647
這個結果是不是很眼熟?它是Integer.MAX_VALUE,也就是有符號整型能表示的最大數值。
那么換算成熟悉的單位,這種方式獲取的文件大小是多大呢?
約等于2GB,這顯然不是正確的結果。
究其原因,File的length()方法返回的類型為long,long型能表示的正數最大值為:9223372036854775807,折算成最大能支持的文件大小為:8954730132868714 EB字節,這個量級將在人類IT發展史上受用很多很多年,而FileInputStream的avaliable()方法返回值是int,在之前也介紹了最大的表示范圍,所能支持的最大文件大小為:1.99GB,而這個量級我們現在很容易就達到了。
2014年3月31日補充:
針對流式方法讀取大文件大小也不是不可行,只是不能再使用傳統的java.io.*下的包了,這里要用到java.nio.*下的新工具——FileChannel。下面我們來看下示例代碼:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
public static void main(String[] args) { FileChannel fc= null ; try { File f= new File( "D:\\CentOS-6.5-x86_64-bin-DVD1.iso" ); if (f.exists() && f.isFile()){ FileInputStream fis= new FileInputStream(f); fc= fis.getChannel(); logger.info(fc.size()); } else { logger.info( "file doesn't exist or is not a file" ); } } catch (FileNotFoundException e) { logger.error(e); } catch (IOException e) { logger.error(e); } finally { if ( null !=fc)){ try { fc.close(); } catch (IOException e){ logger.error(e); } } } } |
使用FileChannel后得到的結果與第一種情況吻合,準確地描述了文件的準確大小。
這里也同樣提醒各位技術同仁,涉及到大文件讀取的時候,對int類型的數據一定要留個心,以免出現隱藏的bug,定位起來很困難。
感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!