題目:
編寫一個截取字符串的函數,輸入為一個字符串和字節數,輸出為按字節截取的字符串。 但是要保證漢字不被截半個,如“我ABC”4,應該截為“我AB”,輸入“我ABC漢DEF”,6,應該輸出為“我ABC”而不是“我ABC+漢的半個”。
如果是charset(gb2312, GBK, BIG5), 漢字占兩個字節,問題的關鍵在于考慮截取長度的最后一個字節,如果是屬于一個漢字的第一個字節,忽略即可,而漢字每個字節前都是1,所以都是負數,采用if(byte[i]<0)判斷是否是漢字的最后一個字節。
目前看到的最好的辦法:
import java.io.UnsupportedEncodingException; public class StringSpliter { static void fun1(String str, int length) throws UnsupportedEncodingException { // System.out.println(str.getBytes().length); byte[] bt = str.getBytes("gbk"); for (int i = 0; i < bt.length; i++) { // 打印出字節數組中的值,可以看出只要是漢字[采用GBK編碼時占兩個字節/UTF-8占3個字節],并且為兩個負整數 // 由于字節的第一位都是1,所以它就是由負數來表示的 System.out.println(bt[i]); } // 打印出按實際出入的字節數的所截字符串 // System.out.println(new String(bt,0,length)); // 判斷最后一個是否為負,如果是負的則丟掉該字節 if (bt[length] < 0) { System.out.println(new String(bt, 0, --length, "gbk")); } else { System.out.println(new String(bt, 0, length, "gbk")); } } public static void main(String[] args) { // StringSpliter.fun1("我ABC", 4); try { StringSpliter.fun1("我ABC漢DEF", 7); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。