国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - C/C++ - C++實現判斷一個字符串是否為UTF8或GBK格式的方法

C++實現判斷一個字符串是否為UTF8或GBK格式的方法

2021-06-10 15:44黑夜童話 C/C++

這篇文章主要介紹了C++實現判斷一個字符串是否為UTF8或GBK格式的方法,涉及C++針對字符編碼的遍歷、判斷、編碼轉換等相關操作技巧,需要的朋友可以參考下

本文實例講述了C++實現判斷一個字符串是否為UTF8或GBK格式的方法。分享給大家供大家參考,具體如下:

在處理外部數據的時候,很可能因為數據格式不一樣而導致亂碼,甚至導致某些程序掛掉。鑒于對多數系統來說,使用是更被廣泛使用的utf8,所以判斷是不是utf8格式顯得很重要了。

下面是一個判斷字符串是否為utf8的函數:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
bool is_str_utf8(const char* str)
{
  unsigned int nBytes = 0;//UFT8可用1-6個字節編碼,ASCII用一個字節
  unsigned char chr = *str;
  bool bAllAscii = true;
  for (unsigned int i = 0; str[i] != '\0'; ++i){
    chr = *(str + i);
    //判斷是否ASCII編碼,如果不是,說明有可能是UTF8,ASCII用7位編碼,最高位標記為0,0xxxxxxx
    if (nBytes == 0 && (chr & 0x80) != 0){
      bAllAscii = false;
    }
    if (nBytes == 0) {
      //如果不是ASCII碼,應該是多字節符,計算字節數
      if (chr >= 0x80) {
        if (chr >= 0xFC && chr <= 0xFD){
          nBytes = 6;
        }
        else if (chr >= 0xF8){
          nBytes = 5;
        }
        else if (chr >= 0xF0){
          nBytes = 4;
        }
        else if (chr >= 0xE0){
          nBytes = 3;
        }
        else if (chr >= 0xC0){
          nBytes = 2;
        }
        else{
          return false;
        }
        nBytes--;
      }
    }
    else{
      //多字節符的非首字節,應為 10xxxxxx
      if ((chr & 0xC0) != 0x80){
        return false;
      }
      //減到為零為止
      nBytes--;
    }
  }
  //違返UTF8編碼規則
  if (nBytes != 0) {
    return false;
  }
  if (bAllAscii){ //如果全部都是ASCII, 也是UTF8
    return true;
  }
  return true;
}

關于utf8的一般性簡介和二進制格式可以參考百度百科。同樣關于GBK的判斷,也是使用的同樣的方法,具體代碼如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
bool is_str_gbk(const char* str)
{
  unsigned int nBytes = 0;//GBK可用1-2個字節編碼,中文兩個 ,英文一個
  unsigned char chr = *str;
  bool bAllAscii = true; //如果全部都是ASCII,
  for (unsigned int i = 0; str[i] != '\0'; ++i){
    chr = *(str + i);
    if ((chr & 0x80) != 0 && nBytes == 0){// 判斷是否ASCII編碼,如果不是,說明有可能是GBK
      bAllAscii = false;
    }
    if (nBytes == 0) {
      if (chr >= 0x80) {
        if (chr >= 0x81 && chr <= 0xFE){
          nBytes = +2;
        }
        else{
          return false;
        }
        nBytes--;
      }
    }
    else{
      if (chr < 0x40 || chr>0xFE){
        return false;
      }
      nBytes--;
    }//else end
  }
  if (nBytes != 0) {   //違返規則
    return false;
  }
  if (bAllAscii){ //如果全部都是ASCII, 也是GBK
    return true;
  }
  return true;
}

按照編碼規則這么寫,是正確的。但鑒于現在的utf8對于中文一般都是三個字節,而且utf8的編碼規則存在重合,如果是utf8,使用上面的這個函數,就會出現一個尷尬的問題,當中文字符為奇數個判斷正確,為則偶數個無法區別。

最后:如果誰有更好的辦法判斷一個字符串是否為GBK格式,歡迎告知。

希望本文所述對大家C++程序設計有所幫助。

原文鏈接:http://blog.csdn.net/thedarkfairytale/article/details/73457200

延伸 · 閱讀

精彩推薦
  • C/C++學習C++編程的必備軟件

    學習C++編程的必備軟件

    本文給大家分享的是作者在學習使用C++進行編程的時候所用到的一些常用的軟件,這里推薦給大家...

    謝恩銘10102021-05-08
  • C/C++深入理解goto語句的替代實現方式分析

    深入理解goto語句的替代實現方式分析

    本篇文章是對goto語句的替代實現方式進行了詳細的分析介紹,需要的朋友參考下...

    C語言教程網7342020-12-03
  • C/C++C語言實現電腦關機程序

    C語言實現電腦關機程序

    這篇文章主要為大家詳細介紹了C語言實現電腦關機程序,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下...

    xiaocaidayong8482021-08-20
  • C/C++C/C++經典實例之模擬計算器示例代碼

    C/C++經典實例之模擬計算器示例代碼

    最近在看到的一個需求,本以為比較簡單,但花了不少時間,所以下面這篇文章主要給大家介紹了關于C/C++經典實例之模擬計算器的相關資料,文中通過示...

    jia150610152021-06-07
  • C/C++c++ 單線程實現同時監聽多個端口

    c++ 單線程實現同時監聽多個端口

    這篇文章主要介紹了c++ 單線程實現同時監聽多個端口的方法,幫助大家更好的理解和學習使用c++,感興趣的朋友可以了解下...

    源之緣11542021-10-27
  • C/C++C++之重載 重定義與重寫用法詳解

    C++之重載 重定義與重寫用法詳解

    這篇文章主要介紹了C++之重載 重定義與重寫用法詳解,本篇文章通過簡要的案例,講解了該項技術的了解與使用,以下就是詳細內容,需要的朋友可以參考下...

    青山的青6062022-01-04
  • C/C++C語言中炫酷的文件操作實例詳解

    C語言中炫酷的文件操作實例詳解

    內存中的數據都是暫時的,當程序結束時,它們都將丟失,為了永久性的保存大量的數據,C語言提供了對文件的操作,這篇文章主要給大家介紹了關于C語言中文件...

    針眼_6702022-01-24
  • C/C++詳解c語言中的 strcpy和strncpy字符串函數使用

    詳解c語言中的 strcpy和strncpy字符串函數使用

    strcpy 和strcnpy函數是字符串復制函數。接下來通過本文給大家介紹c語言中的strcpy和strncpy字符串函數使用,感興趣的朋友跟隨小編要求看看吧...

    spring-go5642021-07-02
Weibo Article 1 Weibo Article 2 Weibo Article 3 Weibo Article 4 Weibo Article 5 Weibo Article 6 Weibo Article 7 Weibo Article 8 Weibo Article 9 Weibo Article 10 Weibo Article 11 Weibo Article 12 Weibo Article 13 Weibo Article 14 Weibo Article 15 Weibo Article 16 Weibo Article 17 Weibo Article 18 Weibo Article 19 Weibo Article 20 Weibo Article 21 Weibo Article 22 Weibo Article 23 Weibo Article 24 Weibo Article 25 Weibo Article 26 Weibo Article 27 Weibo Article 28 Weibo Article 29 Weibo Article 30 Weibo Article 31 Weibo Article 32 Weibo Article 33 Weibo Article 34 Weibo Article 35 Weibo Article 36 Weibo Article 37 Weibo Article 38 Weibo Article 39 Weibo Article 40
主站蜘蛛池模板: 日韩成人在线播放 | 欧美色综合天天久久综合精品 | 国产精品久久久久久久久 | 国产黄色91视频 | av免费人人干 | 日韩成人一区 | 亚洲欧美另类久久久精品2019 | 日韩精品久久久久久 | 久久久久久亚洲 | 日本欧美久久久久免费播放网 | 日韩av免费在线观看 | 91性高湖久久久久久久久网站 | 国产不卡精品视频 | 欧洲精品久久久 | 亚洲人成网站999久久久综合 | 国产成人免费视频网站高清观看视频 | 成人欧美一区二区三区白人 | 成人午夜在线视频 | 91精品国产综合久久久久久丝袜 | 欧美午夜在线观看 | 在线欧美日韩 | 国产伦精品一区二区三区四区视频 | 精品一区二区三区四区五区 | 欧美精品v国产精品v日韩精品 | 人人鲁人人莫一区二区三区 | 欧美日在线 | 久久精品国产一区二区三区不卡 | 久久久亚洲 | 国产精品v | 久久精品高清 | 免费毛片黄色视频 | 一本大道香蕉大a√在线 | 亚洲色图在线观看 | 久久婷婷av| 中文字幕亚洲国产 | 涩涩天堂| 国产日韩欧美在线观看 | 亚洲欧美精品 | 欧美一级做a爰片久久高潮 免费在线毛片 | 国产精品爱久久久久久久 | 综合久久99 |