STM32 如何根据汉字的 GBK编码，查到对应的汉字

STM32LWIP · 发表于 2020-9-22 13:58:16

STM32 如何根据汉字的 GBK编码，查到对应的汉字：比如对方通过总线传来一个汉字的  GBK 编码  （加入 “哈”的 GBK编码是 02  A6），  怎样把这个编码  转成汉字（哈），然后通过发送出去给其他文字处理服务器：    收到字符串 char str[2] ,其中， str[0] = 0x02; str[1] = 0xA6

   convert(&str)  --->对应汉字 “哈”

   send_HTTP（“哈"，“xxx.com/ASR/...API”）;

   是要把GKB的对应表  放到Flash中？  到那里  GKB 表头文件？  怎么加入STM工程？

谢谢！

szczyb1314 · 发表于 2020-9-22 13:58:17

1.任何代码都不“认识”汉字，只认识二进制的0和1（16进制方便表示）
2.汉字GBK编码以2个字节内码的形式表示汉字
   第一字节0x81 - 0xFE(126个，称为区)
   第二字节分为两部分： 0x40 - 0x7E (63个)
                                    0X80 - 0XFE（127个）
每区63+127=190个汉字，共126*190=23940个汉字(基本使用足够了)
  这里汉字其实是  0x81 0x40（第一个汉字) 0x81 0x41（第二个汉字）......0xfe 0xfe(第23940个汉字)的固定顺序对应固定的汉字顺序，这个网上可以查到
3.GBK内码，要发送出去，那就是接收方负责解析(先判断是否大于0x80，若小于则是ASCII码，若大于则跟后面一字节一起当作汉字解析)；要是自己是接受方，也是将接受到的数组做一样的判断
4.你已经得到汉字的GBK编码了，也就是说你已经知道是哪个汉字了。把这个编码给处理云，处理云应该也是根据GBK编码识别汉字的

LcwSwust · 发表于 2020-9-22 15:12:43

利用VB从字库中提取汉字字模代码.pdf (160.09 KB, 下载次数: 8)

翼行园子 · 发表于 2020-9-22 15:23:50

看下原子的汉字显示例程那个章节

STM32LWIP · 发表于 2020-9-22 15:45:09

大家可能理解错了，我不是要字模：我从通信线上得到汉字的 GBK码（两个Byte）比如 01 A5 它实际对应的汉字是 “哈”，然后我要访问文字处理云

处理云的代码如下：这里是 “欢迎使用 ”、但我在这段代码之前的得到的是 “02A6 01A8 03A7 02B6“ 不知道怎么通过查表把他们变成 “欢迎使用”

#define TTS_TEXT "欢迎使用”

nt data_len = snprintf(request_data, 1024, "lan=zh&cuid=ESP32&ctp=1&tok=%s&tex=%s", baidu_access_token, TTS_TEXT);

esp_http_client_set_post_field(http_client, request_data, data_len);

阿侑kevin · 发表于 2020-9-22 16:08:51

STM32LWIP 发表于 2020-9-22 15:45
大家可能理解错了，我不是要字模：我从通信线上得到汉字的 GBK码（两个Byte）比如 ...

只是编码方式不同而已，比如你说的02A6，GBK编码是哈，在UTF-8里面又是另一个东西，对于控制器来说都是二进制的，在处理的时候只要知道从哪个字节开始是你要的东西，然后保存再通过你想要的编码方式显示出来就行，02A6你可以显示成二进制、八进制、十进制、十六进制、GBK、UTF-8、UTF-16等等