C++ – 动态链接库dll为什么要使用unsigned char作为byte的内部格式-StubbornHuang Blog

C++ – 动态链接库dll为什么要使用unsigned char作为byte的内部格式

StubbornHuang C++ 发布于2022-05-25 阅读 1,974次 0次评论 0次点赞本文共1295个字，阅读需要4分钟。

1 dll为什么要使用unsigned char*作为byte字节数组的内部格式

byte指的是字节，一个字节是8位2进制。

char型占内存也是一个字节，实质上是一个字节长度的有符号整型数，最高位是符号位，另7位是数据位，表示数值-128到127。

而unsigned char没有符号位，因此能表示0~255，这个好理解，2的8次方，最多256种情况，因此无论如何都能表示256个数字。

将byte的值取出赋值给int，long等其它类型时，系统会最高位进行扩展。如果使用符号类型（char），则以符号位（最高位）扩展，会造成数据错误；如果使用无符号类型（unsigned char），则以零扩展，并不会造成数据错误，因此常用unsigned char常用来表示byte。

首先我们通常意义上理解，byte没有什么符号位之说，更重要的是如果将byte的值赋给int，long等数据类型时，系统会做一些额外的工作。如果是char，那么系统认为最高位是符号位，而int可能是16或者32位，那么会对最高位进行扩展（注意，赋给unsigned int也会扩展）而如果是unsigned char，那么不会扩展。最高位若为0时，二者没有区别，若为1时，则有区别了。同理可以推导到其它的类型，比如short，unsigned short等等。

可以查看以下代码：

#include <stdio.h>

void f(unsigned char v)
{
    char c = v;
    unsigned char uc = v;
    unsigned int a = c, b = uc;
    int i = c, j = uc;
    printf("----------------\n");
    printf("%%c: %c, %c\n", c, uc);
    printf("%%X: %X, %X\n", c, uc);
    printf("%%u: %u, %u\n", a, b);
    printf("%%d: %d, %d\n", i, j);
}


int main(int argc, char* argv[])
{
    f(0x80);
    f(0x7F);
    return 0;
}

输出结果：

----------------
%c: €, €
%X: FFFFFF80, 80
%u: 4294967168, 128
%d: -128, 128
----------------
%c: , 
%X: 7F, 7F
%u: 127, 127
%d: 127, 127

分析
对于(signed)char来说，0x80用二进制表示为1000 0000，当它作为char赋值给unsigned int或 int 时，系统认为最高位是符号位，会对最高位进行扩展。而0x7F用二进制表示为0111 1111，最高位为0，不会扩展。

对于unsigned char来说，不管最高位是0，还是1，都不会做扩展。

使用unsigned char作为byte的内部格式的原因主要是保证通过字节流传递的数据是正确的。

参考链接

联系我

资助我们

随机推荐

资源分享 – 游戏开发物理学（第2版）Physics for Game Developers 中文PDF下载

C++ – 从std::string的文件路径中获取文件夹、文件名、文件后缀名

计算机图形学 – 大白话模型视图投影矩阵(MVP)以及各种变换空间(模型空间、世界空间、相机空间、裁剪空间、屏幕空间)

ThreeJS – 直接设置Fbx模型的某个关节的位移和旋转值

资源分享 – The Algorithms and Principles of Non-photorealistic Graphics – Artistic Rendering and Cartoon Animation 英文PDF下载

C++ – std::map – 存储动态指针时正确释放内存

最新评论

C++ – 动态链接库dll为什么要使用unsigned char作为byte的内部格式

1 dll为什么要使用unsigned char*作为byte字节数组的内部格式

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

资源分享 – 游戏开发物理学（第2版）Physics for Game Developers 中文PDF下载

C++ – 从std::string的文件路径中获取文件夹、文件名、文件后缀名

计算机图形学 – 大白话模型视图投影矩阵(MVP)以及各种变换空间(模型空间、世界空间、相机空间、裁剪空间、屏幕空间)

ThreeJS – 直接设置Fbx模型的某个关节的位移和旋转值

资源分享 – The Algorithms and Principles of Non-photorealistic Graphics – Artistic Rendering and Cartoon Animation 英文PDF下载

C++ – std::map – 存储动态指针时正确释放内存

最新评论

C++ – 动态链接库dll为什么要使用unsigned char作为byte的内部格式

1 dll为什么要使用unsigned char*作为byte字节数组的内部格式

发表评论 点击这里取消回复。

大家都在搜

关注我们的公众号

发表评论点击这里取消回复。