linux cp acp,Windows上的字符转换之CP-FreeNAS中文网

admin 管理员组

文章数量: 887021

linux cp acp,Windows上的字符转换之CP

Windows API函数MultiByteToWideChar用于多字节编码字符串向宽字符串(即UTF-16 LE)的转码。它的第一个参数的常用值是CP_ACP和CP_OEMCP。这到底指的是什么代码页呢？我编了小程序做了实验。

CP_ACP和CP_OEMCP，分别是指当前计算机上的Windows操作系统的Windows代码页与OEM代码页。对于东亚的简体中文、繁体中文、日文、韩文等Win操作系统语言环境，这两种代码页是同一个，如简体中文是代码页936即GB2312字符集，繁体中文是950即大五码字符集，韩文是949、日文是932。对于西方国家的拼音文字语言设置，两个代码页不同。典型的如English_US，其Windows代码页是1252、OEM代码页是437，还有第三个代码页ISO-8859-1又称Latin-1或“西欧语言”，是针对英语法语西语德语等西欧语言的扩展ASCII字符集。这三者(1252、437、8859-1)都是针对英语但并不相同。

为什么会有Windows代码页与OEM代码页的区别呢？因为在八十年代DOS系统时期，还是“字符终端”的屏幕只能够显示的256个字符，这些字符的字形的点阵信息存储在硬件的ROM中。DOS操作系统通过系统中断调用驱动程序把这些字形读出来写入显存。这是由OEM负责字符集中有哪些字符，显示时为什么字形的时代，而且一台PC上只有这么一套字符集/字形，没得选，除非你再差一个带字库的“汉卡”。进入了微软的Windows操作系统时代之后，由于硬件的发展，操作系统有了自己的字形文件，绘制字符时不再真地去读ROM，而是用字形文件(就是字体fonts文件)来把字符的形状写入显存。可以选择用哪种字形：如有衬线的Times NewRome，还是无衬线的Sans Serif。操作系统默认使用的字符集，就由微软来定义了，如English_US使用Codepage1252；简体中文使用Codepage936(即国标2312). 至于那个OEM436，就是legacy，用于向后兼容。

综上，就这么点事。CP_ACP和CP_OEMCP，分别是UINT的0和1。在WinNls.h中的注释说明分别是“default to ANSI code page”，“default to OEM code page”。所以，在简体中文Windows，这两个宏表示的都是代码页936.

下述程序代码片段用于测试

UINT codepage=936;

char str[]="我们中国"; //这个char[]必然是多字节编码字符串

DWORD len;

// 得到我们要转换的MyString为UNICODE所需要的UNICODE缓冲区的长度

len = MultiByteToWideChar(codepage, 0, str, -1, 0, 0);

wchar_t *buf=new wchar_t[len+10];

MultiByteToWideChar(codepage, 0, str, -1, buf, len);

setlocale(LC_CTYPE,"");//把当前locale字符环境从C/C++缺省的"C"设置，改为操作系统的设置(即代码页936)

wprintf(L"%s",buf); //因为这个C标准库函数的实现，是把宽字符输入又转化为多字节字符去显示，所以必须正确设置当前操作系统的多字节编码的代码页

结果：

1. 输入是char str[]="我们中国"; UINT codepage=936或者54936(这是GB18030代码页)或者CP_ACP或者CP_OEMCP，都能正确打印出结果“我们中国”。

2. 输入是char str[]="иい瓣"; UINT codepage=950; 也能正确把上述大五码字符串打印出宽字符串输出结果“我们中国”。

3. 输入是char str[]="鎴戜滑涓浗 "; UINT codepage=65001; 也能正确把上述UTF-8字符串打印出宽字符串输出结果“我们中国”。

附录：

一个在线GB/BIG5/UTF-8/UNICODE转码的网站.php

ps. 实际上，简体中文Windows系统的默认代码页936，不是只有6763个汉字的GB2316，正确说法是自1995年Windows95起，代码页936是GBK字符集，包含了20902个汉字。此前，代码页936与GB2316是一样的。GB2316 >> GBK >> GB18030 是向后兼容的。所以编程角度把这三者视作等同，也凑合啦。

本文标签： linux cp acp Windows上的字符转换之CP

版权声明：本文标题：linux cp acp,Windows上的字符转换之CP 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1686596699h15028.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

linux cp acp,Windows上的字符转换之CP

linux cp acp,Windows上的字符转换之CP

更多相关文章

linux cp acp,Windows上的字符转换之CP

linux cp acp,CP

发表评论

推荐文章

分享新版chatGPT4.0升级完成

宽带资本亮相2023MWC上海

公众号+小程序二合一分销商城源码系统

[转载]vmware虚拟机上安装vxworks

Windows7下安装和运行TensorFlow

热门文章

windows系统镜像下载@ISO下载@安装引导跳过联网登录微软账号

苹果手机黑屏打不开？别慌！快来看看这几种解决办法

ThinkPad T480升级改造实战：从屏幕到硬盘的全面升级指南

在ubuntu20.04上配置VINS

考研英语五附双语阅读：该如何要求涨工资？

Windows11 24H2正式版大幅度提升整机性能业内公认最强！

VMware虚拟机安装Window10系统

最新 Sublime Text3 激活码 (Build 3114 有效)

windows7 找不到w3wp.exe 进程

[.NET] Windows系统全局代理IP设置

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

技术交流 – FreeNAS中文网

linux cp acp,Windows上的字符转换之CP

linux cp acp,Windows上的字符转换之CP

更多相关文章

linux cp acp,Windows上的字符转换之CP

linux cp acp,CP

发表评论

推荐文章

分享新版chatGPT4.0升级完成

宽带资本亮相2023MWC上海

公众号+小程序二合一分销商城源码系统

[转载]vmware虚拟机上安装vxworks

Windows7下安装和运行TensorFlow

热门文章

windows系统镜像下载@ISO下载@安装引导跳过联网登录微软账号

苹果手机黑屏打不开？别慌！快来看看这几种解决办法

ThinkPad T480升级改造实战：从屏幕到硬盘的全面升级指南

在ubuntu20.04上配置VINS

考研英语五附双语阅读：该如何要求涨工资？

Windows11 24H2正式版 大幅度提升整机性能 业内公认最强！

VMware虚拟机安装Window10系统

最新 Sublime Text3 激活码 (Build 3114 有效)

windows7 找不到w3wp.exe 进程

[.NET] Windows系统全局代理IP设置

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

Windows11 24H2正式版大幅度提升整机性能业内公认最强！

（Windows系统）详细介绍Windows系统含有英文版