在许多项目和应用中,我们常常需要将文件导入到sap系统中,最常用的数据读取方法是使用gui_upload这个函数模块(fm)。在这个fm中,有一个codepage参数,用于指定代码页。如果我们导入的是中文文件,通常会使用8400。还有8401、8411等,但主要介绍8400和8401,因为8400是最常用的。8400基于gb2312-euc版本,在windows中对应的是代码页cp936;而8401则使用gb18030 2000编码。那么,它们的区别在哪里呢?
1、GB2312:GB2312于1980年发布,共收录了7445个字符,包括6763个汉字和682个其他符号。汉字区的内码范围高字节从B0到F7,低字节从A1到FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。在Windows中的代码页是CP936。
2、GBK:GBK最初是由微软对GB2312的扩展,即CP936字码表的扩展(原来的CP936和GB 2312-80完全相同),首次出现在Windows 95简体中文版中。由于Windows产品的流行和在中国大陆的广泛使用,中华人民共和国国家有关部门将其作为技术规范。注意,GBK并非国家正式标准,而是国家技术监督局标准化司、电子工业部科技与质量监督司发布的“技术规范指导性文件”。虽然GBK收录了所有Unicode 1.1及GB 13000.1-93中的汉字,但编码方式与Unicode 1.1及GB 13000.1-93不同。GBK仅是GB 2312到GB 13000.1-93之间的过渡方案。GBK收录了21886个符号,分为汉字区和图形符号区,汉字区包括21003个字符。GBK作为对GB2312的扩展,在现在的Windows系统中仍然使用代码页CP936表示,但现在的936代码页支持GBK编码,并且向下兼容GB2312编码。
3、GB18030:2000年的GB18030取代了GBK1.0,成为正式的国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,而对嵌入式产品暂不作要求。因此,手机、MP3一般只支持GB2312。GB18030在Windows中的代码页是CP54936。
4、GB13000:GB13000等同于国际标准的《通用多八位编码字符集 (UCS)》ISO10646.1,即等同于Unicode标准,使用UTF的一套标准。从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

以上就是SAP 中关于编码的解释的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号