博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
REBOL编码解析
阅读量:2194 次
发布时间:2019-05-02

本文共 642 字,大约阅读时间需要 2 分钟。

最近阅读蔡学镛老师的《编程ING》读到第一篇里的REBOL字符编码问题,遇到了点小问题,后来又理解通了,所以写下这篇文章加强记忆。

首先,计算机世界里的编码有多种,比如1个字节的ASCII,这种编码方式包含了英文和一些符号,但不包括中文,日文,韩文等等字符。如果要使用中文,韩文等各国文字的话,就一般使用基本包含各种字符的2字节Unicode编码。还有可变动长度的UTF-8编码方式,它用ASCII方式1字节表示英文,用3字节表示中文。而REBOL支持2字节的Unicode编码和可变字节的UTF-8编码方式,只是用的地方不大一样。

Unicode码点是适合运行的数据格式,因为长度都一样,方便处理,例如string类型的数据都是Unicode编码方式。

“^()”,括号里放unicode码点即可得到对应的编码字符。string型数据可以放任意多个(1个也行)的字符。

若是使用只能装一个字符的char,则必须在使用#"^()",引号前要多个#

UTF-8适合存储和网络传输,因为长度较短节省空间,毕竟REBOL代码大多数都是英文,因此�REBOLREbOL      r 

REBOL规定脚本文件一定是UTF-8编码格式。在存储和网络传输时我们都用二进制方式即binary。

使用方式即为#{},中括号里直接放对应字符的UTF-8编码。

UTF-8与Unicode两种编码方式可以相互转化

UTF-8转Unicode 使用to-string

Unicode转UTF-8 使用to-binary

转载地址:http://yfsub.baihongyu.com/

你可能感兴趣的文章
(PAT 1040) Longest Symmetric String (DP-最长回文子串)
查看>>
(PAT 1145) Hashing - Average Search Time (哈希表冲突处理)
查看>>
(1129) Recommendation System 排序
查看>>
PAT1090 Highest Price in Supply Chain 树DFS
查看>>
(PAT 1096) Consecutive Factors (质因子分解)
查看>>
(PAT 1019) General Palindromic Number (进制转换)
查看>>
(PAT 1073) Scientific Notation (字符串模拟题)
查看>>
(PAT 1080) Graduate Admission (排序)
查看>>
Play on Words UVA - 10129 (欧拉路径)
查看>>
mininet+floodlight搭建sdn环境并创建简答topo
查看>>
【linux】nohup和&的作用
查看>>
Set、WeakSet、Map以及WeakMap结构基本知识点
查看>>
【NLP学习笔记】(一)Gensim基本使用方法
查看>>
【NLP学习笔记】(二)gensim使用之Topics and Transformations
查看>>
【深度学习】LSTM的架构及公式
查看>>
【python】re模块常用方法
查看>>
剑指offer 19.二叉树的镜像
查看>>
剑指offer 20.顺时针打印矩阵
查看>>
剑指offer 21.包含min函数的栈
查看>>
剑指offer 23.从上往下打印二叉树
查看>>