跳转至

字符类型

字符类型

表 字符类型

名字 描述
character varying(n), varchar(n) 有限制的变长
character(n), char(n) 定长,空格填充
text 无限变长

表 字符类型显示了在SeaboxSQL里可用的一般用途的字符类型。

SQL定义了两种基本的字符类型: character varying(n)和character(n),其中n是一个正整数。两种类型都可以存储最多n个字符长的串。试图存储更长的串到这些类型的列里会产生一个错误,除非超出长度的字符都是空白,这种情况下该串将被截断为最大长度(这个看上去有点怪异的例外是SQL标准要求的)。

如果要存储的串比声明的长度短,类型为character的值将会用空白填满;而类型为character varying的值将只是存储短些的串。

如果我们明确地把一个值造型成character varying(n)或者character(n),那么超长的值将被截断成n个字符,而不会抛出错误(这也是SQL标准的要求)。

varchar(n)和char(n)的概念分别是character varying(n)和character(n)的别名。没有长度声明词的character等效于character(1)。如果不带长度说明词使用character varying,那么该类型接受任何长度的串。后者是一个SeaboxSQL的扩展。

另外,SeaboxSQL提供text类型,它可以存储任何长度的串。尽管类型text不是SQL标准,但是许多其它SQL数据库系统也有它。

类型character的值物理上都用空白填充到指定的长度 n ,并且以这种方式存储和显示。不过,拖尾的空白被当作是没有意义的,并且在比较两个character类型值时不会考虑它们。在空白有意义的排序规则中,这种行为可能会 产生意料之外的结果,例如SELECT 'a'::CHAR(2) collate "C" <E'a\n'::CHAR(2)会返回真(即便C区域会认为一个空格比新行更大)。当把一个character值转换成其他字符串类型之一时,拖尾的空白会被移除。请注意,在character varyingtext值里,结尾的空白语意上 有含义的,并且在使用模式匹配(如LIKE和正则表达式)时也会被考虑。

这些类型的存储需求是 4 字节加上实际的字串,如果是 character 的话再加上填充的字节。长的字串将会自动被系统压缩,因此在磁盘上的物理需求可能会更少些。长的数值也会存储在后台表里面,这样它们就不会干扰对短字段值的快速访问。

不管怎样,允许存储的最长字串大概是 1 GB。 (允许在数据类型声明中出现的的 n 的最大值比这还小。修改这个行为没有甚么意义,因为在多字节编码下字符和字节的数目可能差别很大。

如果你想存储没有特定上限的长字串,那么使用 text 或者没有长度声明词的 character varying, 而不要选择一个任意长度限制。)

一个短串(最长126字节)的存储要求是1个字节外加实际的串,该串在character情况下包含填充的空白。长一些的串在前面需要4个字节而不是1个字节。长串会被系统自动压缩,这样在磁盘上的物理需求可能会更少。非常长的值也会被存储在背景表中,这样它们不会干扰对较短的列值的快速访问。在任何情况下,能被存储的最长的字符串是1GB(数据类型定义中 n 能允许的最大值比这个值要小。修改它没有用处,因为对于多字节字符编码来说,字符的数量和字节数可能完全不同。如果你想要存储没有指定上限的长串,使用text或没有长度声明的character varying,而不是给出一个任意长度限制)。

为了兼容oracle的varchar2类型,新增类型语法,形如character(n str_semantics), char(n str_semantics)。

str_semantics可表示为char, byte, null(也即空),当为character(n char)时表示可以存储最多n个字符长的串,与character(n)相同含义,当为character(n byte)时表示可以存储最多n个字节长的串。 (n str_semantics)只适用于character/charcharacter varying/varchar只是语法上支持,实际插入数据还是按照字符去存储。

提示

这三种类型之间没有性能差别,只不过是在使用填充空白的类型的时候需要更多存储尺寸,以及在存储到一个有长度约束的列时需要少量额外CPU周期来检查长度。虽然在某些其它的数据库系统里,character(n)有一定的性能优势,但在SeaboxSQL里没有。事实上,character(n)通常是这三种类型之中最慢的一个,因为它需要额外的存储开销。在大多数情况下,应该使用text或者character varying

请参考字符串常量获取关于串文本的语法的信息,以及参阅函数和操作符获取关于可用操作符和函数的信息。
数据库的字符集决定用于存储文本值的字符集。

示例 使用字符类型

CREATE TABLE test1 (a character(4));
INSERT INTO test1 VALUES ('ok');
SELECT a, char_length(a) FROM test1; -- (1)

  a   | char_length
------+-------------
 ok   |           2

CREATE TABLE test2 (b varchar(5));
INSERT INTO test2 VALUES ('ok');
INSERT INTO test2 VALUES ('good      ');
INSERT INTO test2 VALUES ('too long');
ERROR:  value too long for type character varying(5)
INSERT INTO test2 VALUES ('too long'::varchar(5)); -- explicit truncation
SELECT b, char_length(b) FROM test2;

   b   | char_length
-------+-------------
 ok    |           2
 good  |           5
 too l |           5

CREATE TABLE test3 (a character(4 byte));
INSERT INTO test3 VALUES ('good');
INSERT INTO test3 VALUES (' 中国天津');
ERROR:  value too long for type character(4)
SELECT a, char_length(a) FROM test3;

  a   | char_length 
------+-------------
 good |           4
(1 row)

CREATE TABLE test4 (a character(4 char));
INSERT INTO test4 VALUES ('good');
INSERT INTO test4 VALUES ('中国天津');
SELECT a, char_length(a) FROM test4;

    a     | char_length 
----------+-------------
 good     |           4
 中国天津 |           4
(2 rows)

提示

函数char_length字符串函数和操作符章节中讨论。

在SeaboxSQL里另外还有两种定长字符类型,在表 特殊字符类型里显示。

name类型用于在内部系统目录中存储标识符并且不是给一般用户使用的。该类型长度当前定为64 字节(63 可用字符加结束符)但在C源代码应该使用常量NAMEDATALEN引用。这个长度是在编译的时候设置的(因而可以为特殊用途调整),缺省的最大长度在以后的版本可能会改变。类型"char"(注意引号)和char(1)是不一样的,它只用了一个字节的存储空间。它在系统内部用于系统目录当做简化的枚举类型用。

表 特殊字符类型

名字 存储尺寸 描述
"char" 1字节 单字节内部类型
name 64字节 用于对象名的内部类型