Java 简明教程

Java - Character Class

通常,当我们处理字符时,我们使用原始数据类型char。

Example

char ch = 'a';

// Unicode for uppercase Greek omega character
char uniChar = '\u039A';

// an array of chars
char[] charArray ={ 'a', 'b', 'c', 'd', 'e' };

Use of Character Class in Java

然而在开发中,我们会遇到需要使用对象来代替原始数据类型的情况。为了实现这一点,Java为原始数据类型char提供了包装类`@ {s0}`。

Java Character Class

`Character`类提供了一些有用的类(即静态)方法来操作字符。你可以使用`Character`构造函数创建一个`Character`对象 -

Character ch = new Character('a');

在某些情况下,Java编译器还会为你创建一个`Character`对象。例如,如果你将一个原始char传递给一个期望对象的函数,编译器会自动为你将char转换成一个`Character`。此功能称为自动装箱或拆箱,如果转换相反。

Example of Java Character Class

// Here following primitive char 'a'
// is boxed into the Character object ch
Character ch = 'a';

// Here primitive 'x' is boxed for method test,
// return is unboxed to char 'c'
char c = test('x');

Escape Sequences

一个带有反斜杠(\)的前缀字符是一个转义序列,并且对编译器有特殊的含义。

换行符(\n)在本教程中经常在`System.out.println()`语句中使用,以便在字符串打印后换到下一行。

下表显示了Java转义序列 -

Escape Sequence

Description

\t

在此处在文本中插入制表符。

\b

在此处在文本中插入退格符。

\n

在此处在文本中插入换行符。

\r

在此处在文本中插入回车符。

\f

在此处在文本中插入换页符。

\'

在此处在文本中插入一个单引号字符。

\"

在此处在文本中插入一个双引号字符。

当在打印语句中遇到转义序列时,编译器会相应地对其进行解释。

Example: Escape Sequences

如果你想在引号内放入引号,则必须在内部引号上使用转义序列 \”,-

public class Test {

   public static void main(String args[]) {
      System.out.println("She said \"Hello!\" to me.");
   }
}
She said "Hello!" to me.

Character Class

Declaration

以下是对`@ {s1}`类的声明 -

public final class Character
   extends Object
      implements Serializable, Comparable<Character>

Field

以下是`@ {s2}`类的字段 -

  1. static byte COMBINING_SPACING_MARK − 这是 Unicode 规范中的常规类别“Mc”。

  2. static byte CONNECTOR_PUNCTUATION − 这是 Unicode 规范中的常规类别“Pc”。

  3. static byte CONTROL − 这是 Unicode 规范中的常规类别“Cc”。

  4. static byte CURRENCY_SYMBOL − 这是 Unicode 规范中的常规类别“Sc”。

  5. static byte DASH_PUNCTUATION − 这是 Unicode 规范中的常规类别“Pd”。

  6. static byte DECIMAL_DIGIT_NUMBER − 这是 Unicode 规范中的常规类别“Nd”。

  7. static byte DIRECTIONALITY_ARABIC_NUMBER − 这是 Unicode 规范中的弱双向字符类型“AN”。

  8. static byte DIRECTIONALITY_BOUNDARY_NEUTRAL − 这是 Unicode 规范中的弱双向字符类型“BN”。

  9. static byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR − 这是 Unicode 规范中的弱双向字符类型“CS”。

  10. static byte DIRECTIONALITY_EUROPEAN_NUMBER − 这是 Unicode 规范中的弱双向字符类型“EN”。

  11. static byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR − 这是 Unicode 规范中的弱双向字符类型“ES”。

  12. static byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR − 这是 Unicode 规范中的弱双向字符类型“ET”。

  13. static byte DIRECTIONALITY_LEFT_TO_RIGHT − 这是 Unicode 规范中的强双向字符类型“L”。

  14. static byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING − 这是 Unicode 规范中的强双向字符类型“LRE”。

  15. static byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE − 这是 Unicode 规范中的强双向字符类型“LRO”。

  16. static byte DIRECTIONALITY_NONSPACING_MARK − 这是 Unicode 规范中的弱双向字符类型“NSM”。

  17. static byte DIRECTIONALITY_OTHER_NEUTRALS − 这是 Unicode 规范中的中立双向字符类型“ON”。

  18. static byte DIRECTIONALITY_PARAGRAPH_SEPARATOR − 这是 Unicode 规范中的中立双向字符类型“B”。

  19. static byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT − 这是 Unicode 规范中的弱双向字符类型“PDF”。

  20. static byte DIRECTIONALITY_RIGHT_TO_LEFT − 这是 Unicode 规范中的强双向字符类型“R”。

  21. static byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC − 这是 Unicode 规范中的强双向字符类型“AL”。

  22. static byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING − 这是 Unicode 规范中的强双向字符类型“RLE”。

  23. static byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE − 这是 Unicode 规范中的强双向字符类型“RLO”。

  24. static byte DIRECTIONALITY_SEGMENT_SEPARATOR − 这是 Unicode 规范中的中性双向字符类型“S”。

  25. static byte DIRECTIONALITY_UNDEFINED − 这是未定义的双向字符类型。

  26. static byte DIRECTIONALITY_WHITESPACE − 这是 Unicode 规范中的中性双向字符类型“WS”。

  27. static byte ENCLOSING_MARK − 这是 Unicode 规范中的通用类别“Me”。

  28. static byte END_PUNCTUATION − 这是 Unicode 规范中的通用类别“Pe”。

  29. static byte FINAL_QUOTE_PUNCTUATION − 这是 Unicode 规范中的通用类别“Pf”。

  30. static byte FORMAT − 这是 Unicode 规范中的通用类别“Cf”。

  31. static byte INITIAL_QUOTE_PUNCTUATION − 这是 Unicode 规范中的通用类别“Pi”。

  32. static byte LETTER_NUMBER − 这是 Unicode 规范中的通用类别“Nl”。

  33. static byte LINE_SEPARATOR − 这是 Unicode 规范中的通用类别“Zl”。

  34. static byte LOWERCASE_LETTER − 这是 Unicode 规范中的通用类别“Ll”。

  35. static byte MATH_SYMBOL − 这是 Unicode 规范中的通用类别“Sm”。

  36. static int MAX_CODE_POINT − 这是 Unicode 码点的最大值。

  37. static char MAX_HIGH_SURROGATE − 这是 UTF-16 编码中 Unicode 高代理代码单元的最大值。

  38. static char MAX_LOW_SURROGATE − 这是 UTF-16 编码中 Unicode 低代理代码单元的最大值。

  39. static int MAX_RADIX − 这是可用于字符串转换的最大基数。

  40. static char MAX_SURROGATE − 这是 UTF-16 编码中的 Unicode 代理代码单元的最大值。

  41. static char MAX_VALUE − 此字段的常量值是 char 类型的最大值“\uFFFF”。

  42. static int MIN_CODE_POINT − 这是 Unicode 代码点最小值。

  43. static char MIN_HIGH_SURROGATE − 这是 UTF-16 编码中 Unicode 高代理代码单元的最小值。

  44. static char MIN_LOW_SURROGATE − 这是 UTF-16 编码中 Unicode 低代理代码单元的最小值。

  45. static int MIN_RADIX − 这是可用于字符串转换的最小基数。

  46. static int MIN_SUPPLEMENTARY_CODE_POINT − 这是补充字符的最小值。

  47. static char MIN_SURROGATE − 这是 UTF-16 编码中 Unicode 代理代码单元的最小值。

  48. static char MIN_VALUE − 此字段的常量值是 char 类型的最小值“\u0000”。

  49. static byte MODIFIER_LETTER − 这是 Unicode 规范中的通用类别“Lm”。

  50. static byte MODIFIER_SYMBOL − 这是 Unicode 规范中的通用类别“Sk”。

  51. static byte NON_SPACING_MARK − 这是 Unicode 规范中的通用类别“Mn”。

  52. static byte OTHER_LETTER − 这是 Unicode 规范中的通用类别“Lo”。

  53. static byte OTHER_NUMBER − 这是 Unicode 规范中的通用类别“No”。

  54. static byte OTHER_PUNCTUATION − 这是 Unicode 规范中的通用类别“Po”。

  55. static byte OTHER_SYMBOL − 这是 Unicode 规范中的通用类别“So”。

  56. static byte PARAGRAPH_SEPARATOR − 这是 Unicode 规范中的通用类别“Zp”。

  57. static byte PRIVATE_USE − 这是 Unicode 规范中的通用类别“Co”。

  58. static int SIZE − 这是用于以无符号二进制形式表示 char 值的位数。

  59. static byte SPACE_SEPARATOR − 这是 Unicode 规范中的通用类别“Zs”。

  60. static byte START_PUNCTUATION − 这是 Unicode 规范中的通用类别“Ps”。

  61. static byte SURROGATE − 这是 Unicode 规范中的通用类别“Cs”。

  62. static byte TITLECASE_LETTER − 这是 Unicode 规范中的通用类别“Lt”。

  63. static Class&lt;Character&gt; TYPE − 这是表示基元类型 char 的类实例。

  64. static byte UNASSIGNED − 这是 Unicode 规范中的通用类别“Cn”。

  65. static byte UPPERCASE_LETTER − 这是 Unicode 规范中的通用类别“Lu”。

Class constructors

Sr.No.

Constructor & Description

1

Character(char value) 这将构造一个新分配的 Character 对象来表示指定的 char 值。

Class methods

Sr.No.

Method & Description

1

static int charCount(int codePoint) 此方法确定表示指定字符(Unicode 代码点)所需的 char 值的数量。

2

char charValue() 此方法返回此 Character 对象的值。

3

static int codePointAt(char[] a, int index) 此方法返回 char 数组的给定索引处的代码点。

4

static int codePointBefore(char[] a, int index) 此方法返回 char 数组的给定索引处前面的代码点。

5

static int codePointCount(char[] a, int offset, int count) 此方法返回 char 数组参数的子数组中的 Unicode 代码点的数量。

6

int compareTo(Character anotherCharacter) 此方法在数字上比较两个 Character 对象。

7

static int digit(char ch, int radix) 此方法以指定基数返回字符 ch 的数字值。

8

boolean equals(Object obj) 此方法将此对象与指定的对象进行比较。

9

static char forDigit(int digit, int radix) 此方法确定指定基数中特定数字的字符表示。

10

static byte getDirectionality(char ch) 此方法返回给定字符的 Unicode 方向性属性。

11

static int getNumericValue(char ch) 此方法返回指定 Unicode 字符所表示的 int 值。

12

static int getType(char ch) 此方法返回一个指示字符一般类别的值。

13

int hashCode() 此方法返回此字符的哈希码。

14

static boolean isDefined(char ch) 此方法确定字符是否在 Unicode 中定义。

15

static boolean isDigit(char ch) 此方法确定指定字符是否是数字。

16

static boolean isHighSurrogate(char ch) 此方法确定给定的字符值是否为高代理代码单元(也称为前导代理代码单元)。

17

static boolean isIdentifierIgnorable(char ch) 此方法确定指定字符是否应在 Java 标识符或 Unicode 标识符中视为可忽略字符。

18

static boolean isISOControl(char ch) 此方法确定指定字符是否是 ISO 控制字符。

19

static boolean isJavaIdentifierPart(char ch) 此方法确定指定字符是否可以作为 Java 标识符(第一个字符除外)的一部分。

20

static boolean isJavaIdentifierStart(char ch) 此方法确定指定字符是否可以作为 Java 标识符的第一个字符。

21

static boolean isLetter(char ch) 此方法确定指定字符是否是字母。

22

static boolean isLetterOrDigit(char ch) 此方法确定指定字符是否是字母或数字。

23

static boolean isLowerCase(char ch) 此方法确定指定字符是否是小写字符。

24

static boolean isLowSurrogate(char ch) 此方法确定给定的字符值是否为低代理代码单元(也称为尾部代理代码单元)。

25

static boolean isMirrored(char ch) 此方法根据 Unicode 规范确定字符是否为镜像字符。

26

static boolean isSpaceChar(char ch) 此方法确定指定字符是否是 Unicode 空格字符。

27

static boolean isSupplementaryCodePoint(int codePoint) 此方法确定指定字符(Unicode 代码点)是否在补充字符范围内。

28

static boolean isSurrogatePair(char high, char low) 此方法确定给定的字符值对是否为有效的代理对。

29

static boolean isTitleCase(char ch) 此方法确定指定字符是否是标题化字符。

30

static boolean isUnicodeIdentifierPart(char ch) 此方法确定指定字符是否可以作为 Unicode 标识符(第一个字符除外)的一部分。

31

static boolean isUnicodeIdentifierStart(char ch) 此方法确定指定字符是否可以作为 Unicode 标识符的第一个字符。

32

static boolean isUpperCase(char ch 此方法确定指定字符是否为大写字符。

33

static boolean isValidCodePoint(int codePoint) 此方法确定指定代码点是否在 0x0000 到 0x10FFFF(包括)范围内的有效 Unicode 代码点值。

34

static boolean isWhitespace(char ch) 此方法确定指定字符是否按照 Java 是空白。

35

static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) 此方法返回给定 char 子数组中给定索引偏移 codePointOffset 代码点的索引

36

static char reverseBytes(char ch) 此方法返回通过反转指定 char 值中的字节顺序而获得的值。

37

static char[] toChars(int codePoint) 此方法将指定字符(Unicode 代码点)转换为其存储在 char 数组中的 UTF-16 表示形式。

38

static int toCodePoint(char high, char low) 此方法将指定代理对转换为其附加代码点值。

39

static char toLowerCase(char ch) 此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。

40

String toString() 此方法返回表示此 Character 值的 String 对象。

41

static char toTitleCase(char ch) 此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题形式。

42

static char toUpperCase(char ch) 此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。

43

static Character valueOf(char c) 此方法返回一个表示指定 char 值的 Character 实例。

Methods inherited

此类从以下类中继承方法:

  1. java.lang.Object

Example

以下示例展示了 Java Character charCount() 方法的用法。在此程序中,我们创建了一个 int 变量并为其分配等效于一个 char 值的十六进制值。然后,使用 charCount() 方法,我们检查它是否是有效的附加字符。然后打印结果。

package com.tutorialspoint;

public class CharacterDemo {
   public static void main(String[] args) {

      // create and assign values to int codepoint cp
      int cp = 0x12345;

      // create an int res
      int res;

      // assign the result of charCount on cp to res
      res = Character.charCount(cp);
      String str1 = "It is not a valid supplementary character";
      String str2 = "It is a valid supplementary character";

      // print res value
      if ( res == 1 ) {
         System.out.println( str1 );
      } else if ( res == 2 ) {
         System.out.println( str2 );
      }
   }
}

Output

让我们编译并运行上述程序,这将生成以下结果 −

It is a valid supplementary character