Java 中, 可以用 \ uXXXX 表示 Unicode 字符, 例如 String s = "\u00X1";
XXXX 必须为 4 位, 因此码点为 U+1D546 的字符, 需要用两个编码单元表示, 例如 String t = "\uD835\uDD46"; 而如果直接写为 "\u1D546", 则表示 "\u1D54" 和 "6" 这两个字符.
大部分字符串, length 与 codePointCount 这两个值相等. 一些特殊字符则不等. 例如 U+1D546 这个字符, 其码点为 1D546, 由两个编码单元组成, Java 中可写为 String s = "\uD835\uDD46"; 此时其 length 为 2,codePointCount 为 1.
来源: http://www.bubuko.com/infodetail-3217390.html