Java正则如何匹配中文字符

在Java中，要使用正则表达式匹配中文字符，可以使用Unicode范围来定义一个模式。中文字符通常位于以下Unicode范围内：

基本汉字：u4E00 - u9FA5
扩展A区汉字：u3400 - u4DBF
扩展B区汉字：u20000 - u2A6DF
扩展C区汉字：u2A700 - u2B73F
扩展D区汉字：u2B740 - u2B81F
扩展E区汉字：u2B820 - u2CEAF
扩展F区汉字：u2CEB0 - u2EBEF

要匹配这些范围内的所有中文字符，可以使用以下正则表达式：

String regex = "[u4E00-u9FA5u3400-u4DBFu20000-u2A6DFu2A700-u2B73Fu2B740-u2B81Fu2B820-u2CEAFu2CEB0-u2EBEF]";

以下是一个使用Java正则表达式匹配中文字符的示例：

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Main {
    public static void main(String[] args) {
        String text = "这是一个测试文本，包含中文字符和English words。";
        String regex = "[u4E00-u9FA5u3400-u4DBFu20000-u2A6DFu2A700-u2B73Fu2B740-u2B81Fu2B820-u2CEAFu2CEB0-u2EBEF]";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(text);

        while (matcher.find()) {
            System.out.println("找到中文字符: " + matcher.group());
        }
    }
}

这个示例将输出：

找到中文字符: 这是一个测试文本
找到中文字符: 包含中文字符