当前位置: 首页 > news >正文

网站建设收益分析建设微信商城网站制作

网站建设收益分析,建设微信商城网站制作,企业网站seo名称,WordPress海报Java字符编码与正则表达式深度解析 1. 字符编码发展 1.1 ASCII 码 在计算机最初发明时,主要用于数值计算,但随着计算需求的增加,人们发现计算机可以用来处理文本信息。因此,将字符映射为数字来表示。 字母 ‘A’ 映射为 65&am…

Java字符编码与正则表达式深度解析

1. 字符编码发展

1.1 ASCII 码

在计算机最初发明时,主要用于数值计算,但随着计算需求的增加,人们发现计算机可以用来处理文本信息。因此,将字符映射为数字来表示。

  • 字母 ‘A’ 映射为 65,字母 ‘B’ 映射为 66。
  • 这种字符与数字的映射关系被称为ASCII字符集

ASCII 范围

  • 控制字符(0~31 和 127):如换行(LF)、回车(CR)。
  • 可显示字符(32~126):如数字 0~9、字母 A-Z 和 a-z,以及标点符号。

示例:

字符 'A' 编码为十进制:65,二进制:01000001

1.2 OEM 字符集的衍生

随着计算需求增加,128个ASCII字符已无法满足多语言环境需求。

  • 许多地区在 0x80-0xFF 范围中自定义字符映射,形成不同的OEM 字符集

示例

  • 在甲的机器中 résumés 显示正常,而在乙的机器上显示为 r?sum?s

1.3 多字节字符集(MBCS)与中文字符集

亚洲国家的字符需求远超 256 个字符,诞生了多字节字符集

  • GB2312:涵盖所有简体中文字符。
  • GBK:在 GB2312 基础上扩展了繁体字符。

多字节字符集特点:

  • 若字节最高位为 0,表示单字节字符,与 ASCII 一致。
  • 若字节最高位为 1,则需两个字节表示一个字符。

1.4 ANSI 标准与国家标准

ANSIISO 制定了字符集标准:

  • ANSI 编码:英文系统使用 ISO-8859-1,中文系统使用 GBK

1.5 Unicode 的出现

为解决跨国文档中的多语言问题,Unicode 字符集诞生。

  • Unicode 为每个字符分配唯一编码值,共 17 个平面,每个平面最多包含 65,536 个字符。

Unicode 编码方案

  • UTF-8:可变长度编码,使用 1~4 个字节表示字符。
  • UTF-16:定长编码,每次 16 位。

示例:将 (U+4E2D) 编码为 UTF-8:

  • Unicode:01001110 00101101
  • UTF-8 规则:1110xxxx 10xxxxxx 10xxxxxx
  • 结果:11100100 10111000 10101101(十六进制 E4B8AD

编码转换示例:

public static void main(String[] args) throws UnsupportedEncodingException {String str = "测试";byte[] utf8Bytes = str.getBytes("UTF-8");byte[] gbkBytes = str.getBytes("GBK");System.out.println("UTF-8 编码长度: " + utf8Bytes.length);  // 输出 6System.out.println("GBK 编码长度: " + gbkBytes.length);    // 输出 4
}

2. 正则表达式

2.1 基本概念

正则表达式是一种字符串匹配模式,常用于字符串的检索替换操作。

2.2 常用匹配模式

模式描述示例
.匹配任意单个字符a.b 匹配 acb, axb
\d匹配数字 [0-9]\d{3} 匹配 123
\w匹配字母、数字或下划线\w+ 匹配 abc123
*匹配 0 次或多次a* 匹配 ``, a, aaa

2.3 捕获组与非捕获组

2.3.1 捕获组

捕获组用于提取匹配的子串。

  • 普通捕获组

    Pattern pattern = Pattern.compile("(\\d{4})-(\\d{2})-(\\d{2})");
    Matcher matcher = pattern.matcher("2024-03-28");
    if (matcher.find()) {System.out.println("年份: " + matcher.group(1));System.out.println("月份: " + matcher.group(2));System.out.println("日期: " + matcher.group(3));
    }
    
  • 命名捕获组

    Pattern pattern = Pattern.compile("(?<year>\\d{4})-(?<month>\\d{2})-(?<day>\\d{2})");
    Matcher matcher = pattern.matcher("2024-01-01");
    if (matcher.find()) {System.out.println("年份: " + matcher.group("year"));System.out.println("月份: " + matcher.group("month"));System.out.println("日期: " + matcher.group("day"));
    }
    
2.3.2 非捕获组

非捕获组匹配但不保存匹配结果。
形式为 (?:X),常用于提高匹配效率。

Pattern p = Pattern.compile("(\\d+)(?:\\.\\d*)?([¥$])");
String[] arr = {"8895¥", "8899.66¥", "6688$", "8965"};
for (String str : arr) {Matcher m = p.matcher(str);if (m.find()) {System.out.println("货币金额: " + m.group(1));System.out.println("货币种类: " + m.group(2));}
}

2.4 零宽断言

零宽断言用于匹配位置而非具体字符:

  • (?=X):正向预查
  • (?<=X):反向预查
  • (?!X):负向预查
  • (?<!X):负向反查

示例:

String str = "abc123def";
Pattern p = Pattern.compile("\\d{3}(?=def)");
Matcher m = p.matcher(str);
if (m.find()) {System.out.println("匹配内容: " + m.group(0));  // 输出 "123"
}

2.5 常用正则表达式示例

  • 验证用户名^[a-zA-Z]\w{5,15}$
  • 验证手机号码^(13[0-9]|15[0-9]|18[0-9])\d{8}$
  • 验证邮箱^[\w-]+@[\w-]+(\.[\w-]+)+$
  • 验证 IP 地址(\d{1,3}\.){3}\d{1,3}

总结

本文系统介绍了字符编码的发展历程,从 ASCII 到 Unicode 的演变过程,并解析了常见的编码方案,如 UTF-8 和 UTF-16。通过 Java 示例展示了不同字符集的编码长度差异。在正则表达式部分,详细说明了捕获组、非捕获组及零宽断言的用法,并提供了常见验证场景的正则表达式示例。通过合理使用正则表达式,可以实现高效、灵活的字符串匹配和处理。

http://www.yayakq.cn/news/476077/

相关文章:

  • 做生意在哪个网站做wordpress替换js为外部引用
  • 甘肃网络公司网站建设关键词推广方法
  • 平邑做网站的windows server 2003 wordpress
  • 嘉兴专业自助建站免费咨询南通公司快速建站
  • php简单购物网站源码网站备案
  • 教程seo推广排名网站微信小程序官网登陆
  • 旅游网站设计asp百度云平台建设网站
  • 苏州企业网站设计方案win淘宝客wordpress主题模板
  • 建设银行互联网网站官网steam
  • 手机网站的特效做磁性材料在哪些网站推广比较好
  • 新网站建设都需要哪些wordpress菜单页面未找到
  • 泰州学习网站建设软文广告营销
  • 网站开发建设费用明细网站链接收费怎么做的
  • 做网站的时候说需求的专业术语外贸公司 如何做公司网站
  • 福建省建设执业注册与管理中心网站做调查报告的网站
  • 迅雷黄冈网站推广软件优惠网站代理怎么做
  • 网站导入题库怎么做的wordpress 免费服务器
  • 可以申请微信号的网站郑州个人网站建设公司排行榜
  • 南宁国贸网站建设成年学校培训班
  • 培训网站建设机构住建部2017建设工程合同范本
  • 网站建设关键词优化网站建设创意公司
  • 制作外贸网站成本html总结心得体会小短篇
  • php能用着手机网站开发企业网站模板中文 产品列表
  • 做网站的职业叫什么中国免费企业建站
  • 广州新塘做网站做网站公司好做吗
  • 网站建设的税率是多少晋江怎么交换友情链接
  • 网站的主题与风格说明如何做静态页网站
  • 哪些网站做机票酒店有优势乡镇做电器网站能不能营运
  • 中山手机网站建设电话桥东企业做网站
  • 山西建筑网站设计设计网页传奇平台