当前位置: 首页 > news >正文

网站建设 全网营销专注苏州网站建设

网站建设 全网营销,专注苏州网站建设,网站备案全国合作拍照点 腾讯云,wordpress仿站步奏入门 1、提取文章中所有的英文单词 //1.先创建一个Pattern对象,模式对象,可以理解成就是一个正则表达式对象 Pattern pattern Pattern.compile("[a-zA-Z]"); //2.创建一个匹配器对象 //理解:就是 matcher匹配器按照p…

入门

1、提取文章中所有的英文单词

//1.先创建一个Pattern对象,模式对象,可以理解成就是一个正则表达式对象
Pattern pattern = Pattern.compile("[a-zA-Z]+");
//2.创建一个匹配器对象
//理解:就是 matcher匹配器按照pattern(模式/样式),到 content文本中去匹配
//找到就返回true,否则就返回false
Matcher matcher = pattern.matcher(content);
//3,可以开始循环匹配
while (matcher.find()){//匹配内容,文本,放到 m.group(0)System.out.println("找到:" +matcher. group(0));
}

2、提取文章中所有的数字
把上述的匹配器改成:

Pattern pattern = Pattern.compile("[0-9]+");

3、提取文章中所有的英文单词和数字

Pattern pattern = Pattern.compile("([0-9]+)|([a-zA-Z]+)");

4、提取百度热榜标题

Pattern pattern = Pattern.compile(" <a target=\"_blank\" title=\"(\\S*)\"");

5、提取IP地址

Pattern pattern = Pattern.compile("\\d+\\.\\d+\\.\\d+\\.\\d");

测试

  1. 一段文本,找出所有四个数字连在一起的子串
//1. \\d 表示一个任意的数字
String regStr = "\\d\\d\\d\\d"
//2. 创建模式对象[即正则表达式对象]
Pattern pattern = Pattern.compile(regStr);
//3. 创建匹配器
//说明:创建匹配器 matcher, 按照 正则表达式的规则 去匹配 content 字符串
Matcher matcher = pattern.matcher(content);
// 4. 开始匹配
/*** matcher.find() 完成的任务 (考虑分组)* 什么是分组,比如 (\d\d)(\d\d) ,正则表达式中有() 表示分组,第 1 个()表示第 1 组,第 2 个()表示第 2 组...* 1. 根据指定的规则 ,定位满足规则的子字符串(比如(19)(98))* 2. 找到后,将 子字符串的开始的索引记录到 matcher 对象的属性 int[] groups;* 2.1 groups[0] = 0 , 把该子字符串的结束的索引+1 的值记录到 groups[1] = 4* 2.2 记录 1 组()匹配到的字符串 groups[2] = 0 groups[3] = 2* 2.3 记录 2 组()匹配到的字符串 groups[4] = 2 groups[5] = 4* 2.4.如果有更多的分组.....* 3. 同时记录 oldLast 的值为 子字符串的结束的 索引+1 的值即 35, 即下次执行 find 时,就从 35 开始匹配**//**matcher.group(0) 分析** 源码:* public String group(int group) {* if (first < 0)* throw new IllegalStateException("No match found");* if (group < 0 || group > groupCount())* throw new IndexOutOfBoundsException("No group " + group);* if ((groups[group*2] == -1) || (groups[group*2+1] == -1))* return null;* return getSubSequence(groups[group * 2], groups[group * 2 + 1]).toString();* }* 1. 根据 groups[0]=31 和 groups[1]=35 的记录的位置,从 content 开始截取子字符串返回* 就是 [31,35) 包含 31 但是不包含索引为 35 的位置** 如果再次指向 find 方法.仍然按照上面分析来执行*///小结
//1. 如果正则表达式有() 即分组
//2. 取出匹配的字符串规则如下
//3. group(0) 表示匹配到的子字符串
//4. group(1) 表示匹配到的子字符串的第 1 组字符串
//5. group(2) 表示匹配到的子字符串的第 2 组字符串
//6. ... 但是分组的数不能越界. System.out.println("找到: " + matcher.group(0));
System.out.println("第 1 组()匹配到的值=" + matcher.group(1));
System.out.println("第 2 组()匹配到的值=" + matcher.group(2))
while(matcher.find()) {System.out.println("找到:" + matcher.group(0));
}
  • 【正则表达式专栏】
http://www.yayakq.cn/news/280319/

相关文章:

  • 网站制作综述seo 网站优化推广排名教程
  • 贸易网站怎么做有找专业做淘宝网站的美工
  • 石家庄手机网站建站上海电商设计招聘网站
  • 德州市住房和城乡建设部网站成都装修公司招聘
  • 做个网站软件多少钱怎么做免费视频网站
  • 桂林市做网站的公司深圳抖音seo
  • 表白网站制作软件手机适合大学生举办的活动策划
  • 做那种的视频网站注册做网站的公司
  • 网站备案在哪里审批有了主机和域名后如何做网站
  • 为该网站做自适应深圳网站设计制作公司 维仆
  • 北京公司注册核名网站四川建设考试培训网
  • 河南郑州软件定制开发沧州做网站优化哪家公司便宜
  • 网站开发员做教育招生网站
  • 如何用域名做邮箱 网站中文购物网站模板
  • 济南定制网站建设wordpress 改变语言
  • 福建省住房城乡和建设厅网站南通网站seo报价
  • 网站建设 深圳 凡科免费网店代运营
  • 招聘网站企业招聘怎么做九江巿建设局网站
  • 丽江网站制作公司网站建设流程步骤
  • 整站优化全网营销潍坊网页网站制作
  • 萍乡商城网站建设网站设计高端网站设计
  • 网站点击率多少正常石家庄建设工程招标办网站
  • 搭建html5网站二级网站怎么建设
  • 临县网站建设网站开发php和ui
  • 大气黑色女性时尚类网站织梦模板横栏建设网站
  • 网站空间的配置商务网站管理与建设
  • 网站换服务器对网站排名有影响吗求好用的seo软件
  • 快速网站制作网页设计欣赏作业
  • wordpress是建站最快的wordpress更新文件放在哪里
  • 百度站长平台网站验证天津门户网站建设