nynw.net
当前位置:首页 >> 给一个网页源码 ,在jAvA中用正则匹配如何将<img =... >>

给一个网页源码 ,在jAvA中用正则匹配如何将<img =...

这个还真不容易实现,单独保留p或者img都可以,但是两个条件放一起就不行了。于是我换了一种思路,用了个函数实现了,你看下,代码是python下的: import ret = 'asdfasdf1111111111asdfasdfasdf 'def replace_two(m): """ #过滤掉页面中除了和...

package test;public class JButtonTest{public static void main ( String[] args ){String regex = "(?i)(\\]+\\>)";String input = "";input = input.replaceAll (regex, "$1 style=\"width:500px;height:400px;\"$2");System.out.println (i...

我觉得可以先用正则把先匹配出imgName = “图片名.gif”,然后再替换: content = content.replaceAll("(.*?)src=\"(.*?)","$1src=\"../image/" + imgName);

代码很简单,一看就能看懂: import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test { public static void main(String[] args) { Pattern p = Pattern.compile("(?

String bireinfo = ""; Pattern p = Pattern.compile("(?:src=\"?)(.*?)\"?\\s"); Matcher m = p.matcher(bireinfo); String[] arr = new String[10]; int i = 0; while(m.find()) { arr[i] = m.group(1); i++; }

这个正则是错误的。括号的.*? 由于加了?,懒惰匹配,所以它能不匹配就不匹配,匹配到的都在[^>]*?里面,group1不会匹配到东西。 用下面这个正则会更靠谱: ]*src\s*=\s*"([^"]*)"[^>]*>

正则表达式:(.*?) group(1)为正文内容。 输出时加上\n就行了 import java.util.regex.*; public class Test{ public static void main(String[] args){ String str="No page with that title exists. "; String regex="(.*?) "; Pattern p =Pat...

学习java的正则表达式,抓取网页并解析HTML内容 :

public static void main(String[] args) { String xx = "hdjksahdjkshj khkjdhsakj dsadsajkdas"; String regex = "src=\"/ee/ads/blll/1.0.0/img/defineform.png\""; xx = xx.replaceAll(regex, "tttt"); System.out.println(xx); }

String oriString = "";String newstString = oriString.replaceAll("", "图片");

网站首页 | 网站地图
All rights reserved Powered by www.nynw.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com