`

.net正则匹配a标签

 
阅读更多



2009-08-26 16:00:51|  分类: Asp.Net |字号 订阅
//c#通过正则匹配html中的a标签 的方法
public string matchA(string teststr)
    {
        StringBuilder sb = new StringBuilder();
        //关键就是这个里面的这则表达式
        Regex reg = new Regex(@"<\s*a\shref=*[^>]*>([^<]|<(?!/a))*<\s*/a\s*>");
         MatchCollection match = reg.Matches(teststr);
         foreach (Match var in match)
         {
             if (var != null)
             {
                 sb.Append(Server.HtmlEncode(var.Value));
                 sb.Append("<br />");
             }
         }
         return sb.ToString();
    }

//这个是测试方法获取网易首页的a标签所有信息
public void test()
{
        string temp=string.Empty;
        WebRequest webReq = WebRequest.Create(" http://www.163.com");
        WebResponse webRes = webReq.GetResponse();
        Stream resStream = webRes.GetResponseStream();
        StreamReader sr = new StreamReader(resStream, Encoding.Default);
        StringBuilder sb = new StringBuilder();
        while ((temp = sr.ReadLine()) != null)
        {
            sb.Append(temp);
        }
        webRes.Close();
        sr.Close();
       //打印出所有匹配信息
       Response.Write(matchA(sb.ToString()));
   
}


分享到:
评论

相关推荐

    asp.net 正则表达式过滤所有html标签

    asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签 asp.net 正则表达式过滤所有html标签

    精通正则表达式基于.NET ASP PHP JSP JavaScript

    进行正则匹配替换.asp 进行正则匹配检验.asp 第14章(/14/) 浮点型数据测试.php 浮点型数据测试 字符串数据测试.php 字符串数据...

    正则表达式30分钟入门教程

    正则表达式引擎通常会提供一个“测试指定的字符串是否匹配一个正则表达式”的方法,如JavaScript里的RegExp.test()方法或.NET里的Regex.IsMatch()方法。这里的匹配是指是字符串里有没有符合表达式规则的部分。如果不...

    正则表达式经典实例

    2.21 把部分的正则匹配添加到替代文本中 2.22 把匹配上下文插入到替代文本中 第3章 使用正则表达式编程 3.1 在源代码中使用字面正则表达式 3.2 导入正则表达式函数库 3.3 创建正则表达式对象 3.4 设置正则...

    正则表达式经典实例.pdf

    2.21 把部分的正则匹配添加到替代文本中 2.22 把匹配上下文插入到替代文本中 第3章 使用正则表达式编程 3.1 在源代码中使用字面正则表达式 3.2 导入正则表达式函数库 3.3 创建正则表达式对象 3.4 设置正则表达式选项...

    asp.net教学讲义

    3.6.5正则表达式匹配验证控件 59 3.7自定义验证控件 62 3.8验证总结控件 64 第四章:ASP.NET内置对象 67 4.1内置对象概述 67 4.2 Response对象和Request对象 67 4.2.1 Response对象的功能,常用属性和方法和示例 67 ...

    ScrapySharp教程和dll下载

    不用正则表达式在整个页面源代码上匹配,速度也会有提升。总而言之,通过该类库,先通过浏览器获取到xpath获取到节点内容然后再通过正则表达式匹配到所需要的内容,无论是开发速度,还是运行效率都有提升。 但是使用...

    基于Python的网站爬虫代码源码.zip

    从文章中的某一个页面,爬取其页面的a标签,用正则匹配将所有爬取的页面中符合http://www.liuchuo.net/articles/ 形式的链接提取为待爬取的URL,将文章页面的标题h1标签和时间time标签分别存储在data字典的title和...

    KingCMS源码下载

    其基本工作原理就是正则表达式匹配标签,而后通过标签的进行多态,把相关的内容返回然后REPLACE。后期发现确实挺慢的,还引入了缓存,其实就是很傻的放到ASP.NET的内存中,缓存策略也很傻,更改时删掉那个缓存项。 ...

    清除整站下载文件中的冗余代码

    1、匹配tppabs标签: \btppabs="h[^"]*" 替换为 (空) 2、匹配javascript代码: href="javascript:if\(confirm\('htt[^"]*" 替换为 href="#www.nmju.net" 注意替换的时候.应该勾选 "使用正则表达式" 如果该...

    《文件批量改名系统》

    3 支持模糊匹配和正则表达式 4 自动利用mp3标签改写文件名 5 修改mp3标签,添加艺术家、标题、注释等信息。 6 按照指定模式重命名文件 如自动添加序号 保留原文件名 7 修改文件扩展名 8 MP3批量更名:是根据...

    editplus 代码编辑器html c++ jsp css

    实际上这也是正则表达式的使用特例,“[0-9]”表示匹配0~9之间的任何特例,同样“[a-z]”就表示匹配a~z之间的任何特例 【1】正则表达式应用——替换指定内容到行尾 原始文本如下面两行 abc aaaaa 123 abc 444 ...

    ApkIDE——安卓反编译

    3、内置代码编辑器,支持语法高亮显示,根据文件格式自动匹配相应语法;支持多文档同时编辑;也支持使用系统编辑器来编辑代码文件。 4、内置基于文件内容的关键字或多行代码段的搜索、替换引擎,一键搜索替换,搜索...

    jquery1.9.1中文版

    //匹配一个独立的标签 rsingleTag = /^&lt;(\w+)\s*\/?&gt;(?:|)$/, // JSON RegExp(JavaScript Object Notation:JavaScript对象标记法正则表达式) rvalidchars = /^[\],:{}\s]*$/, rvalidbraces = /(?:^|:|,)(?:...

    jquery1.9.1中文汉化版

    //匹配一个独立的标签 rsingleTag = /^&lt;(\w+)\s*\/?&gt;(?:|)$/, // JSON RegExp(JavaScript Object Notation:JavaScript对象标记法正则表达式) rvalidchars = /^[\],:{}\s]*$/, rvalidbraces = /(?:^|:|,)...

Global site tag (gtag.js) - Google Analytics