博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
取得HTML中所有图片的 URL 正则表达式
阅读量:5140 次
发布时间:2019-06-13

本文共 656 字,大约阅读时间需要 2 分钟。

  1. /// <summary>   
  2. /// 取得HTML中所有图片的 URL。   
  3. /// </summary>   
  4. /// <param name="sHtmlText">HTML代码</param>   
  5. /// <returns>图片的URL列表</returns>   
  6. public static string[] GetHtmlImageUrlList(string sHtmlText)   
  7. {   
  8.   // 定义正则表达式用来匹配 img 标签   
  9.   Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>",   RegexOptions.IgnoreCase);   
  10.     
  11.   // 搜索匹配的字符串   
  12.   MatchCollection matches = regImg.Matches(sHtmlText);   
  13.   int i = 0;   
  14.   string[] sUrlList = new string[matches.Count];   
  15.     
  16.   // 取得匹配项列表   
  17.   foreach (Match match in matches)   
  18.   sUrlList[i++] = match.Groups["imgUrl"].Value;   
  19.   return sUrlList;   

转载于:https://www.cnblogs.com/wahaccp/p/3989063.html

你可能感兴趣的文章
字符串处理
查看>>
ad logon hour
查看>>
罗马数字与阿拉伯数字转换
查看>>
Eclipse 反编译之 JadClipse
查看>>
距离公式汇总以及Python实现
查看>>
Linux内核态、用户态简介与IntelCPU特权级别--Ring0-3
查看>>
第23月第24天 git命令 .git-credentials git rm --cached git stash clear
查看>>
java SE :标准输入/输出
查看>>
[ JAVA编程 ] double类型计算精度丢失问题及解决方法
查看>>
好玩的-记最近玩的几个经典ipad ios游戏
查看>>
Sql Server 中由数字转换为指定长度的字符串
查看>>
tmux的简单快捷键
查看>>
[Swift]LeetCode922.按奇偶排序数组 II | Sort Array By Parity II
查看>>
php match_model的简单使用
查看>>
Vue_(组件通讯)子组件向父组件传值
查看>>
移动开发平台-应用之星app制作教程
查看>>
springboot No Identifier specified for entity的解决办法
查看>>
如何在maven工程中加载oracle驱动
查看>>
一句话说清分布式锁,进程锁,线程锁
查看>>
服务器解析请求的基本原理
查看>>