1. 首页 > 电脑教程 > C#html抽取所有文本内容的正则表达式

C#html抽取所有文本内容的正则表达式

只抽取HTML中 所有

之间的文本的正则表达式:(?is)]*>(?>]*>(?)|

(?<-o>)|(?:(?!测试代码:public static void Main(string[] args){ string text="

sdfasdfsa

sxcvxc

23424

"; string regex=@"(?is)]*>(?>]*>(?)|

(?<-o>)|(?:(?!"; GetListByHtml(text, regex); Console.ReadKey(); }public static void GetListByHtml(string text,string pat) { System.Text.RegularExpressions.Regex r = new System.Text.RegularExpressions.Regex(pat, System.Text.RegularExpressions.RegexOptions.IgnoreCase); System.Text.RegularExpressions.Match m = r.Match(text); //int matchCount = 0; while (m.Success) { Console.WriteLine(m.Value); m = m.NextMatch(); } }这是抽取herf的例子 string regexs = "href=[\\\"\\\'](http:\\/\\/|\\.\\/|\\/)?\\w+(\\.\\w+)*(\\/\\w+(\\.\\w+)?)*(\\/|\\?\\w*=\\w*(&\\w*=\\w*)*)?[\\\"\\\']";

声明:希维路由器教程网提供的内容,仅供网友学习交流,如有侵权请与我们联系删除,谢谢。ihuangque@qq.com
本文地址:https://www.ctrlcv.com.cn/diannao/169323123810606.html