使用 Javascript 正则表达式从 HTML 中提取文本

Extract text from HTML with Javascript regex

本文关键字:提取 取文本 HTML Javascript 正则表达式 使用      更新时间:2023-09-26

我正在尝试解析网页并在

  • YM#之后获取数字引用。例如,我需要从包含以下内容的 HTML 中获取 1234-234234

  • YM# 1234-234234        
  • 非常感谢您的帮助!

    目前,您的正则表达式仅在破折号前有一个数字和它后面有一个数字时才匹配。这将允许您在每个位置获得一个或多个号码:

    /YM#[0-9]+-[0-9]+/g
    

    然后,你还需要捕获它,所以我们使用 cgroup 来捕获它:

    /YM#([0-9]+-[0-9]+)/g
    

    然后我们需要再次引用捕获组,所以我们使用以下代码而不是 String.match

    var regex = /YM#([0-9]+-[0-9]+)/g;
    var match = regex.exec(text);
    var id = match[1];
     // 0: match of entire regex
     // after that, each of the groups gets a number
    

    (?!<li>YM#'s)(['d-]+)

    http://regexr.com?30ng5

    这将匹配数字。

    试试这个:

    (<li>[^#<>]*?# *)(['d'-]+)'b并在$2中得到结果.