如何使用正则表达式提取特定 HTML 结构中的内容？（如何使用.提取.特定.结构.内容...）

wufei1232024-10-31PHP11

如何使用正则表达式提取特定 html 结构中的内容？

正则表达式匹配特定 html 结构

通过正则表达式，我们可以解析 html 文本并提取所需数据。以下是一个实例，展示了如何通过正则表达式匹配特定 html 结构并提取其中的内容：

给定以下 html 结构：

<div class="content">
    <h1>标题xxxxx</h1>
    <div class="block-1">
        <ul class="article">
<li>文章标题1</li>
            <li>文章标题2</li>
            <li>文章标题3</li>
        </ul>
</div>
    <div class="block-2">
        <ul class="article">
<li>文章标题1</li>
            <li>文章标题2</li>
            <li>文章标题3</li>
        </ul>
</div>
    <div class="block-3">
        <ul class="article">
<li>文章标题1</li>
            <li>文章标题2</li>
            <li>文章标题3</li>
        </ul>
</div>
</div>

我们希望提取 class 为 "block-2" 的 div 中所有 li 标签内的值。

使用以下正则表达式可以实现上述目的：

/(?).*?(?=.*block-2)/g

该正则表达式包含以下部分：

(?)：匹配以 class 为 "block-1" 的 div 内 li 标签之前的任何内容。
.*?：非贪婪匹配 li 标签的内容（包括子元素）。
(?=

利用该正则表达式，我们可以如下提取所需数据：

let str = strhtml; // html 文本
let removeenter = str.replace(/[\r\n]/g, "").replace(/[ ]/g, "").match(/(?).*?(?=.*block-2)/g);
console.log(removeenter);

输出结果：

["文章标题1", "文章标题2", "文章标题3"]

以上就是如何使用正则表达式提取特定 HTML 结构中的内容？的详细内容，更多请关注知识资源分享宝库其它相关文章！

PHP框架中的中间件如何使用？（如何使用.中间件.框架.PHP...）2024-06-18

如何使用PHP框架构建微服务？（微服.如何使用.框架.构建.PHP...）2024-06-18

如何使用PHP框架进行异步编程？（如何使用.框架.编程.PHP...）2024-06-18

PHP框架中如何使用性能测试？（如何使用.性能测试.框架.PHP...）2024-06-18

支付宝公积金提取出来的方法（公积金.支付宝.提取.方法...）2024-06-20

如何使用PHP框架优化MVC模式的性能？（如何使用.框架.优化.性能.模式...）2024-06-20

如何使用正则表达式提取特定 HTML 结构中的内容？（如何使用.提取.特定.结构.内容...）

相关文章

发表评论

本站内容来源于互联网搬运，仅限用于小范围内传播学习，请在下载后24小时内删除，如果有侵权内容、不妥之处，请第一时间联系我们删除。敬请谅解! E-mail：dpw1001@163.com
陕ICP备2023000927号

Powered By Z-BlogPHP. Theme by TOYEAN.

如何使用正则表达式提取特定 HTML 结构中的内容？（如何使用.提取.特定.结构.内容...）

相关文章

发表评论取消回复

本站内容来源于互联网搬运，仅限用于小范围内传播学习，请在下载后24小时内删除， 如果有侵权内容、不妥之处，请第一时间联系我们删除。敬请谅解! E-mail：dpw1001@163.com 陕ICP备2023000927号

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论

本站内容来源于互联网搬运，仅限用于小范围内传播学习，请在下载后24小时内删除，如果有侵权内容、不妥之处，请第一时间联系我们删除。敬请谅解! E-mail：dpw1001@163.com
陕ICP备2023000927号