HTML敏捷包--按ID或类删除标签

Html Agility Pack - Remove Tags by ID Or Class(HTML敏捷包--按ID或类删除标签)
本文介绍了HTML敏捷包--按ID或类删除标签的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

以下是我的简化的HTML:

<html>
  <body>
    <div id="mainDiv">
       <div id="divToRemove"></div>
       <div id="divToKeep"></div>
       <div class="divToRemove"></div>
       <div class="divToRemove"></div>
    </div>
  </body>
</html>
我想删除ID为"divToRemove"的div或类 然后我只想选择名为"mainDiv"的div(在HtmlNode中)。

结果应为:

   <div id="mainDiv">
       <div id="divToKeep"></div>
   </div>

如何使用HTML Agility Pack执行此操作?

谢谢!

推荐答案

以下代码改编自this Html Agility Pack forum page以满足您的需求。本质上,我们将获取所有div,然后循环遍历它们,并检查它们的类或id是否匹配。如果存在,请将其移除。

var divs = htmldoc.DocumentNode.SelectNodes("//div");
if (divs != null)
{
    foreach (var tag in divs)
    {
        if (tag.Attributes["class"] != null && string.Compare(tag.Attributes["class"].Value, "divToRemove", StringComparison.InvariantCultureIgnoreCase) == 0)
        {
            tag.Remove();
        } else if(tag.Attributes["id"] != null && string.Compare(tag.Attributes["id"].Value, "divToRemove", StringComparison.InvariantCultureIgnoreCase) == 0) {
            tag.Remove();
        }
    }
}

您也可以将这些if语句合并到一个大的if语句中,但我认为这样读起来更适合答案。

最后,选择您要查找的节点...

var mainDiv = htmldoc.DocumentNode.SelectSingleNode("//div[@id='mainDiv']");

这篇关于HTML敏捷包--按ID或类删除标签的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本站部分内容来源互联网,如果有图片或者内容侵犯您的权益请联系我们删除!

相关文档推荐

DispatcherQueue null when trying to update Ui property in ViewModel(尝试更新ViewModel中的Ui属性时DispatcherQueue为空)
Drawing over all windows on multiple monitors(在多个监视器上绘制所有窗口)
Programmatically show the desktop(以编程方式显示桌面)
c# Generic Setlt;Tgt; implementation to access objects by type(按类型访问对象的C#泛型集实现)
InvalidOperationException When using Context Injection in ASP.Net Core(在ASP.NET核心中使用上下文注入时发生InvalidOperationException)
LINQ many-to-many relationship, how to write a correct WHERE clause?(LINQ多对多关系,如何写一个正确的WHERE子句?)