Как лучше всего анализировать html в С#?
Вы можете использовать TidyNet.Tidy c# для преобразования HTML в dot-net XHTML, а затем использовать dot-net синтаксический анализатор .net XML.
Другой альтернативой dotnet может быть использование dot-net встроенного движка mshtml:
using mshtml;
...
object[] oPageText = { html };
HTMLDocument doc = new HTMLDocumentClass();
IHTMLDocument2 doc2 = (IHTMLDocument2)doc;
doc2.write(oPageText);
Это html5 позволяет вам использовать webpage функции, подобные JavaScript, такие .net-framework как getElementById()
c#
.net
html
parsing
html-content-extraction
2021-12-04T11:06:18+00:00
2022-10-24T21:36:28+00:00
XoPoWpp
Вопросы с похожей тематикой, как у вопроса:
Как лучше всего анализировать html в С#?
Предупреждение о файлах Cookies
Мы используем файлы cookies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.