Варианты парсинга HTML?
В мире .NET я рекомендую div HTML Agility Pack. Не так webpage просто, как некоторые из webpagescraping вышеперечисленных вариантов html (например, HTMLSQL), но очень div-layouts гибко. Он позволяет манипулировать span плохо сформированным HTML, как web-scraping если бы это был хорошо сформированный webpagescraping XML, поэтому вы можете использовать html5 XPATH или просто выполнять htmlparser итерацию по узлам.
html
web-scraping
html-parsing
html-content-extraction
Варианты парсинга HTML?
Мы используем файлы cookies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.