简介
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 JQuery 的操作方法来取出和操作数据。
jsoup 工作的流程主要如下:
- 从一个 URL,文件或字符串中解析 HTML,并加载为一个
Document
对象。 - 使用 DOM 或 CSS 选择器来取出数据;
- 可操作 HTML 元素、属性、文本。
jsoup 是基于 MIT 协议发布的,可放心使用于商业项目。
2022年2月17日大约 14 分钟