mirror of
https://github.com/apachecn/epub-crawler.git
synced 2025-06-03 15:48:28 +00:00
1.2 KiB
1.2 KiB
历史记录
v2013.4.16.0
imgThreads
默认值改为24
v2023.3.14.0
connTimeout
默认值改为10
v2023.3.13.0
- 支持 YAML 和 TXT 作为抓取目标
v2023.2.14.0
- 添加新的配置项
sizeLimit
,限制单个 EPUB 总大小
v2023.1.18.0
- 修复外部脚本的加载问题
v2022.8.20.0
- 添加 Selenium 支持
v2022.5.30.0
- 修复带有 XML 标签的文档爬取失败的问题
v2022.3.25.0
- 新增缓存功能
- 拆分连接和读取超时
- 优化下载成功和失败提示
- 支持智能抓取标题和正文
v2022.2.24.0
- 新增检查 HTTP 状态码的功能
v2021.11.14.0
- 支持抓取 DataURL
v2021.9.24.0
- 修复解码异常问题
v2021.9.4.0
- 抓取图片后在自定义属性中标记图片来源
v2021.8.30.0
- 修复图片获取失败可能导致 EPUB 制作失败的问题
v2021.8.23.1
- 增加加载外部脚本来自定义获取目录和正文逻辑的功能
v2021.8.23.0
- 修复获取目录的重大错误
v2021.8.21.1
- 修复页面获取失败可能导致 EPUB 制作失败的问题
v2021.8.21.0
- 开放 img 和 util 子模块,可以在程序中导入
v2021.8.20.0
- 使用 Python 重构