1
0
mirror of https://github.com/apachecn/epub-crawler.git synced 2025-06-03 15:48:28 +00:00
epub-crawler/CHANGELOG.md
2023-04-16 02:12:08 +08:00

1.2 KiB

历史记录

v2013.4.16.0

  • imgThreads默认值改为24

v2023.3.14.0

  • connTimeout默认值改为10

v2023.3.13.0

  • 支持 YAML 和 TXT 作为抓取目标

v2023.2.14.0

  • 添加新的配置项sizeLimit,限制单个 EPUB 总大小

v2023.1.18.0

  • 修复外部脚本的加载问题

v2022.8.20.0

  • 添加 Selenium 支持

v2022.5.30.0

  • 修复带有 XML 标签的文档爬取失败的问题

v2022.3.25.0

  • 新增缓存功能
  • 拆分连接和读取超时
  • 优化下载成功和失败提示
  • 支持智能抓取标题和正文

v2022.2.24.0

  • 新增检查 HTTP 状态码的功能

v2021.11.14.0

  • 支持抓取 DataURL

v2021.9.24.0

  • 修复解码异常问题

v2021.9.4.0

  • 抓取图片后在自定义属性中标记图片来源

v2021.8.30.0

  • 修复图片获取失败可能导致 EPUB 制作失败的问题

v2021.8.23.1

  • 增加加载外部脚本来自定义获取目录和正文逻辑的功能

v2021.8.23.0

  • 修复获取目录的重大错误

v2021.8.21.1

  • 修复页面获取失败可能导致 EPUB 制作失败的问题

v2021.8.21.0

  • 开放 img 和 util 子模块,可以在程序中导入

v2021.8.20.0

  • 使用 Python 重构