新手上路 3小时前
主楼
[资源名称]
extractous
[资源来源]
github.com
[资源介绍]
extractous 一款文档解析工具,可提取PDF、Word等多种格式文件内容及通过OCR识别图片文字,内存占用低且处理速度比unstructured-io库快25倍,提供简洁易用API以提取文本和元数据。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️