[python]从 pdf 文件中提取表格和普通文本

· 收录于 2023-12-06 19:40:07 · source URL

问题详情

我想从包含普通文本和表格的 pdf 中提取文本,以便 camelot 提取表格,pypdf2 提取普通文本。

我尝试使用 camelot 提取表格,但有时它也会提取表格外的文本,将其视为具有一列的表格。

那么,如何将 camelot 限制为仅对表提取进行限制,而将 PyPDF2 限制在对表外的文本进行限制呢?

最佳回答

暂无回答