繁體中文
|
English
全部
搜索
图片
视频
地图
Copilot
资讯
更多
航班
旅游
笔记本
熱門報導
全球
娛樂
商業
運動
科技
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
最佳匹配
最新
GitHub
1 年
PDF
-to-
HTML
-Processor
PDF-to-HTML-Processor是一个处理pdf文件的项目,用于将PDF文件转换为HTML格式,并提取文本、图片、元数据等信息。它使用fitz和BeautifulSoup库来实现PDF的读取和HTML的生成。最终以生成器的方式输出一个个和langchain中Document类相同的对象。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈