如何解析pdf文件的本地副本并使用javascript搜索关键字出现

how to parse a local copy of pdf files and search keyword occurrence using javascript?

本文关键字:javascript 搜索 关键字 副本 pdf 何解析 文件      更新时间:2023-09-26

我正在开发一个窗口应用程序,在该应用程序中,我必须查找所有pdf文件,解析它们,并在javascript的帮助下搜索其中出现的关键字。我尝试使用pdf.js,但没有找到本地文件的解决方案。它向我展示了以下错误;XMLHttpRequest无法加载file:///Hello.pdf.只有HTTP才支持跨源请求。(示例文件名为Hello.pdf)

PDFJS.getDocument方法接受文件的URL或PDF文件的ArrayBuffer。因此,您可以将文件读取到ArrayBuffer中(可能使用FileReader.readAsArrayBuffer),然后将缓冲区传递给getDocument

请参见此处。

如果你想在本地运行它,并且它必须是JavaScript,我会寻找可以处理PDF的Node.js模块,比如pdf2json。