如何解析pdf文件的本地副本并使用javascript搜索关键字出现

how to parse a local copy of pdf files and search keyword occurrence using javascript?

本文关键字：javascript 搜索关键字副本 pdf 何解析文件更新时间：2023-09-26

我正在开发一个窗口应用程序，在该应用程序中，我必须查找所有pdf文件，解析它们，并在javascript的帮助下搜索其中出现的关键字。我尝试使用pdf.js，但没有找到本地文件的解决方案。它向我展示了以下错误；XMLHttpRequest无法加载file:///Hello.pdf.只有HTTP才支持跨源请求。（示例文件名为Hello.pdf）

PDFJS.getDocument方法接受文件的URL或PDF文件的ArrayBuffer。因此，您可以将文件读取到ArrayBuffer中（可能使用FileReader.readAsArrayBuffer），然后将缓冲区传递给getDocument。

请参见此处。

如果你想在本地运行它，并且它必须是JavaScript，我会寻找可以处理PDF的Node.js模块，比如pdf2json。