PHP - 从 PDF 读取用户选择的文本的解决方法

PHP - Workaround for reading user-selected text from PDF?

本文关键字:文本 解决 方法 选择 用户 PDF 读取 PHP      更新时间:2023-09-26

>我正在做一个项目,允许用户从日语的HTML页面上传文本或内容,然后使用光标选择文本/内容中的单词以翻译成英语。但是,我希望能够将此功能扩展到PDF文件。从本质上讲,我希望用户能够提交一个PDF文件,并让浏览器以这样的方式呈现该PDF文件,当用户选择/突出显示PDF中的单词时,浏览器可以以某种方式中继突出显示部分的文本是什么,例如通过javascript,然后中继到PHP变量。

我知道在stackoverflow上有很多帖子在问类似的问题(我花了几个小时试图整理它们!),但我似乎找不到关于这是否可能的明确答案。似乎有很多选项可以将PDF转换为HTML或从PDF中提取文本,但老实说,我很困惑这些选项中的任何一个是否与我想要完成的任务相关。我知道有一个用于Adobe的javascript API,但我的印象是javascript已经需要嵌入到PDF中,如果用户上传自己的PDF文件进行渲染,则情况并非如此。即使这是可能的,Adobe javascript API中似乎也没有原生文本选择支持。

有没有一个简单的解决方法(矛盾?)来做到这一点?同样,我希望能够将PDF中选择的文本传递给变量 - 效果是用户突出显示他们不知道的单词,以便可以将这些单词添加到单词库中以便在字典中检索。

如果我能更清楚地了解任何事情,请告诉我。谢谢!

我认为你最好的选择是将PDF转换为HTML(见这个答案),然后你已经设置好了,因为你已经为常规HTML实现了所有内容。