如何从网页中的嵌入 pdf 中获取所选文本
How to get the selected text from an embedded pdf in a web page?
这是一个pdf文档的示例,我需要从中提取用户的选择 http://www.ada.gov/hospcombrprt.pdf。如果我们查看页面源代码,我们将看到如下内容:
<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin"
src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
</body>
</html>
我们如何从这个嵌入的pdf中获取用户的选择?
我在这里找到了一篇关于从 pdf 文档中提取全文的帖子,以及一篇类似于我的帖子,其中写道没有这种可能性。
但应该有一些出路。也许可以提取整个文本,然后以某种方式确定选择了什么?或者通过鼠标按下和向上事件上的鼠标光标位置确定选择?任何想法将不胜感激。
我怀疑这是否可能 - 如果是,将没有通用解决方案,因为每个PDF查看器都是不同的。
不是每个人都使用Adobe自己的Acrobat插件。福昕很受欢迎。这两个插件很可能不提供访问此信息的接口。
一些浏览器,如Chrome和Firefox现在提供了一个内置的PDF查看器,其工作方式与插件完全不同。
另外,您是否正在访问其他域上的PDF?在这种情况下,同源策略无论如何都会阻止访问此类信息。
最后,您需要考虑到并非每个用户都喜欢使用(甚至被允许使用)PDF浏览器插件,因此您的"解决方案"在这些情况下不起作用。
还有一点:你正在使用过时的embed
元素而不是object
这一事实表明你正在使用非常古老的知识。
您可能需要退后一步,真正重新考虑您在这里要做的事情。大局是什么?你想实现什么?
我也想要一种从网页上的pdf中获取选定文本的方法,我遇到了pdftron,这当然不是本机方法。您可以使用pdftron的网络查看器使用以下方法从pdf中获取选定的文本:
var selectedText = myWebViewer.getInstance().docViewer.getSelectedText();
相关文章:
- 获取当前页面MVC 5的pdf
- Phonegap从PDF文件中获取内容
- 如何使用TCPDF在可编辑PDF中获取日期选择器
- 通过javascript获取pdf文件的表单数据
- 使用javascript获取aws上pdf的页数
- 使用PDF.js获取PDF的修剪区域
- 正在获取文本内容pdf.js
- 如何在Acrobat中使用javascript获取PDF表单字段的所有键值对
- 如何获取和设置鼠标单击x,y打开的pdf文档的位置
- 如何从网页中的嵌入 pdf 中获取所选文本
- 在 pdf.js 库中,哪个文件调用 read_pdf 函数将 pdf 的数据从服务器端获取到客户端
- 使用 PHP 或 JavaScript 解析 pdf 表单以获取字段位置
- 是否可以将相对 URL 提供给 Phantom.js页面生成器以获取 PDF 渲染
- 如何获取用户上传的.PDF的页数
- 使用javascript获取PDF的设备id
- 如何从Javascript强制显示下载/打开对话框以获取PDF
- 获取PDF通过REST API与头认证令牌,并显示在iframe
- 使用DOMPDF与jQuery获取PDF
- 从部分匹配中获取.pdf文件的Javascript
- 如何使用pdf.js获取pdf标题