找出图像中文本块的像素坐标

Finding out pixel coordinates of the block of text in an image

本文关键字:像素 坐标 文本 图像 中文      更新时间:2023-09-26

我有一个.png图像。图像包含各种文本块。我想找到每个文本块在图像中的位置。这些方块是长方形的。

由于块是矩形的,我需要左上角的像素值,然后是矩形的长度和宽度。

我可以用任何软件来做这件事吗?还是一些简单的方法?

这样做的主要目的是在javascript中识别该大小的div,然后使其可点击。

图像的示例可以是https://www.dropbox.com/sh/bup6lvwqs30ls4e/AACEQpGRhuKLyPa61fCzjV0sa?lst=#lh:null-12.png,我想找到营养列表和成分列表的像素位置。

如果你只有一个png图像,而没有其他东西,并且你想从中推断文本位置,这是一个非常困难的计算机视觉问题,并且没有简单的JavaScript库可以利用。如果你可以设置某种服务来处理这个图像,即将这个图像上传到服务器,计算这些图像中的边界框,那么你有几个选择:

  • 我不在乎准确性,我只想让我的东西发挥作用:http://code.google.com/p/tesseract-ocr/
  • 我想使用最先进的技术:从http://crypto.stanford.edu/~dwu4/ICDAR2011.pdf,并使用谷歌查找相关内容