macOS 技术栈下有什么可以高效的获取屏幕上内容的方法吗?

15次阅读

共计 183 个字符,预计需要花费 1 分钟才能阅读完成。

我在做一款 App,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App(进程)

我之前的做法是:

  1. 在光标周围置顶范围内截取屏幕
  2. 将截取的图片进行 OCR
  3. 每秒重复若干次上述操作

但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消

有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?

在我看来,这个似乎有点像是实时语义分割?

正文完
 0