共计 183 个字符,预计需要花费 1 分钟才能阅读完成。
我在做一款 App,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App(进程)
我之前的做法是:
- 在光标周围置顶范围内截取屏幕
- 将截取的图片进行 OCR
- 每秒重复若干次上述操作
但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消
有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?
在我看来,这个似乎有点像是实时语义分割?
正文完
共计 183 个字符,预计需要花费 1 分钟才能阅读完成。
我在做一款 App,我希望能截取整个屏幕后进行 OCR 功能。也就是说包括其他任意 App(进程)
我之前的做法是:
但是,总是截取鼠标附近的区域,获取的信息量太少。如果截取整个屏幕,电脑性能又吃不消
有什么开箱即用的,实时性高的 framework 可以解决这个问题吗?
在我看来,这个似乎有点像是实时语义分割?