我正在从事OCR项目。我使用Firebase ML Kit进行光学字符识别。我必须在捕获的图像上用不同语言的翻译替换文本。为此,我需要先从原始图像中删除文本,然后再在其上绘制翻译的文本。
我尝试从检测到的文本坐标中提取可能的背景颜色和文本颜色。它几乎成功了。但是问题是,背景会变成静态颜色。
https://superuser.com/questions/1359257/how-to-use-ffmpeg-removelogo-filter
我能够获得图像中原始文本的确切坐标。在FFMPEG中找到了视频的delogo过滤器。由于相邻的像素会填充所需的区域,因此请尝试在android中对位图图像进行尝试。已经有用于从位图中删除徽标/水印/对象的任何算法/实现。
期待这样的事情
答案 0 :(得分:0)
使用Firebase Ml套件Example
的Google翻译器获取FirebaseVisionDocumentText后,您可以使用google Translate API