我目前正在一个小小的项目与错,识别11SDK。提高我的结果我喜欢的工作有一个特设词典。内容词典是基于第一词的定线

例如:

Samsung Galaxy S3 ... many other word in this line
Apple Iphone 4 ... much more words
some more lines

我的想法是recongize第一词(三星或苹果),并填写的字典与所有可能的话根据第(三星:银河系,S3,...)

任何想法如何解决这与错,识别

关于

有帮助吗?

解决方案

谢谢你的澄清。因此,这里是什么你可以做我的意见。这适用于错,识别产品线,当然在SDK你有更具体的控制,通过API。

错,识别OCR有这些词典:

  • 建立在字典中-大套共同的词语及其变化的一个优势。OCR技术。它不包含专门的词语,例如"三星"和"S3"为例。通过选择受欢迎的语言,则自动在内的字典用这种语言。

  • 定义的字典-这是一个典,你可以建立,并使用单独或结合与内在的字典。

因此,对于你的项目,我相信这是有道理的使用建立在字典,因为你的短语可能有标准的英文字(未提供完整的短语对于我看到的,所以决定在该你自己)。

我还强烈认为,需要创建一个自定义的字典品牌和型号等。如果你有这样的选择,并且听起来像你一样。这将大大提高认识,特别是对联合国的自然词语,如"S3",因为共同语言的规则表示字母和数字不应当混用。这是很容易做到的。

我目前看不出有益的阅读每个符合一个独立的字典,除非你相信你将有个交叉点非常相似的词适用于不同的纹路,你想想这些词语在独立的字典和相对于每个线。然后您可以创建独立的词典,并把每个字典次承认基于初始词。然而,为了实现这一目标,需要首先分开进行(在存储器,或实际作物的图像),以便能够处理每个分别具有独特的字典。这是可能的,只有在SDK有大量的工作。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top