算法用于绘画的机器人

你好

我想写一个软件分析图像,然后产生的一个影像捕捉什么一个人的眼睛感知在原始图像,使用最少的贝塞尔的道路的对象不同的颜色和透明度。

不同于最近的twitter的超压缩比赛 (参见:stackoverflow.com/questions/891643/twitter-image-encoding-challenge), 我的目的不是创建一个副本,这是忠实的图像,而是复制人的经验看图像。

例如,如果原始图像显示了一个红色的气球在左上角,并再现有的东西,这看起来像一个红色的气球在左上角,然后我会实现我的目标,甚至如果这球再生是不是很在相同的位置并不完全一样的尺寸或颜色。

当我说"如认为由一个人",我的意思是这在一个非常有限的意义。我没有试图分析的意义的一个图像,我不需要知道什么一个像是的,我是唯一感兴趣的关键视觉特征,一个人的眼睛会注意到,在某种程度上,这可以通过自动化的一个算法,它没有能力构思是什么,它实际上是观察。

为什么这个不寻常的标准的人感知过摄影的准确性?

该软件将被用于推动一个绘画的机器人,这将是与人类的艺术家 (参见:video.google.com/videosearch?q=mr%20squiggle).

而不是治标志着由的人这不是摄影完美的,因为必然是错误的,算法应该寻求将什么是已经在画布上到最终的图像。

因此相对的亮度,顺化,饱和,大小和位置的多重要的不是摄影完全相同。维持拓扑结构的功能,方块的颜色,梯度,凸凹曲线将更加重要的确切大小的形状和颜色,这些功能

仍然有我的吗?

我的问题是,我的痛苦一点从"当你有锤子一切都看起来像一个钉子"综合症。对我来说,似乎这样做的方法是使用了遗传算法的类似比较分子波变换 (参见: grail.cs.washington.edu/projects/query/) 使用的retrievr (参见: 实验室。systemone.在/retrievr/) 选择适合的解决方案。

但主要原因,我看到这个作为回答,是这些都是这些都是技术我知道,可能有更典雅的解决方案使用的技术我不在任何有关。

这将是特别有趣的考虑方式的人的视觉系统分析的图像,因此也许特别关注需要支付的直线,和角度,高对边界和大块的颜色。

你有任何的建议的事情我应该阅读的愿景,图像的算法,遗传算法或类似项目?

谢谢你

PS。一些拼写上可能出现的错误向你和你的拼写检查.它只是国际拼写形式可能不同于标准在国家:例如澳大利亚标准:颜色vs美国标准:颜色

有帮助吗?

解决方案

有是可作为一个算法来计算用于图像的显着图中,确定图像的哪些部分将来自人获得了最多的关注实现的模型。

该模型被称为ITTI科赫模型结果 你可以找到一个挑动纸这里结果 多的资源和C ++源码这里

其他提示

我不能直接回答你的问题,但你真的应该看看艺术家/程序员(Lisp的)的哈罗德科恩涂漆机亚伦

这是一个相当大的任务。您可能会感兴趣的图像矢量化(不知道它的正式名称叫),这是用来参加光栅图像(比如你用一个相机拍摄的照片),并输出一组的贝塞尔线(我认为)逼近你把图像由于良好的算法通常输出质量非常高(读:复杂的)。行设置你也很想在简化算法,它能够极大地帮助。

可惜我不是我旁边的图书馆,我也可以reccomend上知觉心理学的一些书籍。

您必须考虑的第一件事是人眼的生理是这样的,当我们检查的图像或场景,我们只是在一个时间捕捉极小的位,如我们的眼睛周围镖迅速。我们的头脑peices不同部分一起尝试并形成一个整体。

您可以通过它周围飞镖找到了眼球的路径的算法开始。也许它被吸引到对比?

接着是,我们的眼睛调节“曝光”,这取决于上下文。这就像那些高动态范围图像,如果它们是由一整个场景的多次曝光peiced在一起,而是由许多小的图像,在其自身的每个平衡,但混入其周围,以形成一个高的动态范围。

现在有一个猴脑一发现有照出了,如果有一个在其视野的左上对角线单个神经元。类似的神经元可以为垂直线,在视觉的猴子的领域的各个领域水平线被发现。所述“diagonalness”确定的频率与该神经元激发。

一个可能推测其他神经元可能被发现并且被映射到其他品质,如发红,或texturedness,和其他东西。

有一些人能做到这一点我从来没见过一个计算机程序永远能够做到的。这是所谓的“封”,其中一个人能够填写有关他们看到的,不图像中实际存在的东西的信息。一个示例:

          *






*                    *

是一个三角形?如果你知道这是提前,那么你很可能使一个程序连接点。但是,如果它只是圆点是什么?你怎么能知道呢?除非我不得不应付一个的一些非常聪明的办法,我不会尝试这一个。

有关于人类感知许多其他事实你也许可以使用。祝你好运,你没有选择了一个简单的任务。

我觉得一个东西,可以帮助你在这个巨大的任务是人为参与。我的意思是数据。就像你可以有很多人坐在随机点凝视(像从以前的帖子),并连接他们,因为他们看到的权利。你可以利用这些数据。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top