我正在尝试寻找有关尝试创建一个可以理解英语单词、语法和上下文的基本人工智能工具的信息(希望是 C# 源代码)。

这个想法是通过使用尽可能多的书面文档来训练人工智能,然后基于这些文档,让人工智能用正确的英语创建自己的、对人类有意义的创造性写作。

虽然这个想法很简单,但我确实意识到障碍是巨大的,任何起点或好的资源都会被应用。

有帮助吗?

解决方案

A 基本的AI工具,可以用来做这样的事情是一个马尔可夫链。这其实不是太靠谱写!

请参阅: http://pscode.com/vb/scripts /ShowCode.asp?txtCodeId=2031&lngWId=10

如果这还不够,你也许能够共发现同义词集存储在您的马尔可夫链,而不是空谈。这给你的话的含义有所了解。

其他提示

为了能够重新编写文档,您必须过滤掉不良结果。

意思是:

  1. 你必须编写一个程序来评估输出是否有效(语法和句法上是你能可靠地做到的最好的)(这将是 NLP)
  2. 您将需要大量的训练数据和测试数据
  3. 您需要注意过度训练(查看 ROC 曲线)

您可以:而不是编写工具:

  1. 手动对输出进行评分(需要很长时间才能正确训练算法)
    1. 使用 Amazon Mechanical Turk 可能是个好主意

讽刺的是:计算机将很难“创造性地”创作出新的东西。它的所有价值都将基于其之前的经验[训练数据]

一些很好的参考,在此 自然语言 一文。

正如其他人所说,马尔可夫链似乎最适合这样的任务。实现马尔可夫链的详细描述可以在 Kernighan 和 Pike,编程实践,第 3.1 节. 。文本生成的精彩描述也存在于 编程珍珠.

一两件事,虽然不是很你需要什么,会是单词的马尔可夫链。这里有一个链接,我发现一个快速搜索:的http://博客。 figmentengine.com/2008/10/markov-chain-code.html ,但你可以通过搜索来找到更多信息。

看一看 http://www.nltk.org/ (自然语言工具包),许多功能强大的工具出现。他们使用Python(不是C#),但是Python是很容易回升。更容易拿起比自然语言处理的广度和深度,至少

我同意,你将不得不创造一些创造性的烦恼。你可能也使用在某些词的关键词微调。您可能还需要实施停止词过滤器除去任何口语。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top