Возможно ли пройти тест Тьюринга с помощью современного программного обеспечения?

StackOverflow https://stackoverflow.com/questions/1648670

Вопрос

Я задаю этот академический вопрос, я хочу задать вслух очень важный вопрос и попросить сообщество попытаться ответить на него.Можем ли мы создать систему, которая генерирует сцену для воспроизведения в живом анонимном групповом видеочате, который может читать набранный в нем текст и отвечать с помощью чат-бота?

Видео в прямом эфире в Интернете часто бывает размытым и имеет низкое разрешение.В сцене отдаленной вечеринки нельзя разглядеть многих деталей.Сцены могут быть отрисованы с помощью современных программных средств, которые выглядят очень реалистично, когда они не движутся.Заставить их двигаться реалистично - это большая часть программного обеспечения для моделирования.

Лица могут визуализироваться со скоростью 24 кадра в секунду кластером из 24 систем, способных отображать 1 кадр в секунду.Затем видео будет иметь задержку в 1 секунду с момента принятия решения о том, какое выражение лица генерировать.Эти выражения лица и их генерация - ключевая проблема.Требование реалистичности оформления - это решаемая проблема графического сообщества.

Выражения лица были классифицированы несколькими исследователями.Они также могут быть визуализированы, это было показано в современной литературе по компьютерной графике.Мы можем выполнять их, если знаем, какие из них подходят для данной ситуации.

Чат-боты используются уже несколько десятилетий.В настоящее время существуют довольно "умные" программы для общения в чате, которые будут читать то, о чем спрашивают, и разумно отвечать.Они всегда делали это с текстом, но программное обеспечение для чтения текста может говорить человеческим голосом, а программное обеспечение для распознавания речи с каждым годом становится все лучше.

Что я предлагаю, так это тот факт, что соединить все эти разрозненные части разработки программного обеспечения и создать действительно потрясающую программу для теста Тьюринга должно быть довольно элементарно.

Эта программа могла бы входить в виртуальное пространство и отображать реалистичную обстановку, как будто на веб-камере, как и другие участники.Он может наблюдать за выражением их лиц, слушать их речь и читать их текст.Затем он мог бы создать ответ и либо ввести, либо передать его обратно группе.Выбор того, что ответить, - это сложная проблема, с которой не справилось даже большинство людей.Мы можем приблизиться к этому, приложив много усилий.

Тест Тьюринга призван доказать, что коммуникатор - это человек, но "доказательство" только в том смысле, что оно достаточно хорошо, чтобы обмануть судей-людей.Если судьями-людьми будут просто все, они, скорее всего, не будут применять строгую формальную процедуру.Угадать или попасться на уловку - этого достаточно.

Как ты думаешь, мы сможем это сделать?

Является ли этот план ошибочным?Есть ли моральные последствия в том, чтобы таким образом обмануть среднестатистического зрителя?Можем ли мы заработать миллионы долларов, создавая персональных интеллектуальных помощников?

Это было полезно?

Решение

В этой области уже ведутся исследования.Цифровые аватары использовались с некоторым успехом.Некоторые из ключевых моментов:

  • Современные КОМПЬЮТЕРЫ могут без проблем отображать убедительное человеческое лицо в режиме реального времени.Просто установите карту gfx среднего размера и хорошую модель - и все готово.(см . Рассвет, например).

  • Современное программное обеспечение для генерации голоса может создавать беглый текст и произносить его правильно.Это все еще немного монотонно, так как у говорящего нет эмоций.(См . эта статья).

  • Проводятся исследования, направленные на то, чтобы заставить машины "чувствовать".Я говорю "чувствовать", потому что это, по сути, просто небольшая программа с парой переменных ("гнев", "страх", "голод", "скука", "печаль" ...) и сложным набором правил, которые влияют на эти переменные.(Смотрите Подробная статья в Википедии).

Главная проблема сейчас заключается в том, что мы не знаем, что такое эмоции.Являются ли они просто количеством молекул, плавающих в определенных частях мозга?Если да, то какие молекулы и в какой части мозга?Нейробиологи сегодня пытаются предсказать состояние ума, глядя на снимки магнитно-резонансной томографии.Чтобы понять, что это значит, приведем аналогию:Они пытаются угадать, чем занимается человечество, глядя на распределение света на Земле с Луны невооруженным глазом.

Поэтому мы не понимаем, что такое эмоции.Следующее препятствие заключается в том, что эмоции ничего не значат без контекста.Легко написать программу, которая чувствует себя "грустной", просто установив значение переменной sadness до 1.0.Но это было бы странно, если бы не было никакой причины.Таким образом, программа должна уметь следить за разговором, создавать его мысленный образ (о чем говорят люди и как они себя чувствуют прямо сейчас), а затем корректируют свое собственное психическое состояние, следуя действующим правилам соответствующей группы.

Вы знаете, каково это, когда ты впервые присоединяешься к новой группе и пытаешься взять в толк, что происходит и как ты должен себя вести.Это трудная задача для людей и тем более для программы.

Есть такая статья "Können wir eine Seele simulieren?" (Только Неман, но выходные данные Google Translate это довольно хорошо.)

Другие советы

Мы не можем пройти традиционный текстовый тест Тьюринга. Добавление видео сверху не имеет значения.

Я не согласен с наличием здесь вашего вопроса, но считаю необходимым указать, что вы серьезно не поняли, в чем смысл теста Тьюринга. Это не имеет ничего общего с тем, чтобы выглядеть как человек или как человек.

На самом деле, большинство предлагаемых тестов включают в себя телетайпный терминал с задержкой по времени, поэтому передача информации настолько мала, насколько это возможно, за пределы реальной проверяемой связи.

Я не хочу разбить ваш пузырь, но нынешнее поколение чат-ботов и даже самые продвинутые ИИ в лаборатории далеко не победили тест Тьюринга. Очень быстро становится очевидно, что там нет реального человека.

Большая проблема не в том, чтобы визуализировать (визуально или вокально), а в том, чтобы передать интеллект и эмоции.

То, что вы предлагаете, - это интерфейс Шрека в реальном времени. Но как насчет серверной части?

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top