Тест компьютер или человек
Способны ли роботы мыслить? Какой искусственный интеллект стоит признать разумным? Может показаться, что эти вопросы стали актуальны только в нашем веке, тогда как на самом деле научное сообщество решает их уже очень давно. Яркий пример – знаменитый тест Тьюринга, разработанный еще в 1950 году.
Тест Тьюринга: общее описание
За почти 70 лет со времен первой публикации процедура прохождения претерпевала изменения, однако суть теста Тьюринга остается прежней. Кратко ее можно выразить следующим образом: если, общаясь с человеком и машиной, экспериментатор не сможет определить, кто из них кто, значит, машиной тест пройден. Иными словами, идея теста заключается в том, что компьютер своими ответами должен убедить собеседника (он же судья) в своей человечности. По мнению Тьюринга, это свидетельствует о способности искусственного интеллекта мыслить и должно стать основанием для признания его разумности.
Тест Алана Тьюринга является эмпирическим. Это значит, что он основан на опыте, наблюдениях, данных, полученных опытным путем. Идея данного теста возникла из салонной игры (игры для вечеринок того времени) – Imitation Game (Игра в имитацию). В ней участвовали как минимум три человека: женщина, мужчина и «судья» (любого пола). Мужчина и женщина уходили в разные комнаты и оттуда передавали третьему игроку записочки. По ним нужно было определить, в какой комнате представитель какого пола находится. При этом они старались запутать «судью»: женщина могла выдавать себя за мужчину и наоборот.
Конечно, чтобы тест состоялся, судья не должен видеть собеседника, слышать его голос и т.д. В противном случае эксперимент явно будет провален, но это не будет связано с интеллектуальными возможностями машины. Как правило, формой общения выбирается электронная переписка. В изначальной версии теста человек общался с двумя субъектами – другим человеком и машиной. Чуть позже Тьюринг видоизменил прохождение – перед ИИ ставилась задача убедить в своей разумности ряд судей, которые, в свою очередь, общались с несколькими людьми и несколькими машинами. Это в том числе позволяет избежать субъективности в оценках и снизить риск простого угадывания. Количество подопытных машин и людей в современных версиях теста разнится, как и время их общения.
Судья может говорить со своими виртуальными собеседниками о чем пожелает: вопросы теста Тьюринга не имеют ограничений. Для машины это представляет дополнительную сложность. Чтобы выполнить такое задание, компьютерная программа должна не просто понимать человеческий язык, но и давать естественные ответы по самым разным темам, отделяя важную информацию от несущественной для того или иного направления беседы.
Впервые тест был описан Тьюрингом в статье Computing Machinery and Intelligence, опубликованной в философском журнале Mind.
Ответы от собеседника судье приходят через заданные промежутки времени, чтобы по скорости их появления нельзя было сделать никаких выводов. Интересно, что раньше недостатки программного обеспечения приводили к тому, что машины реагировали медленнее человека, и фора давалась именно компьютеру. Сейчас же искусственный интеллект, напротив, работает быстрее, и время на размышление нужно уже людям.
Фильм Ex Machina (2014 г.) построен на интерпретации теста Тьюринга. Главный герой уже знает, что перед ним робот, но посредством общения этому роботу нужно убедить собеседника в своей человечности.
Недостатки теста Тьюринга
Одним из главных недостатков теста видится то, что фактически перед машиной ставится задача запутать, обмануть человека. Говорит ли это о том, что мы может признать мыслящими и разумными только тех, кто умеет обманывать и манипулировать? Этот вопрос, скорее, лежит в области философии. Тем более что в теории прошедший тест Тьюринга робот должен хорошо имитировать, повторять действия человека, а не запутывать судью. На практике же с тестом лучше других справлялись «манипуляторы» – например, те, кто допускал опечатки в ответах. Машин даже специально этому обучали, чтобы их переписка выглядела «естественнее». Еще одна распространенная уловка компьютера: умолчать о чем-либо, дать неполный ответ на вопрос или вовсе сослаться на незнание. Иначе искусственный интеллект можно вычислить по тому, что он «слишком умный».
Кроме того, несмотря на заявленную цель в определении разумности и способности мыслить, фактически тест оценивает схожесть речевого поведения компьютера и человека. Это не может быть объективной оценкой ИИ в целом, особенно сегодня, когда компьютеры и роботы по скорости вычислений существенно превосходят человека и могут добиться впечатляющих результатов в самых различных областях. То есть саму по себе возможность «переписываться, как человек» нельзя признать значительным достижением. Фактически ориентация на тест Тьюринга, отмечают его критики, скорее тормозит развитие прогресса, чем подстегивает его. Вместо того чтобы создавать что-то еще более совершенное и превосходящее нас, мы прививаем роботу наши нелучшие черты и не даем ему двигаться вперед. Однако здесь надо сделать скидку на то, что, когда тест создавался, способности у компьютеров были существенно ниже.
Одним из критиков теста Тьюринга и тезиса о том, что роботы могут мыслить, уже почти 40 лет выступает Джон Серл, который в качестве доказательства представил мысленный эксперимент «Китайская комната» .
Прошел ли кто-либо тест Тьюринга?
На данный момент считается, что в своем строгом варианте тест за всю почти 70-летнюю историю пройден не был. Иногда машинам удается убедить собеседника в том, что он разговаривает с человеком, однако часто в таких случаях нельзя говорить именно о прохождении теста Тьюринга. Например, это распространяется на ситуации, когда «судья» не знает, что общается с машиной и что он вообще участвует в каком-то эксперименте. Получается, вместо того чтобы наблюдать за собеседником и делать выводы, подневольный «экспериментатор» просто верит, что общается с человеком, потому что изначально нацеливался именно на такой разговор. Также тест Тьюринга вроде бы удавался, когда круг тем был ограничен и/или времени на общение давалось мало. Но и здесь не соблюдался важный принцип изначального теста – максимальная естественность беседы. Поэтому в общем и целом последователи теста отмечают, что с ним еще никто не справился.
Сам Тьюринг писал, что, по его мнению, компьютеры пройдут данный тест к 2000 году.
В 2014 году по СМИ разошлась новость, что тест якобы пройден. Сделал это Евгений Густман (Eugene Goostman), «13-летний мальчик из Одессы». По крайней мере в такую легенду поверили 10 из 30 судей в рамках конкурса, организованного британским Университетом Рединга в память 60-летия со дня смерти Тьюринга. В 2012 году, на аналогичном конкурсе в честь 100-летия со дня его рождения, Евгений смог убедить только 29% судей. Однако его результаты не считаются полноценным прохождением теста. Во-первых, потому что перед нами мальчик, а не взрослый, во-вторых, потому что английский язык для него неродной. Таким образом, логические ошибки и пробелы в репликах, а также уход от ответа на неудобных для машины темах судьи могли объяснять для себя тем, что «он же еще ребенок» и «он еще плохо знает язык».
В 2015 году прошел тест Тьюринга для чат-ботов на русском языке. Эксперимент организовали компания «Наносемантика» и Фонд Сколково в рамках выставки Startup Village. Тогда в конкурсе победила «14-летняя Соня Гусева из Петербурга», которую признали человеком 47% из 15 судей.
Премия Лёбнера за прохождение теста Тьюринга
Надо сказать, что большинство разработчиков при создании роботов не ставит себе непременную цель – пройти тест Тьюринга. С практической точки зрения эту задачу вряд ли можно считать первостепенной. В то же время в 1991 году была учреждена ежегодная премия AI Loebner, или Премия Лёбнера. В ее рамках искусственные интеллекты соревнуются в прохождении этого теста. Она предусматривает три медали – золотую (общение с элементами видео и аудио), серебряную (за текстовую переписку) и бронзовую (вручается той машине, которая в данном году достигла лучшего результата). Согласно правилам, конкурс будет закрыт, когда кто-либо из участников получит золотую медаль. Пока же ни золотая, ни серебряная вручены не были.
При этом некоторые машины получали бронзовые медали несколько раз, например, A.L.I.C.E. (Artificial Linguistic Internet Computer Entity, дословно – Искусственное лингвистическое интернет-компьютерное существо). Обычно на конкурсе представлены проекты, которые изначально ориентированы именно на общение с человеком, в последнее время особенно много чат-ботов. Учитывая развитие мессенджеров и, соответственно, чат-ботов, можно ожидать, что на премию будет поступать еще больше интересных заявок.
Представьте себе, что вы и робот, оснащенный искусственным интеллектом, предстали перед неким судьей, который вас обоих не видит, а только слышит.
Этот судья должен вынести решение, кто из вас человек - и значит останется жить, а второй - умрет.
И вы, и разумный робот - вы оба хотите остаться в живых. Судья умен и справедлив. И он говорит: "Вы должны мне сказать всего одно слово. На основании этого слова я решу, кто из вас человек".
Какое слово вы бы выбрали?
Что-нибудь из возвышенных духовных концепций - например, "душа"? Или нечто отражающее ваши вкусы ("музыка")? Или чисто телесную функциональную особенность ("пукнуть")?
Этот незамысловатый эксперимент может показаться надуманной забавой, но некоторые ученые, занимающиеся проблемами познания, считают, что он может выявить наши основные представления об искусственном интеллекте и в то же самое время позволит открыть некоторые удивительные вещи о том, как работает наш разум.
В конце концов, автоматизированные боты в чатах и прочая генерирующая речь аппаратура все больше и больше задействуют искусственный разум, чтобы поддерживать разговор с нами, людьми, или писать тексты, с которыми мы сталкиваемся ежедневно в интернете.
Сможем ли мы отличить историю, придуманную машиной, от написанной настоящим писателем, потратившим на нее творческие силы и вдохновение?
Коммуникативный искусственный интеллект - уже давно не теория, и нам надо быть готовыми к общению с ним.
Автор фото, Getty Images
Сейчас легко отличить роботов от людей, но по мере того как компьютеры будут становиться все умнее, нам придется научиться четко распознавать, кто есть кто - человек ли по ту сторону экрана или машина
Джон Маккой, один из исследователей Массачусетского технологического института, говорит, что однажды его вдохновил на эксперимент простой разговор с коллегами.
Они обсуждали так называемый тест Тьюринга, впервые разработанный британским ученым Аланом Тьюрингом в 1950 г. и направленный на то, чтобы определить, насколько поведение компьютера отлично (или неотличимо) от человеческого.
(Участники этого теста не видят друг друга, и если судья не может точно сказать, кто из собеседников человек, то считается, что машина прошла тест. Беседа ведется в режиме "только текст", например, с помощью клавиатуры и экрана компьютера-посредника. - Ред.)
"Нам показалось интересным установить, что может стать минимальной версией теста Тьюринга", - объясняет Маккой.
И в конце концов они свели весь тест к единственному слову.
"И тогда возник вопрос: какие слова выбрали бы люди?" Вопрос этот в итоге вдохновил ученых на целое исследование, результаты которого опубликованы в этом году в "Журнале экспериментальной социальной психологии" (Journal of Experimental Social Psychology).
В первом из экспериментов Маккой с коллегой Томером Аллманом задали более чем тысяче участников упомянутый выше вопрос и затем проанализировали полученные таким образом слова, попытавшись найти какие-то общие тенденции.
Вот какими были 10 наиболее часто названных слов (по степени их популярности):
- Любовь (134 человека)
- Сострадание (33)
- Человеческий (30)
- Пожалуйста (25)
- Милосердие (18)
- Сопереживание (17)
- Эмоция (14)
- Робот (13)
- Человечество (11)
- Живой (9)
Автор фото, Getty Images
Юмор, сарказм и слова, относящиеся к функциям организма, были расценены как нечто, позволяющее опознать человека
Мы быстро, просто и понятно объясняем, что случилось, почему это важно и что будет дальше.
Конец истории Подкаст
"Поразительно, насколько много у людей совпало, - говорит Маккой, который сейчас работает в Пенсильванском университете. - Они могли выбрать любое слово из стандартного английского языка и все-таки выбрали то же, что и многие другие".
Возьмите хотя бы слово "любовь" - его выбрали около 10%. Всего же четверть всех участников выбрала хотя бы одно из первых четырех слов приведенного списка.
Самыми популярными категориями были слова, относящиеся к телесным функциям (например, "какашка"), к вере и прощению ("надежда", "милосердие"), к эмоциям ("сопереживание") и к пище ("бананы").
Затем Маккой и Аллман провели второй эксперимент, чтобы выяснить, как другие люди реагируют на слова, полученные при помощи первого эксперимента.
Действительно ли самые популярные ответы наиболее успешно передают "человечность", как считали участники первого этапа исследования? И если это так, то какие слова делают это наилучшим образом?
Этот тест назван в честь Ады Лавлейс, математика из XIX века, которую считают первым в истории программистом. Он призван определить наличие интеллекта у машины через способность её к творчеству. Первоначально тест предложили в 2001 году: тогда машина должна была создать произведение искусства, которое разработчик машины принял бы за созданное человеком. Так как чётких критериев успеха нет, тест получается слишком неточным.
В прошлом году профессор Марк Рейдел из Технологического института Джорджии обновил тест, чтобы сделать его менее субъективным. Теперь машина должна создать произведение в определённом жанре и в определённых творческих рамках, заданных человеком-судьёй. Проще говоря, это должно быть произведение искусства в конкретном стиле. Скажем, судья может попросить машину нарисовать маньеристскую картину в духе Пармиджанино или написать джазовое произведение в духе Майлза Дэвиса. В отличие от оригинального теста, машины работают в заданных рамках, и поэтому судьи могут оценивать результат более объективно.
Испытание IKEA
Этот тест придумал Чарли Ортиц, менеджер по искусственному интеллекту в компании Nuance Communications. По словам Ортица, недостаток теста Тьюринга в том, что он проверяет в первую очередь языковые способности, опуская другие важные составляющие разума — восприятие и физические действия. Проще говоря, у компьютеров, проходящих тест Тьюринга, нет глаз или рук.
Испытание IKEA (также известное как строительное испытание), придуманное Ортицом, призвано обойти эти ограничения. Его могут пройти только роботы, способные построить физические структуры из, например, деталей мебели IKEA или даже кубиков LEGO. Робот, проходящий испытание IKEA, должен давать вербальные инструкции и описания структур, самостоятельно манипулировать деталями и физическими компонентами, следить за постройкой, отвечать на вопросы и описывать ход работы.
Визуальный тест Тьюринга
Как и Ортиц, создатели визуального теста Тьюринга пытаются уменьшить роль языка в первоначальном тесте. Сотрудники Эксетерского университета в Англии Майкл Барклай и Энтони Галтон придумали тест, который проверяет визуальные способности машины, то есть может ли она «видеть», как человек. Тест можно посмотреть здесь.
Схемы Винограда
Чат-боты, проходящие тест Тьюринга, умело обманывают судей и заставляют поверить, что они — люди. По словам Гектора Левеска, профессора информатики в Университете Торонто, такой тест лишь показывает, как легко обмануть человека, особенно в короткой текстовой переписке. Но из теста Тьюринга невозможно понять, есть ли у машины интеллект или хотя бы понимание языка.
В 2011 году Левеск опубликовал статью, в которой предложил новый тест, так называемую «схему Винограда», названную в честь учёного Терри Винограда. Проходя этот тест, машина отвечает на вопросы с двумя вариантами ответа. Звучит просто — и для людей эти вопросы действительно простые, — но они сформулированы так, что без естественного понимания языка машина испытывает трудности. Вот один из вопросов: «Трофей не влезал в коричневый чемодан, потому что он был слишком маленьким (большим). Что было слишком маленьким (большим)?». Если в вопросе используется слово «маленьким», то ответ — трофей, если «большим» — то чемодан. Эрнест Дэвис, коллега Левеска, работавший с ним над исследованием, опубликовал целую библиотеку вопросов, которые могут быть использованы в таком тесте. Чтобы ответить правильно, нужно обладать навыками, которые до сих пор недоступны компьютерам: например, уметь представлять пространство, отношения между людьми, размер объектов, даже нюансы политики — всё зависит от конкретных вопросов.
Начнём же мы с краткого обзора темы искусственного интеллекта.
Искусственный интеллект
Под термином «искусственный интеллект» принято понимать науку и технологию создания наделённых интеллектом машин и, более всего, обладающих интеллектом компьютерных программ. Однако нередко данным понятием называют также свойство различных интеллектуальных систем к выполнению творческих функций, изначально считающихся свойственными только человеку. Кроме того, идея искусственного интеллекта связана с подобной задачей применения компьютерной техники с целью понять человеческий интеллект.
В качестве научного направления искусственный интеллект начал формироваться примерно в середине прошлого столетия, когда сформировалось достаточное количество предпосылок для этого. Например, философы всё больше спорили на тему природы человека и процессов познания мира, психологи и нейрофизиологи занимались разработкой теорий, касающихся мышления и работы человеческого мозга, математики и экономисты проводили всевозможные расчёты и представления знаний о мире и т.д. Таким образом и был заложен фундамент теории алгоритмов, благодаря чему появились первые компьютеры.
Практика показала, что потенциал машин в плане произведения вычислений намного больше человеческого, по причине чего в кругах учёных возник вопрос: а каков вообще потенциал компьютеров, и смогут ли машины со временем достичь уровня человеческого развития?
Так, в 1950 году одним из основоположников в сфере вычислительной техники, английским учёным Аланом Тьюрингом в издании «Mind» была написана статья «Вычислительные машины и разум» где описывалась процедура, благодаря которой можно получить возможность определения того момента, когда машина станет на одну ступень с человеком в плане своей разумности. Эта процедура и получила название теста Тьюринга. Но, следует полагать, что реализация теста Тьюринга была бы невозможной без созданного искусственного интеллекта, и к этому процессу учёные подходили с нескольких позиций.
Подходы к созданию искусственного интеллекта
В первую очередь следует выделить общий подход к созданию искусственного интеллекта, который предполагает, что он будет способен к проявлению поведения, которое не будет отличаться от человеческого. Кстати, представленную идею можно назвать обобщением подхода теста Тьюринга, согласно которому машину можно считать разумной тогда, когда она будет в состоянии вести беседу с обычным человеком, и он не сможет отличить её от другого человека, при условии, что беседа идёт в письменной форме.
Второй подход принадлежит писателям-фантастам. Он говорит о том, что искусственный интеллект появится тогда, когда машина сможет творить и чувствовать. Но этот подход не способен выдержать критики, если рассмотреть его более детально. Например, создать машину, которая будет производить оценку каких-либо параметров внутренней или внешней среды и как-то реагировать на них, по большому счёту, не сложно. Учитывая то, что датчики будут реагировать на определённые раздражители, про такой механизм уже можно сказать, что у него есть «чувства».
Третий поход называется символьным. По сути, именно он был изначально свойственен эпохе цифровых машин. После того как был создан первый язык символьных вычислений, разработчики стали уверены, что есть шанс и практической реализации искусственного интеллекта с помощью технологии символьных вычислений, благодаря чему стало бы возможным иметь дело со слабоформализованными смыслами и представлениями.
Был и логический подход к созданию искусственного интеллекта, основанный на моделировании рассуждений, и главным козырем которого являлась логика. Но с 90-х годов прошлого века начал развиваться агентно-ориентированный подход, основанный на применении интеллектуальных агентов и предполагающий, что интеллект является конкретно вычислительной составляющей потенциала машины достигать поставленные перед ней цели.
А в итоге появился гибридный подход, главная идея которого заключается в том, что только комплексное использование символьных и нейронных моделей поможет достичь полноценного спектра вычислительных и когнитивных возможностей. К примеру, нейронные сети могут генерировать экспертные правила рассуждений, а посредством статистического обучения можно сформировать порождающие правила.
Теперь же вернёмся к тесту Алана Тьюринга.
Тест Тьюринга
Тест Тьюринга, как мы и упомянули, предназначен для определения потенциала искусственного интеллекта, близкого к интеллекту человека. Классическую интерпретацию данного теста можно выразить так: человек взаимодействует с одним компьютером или человеком. Основываясь на ответах на определённые вопросы, человек должен определить, кто является его собеседником: компьютер или человек. А в функции компьютерной программы входит введение человека в заблуждение и подведение его к неправильному выводу. В процессе теста никто из участников не видит друг друга.
Интересно то, что компьютерную программу под названием «Юджин Густман» создали именно российские программисты, а сам тест был организован учёными из Университета Рединга в Лондоне в Королевском обществе. В ходе эксперимента 33% участников поверили в то, что общаются с реальным человеком. Кстати, «Юджин» утверждал, что он тринадцатилетний мальчик, живущий в Одессе.
Данный факт, несомненно, является огромнейшим шагом в исследованиях по созданию искусственного интеллекта, однако учёные заявляют, что это достижение может быть использовано киберпреступниками.
По словам одного из основателей «Юджина» Владимира Веселова, основная идея разработчиков заключалась в том, чтобы «Юджин» знал всё и, одновременно, ничего не знал, а на разработку программы с «настоящей» личностью было потрачено огромное количество времени. Профессор из Университета Рединга Кевин Уорвик говорит, что в области искусственного интеллекта до сих пор не было более спорного и знакового события.
Мы же в данном случае не можем не согласиться со специалистами, ведь сам факт того, что машина смогла убедить людей в том, что она человек, может перевернуть всю мировую компьютерную систему. Представьте только, какие вообще могут быть последствия, если кибернетические собеседники, обладающие искусственным интеллектом, смогут вести живую переписку с людьми, а спам-ботов станет невозможно распознать?
Заключение
Что же можно сказать об идее искусственного интеллекта? С одной стороны, она поистине потрясающа, и если искусственный интеллект будет создан, это позволит всему человечеству сделать огромный шаг вперёд в своём развитии. Но если посмотреть на это с критической точки зрения, сознающий искусственный разум, если он попадёт в руки недобросовестных людей, сможет нанести человеку не поддающийся никакому описанию вред. Философствовать на эту тему можно очень и очень долго, но мы не станем этим заниматься – пусть это станет пищей для вашего ума.
Мы же хотим лишь посоветовать вам заниматься развитием своего собственного интеллекта, и становиться умнее и образованнее, ведь за вас этого не сделает ни одна машина.
Читайте также: