1. Перейти к содержанию
  2. Перейти к главному меню
  3. К другим проектам DW

12.02.2001 Новые способы коммуникации между человеком и компьютером

ВладимирФрадкин

Здравствуйте, в студии – Владимир Фрадкин.

В одной из недавних передач мы рассказывали о новых достижениях в сфере создания искусственного интеллекта. Речь, в частности, шла об умении роботов играть в футбол, то есть о способности машин в известной мере "творчески" воссоздавать человеческое поведение, самостоятельно анализируя ситуацию и действуя по обстоятельствам. Однако сегодняшние компьютеры могут не только имитировать, но и анализировать поведение человека. Например, его телодвижения. Причём не только более или менее сознательную мимику и жестикуляцию, но и совершенно непроизвольные или неконтролируемые движения. Послушайте репортаж Виталия Волкова:

Венский профессор Карл Граммер, директор Института урбаноэтологии имени Людвига Больцмана и один из ведущих научных сотрудников Института биологии человека, работает над тем, чтобы научить компьютер регистрировать и оценивать самые, казалось бы, незначительные жесты и телодвижения человека. Цель профессора и его коллег – создание такого программного обеспечения, которое позволило бы из всего массива видеоданных "выуживать" информацию о внутреннем состоянии объекта наблюдения. Задача весьма важная, если иметь в виду, что та информация, которой партнёры по коммуникации обмениваются с помощью жестов и телодвижений, по объёму и важности содержания не уступает информации, получаемой одним собеседником от другого при вербальном контакте – только воспринимаются и расшифровываются эти невербальные сигналы, в основном, не на сознательном, а на подсознательном уровне. Более того, непроизвольные жесты, телодвижения, моторика глаз и так далее являются объективными и достаточно тонкими индикаторами, позволяющими судить о внутреннем состоянии человека. (Кстати, это обстоятельство положено в основу такой эффективной современной психотерапевтической методики как нейро-лингвистическое программирование. Её разработчики как раз и занимались тем, что методами системного анализа изучали общие элементы в подходах различных психотерапевтов, выявляя универсальные "ключи", содержащиеся в невербальных реакциях пациентов). Карл Граммер намерен придать ЭВМ некоторые из таких психотерапевтических способностей:

    С одной стороны, мы, естественно, хотим выяснить, насколько движение и его качественные характеристики важны для взаимопонимания между собеседниками, какой вклад различные параметры движения вносят в создание знаковой системы коммуникации. Это первый пункт. А второй пункт, естественно, заключается в том, чтобы выяснить, что именно люди пытаются сказать с помощью телодвижения, что можно "усмотреть" в их движениях. И тут, похоже, мы уже можем констатировать, что в движениях человека кроется немало самой разнообразной информации о его личности: начиная с гормонального баланса и кончая склонностью к депрессии.

Для того, чтобы научить ЭВМ выявлять эти индивидуальные параметры, профессор Карл Граммер и его коллеги разработали специальную программу, получившую название "E-Motion". Она преобразует регистрируемые видеокамерой телодвижения пациента в цифры и графики и определяет по ним показатели, характеризующие состояние его психики.

    Мы определяем такие параметры движения, как скорость, ускорение и так далее, а затем сопоставляем их с данными, почерпнутыми из других медицинских источников: гормональных анализов слюны, историй болезни, специальных анкет, заполняемых пациентами на предмет ранней диагностики депрессий, и так далее,

говорит Карл Граммер. Чтобы ввести в ЭВМ первоначальный объём сравнительных данных, то есть задать определённую "сетку координат", сотрудники группы профессора Граммера составили своего рода "архив телодвижений" на более чем 400 женщин. Каждую из них попросили совершить перед видеокамерой одно и то же движение – "поворот кругом".

    Эти кадры записываются на видеомагнитофон и поступают в компьютер, который анализирует параметры движения и строит соответствующую кривую.

Анализ этих графиков, полученных на основе видеоданных, показал, что характер телодвижений женщины коррелирует с её гормональным балансом. В частности, оказалось, что существует достаточно жёсткая связь между кривой движения и уровнем острогена в организме женщины.

    Этот график вводится в нейронную сеть, и та определяет уровень эстрогена.

Тут требуется небольшое пояснение. Нейронная сеть представляет собой множество компьютеров или микропроцессоров, соединённых параллельно. Такая сеть, своей структурой напоминающая нервную систему животных, широко используется учёными для решения задач, связанных с распознаванием зрительных образов. Нейронная сеть способна находить закономерности в ситуациях, которые человеку представляются сугубо хаотическими. Так вот, компьютерный анализ выявил, что, например, телодвижения женщины в период, когда она способна к зачатию, отличаются от её же телодвижений в другие дни менструального цикла. Профессор Граммер особо подчёркивает индивидуальность и достоверность такого компьютерного анализа:

    Убедительным доказательством может служить способность компьютера правильно определить физиологическое состояние женщины, которую он, так сказать, "видит впервые". Так вот, наши компьютеры обладают такой способностью.

По мнению Карла Граммера, определение гормонального баланса пациента путём компьютерного анализа его телодвижений – это лишь начало пути, который в перспективе приведёт к возможности получать достаточно полное представление если не о внутреннем мире, то, по крайней мере, о психике и характере наблюдаемого человека.

    В ближайшие годы вполне реальным делом станет распознавание надвигающихся депрессий и классификация личности пациентов – к решению этих двух задач мы приблизились, можно сказать, вплотную,

подчёркивает Карл Граммер. Речь идёт, в частности, и о том, что компьютеры, оснащённые программой "E-Motion", смогут по данным внешнего наблюдения за человеком делать заключение об особенностях его психики, выявлять аномальные и пограничные состояния, определять степень агрессивности человека и меру испытываемых им эмоций – страха, гнева, отчаяния:

    Примерно через 20-30 лет программное обеспечение достигнет такого уровня развития, что его можно будет, например, использовать в системах наружного наблюдения и видеоконтроля. Причём речь тут, естественно, может идти о двух различных концепциях такого наблюдения: позитивном и негативном. Позитивное наблюдение позволит выявлять лиц, имеющих серьёзные психологические проблемы: скажем, подверженных депрессиям или склонных к самоубийству. А негативное наблюдение – это тотальный контроль, представляющий собой крайнюю, экстремальную разновидность наружного наблюдения. К сожалению, такая перспектива тоже вполне реальна. Кое-где тотальный контроль применяется уже сегодня: например, во многих городах Великобритании, в том же Лондоне, буквально повсюду, на каждом углу, установлены камеры слежения. Изображение поступает в полицейские участки на мониторы, перед которыми круглые сутки дежурят специальные операторы. Новое программное обеспечение позволит в автоматическом режиме обрабатывать и классифицировать колоссальный массив видеоинформации. Это-то и вызывает серьёзные опасения и даже протесты: автономность или, если хотите, самостоятельность компьютера даёт ему власть над людьми. Предотвратить распространение порочной практики тотальной слежки можно только законодательным путём,

считает Карл Граммер. Если же законодатели не поторопятся, то уже в не столь отдалённом будущем не только люди смогут следить за действиями компьютеров, но и компьютеры, – благодаря программам профессора Граммера – смогут наблюдать за людьми и оценивать их: поначалу, скажем, в кабинете у врача или при приёме на работу, а там, глядишь, и в быту. Например, родителям невесты наверняка будет небезынтересно понаблюдать за женихом, пока тот в ожидании знакомства с ними томится в прихожей, и таким образом узнать всю его подноготную...

Однако разбираться в телодвижениях людей учатся не только компьютеры профессора Граммера. Инженеры берлинского Института информационных технологий имени Генриха Герца тоже работают над тем, чтобы научить ЭВМ воспринимать жесты и взгляды пользователей. Правда, свою задачу берлинские специалисты видят не в том, чтобы определить внутреннее состояние пользователя, а в том, чтобы облегчить ему "диалог" с компьютером и, в частности, избавить от необходимости пользоваться для ввода команд клавиатурой и мышью.

    Мы поставили перед собой задачу расширить возможности применения компьютера. При этом имеется в виду не увеличение тактовой частоты или рабочей памяти ЭВМ, а то, что она реально может делать. И одновременно мы хотели существенно упростить пользование компьютером,

говорит сотрудник берлинского Института информационных технологий Зигмунд Пастоор. Речь идёт, прежде всего, о трёхмерной графике и о создании альтернативы компьютерной мыши.

    Непосредственный доступ рукой к объекту на экране монитора – без посредничества каких бы то ни было вспомогательных устройств вроде мыши и уж тем более клавиатуры – открывает перед пользователем возможность работать в действительно интерактивном режиме, поскольку позволяет гораздо быстрее моделировать и перемещать виртуальный объект. А с помощью взгляда, то есть движением глаз, можно изменять такие параметры объекта, как длина, ширина, высота и так далее,

считает Франческо Сакко, специалист по компьютерному дизайну и коммерческий директор фирмы "Sacco Multimedia". Для того, чтобы пользователь воспринимал объект на экране монитора как трёхмерную картинку, каждый глаз должно видеть его в своём ракурсе. Этот эффект достигается тем, что компьютер формирует два различных изображения объекта, раскладывает их на тонкие полоски и передаёт обе картинки на экран монитора. Специальная плёнка, покрывающая экран и состоящая из цилиндрических линз, фокусирует изображение так, чтобы правому глазу "досталась" "правая" картинка, а левому – "левая".

Однако если для создания трёхмерной картинки на экране монитора хватает фокусирующей плёнки и не очень сложного программного обеспечения, следящего за правильным разложением изображения, то для того, чтобы управлять компьютером без мыши и клавиатуры необходим – во всяком случае, пока, – гораздо более сложный аппаратный и программный комплекс.

    Сегодня, чтобы взаимодействовать с компьютером, обычно используют клавиатуру или мышь, в последнее время появилась ещё возможность подавать команды голосом. Мы же пытаемся научить компьютер зрительному восприятию. Для этого мы расположили вокруг монитора несколько видеокамер. Это своего рода глаза компьютера,

поясняет Зигмунд Пастоор. Эти видеокамеры "умеют" распознавать положение глаз сидящего за компьютером пользователя. Монитор установлен на подвижном основании с электроприводом и может поворачиваться, "подстраиваясь" под взгляд, а камеры отслеживают положение зрачков и по нему определяют, на чём именно сосредоточил своё внимание пользователь. Несколько утрируя, можно сказать, что ЭВМ читает мысли пользователя или, по крайней мере, угадывает его желания. Пристально глядя на то или иное управляющее поле на экране, он тем самым подаёт компьютеру команды и может, в частности, осуществлять то, о чём говорил Франческо Сакко, то есть менять линейные параметры виртуального объекта. Кроме того, две дополнительные видеокамеры, установленные перед клавиатурой, вводят в компьютер информацию о жестах пользователя, движениях его рук, причём такие команды передаются непосредственно в качестве зрительных образов, без применения специальных перчаток, оснащённых сенсорами. Таким образом, пользователь может жестами управлять объектом на экране – скажем, вращать его. Правда, чтобы такая видеокомпьютерная система работала в режиме реального времени, вычислительной мощности обычных персональных компьютеров пока недостаточно, необходима супер-ЭВМ. Но Зигмунд Пастоор уверен, что новая техника, предложенная институтом имени Генриха Герца, будет пользоваться спросом:

    Прежде всего, мы полагаем, она найдёт применение в профессиональной сфере – например, в области компьютерного дизайна. Или в биохимии, где учёные моделируют сложные пространственные молекулярные структуры. Или в медицинской технике, там, где речь идёт о трёхмерной визуализации данных компьютерной томографии. Всё это – совершенно новые подходы к компьютеру как таковому и к проблеме коммуникации с ним.

Кстати, значительный интерес к такому "бестактильному" управлению компьютером проявили и фирмы, занимающиеся разработкой техники для инвалидов.

    Развитие альтернативных способов управления компьютером можно только приветствовать. Это облегчит жизнь не только инвалидам, но и обычным пользователям. Что хорошо для инвалидов, хорошо и для всех остальных. Если такого рода разработки действительно сделают операцию ввода команд в компьютер проще, удобнее, логичнее, то это не может не радовать. Это направление исследований следует всячески развивать, -

полагает Вольфрам Росдойчер, сотрудник Института медицинской техники при Техническом университете в Берлине. А вот что считает Ларс Бала, коммерческий директор фирмы "Vision Pearls", специализирующейся на рыночной реализации инноваций в области компьютерных технологий и, в частности, идей "бестактильного" управления ЭВМ:

    Мы хотим как можно скорее найти практические приложения для этой наукоёмкой разработки, причём использовать не супер-ЭВМ, а стандартные персональные компьютеры на базе операционной системы "Windows" и самые обычные недорогие сетевые камеры "webcams". Отчасти такая система уже реализована и в ближайшее время появится на рынке.

Это был репортаж Виталия Волкова.

Вот и всё на сегодня. В следующем выпуске радиожурнала мы поговорим о первой в мире трансгенной обезьяне, о расшифровке генома человека и о том, какие это открывает перспективы в области фундаментальных и прикладных исследований. А сейчас я прощаюсь с вами, всего доброго.

Пропустить раздел Топ-тема

Топ-тема

Пропустить раздел Другие публикации DW

Другие публикации DW