Категории каталога
Каталог / Наука / Новые технологии, изобретения / Роботы и искусственный интеллект / Attentive Interface. Часть вторая: сегодняшние решения

Attentive Interface. Часть вторая: сегодняшние решения

Некоторые отклики на первую часть статьи показывают, что Attentive User Interface (AUI – внимательный пользовательский интерфейс) иногда путают с дружественным интерфейсом, а то и с самим искусственным интеллектом.

Между тем, AUI — вещь, неизмеримо более простая. Ведь никому не придёт в голову обижаться на автоматическую дверь с фотоэлементом, гостеприимно распахивающуюся при вашем появлении. Или негодовать по поводу эскалатора, приходящего в движение под вашими ногами.

Наоборот, такие элементы AUI вызывают сначала чувство законной гордости за собственную персону, а очень скоро их вообще перестаёшь замечать. Вообще, грань между предупредительностью и надоедливостью в данном случае провести достаточно просто.

Если техника пытается среагировать на ещё не совершённое вами действие — это уже надоедливость и беспардонность с её стороны. Типичный пример — автоматическое перескакивание компьютерной мыши на ответ "да" в различных меню.

Если же курсор просто передвигается поближе к пунктам меню — это всего лишь предупредительность со стороны компьютера.

Разговор не сложился (фото с сайта hml.queensu.ca).

Разговор не сложился (фото с сайта hml.queensu.ca).

Однако всегда остаётся определённая вероятность ошибки. Может, вы только на минутку остановились перед всевидящими дверьми банка — прикурить или завязать шнурки, — а двери уже норовят завлечь вас внутрь. Поэтому, в наших интересах запрограммировать технику на наиболее очевидное и однозначное истолкование действий своих хозяев.

Давайте посмотрим, как эти проблемы решаются в уже знакомой нам лаборатории HML. Для начала, оцените такую полезную вещь, как индикатор интенсивности общения AuraMirror ("Зеркало ауры").

Крепить датчик EyeContact на лбу не слишком удобно (фото с сайта hml.queensu.ca).

Крепить датчик EyeContact на лбу не слишком удобно (фото с сайта hml.queensu.ca).
Это графическое панно, подглядывающее за беседующими людьми и иллюстрирующее, насколько они внимательны друг к другу. Алгоритмы, используемые этим устройством, могут помочь в конструировании AUI, так как поставят машину на место человека.

Степень человеческого внимания можно определять по многим критериям, большинство из которых с трудом поддаётся измерению. В этом нелёгком деле прибор, в первую очередь, руководствуется тем же, что и мы — глазами собеседников.

Работает AuraMirror следующим образом. К зеркальному экрану, представляющему собой 50-дюймовый плазменный монитор, подходят два человека. Их перемещения и реакции отслеживаются сразу четырьмя видеокамерами.

Основная камера фиксирует общий план и посредством компьютера накладывает цветные пузыри, символизирующие ауры собеседников, точно на их отражения в зеркальной поверхности. Эти пузыри ведут себя подобно вязкой жидкости.

Поведение пузырей регулируется показаниями трёх оставшихся камер. Вторая камера изучает движения людей и определённым образом их идентифицирует. Две другие камеры внимательно следят за человеческими лицами и направлениями взглядов.

Прототип внимательного мобильника на базе КПК показывает состояние вызываемых абонентов (фото с сайта hml.queensu.ca).

Прототип внимательного мобильника на базе КПК показывает состояние вызываемых абонентов (фото с сайта hml.queensu.ca).
Как видите, для решения, в общем-то, простейшей задачи, над которой мы даже не задумываемся, компьютеру понадобилось целых четыре "соглядатая".

В результате получилась наглядная динамическая иллюстрация человеческого общения, своего рода визуально-информативное искусство.

Пузыри дружно сливаются в экстазе, если собеседники заняты друг другом. Стоит кому-то отвлечься, как его пузырь тотчас "отворачивается". Для этого достаточно всего лишь поглядеть на своё отражение в экране AuraMirror.

Аурозеркало, конечно, не является самоцелью, а всего лишь любопытным фокусом и средством отображения работы моделирующих алгоритмов компьютера. По правильности его реакций можно судить о степени адекватности Attentive Interface — ведь в дальнейшем одним из участников диалога станет сам компьютер, мобильный телефон или ещё какая-нибудь железяка.

Как всё это работает на практике, на примере (PDF!) того же мобильника? Очень непросто.

Если человек видит, что двое заняты беседой, но имеет срочное дело к одному из них, то, скорее всего, он подойдёт, покашляет, потопчется, стремясь обратить на себя внимание. Дальнейшее определяется воспитанием.

Похоже, внимательная лампа не способна отследить все ваши перемещения (фото с сайта hml.queensu.ca).

Похоже, внимательная лампа не способна отследить все ваши перемещения (фото с сайта hml.queensu.ca).

Для тактичного мобильника такая тактика неприемлема. Да и средств контроля у него не слишком много, разве что микрофон. Благо, многие пользуются гарнитурами hands-free, заранее цепляя микрофон себе на одежду.

Положим, по определённому алгоритму, учитывающему вероятности пауз в беседе, можно довольно точно вычислить, что вызываемый абонент в настоящее время молчит, как рыба. А если он слушает собеседника?

Значит, на головы всех возможных собеседников надо напялить видеокамеры с датчиками направленного взгляда EyeContact, выслеживающими зрачки бедного абонента. Как показывает практика, слушающий около 40% времени смотрит в глаза говорящего.

EyePhone должен находится в зоне периферийного зрения работающего (фото с сайта hml.queensu.ca).

EyePhone должен находится в зоне периферийного зрения работающего (фото с сайта hml.queensu.ca).
Ну, а дальше все эти датчики по беспроводной сети донесут до телефона нашего вызываемого информацию о степени его занятости. А телефон предъявит вызывающему картинку, иллюстрирующую степень озабоченности интересующего его субъекта.

И пусть уж сам звонящий решает, как беспокоить: текстовым сообщением, виброзвонком, звонком погромче или пронзительным сигналом. Только и вызываемый, в свою очередь, может заранее установить уровни доступа.

Представляется, что такой интерфейс не покажется вам слишком привлекательным. Кому захочется обвешиваться микрофонами, видеокамерами, да ещё и перепрограммировать свой телефон в зависимости от обстановки.

То есть, вместо внимания со стороны техники, мы сами должны уделять ей внимания больше обычного, в расчёте на какие-то то эфемерные дивиденды. Не дело всё это.

С внимательным телевизором (PDF!) вроде бы всё просто. Не смотрит человек в экран — значит не интересно, пора выключаться.

EyePhone сожалеет, но Алекс не хочет говорить с Коннор (изображение с сайта hml.queensu.ca).

EyePhone сожалеет, но Алекс не хочет говорить с Коннор (изображение с сайта hml.queensu.ca).
А что, если хозяин вышел на кухню сварить себе кофе, а сам слушает краем уха выступление яркой личности? В конце концов, так и гол в футболе пропустить можно.

А что до лампочки с аудиовизуальным датчиком EyePliances, чутко реагирующей на взгляд и устное приказание зажечься, то как-то не по-людски разговаривать с лампочками и прочим домашним скарбом. Тоже скажем дружное "нет" таким новациям.

Между тем, EyePhone (PDF — глазотелефон) — штука довольно забавная. Это пара больших пенополистироловых глазных яблок, похожих на плюшевую игрушку и приводимых в движение электродвигателем.

Если у каждого из двух участников предполагаемого телефонного разговора на столе помещается EyePhone, являющийся образным представлением партнёра, то они могут начать беседовать, просто посмотрев на свои игрушки.

Опишем предполагаемый сценарий начала разговора между А и Б.

А хочет позвонить Б, для чего в течение полутора секунд пристально смотрит на свой EyePhone. Тот замечает хозяина и устанавливает связь, при этом вращая глазами и всячески делая вид, что усиленно ищет Б.

В это время EyePhone на столе Б аналогичными манипуляциями старается завладеть вниманием хозяина. Если это ему удается, то EyePhone на столе A демонстрирует успехи своего напарника преданным взглядом, означающим возможность начала голосового диалога.

В случае, когда Б не до разговоров и он отводит глаза от своего EyePhone, то и прибор у А опускает глаза долу и ещё отрицательно поводит ими из стороны в сторону.

И дальше сам А решает, стоил ли ему прибегать к крайнему средству — инициировать у Б звуковой сигнал. Всё это кажется довольно сложным, но, как ни смешно, именно по такому алгоритму воспитанные люди вступают в беседу.

Другое дело, что общение с техникой давно приучило нас игнорировать стадию невербального диалога. Всем кажется, что на другом конце провода с нетерпением ждут их звонка. А мобильные телефоны сузили зону социального комфорта до последнего предела — за все удобства приходится платить.

Между прочим, технология EyePhone может оказаться полезной во время многосторонних голосовых конференций, когда требуется вступить в беседу, не перебивая говорящего.

Внимательная видеоконференция избирательно переключается между участниками (фото с сайта hml.queensu.ca).

Внимательная видеоконференция избирательно переключается между участниками (фото с сайта hml.queensu.ca).

Что касается видеоконференций (тоже PDF), то слежение за направлением взглядов участников помогает определить, кто из них вызывает наибольший интерес, и передавать изображение именно этого человека крупным планом. Для переключения приоритетов вам достаточно посмотреть на другого участника.

Может быть, всё это и будет привычно для наших детей, но пока вызывает слишком много вопросов и чисто технических проблем.

Как минимум, надо научиться не замечать многочисленных датчиков, камер и микрофонов, предупредительно следящих за каждым вашим шагом и вздохом.

Естественно, на любое детище прогресса можно посмотреть глазами Оптимиста и Пессимиста. Но очень бы хотелось, чтобы такие разносторонние взгляды были присущи и Автору Изобретения. Хотя бы взгляд с точки зрения здравого смысла.

Выходит, всё-таки правы были наши читатели. Пока ещё не вырисовывается ничего сверхъестественного с Attentive Interface. Типичный сеанс магии с последующим разоблачением.

Материал предоставлен: Membrana.RU - Люди. Идеи. Технологии.

Реклама:
Где заказать рерайтинг текстов узнай на сайте eTXT.ru