Стив Манн: Моя «допосредованная» жизнь

Это было в 2004 году: я проснулся рано утром от грохота, выбежал на улицу и увидел, что автомобиль разбил угол моего ...

Это было в 2004 году: я проснулся рано утром от грохота, выбежал на улицу и увидел, что автомобиль разбил угол моего дома. Я подошёл к нему, чтобы поговорить с водителем, тот сдал назад и помчался, сбив меня и переехав мою правую ногу, пока я лежал на земле. Когда на меня наехали, на мне была система компьютерного зрения, которая, по моему разумению, должна была предоставить мне лучшее представление об окружающем мире. Удар и падение привели к перелому ноги и поломке моей нательной компьютерной системы, которая обычно перезаписывает данные в буферах памяти и не ведёт постоянную съёмку. Однако одним из результатов ущерба стало сохранение в памяти фотографий номера лицензии на вождение и самого водителя, который позже был найден и арестован благодаря записи инцидента.

Было ли слепой удачей (извините за выражение) то, что я оказался в системе расширения зрения в момент аварии? Вовсе нет: я проектирую, создаю и ношу такое устройство в той или иной форме более 35 лет. Я нашёл эту систему чрезвычайно полезной в деле расширения человеческих возможностей. Например, когда фары встречного автомобиля ночью светят прямо в глаза, я могу разглядеть лицо его водителя. Это возможно потому, что автоматизированная система делает несколько снимков с разной экспозицией перед отображением результата для меня.

Я собрал десятки подобных систем, расширяющих возможности моего зрения разными способами. Некоторые версии даже могут захватывать другие спектральные диапазоны. Если оборудование включает в себя камеру, чувствительную к длинноволновому инфракрасному излучению, я, например, могу обнаружить слабые тепловые сигнатуры, позволяющие мне увидеть, какие места в лекционной аудитории были освобождены только что, или то, у каких автомобилей на стоянке недавно заглушили двигатели. Иные версии оптимизируют текст, делая его более удобным для чтения, если он слишком далеко или написан на неизвестном мне языке.

Поверьте, после того, как вы ненадолго одели такой аксессуар, вы не захотите отказываться от всего, что он предлагает. Его ношение, однако, имеет свою цену. С одной стороны оно делает меня «ботаником». С другой — ранние прототипы было трудно надевать и снимать. Они имели алюминиевые рамы, плотно оборачивавшие голову владельца и требовавшие специальных инструментов для удаления.

Поскольку мои компьютеризированные очки могут подсвечивать тёмные области обозреваемого пространства и затемнять яркие области, я утверждаю, что они обеспечивают «опосредованную» версию реальности. Я начал использовать эту формулировку задолго до того, как популярность набрал ныне более распространённый термин «дополненная реальность», обычно относящийся к чему-нибудь менее интересному, вроде наложения текста или графики на верхнюю часть вашего обзора. Она не улучшит ваше зрение. На самом деле, она часто делает его даже хуже, загораживая вид массой визуальных помех.

Стив Манн в одной из своих разработок

Стив Манн в EyeTap Generation-4 Glass

В течение долгого времени зрение с помощью компьютера и дополненная реальность были довольно неясными темами, представляющими интерес лишь для некоторых корпоративных исследователей, учёных и небольшого числа страстных любителей. Однако недавно дополненная реальность захватила общественное сознание. В частности, Google в последнее время привлекает огромное внимание к своему проекту Glass — смартфону-очкам с нательным дисплеем. Я полагаю, что всё идет так, как должно. Но Glass гораздо менее амбициозен, чем опосредованные от компьютеров визуальные системы, которые я построил несколько десятилетий назад. Но что обещает участие Google, так это популяризацию данного вида техники.

Легко понять, что нам предстоит: переносная вычислительная техника, которая в числе прочего включает такие элементы, как мониторы физического состояния и камеры на шлемах, уже близка к созданию индустрии, объём которой будет выражаться миллиардами долларов. И если энергичная медиакампания Google для Glass — признак серьёзной заинтересованности в продукте поискового гиганта, то нательные компьютеры с головными камерами и дисплеями могут, наконец, стать чем-то большим, нежели новинка для отъявленных гиков.

Так вот, позвольте мне поделиться мудростью, накопленной за последние 35 лет. Я полагаю, что тысячи людей собираются испытать те странные ощущения, с которыми я впервые столкнулся десятилетия назад. Если я могу уберечь от некоторых кочек на этом пути, тем лучше.

Идея создать что-то, что улучшило бы моё зрение, в первый раз посетила меня в детстве — вскоре после того, как дед (заядлый ремесленник) научил меня сварке. Сварщики носят специальные очки или маски, чтобы следить за выполнением работы и защищать зрение от ослепительного света, исходящего от электрической дуги. В старомодных сварочных масках для этого используются затемнённые стёкла. В более современных — электронные затворы. В любом случае, человек получает ту же сварку, но через фильтр. Дуга по-прежнему выглядит неприятно ярко, а прилегающие зоны становятся удручающе тусклыми.

Эта давняя проблема сварщиков заставила меня задуматься: почему бы не использовать видеокамеры, мониторы, компьютеры для модификации вашего зрения в реальном времени? А почему бы не связать такие нательные компьютерные системы с централизованными базовыми станциями или друг с другом? Это позволило бы им стать гораздо более универсальными.

Я начал изучать различные способы реализации этого во времена моей юности в 1970-х, когда большинство компьютеров были размерами с большие комнаты, а беспроводная передача дынных — неслыханна. Первые версии созданных мной устройств включали передающие и принимающие антенны, в том числе кроличьи уши, которые, я уверен, на моей голове выглядели очень смешно. Но создание нательного компьютера общего назначения с беспроводными цифровыми коммуникационными возможностями само по себе подвиг. Я был горд успехом, и меня на самом деле не волновало, как я выглядел.

Моя нательная компьютерная система конца 1970-х эволюционировала до того, что я изначально проектировал как устройство для подведения фотографов к тексту, графике, видео, аудио и даже возможностям радара к началу 1980-х. Как вы можете представить, это потребовало от меня множества приспособлений. Из-за всего «железа», связанного с моими головой и телом, почти все вокруг думали, что я совершенно ополоумел. Когда я выходил с этим из дома, многие люди переходили на другую сторону улицы, чтобы избежать встречи со мной — включая некоторых выглядящих сомнительно типов, беспокоившихся за то, чтобы не быть замеченными с кем-то, носящим камеру и пучок радиоантенн!

Почему я иду на такие крайности? Потому что я понял, что будущее компьютеров точно так же зависит от связи между людьми, носящими компьютеры, как от выполнения колоссальных вычислений. В то время большинство инженеров, работавших с компьютерами, считало такую точку зрения плодом больного разума. Только после того, как я пошёл в аспирантуру MIT, в начале девяностых годов некоторые люди в моём окружении начинают замечать достоинства нательных компьютеров.

Аспирант Манн на испытаниях в MIT

Аспирант Манн на испытаниях в MIT

Технические проблемы на то время были огромны. Например, беспроводные сети передачи данных, сейчас распространённые повсеместно, пока не расцвели. Так что мне пришлось собрать собственные радиостанции для коммуникации. Радиолинии, созданные мной в конце 1980 года, могли передавать данные на молниеносной скорости в 56 килобайт в секунду.

За несколько лет до этого я вернулся к моему первоначальному вдохновению — улучшенным сварочным маскам — и сделал несколько образцов, включающих технологии расширения возможностей зрения. При сварке в такой защите я могу различить кончик блестящего электрода и даже форму электрической дуги, одновременно видя детали прилегающей области. Видимы даже объекты на заднем плане, как правило поглощённые темнотой. Эти шлемы используют разработанную мной технологию обработки изображений, которая теперь повсеместно используется для записи HDR-фотографий. Но они используют её в высокоскоростной видеосъёмке и позволяют пользователю просматривать стереоскопические данные в режиме реального времени.

Сварка была лишь одним из возможных применений моей системы компьютеризированного зрения, но она также повлияла на мой образ мыслей об этой технологии в целом. Так же, как сварщики называют свои затемнённые стёкла в единственном числе, я называю своё оборудование Digital Eye Glass (можно грубо перевести как «Цифровой монокль» — прим. ред.), а не «цифровые очки», даже в отношении того, что я собрал похожим на обычные или солнечные очки. Google также использует Glass в единственном числе и, вероятно, не случайно.

У меня смешанные чувства по поводу последних событий. С одной стороны приятно видеть, что остальной мир теперь ценит технологии нательных компьютеров. С другой стороны я волнуюсь по поводу пренебрежения Google и другими компаниями некоторыми важными уроками. Их дизайнерские решения могут затруднить использование этих систем для многих людей. Хуже того, плохо настроенные продукты могут привести к ухудшению зрения и отбросить прогресс на годы в прошлое.

Моё беспокойство уходит корнями в собственный опыт. Самые первые нательные компьютерные системы, которые я собрал, показывали мне видео в реальном времени через шлем-дисплей. Камера располагалась рядом с одним глазом, но она не имела той же точки обзора. В то время небольшое смещение казалось неважным, но оно привело к некоторым странным и неприятным эффектам. И те тревожные эффекты сохранялись долгое время после того, как я снимал устройство. Это происходило потому, что мой мозг привыкал к неестественному зрению, и требовалось некоторое время для приспособления к нормальному.

Исследование со сроком давности более века помогает это объяснить. В 1890-х годах известный психолог Джордж Стреттон (George Stratton) создал специальные очки, позволившие ему видеть мир перевёрнутым. Примечательно то, что через несколько дней мозг Стреттона адаптировался к его перевёрнутому восприятию, и он уже не видел мир вверх дном. Вы можете предположить, что когда он снял инвертирующие очки, то вновь увидел мир перевёрнутым. Этого не случилось. Но его восприятие было тем, что он с викторианским шармом назвал «смущающей атмосферой».

Благодаря экспериментам я обнаружил, что требуемый период приспособления, как ни странно, короче, когда мой мозг адаптируется к серьёзному искажению — скажем, к зеркалированию слева направо или переворачиванию. Когда искажение не такое сильное — например, небольшое смещение зрительной оси, — адаптация занимает меньше времени, однако больше времени требуется на восстановление.

Стив Манн в EyeTap Generation-4 Glass на лекции в Университете Торонто

Стив Манн в EyeTap Generation-4 Glass на лекции в Университете Торонто

В нынешних прототипах Google Glass камера правильно располагается справа от правого глаза пользователя. Будь эта система предназначена для наложения изображения поверх зрения пользователя в реальном времени, безусловно, возникли бы те же проблемы. Возможно, Google знает об этом вопросе и намеренно не направляет «живое» видео к пользователю через дисплей. Но кто знает, как Google Glass будет развиваться, или что ещё ему позволят сделать приложения?

Они могут попытаться отображать для пользователя видео в реальном времени, так, чтобы устройство, к примеру, служило в качестве видоискателя для съёмки фото и видео. Но просмотр такого контента, выровненного по одному глазу, в течение длительного времени вполне может испортить нервную систему человека. Исследователи виртуальной реальности долго бились над устранением эффектов, которые искажают нормальную обработку мозгом визуальной информации, и когда эти эффекты возникают в оборудовании, которое дополняет реальный мир или выступает посредником, они могут стать гораздо более неприятными. Длительное воздействие может нанести даже непоправимый ущерб, особенно молодым людям, чьи мозги и мышцы только развиваются.

Google Glass и некоторые системы аналогичной конфигурации, разрабатываемые в настоящее время, испытывают проблему, о которой я узнал около 30 лет назад и которая возникает из-за базовой асимметрии их конструкции, согласно которой пользователь смотрит на дисплей только одним глазом. Эти системы содержат линзы, которые визуально делают дисплей «парящим» в пространстве чуть дальше, чем на самом деле. Происходит это из-за неспособности человеческого глаза сфокусироваться на том, что находится лишь в паре сантиметров, и требуется оптическая коррекция. Однако то, что Google и другие компании используют объективы с фиксированным фокусным расстоянием, чтобы дисплей казался дальше, — не есть хорошо.

Использование линз таким образом заставляет один глаз оставаться сосредоточенным на некотором заданном расстоянии, пока фокус другого глаза изменяется согласно тому, рядом ли или далеко находится объект, на который он смотрит. Это приводит к тяжёлому зрительному напряжению, которое опять же может быть вредно, особенно для детей.

Я построил четыре поколения Digital Eye Glass и по ходу выяснил, как решить эту и другие проблемы. Тогда как мои последние устройства несколько сложны, основные принципы, лежащие в их основе, довольно просты.

Многие из моих систем типа Google Glass модифицируют зрение лишь для одного глаза. По моему мнению, они работают хорошо. Но я организовал оптику так, что камера снимает в точно такой же перспективе, в которой видит глаз. Я также расположил дисплей таким образом, что владелец смотрит прямо перед собой и не должен смотреть вверх (как это необходимо делать с Glass), вниз или в сторону, чтобы его увидеть.

Предоставить хорошее согласование полей зрения не сложно — достаточно двухстороннего зеркала. Одна поверхность отражает падающий свет для боковой камеры, а другая отражает свет с бокового дисплея для глаза. При добавлении поляризационных фильтров вы можете использовать частично прозрачное зеркало так, чтобы всё отображаемое на дисплее накладывалось на прямое поле зрения с глаз. Проблема № 1 решена.

Вторая проблема, состоящая в зрительном напряжении от фокусировки обоих глаз на различном расстоянии, также решена мной — я преодолел её более 20 лет назад! Хитрость заключается в том, чтобы предоставить глазу за зеркалом возможность сосредоточиться на любом расстоянии и по-прежнему чётко видеть дисплей. Такое расположение оптических компонентов я назвал aremac (aremac — просто camera в обратном направлении). В идеале вам нужно использовать aremac-обскура.

Схема aremac

Схема aremac

Чтобы понять, почему aremac-обскура ловко решает проблему фокусировки, нужно понять, как работает камера-обскура. Если вы этого не понимаете, проделайте мысленный эксперимент. Представьте, что вы хотите записать ярко освещённую сцену на кусок фотоплёнки. Вы не можете просто держать плёнку и ждать проявления на ней чёткого изображения, но почему нет? Потому что световые лучи с каждой точки в сцене будут попадать на каждую точку на плёнке, создавая полное размытие. Что вам нужно, так это попадание света, идущего от каждой маленькой точки сцены, на соответствующие точки на плёнке.

Вы можете достичь этого, используя светонепроницаемый барьер с крошечным отверстием. Просто положите его между сценой и плёнкой. Теперь из всех лучей, исходящих, например, из левого верхнего угла сцены, только один проходит через отверстие в перегородке и в данном случае попадает на нижний правый угол плёнки. Подобные вещи происходят для любой другой точки в сцене, что приводит к проявлению чёткого изображения (хотя и перевёрнутого).

Конечно, в некоторых камерах используются диафрагмы малого сечения. В них употребляются линзы, делающие ту же работу по формированию изображения при сборе большего количества света. Но линзы имеют один недостаток: объектам на разном расстоянии требуются разные настройки фокуса. Отверстия не имеют этого недостатка. Они держат в фокусе всё, близкое или далёкое. Говоря жаргонным языком фотографов, они имеют бесконечную глубину резкости.

Моя aremac-обскура — обратный порядок камеры-обскура: это гарантирует, что вы видите чёткое изображение на дисплее независимо от того, как сфокусированы ваши глаза. Однако aremac сложнее, чем барьер с отверстием. Она требует лазерного источника света и пространственного модулятора, похожего на те, которые находятся внутри многих цифровых проекторов. Применяя её, вы можете нормально фокусировать оба глаза, смотря одним через систему опосредованного зрения, что позволяет избежать напряжения глаз.

Для меня поразительно, что Google и прочие стремятся на рынок головных компьютеров с камерами и дисплеями, не используя мой лучший дизайн (то, что я называю EyeTap Generation-4 Glass) для производства лучших моделей. Возможно, это происходит из-за того, что больше никто, работающий над такого рода вещами, не провёл годы, ходя с камерой вместо одного глаза. Или это может быть проявлением синдрома «изобретено не у нас».

До недавнего времени большинство людей было склонно рассматривать меня и мою работу с мягким любопытством и смущением. Никто не задумывался о том, что эта технология может означать для общества в целом. Но всё чаще владельцы смартфонов используют различные виды приложений дополненной реальности. И почти все пользователи мобильных телефонов помогают сделать возможность ведения записи видео и аудио повсеместными. И это ещё не подхватили наши законодательство и культура. Представьте, что было бы, если б сотни тысяч, миллионы людей имели видеокамеры, постоянно прикреплённые к их голове. Если это произойдёт, мой опыт станет по-новому актуальным.

Система, которую я обычно использую, выглядит немного странно, но она не более громоздка, чем Google Glass. Однако её ношение в общественных местах часто навлекало на меня неприятности — обычно они исходили от людей, возражающих против присутствия того, что они считали головным видеомагнитофоном. Так что я с нетерпением жду того дня, когда ношение таких вещей не будет казаться более странным, чем ношение iPhone.

Размещение камер на огромном количестве людей обострит вопросы конфиденциальности и соблюдения авторского права. Но будут и выгоды. Когда полиция по ошибке застрелила Жана Шарля де Менезеса, бразильского электрика, на станции метро в Лондоне в 2005 году, на платформе находились четыре вездесущие городские камеры кабельного телевидения. Тем не менее, лондонские власти утверждают, что видеозапись инцидента не была восстановлена. Технический сбой? Прикрытие? В любом случае, представьте, что было бы, если бы многие из присутствовавших были в очках с ведущими запись камерами, являющимися частью повседневной жизни. Каждый знал бы, что произошло.

Но у всего этого есть и тёмная сторона: вместо того, чтобы действовать в качестве противовеса Большому Брату, возможно, эта технология превратит нас в так называемых Младших Братьев (мы с другими участниками Международного симпозиума IEEE по технологическим и общественным вопросам (IEEE International Symposium on Technology and Society) будем обсуждать это в июне 2013 года в Торонто).

Я считаю, что, нравится нам это или нет, видеокамеры скоро будут везде: вы уже можете найти их во многих телевизорах, автоматических кранах, датчиках дыма и энергосберегающих лампах. Безусловно, власти будут иметь доступ к записям, которые делают, расширяя и без того широкие возможности для наблюдения. На мой взгляд, видеонаблюдение предназначено для уменьшения количества правонарушений, и если обычные люди носят собственное записывающее оборудование, они могут наблюдать за наблюдателями в форме обратного надзора.

Конечно, я могу ошибаться. Я вижу множество незаметных вещей с моими компьютеризированными очками, но будущее становится для меня слишком неясным, чтобы в нём разобраться.

Перевод статьи Стива Манна (Steve Mann) My «Augmediated» Life

Если вы нашли ошибку, пожалуйста, сообщите нам, выделив текст и нажав клавиши Shift + E или кликнув сюда.

Раздел
Статьи
  • Passer-by

    Фотография номера лицензии на вождение? Разве речь не о фотографии лицензионной тарелки (license plate)?

    дальше читать не стал

Другие статьи