Пока мы рассуждаем о рынке дополненной реальности, занимаемся исследованиями, ведём проекты, консолидируем бизнес и накладываем на мир цифровой грим, где-то в кузницах школ и ВУЗов формируется будущее не просто одной из прорывных (мы-то знаем) технологий, но и целого направления технологического развития человечества. Задачу отбора и поощрения представителей нового поколения учёных, в частности, решает ежегодный конкурс «Учёные будущего», проводимый государственными органами России при поддержке компании Intel и отечественного бизнеса, и в этот раз одним из победителей в секции «Программирование» стал наш коллега, молодой разработчик программного обеспечения дополненной реальности Владимир Пайор — ученик пусть и не самой простой, но всё же одной из красноярских школ. Упустить шанс побеседовать с ним ARNext себе позволить не мог.
Поскольку конкурс «Учёные будущего» — это конкурс для школьников, начнём с самого начала: сколько вам лет, где готовят таких специалистов?
Мне 16 лет, я ученик 10 класса физико-математической школы при Сибирском федеральном университете.
Вы назвали свой проект «Дополненная реальность» и, видимо, сделали правильную ставку, поскольку AR сегодня — тренд, она бросается в глаза и без замысловатых заголовков. Однако название не позволяет угадать, в чём заключается ваша работа. Расскажите о ней.
Работать над этим проектом я начал ещё в 8 классе, когда узнал на уроках информатики о существовании машинного зрения. Тогда я уже владел азами Actionscript 2.0. (в нашей школе его преподают с 5 класса)… Первая программа просто выводила текст «Опознано!» в случае распознавания чёрно-белого маркера. Затем средствами Alternativa 3D мне удалось привязать к маркеру 3D-модель.
А что именно вы представили на конкурсе? Насколько я понимаю, проект заключался в созданной на основе Actionscript и движка Alternativa модели, выполненной по маркерной технологии?
Изначально, проект базировался на Actionscript и Alternativa, позднее он был перенесён на С# и адаптирован под Unity с целью покрыть все мобильные платформы.
Процесс трэкинга был модифицирован и стал позволять считывать изображения любой сложности. Для распознавания используется разработанный мной алгоритм, рассматривающий изображение как математическую функцию, то есть весь процесс сводится к сравнению двух функций — нахождению точек пересечения эталонной функции и входящей с камеры устройства. Программа может работать с любыми данными, от текста до 3D-игр и видео.
Расскажите подробнее об алгоритме.
В процессе создания маркера программа сначала преобразует изображение в оттенки серого, затем разбивает его на пиксели и поочередно сравнивает их на предмет различия яркости; пары координаты двух близлежащих точек с наиболее выраженной разностью яркости записываются в массив (множество эталонной функции). Аналогичная операция проделывается с картинкой с камеры при считывании маркера, только затем подученная функция сравнивается с эталонами и, в случае различия менее чем на 50–70%, программа выполняет закрепление трёхмерной матрицы за тремя произвольными точками из пересечения множеств. Далее подгружается контент.
Каковы ключевые отличия вашего принципа распознавания объектов от существующих на рынке решений?
Лёгкие, не капризные маркеры — чем сложнее, тем лучше. Ведётся разработка алгоритма считывания объёмных объектов и жестов только с помощью камеры. Уже можем считывать угловатые 3D-объекты, комбинируя несколько графических маркеров — это позволяет избежать слепых зон. А работа ведётся над алгоритмом распознавания объектов с более плавными формами.
До этого проект имел успех на региональных этапах и с каждым конкурсом совершенствовался. Я вижу его путь как «идея — технология — продукт», сейчас он находится на второй и, пожалуй, самой продолжительной стадии, но уже в первой декаде января планируется перейти к третьей стадии. Недавно проект занял первое место на Решетневских чтениях в СибГАУ, но работы по-прежнему много!
Какие впечатления от конкурса Intel — от его уровня, организации, от ваших конкурентов?
Конкурсом остались довольны и я, и мой научный руководитель. Что касается организации, тот тут компания Intel проработала всё до мелочей: от дороги и гостиницы до персональных приглашений. Конечно пришлось долго ждать результатов отборочного тура, сроки оглашения результатов переносились три раза, но какой конкурс без интриги? Было представлено много отличных работ. На мой взгляд, такие конкурсы нужно проводить как можно чаще.
Трудно было бороться с другими участниками?
Этот конкурс нельзя назвать борьбой, за три дня конференции мы сдружились с ребятами из моей номинации, а подобное общение позволяет получить объективные оценки своей работы, что способствует дальнейшему развитию проектов.
На удивление судьи не старались «загрузить» участников вопросами, они легко шли на контакт. Защита проектов выглядела скорее как диалог рассказчика и заинтересованного человека.
А как вы стали участником? Подать заявку может любой желающий?
В нашей школе было вывешено объявление. А заявку может подать любой ученик до 18 лет включительно.
Школа помогала в развитии проекта? Разработка велась в рамках обучения или это была личная инициатива и ей же осталась?
Работа была инициативной, а школа создаёт для этого базу. Программа не предусматривает создание проектов.
Под базой вы подразумеваете сам процесс обучения и получаемые знания и навыки, или имеется в виду нечто более специфичное?
Знание — это основа, под базой я имею в виду предоставление необходимых ресурсов, в данном случае это программное обеспечение.
То есть программное обеспечение было приобретено школой, а не вами — это важно, ведь софт не дешёвый.
Да, школа участвует во многих студенческих программах от ведущих IT-компаний, что позволяет учащимся легально получать профессиональные версии программ на время обучения в школе.
С вашего позволения вернусь непосредственно к проекту. Собираетесь ли вы в последствии монетизировать алгоритм трекинга, встраивать его в завершённый потребительский продукт?
Конечными продуктами станут браузер дополненной реальности, который будет представлен на суперфинале, и SDK к нему. Cкорее всего, монетизация будет производиться за счёт рекламодателей, размещающих контент для браузера.
Сегодня многие представители IT-бизнеса сразу уходят на развитые западные и восточные рынки. В качестве стартового рынка для браузера выбран российский, или в первую очередь развиваться будет англоязычная версия программы?
Участие в конкурсе ISEF подразумевает наличие англоязычной версии, но основной акцент будет делаться на российского пользователя.
Почему?
Большинство российских пользователей, на мой взгляд, плохо представляет себе технологию дополненной реальности, но они готовы к её появлению на массовом рынке, а за счёт вау-эффекта она получит широкое распространение.
То есть вы надеетесь на взрывной эффект от появления русскоязычного браузера с российскими же корнями?
Не только, следует надавить на качество, я имею в виду предоставить некоторые сервисы, недоступные в аналогах.
А вы уже обдумывали возможности получения внешнего финансирования и иного сотрудничества? Какие компании могли бы стать вашими партнёрами?
Сейчас главная задача сделать проект привлекательным для инвесторов.
Это значит, что вы открыты для предложений?
Да.
Что даёт участие в конкурсах — в конкурсе Intel, в частности? Вам лично помогает представление проектов более опытным специалистам?
Во-первых, этот конкурс позволяет получить объективную критику проекта, во-вторых, такие конкурсы являются своего рода раскруткой.
А вы сами хотели бы работать в Intel, какой-либо другой компании, или вам ближе идея собственного бизнеса?
Уже не раз возникали идеи собственного бизнес-проекта, связанного с AR, но, на мой взгяд, для это требуется опыт работы в компании, и будет гораздо лучше, если этот опыт будет получен под крылом настоящих профессионалов.
Как вы планируете продолжать образование?
Разумеется, образование планирую получать в области IT.
Трудно совмещать обучение и, фактически, собственную работу?
Приходится в процессе обучения уделять своей работе меньше времени, чем хотелось бы, но это не сильно мешает.
Не боитесь трудностей?
Трудности были ожидаемы с самого начала, как только я начал заниматься компьютерным зрением; поначалу мне просто не хватало знаний, а единственный выход — учить математику вперёд базовой программы. Главные трудности для меня — это постоянная нехватка опыта и знаний, а единственный способ их преодоления — учиться.