Система распознавания показаний
Департамент информационных технологий (ДИТ) Москвы приступил к созданию системы, которая будет считывать показания счетчиков воды с фотографий этих счетчиков. В основе системы лежит обучаемая нейросеть. Предполагается, что она научится распознавать показания на фото уже к концу 2017 г., для чего ей нужно обработать порядка 10 тыс. таких изображений.
После того, как обученная нейросеть приступит к работе, фотографии нужно будет загружать в приложения «ЖКХ Москвы», «Госуслуги Москвы» или в личный кабинет на сайте mos.ru. В настоящий момент, чтобы сообщить показания счетчика, жителям города приходится вводить их вручную. Распознавание показаний по фото, которое будет занимать всего несколько секунд, должно сэкономить москвичам время.
Обучение нейросети
Когда нейросеть будет полностью обучена, она сможет распознавать цифры на фотографиях счетчиков независимо от освещения, угла съемки, возможностей камеры и качества снимков. Мэрия Москвы на своем сайте просит жителей города помочь обучить нейросеть, создав базу фотографий — для этого нужно загрузить снимки на сайт, а потом подтвердить правильность распознанных цифр.
Фотографий можно загружать неограниченное количество. Например, по мере изменения показаний счетчика пользователь может сделать несколько разных снимков в течение месяца, и все их передать для обучения сети. Фото, которые используются для обучения, не отправляются в ответственное ведомство, то есть показания на них не заносятся в базу.
К фотографиям предъявляется ряд требований. Камера должна находиться на расстоянии не более 15 см от счетчика. Не менее половины снимка должно быть занято изображением счетчика. Нельзя помещать на одном фото два счетчика и более, но разрешается сделать несколько снимков одного счетчика с разных ракурсов.
Нейросеть и распознавание цифр
Искусственная нейронная сеть — это программный или аппаратный комплекс, построенный по аналогии с нервной системой живого организма. Сеть состоит из искусственных нейронов — простых программ или процессоров, которые занимаются выполнением своих частных несложных задач. При этом в совокупности они способны справиться с достаточно трудными заданиями.
В сети присутствует три типа нейронов: входные, через которые поступает информация, выходные, через которые выдается решение, и расположенные между ними скрытые нейроны. Отличием нейросети от других программных и аппаратных платформ является то, что ее не программируют, а обучают. Все задачи она выполняет с учетом предыдущих попыток и ошибок, допущенных в ходе этих попыток.
Чтобы обучить нейросеть распознавать цифры, необходимо показать ей множество отличающихся друг от друга изображений одной и той же цифры, указывая в каждом случае, что это за цифра. Когда будет пройден определенный порог вариативности, нейросеть сама начнет соотносить поступающие изображения с нужной цифрой.