В чем реальная проблема внедрения видеоаналитики на предприятиях?
Как работает видеоаналитика: от «узнавания» к «вероятности»
Многие заказчики полагают, что современная видеоаналитика мыслит почти как человек: видит кадр, узнает объект и принимает решение. На самом деле это не так. Нейросети, лежащие в основе этих систем, пока далеки от человеческого мышления.
Нейросеть не ищет в своей памяти «похожую картинку», как это делал бы человек. Вместо этого она выделяет в кадре набор математических признаков (например: «объект круглой формы находится в верхней части другого объекта»). На основе миллионов заранее обученных весов (параметров) сеть вычисляет вероятность: «это каска — 96%», «это человек — 98%».
Откуда берутся весы? База знаний нейросети наполняется вручную на этапе обучения. Специалисты-разметчики показывают модели тысячи кадров, выделяя на них людей, каски, инструменты и другие нужные объекты.

Почему идеальной точности не существует
Качество и надежность распознавания напрямую зависят от количества, качества и разнообразия размеченных кадров. Чем больше разных ракурсов, условий освещения и типов объектов увидела нейросеть на этапе обучения — тем выше ее точность в будущем. Но даже при идеальном обучении на результат работы влияет множество внешних факторов:- задымлённость и запылённость помещения;
- попадание на объектив камеры посторонних предметов;
- высокая влажность;
- уровень освещения;
- искажение кадра — например, новый ракурс, которого не было в обучающей выборке.
Главная проблема: несовместимость вероятностей и производственного мышления
Теперь переложим это на реалии российских предприятий. Лицо, принимающее решение (ЛПР), на производстве привыкло оперировать точными числами: вес, диаметр, допуск, температура. Деталь либо соответствует техническому заданию, либо брак. Система либо работает, либо нет. Понятие «почти правильно» или «с вероятностью 95%» здесь плохо приживается. На бумаге проект видеоаналитики выглядит очень заманчиво:Мы повесим пару камер и будем автоматически определять людей без касок. ЛПРу такая идея нравится — небольшими средствами можно закрыть важную задачу контроля безопасности. Но на этапе тестирования и сдачи проекта начинаются сложности:
- система выдаёт ложные срабатывания;
- или, что ещё хуже, пропускает 5 человек без каски из 100.