Андрей В приведенной аналогии каждый раз, когда я достаю очередной ковшик содержимого, я могу вполне конкретно определить, с какой вероятностью в нем пиво, а не бурда. Поэтому, опираясь на знания, что сверху всегда идет чистое пиво, я не стану с самого начала черпать ковшиком. Я наклоню бочку и отолью половину содержимого, потому что я уверен на 99%, что это и есть пиво. А если туда случайно попадет несколько соринок, и я их замечу, (что тоже не факт), то я их выловлю индивидуально. А вот когда процент осадка станет неприемлемым, я уже буду черпать ковшиком, анализировать и фильтровать каждую порцию.
Так же и тут: если степень похожести картинки на модель оценивается как, скажем, 99%, то почему бы сразу не считать, что это и есть искомый человек? Согласен, что степень доверия к такой фотке, всё же, ниже, чем к подтвержденной руками. Поэтому её и не надо использовать при дообучении модели.
Пример из жизни: я часто делаю подряд несколько фотографий одних и тех же людей в одном и том же месте. Либо вообще “стреляю” серией. Потому что человек может моргнуть, или еще какой-то дефект возникнуть…. Фотографии совпадают практически полностью. И если я размечаю лица на одной, то почему бы не отметить автоматически их и на других? Ведь они как две капли воды!
Мои рассуждения основываются на том, что программа может “измерить” степень отличия фотографии от модели. И всех кандидатов можно отсортировать по этому значению. И потом самые сливки (условно, с похожестью >95%) помечать автоматически, а из остальных брать верхнюю сотню и предлагать на ручное подтверждение.