Предлагаю создать постоянную ветку, в которой собирать предложения по совершенствованию системы распознавания лиц. Сейчас я предлагаю первые нововведения. 1) Программа должна более активно использовать знания пользователя, который заведомо лучше знает, какие люди у него в альбоме. Для начала процесс распознавания надо разбить на несколько этапов. Я предлагаю создать нечто вроде Wizardа для того, чтобы пользователь шел по порядку. Я вижу такие этапы: Этап 1. Выбор папок, которыми нужно ограничиться (сейчас программа активно ищет мою бабушку в папках 1991-2024, хотя бабушка скончалась в 1989. Было бы неплохо пометить папки, в которых искомый персонаж присутствует в обязательном порядке или даже абсолютно на всех фото (папка “бабушка”). Также была бы крайне полезна кнопка “Стоп”. Хватит искать. Этап 2. Программа просит выбрать 1 или 5-6 (10-20) наиболее удачных фото, которые характеризуют текущего человека. Количество зависит от того, какие параметры идентификации использует ИИ (анфас/профиль, возраст, очки и т.п.) Этап 3. Далее программа работает в фоновом режиме и по завершению работы выдает массив предложений - 100-200-300+ фото, которые в наибольшей степени соответствуют критериям поиска. Это первый этап отбора. Пользователь подтверждает/отклоняет. Этап 4. Программа оценивает эффективность своей работы и предлагает пользователю продолжить поиск, изменив настройки поиска (предлагать больше/меньше, охватить больше папок и т.п.). Дальше программа снова работает сколько хочет в фоновом режиме, а потом выдает пользователю массив 1000+ фото для его проверки. Пользователь плюсует/минусует. Если результат его устраивает, то он жмет “Завершить”. Если не устраивает, то программа предлагает ему еще раз изменить критерии поиска и запустить поиск еще раз. Как мне видится, проблема не в том, что нужный человек не находится на фото, а в том, что программы опознавания предлагают пользователю тысячи бессмысленных фото, не имеющих никакого отношения к лицу бабушки (памятники, мужики с бородой, морды лошадей и дети на рекламных плакатах). Я не знаю, как это должно работать, поэтому не буду тут это обсуждать. Но совершенно ясно, что можно сделать обратную связь, чтобы улучшить результаты поиска. А именно: 1) Предложить пользователю все схожие объекты, которые он запретит раз и навсегда, чтобы они не предлагались при поиске последующих лиц (памятники, собаки, лошади, полностью размытые лица, слишком мелкие лица, лица на плакатах и т.п.) В чем тут суть? Мне программа при поиске лица бабушки подсовывает уличные фото, на которых сотни людей, лица которых неразличимы. А все равно подсовывает их! Давайте пользователь решит - хочет ли он искать свою бабушку на улице и готов ли посмотреть 30 000 размытых лиц, или он просто отменит все неразличимые мелкие лица раз и навсегда. 2) Если это действительно ИИ, то логично бы, чтобы он учился. Т.е. спрашивал бы первое время на минусование пользователя причину минусования: Это не бабушка? Это не женщина? Это не человек? Это не живое существо? Это не изображение человека? Ну или как-то иначе. 3) Также логично было бы не игнорировать папку с фото. Обычно фото в папке относятся к какому-то периоду, какому-нибудь событию и т.п. Т.е. человек на фото внутри этой парки будет максимально похож сам на себя (бороду не успел сбрить, очки надел, костюм тот же, прическа та же…) Поэтому логично предлагать фото на оценку пачками по папкам, т.е. осмысленными группами. И в этом случае не надо заставлять пользователя ставить 300 плюсиков. Ему достаточно поставить 20 минусов, а все остальные фото заплюсовать нажатием одной кнопки. Пока прервусь, вдохновение иссякло..

Еще предложения: 1) Добавить полезные пункты при открытии контекстного меню по правому клику на предложенном фото, которое открыто по команде “Просмотреть” (в этом режиме на фото можно нескольких людей отмечать, назначать новые лица): Больше на этом фото знакомых лиц нет (больше не предлагать лица с этого фото) То же самое для целой папки

Lysander Как-то вы сильно всё усложняете. Таким сложными интерфейсом никто пользоваться не будет. Программа должна быть очень простой, а вы предлагаете сделать какой-то профессиональный инструмент. Lysander Еще предложения: Для этого уже есть функция “Control+I” Работает как для фотки при просмотре, так и для всех выделеных фоток в ленте.

Так я и предлагаю сделать Wizard, который упростит для пользователя сложный процесс. Клиент пойдет последовательно по предлагаемым шагам. А что я вижу сейчас? Мне программа при открытии показывает новые фото человека, на котором я остановился вчера. Я начинаю с ними разбираться, так программа прямо под руку, сдвигая фото, над которым я работаю, подсовывает новые. И никто не знает, сколько еще тысяч фото предполагаемой бабушки программа мне будет подсовывать в ближайшие полгода порциями по 20 шт. (опцию “Показывать меньше” я выбрал, но меньше хлама не стало!) Хуже только в ACDSee, где программа без подтверждения со стороны пользователя засовывает хлам прямо в отобранные фотки профиля человека. Где, вообще, кнопка “Хватит”, Золотая антилопа? Процесс опознания человека должен иметь начало и конец, а не быть бесконечным. Если пользователь не удовлетворен результатами, то он снова запускает процесс с начала, подкрутив немного опции. Далее. Я внес 12 родственников, и уже включилось ограничение. И даже при этом небольшом количестве ощущается, что возможности контекстного меню сильно ограничены. При количестве лиц, превышающем несколько десятков, явно будет нужен другой инструмент выбора нужного человека, который, полагаю, должен будет открываться в отдельном окне. Мне нравится, как программа находит нужного человека даже на невнятных размытых групповых фото. Т.е. на фото 20 мелких размытых лиц, программа находит среди них правильное. И тогда не понятно, почему она, обладая такими выдающимися способностями распознавания, предлагает еще тысячи тонн мусора, в т.ч. вообще даже не лица. Где регулировки?

Что еще напрашивается. Программа вначале эффективно выдавала большими пачками правильные лица, оставалось только все это подтверждать теми же пачками. Тут, как я уже писал, важно выдавать не случайные пачки, а основываясь на содержании пользовательских папок, включенных в поиск. В одной папке с большей вероятностью будут наиболее похожие фото одного человека. В этом случае и пользователю будет легче подтверждать, и ошибок будет меньше. Это важно и для того, что я дальше напишу. Далее программа стала выдавать все меньше правильных предложений и все больше мусора. Из-за того, что пользовательские каталоги она игнорирует, она снова и снова выгружает из тех папок, в которых она все уже распознала, все новые и новые предложения, которые на 99-100% составляет мусор. Я ищу свою морду и вижу, что программа уже всюду меня распознала, даже на размытых групповых фотографиях,. Это замечательно! Но если на фото меня совсем нет, то она обязательно что-то предложит с этого фото - колесо машины, кусок памятника или вконец размытую чью-то рожу в толпе людей. Как ее остановить? Ведь не понятно, какие папки она уже закончила мониторить, а какие нет. В каких-то папках я еще могу попадаться. Тут нужен инструмент, заставляющий программу прекратить предлагать совсем уже мусор. Как я уже писал, нужна явная кнопка “Хватит!”. Но при этом пользователь должен быть уверен, что качественные изображения во всех намеченных папках уже проанализированы. Напомню, что у меня количество папок измеряется сотнями. Вручную последовательно отмечать папки для сканирования - не вариант. Я такое стал пробовать в ACDSee, но там совсем все грустно. Именно поэтому я сейчас активно ищу самый удобный софт для распознавания.

Почему еще важно идти по папкам последовательно, а не общим потоком по всем выделенным папкам. Возраст важен. Многие семейные архивы отсортированы в хронологическом порядке. Ребенок родился, пошел в ясли, в детский сад, в школу, в ВУЗ, свадьба, похороны… Если программа сначала будет обрабатывать папки с ребенком, а потом перейдет к подростку, а затем уже к взрослому человеку, который отпустил бороду, разжирел и надел очки, то всем будет легче. Было бы здорово, если бы программа как-то это учитывала. Вернее, пользователю пофиг, пусть работает как ей нравится. Но вот выдавать пользователю предложения желательно осмысленными порциями.

Учитывая сказанное, напрашивается организация выдача предложений на суд юзера пакетами по разным людям. Например, программа работала пару часов в фоновом режиме. Пользователь открывает, видит, что ему предложено 40 пакетов по 500 фото, разбитых на 10-20 групп (40 уникальных лиц, 400-800 групп фото, на которых персона максимально похожа сама на себя (фото из одной папки, как правило). Юзер спокойно обрабатывает предложенное, подтверждая целыми группами, т.к. внутри групп ошибок почти нет. После завершения процесса подтверждения юзер выбирает новые лица (или оставляет в выборе предыдущие) и запускает распознавание снова. Программа приступает к своей тяжелой работе в фоновом режиме.

Вообще не понятно, в какой последовательности отсортированы морды лица в галереи одной персоны. И нигде не могу найти интерфейса для сортировки. Мало того, часть подтвержденных фото остается в начале, а часть улетает в самый низ сразу после подтверждения. Фото младенца перемешаны с фото того же человека предпенсионного возраста.

Обнаружил ошибку. Программа предлагает мне не мое лицо подтвердить (себя ищу). На всякий случай вхожу в режим просмотра. За столом сидят коллеги, я в их числе. Подтверждаю себя по правой кнопке через контекстное меню. Выхожу из режима просмотра. В массиве предложенных фото ничего не меняется. Данное фото числится неподтвержденным, на нем все так же выделена не моя морда, хотя я нахожусь в разделе “Я”.

Еще пожелание. Программа отказывается назначать новое лицо, если человек стоит спиной, а часто просто в профиль. Логично. Но пользователю нужно отметить человека, и он точно знает, кто это в профиль/со спины. Мне кажется, что разумнее не отказывать в назначении, а вместо отказа выдавать просьбу выделить мышкой квадрат, который затем и используется для задания имени. Но в дальнейшем это “лицо” в алгоритме никак не используется, чтобы не засорять систему. Зато человек выделен и добавлен в базу!

Еще пожелание. Во время проверки лиц в режиме просмотра фотографии при наведении курсора на лицо человека всплывает подсказка с его именем. Но никак не отмечено - это лицо уже подтверждено или нет. Чтобы это узнать, нужно кликнуть правой кнопкой и открыть меню. Тогда по нему будет понятно: если написано “Подтвердить”, то можно подтвердить или отклонить, если написано “Подробная информация”, значит этот человек уже подтвержден. Предлагаю выделять разным цветом границы окна с всплывающим именем или ставить значок, чтобы сразу при наведении курсора было понятно какие лица на данном фото уже подтверждены, а какие ждут подтверждения (помимо основного персонажа, со страницы которого мы вошли в режим просмотра фото). Это ускорит просмотр всех лиц на фото - не надо будет открывать меню на каждом лице.

Совершенствование системы распознания лиц.: Страница 3

Этот сайт лучше всего просматривать в современном браузере с включённым JavaScript.

Совершенствование системы распознания лиц.

Sergej DAGDA

Lysander Многие семейные архивы отсортированы в хронологическом порядке.

дата и время создания снимка при сканировании это когда изображение было оцифровано, а не сделано. Программам просто неоткуда взять данные о точной дате создания снимка если они не пробиты в метаданных. Даже если это вписано в название файла. Так что автоматический хронологический порядок и распознавание последовательности это утопия.

Lysander

Sergej DAGDA Программам просто неоткуда взять данные о точной дате создания снимка если они не пробиты в метаданных.

Помню, с программистами это был постоянный разговор:

Вы не знаете, как это сложно осуществить!
Но все равно легче, чем весь отдел будет это годами вручную обрабатывать!

В чем проблема считать дату из свойств файла?
В чем проблема отсортировать по названию файла? (“2024_06_11_Moscow_0019.jpg”)?
В чем проблема присвоить метку названия папки? Я ратую за то, чтобы не игнорить папки пользователей.

Программа должна быть простая, это верно. Но как у всего хорошего простота должна быть не в алгоритме, а в интерфейсе. Всплывающие подсказки, раскрывающиеся меню. Открывает пользователь меню сортировки, а там у него большой выбор опций, которые все перечислены. Уж с сортировкой-то разберется. Поймет, что у него бардак в названиях папок и файлов, метаданных нет, сядет и переименует пакетно.
А что сейчас? У меня образцовый порядок в названиях. На каждый год и месяц - отдельная папка, файлы идут в правильном порядке по времени. Указана страна и город (название папки). И кто виноват, что сканер не умеет прописывать метаданные в файл? У меня готовые альбомы по странам и городам. А просмотрщики все это путают и перемешивают по каким-то своим соображениям. 😄

Андрей

Lysander В чем проблема считать дату из свойств файла?

Видимо в том, что там неверные данные. В метаданных может быть примерно 7 или 10 разных дат одновременно, а также есть еще даты в атрибутах файла в файловой системе. В Tonfotos встроена некая эвристика, которая из этого многообразия пытается угадать, что же из этого правильная дата для фотки. Но часто эти попытки просто тщетны, потому что ни одна из них не правильная.

Lysander В чем проблема отсортировать по названию файла? (“2024_06_11_Moscow_0019.jpg”)?

В том, что есть очень много источников фоток (в первую очередь мессенджеры), которые прописывают в название файла дату сообщения, а все метаданные при этом удаляют под корень. Ценность таких дат обычно крайне низкая, так как это дата пересылки а не съемки. Да, существуют пользователи вроде вас, которые могут настолько запарится, что впишут дату в название каждой фотки, но тут сразу возникает два вопроса:

А зачем они вообще так странно поступают? Ведь можно с тем же количеством усилий прописать правильную дату в метаданные, и тогда ВСЕ каталогизаторы будут ее правильно понимать, вместо того, чтобы надеятся, что в будущем появится какой-то мега-умный каталогизатор, который сможет брать дату из подобного названия
Таких пользователей настолько мало, что нет смысла даже браться за подобную оптимизацию. Программа никогда не сможет учитывать все возможные частные случаи, она настраивается на наиболее частотные.

Lysander В чем проблема присвоить метку названия папки? Я ратую за то, чтобы не игнорить папки пользователей.

Tonfotos, в отличие от всех остальных каталогизаторов, единственный, кто не игнорирует названия папок и пытается оттуда извлекать даты, и использует эти даты при автоматическом создании событий. Другое дело, что форматов написаний даты в мире с дюжину примерно, а вариантов как самовыражаться при сочинении имени папки - тысячи, и очевидно, все они не поддержаны. Но какие-то наиболее очевидные поддержаны и используются.

Sergej DAGDA

Lysander В чем проблема считать дату из свойств файла?

нет проблемы, в данных о файле стоит дата когда изображение было оцифровано. Если положить фотографию 1900 года в сканер в 2024 то в данных файла будет 2024 а не 1900. Нет никакой системы распознавания даты по содержанию снимка, просто технически нереально. Можно по отпечатку сделать радиоуглеродный анализ и определить возраст бумаги но это не гарантирует то что дата создания снимка и дата отпечатка даже в пределах 10 летия совпадут.

Lysander В чем проблема отсортировать по названию файла?

ну так они и сортируются по названиям, но это не дает гарантии того что снимок и название файла совпадают. У меня вот все снимки с камеры базово IMG_XXXXXX.raw и что с ними делать программе? она вытаскивает данные из файла раз это возможно. В сканах этих данных нет. У меня ¾ отпечатанного архива без дат даже примерных и спросить уже некого.

Lysander Я ратую за то, чтобы не игнорить папки пользователей.

тут не спорю, у меня самого структура год - годмесяц - годмесяцдата - годмесяц_дата-XXX (порядковый номер).

Lysander

Андрей Tonfotos, в отличие от всех остальных каталогизаторов, единственный, кто не игнорирует названия папок и пытается оттуда извлекать даты, и использует эти даты при автоматическом создании событий. Другое дело, что форматов написаний даты в мире с дюжину примерно, а вариантов как самовыражаться при сочинении имени папки - тысячи

Да, это понятно. В ACDSee все варианты дат, прописаные в метаданных, можно использовать для сортировки. Ясно, что это помогает не сильно, если половина фото в архиве из-под сканера и без метаданных вообще. Я не могу учить вас правильно работать с исходными данными. Просто много проблем можно решить, вернув мяч на территорию пользователя. Для этого надо дать ему возможность выбрать вариант сортировки. Я в другой теме подробно описал проблему с присвоением геометки (места съемки). Если юзер хочет геометку (лицо, дату, альбом, событие) - пусть озадачится и создаст, используя удобные инструменты. Я над созданием фотоархива кропотливо трудился годы. Там все разложено по папкам, подпапкам, датам и событиям. Ни один софт, ясное дело, лучше не сделает. Но софт, я вижу, скоро позволит классифицировать фото по лицам и красиво нанести места съемки на карту мира. Хочу это иметь в своем архиве! Дайте скорее возможность! 😃 😃

drAstronomus

Проблема с ухудшением качества распознавания при постепенном скармливании программе неудачных ракурсов действительно есть. Возможно стоит рассмотреть возможность по блокировке дальнейшего обучения системы для распознавания определенного человека.

Sergej DAGDA

drAstronomus при постепенном скармливании программе неудачных ракурсов

ну кстати! отметка человека на снимке если не видно лица (принудительная просто рисованием прямоугольника) с указанием того что этот снимок не участвует в обучении это тема. По сути можно сделать опцию исключения из обучения некоторых кадров где лицо видно но качество плохое. Тогда и ошибок может стать сильно меньше.

Lysander

drAstronomus Проблема с ухудшением качества распознавания при постепенном скармливании программе неудачных ракурсов действительно есть. Возможно стоит рассмотреть возможность по блокировке дальнейшего обучения системы для распознавания определенного человека.

Я тоже за это ратую! Сейчас Tonfotos имеет возможность утереть нос гигантам индустрии распознавания!
Но для этого нужно шагать впереди конкурентов не на шаг, а на десять шагов! 😃
Выше я приводил примеры когда ИИ сам себя запутывает.
Я за поэтапное распознавание, учет пользовательских папок, учет возраста. В перспективе должно быть несколько ИИ, взаимодействующих между собой. Один ищет традиционно - по чертам лица. Другой - по папке, атрибутам файла. Третий - по одежде и прочим косвенным признакам (цвет, очки, прическа, украшения и т.п.). Вот мой дед умер до того, как в СССР появилась цветная фотография. Последние его фото - середина 50-х гг. прошлого века. Зачем программа его ищет в цветных цифровых фото и выдает мне фото автоколес? Если бы был алгоритм, заточенный на такой контроль, то он быстро бы сообразил, что деда надо искать только в старых папках с отсканированными ч/б фото, поскольку все подтвержденные пользователем фото относятся исключительно к таким папкам. Но для такого подхода должно быть несколько этапов распознавания. Первый этап - самый важный. На нем программа предлагает несколько фото человека, которые она считает наиболее точно его описывающими. А уже после этого начинает расширять поиски, находя необычные ракурсы, лица на размазанных фото и т.п. Да, и на каждом этапе пользователь получает пачку фото для подтверждения и может поменять настройки.
Программа может выдавать и подсказки. Например, “Искомое лицо, вероятно, присутствует на оставшихся необработанными фотографиях только на дальних планах. Продолжить поиски?” Или “Поиски искомого лица закончены в контрольных возрастных категориях. Продолжить поиски в других возрастных категориях?” И т.п.

Я не говорю, что надо все бросать и скорее этим заниматься. Но жаль терять конкурентное преимущество. Оно не продлится вечно.

drAstronomus

Lysander ищет программа неплохо и людей находит в любом возрасте. Переобучение плохими фотографиями - это плохо

Lysander

drAstronomus ищет программа неплохо и людей находит в любом возрасте

Смотря что понимать под “неплохо”. Если просто сравнивать с конкурентами, то ищет великолепно, поскольку конкуренты вообще не ищут. Но если исходить из поставленной задачи, то ищет плохо, какой критерий ни применяйте. 10-20% нераспознанных искомых лиц - это примерно та же эффективность, как у дезинфицирующего средства, которое убивает 80% микробов. Вы хотите попасть на стол к хирургу, который начнет операцию, обработав свои инструменты таким средством? Вот и мне нужна эффективность 95-99%. И я готов пожертвовать нескольким лицами с затылка и на далеком размытом плане. Но когда программа в упор не видит нужное лицо на портретном фото, то нафиг с такой программой вообще начинать работать? Все закончится ручной работой по всему каталогу. Ну ладно, я согласен и на это. Но тогда инструменты должны быть, облегчающие эту ручную работу.

drAstronomus

Lysander нужна эффективность 95-99%

это уже уровень ФСБ 🙂

Lysander

drAstronomus это уже уровень ФСБ

В том-то и дело, что в конечном итоге пользователю нужно доделать работу до какого-то логического завершения. Если технологии не могут сделать 100% работы автоматически, то программа подключает на помощь себе самого пользователя. У нас так компания работала с отделом программирования. 90% работы делал алгоритм, а оставшиеся 10% (слишком сложные, нестандартные и новые случаи) программа выгружала в максимально удобной форме, чтобы девушки-операторы разбросали это по правильным разделам и присвоили нужные метки и коды.
Что сейчас делают просмотрщики-распознавалки? Они после долгой индексации выгружают пользователю тысячи лиц вперемешку с мусором. Пользователь старательно это обрабатывает. И так несколько раз. Потом пользователь лезет в папки и проверяет. Выясняется, что 10-20% нужных лиц на фото так и не найдено (50% в случае с ACDSee, digiKam и MS Фото). Если пользователь хочет 90-100%, остается один путь - пройтись по всем папкам и доделать то, что не доделала программа.
Вопрос: а почему пользователю сразу не пройтись по папкам и ни подписать все нужные ему лица? Ведь за то время, пока он работал и расчищал авгиевы конюшни, он смог бы весь свой архив обработать, будь у него для этого удобный инструмент.
Может, Tonfotos не будет конкурировать с гигантами, а первым создаст такой инструмент?

Как он должен работать в режиме присвоения имени.

Клик мышью на лице на фото. Открывается квадратик в соответствии с размером головы. Это-то легко сделать.
Вместе с квадратиком открывается менюшка с именами. Видно 10 последних присвоенных имен. Если это семейные фото, то 10-12 имен хватит для основной работы внутри одной папки.
Выше или ниже списка этих имен есть окно ввода имени. Если начать вводить имя, то открывается список из 10 подсказок. Чем больше букв введено, тем точнее подсказки. это стандартный инструмент.
Если в этом режиме программа сама расставит квадратики по всем лицам, это неплохая помощь пользователю.
Если в этом режиме она присвоит сама имена некоторым лицам, в которых она уверена, это еще большая помощь.
Внутри папки с большой вероятностью одни и те же люди будут в одной одежде, с одной прической, одного возраста и т.п. Лично я на туристических фото распознаю в толпе знакомых не по мелкому лицу, а по характерной одежде. Вот бросается в глаза клетчатая рубашка - это мой знакомый.
Т.е. вот такой интерактивный инструмент, который в разы ускоряет работу по присвоению имен.
И я уверен, что это будет более востребовано, нежели игрушка, КОТОРАЯ УМЕЕТ распознавать в архиве 20-50% лиц. Ну поиграл я неделю в эти игры, пописал на форум, неплохо провел время. Но толку от этого для моего фотоархива - никакого. 😄

Lysander

И главное. Пользователь пройдет по нужным ему папкам и будет уверен в том, работа выполнена на 100%. И больше не надо лезть в эти папки, снова и снова их индексировать и т.п.
Вот я уже четвертый день прогоняю свой архив через алгоритм digiKam, двигая ползунок настроек то в одну сторону, то в другую. Запускал распознавание по базе неизвестных лиц уже раз 20, каждый раз разгребая тонны мусора, если уменьшить точность. А если точность увеличить, то программа выдает 0 новых распознаваний. Лезу в галерею нераспознанных лиц - там уже и мусора-то мало осталось - вот как я старался его удалять! А что осталось? А осталась куча знакомых лиц, которые по каким-то причинам программа отказывается узнавать! Навскидку эффективность где-то 50%. И это не эффективность автоматического распознавания! Это итог 4-дневной кропотливой работы! 😁

Lysander

Прошелся по нескольким папкам родственников, чтобы дописать имена нераспознанным фото. Ниже предложения и замечания по порядку, кое в чем могу повторяться.

Очень много лиц невозможно обозначить как лица. Тут почти все лица в профиль, наклоненные, частично (даже немного) загороженные. Также попалась пара фото, на которых при попытке назначить новое лицо квадратик появлялся где-то на туловище, хотя я старательно тыкал между глаз, как велит программа. Это явная недоработка. Если программа не видит лицо в точке, указанной курсором, то зачем она назначает лицо совсем в другом месте?
Причина, судя по всему, недостаточные четкость и контрастность. Это старые оцифрованные ч/б фото. Мне это кажется странным, т.к. на более поздних фото программа без проблем обозначает и распознает мелкие размытые лица на дальнем плане.
Вот пример. Лицо женщины распозналось, ребенка - не хочет назначаться.

Lysander

У меня попадаются схожие и даже полностью одинаковые фото парами и по 3-4 шт. Это вызвано тем, что я сканировал некоторые негативы 2 раза с разным разрешением, некоторым фото делал коррекцию, причем исходник тоже оставлял, и т.п.. На одном из фото в каждой такой паре/группе мной были подписаны лица, но программа по какой-то причине не присвоила эти имена на других фото этой же пары/группы. Когда я навожусь на квадратик, чтобы присвоить имя, то программа большей частью нужное имя ставит в самый верх списка имен. Т.е. она, видимо, уже с большой вероятностью знает, какое имя я хочу присвоить, т.к. это имя ранее уже было указано на такой же другой фотке.
И тут пришла идея.
ACDSee часто без спроса присваивает имена распознанным лицам, добавляя фото к определенному человеку, и при этом делает ошибки. Это самый неудачный вариант.
digiKam, как и ваша программа, на одинаковых фото уже знает, чье лицо, но все равно ждет подтверждения. Это лучше, первого варианта, но не оптимально, т.к. в итоге пользователю надо делать двойную работу.

Самым лучшим вариантом был бы такой. Если программа уверена, какое имя надо присвоить данному лицу, то она присваивает и помещает лицо в список распознанных и подтвержденных, но ставит метку, что “Нет окончательного подтверждения”. Пользователь может включить фильтр по неподтвержденным лицам, по подтвержденным или по подтвержденным, ожидающих окончательного подтверждения (это все вариации лиц, которым уже присвоено имя).
Данный вариант пока для Tonfotos не подходит, т.к. программа не делает полною выгрузку обработанных фото, а выгружает небольшими партиями. Я думаю, что даже если вы хотите оставить такую систему взаимодействия с пользователем, то опционально надо добавить и вариант полной обработки заданной базы лиц (или набора папок), в котором процесс распознавания будет иметь явные начало и конец.

Lysander

Еще идея, которая может улучшить и ускорить работу пользователя и самой программы.

а) Все программы этим грешат. Пользователь обычно подтверждает предложенные лица, переходя последовательно от персонажа к персонажу. Сначала работаем с персонажем А. Очень хорошо, когда видим его четкое лицо на превьюшке. Если мутное пятно, то приходится заходить в режим просмотра всего фото. Стоп! Вот тут программа должна сначала выдавать исключительно четкие фото. А когда они кончатся, вот только тогда дальние и размытые. Это мне кажется сверх очевидным. Но почему-то это не так.

б) И еще. Переходим к персонажу Б, затем, В, Г… И там нам постоянно попадаются лица персонажа А, которые программа предлагает опознать как Б, В, Г и т.п. Ну ясно же, что не может персонаж А быть похож на Б,В,Г больше, чем на себя самого. Явно данное лицо А программа сочла подходящим для А, Б, В, Г, но ей показалось, что наиболее он подходит для В. И она туда его относит, и только туда. И это неправильно.
Программа должна его добавить ко всем персонажам: А,Б,В,Г… Но как только пользователь подтвердит в разделе А, что это лицо А, программа должна его удалить из Б,В,Г..
А если пользователь увидит лицо Б в разделе А и заминусует его, то программа убирает его из А, но не убирает из Б, В, Г. Уберет оттуда, когда пользователь подтвердит Б в Б.
Так пользователю не придется вручную исправлять имя. Но если он хочет исправить Б в разделе А, то пусть исправляет. Тогда программа уберет Б из А,В,Г и добавит его в Б.

FoksSerg

Я полностью согласен, что программа до подтверждения пользователя не должна во-первых: считать количество фото пользователя вместе с предложенными, а во-вторых: привязывать только к одной персоне, удаляя из других потенциально похожих. Пусть это предложение будет у всех подходящих кандидатов, а уж где “клюнет” там и останется. Причем самое тупое и не решаемое до сих пор ограничение на одновременное количество предложенных совпадений (100 если не ошибаюсь в одной пачке). Когда подключаю новый архив практически с одним человеком (его отфильтрованные фото), нужно потратить уйму времени чтобы его зафиксировать, вместо того, чтобы дождаться полного списка совпадений и просто их подтвердить.

FoksSerg

Ну и еще добавлю про выносящую мозг динамическую вставку (или исчезновение) новых предложений прямо в текущую область обработки (похоже связано с сортировкой по дате). Только просмотрел десяток и хочешь принять решение и тут бац - все съехало и кто куда не сразу поймешь. А иногда нажатие совпадает с “приходом” и только отмена позволяет все исправить (благо она теперь есть).

Lysander

Что-то надо делать с лицами в профиль. Мне тут представляется такой алгоритм был бы правильным.
На это натолкнула ваша программа, которая время от времени показывает десяток лиц одного человека и спрашивает кто это. Я присваиваю имя, но поскольку у меня лимит 12 лиц, то новые имена неактивны. Но сама идея отличная. И я заметил, что предлагаемые лица из одной папки (одна одежда и т.п.).
Сейчас даже уже не помню, с чего началось у меня присвоение имен в Tonfotos. Наверное, программа вот так выдала первое предложение по лицу.
Думаю, что правильнее процесс начального распознавания делать при участии пользователя. А все программы, которые я протестировал, как раз пытаются в массе лиц самостоятельно найти схожие. И результаты плачевные. ACDSee выдала несколько тысяч лиц, сгруппированных по 2-3 шт, в лучших случаях - по 20-30 шт. Это бред, согласитесь. Я еще ничего не успел задать программе, а она уже начинает серьезную работу, чтобы сгруппировать тысячи случайных лиц, до которых мне нет никакого дела.

Вот почему мне кажется, что Wizard помог бы.
Программа делает индексирование и в ходе него накапливает какие-то предварительные результаты. Когда пользователь впервые начинает работать с распознаванием, программа ему предлагает выбрать папку, а в ней начать прописывать имена одному или нескольким персонажам (квадратики лиц уже расставлены в ходе индексирования).
Пользователь, допустим, подписывает несколько человек на первых 20 фото в папке. Этого достаточно, чтобы в данной папке гарантированно опознать эти лица в анфас. Поэтому, когда пользователь переходит к 21-му фото, то там программа ему уже подсовывает нужные имена на распознанных ей лицах. Пользователь продолжает заносить имена новых людей и лица, которые программа не распознала из-за нестандартного ракурса, размера, цвета и т.п. По лицу А программа накапливает базу: вот так выглядит А в анфас, вот так в профиль, вот так с наклоном головы… Постепенно пользователю в данной папке нужно все меньше заносить имена вручную. Когда программа понимает, что 80-90% лиц она уже сама распознает в папке уверенно, она останавливает пользователя и предлагает ему перейти к следующей папке, сообщив ему, что в текущей папке большинство лиц уже распознано, а остальные имена будут присвоены позже. Так работаем с еще несколькими папками, в которых по мнению пользователя (или программы) присутствуют текущие персонажи. Далее программа предлагает пользователю либо продолжить накапливать данные на разных персонажей, либо произвести полный поиск уже отобранных персонажей во всем архиве. Если второе - то переключаемся на режим, похожий на нынешний.

Чем это лучше. 1) Тем, что пользователь сам выбирает те лица, которые ему нужны, и игнорит те, которые не интересны. 2) Тем, что программа накапливает по нужным лицам все ракурсы и вариации. Ведь в нынешнем режиме лица в профиль и прочие нестандартные ситуации вообще не отмечены как лица, а значит, алгоритм их не учитывает никак. 3) Тем, что опознавание идет одновременно с работой пользователя. Никто никого не ждет, работают вместе.
Тут можно применить настройки, а также значительную часть работы, проделанную программой, отправить в запасник. Лица, которые пользователь заигнорил, не обязательно терять или сваливать в одну большую мусорную корзину. Им можно присваивать имя-число (#1934756). Потом, если пользователь захочет данного человека обозначить, то это можно сделать, открыв архив лиц, у которых нет еще имен. Достаточно на нескольких фото дописать имя лицу, как программа поднимет из архива все лица с этим же номером. Я вот на фото с коллегами многих имен просто не помню, хотя людей в лицо знаю. Мне надо что-то временное им присваивать или ставить игнор. Лень. А тут программа берет этот труд на себя.

« Предыдущая страница Следующая страница »