Skip to content

Signals Processing and Interpretation: iteration 1#3

Open
zuevval wants to merge 8 commits into
developfrom
feature/improve_detection
Open

Signals Processing and Interpretation: iteration 1#3
zuevval wants to merge 8 commits into
developfrom
feature/improve_detection

Conversation

@zuevval
Copy link
Copy Markdown
Member

@zuevval zuevval commented Mar 20, 2021

Этот Pull Request идёт вместе с braille-systems/brl_ocr / PR #1

Прочесть про работу и про эти Pull Request'ы можно в документе report_01_20_mar.md

@zuevval zuevval changed the title Feature/improve detection Signals Processing and Interpretation: iteration 1 Mar 20, 2021
@mitenevav mitenevav self-requested a review March 22, 2021 19:40
Copy link
Copy Markdown
Collaborator

@NikitaS4 NikitaS4 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Работа очень понравилось! Предложены интересные идеи с аугментацией и SSL, получены результаты, сделан их анализ. Документация максимально полная, сразу понятно, что и как делать, и что для этого нужно. Обучение модели достаточно затратное (серьёзные требования к железу + долго обучать), поэтому попробовал воспользоваться предобученной моделью (очень удобно, что есть чекпойнт с весами модели, и очень подробно показано, как пользоваться). Единственное замечание - фотографии почему-то не открываются (использую Linux Ubuntu 20.10, ошибка: "Not a JPEG file: starts with 0x76 0x65"), но я думаю, это проблема на моей стороне. Хотелось бы ещё где-то в readme видеть пример работы модели (картинка, ответ и ground truth) хотя бы на конфигурации с лучшими метриками (иначе приходится качать сразу все результаты - 1.9 ГБ)

@zuevval zuevval requested a review from DanilPestryakov March 23, 2021 19:00
@zuevval
Copy link
Copy Markdown
Member Author

zuevval commented Mar 23, 2021

"Not a JPEG file: starts with 0x76 0x65"

@NikitaS4 Проверь, пожалуйста, у тебя установлен Git с Git LFS? (git lfs --version)
Если нет, удали репозиторий brl_ocr, установи LFS и склонируй его заново.

@NikitaS4
Copy link
Copy Markdown
Collaborator

@zuevval Получилось решить проблему, спасибо. Сначала забыл установить Git LFS, поставил уже потом, но не знал, что надо заново клонировать репозиторий (и не думал, что проблема возникала из-за этого). Результаты работы сети вижу, здорово :)

@mitenevav
Copy link
Copy Markdown
Collaborator

Появился вопрос по постановке задачи. Одним из пунктов было уменьшить "Чувствительность к повороту листа в горизонтальной плоскости". Казалось бы повернув на 180 градусов, получиться другая буква. Тут наверно стоило бы ввести ограничение по углу, или же указать какие-нибудь характерные черты поворота (если такие имеются).
Так же было тяжело бродить по двум репозиториям и разбираться с таким большим количеством файлов, не смог детально разобраться в структуре всего этого.
В целом же проект понравился, проделан большой объем работы. Очень полезное приложение.

@zuevval
Copy link
Copy Markdown
Member Author

zuevval commented Mar 27, 2021

Казалось бы повернув на 180 градусов, получиться другая буква.

Действительно, подразумевался поворот на углы 30-45 градусов.
Надо сказать, у Ильи реализовано распознавание ориентации листа (с точностью до 90 градусов):

aug_img = PIL.Image.fromarray(aug_img if best_idx < OrientationAttempts.ROT90 else aug_img_rot)
if best_idx in (OrientationAttempts.ROT180, OrientationAttempts.ROT270):
aug_img = aug_img.transpose(PIL.Image.ROTATE_180)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants