mrz код в паспорте

Цифры в паспорте: что закодировано в вашем документе и примеры, как это расшифровать

Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

🔢 Что закодировано в документе

Вообще, процедура получения или замены паспорта гражданина России на апрель 2021 года регламентируется Приказом МВД России № 773 от 16.11.2020 г. В этом документе, в частности, имеется приложение №24, в котором приведен алгоритм формирования машиночитаемой записи (МЧЗ) в российском паспорте.

Именно две строчки с буквами и цифрами ниже фотографии являются этой машиночитаемой записью. Кстати, несколько раньше такие же записи появились и в бланках загранпаспортов.

Для чего нужна машиночитаемая запись? Такая запись обеспечивает быстрое и точное сканирование данных, содержащихся в паспорте, различными устройствами машинного ввода. А места расположения этой информации называют машиночитаемыми зонами (MRZ).

mrz код в паспорте. new expert 1 e1597823060363. mrz код в паспорте фото. mrz код в паспорте-new expert 1 e1597823060363. картинка mrz код в паспорте. картинка new expert 1 e1597823060363. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Например, при оформлении проездных документов на железнодорожных вокзалах и аэропортах, прохождении пограничного и таможенного контроля при пересечении границы или при проходе на предприятия и зоны, куда доступ осуществляется по паспорту.

Также применение МЧЗ исключает ошибки при оформлении документов, которые иногда допускают операторы.

МЧЗ состоит из двух строк по 44 знака в каждой. В верхней строке закодирована информация о типе документа (PN — «национальный паспорт») и о выдавшем его государстве (RUS — «Россия»). Также в верхней строке зашифрована фамилия, имя и отчество (при его наличии). Вся эта информация закодирована таким способом, при котором буквы кириллицы заменяются латинскими буквами и арабскими цифрами.

Соответствие русского алфавита и латиницы следующее:

Русский алфавитСоответствующий знакРусский алфавитСоответствующий знакРусский алфавитСоответствующий знак
АAКKХH
БBЛLЦC
ВVМMЧ3
ГGНNШ4
ДDОOЩW
ЕEПPЪX
Ё2РRЫY
ЖJСSЬ9
ЗZТTЭ6
ИIУUЮ7
ЙQФFЯ8

В нижней строке цифровым способом закодировано:

Источник

Распознавание машиночитаемой зоны на документах

Smart Code Engine

Smart Code Engine SDK (ранее технология Smart MRZReader) является первой технологией распознавания машиночитаемых зон на мобильных устройствах в России. Система обеспечивает автоматический поиск и распознавание данных машиночитаемых зон документов (MRZ), выполненных в соответствии с установленными международными стандартами ISO/ICAO (IEC 7501-1/ICAO Document 9303 ISO) и локальными стандартами (Россия, Франция, Швейцария, Болгария, Эквадор) на паспортах, видах на жительство, идентификационных картах, визах, водительских удостоверениях и др. Автоматическое считывание данных происходит в широком классе условий захвата изображений и устойчиво к перепадам освещения, ракурсу съемки, перекосам, углу поворота.

Smart Code Engine SDK автоматически распознает MRZ на фотографиях, в видеопотоке реального времени, а также на изображениях, полученных как обычными сканерами, так и специализированными, многодиапазонными паспортными сканерами.

Распознавание не требовательно к вычислительным ресурсам и выполняется в режиме реального времени на устройствах без передачи данных вовне. Это позволяет распознавать MRZ даже на устройствах с ограниченной вычислительной мощностью (тонкие клиенты, терминалы сбора данных, мобильные кассы и др.). При этом высочайшая производительность Smart Code Engine позволяет создавать технические решения, способные обрабатывать тысячи сканов, фотографий и видеопоследовательностей в секунду.

Важно, что программное обеспечение НЕ передает данные на обработку в /Smart Engines, сторонние сервисы и/или третьим лицам для ручного ввода, НЕ сохраняет данные (вся обработка ведется в локальной оперативной памяти устройства) и НЕ требует сетевого соединения. Smart Code Engine соответствует требованиям как Российского законодательства (152-ФЗ), так и международного права (GDPR, CCPA) в области защиты и обработки персональных данных.

В процессе работы система не только выделяет данные, но и определяет признаки, которые могут свидетельствовать о цифровой или физической подделке машиночитаемой зоны документа. Встроенная функция автоматического поиска лица на документе в процессе распознавания позволяет также использовать систему для проведения биометрической верификации.

Smart Code Engine SDK предоставляется для мобильных, серверных, десктопных платформ и распознавания в браузере. SDK просто интегрировать в приложение с использованием интерфейсов на языках Objective-C, Swift, C, C++, Java, C#, PHP, и Python для широкого круга систем: iOS, Android, Sailfish Mobile, МОС «Аврора», Linux, Windows, macOS, Solaris и др. Для удобства встраивания разработчикам мобильных приложений также доступны обертки для React Native и Flutter.

Источник

Что такое MRZ и зачем она нужна

С точки машинного зрения

Сравнительно недавно — в 2011 году — в новых бланках Российских общегражданских паспортов на странице, которая содержит фотографию и основные реквизиты владельца (фамилию, имя, отчество, дату рождения, гражданство) появились две строки, содержащие буквы, цифры, и много символов mrz код в паспорте. mrzblog1 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog1 min. картинка mrz код в паспорте. картинка mrzblog1 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

mrz код в паспорте. mrzblog2 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog2 min. картинка mrz код в паспорте. картинка mrzblog2 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Для того, чтобы паспорта для трансграничных путешествий разных стран распознавались одинаково правильно во всех современных аэропортах мира, содержание страницы данных такого паспорта строго регламентировано в международным документе “Doc 9303. Машиносчитываемые проездные документы”, изданным Международной организацией гражданской авиации. Страница данных — это та страница, где располагаются сведения о владельце паспорта, его фото и паспортные реквизиты, напечатанные в доступном для понимания человеком виде (это зона визуальной проверки, ЗВП). Машиносчитываемая зона, расположенная внизу страницы, в своем составе соответствует полям ЗВП.

Структура элементов в обеих строках машиносчитываемой зоны заграничного паспорта строго регламентирована и составляющие ее поля идут в определенном порядке.

mrz код в паспорте. mrzblog3 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog3 min. картинка mrz код в паспорте. картинка mrzblog3 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

MRZ, созданная по стандарту ICAO, на машиносчитываемых проездных документах различных государств содержит:

Помимо паспортов и виз, содержащих машиносчитываемую зону стандартов ICAO, MRZ-подобные зоны размещаются странами и на других документах. Так, машиносчитываемые зоны могут размещаться на внутренних паспортах, ID-картах, водительских удостоверениях. Форматы таких МСЗ могут варьироваться как по количеству строк и знаков, соответствовать стандарту или отходить от него.

mrz код в паспорте. mrzblog4 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog4 min. картинка mrz код в паспорте. картинка mrzblog4 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Courtesy Cth103 t / wikimeda
MRZ-подобная зона на ID-карте Французской Республики

В настоящее время в обиходе несколько типов стандартных машиночитаемых зон, которые разнятся количеством строк и символов в строке. Тип MRP — паспорта — состоит из 2-х строк по 44 символа, так же как и машиночитаемые визы типа А (MRV-A), которые используются США и Японией.

mrz код в паспорте. mrzblog5 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog5 min. картинка mrz код в паспорте. картинка mrzblog5 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Courtesy Shwangtianyuan / wikimedia
Пример MRV-A

Машиночитаемая зона TD-1 (удостоверение личности гражданина, европейские ID-карты, грин-карта США) — состоит из 3-х строк по 30 знаков.

mrz код в паспорте. mrzblog6 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog6 min. картинка mrz код в паспорте. картинка mrzblog6 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Courtesy AH829 / wikimedia
Пример TD-1

Машиночитаемая зона TD-2 (ID Румынии, старый тип ID Казахстана) и машиночитаемые визы типа B (MRV-B) (визы Шенгенской зоны) наносятся в 2 строки и содержат по 36 знаков.

mrz код в паспорте. mrzblog7 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog7 min. картинка mrz код в паспорте. картинка mrzblog7 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Courtesy Doco / wikimedia
Пример TD-2

mrz код в паспорте. mrzblog8 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog8 min. картинка mrz код в паспорте. картинка mrzblog8 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Courtesy Glentamara / wikimedia
Пример MRV-B

Строго говоря, только эти документы, перечисленные в стандарте ICAO, содержат то, что мы называем MRZ. На всех остальных документах машиночитаемые зоны могут быть созданы как в соответствии с этим стандартом, так и отличаться от него. Здесь мы разберем стандартную MRZ формата MRP на примере заграничного паспорта.

Следующие 39 символов первой строки MRZ в заграничном паспорте отведены под написание имени. Сначала идет основной идентификатор или фамилия. Если фамилия состоит из нескольких слов, то между ними в MRZ ставится знак-заполнитель ( mrz код в паспорте. mrzblog11 min. mrz код в паспорте фото. mrz код в паспорте-mrzblog11 min. картинка mrz код в паспорте. картинка mrzblog11 min. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

А теперь вернемся к Российскому национальному общегражданскому паспорту. В Положении о паспорте гражданина Российской Федерации, образца бланка и описания паспорта гражданина Российской Федерации в 2011 году появилось описание машиночитаемой записи, которая наряду с заграничным паспортом стала применяться и на бланках общегражданского паспорта. Правила и способ формирования машиночитаемой записи устанавливаются Федеральной миграционной службой по согласованию с заинтересованными федеральными органами исполнительной власти. Изучив эти правила мы можем увидеть, видим, что содержание машиночитаемой записи российского паспорта не полностью соответствует требованиям ICAO и международным стандартам.

Мы видим как минимум три критических несоответствия ошибки, которые не дают нам возможности говорить о машиночитаемой записи в Российском общегражданском паспорте как о полноценной MRZ, применяемой в международных проездных документах.

Первое отступление от международного стандарта связано с используемым в России алфавитом. Так как надписи на странице данных в Российском паспорте нанесены на русском языке, для транслитерации в машиночитаемой записи Российского паспорта букв Ё, Ч, Ш, Ь, Э, Ю, Я используются цифры 2, 3, 4, 9, 6, 7, 8 соответственно. Это серьезное нарушение стандарта ICAO: использование цифр в имени при внесении в MRZ запрещено.

Скачайте мобильное демо приложение и попробуйте Smart MRZReader в действии

Источник

Компьютеры с камерой и подходящим программным обеспечением могут напрямую считывать информацию в машиночитаемых паспортах. Это обеспечивает более быструю обработку прибывающих пассажиров сотрудниками иммиграционной службы и большую точность, чем ручное считывание паспортов, а также более быстрый ввод данных, большее количество данных для чтения и лучшее сопоставление данных с иммиграционными базами данных и списками наблюдения.

СОДЕРЖАНИЕ

Формат

Буклеты на паспорт

mrz код в паспорте. 220px Mrp image. mrz код в паспорте фото. mrz код в паспорте-220px Mrp image. картинка mrz код в паспорте. картинка 220px Mrp image. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Буклеты для паспорта имеют идентификационную страницу, содержащую идентификационные данные. Эта страница имеет размер TD3 125 × 88 мм (4,92 × 3,46 дюйма).

Данные машиночитаемой зоны состоят из двух строк по 44 символа в каждой. Используются только символы A – Z, 0–9 и знак-заполнитель Официальные проездные документы

mrz код в паспорте. 220px HunIDback. mrz код в паспорте фото. mrz код в паспорте-220px HunIDback. картинка mrz код в паспорте. картинка 220px HunIDback. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Формат первой строки для документов TD1 (размер кредитной карты):

ПозицииДлинаCharsИмея в виду
11альфаЯ, А или С
21альфа + 1
301числоКонтрольная цифра над цифрами 6–30 (верхняя строка), 1–7, 9–15, 19–29 (средняя строка)

Формат третьей строки:

ПозицииДлинаCharsИмея в виду
1–3030альфа + Машиносчитываемые визы

mrz код в паспорте. 220px. mrz код в паспорте фото. mrz код в паспорте-220px. картинка mrz код в паспорте. картинка 220px. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.

Документ ИКАО 9303, часть 7, описывает машиночитаемые визы. Они бывают двух разных форматов:

Формат первой строки машиночитаемой зоны:

ПозицииДлинаCharsИмея в виду
11альфа«V»
21альфа + Технические характеристики, общие для всех форматов

Документ ИКАО 9303, часть 3, описывает спецификации, общие для всех машиносчитываемых проездных документов.

Размеры эффективной зоны чтения (ERZ) стандартизированы и составляют 17,0 мм (0,67 дюйма) в высоту с полем 3 мм по краям документа и 3,2 мм по краю относительно визуально читаемой части. Это сделано для того, чтобы разрешить использование одного считывающего устройства.

Допускаются только символы от A до Z (верхний регистр), 0–9 и Коды гражданства

Коды национальной принадлежности должны содержать код ISO 3166-1 alpha-3 с модификациями для всех форматов. Метод расчета контрольной цифры одинаков для всех форматов.

Некоторые значения, отличные от ISO 3166-1 alpha-3, используются для поля страны выдачи и национальности:

Другие ценности, не получившие широкого признания на международном уровне, включают:

Расчет контрольной суммы

Расчет контрольной цифры следующий: каждой позиции присваивается значение; для цифр от 0 до 9 это значение цифр, для букв от A до Z это от 10 до 35, для заполнителя Имена

В Германии, Австрии, Швейцарии, Венгрии и Скандинавии стандартно использовать сопоставления Å → AA, Ä или Æ → AE, Ö или Ø → OE, Ü → UE и ß → SS, поэтому M ü ller становится M UE LLER, G öß mann становится G OESS MANN, а H ä m ä l ä inen становится H AE M AE L AE INEN. ð, ñ и ü встречаются в Исландии и Испании, но пишут их как D, N и U.

Австрийские паспорта могут (но не всегда) содержать трехъязычное (на немецком, английском и французском языках) объяснение немецких умляутов и ß, например, «ß» entspricht / равно / соответствует à «SS».

Также существуют таблицы для транслитерации имен, написанных с использованием кириллицы и арабского алфавита, в основном на основе правил транслитерации на английский язык. Например, русская фамилия Горбачёв (« Gorba tschow » на немецком языке, « Gorba tchov » на французском, « Gorba chov » на испанском, « Gorba czow » на польском) транскрибируется как « Gorba chev » как на английском языке, так и в соответствии с ИКАО. 9303 правила.

Российские визы (и российские внутренние паспорта с 2011 года) имеют другую транслитерацию в машиночитаемую зону. Например, буква «ч» обычно расшифровывается как «ch» в российских проездных документах, однако в российских визах и внутренних паспортах вместо этого используется цифра «3» в машиночитаемой зоне. Другой пример: «Алексей» (загранпаспорт) => «Алексей» (кириллица) => «АЛЕКСЭК» (машиносчитываемая версия во внутреннем документе). Это упрощает обратную транслитерацию имени на кириллицу.

Имя и имя

Этот вопрос с именами также является проблемой для женщин из ЕС, переживших Брексит и получивших статус урегулированного Брексита.

Источник

Проблемы распознавания ID-документов на мобильных устройствах на примере машинно-читаемых зон

mrz код в паспорте. 5f3144b3401f40b1b048a15be23e348a. mrz код в паспорте фото. mrz код в паспорте-5f3144b3401f40b1b048a15be23e348a. картинка mrz код в паспорте. картинка 5f3144b3401f40b1b048a15be23e348a. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 1 — Загранпаспорт РФ с MRZ-зоной (Источник изображения: en.wikipedia.org/wiki/Russian_passport)

Здравствуйте, сегодня мы хотим рассказать вам об особенностях задачи распознавания документов, удостоверяющих личность, с помощью мобильного телефона. В качестве примера мы рассмотрим задачу распознавания машинно-читаемых зон MRZ на изображениях и на кадрах видеопотока, полученных с камеры мобильного устройства.

1. Что такое MRZ?

Машинно-читаемой зоной (MRZ — Machine-Readable Zone) называют часть документа, удостоверяющего личность, выполненную согласно международным рекомендациям, закрепленным в документе Doc 9303 — Machine Readable Travel Documents Международной Организации Гражданской Авиации.

Примером машинно-читаемой зоны, выполненной в соответствии с этими рекомендациями, является MRZ заграничных паспортов граждан Российской Федерации (Рис. 1 — внизу).

2. Распознавание MRZ при помощи сканеров (в т.ч. специализированных)

Рассмотрим особенности использования сканирующего оборудования в задаче оптического распознавания документов. При сканировании документ расположен в перпендикулярной оптической оси плоскости на фиксированном расстоянии от регистрирующей матрицы. Этим достигается гомотетичность исходного документа и его изображения, а незначительные искажения при небольших отклонениях от такого расположения легко детектируются и корректируются. В процессе сканирования документ неподвижен во время экспозиции, поэтому исключены связанные со смещением исходного документа дефекты (размытие) изображения. Освещение в сканере формируется специальными мощными лампами подсветки, которые гарантируют стабильные характеристики освещенности и отсутствие теней.

Особым случаем сканирующего оборудования являются специализированные документные считыватели и аппаратно-программные комплексы, в которых изображение получается по принципам планшетного, планетарного или щелевого сканера. Документ в таких устройствах либо прижимается к стеклу, либо вставляется в специальную щель (Рис. 2), что практически устраняет деформации сканируемой страницы документа.

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 2 — Примеры расположения документа при использовании считывателей

Такого рода считыватели позволяют получать изображения документов в различных схемах освещения (белая, инфракрасная, ультрафиолетовая, белая на просвет). При этом для оптического распознавания может использоваться схема с белым и инфракрасным освещением, которая дает высококонтрастное изображение с низким уровнем помех от фонового заполнения и элементов защиты.

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 3 — Сканирование паспорта Японии в белом и инфракрасном диапазонах (Источник изображения: bersisteknoloji.com.tr/index_htm_files/Regula%208703_en.pdf)

Известное взаимное расположение элементов освещения (лампы, светодиоды) относительно рабочей поверхности, на которой располагается документ, позволяет полностью устранить (в процессе проектирования прибора) или существенно упростить компенсацию бликов (в процессе работы).

В зависимости от модели такого рода специализированное оборудование позволяет получать изображения в разрешении от 200 DPI и выше, при этом большинство модификаций имеет возможность получения изображений достаточного для оптического распознавания текста разрешения (300-400 DPI).

Таким образом, сканирующие устройства предоставляют изображения высокого качества с минимальными искажениями, что позволяет осуществлять оптическое распознавание текста с высоким качеством и высокой надежностью.

3. Съемка малоформатными цифровыми камерами

3.1. Общие проблемы

По сравнению со сканерами, оптическая схема камеры является более сложной и сама по себе вносит больше искажений в следствии аберраций, бликов и отражений внутри оптической системы. Использование фотосенсоров (матриц) и аналоговой электроники устройствами для регистрации изображений неизбежно приводит к появлению искажений изображений, называемых цифровым шумом. Источниками цифрового шума является сам процесс оцифровки аналогового сигнала (ошибки квантования сигнала, тепловой шум и перенос заряда на матрице) и его дальнейшее усиление. Цифровой шум заметен на изображении в виде наложенной маски из пикселей случайного цвета и яркости. Шум более заметен на однотонных участках изображения, в особенности – на тёмных. В отличии от сканирования, когда гарантировано качественное освещение, при съемке цифровыми камерами часто возникает недостаточная освещенность, при этом влияние цифрового шума естественно многократно усиливается. Еще один источник искажений — алгоритмы сжатия изображений, что особенно характерно для кадров видеопотока.

mrz код в паспорте. 5673bd50e3d6409d89bea61d7ca98fe5. mrz код в паспорте фото. mrz код в паспорте-5673bd50e3d6409d89bea61d7ca98fe5. картинка mrz код в паспорте. картинка 5673bd50e3d6409d89bea61d7ca98fe5. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. a17d83094bd047bbaa343e1cc71d4c33. mrz код в паспорте фото. mrz код в паспорте-a17d83094bd047bbaa343e1cc71d4c33. картинка mrz код в паспорте. картинка a17d83094bd047bbaa343e1cc71d4c33. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. dd104c141aa045b687d6f6b6da43cf8a. mrz код в паспорте фото. mrz код в паспорте-dd104c141aa045b687d6f6b6da43cf8a. картинка mrz код в паспорте. картинка dd104c141aa045b687d6f6b6da43cf8a. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. f847eb6d4ce9494f9e7f4da5f9a140a0. mrz код в паспорте фото. mrz код в паспорте-f847eb6d4ce9494f9e7f4da5f9a140a0. картинка mrz код в паспорте. картинка f847eb6d4ce9494f9e7f4da5f9a140a0. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. 8b431d24b7c1457caa00b8d74c37c8d8. mrz код в паспорте фото. mrz код в паспорте-8b431d24b7c1457caa00b8d74c37c8d8. картинка mrz код в паспорте. картинка 8b431d24b7c1457caa00b8d74c37c8d8. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 4 — Примеры искаженных изображений символов MRZ документа

В зависимости от характеристик объектива и положения документа относительно плоскости наводки на резкость часть или все изображение документа может быть «размыто». Если из-за движения самого документа или камеры происходит смещение во время экспозиции, то появляется «смазывание» (Рис. 5), которое усиливается в условиях недостаточной освещенности.

mrz код в паспорте. 2ba03d427cc547e486a4628ac79b979c. mrz код в паспорте фото. mrz код в паспорте-2ba03d427cc547e486a4628ac79b979c. картинка mrz код в паспорте. картинка 2ba03d427cc547e486a4628ac79b979c. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. a1aa2113b3a5464497db9a4eec52f993. mrz код в паспорте фото. mrz код в паспорте-a1aa2113b3a5464497db9a4eec52f993. картинка mrz код в паспорте. картинка a1aa2113b3a5464497db9a4eec52f993. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. 2d90567dbde34ba0a5edb00f58bbb5ca. mrz код в паспорте фото. mrz код в паспорте-2d90567dbde34ba0a5edb00f58bbb5ca. картинка mrz код в паспорте. картинка 2d90567dbde34ba0a5edb00f58bbb5ca. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. 24bac147da884bc9bd0d6b48b646348a. mrz код в паспорте фото. mrz код в паспорте-24bac147da884bc9bd0d6b48b646348a. картинка mrz код в паспорте. картинка 24bac147da884bc9bd0d6b48b646348a. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. 48baf6d2a49a45a9b18e16183153c912. mrz код в паспорте фото. mrz код в паспорте-48baf6d2a49a45a9b18e16183153c912. картинка mrz код в паспорте. картинка 48baf6d2a49a45a9b18e16183153c912. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. f3a58f97a2e74762ad16a1250b48e6a4. mrz код в паспорте фото. mrz код в паспорте-f3a58f97a2e74762ad16a1250b48e6a4. картинка mrz код в паспорте. картинка f3a58f97a2e74762ad16a1250b48e6a4. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. c4681be0ad104c528b9a2007a8f21f91. mrz код в паспорте фото. mrz код в паспорте-c4681be0ad104c528b9a2007a8f21f91. картинка mrz код в паспорте. картинка c4681be0ad104c528b9a2007a8f21f91. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 5 — Примеры «смазанных» изображений символов

3.2. Проективные и нелинейные искажения

В отличии от сканеров при съемке камерой сам документ расположен в произвольной плоскости относительно плоскости сфокусированного изображения. Отклонение от перпендикулярной оптической оси плоскости приводит к проективному искажению изображения документа. При незначительных углах отклонения можно распознавать машиночитаемую зону без дополнительного проективного исправления, но в общем случае необходимо оценить параметры проективного базиса и производить оптическое распознавание для проективно исправленного изображения. При этом возможны ошибки в определении параметров проективного исправления, что приводит к геометрическим искажениям изображений символов. Более того, как объект физического мира исходный документ подвержен механическим деформациям. Например, выполненные на бумаге документы подвержены «изгибам» и «скручиванию» (чаще всего вдоль или поперек основного направления чтения), причем иногда возникают «волны», когда изгибы в разных местах страницы разнонаправленны. При съемке камерой обеспечить отсутствие деформаций такого рода сложно или просто невозможно (Рис. 6).

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 6 — Различные варианты деформаций

Механическая деформация страницы документа комбинируется с проективным искажением изображения. Выровненные в параллельные строки на исходном документе символы на изображении даже после проективной нормализации могут не иметь базовых линий. Более того, искажению подвергаются не только сами строки, но и изображения отдельных символов. То есть даже после правильной проективной нормализации всего документа изображение символа из физически деформированной на исходном документе области будет отличаться от изображения этого же символа из недеформированной области.

mrz код в паспорте. ca8f6017848c4e86be561571a52d48f4. mrz код в паспорте фото. mrz код в паспорте-ca8f6017848c4e86be561571a52d48f4. картинка mrz код в паспорте. картинка ca8f6017848c4e86be561571a52d48f4. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. f16e44d432194ecf80b1e6a483286747. mrz код в паспорте фото. mrz код в паспорте-f16e44d432194ecf80b1e6a483286747. картинка mrz код в паспорте. картинка f16e44d432194ecf80b1e6a483286747. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. e0feaf62dccc4e98bc85b4e4da29273c. mrz код в паспорте фото. mrz код в паспорте-e0feaf62dccc4e98bc85b4e4da29273c. картинка mrz код в паспорте. картинка e0feaf62dccc4e98bc85b4e4da29273c. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. 003d41ee38984c9d8bd1a252566f4ee8. mrz код в паспорте фото. mrz код в паспорте-003d41ee38984c9d8bd1a252566f4ee8. картинка mrz код в паспорте. картинка 003d41ee38984c9d8bd1a252566f4ee8. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. d90b50e63a1c4e1f8282c384b8977e92. mrz код в паспорте фото. mrz код в паспорте-d90b50e63a1c4e1f8282c384b8977e92. картинка mrz код в паспорте. картинка d90b50e63a1c4e1f8282c384b8977e92. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. c5a31b26d81d4be8933347231cc14ed3. mrz код в паспорте фото. mrz код в паспорте-c5a31b26d81d4be8933347231cc14ed3. картинка mrz код в паспорте. картинка c5a31b26d81d4be8933347231cc14ed3. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. 5ab20b42b97b4c70b39364fcfe5db429. mrz код в паспорте фото. mrz код в паспорте-5ab20b42b97b4c70b39364fcfe5db429. картинка mrz код в паспорте. картинка 5ab20b42b97b4c70b39364fcfe5db429. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. ad57ec31179a4225befc51b1f35b28fc. mrz код в паспорте фото. mrz код в паспорте-ad57ec31179a4225befc51b1f35b28fc. картинка mrz код в паспорте. картинка ad57ec31179a4225befc51b1f35b28fc. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. 93fbdc93c5664c11ae1f6b60a22675ed. mrz код в паспорте фото. mrz код в паспорте-93fbdc93c5664c11ae1f6b60a22675ed. картинка mrz код в паспорте. картинка 93fbdc93c5664c11ae1f6b60a22675ed. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 7 — Примеры искаженных изображений символов из-за проективных и нелинейных деформаций

3.3. Проблемы фона

Для машиночитаемой зоны ICAO 9303 устанавливает, что печать текста должна быть визуально разборчивой и иметь черный цвет (на длинах волн В425–В680 согласно стандарту ИСО 1831), а так же краска должна хорошо поглощать в ближней части инфракрасного диапазона (в диапазоне В900 в соответствии со стандартом ИСО 1831). Таким образом, требования к контрастности налагаются только для инфракрасной области спектрального диапазона. На практике это приводит к тому, что при соблюдении стандарта некоторые страны используют для печати фонового заполнения машиночитаемой зоны краски, которые “прозрачны” в инфракрасном диапазоне и в тоже время довольно “плотны” в оптическом (Рис. 8).

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 8 — Примеры зон с «темным» и «пестрым» заполнением в оптическом диапазоне

Для малоформатных камер мобильных устройств съемка в инфракрасном диапазоне невозможна, поэтому неоднородный фон существенно усложняет процесс оптического распознавания зоны, особенно, в условиях “неудачного” освещения.

Схема освещения документа в сканерах минимизирует появление теней и бликов даже для «глянцевых» страниц документов. При съемке камерой в естественных сценах на изображениях часто возникают перепады яркости (тени, отражения, рефлексы и т.д.) и цветовые искажения, которые усложняют задачи анализа изображений и распознавания, например, за счет потери существующих или появления фальшивых границ объектов. Страницы большинства документов с машиночитаемой зоной либо изготовлены из специального пластика, либо покрыты защитной пленкой и обладают хорошими отражающими свойствами. Такие физические свойства объектов съемки приводят к появлению на документе бликов (Рис. 9). Дополнительно элементы защиты документа часто содержат области с «голографическими» элементами, которые тоже искажают изображение.

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 9 — Фрагменты зоны: блик от протяженного источника света, голографические элементы защиты

3.4. Проблемы использования шрифта OCR-B

Рассмотрим влияние вышеперечисленных сложностей при использовании малоформатных цифровых камер на распознавание одиночных символов.

Для печати строк текста машиносчитываемой зоны ICAO 9303 устанавливает допустимое подмножество символов шрифта OCR-B, при этом некоторые символы имеют схожие начертания.

Наиболее трудными для различения между собой являются буква «О» и цифра ноль, изображения которых отличаются только пропорциями и небольшим различием в “кривизне”. Незначительность различий в начертаниях в условиях даже незначительных искажений или не очень высоко разрешения приводит к тому, что даже человек либо различает их с большим трудом, либо вообще не может различить (Рис. 10).

mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно. mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.— — — — — mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.mrz код в паспорте. image loader. mrz код в паспорте фото. mrz код в паспорте-image loader. картинка mrz код в паспорте. картинка image loader. Начиная с 1 июля 2011 года в России начали выдавать паспорта нового образца. В них на третьей странице под фотографией теперь находится две строки с цифрами и буквами, о назначении которых не задумывается большинство граждан. А зря, поскольку их содержание весьма интересно.
Рис. 10 — Примеры трудно различимых символов 0 (ноль, слева) и O (буква, справа)

Таким образом, при использовании для получения изображений документов малоформатных цифровых камер, в общем случае, невозможно гарантировать высокое качество изображения символа. Это приводит к существенно более низкому качеству и надежности результатов распознавания отдельных символов, а механизмы контекстной обработки начинают играть существенно более важную роль (по сравнению со сканированием).

4. Проблемы языковой модели

В современных системах распознавания и идентификации структурированных документов для улучшения точности распознавания используются механизмы статистической коррекции. Эти механизмы используют информацию о структуре документа, о “контексте” распознавания, и опираются на языковую модель распознаваемого документа (либо распознаваемого поля). Известны алгоритмы подобной статистической коррекции, или пост-обработки, опирающиеся на группу родственных методов, таких как скрытые марковские модели (Hidden Markov Models, HMM), конечные автоматы, N-граммные и словарные методы, а также механизмы, использующие взвешенные конечные преобразователи (Weighted Finite-State Transducers, WFST).

4.1. Мощность контекста

Так как финальная сумма взвешенных кодов символов берется по модулю 10, возникает значительное количество коллизий. Особенные трудности вызывают коллизии на парах символов, которые трудно различимы механизмами распознавания одиночных символов в условиях распознавания с камеры мобильных устройств (см. пп. 3.1, 3.2). Так, одинаковые коды (взятые по модулю 10) имеют символы ‘F’ и ‘P’, ‘H’ и ‘R’, ‘G’ и ‘6, ‘S’ и ‘8’. В таких полях, как “номер документа” и “персональный номер”, могут встречаться как цифры, так и буквы латинского алфавита, и основным способом валидации является именно контрольная сумма. Однако, если на этапе распознавания одиночных символов один из символов, из приведенных выше пар, ошибочно распознался как другой член этой пары, то контрольная сумма при этом не изменится, и вероятность того, что после пост-обработки результат распознавания поля исправится сильно понижается.
Веса, на которые умножаются коды символов проверяемого поля, также вызывают вопросы. К примеру, веса 7 и 3, применяемые к соседствующим символам, дают в сумме 10. Это значит, что стоящие рядом одинаковые символы (или разные символы, но с одинаковыми кодами по модулю 10) с весами 7 и 3 будут вместе давать нулевой вклад в контрольную сумму, вне зависимости от того, какие это символы. Это в свою очередь означает, что если на фотографии или на кадре видеопотока, на котором происходит распознавание MRZ-документа, наблюдается локальное искажение, из-за которого два соседних символа распознались с ошибкой (например, пара цифр ‘00’ распозналась как пара букв ‘OO’), и эти два символа находятся в позициях поля с весами 7 и 3, то при помощи контрольной суммы их исправить не удастся. Особенно выражено это касается полей “номер документа” и “персональный номер”, так как у этих полей самый широкий алфавит из всех полей MRZ-документа (в их записи допускаются как цифры, так и буквы).

Для повышения надежности механизма валидации чувствительных данных в документе ICAO 9303 для некоторых типов MRZ-документов предусмотрена общая контрольная сумма. Однако общая контрольная сумма распространяется не на весь MRZ документ, а только на те его поля, которые уже защищены собственной контрольной суммой.

В итоге, с точки зрения моделирования языка с целью построения механизмов коррекции результатов распознавания MRZ-документа, некоторые поля, предусмотренные ICAO 9303, позволяют построить достаточно мощные контексты. Однако для отдельных полей (таких как “номер документа”, “персональный номер”) определение более строгой синтаксической структуры позволило бы увеличить качество распознавания, как в системах, работающих с камерами мобильных устройств, так и в традиционных системах на основе сканеров. Также повысить качество и надежность распознавания MRZ-документов позволило бы введение контрольных сумм на все значимые поля, или общих контрольных сумм, распространяющихся на весь документ.

5. Заключение

Мы описали вам основные проблемы, с которыми нам пришлось столкнуться при разработке нашего программного продукта Smart 3D OCR MRZ — Software Developer Kit для автономного распознавания MRZ-документов на мобильных устройствах. В дальнейшем мы планируем представить вам обзорную статью по архитектуре и ряд статей по алгоритмам, которые мы используем в наших разработках, связанных с распознаванием документов в видеопотоке.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *