Системы распознавания текста были изобретены еще в прошлом двадцатом веке, когда с помощью сканеров листы отпечатанных документов стало можно переводить в редактируемые компьютерные файлы. Технологический прорыв в этой области сэкономил немало времени тем, кто работал над дипломами, диссертациями, научными докладами, в которых было нужно процитировать большой объем текста.

При непосредственном участии Федеральной службы по интеллектуальной собственности («Роспатента») мы решили ввести на сайте рубрику «Патент недели». Еженедельно в России патентуются десятки интересных изобретений и усовершенствований — почему бы не рассказывать о них в числе первых.

Патент: 2691214

Авторы: Никита Орлов, Владимир Рыбкин, Константин Анисимович, Азат Давлетшин

Патентообладатели: ООО «Аби Продакшн»

Проблема, с которой сталкивалось большинство систем распознавания текста, — сложность работы с «нестандартными» шрифтами, а также, например, арабской вязью или китайскими иероглифами. Вариантов начертания и написания подобных символов — бесчисленное множество, вплоть до индивидуальных особенностей, а бесконечное обновление базы данных символов — почти нерешаемая задача.

Человеческий мозг в подобной ситуации ориентируется на ключевые элементы текстовых символов: скажем, букву «а», написанную разными людьми, люди, так или иначе, узнают, несмотря на индивидуальные особенности почерка или стиль печати. Другое дело — машины. По сути, ранние системы распознавания текста были построены на сравнении отсканированной картинки символа с символами в памяти программы: небольшое изменение — и вот уже программа выдает совсем не ту букву или знак, что вам нужен. «Распознанный» текст приходилось вычитывать во избежание ошибок даже при сканировании простых документов на кириллице или латинице.

Лидер российского и международного рынка систем распознавания, компания ABBYY, включила в свою новую систему перевода текстов в редактируемый файл элементы искусственного интеллекта. Благодаря такому подходу система начинает работать, фактически как человеческий мозг, который за индивидуальными особенностями почерка или печати все равно видит знакомые еще со школы буквы.

Система не просто «ждет» добавления в нее новых графических символов, а проводит сравнительный анализ отсканированного символа с уже известным ей набором, расширяя варианты возможного написания и начертания одной и той же графемы, что особенно важно для работы с очень «графическими» шрифтами — иероглифами, арабской вязью. Если в документе есть особенности или недостатки печати: плывущие строки, непропечатаные элементы и тому подобное, «ума» системы хватит, чтобы выдать вам правильный вариант.

Подробности изобретения — в опубликованном патенте.

Источник

ПОДЕЛИТЬСЯ:
bhojpuri video dow pornthash.mobi sky movie in south
reshma fucking videos redpornvideos.mobi choda chudi wala
kerasex myxxxbase.mobi www.sexywife.com
افلام سكس كترجمة supercumtube.com اخ ينك اخته
kamapishasi orgypornvids.com girls in saree
عارية تماما freeporn8.net lkj]dhj hldv hg/ghl
افلام سكس اجنبية مترجمة meyzo.info صور سس
steamed lapulapu teleseryeepesodes.com what time is jessica soho
نيك البنت freepornarabsex.com افلام سكس جميلة
صور ازبار مصرية arabsgat.com سكس زوج الام مترجم
dtvedio pornotane.info indian porn sex.com
لحس اقدام البنات sosiano.com شعر الابط سكس
indian college sex stories tubzolina.mobi ashwitha nude
delivery bitch mama super hentaihd.org thefaplist
xxxxxxxxxxxxv indianpornvideos.me kowalskypag