С точностью 83,65%: алгоритм научился распознавать курсивный текст

Автор
838
С точностью 83,65%: алгоритм научился распознавать курсивный текст

Алгоритм от Amazon научился распознавать курсивный и не горизонтально расположенный текст.

Исследователи несколько лет пытались создать алгоритм, который будет с высокой точностью распознавать не горизонтально расположенные символы. Теперь инженеры из Amazon разработали TextTubes — это детектор искривленного текста.

Алгоритм считывает текст в два шага — сначала обнаруживает и определяет его последовательность, а затем распознает. Для первой задачи TextTubes локализует символы, потом, с помощью контекстных подсказок, определяет, как правильно его читать, а затем — расшифровывает содержание. Основная сложность — в деформации текста и произвольных шрифтах.

Исследователи оценили производительность TextTubes на CTW-1500 — наборе данных, состоящем из 1500 изображений, собранных из стоковых библиотек. На них есть более 10 тыс. текстов, содержащих, по крайней мере, одно слово, написанное не строго по горизонтали.

Apple, Google и Amazon объединяются: причина

Кроме того, массив содержал примерно 1255 учебных изображений и 300 тестовых изображений с одним или несколькими изогнутыми текстами. Ученые сообщили, что они достигли лучших результатов в отрасли — 83,65% удачных случаев распознавания.