С точностью 83,65%: алгоритм научился распознавать курсивный текст
- Автор
- Дата публикации
- Автор
Алгоритм от Amazon научился распознавать курсивный и не горизонтально расположенный текст.
Исследователи несколько лет пытались создать алгоритм, который будет с высокой точностью распознавать не горизонтально расположенные символы. Теперь инженеры из Amazon разработали TextTubes — это детектор искривленного текста.
Алгоритм считывает текст в два шага — сначала обнаруживает и определяет его последовательность, а затем распознает. Для первой задачи TextTubes локализует символы, потом, с помощью контекстных подсказок, определяет, как правильно его читать, а затем — расшифровывает содержание. Основная сложность — в деформации текста и произвольных шрифтах.
Исследователи оценили производительность TextTubes на CTW-1500 — наборе данных, состоящем из 1500 изображений, собранных из стоковых библиотек. На них есть более 10 тыс. текстов, содержащих, по крайней мере, одно слово, написанное не строго по горизонтали.
Apple, Google и Amazon объединяются: причинаКроме того, массив содержал примерно 1255 учебных изображений и 300 тестовых изображений с одним или несколькими изогнутыми текстами. Ученые сообщили, что они достигли лучших результатов в отрасли — 83,65% удачных случаев распознавания.