Що таке OCR?
OCR (Optical Character Recognition) — оптичне розпізнавання символів або оптичний пристрій читання символів. Це технологія, яка використовується для «розпізнавання» або «читання» тексту, що міститься у файлах зображень.
OCR перетворює зображення друкованого або рукописного тексту з файлів у текст, який може автоматично оброблятися та в якому може здійснюватися пошук. Сюди входять відскановані документи, фотографії документа, фотографії з підписами або зображеннями з друкованим текстом, а також підписами на зображенні.
Наразі Dropbox використовує OCR для розпізнавання тексту в PDF‑файлах і полегшення пошуку їх вмісту. Це може суттєво заощадити час.