OCR とは、「Optical Character Recognition」(光学文字認識)または「Optical Character Reader」(光学式文字読み取り装置)の略称で、画像ファイルに含まれるテキストの「認識」や「読み取り」に用いられる技術です。
OCR は、キーボード入力、手書き、または印刷によるテキストの画像を、機械で処理、検索できるテキストに変換します。たとえば、スキャンしたドキュメント、ドキュメントを撮影した写真、文字情報が含まれる看板や景色の写真、映像の字幕などをテキストに変換できます。
現時点で、Dropbox は OCR を使用して PDF に含まれるテキストを認識し、簡単に検索できる文字情報に変換しています。このため、必要な情報を探すのにかかる時間を大幅に節約できます。