OCR市場規模の予測
アイタスクのサービスは、企業の書類をPDFや画像のデータで管理するにあたり、OCR機能を使ってデータベース化しています。そこで、OCRがどのようなものか、またOCRの市場性についてご案内します。
OCRとは
手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術です。
紙に記載されたテキスト情報を使うために、パソコンで数字や文字を手入力すると多くの手間と時間がかかります。
上図のように、紙面の文字情報をテキストデータ化して使いたい場合には、紙面を読み取るスキャナーとOCR機能を備えたサービスが活用されています。
OCR市場の成長について
2018年度のOCR市場の売上金額は52億円、前年度比45.3%増と急成長
2018年度のOCR市場の売上金額は52億円、前年度比45.3%増の急速な伸びを示しました。2019年度も同53.8%増とさらなる伸びを予測しています。OCRの歴史は長いものの、認識精度の低さから企業での導入は限定的でしたが、AI活用による認識精度の向上やデータの自動抽出機能の追加などにより、OCRが見直されていることが背景にあります。
出典:市場調査とコンサルティングのITR
AIによる認識精度向上に伴い導入が拡大し、2023年度には市場は160億円に達すると予測
加えて、RPAの導入を機に入力業務の省力化や、自動化の範囲の拡大を検討する企業が増えつつあり、これに伴いOCRの導入を検討する企業も増加傾向にあります。これらのことから、OCR市場は2023年度には160億円、CAGR(2018~2023年度)は25.5%の高い伸びを予測しています。
出典:市場調査とコンサルティングのITR
このように、OCRが使われる機会は年々増加傾向にあります。将来的に紙で保管したり、企業内で資料を紙で配布する手法は減少していくでしょう。
その代わりに、情報をパソコン・スマホ・タブレットなどのデジタル端末で閲覧したり、情報が必要なときにクラウド上からデータを引きだして共有する企業が増えています。
データ共有・セキュリティ重視の傾向はさらに強くなる
情報をテキストデータとして保存するということは、個人情報を含んだ情報も多く取り込むことになります。
書面からOCRが読み取ったテキスト情報には、顧客名や氏名、借主と貸主、物件名や住所などの情報が含まれています。企業にとって機密情報(個人情報や顧客情報)に該当する場合もあるでしょう。
このように企業が保有するテキストデータが増えるほど、その情報管理をより安全に取り扱う必要があります。
OCRで読み込んだテキストをクラウド上で管理する時、テキストデータを暗号化して取り扱っていたとしても、テキストデータはサーバー内に平文(ひらぶん)で保存されています。
暗号化された情報は、復号化(元の情報に戻す)できることが前提となっています。サーバーにある暗号化された情報が漏洩してしまった場合、時間をかけて解読される可能性があります。
このテキストデータを安全に管理するシステムとして、アイタスクによるクラウドデータ管理システムを開発し、特許を取得いたしました。