امروزه در زمینه ذخیره سازی و اسکن داده ها فناوری های جالبی ارائه شده است که OCR از جمله آنها می باشد. این نرم افزار این قابلیت را دارد تا با پردازش نوشته های چاپی ، آنها را به کاراکتر های قابل پردازش برای رایانه بدل کند. کاربرد های این فناوری از جهت های باعث مطرح شدن آن میان افراد شده است که در ادامه این کاربرد ها را بررسی خواهیم کرد.
وقتی در حال خواندن یک نوشته هستیم مغز ما با کمک چشم کاراکترهای اپتیکی را پردازش میکند که حتی متوجه چنین پردازشی نخواهیم شد چشم ها امکان اشکال ثبت شده کاراکترها را برعهده میگیرند و در ادامه مغز این کاراکترها را پردازش میکند.
تکنولوژی OCR نیز مشابه این فرآیند را بوسیله کامپیوترها امکان پذیر میکند . در این فرآیند تصاویر مربوط به یک متن یا سند از طریق تصویربرداری دیجیتال با دوربین دیجیتال های معمول یا اسکنر گرفته شده و به کامپیوتر داده میشود سپس این تصاویر به عنوان فایل های گرافیکی مورد استفاده قرار میگیرد.
در ابتدای این کار برای کامپیوتر برای این فایل ها هیچ تفاوتی با سایرفایل های تصویری مانند عکس های منظره و …. قائل نیست و تفاوت زمانی مشخص میشود که یک نرم افزار واسطه وارد این عملیات میشود. طی این فرآیند تصویر متن که برپایه فرمت های تصویری است به فایل متنی مانند txt یا docs و هر فرمت دیگری میتواند تبدیل شود.