تبدیل اسناد اسکن شده به متون نوشتاری توسط آفیس 2007
نوشته شده به وسیله ی محمد ک در تاریخ 88/5/7:: 11:53 عصر
تبدیل اسناد اسکن شده به متون نوشتاری توسط آفیس 2007
اگر تا کنون دقت کردهباشید، همراه با نرمافزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Offic Tools نیز نصب میشود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.
یکی از این ابزارها، قابلیت OCR(Optional Character Recognition) نام دارد که در قالب دو نرمافزار Microsoft Office Document Scanning و Microsoft Office Document Imiging در قسمت office tools قرار گرفتهاست. قابلیت OCR صفحه اسکن شده را تحلیل و سپس متون موجود در آن را استخراج میکند. همانطور که میبینید روش کار واضح است. ابتدا باید اسناد مورد نظر را به فرمت TIFF(Tagged Image File Format) اسکن کنید و سپس بهکمک قابلیت OCR، آنها را بهصورت text درآورید. بدین ترتیب میتوانید متون یک کتاب یا هر نوشته دیگری را در نرمافزار Word یا یا سایر نرمافزارهای ویرایش متن وارد و آنها را ویرایش کنید.(این قابلیت تنها برای متون انگلیسی،فرانسه و اسپانیایی کاربرد دارد)
بدین منظور باید مراحل زیر را دنبال کنید:
- 1- روی دکمه استارت کلیک کنید
- 2- عبارت All Programs را انتخاب کنید
- 3- عبارت Microsoft Office را انتخاب کنید
- 4- عبارت Microsoft Office Tools را انتخاب کنید(شکل 1)
- 5- در فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن کلیک کنید. اگر این عبارت وجود نداشت باید آن را نسب کنید. بدین منظور سیدی نصب آفیس را در درایو سیدی قرار دهید. پس از نمایش صفحه Autorun، تیک عبارت Add or Remove Features را بزنید و روی Continue کلیک کنید. اکنون شما به صفحه سفارشی کردن آفیس هدایت شدهاید. روی علامت (+) کنار عبارت Office Tools کلیک کنید تا شاخه مریوطه باز شود. در این قسمت روی آیکون عبارت Microsoft Office Document Imaging کلیک کنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب کنید. با فشردن دکمه Continue، فرآیند نصب آغاز میشود. پس از پایان مراحل نصب، مراحل 1 تا پنج را بار دیگر تکرار کنید تا کادر محاورهای با عنوان Scan New Document نمایش دادهشود.(شکل 2)
- 6- در این پنجره میتوانید یکی از تنظیمات پیشفرض را برای اسکن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پییشفرض جدید میتوانید روی دکمه Preset Options کلیک کنید و عملیات مورد نظر خود را انتخاب کنید. پیشنهاد میکنیم برای دستیابی به بک نتیجه مطلوب تنظیمات پیشفرض اسکن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید.
- 7- پس از پایان تنظیمات اسکن، رو دکمه Scan کلیک کنید تا صفحه مورد نظر اسکن شود. اگر هنگام عملیات اسکن با پیغام خطایی مواجه شدید به کادر Scan new Document بازگردید و در قسمت انتخاب اسکنر، تیک عبارتهای Use Automatic Document Feeder و Show scanner Driver Dialog Before Scanning را بزنید و برای تایید روی OK کلیک کنید.
- 8- پس از پایان عملیات اسکن، روی دکمه Close کلیک کنید. اکنون صفحه اسکن شده در قالب فرمت تصویری TIFF و در نرمافزار Office Document Imaging Window نمایش داده شدهاست.(شکل3)
- 9- اگر مایلید که تنها قسمت خاصی از این فایل را استخراج کنید، باید دیکمه چپ ماوس را پایین نگه دارید و آن را روی قسمت مورد نظر بکشید.
- 10- در بالای صفحه، منوی Tools را انتخاب کنید.
- 11- زیر منوی Sent text to word را کلیک منید تا پنجره مربوطه نشان دادهشود.(شکل 4)
- 12- برای استخراج تمام متون فایل TIFF، تیک عبارت All Pages را بزنید. اما اگر میخواهید تنها متون انتخاب شده استخراج شوند، تیک عبارت Current Selection را بزنید.
- 13- اگر میخواهید خروجی عملیات تبدیل فایل TIFF به text ، فاقد تصاویر سند اسکن شده باشد، تیک عبارت Maintain Pictures in Output را بردارید.
- 14- پس از اتمام تنظیمات مربوطه، روی دکمه ok کلیک کنید. با این کار، نرمافزار word باز شده و فایل TIFF در قالب سند نوشتاری(text) نمایش داده میشود. در صورت نیاز میتوانید آنها را ویرایش کنید. (شکل 5)
علاوه بر روش فوق، در نرمافزار Document Imagng میتوانید فایلهای TIFF را به text تبدیل کنید. بدین منظور از منوی file عباری Import را انتخاب کنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دکمه Import کلیک کنید. اکنون میتوانید با طی کردن مراحل 9 تا 14، متون فایل TIFF را استخراج نمایید.
باید این نکته را توجه داشتهباشید که هنگام تحلیل یک صفحه توسط قابلیت OCR، احتمالاً با این پیغام مواجه خواهید شد: Unable to perform OCR in farsi. این پیغام زمانی نمایش داده میشود که زبان انتخابی پیشفرض سیستم شما، فارسی باشد. برای رفع این مشکل، از منوی Tools نرمافزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی کرکرهای OCR Language ، زبان English را انتخاب کنید.
امیدوارم که مفید واقع شده باشه
نظر یادتون نره
منبع: دو هفتهنامه عصرشبکه
کلمات کلیدی : Microsoft Office Document Imiging، Microsoft Office Document Scanning، آفیس 2007، Office 2007