سفارش تبلیغ
صبا ویژن

تبدیل اسناد اسکن شده به متون نوشتاری توسط آفیس 2007

تبدیل اسناد اسکن شده به متون نوشتاری توسط آفیس 2007

اگر تا کنون دقت کرده‌باشید، همراه با نرم‌افزارهای مجموعه آفیس، قسمتی با عنوان Microsoft Offic Tools نیز نصب می‌شود که شامل ابزار کاربردی و کمکی برای کاربران آفیس است.

یکی از این ابزارها، قابلیت OCR(Optional Character Recognition) نام دارد که در قالب دو نرم‌افزار Microsoft Office Document Scanning و Microsoft Office Document Imiging در قسمت office tools قرار گرفته‌است. قابلیت OCR صفحه اسکن شده را تحلیل و سپس متون موجود در آن را استخراج می‌کند. همانطور که می‌بینید روش کار واضح است. ابتدا باید اسناد مورد نظر را به فرمت TIFF(Tagged Image File Format) اسکن کنید و سپس به‌کمک قابلیت OCR، آن‌ها را به‌صورت text درآورید. بدین ترتیب می‌توانید متون یک کتاب یا هر نوشته دیگری را در نرم‌افزار Word یا یا سایر نرم‌افزارهای ویرایش متن وارد و آنها را ویرایش کنید.(این قابلیت تنها برای متون انگلیسی،فرانسه و اسپانیایی کاربرد دارد)

بدین منظور باید مراحل زیر را دنبال کنید:

  • 1- روی دکمه استارت کلیک کنید
  • 2- عبارت All Programs را انتخاب کنید
  • 3- عبارت Microsoft Office را انتخاب کنید
  • 4- عبارت Microsoft Office Tools را انتخاب کنید(شکل 1)
  • تبدیل اسناد اسکن شده به متون
  • 5- در فهرست باز شده به دنبال عبارت Microsoft Office Document Scanning بگردید و روی آن کلیک کنید. اگر این عبارت وجود نداشت باید آن را نسب کنید. بدین منظور سی‌دی نصب آفیس را در درایو سی‌دی قرار دهید. پس از نمایش صفحه Autorun، تیک عبارت Add or Remove Features را بزنید و روی Continue کلیک کنید. اکنون شما به صفحه سفارشی کردن آفیس هدایت شده‌اید. روی علامت (+) کنار عبارت Office Tools کلیک کنید تا شاخه مریوطه باز شود. در این قسمت روی آیکون عبارت Microsoft Office Document Imaging کلیک کنید و از فهرست باز شده، عبارت Run all from my computer را انتخاب کنید. با فشردن دکمه Continue، فرآیند نصب آغاز می‌شود. پس از پایان مراحل نصب، مراحل 1 تا پنج را بار دیگر تکرار کنید تا کادر محاوره‌ای با عنوان Scan New Document نمایش داده‌شود.(شکل 2)
  • تبدیل اسناد اسکن شده به متون
  • 6- در این پنجره می‌توانید یکی از تنظیمات پیش‌فرض را برای اسکن سند خود در نظر بگیرید. با این حال برای ویرایش تنظیمات پییش‌فرض جدید می‌توانید روی دکمه Preset Options کلیک کنید و عملیات مورد نظر خود را انتخاب کنید. پیشنهاد می‌کنیم برای دستیابی به بک نتیجه مطلوب تنظیمات پیش‌فرض اسکن را روی عبارت Black & White (سیاه و سفید) دست نخورده باقی بگذارید.
  • 7- پس از پایان تنظیمات اسکن، رو دکمه Scan کلیک کنید تا صفحه مورد نظر اسکن شود. اگر هنگام عملیات اسکن با پیغام خطایی مواجه شدید به کادر Scan new Document بازگردید و در قسمت انتخاب اسکنر، تیک عبارتهای Use Automatic Document Feeder و Show scanner Driver Dialog Before Scanning را بزنید و برای تایید روی OK کلیک کنید.
  • 8- پس از پایان عملیات اسکن، روی دکمه Close کلیک کنید. اکنون صفحه اسکن شده در قالب فرمت تصویری TIFF و در نرم‌افزار Office Document Imaging Window نمایش داده شده‌است.(شکل3)
  • تبدیل اسناد اسکن شده به متون
  • 9- اگر مایلید که تنها قسمت خاصی از این فایل را استخراج کنید، باید دیکمه چپ ماوس را پایین نگه‌ دارید و آن را روی قسمت مورد نظر بکشید.
  • 10- در بالای صفحه، منوی Tools را انتخاب کنید.
  • 11- زیر منوی Sent text to word را کلیک منید تا پنجره مربوطه نشان داده‌شود.(شکل 4)
  • تبدیل اسناد اسکن شده به متون
  • 12- برای استخراج تمام متون فایل TIFF، تیک عبارت All Pages را بزنید. اما اگر می‌خواهید تنها متون انتخاب شده استخراج شوند، تیک عبارت Current Selection را بزنید.
  • 13- اگر می‌خواهید خروجی عملیات تبدیل فایل TIFF به text ، فاقد تصاویر سند اسکن شده باشد، تیک عبارت Maintain Pictures in Output را بردارید.
  • 14- پس از اتمام تنظیمات مربوطه، روی دکمه ok کلیک کنید. با این کار، نرم‌افزار word باز شده و فایل TIFF در قالب سند نوشتاری(text) نمایش داده می‌شود. در صورت نیاز می‌توانید آنها را ویرایش کنید. (شکل 5)
  • تبدیل اسناد اسکن شده به متون

علاوه بر روش فوق، در نرم‌افزار Document Imagng می‌توانید فایل‌های TIFF را به text  تبدیل کنید. بدین منظور از منوی file عباری Import را انتخاب کنید. در پنجره باز شده، به دنبال فایل TIFF مورد نظر بگردید و پس از انتخاب آن روی دکمه Import کلیک کنید. اکنون می‌توانید با طی کردن مراحل 9 تا 14، متون فایل TIFF را استخراج نمایید.

باید این نکته را توجه داشته‌باشید که هنگام تحلیل یک صفحه توسط قابلیت OCR، احتمالاً با این پیغام مواجه خواهید شد: Unable to perform OCR in farsi. این پیغام زمانی نمایش داده می‌شود که زبان انتخابی پیش‌فرض سیستم شما، فارسی باشد. برای رفع این مشکل، از منوی Tools نرم‌افزار Document Imaging، عبارت Options را انتخاب نمایید. سپس در زبانه OCR و از منوی کرکره‌ای OCR Language ، زبان English را انتخاب کنید.

امیدوارم که مفید واقع شده باشهمؤدبنکته بین

نظر یادتون نرهتبسمبووووس

 

منبع: دو هفته‌نامه عصر‌شبکه

 



کلمات کلیدی : Microsoft Office Document Imiging، Microsoft Office Document Scanning، آفیس 2007، Office 2007