แปลง PDF เป็น Text
มีคำถามมาบ่อยครั้งในการแปลงเอกสาร PDF กลับไปเป็น เอกสารข้อความ (Text format) โดยท่านที่ใช้โปรแกรม Acrobat Professional ย่อมไม่มีปัญหา เพราะสามารถ Export กลับเป็นเอกสารข้อความ หรือเอกสาร Word ได้ง่าย
ส่วนท่านที่ไม่ได้ใช้ Acrobat Professional มีทางเลือกโดยเลือกใช้ Open Source อย่าง PDF2Text Pilot ซึ่งสามารถดาวน์โหลดได้จากเว็บ http://www.colorpilot.com/extract-pdf-text.html
ตัวโปรแกรมติดตั้งบน Microsoft Windows แล้วสามารถทำงานได้ง่าย โดยมีหน้าต่างโปรแกรมดังนี้
การใช้งานโปรแกรมไม่ยุ่งยากเลยครับ เริ่มจากการนำเข้าแฟ้มเอกสาร PDF (ที่ได้จากการแปลง – Convert) โดยคลิกปุ่ม Add Files… จากนั้นคลิกปุ่ม Convert โปรแกรมจะดึงข้อความให้ออกมาในรูปแบบเอกสารข้อความ (.txt) ทั้งนี้โปรแกรมรองรับเอกสารภาษาไทย ดังนี้
นอกจากนี้เครื่องมือ Google Docs ก็สามารถนำเข้าเอกสาร PDF และแปลงเป็น Text ได้ (เครื่องมือนี้สนับสนุน OCR ด้วยครับ) โดยเริ่มจากการเข้าเว็บ Google Docs
คลิกเลือก Files แล้วเลือกแฟ้มเอกสาร PDF ที่ต้องการ (รองรับทั้งแฟ้ม PDF จากการแปลง และจากการสแกนความละเอียดสูง) จะปรากฏจอภาพการนำเข้า ดังนี้
ให้ตรวจสอบค่า Conversion ต้องเป็น on โดยปรับได้จากรายการ Settings
เลือกรายการ Convert text from uploaded PDF and image files
เพียงเท่านี้โปรแกรม Google Docs ก็จะแปลงเอกสาร PDF เป็นเอกสารข้อความ พร้อมแก้ไขได้ง่ายแล้วครับ
อย่างไรก็ดี ผลลัพธ์การแปลง PDF เป็น Text ภาษาไทยอาจจะไม่สมบูรณ์อย่างที่ต้องการนะครับ







You must be logged in to post a comment.