แปลง PDF เป็น Text

มีคำถามมาบ่อยครั้งในการแปลงเอกสาร PDF กลับไปเป็น เอกสารข้อความ (Text format) โดยท่านที่ใช้โปรแกรม Acrobat Professional ย่อมไม่มีปัญหา เพราะสามารถ Export กลับเป็นเอกสารข้อความ หรือเอกสาร Word ได้ง่าย

ส่วนท่านที่ไม่ได้ใช้ Acrobat Professional มีทางเลือกโดยเลือกใช้ Open Source อย่าง PDF2Text Pilot ซึ่งสามารถดาวน์โหลดได้จากเว็บ http://www.colorpilot.com/extract-pdf-text.html

ตัวโปรแกรมติดตั้งบน Microsoft Windows แล้วสามารถทำงานได้ง่าย โดยมีหน้าต่างโปรแกรมดังนี้

pdf2text

การใช้งานโปรแกรมไม่ยุ่งยากเลยครับ เริ่มจากการนำเข้าแฟ้มเอกสาร PDF (ที่ได้จากการแปลง – Convert) โดยคลิกปุ่ม Add Files… จากนั้นคลิกปุ่ม Convert โปรแกรมจะดึงข้อความให้ออกมาในรูปแบบเอกสารข้อความ (.txt) ทั้งนี้โปรแกรมรองรับเอกสารภาษาไทย ดังนี้

pdf2text01

นอกจากนี้เครื่องมือ Google Docs ก็สามารถนำเข้าเอกสาร PDF และแปลงเป็น Text ได้ (เครื่องมือนี้สนับสนุน OCR ด้วยครับ) โดยเริ่มจากการเข้าเว็บ Google Docs

docs01

คลิกเลือก Files แล้วเลือกแฟ้มเอกสาร PDF ที่ต้องการ (รองรับทั้งแฟ้ม PDF จากการแปลง และจากการสแกนความละเอียดสูง) จะปรากฏจอภาพการนำเข้า ดังนี้

docs02

ให้ตรวจสอบค่า Conversion ต้องเป็น on โดยปรับได้จากรายการ Settings

docs03

เลือกรายการ Convert text from uploaded PDF and image files

เพียงเท่านี้โปรแกรม Google Docs ก็จะแปลงเอกสาร PDF เป็นเอกสารข้อความ พร้อมแก้ไขได้ง่ายแล้วครับ

docs04

อย่างไรก็ดี ผลลัพธ์การแปลง PDF เป็น Text ภาษาไทยอาจจะไม่สมบูรณ์อย่างที่ต้องการนะครับ

Unknown's avatar

ฺBoonlert Aroonpiboon

เก็บบันทึกเรื่องราวและความทรงจำ

You may also like...

Discover more from Boonlert Aroonpiboon

Subscribe now to keep reading and get access to the full archive.

Continue reading