โฮมเพจ » ดาวน์โหลดซอฟต์แวร์ฟรี » แยกข้อความจากไฟล์ PDF และไฟล์ภาพ

    แยกข้อความจากไฟล์ PDF และไฟล์ภาพ

    มีเอกสาร PDF ที่คุณต้องการแยกข้อความทั้งหมดหรือไม่ ไฟล์รูปภาพของเอกสารที่สแกนที่คุณต้องการแปลงเป็นข้อความที่แก้ไขได้ นี่คือปัญหาที่พบบ่อยที่สุดที่ฉันเคยเห็นในที่ทำงานเมื่อทำงานกับไฟล์.

    ในบทความนี้ฉันจะพูดเกี่ยวกับวิธีที่แตกต่างกันหลายวิธีที่คุณสามารถทำได้เกี่ยวกับการพยายามดึงข้อความจาก PDF หรือจากรูปภาพ ผลลัพธ์การดึงข้อมูลของคุณจะแตกต่างกันไปขึ้นอยู่กับประเภทและคุณภาพของข้อความใน PDF หรือรูปภาพ นอกจากนี้ผลลัพธ์ของคุณจะแตกต่างกันไปตามเครื่องมือที่คุณใช้ดังนั้นจึงเป็นวิธีที่ดีที่สุดที่จะลองใช้ตัวเลือกมากมายด้านล่างเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด.

    แยกข้อความจากรูปภาพหรือ PDF

    วิธีเริ่มต้นที่ง่ายและรวดเร็วที่สุดคือลองใช้บริการแยกไฟล์ข้อความออนไลน์ PDF สิ่งเหล่านี้เป็นปกติฟรีและสามารถให้สิ่งที่คุณต้องการโดยไม่ต้องติดตั้งอะไรบนคอมพิวเตอร์ของคุณ นี่คือสองสิ่งที่ฉันใช้กับผลลัพธ์ที่ยอดเยี่ยมถึงดีมาก:

    ExtractPDF

    ExtractPDF เป็นเครื่องมือฟรีที่จะดึงรูปภาพข้อความและแบบอักษรออกจากไฟล์ PDF ข้อ จำกัด เพียงอย่างเดียวคือขนาดสูงสุดสำหรับไฟล์ PDF คือ 10 MB มันเล็กไปหน่อย ดังนั้นหากคุณมีไฟล์ที่ใหญ่กว่าให้ลองวิธีอื่นด้านล่าง เลือกไฟล์ของคุณแล้วคลิก ส่งไฟล์ ปุ่ม. โดยปกติผลลัพธ์จะเร็วมากและคุณควรเห็นตัวอย่างข้อความเมื่อคุณคลิกที่แท็บ Text.

    นอกจากนี้ยังเป็นประโยชน์อย่างมากที่จะดึงภาพออกจากไฟล์ PDF ด้วยเช่นกันในกรณีที่คุณต้องการ! โดยรวมแล้วเครื่องมือออนไลน์ใช้งานได้ดี แต่ฉันพบเอกสาร PDF สองไฟล์ที่ให้ผลลัพธ์ที่ตลก ข้อความถูกดึงออกมาได้ดี แต่ด้วยเหตุผลบางอย่างมันจะมีการขึ้นบรรทัดใหม่หลังจากแต่ละคำ! ไม่ใช่ปัญหาใหญ่สำหรับไฟล์ PDF สั้น ๆ แต่แน่นอนปัญหาสำหรับไฟล์ที่มีข้อความจำนวนมาก หากเกิดขึ้นกับคุณลองใช้เครื่องมือถัดไป.

    OCR ออนไลน์

    OCR ออนไลน์มักจะทำงานกับเอกสารที่ไม่ได้แปลงอย่างถูกต้องด้วย ExtractPDF ดังนั้นจึงเป็นความคิดที่ดีที่จะลองใช้บริการทั้งสองเพื่อดูว่าบริการใดบ้างที่ให้ผลลัพธ์ที่ดีกว่า OCR ออนไลน์ยังมีคุณสมบัติที่ดีกว่าที่สามารถพิสูจน์ได้ว่ามีประโยชน์สำหรับทุกคนที่มีไฟล์ PDF ขนาดใหญ่ที่ต้องการแปลงข้อความในหน้าไม่กี่หน้าแทนที่จะเป็นเอกสารทั้งหมด.

    สิ่งแรกที่คุณต้องการทำคือไปข้างหน้าและสร้างบัญชีฟรี มันค่อนข้างน่ารำคาญ แต่ถ้าคุณไม่ได้สร้างบัญชีฟรีมันจะแปลง PDF ของคุณเพียงบางส่วนแทนที่จะเป็นเอกสารทั้งหมด นอกจากนี้แทนที่จะสามารถอัปโหลดเอกสารได้เพียง 5 MB เท่านั้นคุณสามารถอัปโหลดได้สูงสุด 100MB ต่อไฟล์ด้วยบัญชี.

    ก่อนอื่นให้เลือกภาษาแล้วเลือกประเภทของรูปแบบผลลัพธ์ที่คุณต้องการสำหรับไฟล์ที่แปลงแล้ว คุณมีตัวเลือกสองทางและคุณสามารถเลือกได้มากกว่าหนึ่งตัวหากคุณต้องการ ภายใต้ เอกสารหลายหน้า, คุณสามารถเลือก หมายเลขหน้า จากนั้นเลือกเฉพาะหน้าที่คุณต้องการแปลง จากนั้นคุณเลือกไฟล์และคลิก แปลง!

    หลังจากการแปลงคุณจะเข้าสู่ส่วนเอกสาร (หากคุณลงชื่อเข้าใช้) ซึ่งคุณสามารถดูจำนวนหน้าที่ว่างที่เหลืออยู่และลิงก์เพื่อดาวน์โหลดไฟล์ที่แปลงแล้ว ดูเหมือนว่าคุณจะมี 25 หน้าฟรีต่อวันดังนั้นหากคุณต้องการมากกว่านั้นคุณจะต้องรอสักครู่หรือซื้อหน้าเพิ่ม.

    OCR ออนไลน์ทำงานได้อย่างยอดเยี่ยมในการแปลง PDF ของฉันเพราะมันสามารถรักษาเค้าโครงที่แท้จริงของข้อความได้ ในการทดสอบของฉันฉันเอาเอกสาร Word ที่ใช้กระสุนขนาดตัวอักษรที่แตกต่างกัน ฯลฯ และแปลงเป็น PDF จากนั้นฉันใช้ Online OCR เพื่อแปลงกลับเป็นรูปแบบ Word และประมาณ 95% เหมือนกับต้นฉบับ มันค่อนข้างน่าประทับใจสำหรับฉัน.

    นอกจากนี้หากคุณต้องการแปลงภาพเป็นข้อความแล้ว Online OCR สามารถทำเช่นนั้นได้อย่างง่ายดายเหมือนกับการแยกข้อความจากไฟล์ PDF.

    ฟรี OCR ออนไลน์

    ตั้งแต่พูดถึงภาพเป็นข้อความ OCR ให้ฉันพูดถึงอีกเว็บไซต์ที่ดีที่ทำงานได้ดีกับภาพ ฟรี OCR ออนไลน์นั้นดีมากและถูกต้องมากเมื่อทำการแยกข้อความจากภาพทดสอบของฉัน ฉันถ่ายรูปสองรูปจาก iPhone ของฉันจากหน้าหนังสือแผ่นพับ ฯลฯ และฉันรู้สึกประหลาดใจที่สามารถแปลงข้อความได้ดี.

    เลือกไฟล์ของคุณจากนั้นคลิกปุ่มอัพโหลด ในหน้าจอถัดไปมีตัวเลือกอยู่สองสามตัวและตัวอย่างของรูปภาพ คุณสามารถครอบตัดมันถ้าคุณไม่ต้องการ OCR ทั้งหมด จากนั้นเพียงคลิกปุ่ม OCR และข้อความที่แปลงแล้วของคุณจะปรากฏใต้ภาพตัวอย่าง นอกจากนี้ยังไม่มีข้อ จำกัด ใด ๆ ซึ่งเป็นสิ่งที่ดีจริงๆ.

    นอกเหนือจากบริการออนไลน์แล้วยังมีตัวแปลง PDF ฟรีแวร์สองตัวที่ฉันต้องการพูดถึงในกรณีที่คุณต้องการซอฟต์แวร์ที่ทำงานอยู่ในเครื่องคอมพิวเตอร์ของคุณเพื่อทำการแปลง ด้วยบริการออนไลน์คุณจะต้องเชื่อมต่ออินเทอร์เน็ตอยู่เสมอและอาจเป็นไปไม่ได้สำหรับทุกคน อย่างไรก็ตามฉันสังเกตเห็นว่าคุณภาพของการแปลงจากโปรแกรมฟรีแวร์นั้นแย่กว่าของเว็บไซต์อย่างมาก.

    A-PDF Text Extractor

    A-PDF Text Extractor เป็นฟรีแวร์ที่ทำงานได้ค่อนข้างดีในการแยกข้อความออกจากไฟล์ PDF เมื่อคุณดาวน์โหลดและติดตั้งให้คลิกปุ่มเปิดเพื่อเลือกไฟล์ PDF ของคุณ จากนั้นคลิกแยกข้อความเพื่อเริ่มกระบวนการ.

    มันจะขอให้คุณเก็บไฟล์เอาท์พุทข้อความจากนั้นมันก็จะเริ่มแตกไฟล์ คุณยังสามารถคลิกที่ ตัวเลือก ปุ่มซึ่งช่วยให้คุณเลือกเฉพาะบางหน้าเพื่อแยกและประเภทการแยก ตัวเลือกที่สองน่าสนใจเพราะมันแยกข้อความในเลย์เอาต์ที่แตกต่างกันและมันคุ้มค่าที่จะลองทั้งสามเพื่อดูว่าอันไหนให้ผลลัพธ์ดีที่สุด.

    นักบิน PDF2Text

    PDF2Text Pilot ทำงานได้ดีในการแยกข้อความ ไม่มีตัวเลือกใด ๆ คุณเพียงแค่เพิ่มไฟล์หรือโฟลเดอร์แปลงและหวังว่าจะดีที่สุด มันทำงานได้ดีใน PDF บางส่วน แต่ส่วนใหญ่มีปัญหามากมาย.

    เพียงคลิกเพิ่มไฟล์จากนั้นคลิก แปลง. เมื่อการแปลงเสร็จสมบูรณ์คลิกที่เรียกดูเพื่อเปิดไฟล์ ไมล์สะสมของคุณจะแตกต่างกันไปเมื่อใช้โปรแกรมนี้ดังนั้นอย่าคาดหวังมาก.

    นอกจากนี้ควรพูดถึงว่าหากคุณอยู่ในสภาพแวดล้อมขององค์กรหรือสามารถคัดลอก Adobe Acrobat จากที่ทำงานคุณก็จะได้รับผลลัพธ์ที่ดีกว่ามาก เห็นได้ชัดว่า Acrobat นั้นไม่มีค่าใช้จ่าย แต่มีตัวเลือกในการแปลง PDF เป็น Word, Excel และ HTML นอกจากนี้ยังทำงานได้ดีที่สุดในการรักษาโครงสร้างของเอกสารต้นฉบับและแปลงข้อความที่ซับซ้อน.