5 บริการ OCR ออนไลน์ฟรีที่ผ่านการทดสอบและตรวจทานแล้ว

มีเอกสาร PDF(PDF document)หรือรูปภาพที่คุณต้องการแปลงเป็นข้อความหรือไม่? เมื่อเร็ว ๆ นี้มีคนส่งเอกสารให้ฉันทางไปรษณีย์ซึ่งฉันต้องแก้ไขและส่งกลับพร้อมการแก้ไข บุคคลนั้นไม่สามารถค้นหาสำเนาดิจิทัลได้ ดังนั้นฉันจึงได้รับมอบหมายให้นำข้อความทั้งหมดนั้นมาอยู่ในรูปแบบดิจิทัล

ไม่มีทางที่ฉันจะต้องใช้เวลาหลายชั่วโมงในการพิมพ์ทุกอย่างกลับเข้าไป ดังนั้นฉันจึงลงเอยด้วยการถ่ายภาพเอกสารคุณภาพสูง จากนั้นจึงเผาวิธีของฉันผ่าน บริการ OCR ออนไลน์จำนวนมาก เพื่อดูว่าอันไหนดีที่สุด ผล.

ในบทความนี้ ผมจะพูดถึงสองเว็บไซต์โปรดของผมสำหรับOCRที่ให้บริการฟรี เป็นที่น่าสังเกตว่าเว็บไซต์เหล่านี้ส่วนใหญ่ให้บริการพื้นฐานฟรี และมีตัวเลือกที่ต้องชำระเงิน หากคุณต้องการคุณสมบัติพิเศษ เช่น รูปภาพที่ใหญ่ขึ้น เอกสาร PDF หลายหน้า ภาษาสำหรับการป้อนที่แตกต่างกัน เป็นต้น

คุณควรทราบล่วงหน้าด้วยว่าบริการเหล่านี้ส่วนใหญ่จะไม่ตรงกับการจัดรูปแบบของเอกสารต้นฉบับของคุณ เหล่านี้ส่วนใหญ่ใช้สำหรับการแยกข้อความและนั่นแหล่ะ หากคุณต้องการให้ทุกอย่างอยู่ใน เลย์เอาต์ หรือรูปแบบ(layout or format) เฉพาะ คุณจะต้องทำด้วยตนเองเมื่อคุณได้รับข้อความทั้งหมดจากOCR

นอกจากนี้ ผลลัพธ์ที่ดีที่สุดในการรับข้อความจะมาจากเอกสารที่มีความละเอียด 200 ถึง400 DPI (DPI resolution)หากคุณมีภาพ DPI(DPI image) ต่ำ ผลลัพธ์จะไม่ดีเท่า

สุดท้าย มีไซต์มากมายที่ฉันทดสอบแต่ใช้งาน(t work)ไม่ได้ หากคุณใช้OCR ออนไลน์ฟรี ใน Google คุณจะเห็นเว็บไซต์จำนวนมาก แต่เว็บไซต์หลายแห่งในผลลัพธ์ 10 อันดับแรกยังแปลงไม่เสร็จ บางส่วนจะหมดเวลา อื่นๆ อาจมีข้อผิดพลาด และบางอันก็ติดอยู่ที่หน้า "การแปลง" ดังนั้นฉันจึงไม่ต้องพูดถึงไซต์เหล่านั้นด้วยซ้ำ

สำหรับแต่ละไซต์ ฉันทดสอบเอกสารสองฉบับเพื่อดูว่าผลลัพธ์จะออกมาดีเพียงใด สำหรับการทดสอบของฉัน ฉันเพียงแค่ใช้iPhone 5Sถ่ายรูปเอกสารทั้งสอง แล้วอัปโหลดไปยังเว็บไซต์โดยตรงเพื่อทำการแปลง

ในกรณีที่คุณต้องการดูว่ารูปภาพที่ฉันใช้ทดสอบเป็นอย่างไร ฉันได้แนบมาไว้ที่นี่: Test1และTest2 โปรดทราบว่ารูปภาพเหล่านี้ไม่ใช่เวอร์ชันความละเอียดเต็มของรูปภาพที่ถ่ายจากโทรศัพท์ ฉันใช้ภาพความละเอียด(resolution image) เต็ม เมื่ออัปโหลดไปยังไซต์

ออนไลน์OCR

OnlineOCR.netเป็นไซต์ที่สะอาดและเรียบง่ายซึ่งให้ผลลัพธ์ที่ดีมากในการทดสอบของฉัน สิ่งสำคัญที่ฉันชอบเกี่ยวกับมันคือไม่มีโฆษณามากมายทั่วทุกแห่ง ซึ่งมักจะเป็นกรณีของไซต์บริการเฉพาะ ประเภทนี้(niche service)

ออนไลน์ฟรี ocr

ในการเริ่มต้น ให้เลือกไฟล์ของคุณและรอจนกว่า(file and wait till)การอัปโหลดจะเสร็จสิ้น ขนาดอัปโหลดสูงสุดสำหรับไซต์นี้คือ 100 MB หากคุณลงทะเบียนสำหรับบัญชีฟรี คุณจะได้รับคุณสมบัติพิเศษบางอย่าง เช่น ขนาดการอัปโหลดที่ใหญ่ขึ้น, PDF(PDFs) หลายหน้า ภาษาสำหรับการป้อนที่แตกต่างกัน, การแปลงที่เพิ่มขึ้นต่อชั่วโมง เป็นต้น

ถัดไป เลือกภาษาสำหรับการป้อนข้อมูล(input language)จากนั้นเลือก รูป แบบผลลัพธ์ (output format)คุณสามารถเลือกจากWord , Excelหรือข้อความ(Plain Text)ธรรมดา คลิก(Click)ปุ่มแปลง(Convert) แล้วคุณจะเห็นข้อความแสดงอยู่ที่ด้าน ล่างในกล่องพร้อมกับลิงก์ดาวน์โหลด(download link)

ocr เอาต์พุต

ถ้าคุณต้องการเพียงแค่ข้อความ ให้คัดลอกและวาง(copy and paste)จากกล่อง อย่างไรก็ตาม เราขอแนะนำให้คุณดาวน์โหลดเอกสาร Word(Word document)เพราะมันสามารถรักษาเลย์เอาต์ของเอกสารต้นฉบับได้อย่างดีเยี่ยม

ตัวอย่างเช่น เมื่อฉันเปิดเอกสาร Word(Word document)สำหรับการทดสอบครั้งที่สอง ฉันรู้สึกประหลาดใจที่พบว่าเอกสารมีตารางที่มีสามคอลัมน์ เช่นเดียวกับในภาพ

เอาต์พุต ocr ออนไลน์

จากไซต์ทั้งหมด ไซต์นี้ดีที่สุดแล้ว การลงทะเบียนเป็นสิ่งที่คุ้มค่าอย่างยิ่งหากคุณต้องการทำ Conversion เป็นจำนวนมาก

เพื่อความสมบูรณ์ ฉันจะลิงก์ไปยังไฟล์ผลลัพธ์ที่สร้างโดยแต่ละบริการด้วย เพื่อให้คุณสามารถดูผลลัพธ์ได้ด้วยตนเอง นี่คือผลลัพธ์จากOnlineOCR : Test1 Doc และTest2 Doc(Test1 Doc and Test2 Doc)

โปรดทราบว่าเมื่อเปิด เอกสาร Word เหล่านี้ บนคอมพิวเตอร์ของคุณ คุณจะได้รับข้อความในWordที่ระบุว่ามาจากอินเทอร์เน็ตและการแก้ไข(Internet and editing)ถูกปิดใช้งาน นั่นเป็นเรื่องปกติเพราะWord ไม่(Word doesn)เชื่อถือเอกสารจากอินเทอร์เน็ต(Internet)และคุณไม่จำเป็นต้องเปิดใช้งานการแก้ไขจริงๆ หากคุณต้องการดูเอกสาร

i2OCR

อีกไซต์ที่ให้ผลลัพธ์ค่อนข้างดีคือi2OCR ขั้นตอนคล้ายกันมาก: เลือกภาษา ไฟล์แล้วกดExtract Text

i2ocr

คุณจะต้องรอหนึ่งหรือสองนาทีที่นี่ เนื่องจากไซต์นี้ใช้เวลานานกว่าเล็กน้อย นอกจากนี้ ในขั้นตอนที่ 2(Step 2)ตรวจสอบให้แน่ใจว่ารูปภาพของคุณแสดงทางด้านขวาในการแสดงตัวอย่าง มิฉะนั้น คุณจะได้รับคำที่พูดไม่ชัดเป็นผลลัพธ์ ด้วยเหตุผลบางอย่าง รูปภาพจาก iPhone ของฉันแสดงในโหมดแนวตั้ง(portrait mode)บนคอมพิวเตอร์ของฉัน แต่เป็นแนวนอนเมื่อฉันอัปโหลดไปยังไซต์นี้

เอาต์พุต i2ocr

ฉันต้องเปิดรูปภาพด้วยตนเองในแอปแก้ไขรูปภาพ หมุน 90 องศา จากนั้นหมุนกลับเป็นแนวตั้งแล้วบันทึกอีกครั้ง เมื่อ(Once) เสร็จแล้ว เลื่อนลง มาจะแสดงตัวอย่างข้อความพร้อมกับปุ่มดาวน์โหลด(download button)

ไซต์นี้แสดงผลได้ค่อนข้างดีสำหรับการทดสอบครั้งแรก แต่ทำได้ไม่ดีนักกับการทดสอบครั้งที่สองที่มี รูป แบบคอลัมน์ (column layout)นี่คือผลลัพธ์จาก i2OCR: Test1 Doc และTest2 Doc(Test1 Doc and Test2 Doc)

FreeOCR

Free-OCR.comจะนำรูปภาพของคุณและแปลงเป็นข้อความ(plain text)ธรรมดา ไม่มีตัวเลือกในการส่งออกไปยัง รูป แบบWord (Word format)เลือกไฟล์ของคุณ เลือกภาษา จากนั้นคลิกเริ่ม(Start)

ไซต์นั้นรวดเร็วและคุณจะได้ผลลัพธ์ค่อนข้างเร็ว เพียงคลิก(Just click)ที่ลิงค์เพื่อดาวน์โหลดไฟล์ข้อความ(text file)ลงในคอมพิวเตอร์ของคุณ

freeocr

เช่นเดียวกับNewOCR ที่(NewOCR)กล่าวถึงด้านล่าง ไซต์นี้ใช้ตัว T ทั้งหมดในเอกสารเป็นตัวพิมพ์ใหญ่ ฉันไม่รู้ว่าทำไมมันถึงทำอย่างนั้น แต่ด้วยเหตุผลแปลก ๆ บางอย่างที่ไซต์นี้และ NewOCR(site and NewOCR)ทั้งสองทำเช่นนี้ การเปลี่ยนแปลงไม่ใช่เรื่องใหญ่ แต่เป็นกระบวนการที่น่าเบื่อที่คุณไม่ควรทำจริงๆ

นี่คือผลลัพธ์จากFreeOCR : Test1 Doc และTest2 Doc(Test1 Doc and Test2 Doc)

ABBYY FineReader ออนไลน์

เพื่อที่จะใช้FineReader Onlineคุณต้องลงทะเบียนสำหรับบัญชี ซึ่งจะทำให้คุณได้ทดลองใช้OCR ฟรี 15 วัน มากถึง 10 หน้าฟรี หากคุณต้องการทำOCR แบบครั้งเดียว สำหรับสองสามหน้า คุณสามารถใช้บริการนี้ได้ ตรวจสอบ ให้(Make)แน่ใจว่าคุณคลิกลิงก์(verify link) ยืนยัน ในอีเมลยืนยัน(confirmation email)หลังจากที่คุณลงทะเบียน

Finereader ออนไลน์

คลิกรู้จัก(Recognize)ที่ด้านบน แล้วคลิกอัปโหลด(Upload)เพื่อเลือกไฟล์ของคุณ เลือกภาษา รูปแบบผลลัพธ์ของคุณ แล้วคลิกรู้จัก(Recognize)ที่ด้านล่าง ไซต์นี้มีอินเทอร์เฟซที่สะอาดและไม่มีโฆษณาด้วย

ในการทดสอบของฉัน ไซต์นี้สามารถดึงข้อความจากเอกสารทดสอบฉบับ(test document) แรก ได้ แต่มันมีขนาดใหญ่มากเมื่อฉันเปิดเอกสาร Word(Word doc)ดังนั้นฉันจึงลงเอยอีกครั้งและเลือกข้อความธรรมดา(Plain Text)เป็น รูป แบบผลลัพธ์(output format)

สำหรับการทดสอบครั้งที่สองกับคอลัมน์เอกสาร Word(Word document)ว่างเปล่าและฉันหาข้อความไม่พบ ไม่แน่ใจว่าเกิดอะไรขึ้นที่นั่น แต่ดูเหมือนจะไม่สามารถจัดการอะไรได้นอกจากย่อหน้าธรรมดาๆ นี่คือผลลัพธ์จากFineReader : Test1 Doc และ Test2 Doc

ใหม่OCR

ไซต์ถัดไปNewOCR.com ใช้ได้(NewOCR.com)แต่ไม่ค่อยดีเท่าไซต์แรก ประการแรก มีโฆษณา แต่โชคดีที่ไม่มีอะไรมาก คุณเลือกไฟล์ของคุณก่อนแล้วจึงคลิกปุ่มแสดงตัวอย่าง(Preview)

อัพโหลดภาพ

จากนั้นคุณสามารถหมุนภาพและปรับพื้นที่ที่คุณต้องการสแกนหาข้อความ มันค่อนข้างเหมือนกับกระบวนการสแกน(scanning process) ที่ ทำงานบนคอมพิวเตอร์ที่มีเครื่องสแกนที่แนบมา

ocr ภาพ

ถ้าเอกสารมีหลายคอลัมน์ คุณสามารถตรวจสอบ ปุ่ม การวิเคราะห์เค้าโครงหน้า( Page layout analysis)ได้ และจะพยายามแยกข้อความออกเป็นคอลัมน์ คลิก(Click)ปุ่มOCR(OCR button)รอสักครู่เพื่อให้เสร็จสิ้น จากนั้นเลื่อนลงไปด้านล่างเมื่อหน้ารีเฟรช

ในการทดสอบครั้งแรก ได้ข้อความทั้งหมดอย่างถูกต้อง แต่ด้วยเหตุผลบางอย่าง T ทุกตัวในเอกสารเป็นตัวพิมพ์ใหญ่! ไม่รู้ว่าทำไมมันถึงทำอย่างนั้น แต่มันก็ทำ ในการทดสอบครั้งที่สองโดย เปิดใช้ การวิเคราะห์หน้า(page analysis)ได้ข้อความส่วนใหญ่ แต่เลย์เอาต์ปิดไปโดยสิ้นเชิง

นี่คือผลลัพธ์จากNewOCR : Test1 Doc และ Test2 Doc

บทสรุป

อย่างที่คุณเห็น ฟรีไม่ได้ให้ผลลัพธ์ที่ดีจริงๆ เกือบตลอดเวลาอย่างน่าเสียดาย ไซต์แรกที่กล่าวถึงเป็นไซต์ที่ดีที่สุด เนื่องจากไม่เพียงแต่สามารถจดจำข้อความทั้งหมดได้อย่างดีเยี่ยมเท่านั้น แต่ยังสามารถรักษารูปแบบของเอกสารต้นฉบับได้อีกด้วย

หากคุณต้องการเพียงแค่ข้อความ เว็บไซต์ส่วนใหญ่ข้างต้นควรจะทำสิ่งนั้นให้คุณได้ หากคุณมีคำถามใด ๆ โปรดแสดงความคิดเห็น สนุก!



About the author

ฉันเป็นผู้ตรวจทานมืออาชีพและเพิ่มประสิทธิภาพการทำงาน ฉันชอบใช้เวลาออนไลน์เล่นวิดีโอเกม สำรวจสิ่งใหม่ ๆ และช่วยเหลือผู้คนเกี่ยวกับความต้องการด้านเทคโนโลยีของพวกเขา ฉันมีประสบการณ์กับ Xbox มาบ้างแล้วและได้ช่วยเหลือลูกค้าในการรักษาระบบของพวกเขาให้ปลอดภัยมาตั้งแต่ปี 2552



Related posts