Showing posts with label pdf. Show all posts
Showing posts with label pdf. Show all posts

Tuesday, November 29, 2016

ทำอีบุ๊ค - รายการอาหารประจำวัน

คนแก่อย่างผมยังใช้ระบบสื่อสารแบบเก่าอยู่...วันนี้ได้รับจดหมายจากพี่ดำรงอีกครั้ง คราวนี้ส่งมาในซองขนาดใหญ่!


ไปรษณีย์ทุกวันนี้คิดค่าส่งพัสดุหรือจดหมายลงทะเบียนด่วนค่อนข้างแพง ถ้าไม่จำเป็นจริง ๆ แล้ว ผมก็ไม่ใช้บริการ ครั้นจะส่งแบบธรรมดาติดแสตมป์ ๓ บาท ก็รู้สึกว่าจะใช้เวลาเดินทางถึงมือผู้รับนานกว่าในอดีต ยิ่งถ้าหย่อนจดหมายลงตู้ไปรษณีย์ เผลอ ๆ อาจหายต๋อม!  

จดหมายซองใหญ่ที่ได้รับ ผมเห็นติดแสตมป์ ๖ บาท อยากรู้ว่าจากกรุงเทพฯ ถึงห้างฉัตรใช้เวลาเดินทางกี่วัน แต่ไปรษณีย์ไม่ได้ประทับตรา (คงจะลืม) ผมจึงมิอาจทราบได้!  แกะดูข้างใน นอกจากจดหมายแล้วยังพบถุงข้าวเปลือกพระราชทานใส่มาด้วย ๑ ถุง พี่ดำรงบอกว่าอยากให้ผมทดลองปลูกในกระถางบนดาดฟ้า...


ขอกราบขอบพระคุณพี่ดำรง จะทำตามครับ...ได้ผลอย่างไรจะเขียนเล่าให้ทราบ


เมื่อวันที่ ๑๐-๑๑ พ.ย. ผมได้เขียนแนะนำเรื่องการแปลงไฟล์ให้เป็น pdf โดยใช้โปรแกรม ABBYY FineReader 12 และโปรแกรม Arn Thai 2.5 (Lite) พี่ดำรงได้ลองทำดูแล้วแต่ไม่สำเร็จ จึงอยากให้ผมช่วยทำให้กับหนังสือ "รายการอาหารประจำวัน สำหรับครอบครัว"


วันนี้หลังจากทาสีห้องสอนดนตรีที่ชั้นลอย ผมได้ใช้เวลาประมาณ ๕ ชั่วโมงสแกนหนังสือหนา ๔๐๒ หน้าแล้วทำให้เป็น e-book โดยใช้โปรแกรม ABBYY FineReader 12 เสร็จเรียบร้อยเวลาประมาณ ๒ ทุ่ม...


ใช้โปรแกรม ABBYY FineReader 12  ค่อนข้างง่ายครับ เพราะมี option ให้เลือกไฟล์ที่จะมาแปลงจากเครื่องสแกนได้เลย...


หนังสือหนาไม่สามารถสแกนได้ ผมต้องฉีกออกแล้ววางบนเครื่องสแกนทีละแผ่น 


สแกนทีละหน้าก็ต้องดูให้ดี ไม่งั้นจะสลับหน้า นอกจากนั้นยังต้องวางให้ตรงด้วย อย่าให้กลับหัวกลับหาง หุหุ...๔๐๒ หน้า ผมเผลอไม่ได้เลย  

โปรแกรมมีให้ปรับ brightness ผมปรับให้สูงขึ้นอีก 25 % ผลสแกนออกมาจึงมีพื้นสีขาว ไม่ดำ และไม่ปรากฏตัวหนังสือจากด้านหลัง อาจจะซีดไปหน่อย แต่ปรับแต่งได้ครับ (ถ้ามีเวลา....)


สแกนได้ ๓๐ หน้าก็ crop ให้เหลือ 1734 x 2388 ซะที รายการอาหารประจำวัน ๑ ปี ผมต้องทำอย่างนั้น ๑๐ กว่าครั้ง เมื่อถึงแผ่นสุดท้ายหนังสือก็เหลืออยู่ในสภาพอย่างที่เห็น (จำเป็นต้องฉีกจริง ๆ ครับพี่ดำรง)


ABBYY FineReader 12  สามารถแปลงไฟล์ได้หลาย format คือ Searchable PDF, Image-Only PDF, Microsoft Word (docx & odt), Microsoft Excel, epub และอื่น ๆ  หลังจากสแกนและ crop เรียบร้อยทั้ง ๔๐๒ หน้า ผมเลือกที่จะแปลงและบันทึกให้เป็น Searchable PDF ก่อน ต้องใช้เวลาเกือบครึ่งชั่วโมงที่จะอ่านไฟล์แต่ละหน้าแล้วแปลงเป็น PDF  เรียบร้อยแล้วเปิดดูได้ด้วย Adobe Reader 9...


Searchable PDF นั้นสามารถทำไฮไลท์ copy แล้วนำไป paste ในโปรแกรมเวิร์ดได้ หนังสือทั้งเล่มแปลงเป็น Searchable PDF แล้วมีขนาด 33.2 MB  ไม่ทำเพียงอย่างเดียวครับ ผมยังแปลงเป็น Image-Only PDF (ไม่สามารถ copy & paste) ตัวนี้มีขนาด 44.5 MB  ทำเป็น e-pub ก็ได้นะ ขนาด 667 KB  หรือจะแปลงให้เป็นไฟล์เวิร์ดโดยตรงเลยก็ได้ ผมเลือกแปลงเป็น DOCX (Office Open XML Document) 1.74 MB และ ODT (Open Document Text) ขนาด 935 KB


ลองเปิดให้ดูใน word pad ได้ดังนี้...


ODT (Open Document Text)...



หนังสือเล่มนี้พี่ดำรงอนุญาตให้เพื่อน ๆ ดาวน์โหลดไปอ่านได้ ผมอัพโหลดไว้ให้แล้ว ใครอยากได้ไปอ่านก็เลือกคลิกเอานะครับ
รายการอาหารประจำวัน.pdf  (33.27 MB)   download
รายการอาหารประจำวัน สำหรับครอบครัว.pdf  (44.55 MB)    download
รายการอาหารประจำวัน.-epub  (667 KB)   download
โห...กว่าจะเขียนบล็อกเสร็จตีหนึ่งพอดี บ้ายบายครับ!

Thursday, November 10, 2016

ABBYY FineReader 12

พี่ดำรงเพื่อนสมาชิกผู้ใจดี เคยส่งหนังสือให้ผม ๑ เล่ม มีชื่อว่า "รายการอาหารประจำวันสำหรับครอบครัว" เป็นหนังสือเกี่ยวกับโภชนาการ หนา ๔๐๒ หน้า!




วันก่อนผมได้รับจดหมายจากพี่ดำรงบอกว่าอยากจะปรับปรุงหนังสือเล่มนี้สำหรับปี ๒๕๖๐ แต่ไม่อยากคีย์ข้อมูลใหม่ ขอปรึกษาถึงวิธีการทำไฟล์ PDF ผมต้องกราบขอบคุณที่ให้เกียรติทั้ง ๆ ผมก็มิได้เป็นผู้เชียวชาญในด้านนี้แต่อย่างใด  


อย่างไรก็ตามในฐานะที่เคยทำหนังสือ "ข้ามน้ำสามทวีป" ให้เป็นไฟล์ PDF ก็เลยอยากจะเขียนแบ่งปันประสบการณ์ พร้อมกับแนะนำวิธีแปลงไฟล์แบบง่าย ๆ ตามสไตล์ช่างเหอะให้พี่ดำรงพอเป็นที่เข้าใจ...

สมัยนั้นซอฟแวร์ต่าง ๆ ยังมีไม่หลากหลาย ผมต้องสแกนหนังสือทีละหน้าแล้วปรับแต่งด้วย PhotoShop ให้ได้ไฟล์ JPG ที่ชัดเจนที่สุดเท่าที่ทำได้ ก่อนที่จะนำไฟล์ภาพไปเรียงในโปรแกรมทำให้เป็น PDF แต่ปัจจุบันนี้มีซอฟแวร์มากมายสำหรับทำไฟล์ PDF  วิธีทำก็มีสอนทั้งใน YouTube และตามเว็บต่าง ๆ ซึ่งผมจะไม่ขอกล่าวถึง อยากแนะนำให้ลองทำดูจะดีกว่า... 

ต้องเริ่มจากการทำไฟล์ภาพขึ้นมาก่อนโดยใช้เครื่องสแกนหรือกล้องถ่ายรูปคุณภาพดี ๆ สแกนหรือถ่ายภาพแต่ละหน้าแล้วนำไปปรับแต่งใน PhotoShop ให้ชัดเจนที่สุด ตัว PhotoShop เองสมัยนี้สามารถ save เป็นไฟล์ PDF ได้เลย

ถ้าสังเกตให้ดีเราจะพบว่าไฟล์ PDF ในอีบุคส์ทั่ว ๆ ไป ส่วนใหญ่สามารถ copy แล้วนำไป paste ลงในโปรแกรมเวิร์ดได้ เพราะเป็นไฟล์ PDF แบบ Searchable คือมี ๒ ชั้น (image และ text) แต่ในกรณีที่ผมสแกนจากหนังสือแล้วนำไฟล์ภาพไปแปลงจะได้ PDF แบบ read only คือไม่สามารถ copy แล้วนำไป paste ในโปรแกรมเวิร์ดได้โดยตรง จึงจำเป็นต้องใช้โปรแกรม OCR เข้ามาช่วย

หน้าที่ของเจ้าโปรแกรม OCR (Optical Character Recognition) คือแปลงไฟล์ภาพเอกสารให้เป็นไฟล์ข้อความโดยอัตโนมัติ สมัยก่อนแพงและหายากด้วย (ตอนนั้นเครื่องสแกนเนอร์ราคาเกือบหมื่น) แต่ทุกวันนี้มีให้ดาวน์โหลดมาใช้ฟรี ๆ ซึ่งโปรแกรม OCR สำหรับภาษาอังกฤษมีความถูกต้องแม่นยำสูงถึง 90 %  ส่วนของไทยก็ต้องขอบคุณผู้พัฒนาที่ทำให้มันสามารถอ่านภาษาไทยได้ถูกต้องอย่างน่าอัศจรรย์ ทั้ง ๆ ที่ภาษาไทยมีอักขระยุ่งยากกว่าภาษาอังกฤษ 

ในกรณีที่ไม่ต้องการแก้ไขข้อความ ก็ไม่ต้องนำมันไปผ่านโปรแกรม OCR เราสามารถทำหนังสือทั้งเล่มให้เป็น PDF ได้เหมือนกับที่ผมเคยทำกับหนังสือ "ข้ามน้ำสามทวีป" ซึ่งตอนนี้ไฟล์หายไปแล้ว (ฮา) 

มาดูขั้นตอนการแปลงไฟล์ของช่างเหอะหน่อยนะครับ....

ก่อนอื่นต้องดาวน์โหลดโปรแกรม OCR มาติดตั้งก่อน ของผมใช้ ABBYY FineReader 12 Professional ซึ่งมีให้โหลดฟรี  เป็นไฟล์ RAR ขนาด 337 MB นำมาติดตั้งไว้ได้เลย....

หน้าตาเป็นอย่างนี้ครับ...


อ่อ... ต้องสแกนหนังสือของพี่ดำรงมาเป็นตัวอย่างก่อน ๑ หน้า ผมเลือกหน้า ๓๕๖ เป็นรายการอาหารสำหรับวันที่ ๒๘ พฤศจิกายน  แต่งไฟล์ภาพใน PhotoShop แล้วนำมาเปิดในโปรแกรม OCR


เปิดขึ้นมาแล้วครับ ทางด้านขวาจะเห็นแถบให้เลือกแปลงไฟล์เป็น ๔ แบบคือ Searchable PDF, Image-Only PDF, Microsoft Word และ Image File ผมลองแปลงให้เป็น Microsoft Word ก่อนนะครับ

ได้แล้วก็นำมาเปิดใน WordPad  ดังนี้...


เห็นได้ว่าอ่านภาษาไทยได้ไม่ถูกต้องดังนี้...
วันที่ 28 พฤศจิกายน พ.ศ. 2550
อาหารเซา
ราวกลองสวย
แกงจตเต่าต่ขาว
มิคไ}วยเล้ง
ไขหะไล้
กล้วยบาล้า
นม/โย;กํรํค (ตามรอบ)
กาแฟ หรอ รา (คามขอบ)
อาหารกตางวัน
กำยเลี๋ยวผัคใVเข
ๅนน้าส์อม
กาแฟเยํน อาหารเซน
ล้าวกล้องตาย
ลาหนอ
ผํ'คถั่วแรกกันหน
คมร่าไก่
ปตาไฬทอค
ผลไม้
ของหวาน
วาทะล้ายฟารับ
ธุรการการกอตรำง ธุคศาม้
เพยงจะมิมากมา นะนน
แรงราตปราคทุนกา ระสฤษด ไต่ฤา
ลนกํข้นทร้ฑยซั๊น ธุคเซึ้อมเออมโไมล
สๆแท?*ฬเรนํฬน* เรระราขวรวงต่ร© กรง/หนนทิท1ทลงกรณ
ผมไม่โทษโปรแกรม เพราะภาพที่สแกนได้นั้นไม่ค่อยชัดเจน และตัวหนังสือในหนังสือก็ค่อนข้างเล็กด้วย โปรแกรม OCR เลยงง... อ่านผิดเยอะ!!  เพื่อพิสูจน์ความสามารถของเจ้า ABBYY FineReader 12 ผมหันไปคว้าหนังสือ "ยาแก้ป่วย" ของเอจังมาจากหิ้ง...



ตัวหนังสือใหญ่ดี ผมสแกนมา ๑ หน้าดังนี้...


นำมาเปิดในโปรแกรม OCR


คลิกแปลงให้เป็นไฟล์ Microsoft Word ลองดูซิว่าจะอ่านผิดมากน้อยแค่ไหน?


อ่านถูกเกือบหมดดังนี้...
ไปหาหมอ รอก็นาน ได้ยามาเหมีอนเดิม ชี้อก็นเองไม่ได้หรีอ ?
ที่เป็นเช่นนี้เพราะแพทย์ต้องการติดตามผล เพื่อดูว่ายาที่ให้ใน ลามารถควบคุมอาการได้หรือเปล่า มีผลข้างเคียงจากยาหรือไม ถ้าควบคุมอาการได้ดี แพทย์ก็จะจ่ายยาเหมือนเก่า
หากไม่อยากไปพบแพทย์ หรือต้องการซื้อยาเอง ให้ปรึกษาแพทย์ ประจำตัวก่อน และอย่าลืมว่าแม้แพทย์ประจำตัวจะอนุญาตให้ซื้อยาใข้ เองได้ แต่ก็ยังต้องไปพบแพทย์เพื่อติดตามผลเป็นระยะตามเวลานัด
แก้ไขได้
สุขภาพต้องอาคัยการสร้างเลริม โรงพยาบาลเป็นเพียงปลายทาง สำหรับบำรุงรักษา ซ่อมแซม บางอย่างก็ฃ่อมได้ บางอย่างก็ซ่อมไม่ได้
อย่าหวังพึ่งยาแต่เพียงอย่างเดียว เพราะยาเป็นเพียงการแก้ไขที่ ปลายเหตุแค่ช่วยควบคุมหรือชะลออาการของโรคไม่ให้ทรุดลงไปกว่าเติม ขอให้จำไว้ว่ายาทุกชนิดล้วนมีผลข้างเคียง และยาที่มีอยู่ในปัจจุบัน ไม่ลามารถรักษาโรคได้ทุกอย่าง ความรู้ทางการแพทย์ในปัจจุบัน ยังไม่ สามารถเอาฃนะโรคได้ทั้งหมด
ขอ1ให้ผู้ปวยเปิด'ใจ และรับฟัง เอาซนะความอยากของตัวเอง ไม่เบียดเบียนตนเองเพราะความอยาก ความเกียจคร้าน และความนักง่าย ที่ติดเป็นนิสัย เพราะความเจ็บปวยของท่านไม่เพียงเบียดเบียนตนเอง แต่ในบางครั้งยังเบียดเบียนผู้อื่นอีกด้วยทั้งลร้างความกังวลให้กับคนที่รัก สร้างภาระค่าใช้จ่ายให้กับครอบครัวและประเทศชาติ
ทีนี้ก็ลองแปลงให้เป็นไฟล์แบบ Searchable PDF ได้ดังนี้..


ไฟล์ PDF ตัวนี้แหละที่สามารถ copy แล้วนำไป paste ลงในโปรแกรมเวิร์ดเพื่อแก้ไขได้ ลองให้ดูหน่อย...


เอาไป paste ให้ดูใน WordPad...


และใน Notepad...



พอดีคอมพ์ฯ ของผมไม่ได้ลง Microsoft Word เอาไว้  ลองแก้ไขใน WordPad ให้ดูละกัน...


ขอขอบคุณผู้พัฒนาโปรแกรม OCR อีกครั้งครับ!

Monday, July 06, 2015

The Notebook

เช้านี้ผมได้อ่านบทความเรื่อง "ภาพสุดท้าย-รักชั่วนิรันดร์!" จากเว็บข่าวสด...


ภาพจาก khaosod.co.th
...อาการของคุณตาอเล็กซานเดอร์กลับแย่ลงเรื่อย ๆ เช่นเดียวกับคุณยายเจเน็ตต์ที่ก็สุขภาพทรุดโทรมลงทุกนาที และในที่สุดคุณตาอเล็กซานเดอร์ก็เสียชีวิตลงในวันที่ 17 มิ.ย. ซึ่งคุณยายเจเน็ตต์แม้จะรู้อยู่เต็มอกว่าทุกอย่างสายเกินแก้แล้ว แต่เธอยังคงไม่ไปไหน ยังนอนจับมือแน่นกับร่างไร้วิญญาณของสามีเหมือนเดิม... และแล้วในวันรุ่งขึ้น คุณยายเจเน็ตต์ก็เสียชีวิตตามสามีโดยที่ยังคงกุมมือกันไว้แน่นไม่ปล่อย 
นี่คือเรื่องจริง...ไมใช่อิงนิยาย 



วันนี้ผมอยากเขียนเกี่ยวกับภาพยนต์เรื่อง The Notebook สักหน่อย (ว่าจะเขียนถึงตั้งนานแล้วแต่ไม่มีโอกาสซักกะที!)   The Notebook ภาพยนต์ปี 2004 สร้างจากนิยายของ Nicholas Sparks (1969) กำกับโดย Nick Cassavetes  นำแสดงโดย Ryan Gosling และ Rachel McAdams โดยมี James Garner รับบทพระเอกตอนแก่


ขออนุญาตไม่เขียนเกี่ยวกับเนื้อเรื่องและอื่น ๆ แต่อยากถือโอกาสนี้นำไฟล์ pdf  มาฝากเพื่อน ๆ ให้ได้โหลดไปอ่าน เพื่อเพิ่มอรรถรสในการดูภาพยนต์เรื่อง The Notebook
















ได้เห็นเรื่องจริงของคุณตาอเล็กซานเดอร์กับคุณยายเจเน็ตต์แล้ว ผมเพิ่มคะแนนให้ The Notebook อีก 0.5  กลายเป็น 8/10!