การแปลงเอกสาร CHM ไปเป็น PDF บน Linux

Posted by AnnoMundi on August 26, 2005

พอดีวันนี้ผมนั่งหา eBook ที่เคยโหลดๆมาอ่านก็พบว่าหลายๆไฟล์เป็นไฟล์ CHM
ซึ่งปกติเป็นเอกสารที่ใช้กันบน Windows แต่บังเเอิญผมใช้ Linux อยู่ ก็เลย
ต้องมานั่งหาวิธีที่จะอ่านไฟล์ CHM (Compiled Help Files) ซึ่งใน Linux ก็มี
อยู่หลายตัวที่ใช้เปิดไฟล์ CHM ก็คือ xchm, kchm และ pychm แต่ว่าบังเอิญ
ที่ทุกตัวดันเป็น Mask Package หมดเลยใน Gentoo Linux ซึ่งผมก็ไม่อย่าใช้
เพราะมันไม่ stable เอามากๆ

ก็เลยต้องหาวิธีแปลงไฟล์ CHM เป็นเอกสารชนิดอื่นซึ่งก็ search เจอในฟอรั่ม
ของ Gentoo เอง ต้องใช้ chmlib และ Htmldoc ซึ่ง chmlib จะ
แตกเอกสาร CHM เป็นไฟล์ HTML (และรูป) ส่วน HtmlDoc จะเปลี่ยนไฟล์
HTML เป็นเอกสาร PDF

ขั้นตอนการทำสำหรับ Gentoo ก็คือ
1. ลง chmlib และ htmldoc
emerge chmlib htmldoc

2. ใช้ chmlib แปลงไฟล์CHM เป็น HTML
chmextract ชื่อไฟล์.chm ไดเร็กทอรี่ปลายทาง
มันก็จะแตกไฟล์ CHM ไปยังไดเร็กทอรี่ที่เราระบุ ในไดเร็กทอรี่นั้นจะมีทั้งไฟล์
HTML และรูปอยู่หลายไฟล์ขึ้นอยู่กับไฟล์ CHM มีจำนวนหน้าอกสารมากน้อย
แค่ไหน

3. เรียกโปรแกรม htmldoc อาจเรียกผ่านทาง Terminal/Shell ก็ได้
htmldoc
โปรแกรมจะมีหน้าตาดังรูปล่างครับ

HTMLDOC
การใช้งานให้เรา Add ไฟล์ HTML เข้าไปโดยต้องระวังเรื่องลำดับเอกสาร HTML
ที่เรา Add เข้าไปไม่งั้นเวลาแปลงออกมาแล้วลำดับหน้าเอกสารอาจผิดได้
ตรง Document Type ให้เลือกเป็น Web Page นะครับ จากนั้นคลิ๊กที่
Tab Output เลือกชื่อไฟล์ที่จะเซฟ และเลือก Format ซึ่งก็ให้เลือกเป็น PDF
เมื่อเราเลือก Format เป็น PDF แล้วเราจะสามารถคลิ๊กไปที่ Tab PDF ได้
ซึ่งเราสามารถเลือกว่าจะแปลงเป็นเอกสาร PDF version ไหน เมื่อเรา
เซ็ตทุกอย่างเรียบร้อยก็กดปุ่ม Generate ได้เลยก็จะได้เอกสาร PDF ออกมา