Selasa, 12 Oktober 2010

Membaca File PostScript dan PDF dengan Terminal

DHOCNETSAFE
Kemaren pas lagi mainan Terminal, eh kepikiran tiba-tiba..., gimana ya caranya baca file PDF pake terminal ???
Nah lhoh.... puyeng lagi neh..... (@.@)!

Waktu itu, cuman satu cara yang bisa dilakukan. Hhmmm... tanya langsung di sistem!
Maklum, lagi cekak. No pulsa wat browsing, no money wat ke warnet, yawdalah... kalo gak ada mau diapain lagi, hiks ... (+.+)' 

Kayak lagi make google, macem-macem keyword dicoba'in di terminal....

$ man -k pdf | grep view
$ man -k pdf | grep show
$ man -k pdf | grep open
$ echo 'ketikan selanjutnya disensor uey, puanjang bgt ... (o,0)!'
ketikan selanjutnya disensor uey, puanjang bgt ... (o,0)!
$ _



Setelah beberapa lama melakukan searching, dapet yang kayak gini...,

pdftohtml []         (1)  - program to convert pdf files into html, xml and png images

Heheheheh.... udah jelas banget kalo file *.PDF gak bisa dibuka pake terminal. Jadi diakalin aja, dikonvert dulu ke berkas yang lain trus dibuka pake aplikasi yang lain juga ... :P

Perintahnya:

$ pdftohtml -q -p -c -i -noframes

Abis itu file hasil konvertnya dibuka pake links, lynx, w3m atau yang lainya terserah lah...

$ lynx file-out.html

Keterangan:

cupucupu@tuxventura:~$ pdftohtml -h
pdftohtml version 0.12.4
Copyright 2005-2009 The Poppler Developers - http://poppler.freedesktop.org
Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch
Copyright 1996-2004 Glyph & Cog, LLC

Usage: pdftohtml [options] [ ]
  -f           : first page to convert
  -l           : last page to convert
  -q                : don't print any messages or errors        <- kita pake ini
  -h                : print usage information
  -help             : print usage information
  -p                : exchange .pdf links by .html              <- ini juga
  -c                : generate complex document                 <- ini,
  -i                : ignore images                             <- ini,
  -noframes         : generate no frames                        <- dan ini
  -stdout           : use standard output
  -zoom         : zoom the pdf document (default 1.5)
  -xml              : output for XML post-processing
  -hidden           : output hidden text
  -nomerge          : do not merge paragraphs
  -enc      : output text encoding name
  -dev      : output device name for Ghostscript (png16m, jpeg etc)
  -v                : print copyright and version info
  -opw      : owner password (for encrypted files)
  -upw      : user password (for encrypted files)
  -nodrm            : override document DRM settings



-q                  -> agar pesan error tidak ditampilkan
-p                  -> translate hyperlink versi pdf menjadi versi html
-c                  -> no comments! ... :D
-i                  -> no images. pake terminal kok bukaknya... :D
-noframes    -> biar jadi single html

Agar lebih mudah, kita bisa mengetikan perintahnya dalam satu baris saja seperti ini misalnya,...

$ pdftohtml -q -p -c -i -noframes filein.pdf fileout.html && lynx fileout.html && rm fileout.html

Logikanya kek gini,
    konvert dulu ke html -> lalu buka hasilnya dengan lynx -> setelah lynx keluar, hapus file htmlnya biar gak jadi sampah, :)





Tekan Q lalu [Enter] untuk keluar...

Untuk file PostScript nya, rada panjang nih perintahnya. Soalnya kita nambah program lagi 1 (satu). Namanya ps2pdf

ps2pdf []            (1)  - Convert PostScript to PDF using ghostscript


Perintahnya jadi seperti ini,

$ ps2pdf filein.ps fileout.pdf && pdftohtml -q -p -c -i -noframes fileout.pdf fileout.html && lynx fileout.html && rm fileout.html



Logikanya sama seperti diatas, hanya saja lebih panjang karena proses konversinya dilakukan 2 (dua) kali :D

Tips:
    Agar lebih mudah penggunaanya, kita bisa membuatkan sebuah script sederhana dan meletakanya di direktori /bin atau /usr/bin. Gambar dibawah adalah script yang saya buat menggunakan script python dan saya letakan di /usr/bin (saya beri nama redpdf :P). Jadi saya bisa menggunakanya dari mana saja tanpa harus menuliskan path lengkap tempat script disimpan... :)

 

Bagi yang tertarik dengan RedPDF, bisa ditemukan disini: http://sites.google.com/site/cuputoyz/pub/redpdf

Semoga bermanfaat, ;)


Artikel Terkait

Leave a Reply

Subscribe to Posts | Subscribe to Comments