Bandingkan PDF Secara Visual | Hackaday

Terkadang suatu masalah tampak sulit, tetapi wawasan yang tepat dapat membuatnya mudah. Jika Anda diminta untuk menulis program untuk membandingkan dua file PDF dan menunjukkan perbedaannya, menurut Anda seberapa sulitkah itu? Jika Anda [serhack]Anda akan membuatnya lebih mudah dari yang Anda duga.

Tentu saja, terkadang membuat sesuatu yang sederhana bergantung pada penyederhanaan asumsi. Jika Anda mengharapkan utilitas “seperti perbedaan” yang menunjukkan penyisipan dan penghapusan, bukan itu yang terjadi di sini. Sebagai gantinya, Anda akan melihat gambar PDF dengan perubahan yang disorot dengan kotak merah. Ini mudah karena program menggunakan utilitas yang tersedia untuk membuat PDF sebagai gambar dan kemudian membandingkan piksel dalam gambar yang dihasilkan, menggambar kotak merah di atas bagian yang tidak cocok.

Jelas, ini yang terbaik untuk PDF yang hanya memiliki beberapa perubahan. Menyisipkan paragraf, misalnya, membuat hasilnya sangat tidak berguna. Untuk itu, Anda dapat mempertimbangkan untuk mengekstrak teks dari PDF menggunakan sesuatu seperti pdf2text (yang menggunakan pustaka dasar yang sama yang digunakan untuk menghasilkan gambar).

Program ini menunjukkan banyak pesan tentang file yang hilang tetapi tampaknya tetap berfungsi. Berikut adalah hasil membandingkan dua versi halaman beranda Hackaday yang diambil ke PDF beberapa menit terpisah:

Namun, Anda dapat melihat bahwa jika sebuah artikel baru diposting dan semuanya meluncur turun satu per satu, Anda tidak akan memiliki apa-apa selain balok merah raksasa.

Itu masih ide yang cerdas. Ada beberapa alat yang mengejutkan di luar sana untuk ini, meskipun kami menemukan beberapa yang lain. Tentu saja ada banyak alat Linux untuk memanipulasi PDF. Banyak dari mereka adalah mashup dari alat lain seperti ini.