Ciao a tutti,
ho un problema con lo scaricamento e lettura di un file da internet.
Praticamente devo leggere un file pdf da URL e convertirlo a testo
utilizzando
un programma esterno (pdftotext) nel seguente modo:
open(filename,“w”).write(open(path).read)
pdf_text = %x{pdftotext #{options} #{filename} - 2>/dev/null}
E’ giusto come procedimento?Il problema, penso, è che nel leggere il file
da
internet perda qualche informazione sul PDF, perchè non riesce a
convertirlo.
Se invece provo con un file locale va tutto a buon fine.
C’è un altro modo per scaricare un file da internet ed essere sicuri che
sia
identico bit a bit?
Grazie!