Cos'è ElectroYou | Login Iscriviti

ElectroYou - la comunità dei professionisti del mondo elettrico

Codifica caratteri da documento PDF

Linguaggi e sistemi

Moderatori: Foto UtenteMassimoB, Foto UtentePaolino, Foto Utentefairyvilje

0
voti

[1] Codifica caratteri da documento PDF

Messaggioda Foto Utentemario_maggi » 21 ott 2024, 20:43

Ciao.
Non riesco a fare copia/incolla da un documento PDF - probabilmente turco - che leggo perfettamente. Ho provato ad importarlo in Excel specificando varie codifiche, senza riuscirci. Anche copiandolo sul blocco note non funziona. Quando incollo il testo originale:

This approach gives you all the advantages

appare così:

Thi
sappr
oachgi
vesyoual
lt
headvant
ages


Mi date p.f. una dritta per risolvere? Grazie!
Ciao,
Mario
Mario Maggi
https://www.evlist.it per la mobilità elettrica e filiera relativa
https://www.axu.it , inverter speciali, convertitori DC/DC, soluzioni originali per la qualità dell'energia
Innovazioni: https://www.axu.it/mm4
Avatar utente
Foto Utentemario_maggi
19,0k 3 10 12
G.Master EY
G.Master EY
 
Messaggi: 4015
Iscritto il: 21 dic 2006, 9:59
Località: Milano

1
voti

[2] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentevenanzio » 21 ott 2024, 20:57

Prova a impostare nel blocco note (ti consiglio notepad ++ che è serio)
a mostrare tutti i caratteri anche quelli nascosti.

Sospetto ci siano degli "a capo" in mezzo a quel testo tipo: LF CR eredità delle telescriventi Line feed e carriage return per la gente normale i caratteri invio.

In ogni caso la mossa di copiarlo prima sul blocco note è vincente in quanto gli fai perdere ogni formattazione oppure per fare lo stesso direttamente in excel shift+ctrl+v.

purtroppo ho paura che comunque quegli "return" te li dovrai cancellare a mano.
Avatar utente
Foto Utentevenanzio
360 2 5
New entry
New entry
 
Messaggi: 70
Iscritto il: 25 ago 2023, 16:11

0
voti

[3] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentemario_maggi » 21 ott 2024, 21:11

Ahimè, Venanzio, grazie per la brutta notizia.
Speravo di non dover stampare 300 pagine di manuali tecnici per poi scannerarle e passarle all'OCR.
Se non arrivano suggerimenti più entusiasmanti, vedrò di chiedere a chi-so-io che me lo risolve di certo.
:(
Mario Maggi
https://www.evlist.it per la mobilità elettrica e filiera relativa
https://www.axu.it , inverter speciali, convertitori DC/DC, soluzioni originali per la qualità dell'energia
Innovazioni: https://www.axu.it/mm4
Avatar utente
Foto Utentemario_maggi
19,0k 3 10 12
G.Master EY
G.Master EY
 
Messaggi: 4015
Iscritto il: 21 dic 2006, 9:59
Località: Milano

0
voti

[4] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentevenanzio » 21 ott 2024, 21:13

da openoffice
Allegati
iScreen Shoter - OpenOffice - 241021211235.png
iScreen Shoter - OpenOffice - 241021211235.png (9.4 KiB) Osservato 3268 volte
Avatar utente
Foto Utentevenanzio
360 2 5
New entry
New entry
 
Messaggi: 70
Iscritto il: 25 ago 2023, 16:11

3
voti

[5] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentevenanzio » 21 ott 2024, 21:17

mario_maggi ha scritto:Ahimè, Venanzio, grazie per la brutta notizia.
Speravo di non dover stampare 300 pagine di manuali tecnici per poi scannerarle e passarle all'OCR.
Se non arrivano suggerimenti più entusiasmanti, vedrò di chiedere a chi-so-io che me lo risolve di certo.
:(


prova a convertire il pdf in word, aprendolo in word o con servizi online tipo ilovepdf oppure con pdf24...

purtroppo è un problema che ho affrontato molte volte...
La fregatura nel tuo caso e che certe parole sono spezzate !!! quindi anche volendo scrivere un programmino in python.. come si distinguono le parole spezzate dalle parole staccate ?
si potrebbero confrontare con un dizionario... si può fare... ma che palle ahhahaha
menomale che sono uscito dal mondo dell'informatica :D
Avatar utente
Foto Utentevenanzio
360 2 5
New entry
New entry
 
Messaggi: 70
Iscritto il: 25 ago 2023, 16:11

2
voti

[6] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentemario_maggi » 21 ott 2024, 21:45

Grazie, Venanzio, per l'ottimo consiglio!
Con http://www.ilovepdf.com ho risolto brillantemente, aprendo il pdf che ha codifica strana e trasformandolo online in Word.
Eccellente!
Ciao
Mario
Mario Maggi
https://www.evlist.it per la mobilità elettrica e filiera relativa
https://www.axu.it , inverter speciali, convertitori DC/DC, soluzioni originali per la qualità dell'energia
Innovazioni: https://www.axu.it/mm4
Avatar utente
Foto Utentemario_maggi
19,0k 3 10 12
G.Master EY
G.Master EY
 
Messaggi: 4015
Iscritto il: 21 dic 2006, 9:59
Località: Milano

0
voti

[7] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentevenanzio » 21 ott 2024, 21:51

eh vedi a volte scoperte di siti/servizi banali così ti salvano la vita...

tipo c'è google che ha un sacco di funzioni di ricerca anche geografica che molti ignorano (tipo prendere elenchi e trovare i posti etc..)
Avatar utente
Foto Utentevenanzio
360 2 5
New entry
New entry
 
Messaggi: 70
Iscritto il: 25 ago 2023, 16:11

0
voti

[8] Re: Codifica caratteri da documento PDF

Messaggioda Foto Utentemario_maggi » 21 ott 2024, 21:56

Vero,
avevo provato anche Google Translate che traduceva abbastanza bene il testo con tanti "a capo" dall'inglese all'italiano, ma c'erano ancora troppi errori, e poi a me serviva in inglese.
Ciao
Mario
Mario Maggi
https://www.evlist.it per la mobilità elettrica e filiera relativa
https://www.axu.it , inverter speciali, convertitori DC/DC, soluzioni originali per la qualità dell'energia
Innovazioni: https://www.axu.it/mm4
Avatar utente
Foto Utentemario_maggi
19,0k 3 10 12
G.Master EY
G.Master EY
 
Messaggi: 4015
Iscritto il: 21 dic 2006, 9:59
Località: Milano

-1
voti

[9] Re: Codifica caratteri da documento PDF

Messaggioda Foto UtenteEcoTan » 22 ott 2024, 6:41

i dati contenuti nella Certificazione Unica, che viene inviata all’Agenzia delle entrate dai sostituti d’imposta: ad esempio, i dati dei familiari
a carico, i redditi di lavoro dipendente o di pensione, le ritenute Irpef, le trattenute di addizionale regionale e comunale, il credito
d’imposta APE, i compensi di lavoro autonomo occasionale, i dati delle locazioni brevi;

Questo lo ho preso dal PDF ufficiale selezionando col mouse e copincollando con CTRL+C, CTRL+V. (Sistema WIN7)
L'esistenza non è un accessorio
Avatar utente
Foto UtenteEcoTan
7.337 4 11 13
Expert EY
Expert EY
 
Messaggi: 5095
Iscritto il: 29 gen 2014, 8:54

0
voti

[10] Re: Codifica caratteri da documento PDF

Messaggioda Foto UtenteGioArca67 » 22 ott 2024, 10:34

Non credo si possa parlare di "codifica" di caratteri, forse meglio di struttura del testo?
Avatar utente
Foto UtenteGioArca67
3.714 4 5 9
Master
Master
 
Messaggi: 3600
Iscritto il: 12 mar 2021, 9:36

Prossimo

Torna a PC e informatica

Chi c’è in linea

Visitano il forum: Nessuno e 46 ospiti