Discussione:
doppioni in elenco
(troppo vecchio per rispondere)
filippo
2009-05-28 15:00:09 UTC
Permalink
ciao
non so se già stato chiesto, ma io non ho trovato nulla.

Su Word 2003 ho un grosso elenco (non in tabella) con nome, cognome,
indirizzo ecc
visto che poi per maggior controllo gli stessi sono anche elencati con
cognome, nome indirizzo
il documento è diventato molto grosso
c'è qualche comando, macro che trovi (senza cancellare) i doppioni)
esempio:

...
paola rossi via ...
paolo rossi via ...
paolo rossi via ...
paolo rossinelli via ...
paolo rossini via ...
rossi paola via...
rossi paolo via...
....

mi dovrebbe evidenziare/trovare i due paolo rossi, poi dopo controllo (per
vedere che non siano persone diverse) cancellerei manualmente uno dei due

grazie
filippo
Giovanni Zezza
2009-05-28 16:19:36 UTC
Permalink
Post by filippo
...
paola rossi via ...
paolo rossi via ...
paolo rossi via ...
paolo rossinelli via ...
paolo rossini via ...
rossi paola via...
rossi paolo via...
....
mi dovrebbe evidenziare/trovare i due paolo rossi, poi dopo controllo (per
vedere che non siano persone diverse) cancellerei manualmente uno dei due
Se si tratta di paragrafi interamente ripetuti, tal quali, si potrebbe
anche tentare qualcosa.

Se la ripetizione riguarda solo nome e cognome e gli altri dati possono
essere diversi (o magari, uguali ma scritti in modo diverso, e per questo
vuoi avere una possibilità di controllo manuale), tanto vale importare i
dati in un database e fare tutti i controlli lì. Tanto più se vuoi
confrontare anche le due serie di elenchi, nome-cognome e cognome-nome.

Un approccio comunque (almeno, all'interno di ogni serie di elenchi)
potrebbe essere ordinare i dati (se già non lo sono), scorrerli nominativo
per nominativo e aggiungere un qualche prefisso (o segnare in altro modo)
ai nominativi duplicati. In questo modo, è necessario memorizzare solo il
nominativo precedente, senza necessità di ricorrere a strutture dati più
complesse.

Per fare questo, bisognerebbe però avere un'idea più precisa di come sono
strutturati i dati: che cosa separa un nominativo da un altro (se sono su
paragrafi distinti o altro), e come è possibile riconoscere la parte
nome-cognome (o cognome-nome) rispetto al resto (se c'è una tabulazione o
un altro carattere di separazione).

Ciao.
filippo
2009-05-29 06:33:50 UTC
Permalink
ciao Giovanni

il documento contiene una marea di dati dove i primi due (ma a volte i primi
tre o addiritura quattro, nomi composti) sono riferiti al nome-cognome o
cognome-nome.
alla destra di questi possono esserci altri dati ma, nel caso di doppioni,
non sempre potrebbero essere ugualmente ripetuti.

ho immaginato da subito che l'unica cosa da fare è stampare e controllare a
mano (anzi ad occhio!)... :-(

comunque grazie
filippo
Mauro Gamberini
2009-05-29 08:39:38 UTC
Permalink
Post by filippo
il documento contiene una marea di dati dove i primi due (ma a volte i
primi tre o addiritura quattro, nomi composti) sono riferiti al
nome-cognome o cognome-nome.
alla destra di questi possono esserci altri dati ma, nel caso di doppioni,
non sempre potrebbero essere ugualmente ripetuti.
Se(se) hai anche Excel, copia la tua
tabella in Excel ed utilizza poi gli strumenti
di Excel per rendere univoci i tuoi dati.

Nel caso chiedi *poi* qui:

microsoft.public.it.office.excel
--
---------------------------
Mauro Gamberini
http://www.riolab.org/
http://blog.maurogsc.eu/
Giovanni Zezza
2009-05-29 09:16:32 UTC
Permalink
Post by filippo
il documento contiene una marea di dati dove i primi due (ma a volte i primi
tre o addiritura quattro, nomi composti) sono riferiti al nome-cognome o
cognome-nome.
alla destra di questi possono esserci altri dati ma, nel caso di doppioni,
non sempre potrebbero essere ugualmente ripetuti.
D'accordo, ma c'è qualcosa che permetta di stabilire dove finisce il
nominativo e iniziano gli altri dati? una tabulazione o un altro carattere
particolare?

Altrimenti, si potrebbe pensare di considerare uguali due elementi che
abbiano uguali almeno le prime due parole. Oppure, inserire a mano un
separatore: è una procedura certamente noiosissima, ma abbastanza veloce
anche su un numero elevato di elementi (qualche migliaio di elementi
all'ora), e molto meno soggetta ad errori dell'analisi completa e del
confronto di più elementi (che si può poi automatizzare).
Post by filippo
ho immaginato da subito che l'unica cosa da fare è stampare e controllare a
mano (anzi ad occhio!)... :-(
Veramente, io non ho detto questo. Ho parlato comunque di procedure
automatiche, o semiautomatiche.

La soluzione migliore mi sembra importare i dati in un database, quindi
strutturarli suddividendo i vari campi (nome, cognome, indirizzo).
(L'importazione può essere probabilmente automatizzata in larga parte, se
non proprio del tutto.) Questo è, alla lunga, l'unico modo per mantenere un
elenco congruente.

Se si vogliono mantenere i dati in Word, si può tentare di riconoscere i
possibili doppioni con una macro, dopo avere ordinato (sempre con una
procedura automatica) i dati. La macro percorrerebbe tutti gli elementi
dell'elenco ordinato (che non hai ancora detto come sono divisi: da segni
di paragrafo, interruzioni di linea o altro?), memorizzando in una
variabile la parte nome-cognome (o le prime due parole, se non c'è un modo
semplice per distinguere il nominativo dal resto dei dati); al successivo
elemento, se la parte considerata è uguale, l'elemento viene marcato in
qualche modo, e così via. Il controllo definitivo sarebbe, sì, da fare a
mano, ma solo sugli elementi "sospetti", come volevi tu.

Per dettagliare la cosa, però, è necessaria una descrizione più precisa
della struttura dei dati.

L'approccio vincente, insomma, è un'integrazione di procedure automatiche e
manuali. Occorre automatizzare tutto quello che è possibile, creare (a
mano) le premesse per poter automatizzare il resto, e automatizzare (in un
certo senso) anche le procedure manuali, rendendole quanto più possibile
rigorose ed elementari (e, per forza di cose, molto noiose).

Ciao.
filippo
2009-05-29 10:33:57 UTC
Permalink
Post by filippo
ciao Giovanni
il documento contiene una marea di dati dove i primi due (ma a volte i
primi tre o addiritura quattro, nomi composti) sono riferiti al
nome-cognome o cognome-nome.
alla destra di questi possono esserci altri dati ma, nel caso di doppioni,
non sempre potrebbero essere ugualmente ripetuti.
ho immaginato da subito che l'unica cosa da fare è stampare e controllare
a mano (anzi ad occhio!)... :-(
comunque grazie
filippo
no ho fatto la "belinata" (come si dice a Genova) di non separare i dati
con nessun carattere... c'è solo lo spazio bianco.
insomma l'elenco è stilato senza punteggiature e col solo spazio per
dividere le varie parole.
via via i dati sono aumentati, ma per migliorare la ricerca ho pensato di
raddoppiare il tutto aggiungendo allo stesso elenco (che inizialmente era
impostato solo per nome cognome e indirizzo) i nominativi ordinati per
cognome nome e indirizzo ma anche altri dati.
Ho Excel e "se avessi previsto tutto questo" (come cantava Guccini) non
avrei certamente usato Word.
tra l'altro mi trovo meglio con Excel...
manualmente dovrei mettere delle virgole tra i nominativi per poi farli
convertire da Excel...

ciao Mauro, ciao Giovanni :-)

filippo
Giovanni Zezza
2009-05-29 11:07:07 UTC
Permalink
Post by filippo
manualmente dovrei mettere delle virgole tra i nominativi per poi farli
convertire da Excel...
Una tabulazione, meglio. Si possono anche tentare delle sostituzioni, per
esempio sostituisci tutte le occorrenze di "via" con "<tab>via", lo stesso
con "piazza", "corso" e così via, se il nome dell'elemento toponomastico è
scritto sempre allo stesso modo (se a volte hai scritto "via" a volte "v.",
a volte "piazza" a volte "p.zza", o altre possibili variazioni, le cose
diventano ovviamente più complicate).

Ciao.
filippo
2009-05-29 17:38:26 UTC
Permalink
Post by Giovanni Zezza
Post by filippo
manualmente dovrei mettere delle virgole tra i nominativi per poi farli
convertire da Excel...
Una tabulazione, meglio. Si possono anche tentare delle sostituzioni, per
esempio sostituisci tutte le occorrenze di "via" con "<tab>via", lo stesso
con "piazza", "corso" e così via, se il nome dell'elemento toponomastico è
scritto sempre allo stesso modo (se a volte hai scritto "via" a volte "v.",
a volte "piazza" a volte "p.zza", o altre possibili variazioni, le cose
diventano ovviamente più complicate).
Ciao.
infatti, come detto ho fatto una belinata... :-(
poco male mi armerò di pazienza
l'insegnamento è che anche quando si fa un piccolo elenco questo potrebbe
via via ingrandirsi
quindi meglio prevenire :-)
grazie comunque

filippo
Provart
2009-05-29 23:06:45 UTC
Permalink
Post by filippo
Post by Giovanni Zezza
Post by filippo
manualmente dovrei mettere delle virgole tra i nominativi per poi farli
convertire da Excel...
Una tabulazione, meglio. Si possono anche tentare delle sostituzioni, per
esempio sostituisci tutte le occorrenze di "via" con "<tab>via", lo stesso
con "piazza", "corso" e così via, se il nome dell'elemento toponomastico è
scritto sempre allo stesso modo (se a volte hai scritto "via" a volte "v.",
a volte "piazza" a volte "p.zza", o altre possibili variazioni, le cose
diventano ovviamente più complicate).
Ciao.
infatti, come detto ho fatto una belinata... :-(
poco male mi armerò di pazienza
l'insegnamento è che anche quando si fa un piccolo elenco questo potrebbe
via via ingrandirsi
quindi meglio prevenire :-)
grazie comunque
filippo
Trasforma in word l'elenco che hai in una tabella, poi la importi in execel
e li puoi usare le macro per eliminare le righe doppie, da word mi pare più
complicato, anche se penso sia possibile farlo anche da lì.

Continua a leggere su narkive:
Loading...