PDA

Visualizza versione completa : Macro apertura multilink


Pagine : [1] 2

18Shirt
15-06-2014, 23.21.14
Ciao a tutti sono nuovo del forum.

Ho un problema di questo tipo: ho un elenco molto ma molto lungo di url (una range da B2:B153900). Ad ogni url corrisponde una pagina web in cui c'è un'immagine con delle descrizioni.

Io dovrei (da Firefox) fare il Salva con none - Pagina web completa di ogni url andando a salvare le raccolte con numeri in ordine crescente.

Inizialmente ho pensato di aprire tante finestre quanti url e di salvare singolarmente con una macro:

Public Sub Tester()
Dim WB As Workbook
Dim SH As Worksheet
Dim Rng As Range
Dim rCell As Range

Set WB = Workbooks("Pippo.xls")
Set SH = WB.Sheets("Foglio1")

Set Rng = SH.Range("B2:B153900")

For Each rCell In Rng.Cells
WB.FollowHyperlink Address:=rCell.Value, _
NewWindow:=True
Next rCell

End Sub

ma è un lavoro da pazzi: si blocca il PC. Qualcuno ha qualche idea?

Mi basterebbe poter fare aprire un url alla volta, salvare con nome, chiudere e sotto con il prossimo.

RunDLL
15-06-2014, 23.50.21
E ce credo che si blocca, cerchi di aprire 153.000 circa di finestre di un browser in contemporanea.

18Shirt
15-06-2014, 23.52.27
Infatti...è quanto dicevo. Dovrei far si che si apra un link alla volta, che vengano salvati i contenuti....ecc.

borgata
16-06-2014, 00.34.56
Vorrei farti notare che non hai specificato che programma usi, in quale versione e in che formato è il file che contiene i link :p

EDIT: in effetti il formato si nota leggendo lo script, è un xls, quindi deduco che con buona probabilità il programma sia una qualche versione di excel, o usi qualche suite alternativa?

Comunque se si tratta di una semplice lista di link potresti portare tutto direttamente su firefox e far eseguire le operazioni da li con uno script.

18Shirt
16-06-2014, 00.40.07
Ciao Borgata,
uso Excel 2010 per cui, avendo moltissili link in colonna, usando il formato .xlsx avrei molte più righe da poter utilizzare.

Se avessi 10 link li potrei aprire con FireFox e con un addons tipo UnMHT mi scaricherebbe tutti i tabs. Ma essendo i link centinaia di migliaia sarebbe un lavoro assurdo.

borgata
16-06-2014, 09.48.35
Proprio per questo ti suggerivo di controllare se è possibile farlo direttamente da firefox.
Tramite script è facile aprire le pagine una per volta e richiuderle, anche se non saprei dirti come fare per avviare la procedura di salvataggio su file della pagina.

Altrimenti non ti resta che aprire le pagine un tot per volta (50 per volta dovresti riuscire a gestirle con una config media) e poi salvare con umht. Devi farlo solo 3000 volte, che vuoi che sia! :p

Gattuccio
16-06-2014, 09.53.53
:rotfl:

Ma si...5 fogli con altrettanti numero di link...non vado in vacanza e ad ottobre ho tutto pronto.

Alexsandra
16-06-2014, 10.57.47
..... Ad ogni url corrisponde una pagina web in cui c'è un'immagine con delle descrizioni.

se è l'immagine che ti interessa perchè non scarichi solo quella invece di tutta la pagina?
ti può andar bene o vuoi tutta la pagina?

LoryOne
16-06-2014, 11.09.37
Scaricarti wget (oppure aria2) per windows, poi lanciarlo via macro in Excel ?
Oppure salvare un file testuale del range ed agire via batch ?

Gattuccio
16-06-2014, 13.08.17
A me non interessa l'immagine ma tutto il pacchetto.

LoryOne non so niente delle applicazioni/modalità di cui mi parli

18Shirt
16-06-2014, 13.19.54
Gattuccio siamo in 2 :act:

Sono in alto mare con programmazione, e simili: venendo dalla grafica gli unici batch che conosco sono quelli di Photoshop.

Stupidamente ho provato a registrare una macro ma mi ha registrato un decimo di quello che ho fatto. Per operazioni di questo tipo mi sa che si deve necessariamente conoscere la programmazione in VBA.

Ho provato a vedere in giro ma da un codice non riesco a metter mano e modificarlo. Ho provato a creare un .bat ma qui andiamo nella fantascienza

RunDLL
16-06-2014, 13.25.17
A mio giudizio fai prima a cliccare in ogni link e salvare, in maniera molto semplicistica, non vedo in che maniera aprendo in automatico un sito alla volta dove dovrai comunque agire manualmente per salvare la pagina risparmieresti tempo sull'aprire il link manualmente.
Cosa diversa sarebbe stata se la pagina fosse stata salvata sempre in automatico.

18Shirt
16-06-2014, 13.30.46
Difatti io devo automazzare tutto:
-apertura link
-salva con nome
-chiudi link
-apri secondo link

e via di seguito

Aprire manualmente oltre 50 mila link e fare il salva con nome è un lavoro da mesi, lavorandoci 4/5 ore al giorno

LoryOne
16-06-2014, 13.55.53
Gattuccio siamo in 2 :act:
Ho provato a creare un .bat ma qui andiamo nella fantascienza

Scarica wget e mettilo nella cartella di windows.
digita da prompt (senza doppi apici) "wget http://www.google.it"
Fatto ?
Di sicuro ha scaricato la pagina iniziale di google.

Crea un file .bat e rinominalo prova
Scrivi (senza doppi apici) "wget %1"
Fatto ?

digita da prompt "prova http://www.google.it"
Fatto ?
Di sicuro ha scaricato la pagina iniziale di google, ma ha associato a %1 il primo parametro che hai digitato nella riga di comando.
Se hai capito il senso, puoi associare l'url della pagina internet da scaricare prelevandolo direttamente da un file che li contiene in sequenza...

18Shirt
16-06-2014, 16.44.27
Allora: scarico wget per Windows. Lo metto in C:\Windows

Se dal prompt digito wget http://www.google.it mi scarica la pagina iniziale di Google in C:\Windows?

Il file .bat immagino che io lo debba creare e poterlo lasciare anche sulla scrivania e, cliccandoci due volte, mi scarica la pagina iniziale di Google in C:\Windows?

Quindi, se io avessi un file nominato pippo.xlsx con tutti i link, nel file .bat dovrei inserire (senza apici) "wget %pippo.xlsx"...corretto?

LoryOne
16-06-2014, 17.40.27
Punto primo:
in C:\Windows: Corretto.
In questo modo, wget sarà lanciato anche se dal prompt il tuo percorso sarà differente.

Punto secondo:
Te la scarica nel percorso attuale: Se vuoi specificare un percorso, guarda la guida.

Punto terzo:
Il file bat lancerà wget (punto primo) e salverà al punto secondo.

Punto quarto:
No.
Dovrai creare un file testuale da Excel e dovrai usare quello.
Come fare per ricavare il percorso ad ogni riga non te l'ho ancora spiegato.
Devi prima avere dimestichezza con wget.

18Shirt
16-06-2014, 20.23.48
Allora...io ho scaricato wget.
dal prompt ho digitato wget http://www.google.it

Si è connesso e mi dice che ha salvato ma in C:\Windows non trovo la pagina salvata.

Poi ho creato il .bat come da tue indicazioni: clicco, lavora ma...anche qui non vedo dove abbia scaricato/salvato il file

borgata
16-06-2014, 20.40.50
C:\Windows è una cartella con permessi ristretti, il programma potrebbe non avervi avuto accesso in scrittura.
Esegui la procedura da una locazione meno problematica, che ci fai dentro la cartella Windows? :p

AMIGA
16-06-2014, 20.46.47
Puoi dare il tuo percorso preferito con il parametro -p

LoryOne
16-06-2014, 20.55.03
Che file ti aspetti ?
Quando ti colleghi ad un sito web, la richiesta viene elaborata dal server e di rimando può essere inviato il file indice (index.html), oppure una direttiva di ulteriore richiesta che costituisce la pagina principale.
Ogni pagina, poi, contiene ulteriori rimandi a contenuti che possono essere ospitati sul server che contiene la pagina principale o altrove.
Il browser elabora il contenuto effettuando diverse richieste in base ai link che ricava dalla pagina ottenuta, fino ad ultimare il render per quella pagina e mostrarla a video...
A te non serve visualizzare la pagina, bensì scaricarla in locale, comprensiva o meno del contenuto dei rimandi...
wget può effettuare il download di un intero sito (get ricorsivo), senza mostrare la pagina.
Prova a scaricare il primo url che trovi nel file di excel ...
Che file ti aspetti ?

LoryOne
16-06-2014, 20.59.26
Poi ho creato il .bat come da tue indicazioni: clicco, lavora ma...anche qui non vedo dove abbia scaricato/salvato il file

Come lavora ?
Ti dice che ha salvato, oppure ti da un errore di scrittura ?

Non cliccare 2 volte sul .bat:
Apri la shell (il prompt del DOS, ossia quella finestra "nera"), trascina il file .bat all'interno e poi dai invio.

RunDLL
16-06-2014, 21.21.27
Una curiosità: dopo che hai scaricato 130.000 pagine ed il loro contenuto che ci fai?
Non conosco questo wget ma da quel che ho capito scarica interi siti e non solo una pagina, la sintassi, sempre che abbia ben capito dovrebbe essere:

wget --input-file:nomefile.xls

Tutto ciò però da Linux e non ho ben capito se i file xls possano essere aperti ma comunque gli url devo essere scritti in maniera sequenziale.

Io credo che con un semplice programma in Visual Basic si possa fare quello che cerchi senza tra l'altro ritrascrivere tutti i 130.000 url.

18Shirt
16-06-2014, 21.46.37
Per Borgata:
eseguivo la prassi suggerita da LoryOne

Per Amiga:
per dare un percorso preferito devo prima imparare a fare l'ABC suggerito da LoryOne


per LoryOne:
davo per scontato che avrebbe scarica la index di Google e quindi cercavo un file tipo index.html.

Se wget può effettuare il download di un intero sito (get ricorsivo), senza mostrare la pagina dove trovo il sito scaricato?

da prompt ho dato il link della prima fila del file in Excel. Dice che lo ha salvato.

Ho preso il .bat in cui avevo scritto wget %1.

L'ho messo nella finestra nera del prompt, ho dato invio e mi esce la seguente dicitura:

C:windows\system32>wget
wget: missing URL
Usage: wget [OPTION]... [URL]...

Try 'wget - -help' for more options.


Per RunDLL:
dopo che li ho scaritati li elaboro e li arcvhio: su di essi ci sono dati complementari a quelli che ho già.

Avevo postato il mio problema per poter trovare una semplice soluzione in VBA

Alexsandra
16-06-2014, 22.49.47
con questo codice

Sub Macro1()
myurl = "URL;"
myurl = myurl + Sheets("Foglio2").Range("A1").Value

With ActiveSheet.QueryTables.Add(Connection:=myurl, _
Destination:=Range("A1"))
.Name = "Quello_che_vuoi"
.FieldNames = True
.RowNumbers = False
.FillAdjacentFormulas = False
.PreserveFormatting = True
.RefreshOnFileOpen = False
.BackgroundQuery = True
.RefreshStyle = xlInsertDeleteCells
.SavePassword = False
.SaveData = True
.AdjustColumnWidth = True
.RefreshPeriod = 0
.WebSelectionType = xlEntirePage
.WebFormatting = xlWebFormattingNone
.WebPreFormattedTextToColumns = True
.WebConsecutiveDelimitersAsOne = True
.WebSingleBlockTextImport = False
.WebDisableDateRecognition = False
.WebDisableRedirections = False
.Refresh BackgroundQuery:=False
End With
End Sub


Viene letto un link presente nella cella A1 del Foglio 2 e si copia il contenuto del link a partire dalla cella A1 del Foglio 1.
ho fatto una prova con il link di questa discussione e copia tutto

Link = http://forum.wintricks.it/showthread.php?p=1694543#post1694543

A parte il metodo, che può essere quello suggerito, un codice vba o di altro linguaggio mi sembra improponibile eseguire 150.000 querry consecutivamente in automatico. secondo me inchiodi il sistema.

a meno che tu non abbia un pc come la ferrari.

18Shirt
16-06-2014, 23.07.21
Ho fatto la prova. Con un sito "normale" normale funzione alla grande.

Con il sito di cui ho i link non va. Non so come spiegarlo tecnicamente...ma ci provo.

Se io copiassi la pagina web da IE o da Mozilla, avrei due risultati completamente differenti: IE copia quello che la programmazione vuole far copiare.

Mozilla ti fa copiare tutta la struttura (la pagine deve avere un fb che a seconda della compilazione di prende dati da origini differenti).

Qui allego un esempio di "estrazione" con IE ed una con Mozilla: http://rapidshare.com/share/5DE9D9BBB9D49D7571D516D6E5FD719C

Alexsandra
16-06-2014, 23.32.27
bisogna vedere come hai scritto il link nel tuo foglio excel.

lo devi scrivere per esteso, con http:// www. .................... etc.

18Shirt
16-06-2014, 23.35.26
E' scritto per esteso e completo di http://

18Shirt
17-06-2014, 00.08.20
Nel sito faccio una ricerca ed il risultato ha un nome tipo:

https://it.pippo.com/ricercaeseguita/#/strategy/8808712665170

La schermata mi da 100 aziende per pagina ma il link corrispondenti ad ogni riga (della pagina web) puntano ad un link unico: se fossero stati link "indipendeti2 con Down Them All avrei scarica 100 pagine html. Invece se ne scarica una sola.

Quindi devo clikkare su ogni link ed il risultato diventa come questo:

https://it.pippo.com/ricercaeseguita/#/detail/0/0

in alto alla pagina vedo che ci sono 150 mila pagine (ognuna con i dati di un record). Scorrendo una dopo l'altra i risultati cambiano così:

https://it.pippo.com/ricercaeseguita/#/detail/0/0
https://it.pippo.com/ricercaeseguita/#/detail/1/0
https://it.pippo.com/ricercaeseguita/#/detail/2/0
https://it.pippo.com/ricercaeseguita/#/detail/3/0 ecc.

Quindi io con una formula ho creato i link in automatico.

LoryOne
17-06-2014, 08.13.05
Se la pagina contiene script e gli url ne sono affetti, allora il discorso si fa più complesso.
Se la pagina è frutto di un'elaborazione che necessiti di cookies e/o di sessioni aperte lato server e gli url ne sono affetti, allora il discorso si fa più complesso.
Se la pagina contiene link che puntano ad un file .php comprensivo di parametri eseguibili lato server e ritorna la pagina web relativa, non c'è problema, ma tutto dipende dalle due condizioni sopra che possono (non devono forzatamente) essere rispettate...
Fino a che non posti almeno i primi 4 link (non servono più link) che trovi nel foglio excel, non posso capire esattamente quello che intendi.
Quando hai eseguito il file .bat, non hai specificato l'url come primo parametro: infatti, wget non sa cosa scaricare.
Poichè un sito si compone di differenti files (salvo che l'url non sia un'immagine, o un file), wget crea una cartella e li immette tutto cio che riesce a scaricare in via ricorsiva in base agli url che ricava pagina per pagina.

AMIGA
17-06-2014, 08.50.35
Non conosco questo wget ma da quel che ho capito scarica interi siti e non solo una pagina

Run Wget è un comandi DOS che può anche servire per scaricare un singolo file, quando per esempio si deve scaricare un file di grandi dimensioni velocemente senza usare il browser; utile quando per qualche strano si interrompe il download o quando il download dei file di grandi dimensioni non è supportate da qualche restrizione. Per usarlo basta copiare il comando Wget.exe in C:\ digitare Wget seguito dal link e il file sarà scaricato automaticamente in C:\

18Shirt
17-06-2014, 10.34.26
Quando hai eseguito il file .bat, non hai specificato l'url come primo parametro: infatti, wget non sa cosa scaricare.
Poichè un sito si compone di differenti files (salvo che l'url non sia un'immagine, o un file), wget crea una cartella e li immette tutto cio che riesce a scaricare in via ricorsiva in base agli url che ricava pagina per pagina.

Quindi nel .bat avrei dovuto inserire:
wget %http://wwww.pippo.... ?

LoryOne
17-06-2014, 10.58.21
No.
Avresti dovuto lanciare il bat con l'url aggiunto nella riga di comando, es:
[percorso di pippo]pippo.bat http://www.pippo.ecc (Come ti ho già spiegato, ma che non hai ancora compreso)

Qui, però, il discorso non è tanto l'utilizzo corretto di un file di automazione batch: Il discorso è maggiormente legato all'utilizzo di wget e dei suoi * parametri di comando per ottenere il risultato di cui necessiti...
Infatti, una volta identificati i parametri di comando di wget, il batch ti diviene utile per l'automazione del download del contenuto dei siti identificati dall' url presenti nel foglio di Excel...

* Anche wget ha i suoi parametri, così come il .bat.
La differenza sta nel fatto che un batch è una sequenza di comandi DOS in parte compresi nella shell, in parte richiamati all'occorrenza, mentre wget non è una sequenza.

borgata
17-06-2014, 11.17.32
Girando in rete ho trovato anche questa (http://www.dbai.tuwien.ac.at/user/pollak/webpagedump/) estensione per firefox, prova a dare una letturina, potrebbe fare al caso tuo.

LoryOne
17-06-2014, 12.22.04
Interessante: "For batch processing the following options can be used through the Firefox command-line. , ecc"
Scarica l' .xpi, rinominalo .zip, estrai il file drm, modifica la versione, rinominalo nuovamente .xpi , installa componenti aggiuntivi da file e...jar permettendo, funziona sotto la versione di FF attualmente in uso ?

LoryOne
17-06-2014, 12.50.02
rdf, non drm ...la memoria mi ha abbandonato.

18Shirt
17-06-2014, 13.29.43
Questa sera lo provo immediatamente da casa...non vorrei creare qualche danno al pc dell'ufficio

18Shirt
17-06-2014, 21.21.12
Interessante: "For batch processing the following options can be used through the Firefox command-line. , ecc"
Scarica l' .xpi, rinominalo .zip, estrai il file drm, modifica la versione, rinominalo nuovamente .xpi , installa componenti aggiuntivi da file e...jar permettendo, funziona sotto la versione di FF attualmente in uso ?

La mia versione di FireFox lo rifiuta.
Ho estratto il tutto...come faccio a modificare la versione?

18Shirt
17-06-2014, 21.54.24
Il file .rdf lo ho aperto con un editor. Ho modificato la versione massima si FireFox e lo ho salvato. Lo ho messo nella cartella sovrascrivendo quello precedente...ed ora? Che cosa devo fare?

borgata
17-06-2014, 23.30.19
Leggi la sezione "using" della pagina che ho linkato sopra, dovrebbe spiegare tutto.

18Shirt
17-06-2014, 23.34.19
Non ci sono ancora arrivato li. Ho aggiornato il file .rdf e adesso cosa devo fare per installare l'addons?

borgata
18-06-2014, 00.32.12
trascinalo dentro la finestra di firefox

18Shirt
18-06-2014, 00.36.18
Mi esce questo:

Il file XML specificato apparentemente non ha un foglio di stile associato. L’albero del documento è mostrato di seguito.
<RDF><Description about="urn:mozilla:install-manifest"><em:id>{9231a64c-215b-4f10-a19d-6348aa3fbb1b}</em:id><em:version>0.3</em:version><em:name>WebPageDump</em:name><em:description>Makes local copies of single HTML pages</em:description><em:creator>Bernhard Pollak</em:creator><em:homepageURL>http://www.dbai.tuwien.ac.at/user/pollak/webpagedump</em:homepageURL><em:iconURL>chrome://webpagedump/skin/mainicon.png</em:iconURL><em:targetApplication><Description><!-- Firefox --><em:id>{ec8030f7-c20a-464f-9b0e-13a3a9e97384}</em:id><em:minVersion>1.5.0</em:minVersion><em:maxVersion>3.0.0</em:maxVersion><em:updateLink>http://www.dbai.tuwien.ac.at/user/pollak/webpagedump/webpagedump.xpi</em:updateLink></Description></em:targetApplication></Description></RDF>

borgata
18-06-2014, 00.39.47
cosa hai trascinato esattamente?
Devi trascinare il file .xpi modificato.

LoryOne
18-06-2014, 08.46.01
Mi esce questo:

Il file XML specificato apparentemente non ha un foglio di stile associato. L’albero del documento è mostrato di seguito.
<RDF>...<!-- Firefox --><em:id>{ec8030f7-c20a-464f-9b0e-13a3a9e97384}</em:id><em:minVersion>1.5.0</em:minVersion><em:maxVersion>3.0.0</em:maxVersion>...</RDF>

Ehm...hai firefox 3.0, oppure 30.0 ?
La modifica del file rdf serve ad "ingannare" firefox sulla versione del plug-in, ma non è detto che anche così funzioni, una volta provato ad installarlo.
Come ti ha detto borgata, il file .rdf devi sostituirlo a quello presente nell' .xpi.
Mal che vada, ti scarichi una versione obsoleta del browser ed usi quella...

borgata
18-06-2014, 09.33.55
Oltretutto con le versioni vecchie del browser dovrebbe funzionare il parametro -save-to-folder.
Se qualche vecchia versione renderizzasse correttamente le pagine, potresti usare quella.
firefox "<indirizzo_pagina_web>" -save-to-folder <cartella_di_destinazione>

Il parametro maxversion nel file RDF comunque già da parecchie versioni ha un uso molto più limitato rispetto al passato, ora la compatibilità è gestita solitamente lato server (se non sbaglio tramite id e Mozilla Addons, ma non sono sicuro di ricordare bene).

18Shirt
18-06-2014, 21.25.10
Scusa il silenzio prolungato. Ho preso un vecchio PC. Ho installato Mozilla 1.5 e sono riuscito ad installare l'addon.

In effetti se vai su una pagina web te la scarica. Domanda per le using: io vorrei fare un batch del file di testo. Da quel che vedo devo impostare una stringa di comando che dica:

-Wpd_srcbatch [C:\test\prova.txt]-wpd_dest [C:\test\sito scaricato\]

Domanda: questa stringa di comando dove la devo scrivere, nel browser?

LoryOne
18-06-2014, 21.45.09
"Batch File: simple text file with the required URLs line-by-line."

Quello chiamato batch, in realtà è un file testuale, il cui contenuto di esempio è quello che trovi cliccando su URL list.
Ti basta richiamare FF aggiungendo la stringa di comando -Wpd_srcbatch C:\test\prova.txt -wpd_dest C:\test\sito scaricato.

Ora la mia curiosità ricade sul funzionamento:
Apre FF e crea una scheda per ogni URL, oppure tutto avviene in modo silente ?

18Shirt
18-06-2014, 22.51.21
"Batch File: simple text file with the required URLs line-by-line."

Quello chiamato batch, in realtà è un file testuale, il cui contenuto di esempio è quello che trovi cliccando su URL list.
Ti basta richiamare FF aggiungendo la stringa di comando -Wpd_srcbatch C:\test\prova.txt -wpd_dest C:\test\sito scaricato.

Ora la mia curiosità ricade sul funzionamento:
Apre FF e crea una scheda per ogni URL, oppure tutto avviene in modo silente ?

Non te la prendere LoryOne ma non ho capito niente:
richiamare FF vuol dire aprire una nuova pagina di FF?


Per la tua curiosità: non appeno riesco te lo dico subito

borgata
18-06-2014, 23.59.49
Sicuro che abbia senso installare firefox 1.5?
Al di la del fatto che è obsoleto e non è detto che riesca a renderizzare (e quindi salvare) correttamente le pagine, i firefox vecchi potevano salvare le pagine da riga di comando senza quell'addon, con il parametro che ti dicevo prima.

Perchè hai già rinunciato ad installare quell'estensione su un firefox aggiornato?
Io l'ho provata e si installa senza problemi dopo aver modificato install.rdf. Non so però se funzioni, perchè l'ho usata su una versione portable di firefox e non posso usare direttamente la linea di comando.

Richiamare firefox in questo caso vuol dire usare la linea di comando (o un file batch, che fa lo stesso) per lanciare l'eseguibile del programma.
Se non sai cosa sia un file batch cerca qualche semplice guida su Google (ne trovi a bizzeffe con tanto di esempi) o dai un'occhiata alla pagina di wikipedia.

18Shirt
19-06-2014, 11.09.58
Ho installato su un vecchio pc Firefox 1.5 perchè dal mio portatile non mi ha installato niente nonostante abbia modificato l'install.rdf (evevo postato il messaggio di errore)

borgata
19-06-2014, 11.23.39
Se hai fatto le cose correttamente, lo installa. Te lo posso assicurare perchè l'ho provato personalmente ieri.
Quindi cerca solo di capire dove hai sbagliato.
che gestore di archivi usi? Con 7zip per esempio è una procedura assolutamente banale.

In ogni caso l'estensione è compatibile con firefox fino a 2.5, quindi avresti potuto installare qualcosa di più recente! :p

Giusto per capirci: cercando in rete ho visto che era possibile salvare le pagine di firefox passando un parametro all'eseguibile (-save-to-folder (http://www.wintricks.it/forum/showpost.php?p=1694621&postcount=45)), ma a quanto pare questa metodologia non funziona più con le ultime versioni di firefox (è in qualche modo "corrotta", apre le pagine anziché salvarle, forse in futuro l'aggiusteranno).
A causa di questo malfunzionamento veniva suggerito di usare l'estensione che ho linkato, ossia webpagedump, ma per poterla usare bisogna forzarne la compatibilità.

Per cui, morale della favola:
- per i firefox vecchi, c'è la funzionalità nativa.
- per i firefox più recenti, puoi tentare usando l'estensione.

18Shirt
19-06-2014, 12.01.00
http://www.netitaly.info/wp-content/uploads/2014/06/168af__mozilla-firefox-30-linux.jpg

Questa è la verione del mio FF. Quindi ho aperto il file install.rdf ed ho apportato le seguenti modifiche:

<em:targetApplication>
<Description> <!-- Firefox -->
<em:id>{ec8030f7-c20a-464f-9b0e-13a3a9e97384}</em:id>
<em:minVersion>1.5.0</em:minVersion>
<em:maxVersion>3.0.0</em:maxVersion>
<em:updateLink>http://www.dbai.tuwien.ac.at/user/pollak/webpagedump/webpagedump.xpi</em:updateLink>
</Description>
</em:targetApplication>

</Description>

</RDF>

A questo punto ho rizzipato il tutto mantenendo gli stessi nomi.
Ora rinomino il file aggiungendo .xpi

Vado in FF, gestione ocomponenti aggiuntivi e dico di installare questo file ma niente...dice che è danneggiato (o sbaglio qualcosa)

borgata
19-06-2014, 12.11.18
Così l'hai reso compatibile con firefox 3, come già ti era stato fatto notare da LoryOne in precedenza.
Scrivici 50.* così sei a posto per un bel po'.

Comunque non occorre estrarre e poi zippare di nuovo, puoi lavorare direttamente dentro l'archivio e poi salvarne i cambiamenti. Fai prima, e probabilmente c'è un rischio minore di sbagliare la procedura (per esempio non rischi di ricomprimere nel formato sbagliato).

PS: l'immagine è un po' troppo grande, usa il tag TIMG al posto di IMG o usa un link testuale.

18Shirt
19-06-2014, 12.28.43
Ho fatto come hai detto: quando vado in componenti aggiunti, aggiungi, ecc. lo carico ma mi esce l'avviso che non è compatibilecon FF 30.0

borgata
19-06-2014, 12.33.01
Puoi condividere il file così gli do un'occhiata?

Comunque come ti dicevo per installare l'estensione ti basta trascinarla dentro la finestra di firefox, senza andare in componenti aggiuntivi ecc...

LoryOne
19-06-2014, 13.42.32
Fai attenzione 18Shirt:
Estrai il file .rdf e modifica la versione massima con *(l'asterisco, ossia "All" in inglese, cioè "tutte").
Il file .xpi deve evere al suo interno il file .rdf modificato: Tutto il resto deve rimanere uguale.
Apri FF e trascina il file .xpi all'interno della scheda (oppure installa l'xpi come fai di solito, è lo stesso)
Sta tranquillo che l'installa, non prima di averti avvertito dell'incompatibilità dell'add-on e la forzatura da te imposta.
Se lanci FF dal terminale di Linux, devi fare attenzione ai percorsi che specifichi, che non sono nella forma classica di Windows, mentre firefox sarà lanciato semplicemente digitandone il nome.
Se lanci FF dalla shell di Windows, devi specificare il percoso entro il quale si trova FF e se tale percorso contiene degli spazi, l'intero percorso+nome del browser deve essere incluso tra doppi apici.
es:
"C:\Programmi\Mozilla Firefox\firefox.exe"

18Shirt
19-06-2014, 14.46.31
il file lo condivido qui: https://www.wetransfer.com/downloads/b36f40e0f749272b2d544c8046c2a56a20140619124445/42a4c56875bd5e947f65596949cf7ecb20140619124445/4f414d

borgata
19-06-2014, 17.53.40
Il file è corretto (estensione del file a parte), ma devi modificare maxversion come ti è stato detto.
Sarebbe stato meglio mi avessi passato il file pronto per l'installazione, ossia con l'estensione giusta e il maxversion corretto.

AMIGA
19-06-2014, 18.17.03
Il file è corretto (estensione del file a parte), ma devi modificare maxversion come ti è stato detto.
Sarebbe stato meglio mi avessi passato il file pronto per l'installazione, ossia con l'estensione giusta e il maxversion corretto.

Be io proprio uguali non li vedo, a parte come hai detto tu non ha rinominato il file webpagedump.zip in webpagedump.xpi, poi guardando l'archivio da dentro con WinRAR noto che, la cartella chrome in uno contiene il file "webpagedump.jar", l'altro invece il contenuto dell'archivio JAR

borgata
19-06-2014, 18.22.40
Questo mi era sfuggito, evidentemente ha decompresso tutto (come avevo detto, se modifica l'archivio senza decomprimerlo rischia di fare meno errori).
Vabbè, basta che segua le indicazioni che gli abbiamo dato e faccia tutto da capo (sono due operazioni sceme, ci perde 30 secondi esagerando).

AMIGA
19-06-2014, 20.19.40
Bene, ora modifico io lo screenshot troppo grande che ha postato ;)

AMIGA
20-06-2014, 00.06.39
Ho fatto qualche test, modificato il file webpagedump.xpi da WinRAR senza scompattare nulla, e poi installato senza problemi su Firefox 30.0. Fatto questo sono andato sul menu di Firefox e da Strumenti ho eseguito webpagedump che mi ha aperto subito un request per il percorso salvataggio, nella cartella salvata ho trovato 3 file: index.html, index.css e il file wpd_error.log che riportava quello che aveva scaricato.

18Shirt
20-06-2014, 10.07.21
Ciao a tutti. Quando ho scaricato il file .xpi, per estrarne i file, ho dovuto rinominarlo in zip (o rar). Ho estratto, ho apportato le modifiche. dal momento che la cartella la devo trasformare con estenzione .xpi ho dei grossi problemi in quanto non me la trasforma in archio compatto.

Se la comprimo da tasto destro, invia a cartella compressa mi trasforma la cartella in .zip.
Ho provato a rinominarla .xpi ma doventa un .xpi.zip (eseguibile con Zip).

LoryOne
20-06-2014, 10.24.25
Fai attenzione 18Shirt:
Il file .xpi deve evere al suo interno il file .rdf modificato: Tutto il resto deve rimanere uguale.
Il file .xpi NON E' una cartella, bensì un file zippato che contenga diversi altri files zippati.
Il file .xpi, quindi, lo devi considerare un archivio .zip a tutti gli effetti.
Per fare in modo che FF lo riconosca come pacchetto per l'installazione dell'add-on, lo devi rinominare semplicemente .xpi.

Supponi che tu abbia un archivio .zip che contenga al suo interno un file che necessita di modifica:
Per prima cosa avresti bisogno di un gestore di archivi zippati.
Il gestore aprirebbe l'archivio e ti mostrerebbe il contenuto.
Tu cliccheresti sul file da modificare e potrebbero succedere due cose:
1 - Si aprirebbe un applicativo che ti mostrerebbe il contenuto dezippato, ma che non ti consentirebbe modifiche: Alla chiusura, tutto rimarrebbe come prima;
2 - Si aprirebbe un applicativo che ti mostrerebbe il contenuto dezippato e che ti consentirebbe modifiche. Alla chiusura di tale applicativo, il gestore dell'archivio zippato, apporterebbe quelle modifiche al file di archivio, aggiornamendone il contenuto.

Ora:
Indipendentemente dai punti 1 e 2, tu devi:
1 - Rinominare .xpi in .zip.
2 - Utilizzare un gestore di files zippati a tua scelta.
3 - Estrarre il solo file .rdf ed agire su di esso.
4 - Trascinare il file modificato all'linterno della finestra del gestore
5 - Chiudere il gestore
6 - Rinominare l'archivio .zip nuovamente in .xpi

Infine, installare 'sto benedetto .xpi all'interno di FF.

Ed adesso spendi un poco di tempo in più per leggere quanto segue:
Il computer necessita di pratica e quest'ultima NON te la può inculcare nessuno.
Il computer necessita di un minimo di impegno da parte dell'utilizzatore.
Se cerchi aiuto in rete, lo troverai sicuramente, basta che un minimo d'impegno tu dimostri di mettercelo.
Se dimostri di mettercelo, non passare per impedito totale...E' una forma di rispetto per te stesso, oltre che per chi ti dedica attenzione.
Chi ti dedica attenzione, non deve sentirsi preso in giro.

Hai esordito con una richiesta da persona che un minimo di conoscenza ce l'ha in campo informatico; Ti abbiamo fornito tutte le informazioni di cui necessiti in maniera chiara, puntuale e schematica.
Da ora in poi, TU DEVI essere in grado di procedere.

Cordiali saluti

borgata
20-06-2014, 10.26.23
Come ti dicevamo (più volte!), non occorre estrarlo, basta aprirlo e modificarlo.

Comunque non devi rinominare il file per poterlo aprire con il gestore di archivi (a proposito, non hai ancora detto quale usi... 7zip? Winzip? Winrar? Cartelle compressi di Windows? ...), è sufficiente usare l' "Apri con..." e selezionare tra i programmi il gestore di archivi, assicurandoti che non sia vistata la casella "usa sempre questo programma ecc...".

Per il problema delle estensioni, assicurati che l'opzione "nascondi le estensioni per i tipi di file conosciuti" sia disabilitata (in ogni caso non serve se segui il precedente consiglio).

18Shirt
20-06-2014, 11.28.33
Grazie. A tutti...io vengo dalla grafica e tutto ciò che è programmazione lo sto imparando poco alla volta. Sono registrato da poco qui...ma sono anni che leggo con interesse i post.

Io sono convinto della collaborazione ma NON della pappa pronta. Se ci arrivo da solo, posso impare qualcosa...per questo non ho chiesto "me lo fate?".

Per rispetto a voi, per rispetto a chi, da sempre, posta quanto ha fatto e richiede un aiuto per capire dove sbaglia.

Vi farò sapere non appena sono riuscito nell'impresa.

AMIGA
20-06-2014, 13.51.44
Allora segui questi passaggi:

- Installa WinRAR
- Fai tasto destro Mouse su file case_change-1.0.rev44-fx.xpi
- Apri Con
- Ne request di scelta Scegli Gestione Archivi WinRAR
- Se WinRAR non è presente vai su sfoglia e lo vai a cercare (C:\Programmi\WinRAR\WinRAR.exe)
- Fatto questo vedrai tutto il contenuto di case_change-1.0.rev44-fx.xpi
- Con il mouse trascina il file install.rdf sul desktop e non chiudere il request
- Doppio click sul file install.rdf
- Apri Con
- Scegli di aprirlo con WordPAD, modifica la strinva e Salva.
- Ora torna sul request aperto, evidenzia il file install.rdf e premi il tasto Canc della tastiera (questo serve a eliminare il vecchio file, volendo si può anche sovrascrivere, ma così e sicuro che lo sostituisci)
- Fatto questo trascina il install.rdf modificato dentro il request aperto, questa operazione includerà il nuovo file dentro l'archivio case_change-1.0.rev44-fx.xpi
- Finito, ora il file case_change-1.0.rev44-fx.xpi è stato aggiornato.

borgata
20-06-2014, 14.07.32
Io ti consiglierei invece di installare 7zip (la versione gratuita di winrar è una versione di prova che ti assilla con la richiesta di licenza) e aprirei il file con l'editor di testo predefinito (F4 in 7zip).
Sempre che non abbia già un gestore d'archivi installato (ma a questa domanda non ha mai risposto).

La procedura è banale: apri il file con 7zip, selezioni il file install.rdf, clicchi F4, ti si apre il blocco note e modifichi maxversion come dicevamo, salvi e chiudi il file di testo. 7zip ti chiederà se aggiornare l'archivio e tu gli dici di si. Chiudi 7zip. Fatto.

18Shirt
20-06-2014, 14.53.44
Caspita...già dal mio ultimo messaggio avevo già modificato il file ed installato correttamente.

Il problema era nel non riuscire ad aprire il .xpi in quanto il compressore di routine non lo gestiva come formato. Per cui avendo tra le utility 7zip sono riuscito a fare il tutto.

Questa sera provo a scaricare una serie di file in batch. Le pagine singole le scarica molto bene.

borgata
20-06-2014, 15.08.04
Più che altro una cosa: dallo screenshot che hai inserito qualche post fa, vedo che stai usando ubuntu.
Con Linux la linea di comando funziona un po' diversamente, la bash è diversa dal prompt dos di windows.

18Shirt
20-06-2014, 22.15.43
Tranquillo borgata: quello era lo screenshot del pc dell'ufficio. Il mio ha Windows. E come dicevo sono riuscito a fare tutto.
Google lo scarica senza problemi.

I problemi, invece, ci sono con il sito che interessa a me...ho fatto delle prove e scarica solo un file wpd_error.txt

Riporta questo:

[wpdCommon.downloadFile]:
-> aSourceURL: t.kompass.com/_ui/desktop/theme-kompass/images/ebol/logo.png
-> aTargetFilename: C:\Users\18Shirt\Desktop\TEST\TEST WE BUMP\it_kompass_com_4416.0\logo.png
-> [Exception... "Not enough arguments [nsIWebBrowserPersist.saveURI]" nsresult: "0x80570001 (NS_ERROR_XPC_NOT_ENOUGH_ARGS)" location: "JS frame :: chrome://webpagedump/content/common.js :: wpdCommon.downloadFile :: line 723" data: no]
[wpdCommon.downloadFile]:
-> aSourceURL: http://prd-kc-sc-osm.cloudapp.net/osm/2/2/2.png
-> aTargetFilename: C:\Users\18Shirt\Desktop\TEST\TEST WE BUMP\it_kompass_com_4416.0\2.png
-> [Exception... "Not enough arguments [nsIWebBrowserPersist.saveURI]" nsresult: "0x80570001 (NS_ERROR_XPC_NOT_ENOUGH_ARGS)" location: "JS frame :: chrome://webpagedump/content/common.js :: wpdCommon.downloadFile :: line 723" data: no]
[wpdDOMSaver.saveHTMLDocument]
-> TypeError: aCSS.href is null

borgata
20-06-2014, 23.26.42
Hai verificato che la pagina venga visualizzata correttamente con il browser?
Altrimenti prova a fare un tentativo con la funzione nativa di firefox installandone una versione più vecchiotta (ora non ricordo da quale versione non funzioni più, prova con FF12, dovrebbe essere abbastanza sicuro).

18Shirt
20-06-2014, 23.31.24
Nel browser si visualizza alla perfezione. Provo da un altro pc con un browser più vecchio

borgata
21-06-2014, 10.00.39
Non solo con nil browser più vecchio, ma anche con la funzionalità integrata al posto di quella fornita dall'estensione.

RunDLL
21-06-2014, 14.03.24
Non capisco questa ostinazione! Vai su un forum che trattano Visual Basic chiedi quello che ti server, usi il file di Excel come database per cui non devi trascrivere niente, chi ti aiuterà sarà in grado di mettere le giuste pause così non si increccherà il computer.
Voglio dire uno che conosce Visual Basic ma anche Delphi te lo fa in 5 minuti.
Qui dentro non c'è nessuno in grado di farglierlo?

borgata
21-06-2014, 17.46.02
Beh ostinazione sarebbe stato voler usare per forza excel e VB. Ma francamente non mi sembra affatto la soluzione migliore, sempre che quel che chiede sia fattibile.
Certo, se queste non dovessero funzionare, allora come ultima spiaggia riproverei con Excel, del resto fare il lavoro a mano è impensabile.

Ora vediamo come va con l'ultima prova che manca.

18Shirt
21-06-2014, 18.01.49
Niente da fare: è prorpio il sito che non si fa scaricare per come è fatto con WebPageDump

borgata
21-06-2014, 19.03.02
aehm... non a caso ho sottolineato che avresti dovuto provare con la funzione nativa, non con webpagedump...

Non è comunque da escludere che webpagedump abbia apposite opzioni da linea di comando che consentano di scaricare correttamente, ma non conoscendo l'estensione non so proprio dirti, bisognerebbe leggere la documentazione e fare qualche prova.
Ma prima proverei con la funzione nativa, come dicevo.

18Shirt
21-06-2014, 19.39.09
Per funzione nativa intendi dalla pagina web, fare un salva con nome?

borgata
22-06-2014, 00.20.04
No, intendevo questo (http://www.wintricks.it/forum/showpost.php?p=1694621&postcount=45).

RunDLL
22-06-2014, 11.05.33
Beh ostinazione sarebbe stato voler usare per forza excel e VB.
A me invece sembra ostinazione, uno perchè ha anche dichiarato appunto di preferire farlo con VBA, due perchè sono 3 giorni che sta provando questo e quello senza giungere a nessun risultato ed, a mio modesto parere, così non arriverà mai a niente. Mentre avrebbe potuto già aver risolto da da un bel pezzo.
Adesso purtroppo non ho Visual Basic nè la possibilità di averlo se no te lo facevo io.

borgata
22-06-2014, 12.31.28
Sicuro che l'abbia dichiarato?
Da quel che ricordo, è semplicemente la prima soluzione che ha trovato e, dato che gli creava problemi, ha chiesto qui come sistemarla.
Però a mio parere non è assolutamente la soluzione migliore, chi fa il lavoro non è excel ma firefox (excel lancia semplicemente firefox ed avvia la procedura), quindi meglio usare firefox direttamente, se possibile.

Oltretutto non ho ancora ben capito se quella macro possa essere davvero utile: apre le pagine, ok, ma poi? Le salva? Le salva correttamente? 18Shirt dice solo che gli si blocca tutto, ma francamente dubito che la macro possa dire a firefox di salvare la pagina.
E se può farlo la macro, allora significa che firefox accetta questo comando e che è possibile farlo anche in altri modi.
Perchè, ricordiamoci, è firefox a fare il lavoro, e non excel, che si limita invece a richiamarlo.

A mio parere ci sta mettendo tanto ad arrivare ad un risultato perchè ha difficoltà a mettere mano alle cose, ma come lui stesso dice, solo mettendoci mano si impara.

Ormai deve solamente fare quella prova con la funzione nativa, ed eventualmente controllare se l'estensione ha qualche particolare opzione per salvare correttamente le pagine.
Se poi non si dovesse ottenere nulla, si cercherà un'altra strada.

RunDLL
22-06-2014, 13.57.52
Sì esattamente l'ha dichiarato, prima di tutto leggo attentamente quello che scrivono gli altri e fortunatamente ho anche una buona memoria: post n. 23 ultima riga.

18Shirt
22-06-2014, 14.43.15
No, intendevo questo (http://www.wintricks.it/forum/showpost.php?p=1694621&postcount=45).

Nessun risultato positivo: l'unico modo di avere una pagina .html con le informazioni complete è quella di salvare la pagina come Pagina web completa.

borgata
22-06-2014, 17.51.49
Spiegati meglio: cosa ottieni esattamente? Con quale versione di FF l'hai provato?

Rispondi anche alla domanda sul funzionamento della macro di excel che ti ho fatto nel mio precedente post.

Sì esattamente l'ha dichiarato, prima di tutto leggo attentamente quello che scrivono gli altri e fortunatamente ho anche una buona memoria: post n. 23 ultima riga.
Buona memoria ma cattiva capacità di interpretazione.
Ha scritto che aveva postato per trovare una semplice soluzione in VB (il che mi pare abbia perfettamente senso nel discorso che ho fatto prima), non che avrebbe preferito questa soluzione.
La soluzione che preferisce è quella che funziona! ;)

18Shirt
22-06-2014, 22.51.37
Ciao Borgata.
Qui di seguito ti allego il risultato: https://www.wetransfer.com/downloads/2ef63e35a1efb3ed618d08d8228b20a420140622204430/2e57a9cea61b1c2d02804c394348446820140622204431/27ba8e

troverai due file:
1) EasybusinessSalvaSempliceIn HTML è i salvatoaggio che ottengo dalla funzione
2) EasybusinessSalvaComePaginaWebCompleta è il risultato che ottengo salvando la pagina completa in web

Come noterai nel primo file si vede solo la maschera iniziale...quella che si copia anche da IE
Nel secondo file, scaricato con Mozilla con salva con nome copia pagina Web completa vedrai che le informazioni sono maggiori.

Preciso ch eho provato a scaricare le pagine con i vati Httrack e simili ma, nessuno, scarica queste pagine complete.

Quindi sto pensando che a questo punto convenga una macro che apra la pagina web e che estrapoli i campi che mi interessano.

borgata
23-06-2014, 00.23.05
Francamente non vedo come una MACRO potrebbe aiutarti, dato che agisce su excel, ma tu hai bisogno che agisca su firefox. Al più avresti bisogno di uno script da eseguire su firefox (sempre che tu abbia bisogno di firefox per aprire correttamente quelle pagine).

Per quanto riguarda i due file, io vedo:
EasybusinessSalvaSempliceIn: pare salvi un po' di informazioni, ma senza foglio di stile associato, quindi solo il testo del link.
EasybusinessSalvaComePaginaWebCompleta: salva solo l'intestazione della pagina, completo di immagini e fogli di stile, ma comunque solo l'intestazione.

Questi comunque sono i risultati ottenuti salvando normalmente (ossia aprendo la pagina dal browser e poi salvandola).

Quello che però ti avevo chiesto prima era il risultato della MACRO (ovviamente con pochi campi, altrimenti ti va tutto in palla) e il risultato della funzione nativa di firefox (e con quale versione di FF l'hai usata).

Devi fare più attenzione alle domande che ti si pongono e cercare di rispondere punto per punto, altrimenti qui si rischia di rimanere giorni a rifare sempre le stesse domande.

Alexsandra
23-06-2014, 01.04.25
con una macro si può scaricare la pagina web, ma sinceramente non ho ancora capito cosa vuole 18S. quel famigerato sito che non si vuole far scaricare è una banca dati, perchè vuoi scaricarlo come pagina web e non il solo contenuto???

ti avevo lasciato una macro tempo fa e hai risposto

Ho fatto la prova. Con un sito "normale" normale funzione alla grande.
Con il sito di cui ho i link non va. Non so come spiegarlo tecnicamente...ma ci provo.

mi fai vedere uno di questi link?

no perchè se tu hai l'accesso a questo sito e i dati sono in una sezione nascosta visibile solo dopo il login (= cookies), col piffero che li scarichiamo.

comunque a mio avviso ci sono informazioni frammentarie, servono delle informazioni più dettagliate, degli screenshot per vedere cosa c'è da scaricare, così si sta andando alla cieca, mi domando cosa centri il browers, perchè scaricare la pagina completa se quello che interessa sono i dati contenuti. e poi si deve considerare che vuole scaricare 150.000 link.
lavorare da remoto con una mole di connessioni del genere tiri il collo a un signor pc dotato di un gran processore. non so ma a me mi pare tutto un gran casino.
cioè è illogico, se uno vuole scaricare i dati da una pagina web, fornisce il link e si prepara il codice, quà invece dopo 87 post si sa meno del primo.

LoryOne
23-06-2014, 08.10.31
Credo che il discorso sia piuttosto semplice, solo che 18Shirt non è pratico.
Se scarichi una pagina web, al suo interno possono essere contenuti link su altri percorsi che il browser si preoccupa di risolvere, renderizzando in toto la pagina che presenta all'utente, praticamente la pagina alla quale corrisponde l'url che specifichi.
Il foglio di stile, ad esempio, è uno di quei link che verrà scaricato senza essere interpretato, ma può essere uno di quei link anche una semplice immagine...
Se il software di rendering della pagina non si preoccupa di scaricare anche i link connessi all'unico url che si specifica, cio che si otterrà sarà semplicemente la pagina presente sul server non elaborata.
Inoltre, credo che la macro presente nel foglio di excel altro non faccia che interfacciarsi al motore di render di IE, non di FF.
Inoltre, una volta scaricato il contenuto in locale, saranno tradotti in locale anche gli url ?
Oppure una volta aperta la pagina in locale, il browser in uso si preoccuperà di renderizzare la pagina collegandosi ad internet per elaborarli ?

LoryOne
23-06-2014, 08.16.38
...

mi fai vedere uno di questi link?



Infatti.
18Shirt è geloso dei suoi url :)

borgata
23-06-2014, 09.48.06
Inoltre, credo che la macro presente nel foglio di excel altro non faccia che interfacciarsi al motore di render di IE, non di FF.
Questo è il punto.

Immagino anche io la stessa cosa, a meno che la MACRO non si occupi di richiamare il browser di default, motivo per cui ho chiesto a 18Shirt di fare una prova con la MACRO per capire cosa effettivamente facesse.

Da quel che ho capito (ma potrei sbagliarmi) gli serve Firefox perchè con IE la pagina non viene renderizzata correttamente.

Poter provare con i suoi link ovviamente aiuterebbe, ma immagino che sia materiale interno per cui non lo possa passare. Sentiamo che dice 18Shirt a riguardo.

Oltretutto non ho ben capito una cosa, ossia cosa dovrà farne di questo materiale. Inizialmente pensavo volesse conservare copia completa delle pagine, ma poi ha parlato di estrarre dei dati.

18Shirt
23-06-2014, 09.50.16
Francamente non vedo come una MACRO potrebbe aiutarti, dato che agisce su excel, ma tu hai bisogno che agisca su firefox. Al più avresti bisogno di uno script da eseguire su firefox (sempre che tu abbia bisogno di firefox per aprire correttamente quelle pagine).

Per quanto riguarda i due file, io vedo:
EasybusinessSalvaSempliceIn: pare salvi un po' di informazioni, ma senza foglio di stile associato, quindi solo il testo del link.
EasybusinessSalvaComePaginaWebCompleta: salva solo l'intestazione della pagina, completo di immagini e fogli di stile, ma comunque solo l'intestazione.

Questi comunque sono i risultati ottenuti salvando normalmente (ossia aprendo la pagina dal browser e poi salvandola).

Quello che però ti avevo chiesto prima era il risultato della MACRO (ovviamente con pochi campi, altrimenti ti va tutto in palla) e il risultato della funzione nativa di firefox (e con quale versione di FF l'hai usata).

Devi fare più attenzione alle domande che ti si pongono e cercare di rispondere punto per punto, altrimenti qui si rischia di rimanere giorni a rifare sempre le stesse domande.

La versione di FF usata per la funzione nativa è la 3. La macro postata da Alexandra funziona ma mi riporta i dati dell'intestazione non quelli a cui potrei accedere una volta loggato.

Entrambi i tentativi li ho fatti andando sul sito e loggandomi (chiaramente).

Io potrei avere tutti i dati possibili ed immaginabili di quelle pagine: selezione l'elenco (100 risultati per pagina) li trascino in excel e mi si copiano.

Unica pecca: i nomi delle aziende risultano dei collegamenti ipertestuali che puntano alla pagina in cui ci sono maggiori approfondimenti (indirizzo web, indirizzo mail).

Per questo nasce il discorso della macro: fatto un elenco in Excel la macro mi dovrebbe estrapolare i dati delle connessioni su Foglio1, apre in FF la pagina, seleziona i dati che mi interessano, li copia e li riporta nel Foglio1 in B1:B (fin quando serve).
In IE, l'apertura della pagina, nonostante il log, non fa copiare niente: limite di IE? o FF avanzato?

borgata
23-06-2014, 10.02.43
Il login potrebbe essere il problema.
Magari bisogna inserire nella MACRO una procedura di autenticazione.

FF3 è un po' vecchiotto, hai verificato che riesca ad accedere tranquillamente alla pagina nell'uso normale? Di IE, che versione stai usando?

La macro non può lavorare su firefox, a meno che firefox non fornisca dei servizi in tal senso.

Puoi essere un po' più esplicito sul tipo di dati che ti servono e cosa intendi farne?

LoryOne
23-06-2014, 10.46.34
...
Per questo nasce il discorso della macro: fatto un elenco in Excel la macro mi dovrebbe estrapolare i dati delle connessioni su Foglio1, apre in FF la pagina, seleziona i dati che mi interessano, li copia e li riporta nel Foglio1 in B1:B (fin quando serve).
In IE, l'apertura della pagina, nonostante il log, non fa copiare niente

Come corri amico mio !
La pagina che appare dopo il login, crea un cookie in locale ?
La pagina che appare dopo il login, crea una sessione in remoto ?
I link che hai nel foglio di Excel sono già quelli ai quali potresti accedere dopo il login, oppure no ?

Inoltre: Quello che t'interessa, in realtà è un copia-incolla di parte della pagina ?

18Shirt
23-06-2014, 11.08.19
Il login potrebbe essere il problema.
Magari bisogna inserire nella MACRO una procedura di autenticazione.

FF3 è un po' vecchiotto, hai verificato che riesca ad accedere tranquillamente alla pagina nell'uso normale? Di IE, che versione stai usando?

La macro non può lavorare su firefox, a meno che firefox non fornisca dei servizi in tal senso.

Puoi essere un po' più esplicito sul tipo di dati che ti servono e cosa intendi farne?

Io di solito sia per IE che per FF ho le ultime versioni. Dietro tuo consiglio ho fatto delle prove usando sia versioni preistoriche che versioni "mezzane" come quelle indicate.

Il tipo di dati che mi interessano sono semplicemente quelli relativi all'anagrafica ed intendo complementare le schede che ho in mio possesso.

18Shirt
23-06-2014, 11.20.44
Come corri amico mio !
La pagina che appare dopo il login, crea un cookie in locale ?
La pagina che appare dopo il login, crea una sessione in remoto ?
I link che hai nel foglio di Excel sono già quelli ai quali potresti accedere dopo il login, oppure no ?

Inoltre: Quello che t'interessa, in realtà è un copia-incolla di parte della pagina ?

Nei cookie locali è presente quello del sito che mi interessa. Per i link il discorso è complicato: vedo di spiegare. il sito raccoglie anagrafiche di aziende da ogni parte del mondo.

quando ci si logga vi è la possibilità di creare delle liste. Es. creo la lista gelatai. Questa ha 1000 aziende. Un passo indietro:

vado sul sito www.pippo.it.
mi loggo ed arrivo a it.pippo.it

vado dove ho le mie cartelle (ogni cartella è una ricerca di aziende) e sono disponibili all'indirizzo

it.pippo.it/my-account/easybusiness/strategies#/

entro nella cartella gelatai e l'indirizzo è:
it.pippo.it/easybusiness/#/strategy/8808919627858

Qui posso scegliere se ragguppare 20, 50 o 100 per pagina.
Poniamo che siano 1000 gelatai. Clikko sul primo nome e l'indirizzo web che appare è it.pippo.it/easybusiness/#/detail/0/0

a fianco vedo che ho 1000 pagine (tante quanti records ha la mia cartella).
Avanzando di pagina in pagina gli indirizzi variano in questo modo:
it.pippo.it/easybusiness/#/detail/0/0
it.pippo.it/easybusiness/#/detail/1/0
it.pippo.it/easybusiness/#/detail/2/0
it.pippo.it/easybusiness/#/detail/3/0

e via di seguito.

Quindi ho fatto la prova: mi loggo, apro il file di excel, clicco sul primo link e mi apre la pagina dell'azienda di riferimento. Quindi è come se ci fosse un corridoio preferenziale aperto: tutto ciò che viene fatto dopo il log alla pagina ti fa accedere sui records della cartella selezionata.

LoryOne
23-06-2014, 12.03.24
Chiaro:
Prima ti devi loggare ed a quel punto il sito da remoto crea il cookie in locale, individuandoti come utente che ha effettuato il log-in.
Quando clicchi su uno dei tanti link nel foglio di Excel, poichè è FF il browser aperto, è lui a prendere in gestione il collegamento ed aprirti la pagina di riferimento, poichè il cookie fornisce informazioni di accesso al server attraverso il browser. (il corridoio preferenziale a cui facevi riferimento)
Ora: Non puoi accedere direttamente all url www.pippo.it/easybusiness/#/detail/0/0, poichè non c'è il cookie relativo alla sessione aperta.
Qual'è il contenuto del cookie e dove si trova ?

18Shirt
23-06-2014, 12.18.19
Nome: ROUTEID
Contenuto: .2
Percorso: /
Invia per: Qualunque tipo di connessione
Scadenza: A fine sessione

LoryOne
23-06-2014, 12.20.13
Dove si trova, ossia il percorso locale ?
il contenuto, aperto con notepad, è leggibile ?

18Shirt
23-06-2014, 12.21.41
Ce ne sono altri di cookies:

Nome: timezoneoffset
Contenuto: -120
Scadenza: A fine sessione
Percorso: /my-account/easybusiness/
Invia per: Qualunque tipo di connessione
Scadenza: A fine sessione