Ciao
Il lavoro l'ho fatto da solo.
I file XML da cui sono partito sono quelli che avevo pubblicato l'ultima volta con il pack di WHDLoad circa un annetto fa (mi pare), c'è un posto vecchio.
Le sorgenti da cui ho popolato i metadati sono Lemon Amiga
http://www.lemonamiga.com/ e HOL
http://hol.abime.net/ che sono appunto i siti di cui ho messo gli ID all'interno dei files XML di HS.
Mi sono fatto degli script PowerShell che si parsano l'XML e prendono i dati dai siti. Una prima versione c'è in attach nel primo post. Non ho postato le altre versioni perchè sono un po' "incasinate", dovrei ripulirle (come codice) prima di postarle.
Ti allego uno di questi script, il più semplice di tutti, che consente solo di verificare cosa c'è e cosa manca da un file XML di HS (Amiga) se vuoi farti un'idea.
Ho fatto in questo modo, aggiungere gli ID direttamente dentro l'XML, così per aggiornare i dati mancanti basta che lancio uno script e se c'è almeno uno di questi due ID prende i dati direttamente dai siti, non sostituendo ma soltanto integrando ciò che manca. Se l'ID manca cerca sul sito di WHDLoad il gioco e ricava l'ID di LemonAmiga o HOL direttamente. Se non lo trova non fa nulla. Alla fine tramite una tabella di trascodifica sostituisco il genre preso dai siti con un genre standard di HS. Su questo mapping ho alcune perplessità ma dopo mi spiego meglio.
In pratica con un mapping automatico dei nomi dei giochi sono riuscito ad avere i dati completi di circa 2600-2700 giochi, gli altri li ho mappati a mano, inserendo l'ID di LemonAmiga o HOL nell'XML (in vari modi, tra script, Excel e files CSV) poi lanciando lo script PS ha integrato i metadati dai siti.
Ieri sera ho scoperto che anche sul sito di HS ne stanno mantenedo uno
http://www.hyperspin-fe.com/forums/topi ... se-thread/ ma non hanno fatto la parte di WHDLoad.
Quando avrò un attimo provo a confrontarli per vedere le differenze. A parte i nomi dei giochi, dove io ho volutamente mantenuto l'esatto set di PD, loro hanno un set pulito e dovrebbero aver inserito i generi in modo più accurato del mapping che ho fatto io, convertendo il genere presente sui siti.
Cmq, al termine penso che posterò gli XML e se riesco a pulirli anche gli script, per aiutare anche (magari...) altri a generare versioni aggiornate (e magari sempre più accurate) degli XML in futuro.
Attualmente un'altra cosa da rivedere sarebbe il fatto che, cercando i giochi sul sito di WHDLoad
http://whdload.de/games/all.html talvolta ci sono puntamenti ad ID multipli per il medesimo gioco. Questo dipende dal fatto che spesso HOL e talvotla LemonAmiga hanno 2 ID differenti per le versioni AGA ed ECS, e se c'è una terza per CD32, a volte per CDTV. Questi ID multipli andrebbero modificati lascando solo l'ID corretto.
Un'altra "figata" è che con lo script se ho i metadati sbagliati su uno o più giochi, metto l'ID corretto, cancello i metadati esistenti, lancio lo script e lui prende giù quelli corretti

Attualmente solo 19 giochi su 3303 sono senza ID, e sono questi:
Codice: Seleziona tutto
name description idlemon idhol cloneof
---- ----------- ------- ----- -------
AdventuresOfGenlockHolmes_v1.0 Adventures Of Genlock Holmes
AdventuresOfQuik&Silva_v1.1 Adventures of Quik and Silva
AdventuresOfWillyBeamish_v1.2_1814 Adventures of Willy Beamish
BombPacCD32_v1.0_AGA Bomb Pac (CD32, AGA)
BombPacCD32_v1.0_AGA_Aminet Bomb Pac Aminet (CD32, AGA) BombPacCD32_v1.0_AGA
CannonFodderNewCampaign_v1.0 Cannon Fodder New Campaign
FastBrain_v0.2_Pl FastBrain PL
FlightSimulator2&SceneryDisk13_v1.0_0329 Flight Simulator 2 Scenery Disk 13
FlightSimulator2&SceneryDisk14_v1.0_0329 Flight Simulator 2 Scenery Disk 14
ForgottenMine_v1.0 Forgotten Mine
ItCameFromTheDesert2_v2.0 It Came From the Desert II - Antheads
Jet&SceneryDisk13_v1.0 Jet & Scenery Disk 13
Jet&SceneryDisk14_v1.0 Jet & Scenery Disk 14
MrMenOlympics_v1.1 Mr Men Olympics
NuxeliaDemo_v1.0 Nuxelia Demo
Roboter_v1.0_De Roboter DE
Starbirds_v1.1 Starbirds
SuperStreetFighter2DX_v1.1_AGA Super Street Fighter 2 DX (AGA)
TenPinBowling_v0.1_Arcadia Ten Pin Bowling (Arcadia)
Non hai i permessi necessari per visualizzare i file allegati in questo messaggio.