Tasca #8476
tancatExportació en format csv de la base de dades de la nova cançó
Descripció
Per valorar la continuïtat del projecte, necesstitem una exportació en format csv de tota la base de dades
Fitxers
JP Actualitzat per Javier Planella fa quasi 2 anys
- Estat ha canviat de Creada a En curs
JP Actualitzat per Javier Planella fa quasi 2 anys
- S'ha afegit Fitxer materies.csv materies.csv
- S'ha afegit Fitxer kzones.csv kzones.csv
- S'ha afegit Fitxer ktitols.csv ktitols.csv
- S'ha afegit Fitxer ktipus.csv ktipus.csv
- S'ha afegit Fitxer ktipbdd.csv ktipbdd.csv
- S'ha afegit Fitxer krecursos.csv krecursos.csv
- S'ha afegit Fitxer kpais.csv kpais.csv
- S'ha afegit Fitxer kfons.csv kfons.csv
- S'ha afegit Fitxer kambit.csv kambit.csv
- S'ha afegit Fitxer formats.csv formats.csv
- Data de venciment s'ha establert a 30-06-2024
Ajunto los ficheros con la exportación de las tablas principales
JP Actualitzat per Javier Planella fa quasi 2 anys
- Assignat a ha canviat de Javier Planella a Teresa Santos
TS Actualitzat per Teresa Santos fa quasi 2 anys
- Assignat a ha canviat de Teresa Santos a Javier Planella
Podem tenir la base de dades sencera en format csv?
JP Actualitzat per Javier Planella fa quasi 2 anys
- S'ha afegit Fitxer bbdd_nova_canso.csv bbdd_nova_canso.csv
JP Actualitzat per Javier Planella fa quasi 2 anys
- S'ha afegit Fitxer bbdd_nova_canso_totes_les_dades.csv bbdd_nova_canso_totes_les_dades.csv
Sentencia SQL
SELECT 0autdoc.*, docus.*, autors.*, 0matdoc.*, materies.*
FROM 0autdoc
LEFT JOIN docus ON 0autdoc.id_docus = docus.id_docus
LEFT JOIN autors ON 0autdoc.autad = autors.idautor
LEFT JOIN 0matdoc ON docus.id_docus = 0matdoc.id_docus
LEFT JOIN materies ON 0matdoc.matmd = materies.idmateria;
TS Actualitzat per Teresa Santos fa quasi 2 anys
- S'ha afegit Fitxer Exemple d_exportació correcte_bbdd_NC.xlsx Exemple d_exportació correcte_bbdd_NC.xlsx
Aquesta darrera exportació no té un format correcte per poder seguir treballant en l’inventari d’aquest fons i tenir una bona base per a la migració a qualsevol altre interfície.
L’exportació ha generat línies duplicades quan un mateix camp port oferir més d’una entrada, això passa en autors i en tema o matèria.
El que necessitem és una única línia per registre i quan es doni el cas d’un registre que té més d’un valor per un mateix camp, aquest ha d’anar en una única cel·la separat per “;”. El que demanem és el comportament normal d’una extracció en format .csv
En excel adjunt tens un exemple actual i com ha der en forma correcte. (Exemple d'exportació correcte_bbdd_NC.xsl)
Entenem que potser l’estructura d’una base de dades tan antiga amb tantes taules no és fàcil de treballar, si més no, a veure si amb programació és possible agafar aquesta taula i deixar-la correcte.
JP Actualitzat per Javier Planella fa quasi 2 anys
Entendiendo que la última exportación de datos en formato Excel puede no estar en el formato óptimo para continuar trabajando y prepararlo para una posible migración a otras interfaces.
Proporcio algunas instrucciones para ayudarles a manipular estos datos en Excel de manera eficaz:
indicando a chatGPT la siguiente instruccion:
agrupar valores repetidos en Excel en base a una columna, y concatenar valores diferentes en el resto de las columnas en una única celda separados por ;, puedes seguir estos pasos:
JP Actualitzat per Javier Planella fa quasi 2 anys
- Assignat a ha canviat de Javier Planella a Teresa Santos
JP Actualitzat per Javier Planella fa quasi 2 anys
- Assignat a ha canviat de Teresa Santos a Javier Planella
TS Actualitzat per Teresa Santos fa quasi 2 anys
- Assignat a ha canviat de Javier Planella a Teresa Santos
Hem començat a treballar sobre la taula bbdd_nova_canso_totes_les_dades.csv. Aplicant aquestes dues fórmules, de moment hem aconseguit obtenir una línia per a cadascun dels registres
=SI(C13539=C13538;" ";UNIRCADENAS(" ; ";VERDADERO;UNICOS(DESREF(U13539;0;0;CONTAR.SI.CONJUNTO(C:C;C13539);1))))
=SI(C13539=C13538;" ";UNIRCADENAS(" ; ";VERDADERO;UNICOS(DESREF(Q13539;0;0;CONTAR.SI.CONJUNTO(C:C;C13539);1))))
Ara incorporarem a algunes de les columnes que només presentes valors numèrics el valor textual, per obtenir una millor visualització.
Després passarem a fer un mostreig per veure si realment aquesta exportació és vàlida i decidirem com continuar el projecte.
TS Actualitzat per Teresa Santos fa quasi 2 anys
- Assignat a ha canviat de Teresa Santos a Javier Planella
Fet el mostreig, comprovem que inicialment no s'ha exportat la base de dades al complert, falten registres. Exemple: El registre https://www.bib.uab.cat/comunica/nc/titol.php?id=480105 o el https://www.bib.uab.cat/comunica/nc/titol.php?id=480106 no es troben a la taula bbdd_nova_canso_totes_les_dades.csv. Si us plau, necessitem una nova extracció.
JP Actualitzat per Javier Planella fa més d'un any
Debido al diseño de la BBDD no es posible obtener los resultados esperados mediante SQL.
Por tanto hay que realizar una programacion especifica con PHP para la trasposicion de filas a columnas y posteriormente formato .csv
ejemplo: (se puede cambiar el id para verificar el resto de los registros)
visualizacion de formato de filas a columnas:
https://www.bib.uab.cat/comunica/nc/int/listado.php?id=102
visualizacion de formato solo en columnas:
https://www.bib.uab.cat/comunica/nc/int/listado_total.php?id=102
TS Actualitzat per Teresa Santos fa més d'un any
A nivell de dades, l'exemple https://www.bib.uab.cat/comunica/nc/int/listado_total.php?id=102 seria correcte, observem que hi ha tota la informació que necessitem. Seguim constatant que el format de sortida no és correcte i no ens permetrà treballar. Els camps que tenen més d'un valor no hi ha cap tipus de comandament de separació, hauria de ser un punt i coma (;). Nosaltres hem fet l'acte simple d'enganxar-ho i veiem que origina salts de fila per a cada valor d’un mateix camp i combina cel·les i això si que invalida qualsevol acció posterior per treballar amb una taula. Insistim que ha d'haver-hi una única fila per ID.
JP Actualitzat per Javier Planella fa més d'un any
Teresa,
solo confirmame que el resultado es correcto, y acabo la programación para que se genere la exportacion en formato .csv
De tal manera que las columnas esten separadas por ; y en caso de que en una celda existan diferentes valores, estos esten separados por otro caracter (ej: #)
JP Actualitzat per Javier Planella fa més d'un any
- S'ha afegit Fitxer export_nova_canço.xls export_nova_canço.xls
URL's
1) Datos de un solo registro
https://www.bib.uab.cat/comunica/nc/int/listado_total_id.php?id=662 (cambiar numero 662 por cualquier otro)
2) exportacion en pantalla de todos los datos
https://www.bib.uab.cat/comunica/nc/int/listado_total.php
3) exportacion en formato excel:
https://www.bib.uab.cat/comunica/nc/int/report.php
Adjunto fichero export_nova_canço.xls con la exportacion de todos los datos
TS Actualitzat per Teresa Santos fa més d'un any
Ara està casi correcte. A mi em queda el dubte dels camps amb valors repetits. Exemple: Correo Catalán, El,Espinàs, Josep Maria,Porter-Moix, Miquel,Magda,Cinta, Maria,4 Gats, Els,Capri, Joan,. La pregunta és, alhora de fer servir una nova interfície, com li podrem dir que es tracta de valors diferenciats, si tenen la mateixa separació pel que fa a un nom que porta articles. Per això el que hem anat sol·licitant era separació per punt i com.
Ara :Correo Catalán, El,Espinàs, Josep Maria,Porter-Moix, Miquel,Magda,Cinta, Maria,4 Gats, Els,Capri, Joan,
Correcte : Correo Catalán, El; Espinàs, Josep Maria ; Porter-Moix, Miquel ;Magda,Cinta, Maria ; 4 Gats, Els ; Capri, Joan
JP Actualitzat per Javier Planella fa més d'un any
- S'ha afegit Fitxer export_nova_canço (1).xls export_nova_canço (1).xls
Modificada la programacion.
Adjunto nueva exportacion en formato excel (disponible a traves de la URL: https://www.bib.uab.cat/comunica/nc/int/report.php)
TS Actualitzat per Teresa Santos fa més d'un any
Ara sembla que està correcte. Passem a fer un nou mostreig.
JP Actualitzat per Javier Planella fa més d'un any
- Assignat a ha canviat de Javier Planella a Teresa Santos
BP Actualitzat per Beatriu Piera fa 2 mesos
- Estat ha canviat de En curs a Anul·lat