Projecte

General

Perfil

Accions

Tasca #8476

tancat
TS TS

Exportació en format csv de la base de dades de la nova cançó

Tasca #8476: Exportació en format csv de la base de dades de la nova cançó

Afegit per Teresa Santos fa quasi 2 anys. Actualitzat fa 2 mesos.

Estat:
Anul·lat
Prioritat:
Normal
Assignat a:
Teresa Santos
Categoria:
Gestió de la col·lecció
Temàtica prevista:
Inici:
02-04-2024
Data de venciment:
30-06-2024
Paraula clau:

Descripció

Per valorar la continuïtat del projecte, necesstitem una exportació en format csv de tota la base de dades


Fitxers

materies.csv (43.9 KB) materies.csv Javier Planella, 02-04-2024 16:00
kzones.csv (148 Bytes) kzones.csv Javier Planella, 02-04-2024 16:00
ktitols.csv (101 KB) ktitols.csv Javier Planella, 02-04-2024 16:00
ktipus.csv (720 Bytes) ktipus.csv Javier Planella, 02-04-2024 16:00
ktipbdd.csv (165 Bytes) ktipbdd.csv Javier Planella, 02-04-2024 16:00
krecursos.csv (25.9 KB) krecursos.csv Javier Planella, 02-04-2024 16:00
kpais.csv (3.1 KB) kpais.csv Javier Planella, 02-04-2024 16:00
kfons.csv (24.8 KB) kfons.csv Javier Planella, 02-04-2024 16:00
kambit.csv (255 Bytes) kambit.csv Javier Planella, 02-04-2024 16:00
formats.csv (147 Bytes) formats.csv Javier Planella, 02-04-2024 16:00
bbdd_nova_canso.csv (1.78 MB) bbdd_nova_canso.csv Javier Planella, 29-05-2024 10:53
bbdd_nova_canso_totes_les_dades.csv (5.07 MB) bbdd_nova_canso_totes_les_dades.csv Javier Planella, 29-05-2024 13:21
Exemple d_exportació correcte_bbdd_NC.xlsx (9.95 KB) Exemple d_exportació correcte_bbdd_NC.xlsx Teresa Santos, 06-06-2024 11:09
export_nova_canço.xls (4.72 MB) export_nova_canço.xls Javier Planella, 01-07-2024 13:08
export_nova_canço (1).xls (4.7 MB) export_nova_canço (1).xls Javier Planella, 02-07-2024 10:54

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #1

  • Estat ha canviat de Creada a En curs

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #2

Ajunto los ficheros con la exportación de las tablas principales

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #3

  • Assignat a ha canviat de Javier Planella a Teresa Santos

TS Actualitzat per Teresa Santos fa quasi 2 anys Accions #4

  • Assignat a ha canviat de Teresa Santos a Javier Planella

Podem tenir la base de dades sencera en format csv?

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #5

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #6

Sentencia SQL

SELECT 0autdoc.*, docus.*, autors.*, 0matdoc.*, materies.*
FROM 0autdoc
LEFT JOIN docus ON 0autdoc.id_docus = docus.id_docus
LEFT JOIN autors ON 0autdoc.autad = autors.idautor
LEFT JOIN 0matdoc ON docus.id_docus = 0matdoc.id_docus
LEFT JOIN materies ON 0matdoc.matmd = materies.idmateria;

TS Actualitzat per Teresa Santos fa quasi 2 anys Accions #7

Aquesta darrera exportació no té un format correcte per poder seguir treballant en l’inventari d’aquest fons i tenir una bona base per a la migració a qualsevol altre interfície.

L’exportació ha generat línies duplicades quan un mateix camp port oferir més d’una entrada, això passa en autors i en tema o matèria.

El que necessitem és una única línia per registre i quan es doni el cas d’un registre que té més d’un valor per un mateix camp, aquest ha d’anar en una única cel·la separat per “;”. El que demanem és el comportament normal d’una extracció en format .csv
En excel adjunt tens un exemple actual i com ha der en forma correcte. (Exemple d'exportació correcte_bbdd_NC.xsl)

Entenem que potser l’estructura d’una base de dades tan antiga amb tantes taules no és fàcil de treballar, si més no, a veure si amb programació és possible agafar aquesta taula i deixar-la correcte.

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #8

Entendiendo que la última exportación de datos en formato Excel puede no estar en el formato óptimo para continuar trabajando y prepararlo para una posible migración a otras interfaces.
Proporcio algunas instrucciones para ayudarles a manipular estos datos en Excel de manera eficaz:

indicando a chatGPT la siguiente instruccion:

agrupar valores repetidos en Excel en base a una columna, y concatenar valores diferentes en el resto de las columnas en una única celda separados por ;, puedes seguir estos pasos:

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #9

  • Assignat a ha canviat de Javier Planella a Teresa Santos

JP Actualitzat per Javier Planella fa quasi 2 anys Accions #10

  • Assignat a ha canviat de Teresa Santos a Javier Planella

TS Actualitzat per Teresa Santos fa quasi 2 anys Accions #11

  • Assignat a ha canviat de Javier Planella a Teresa Santos

Hem començat a treballar sobre la taula bbdd_nova_canso_totes_les_dades.csv. Aplicant aquestes dues fórmules, de moment hem aconseguit obtenir una línia per a cadascun dels registres

=SI(C13539=C13538;" ";UNIRCADENAS(" ; ";VERDADERO;UNICOS(DESREF(U13539;0;0;CONTAR.SI.CONJUNTO(C:C;C13539);1))))
=SI(C13539=C13538;" ";UNIRCADENAS(" ; ";VERDADERO;UNICOS(DESREF(Q13539;0;0;CONTAR.SI.CONJUNTO(C:C;C13539);1))))

Ara incorporarem a algunes de les columnes que només presentes valors numèrics el valor textual, per obtenir una millor visualització.

Després passarem a fer un mostreig per veure si realment aquesta exportació és vàlida i decidirem com continuar el projecte.

TS Actualitzat per Teresa Santos fa quasi 2 anys Accions #12

  • Assignat a ha canviat de Teresa Santos a Javier Planella

Fet el mostreig, comprovem que inicialment no s'ha exportat la base de dades al complert, falten registres. Exemple: El registre https://www.bib.uab.cat/comunica/nc/titol.php?id=480105 o el https://www.bib.uab.cat/comunica/nc/titol.php?id=480106 no es troben a la taula bbdd_nova_canso_totes_les_dades.csv. Si us plau, necessitem una nova extracció.

JP Actualitzat per Javier Planella fa més d'un any Accions #13

Debido al diseño de la BBDD no es posible obtener los resultados esperados mediante SQL.

Por tanto hay que realizar una programacion especifica con PHP para la trasposicion de filas a columnas y posteriormente formato .csv

ejemplo: (se puede cambiar el id para verificar el resto de los registros)
visualizacion de formato de filas a columnas:
https://www.bib.uab.cat/comunica/nc/int/listado.php?id=102

visualizacion de formato solo en columnas:
https://www.bib.uab.cat/comunica/nc/int/listado_total.php?id=102

TS Actualitzat per Teresa Santos fa més d'un any Accions #14

A nivell de dades, l'exemple https://www.bib.uab.cat/comunica/nc/int/listado_total.php?id=102 seria correcte, observem que hi ha tota la informació que necessitem. Seguim constatant que el format de sortida no és correcte i no ens permetrà treballar. Els camps que tenen més d'un valor no hi ha cap tipus de comandament de separació, hauria de ser un punt i coma (;). Nosaltres hem fet l'acte simple d'enganxar-ho i veiem que origina salts de fila per a cada valor d’un mateix camp i combina cel·les i això si que invalida qualsevol acció posterior per treballar amb una taula. Insistim que ha d'haver-hi una única fila per ID.

JP Actualitzat per Javier Planella fa més d'un any Accions #15

Teresa,

solo confirmame que el resultado es correcto, y acabo la programación para que se genere la exportacion en formato .csv
De tal manera que las columnas esten separadas por ; y en caso de que en una celda existan diferentes valores, estos esten separados por otro caracter (ej: #)

JP Actualitzat per Javier Planella fa més d'un any Accions #16

URL's

1) Datos de un solo registro
https://www.bib.uab.cat/comunica/nc/int/listado_total_id.php?id=662 (cambiar numero 662 por cualquier otro)

2) exportacion en pantalla de todos los datos
https://www.bib.uab.cat/comunica/nc/int/listado_total.php

3) exportacion en formato excel:
https://www.bib.uab.cat/comunica/nc/int/report.php

Adjunto fichero export_nova_canço.xls con la exportacion de todos los datos

TS Actualitzat per Teresa Santos fa més d'un any Accions #17

Ara està casi correcte. A mi em queda el dubte dels camps amb valors repetits. Exemple: Correo Catalán, El,Espinàs, Josep Maria,Porter-Moix, Miquel,Magda,Cinta, Maria,4 Gats, Els,Capri, Joan,. La pregunta és, alhora de fer servir una nova interfície, com li podrem dir que es tracta de valors diferenciats, si tenen la mateixa separació pel que fa a un nom que porta articles. Per això el que hem anat sol·licitant era separació per punt i com.

Ara :Correo Catalán, El,Espinàs, Josep Maria,Porter-Moix, Miquel,Magda,Cinta, Maria,4 Gats, Els,Capri, Joan,
Correcte : Correo Catalán, El; Espinàs, Josep Maria ; Porter-Moix, Miquel ;Magda,Cinta, Maria ; 4 Gats, Els ; Capri, Joan

JP Actualitzat per Javier Planella fa més d'un any Accions #18

Modificada la programacion.

Adjunto nueva exportacion en formato excel (disponible a traves de la URL: https://www.bib.uab.cat/comunica/nc/int/report.php)

TS Actualitzat per Teresa Santos fa més d'un any Accions #19

Ara sembla que està correcte. Passem a fer un nou mostreig.

JP Actualitzat per Javier Planella fa més d'un any Accions #20

  • Assignat a ha canviat de Javier Planella a Teresa Santos

BP Actualitzat per Beatriu Piera fa 2 mesos Accions #21

  • Estat ha canviat de En curs a Anul·lat
Accions

També disponible a: PDF Atom