Tasca #3292
tancatMillorar la sortida del DDD a Google Scholar
Afegit per Cristina Azorin fa aproximadament 11 anys. Actualitzat fa més de 10 anys.
Descripció
Sembla que en algun moment vam tenir moltes entrades a Google Scholar i ara hem tornat a baixar el volum de registres.
Hi ha una guia de requeriments a
http://scholar.google.com/intl/en/scholar/inclusion.html
Adaptar-nos a Google potser ens implica fer algun tipus de desenvolupament tècnic. Per exemple: Para los sitios web con más de cien mil documentos, le recomendamos que cree una interfaz de navegación adicional que muestre sólo los artículos agregados en las últimas dos semanas. Este conjunto más pequeño de páginas web puede recolectar-se con más frecuencia que su interfaz de navegación con todo el contenido, lo que facilitará la cobertura oportuna de sus artículos recientes por los robots de búsqueda.
Tenga en cuenta que el uso de Flash, JavaScript, o de navegación basado en la forma hace que sea difícil para nuestro sistema automatizado para encontrar sus artículos. Si su sitio web utiliza este tipo de navegación, por favor, añadir también un "navegar por fecha".
Fitxers
| ddd_googleScholar.pdf (412 KB) ddd_googleScholar.pdf | Tomas Fabregat, 16-03-2015 13:44 | ||
| ddd_scholar.pdf (150 KB) ddd_scholar.pdf | Tomas Fabregat, 16-03-2015 16:06 |
Tasques relacionades 5 (1 oberta — 4 tancades)
CA Actualitzat per Cristina Azorin fa aproximadament 11 anys Accions #1
- Assignat a ha canviat de Cristina Azorin a Tomas Fabregat
Tomàs, tu podries mirar-te aquesta guia i quins són els punts importants o que hauríem de modificar??
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #2
Com que no ser per on tirar, he fet de Sherlock amb uns quants registres. Adjunto els casos. De moment, dues coses a destacar:
- els registres del DDD no sempre surten de forma visible PERÒ sempre els trobo seguint les versions
- hi ha registres que han estat a la carpeta REVISAR i també surten com a versions.
Sisplau, doneu una ullada als registres triats, a veure si en treieu alguna cosa.
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #3
- S'ha afegit Fitxer ddd_googleScholar.pdf ddd_googleScholar.pdf
adjunto els casos
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #4
No se si em precipito, però crec que he trobat una possible causa del què passa:
La guia de Google a Indexig Guidelines diu:
The publication date tag, e.g., citation_publication_date or DC.issued, must contain the date of publication, i.e., the date that would normally be cited in references to this paper from other papers. Don't use it for the date of entry into the repository - that should go into citation_online_date instead. Provide full dates in the "2010/5/12" format if available; or a year alone otherwise. This tag is required for inclusion in Google Scholar.
I aquest és el format que té en els registres d'exemple:
<meta content="2013" name="citation_date" />
en lloc de:
<meta content="2013" name="citation_publication_date" />
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #5
I una segona, que crec que no és determinant és:
Segons diu la guia,
For journal and conference papers, provide the remaining bibliographic citation data in the following tags: citation_journal_title or citation_conference_title, citation_issn, citation_isbn, citation_volume, citation_issue, citation_firstpage, and citation_lastpage. Dublin Core equivalents are DC.relation.ispartof for journal and conference titles and the non-standard tags DC.citation.volume, DC.citation.issue, DC.citation.spage (start page), and DC.citation.epage (end page) for the remaining fields. Regardless of the scheme chosen, these fields must contain sufficient information to identify a reference to this paper from another document, which is normally all of: (a) journal or conference name, (b) volume and issue numbers, if applicable, and (c) the number of the first page of the paper in the volume (or issue) in question.
En els registres de mostra no hi ha cap etiqueta "issue", per exemple:
<meta content="5" name="itation_issue" />
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #6
- S'ha afegit Fitxer ddd_scholar.pdf ddd_scholar.pdf
Adjunto un pdf (ddd_scholar.pdf) amb el codi font de dos registres on es veu el que he explicat.
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #7
Finalment, del 2 registres amb el codi font un surt a GS i l'altre no. Per què passa si a tots dos els falla el mateix? Potser teniu l'explicació. La meva és que hi ha hagut algun canvi entre l'última escombrada completa de GS i l'actual contingut del DDD. A GS veiem el que va recollir en lúltima escombrada, no el contingut actual degut als canvis. I aquí ja em perdo. Potser podeu seguir el fil. Jo, no.
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #8
Un altre aspecte a tenir en compte: la data d'entrada de registre (no la de publicació). Segons la guia:
Don't use it[the publication date] for the date of entry into the repository - that should go into citation_online_date instead. Provide full dates in the "2010/5/12" format if available;
En format HTML surt com:
<div class="recordlastmodifiedbox" style="position:relative;margin-left:1px"> Record created 2013-10-28, last modified 2014-11-03</div>
Però no he sabut trobar-ho com a metatags de GS: Per exemple:
<meta content="2014/11/03" name="citation_online_date" />
TF Actualitzat per Tomas Fabregat fa aproximadament 11 anys Accions #9
Finalment, caldria aclarir quina és la data que consta en l'etiqueta errònia:
<meta content="2013" name="citation_date" />
Es refereix a la data de publicació o a la data d'entrada/modificació del registre.
Em sembla que si es reolt això quedaria resolt el problema de GS.
TF Actualitzat per Tomas Fabregat fa quasi 11 anys Accions #10
- Estat ha canviat de Creada a En curs
FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #11
- Temàtica prevista ha canviat de OAI: recol·leccions a Millores respecte a la producció científica de la UAB
TF Actualitzat per Tomas Fabregat fa quasi 11 anys Accions #12
Resumeixo què caldria fer:
Actualment els registres del DDD contenen un etiquesta de data segons la sintaxi segënt:
<meta content="2013" name="citation_date" />
Segons GS aquesta sintaxi és incorrecta.Ho és el "name". El content és vàlid (GS diu: "Provide full dates in the "2010/5/12" format if available; or a year alone otherwise")
La pregunta prèvia és què vol dir aquesta data? Es la data d'entrada del registre o la data de publicació?
1- Dóno per suposat que es la data de publicació. Aleshores la sintaxi correcta hauria de ser:
<meta content="2013" name="citation_publication_date" />
(equival a DC.issued)
2- Ara bé, GS també demana/recomana la data d'entrada dels registres al repositori, especialment en repositoris amb molt volum d'entrades, que no he sabut trobar-la en els actuals a metatags de GS:
En format HTML surt com:
<div class="recordlastmodifiedbox" style="position:relative;margin-left:1px"> Record created 2013-10-28, last modified 2014-11-03</div>
i com a metatags de GS hauria de sortir així
<meta content="2014/11/03" name="citation_online_date" />
Queda clar que la data de publicació és imprescindible. No queda clar si ho és la data d'entrada. Però sí que és recomanable en dipòsits grans
FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #13
Tomas Fabregat va escriure:
1- Dóno per suposat que es la data de publicació. Aleshores la sintaxi correcta hauria de ser:
<meta content="2013" name="citation_publication_date" />
(equival a DC.issued)
Aquest ja l'acabo d'arreglar al ddd-test.
FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #14
Tomas Fabregat va escriure:
i com a metatags de GS hauria de sortir així
<meta content="2014/11/03" name="citation_online_date" />
Queda clar que la data de publicació és imprescindible. No queda clar si ho és la data d'entrada. Però sí que és recomanable en dipòsits grans
Em temo que aquest camp no el podré posar, perquè només puc posar valors de subcamps Marc21, i com que està en una etiqueta de control, no té subcamps. Ho deixo reposar una mica per si hi trobo una solució, i si no la setmana que ve aplico el canvi de la data de publicació al DDD públic.
FJ Actualitzat per Ferran Jorba fa quasi 11 anys Accions #15
- Estat ha canviat de En curs a Tancada
Com que no trobo la manera de posar la d'entrada al DDD com a "citation_online_date", i tal com vaig dir, he aplicat el canvi al DDD públic i tanco la tasca.
Si cal o hi veig una solució, la podem tornar a obrir.
CA Actualitzat per Cristina Azorin fa més de 10 anys Accions #16
- Categoria s'ha establert a Suport a docència i recerca
FJ Actualitzat per Ferran Jorba fa aproximadament 7 anys Accions #17
- S'ha afegit relacionat amb Defecte #5245: Mendeley a Traces no funciona