Projecte

General

Perfil

Accions

Tasca #2380

tancat
FJ FJ

Tasca #2439: Objectius i tasques per fer a casa en teletreball fins a 31 octubre 2013 (Ferran)

Arreglar la cerca a text complet (reindexar tota la base de dades)

Tasca #2380: Arreglar la cerca a text complet (reindexar tota la base de dades)

Afegit per Ferran Jorba fa més de 12 anys. Actualitzat fa aproximadament 12 anys.

Estat:
Tancada
Prioritat:
Normal
Assignat a:
Categoria:
-
Temàtica prevista:
Inici:
15-07-2013
Data de venciment:
29-07-2013
Paraula clau:

Descripció

La taula d'índex de text complet estava definida massa petita i s'ha omplert a l'arribar a les 14 milions de paraules diferents (hi ha molta porqueria de l'OCR). Cal reindexar tot el DDD a text complet. Val la pena fer com en el camp de resum i indexar-ho amb les regles de stemming (http://en.wikipedia.org/wiki/Stemming) i indexar les arrels de les paraules, per poder recuperar les diferents variants de les paraules.

S'ha de poder fer tant com sigui possible a fora d'hores de feina per no col·lapsar el sistema: preferiblement el cap de setmana, i també de nits.

Accions

També disponible a: PDF Atom