Commenti & Opinioni


Home Page | Commenti | Articoli | Faq | Documenti | Ricerca | Archivio | Storie dalla Sala Macchine | Contribuire | Login/Register

Alla ricerca della pagina perduta

Updated!

Cercare o non cercare? Questo e' il dilemma. No, in effetti non e' un dilemma manco per un ca$$o. Si cerca. Punto e basta.

No, non sto parlando di donne (sic), mi riferisco alla funzione di ricerca del sito, che e' disattivata da un paio di settimane. Ed e' da ieri che sto' cercando un modo di rivitalizzarla. Andiamo con ordine.

La precedente funzione di ricerca era fatta usando il motore Ht://Dig, che e' un bel prodottino. O almeno lo era. Il progetto pare morto, l'ultima versione (una beta) e' del 2004 e non ha rilasciato ulteriori versioni. Inoltre, la versione attuale (ed anche quelle piu' vecchie) non si compilano con le nuove versioni di Gcc, obbligandoti a fare i salti mortali se lo vuoi ricompilare.

Ok, una versione pre-compilata e' distribuita con Slackware, in questo non ci sono problemi, ma... Quello che non mi piace tanto di ht://dig e' che richiede dei template che sono delle pagine html statiche. Mentre a me piacerebbe avere qualche cosa che si possa integrare un po' meglio con il sistema dinamico del mio sito. Ed e' per questo che stavo guardando di ricompilare il tutto modificando la parte di ricerca come mi pare.

Solo che, dopo un'intera giornata spesa madonnando contro il codice di questo coso (chi e' che ha detto che C++ si commenta da solo? Bugiardo!) sono ancora al punto di partenza (aka: non si compila).

Tempo addietro, quando lavoravo per $noisalviamoilmondopuntocom avevo usato un altro prodottino carino Asp Seek, solo che anche questo pare morto nel 2003 e (come al solito) non si compila.

Allora ho cominciato a pensare alle varie alternative, in sostanza:

  1. Usare un motore di ricerca diverso

    Si', facile a dirsi. E' trovarne uno che non sia scritto in PiAccidentiatePi', che non usi Java, che non richieda di fare delle cose astruse per integrarsi con un sito gia' esistente.

  2. Usare Google

    Che sarebbe la soluzione piu' semplice, se non che... a me non piace tanto che Google metta pubblicita' nelle pagine che ritorna. Aho', li capisco: e' cosi' che vivono, pero'... Loro fanno i soldi (tanti) ed io no. Come dite? Metterla io la pubblicita'? Quajo', non mi inducete in tentazione. E poi c'e' l'altro problema: Google funzica solo se il sito e' su internet ma non funziona se quello che volete e' una intranet.

  3. Scriverlo io il motore di ricerca

    Che sarebbe la soluzione ottimale, solo che non ci ho ne' la voglia, ne' il tempo di farlo. Cosi' ho speso tutta la giornata di ieri cercando una "base" gia' fatta per un motore di ricerca. Ed ho trovato un tubazzo (fino ad ora).

Bah, finira' che la elimino la funzione di ricerca...

E la ricerca e' di nuovo on-line

Ci avevate paura? Vabbe', grazie a tutti quelli che mi hanno martellato di pubbl... hemm, di indicazioni di vari progetti disponibili. In effetti avevo gia' cominciato a guardarmi swish-e (che in parecchi mi hanno segnalato) ed alla fine ho scelto quello come nuovo "motore".

Adesso dovro' aggiornare anche la documentazione e magari rifare il package per SourceForge. Al momento ho solo aggiornato il codice in Subversion.

Davide Bianchi
22/07/2009 18:25

 

I commenti sono aggiunti quando e soprattutto se ho il tempo di guardarli e dopo aver eliminato le cagate, spam, tentativi di phishing et similia. Quindi non trattenete il respiro.

19 messaggi this document does not accept new posts
Anonymous cowardSearch engines Di Anonymous coward - postato il 22/07/2009 10:50
Non so se possono esserti utili, ma ho trovato i seguenti link:

mnoGoSearch web search engine software
http://www.mnogosearch.org/

Xapian
http://xapian.org/

Scusami, invece, se ti ho fatto solo perdere tempo.

--
Anonymous coward


maxxfiMeglio niente che Java? Di maxxfi - postato il 22/07/2009 10:59

Giusto per capire come la pensi, meglio niente search engine che Java/Python/Ruby/whattheheck ?
(Java sta anche a me abbastanza sui cabasisi, per cui ti capisco ;\) )

--
maxxfi


Davide Bianchi@ maxxfi Di Davide Bianchi - postato il 22/07/2009 18:13

> Giusto per capire come la pensi, meglio niente search engine che Java/Python/Ruby/whattheheck ?

No, meglio niente che "grande rottura di marroni, perdita di tempo, giorni e giorni di lavoro indefesso per una funzionalita' che poi fondamentalmente non e' che ci muoio se non ce l'ho".

Come gia' detto alla nausea: io il sito lo mantengo nel mio tempo libero. Invece di stare qui' a debuggare codice C++ scritto 5 anni fa' potrei andarmene in giro in moto.

--
Davide Bianchi


Sottilette@ Davide Bianchi Di Sottilette - postato il 23/07/2009 13:08



>Come gia' detto alla nausea: io il sito lo mantengo nel mio tempo libero. Invece >di stare qui' a debuggare codice C++ scritto 5 anni fa' potrei andarmene in giro >in moto.

turbo quoto!
ho una voglia di rimettere in strada il mio Cbr.... e google fa un lavoro davvero decente; il sito Ibm.com ha inktomi come search engine, io riesco a trovare prima ciò che cerco con bigG, magari sono solo più abituato ad utilizzare questo secondo.


--
Davide Bianchi

--
bye bye my Honda CBR bike.... looking for some Bayern Horses?


Anonymous coward@ Davide Bianchi Di Anonymous coward - postato il 23/07/2009 17:08

> Come gia' detto alla nausea: io il sito lo mantengo nel mio tempo libero.
> Invece di stare qui' a debuggare codice C++ scritto 5 anni fa' potrei andarmene
> in giro in moto.

Solo perchè è estate, ed è pieno di olandesine in giro per i parchi. Non appena torna la stagione delle piogge (tra due settimane) il sito avrà il suo motore di ricerca.

--
G

--
Anonymous coward


Anonymous cowardRicerca... Di Anonymous coward - postato il 22/07/2009 11:05

Ho letto nella pagina di presentazione del CMS FdT che per il CMS FdT Next Generation non escludi l'uso di Java.
Perché non cominciare subito con Lucene come motore di ricerca?

Nella nostra intranet il suo "sporco lavoro" lo fa degnamente.

--
Anonymous coward


Davide Bianchi@ Anonymous coward Di Davide Bianchi - postato il 22/07/2009 18:14

> ...non escludi l'uso di Java.
> Perché non cominciare subito con Lucene come motore di ricerca?

"non escludo" != "sicuramente"

--
Davide Bianchi


Anonymous cowardperl search engines Di Anonymous coward - postato il 22/07/2009 11:09

forse che hai gia' visto sta paginata di roba in perl?
http://www.thefreecountry.com/perlscripts/searchengines.shtml

--
Anonymous coward


Anonymous cowardCLucene? Di Anonymous coward - postato il 22/07/2009 11:09

http://sourceforge.net/projects/clucene/

--
Anonymous coward


Anonymous cowardsearch engine Di Anonymous coward - postato il 22/07/2009 11:20

I don't know how is hard, but the fact that you have all the articles in the database should make easy to have a dedicated search engine which looks in the right tables...

--
Anonymous coward


Davide Bianchi@ Anonymous coward Di Davide Bianchi - postato il 22/07/2009 18:17

> I don't know how is hard, but the fact that you have all the articles in the database should make easy to have a dedicated search engine which looks in the right tables...

Yes, in fact I was thinking the same. BUT if you want full-text-search you need to wave bye-bye to InnoDB tables and referential integrity. Or you need to do a simple "partial" match that can take a lot of time.

Moreover, this way you don't have a clue about which document "matches" more of what you're looking. Unless you do a parsing of the doc and get a list of the words and then count the individual matches with each word and...

It looks easy... on the surface... is only when you start thinking at all the nitty-gritty bits that is not so easy.

--
Davide Bianchi


Anonymous cowardAi provato... Di Anonymous coward - postato il 22/07/2009 11:41

http://swish-e.org/

--
Anonymous coward


Luigidai un occhio a questo .... Di Luigi - postato il 22/07/2009 11:56

Se hai tempo. voglia e pazienza
http://sourceforge.net/projects/opensearchserve/

Ciao, luigi

--
Luigi


Anonymous cowardQuesto? Di Anonymous coward - postato il 22/07/2009 12:18

swish-e, non so se ti va bene ma è un inizio

--
Anonymous coward


Oriano...ma no, dai....... Di Oriano - postato il 22/07/2009 13:39

....che era cosi' comoda.
Se volevo rileggermi qualche storia, la trovavo in un attimo.
Dai concentrati....sei concentrato? Piu' concentrato....

--
Oriano


Davide Bianchi@ Oriano Di Davide Bianchi - postato il 22/07/2009 18:18

> ....che era cosi' comoda.

E perche' pensi che sia qui' a spaccarmi lo cranio senno'?

--
Davide Bianchi


Anonymous cowardIndicizzatori e motori di ricerca Di Anonymous coward - postato il 22/07/2009 15:06

Ho dato un occhiata ai progetti ht://Dig e Asp seek che avevi usato in precedenza e mi sembra che Swish-e http://swish-e.org/ o The Lemur Toolkit http://www.lemurproject.org/ sono entrambi scitti in C / C++ e la possibilta di usarli tramite script CGI
Io non li ho mai usati ma da quello che ho letto della loro documentazione sembrebbero essere adatti a sostituire degnamente Ht://Dig e salvare la funzione ricerca.

--
Anonymous coward


Anonymous cowardsearch engine Di Anonymous coward - postato il 22/07/2009 16:21

premesso che non gli ho ancora dato un'occhiata, ci sarebbe questo:
http://mnogosearch.org/
a vederlo operare sul loro stesso sito sembra efficiente.
Ciao
G.

--
Anonymous coward


dpantaleoViene da chiedersi... Di dpantaleo - postato il 24/07/2009 18:51

chi è che usa quella pagina...
i veri appassionati di D ormai conoscono i titoli a memoria :D

--
dpantaleo
"Nemo reverte ab nos..."


19 messaggi this document does not accept new posts

Precedente Successivo


Il presente sito e' frutto del sudore della mia fronte (e delle mie dita), se siete interessati a ripubblicare uno degli articoli, documenti o qualunque altra cosa presente in questo sito per cortesia datemene comunicazione (o all'autore dell'articolo se non sono io), cosi' il giorno che faccio delle aggiunte potro' avvisarvi e magari mandarvi il testo aggiornato.


Questo sito era composto con VIM, ora e' composto con VIM ed il famosissimo CMS FdT.

Questo sito non e' ottimizzato per la visione con nessun browser particolare, ne' richiede l'uso di font particolari o risoluzioni speciali. Siete liberi di vederlo come vi pare e piace, o come disse qualcuno: "Finalmente uno dei POCHI siti che ancora funzionano con IE5 dentro Windows 3.1".

Web Interoperability Pleadge Support This Project
Powered By Gort