Categorie
tutorial

MySQL, indici FullText e la lunghezza delle strighe

Avete mai provato a cercare su un indice FullText con una stringa sotto i 4 caratteri ?

select * from tabella where match (nomecampo) against (‘abc’);

Bhe, io dopo essere diventato scemo, ho scoperto che per default la lunghezza minima è impostata a 4 caratteri.

MySQL, indici FullText e ricerca sotto i 4 caratteri

Se quindi state cercando stringhe come “php“,”htm” o “css“, e nonostante siate sicuri che ci siano riscontri, la ricerca non vi restituisce nessun record, non è dovuto ad una tabella corrotta, ma molto più semplicemente perché l’indice in condizioni normali non gestisce ricerche di questo tipo.

La soluzione, se siete nelle condizioni di modificare il file di configurazione, fortunatamente c’è, e prevede 3 operazioni

  1. E’ necessario definire il valore della variabile ft_min_word_len all’interno del file my.cfg
    ft_min_word_len=3
  2. Riavviare il server in modo che valorizzi in modo corretto la nuova impostazione
  3. Per finire, è necessario fare il rebuild degli indici, in modo che vengano ricostruiti con tutte le informazioni corrette
    REPAIR TABLE nometabella QUICK;

Facile come bere un chupito… basta saperlo.

Per la documentazione ufficiale basta guardare qui

Categorie
fatti ... e pugnette

Mi hanno craccato le stastistiche del blog

Questa notte qualche “simpatico personaggio ( 👿 )”, ha deciso che doveva farmi vedere quanto fosse bravo a fare l’ hacker il cracker.

La sua attenzione è stata focalizzata sul database delle statistiche di PHPstatsche non so se grazie ad un Exploit o ad un attacco brute force ha ceduto miseramente. ( 😥 )

Questo è quello che mi sono trovato difronte questa mattina:

PHP-Stats - Calendario accessi svuotato
(clicca per ingrandire)

Dopo un attimo di sconforto, ho pensato ai backup … ” 😀 Ok, nessun problema, li faccio tutte le notti …”

Con un operazione durata circa 20 minuti, mi collego al server di backup, li scarico in locale, fermo il demone di mysql, li ripristino e rifaccio partire mysql ….

Bene, tutto a posto mi dico, ma quando mi ricollego mi rendo conto che il problema è rimasto e realizzo che non so fare i backup. 🙁

O meglio, il backup c’è ma viene sovrascritto ogni notte, ed in questo caso, il simpatico personaggio aveva smanettato prima dell’ora x.

Il risultato è che ho perso le statistiche ma dato che è inutile “piangere sul latte versato” vediamo i lati positivi:

  • E’ successo a me e non ad un cliente
  • Si tratta delle statistiche di un blog … (quindi niente di vitale)
  • Ho migliorato la procedura di backup
    ( gestione settimanale, ed invio dump mysql via mail )
  • Mi sono reso conto che phpstats è bacato
    ( sarà il caso di cambiarlo ???? )

Se poi vogliamo dirla tutta, per vari motivi, nel corso del tempo ho implementato statistiche anche con Analitycs , Reinvigorate e 103bees quindi il danno è relativamente marginale.

Certo, mi spiace in quanto con phpstats avevo dati da oltre un anno, ad era bello vedere l’andamento degli accessi sempre in crescita, ma questa è la giusta punizione a chi non fa i backup (almeno questo è quello che dico sempre ai miei clienti)

Penso che con l’occasione passerò a mint; è già da un po’ che ci penso ma per vari motivi o sempre rimandato.

[tags]phpstats, backup[/tags]

Categorie
sviluppo

Un introduzione a SQLite

SQLite è una piccola libreria scritta in C che implementa un motore SQL in meno di 250 KB, compatibile con la maggior parte dei comandi SQL-92, funzionante senza nessuna installazione e/o configurazione.

Il suo papà, Richard Hipp, ha preparato per Google una presentazione in cui ci illustra pregi e difetti della sua creatura.

Link di riferimento:

Sito Ufficiale
Slide della presentazione

Via Digitazero

Categorie
sviluppo

Ordinare i risultati di una query per rilevanza

Per un lavoro che sto seguendo mi è stato chiesto di preparare un motore di ricerca dove i risultati della query devono essere ordinati in base alla rilevanza che questi hanno con le parole cercate.

il problema è che la rilevanza dei singoli record varia a seconda del campo nel quale vengono trovate e dal numero di parole cercate.

immagine una tabella con la seguente struttura:

  • id
  • titolo
  • descrizione
  • keywords
  • il motore di ricerca deve cercare all’interno dei campi titolo, descrizione e keywords con il criterio “like ‘%parola%’ ” ma deve visualizzare prima i risultati dove il match è positivo per titolo , poi per keywords ed infine per descrizione.

    il discorso di complica se le parole cercate sono più di una in quanto la rilavenza di un match completo su tutte le parola vale di più di uno parziale.

    quello che segue è la mia soluzione al problema …