Fonetica nel pattern matching con php

In questo periodo per lavoro mi sto scontrando con problemi che riguardano il matrching tra stringhe. Gli strumenti per la manipolazione delle stringhe che il php mette a disposizione sono diversi, tutti molto efficaci a seconda dei casi.

Ci sono casi in cui le normali operazioni di confronto e sostituzione tra stringhe e caratteri non bastano, così ci viene in aiuto la fonetica. Le funzioni che il php ci mette a disposizione sono metaphone e soundex. Entrambe calcolano una chiave per ogni suono uguale, ovvero fornisce un impronta derivata dalla pronuncia della parola. Metaphone fornisce una chiave secondo la pronuncia inglese della parola ed ha una lunghezza variabile, essa è formata dalla prima lettera della parola e da un numero con diverse cifre. Soundex fornisce una chiave dello stesso tipo di metaphone ma di 4 caratteri, il primo carattere è la prima lettera della parola, poi ci sono 3 cifre che rappresentano il risultato dell’operazione.

Per meglio comprendere l’utilità di queste funzioni vediamo alcuni esempi:

<?
echo "\n".soundex("Viale Marconi")." ". soundex("V.le marconi");
?>

con un normale confronto le due stringhe risulterebbero differenti sfalsando dunque qualche vostro controllo, soundex invece ci fornirà due chiavi del tipo V… e V… dove al posto dei … ci sono dei numeri, uguali perchè foneticamente le due parole sono molto vicine.

Annunci

3 thoughts on “Fonetica nel pattern matching con php

  1. […] Tempo fa vi ho parlato delle funzioni soundex e metaphone per utilzzare una verifica vocale nel matching tra stringhe di testo. Personalmente dopo alcuni test avevo riscontrato una buona affidabilità di soundex, sono però poi stato smentito, mi è capitato il caso: via ennio quirino visconti […]

  2. twink lesbian ha detto:

    I’m really impressed with your writing skills as well as with the layout on your weblog. Is this a paid theme or did you modify it yourself? Either way keep up the nice quality writing, it’s rare to see a nice blog like this one today.

  3. revtest Reviews ha detto:

    With havin so much content and articles do you ever run into any
    issues of plagorim or copyright violation? My blog has a lot of completerly unique content I’ve either written myself or
    outsourced but it looks like a lot of it is popping it up all over the web without my authorization.
    Do you know any solutions to help reduce content from being stolen?
    I’d truly appreciate it.

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...