SimMetrics

SimMetrics

SimMetrics is an open source extensible library of similarity or distance metrics (also known as string metrics).

The SimMetrics open source library includes the following metrics
* Levenshtein distance,
* Block distance or city block distance or L2 distance,
* Cosine similarity,
* Jaccard index,
* Needleman-Wunsch algorithm or Sellers algorithm,
* Smith-Waterman algorithm,
* Gotoh distance or Smith-Waterman-Gotoh distance,
* Monge Elkan distance,
* Jaro distance,
* Jaro-Winkler,
* SoundEx distance,
* Matching coefficient,
* Dice’s coefficient,
* Jaccard similarity or Jaccard coefficient or Tanimoto coefficient,
* Overlap coefficient,
* Euclidean distance,
* Q-gram distance,
* and more.

SimMetrics provides a library of floating-point based (0.0-1.0) similarity measures between pairs of string data as well as the unnormalised metric output.

External links

* [http://sourceforge.net/projects/simmetrics/] [http://www.dcs.shef.ac.uk/~sam/simmetrics.html ]
* [http://secondstring.sourceforge.net/ Second String] similar library


Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Look at other dictionaries:

  • Soundex — is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for names with the same pronunciation to be encoded to the same representation so that they can be matched despite minor differences in spelling. Soundex… …   Wikipedia

  • Jaccard index — The Jaccard index, also known as the Jaccard similarity coefficient (originally coined coefficient de communauté by Paul Jaccard), is a statistic used for comparing the similarity and diversity of sample sets.The Jaccard coefficient measures… …   Wikipedia

  • Record linkage — (RL) refers to the task of finding entries that refer to the same entity across different data sources (e.g., files, books, websites, databases, etc.). Record linkage is an appropriate technique when you have to join data sets that do not already …   Wikipedia

  • String metric — String metrics (also known as similarity metrics) are a class of textual based metrics resulting in a similarity or dissimilarity (distance) score between two pairs of text strings for approximate matching or comparison and in fuzzy string… …   Wikipedia

  • Ontology merging — defines the act of bringing together two conceptually divergent ontologies or the instance data associated to two ontologies. This is similar to work in database merging (schema matching). This merging process can be performed in a number of ways …   Wikipedia

  • Distance de Jaccard — Indice et distance de Jaccard L indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la similarité et la diversité entre des échantillons. Elles sont nommées d après le botaniste suisse Paul Jaccard.… …   Wikipédia en Français

  • Index et distance de Jaccard — Indice et distance de Jaccard L indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la similarité et la diversité entre des échantillons. Elles sont nommées d après le botaniste suisse Paul Jaccard.… …   Wikipédia en Français

  • Indice Et Distance De Jaccard — L indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la similarité et la diversité entre des échantillons. Elles sont nommées d après le botaniste suisse Paul Jaccard. Sommaire 1 Description formelle 2… …   Wikipédia en Français

  • Indice de Jaccard — Indice et distance de Jaccard L indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la similarité et la diversité entre des échantillons. Elles sont nommées d après le botaniste suisse Paul Jaccard.… …   Wikipédia en Français

  • Indice et distance de Jaccard — L indice et la distance de Jaccard sont deux métriques utilisées en statistiques pour comparer la similarité et la diversité entre des échantillons. Elles sont nommées d après le botaniste suisse Paul Jaccard. Sommaire 1 Description formelle 2… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”