Linguistische Suchmaschine
Dem Motto 'benefits in community' folgend wurde für diese eine Suchmaschine integriert, welche noch nicht einmal ansatzweise ihre Grenzen gefunden hat. Die linguistische Suchmaschine wird z.B. von Wikipedia eingesetzt und selbst von einer großen, breit gefächerten Community entwickelt.
Alle Texte/Daten zum Beispiel von Katalogen oder Artikeln werden einem sogenannten Analyzer übergeben. Die Daten werden von diesem nach fest definierten Regeln zerlegt und in einer einheitlichen Weise für den Index (eine Struktur von Vektoren) aufbereitet. Nach der Analyse erfolgen die eigentliche Indexierung und das Abspeichern des aufbereiteten Vektor-Suchraums. Die Suchmaschine kennt kennt Term- und Phrasensuche, Boolesche Operatoren, Wildcard-Suche, Range-Queries (Bereichs-anfragen) sowie Fuzzy- und Proximity-Suche.
Der integrierte Query Parser lehnt sich mit seiner Syntax stark an Googles Anfragesprache an. Das erzeugte Anfrageobjekt wird anschließend an einen Index-Searcher übergeben, der die Suche im technischen Sinne betreibt. Zur Präsentation der Ergebnisse, beispielsweise auf einer Web-Seite oder in einer Desktop-Applikation, kann man über eine Klasse namens Hits auf die Treffer zugreifen. Aus Performance-Gründen holt eine Hits-Instanz nicht alle Treffer aus dem Index, sondern nur eine begrenzte Anzahl der besten Ergebnisse. Über Low-Level-Methoden können eigene Scoring- und Sortier-Algorithmen implementiert werden.