SHI GmbH Augsburg - Ihr Starker Partner für Search & Big Data, Apache Solr, IT Commerce Lösungen

27-03-2017 - 28-03-2017
Apache Solr Unleashed
29-03-2017 - 30-03-2017
Apache Solr Under the Hood
04-04-2017 - 05-04-2017
Apache SolrCloud
SHI - Support und Service
SHI - Support und Service
Wir sind Dienstleister aus Leidenschaft und verstehen unsere Kunden.
Nach dem Projekt ist vor dem Projekt und individuelle, persönliche
Betreuung stehen bei uns ganz weit oben.
SHI - Fast Forward to Success
SHI - Fast Forward to Success
Geschwindigkeit zählt. Bei den Kosten und bei den Erfolgsaussichten.
Bei uns sorgen professionelles Projektmanagement und modulare Entwicklung
für Ihren raschen und effizienten Software-Projekterfolg.
SHI - Beratung  Entwicklung  Consulting
SHI - Beratung Entwicklung Consulting
Wir beraten unterstützen Sie mit Schulungen, Trainings und Consulting. Von der Strategieberatung bis zur Anwendungsentwicklung helfen wir Ihnen bei der Optimierung Ihrer
Geschäftsprozesse.
SHI - Individuelle Anwendungen aus Software-Bausteinen
SHI - Individuelle Anwendungen aus Software-Bausteinen
Bei uns bekommen Sie weder Software von der Stange, noch unerprobte Eigenentwicklungen. Wir setzen auf bewährte Open-Source-Technologien und setzen Ihre individuelle Anwendung
aus passenden
Bausteinen zusammen.
SHI - Migration
SHI - Migration
Steigen Sie jetzt auf die Open Source Plattform Apache Solr oder die professionelle Distribution Lucidworks Fusion um
SHI - Training
SHI - Training
Schneller am Ziel - Search & Big Data Lösungen erfolgreich entwickeln und betreiben.
SHI - Apache Solr Beratung
SHI - Apache Solr Beratung
Professionelle Beratung rund um Apache Solr - Wir unterstützen Sie vor, während und nach Ihrem Projekt.
SHI - Integration
SHI - Integration
Insbesondere Big Data Lösungen sind nur mit Integration zahlreicher Plattformen realisierbar: Apache Solr, Hadoop, Mahout, Stanbol, HBase, ZooKeeper, Pig und viele andere mehr.

Universal AJAX Live Search

Einbindung von Thesauri und Verarbeitung von Mehrwortsynonymen in Apache Solr mit dem "Search Enhancement Pack" - SEP


Als Weiterentwicklung von Apache Solr bietet SHI das "Search Enhancement Pack" (SEP) an. Mit dem SEP können Thesauri und Mehrwortsynonyme auf einfache Weise in die Suche mit Apache Solr eingebunden werden. In der Anwendung ist das SEP durch in-Memory Verarbeitung hoch performant.


Einbindung eines Thesaurus

Thesauri ermöglichen es, Suchen zu präzisieren und Suchmöglichkeiten zu erweitern. Dabei wird ein Wortnetz bzw. ein kontrolliertes Vokabular gebildet, dessen Begriffe beispielsweise in einer Begriffshierarchie miteinander verbunden sind. In einer der folgenden Abbildung entsprechenden Begriffshierarchie ist vom Term "Nordafrika" ausgehend "Afrika" ein Broader-Term, Ägypten hingegen ein Narrower-Term.

Begriffshierarchie


Durch solche Begriffshierarchien können Ergebnismengen in Suchen besser kontrolliert werden. Mittels Broader- und Narrower-Terms ist es möglich, Suchen zu erweitern oder einzuschränken bzw. zu präzisieren. Weiterführend werden in einem Thesaurus oftmals Abkürzungen oder Synonyme mit berücksichtigt.
Mit dem "Thesaurus Indexer" des SEP ist es möglich, Thesauri effizient in Apache Solr Instanzen zu integrieren. Dazu werden zunächst Thesaurus-Dateien des standardisierten RDF/SKOS-Formats in mehrere Solr-Cores indexiert. Für jeden Thesaurus-Term wird somit ein Solr-Dokument erzeugt, das neben dem Term selbst noch die jeweils zugehörigen Narrower- und Broader-Terms, Synonyme oder Abkürzungen enthält. Anschließend werden die Solr-Cores zu einem Thesaurus-Core gemerged bzw. zusammengefasst, sodass der Thesaurus vollständig durchsucht werden kann. Sobald der Thesaurus indexiert ist, kann er durch den Einsatz des "Enrichment Filter" in die Suche mit eingebunden werden. Mit dem SEP ist es zudem möglich, mehrere Thesauri zu einem Thesaurus zusammenzufassen, ohne dass dabei Doubletten entstehen.

 

SEP

Verarbeitung von Mehrwortsynonymen

Die Berücksichtigung von Synonymen ist für eine Suche überaus bedeutsam. Beispielsweise sollten in einem E-Commerce Shop bei einer Suche nach "Laptop" auch Produkte angezeigt werden, in denen ausschließlich das Wort "Notebook" im Titel oder in den Beschreibungen verwendet wird. Die Einbindung von Synonymen, die aus lediglich einem Begriff bestehen, ist in Solr "out-of-the-box" möglich. Die Einbindung von Mehrwortsynonymen ist es hingegen nicht. Beispielsweise ist es nicht möglich, die Begriffskombinationen "Laptop Tasche" und "Notebook Case" direkt als Synonyme zu definieren. Die Begriffspaare "Laptop"-"Notebook" und "Tasche"-"Case" können zwar einzeln als Synonyme definiert werden, sodass bei einer Suche nach "Laptop Tasche" auch Produkte in der Trefferliste landen, die als "Notebook Case" bezeichnet werden. Allerdings landen in diesem Fall auch Laptops bzw. Notebooks und Taschen bzw. Cases in der Trefferliste, nach denen nicht gesucht wurde. Dadurch wird die Trefferliste sehr groß und ungenau. Ein weiteres Problem ist, dass eine Suche nach "Laptoptasche" unter Umständen nur zu sehr wenigen Treffern führt.
Diese Probleme können mit dem "Search Enhancement Pack" auf einfache Weise behoben werden. Das SEP erlaubt die Einbindung von Mehrwortsynonymen, wodurch Ihre Treffer präziser und plausibler werden. Dadurch steigen die Nutzerfreundlichkeit und das Vertrauen der Nutzer in Ihre Suche. Weiterführend werden Nutzer zielführender zu gewünschten Treffern bzw. Produkten geleitet, was sich in einem E-Commerce Shop positiv auf Ihre Conversion Rate auswirken wird.
Eine detaillierte Beschreibung der Verwendung von Synonymen und Mehrwortsynonymen in Solr ist auch unter Youtube zugänglich.

 

Bestellung Search Enhancement Pack (SEP)

 

SEP-Youtube

Synonyme und Mehrwortsynonyme mit Apache Solr

Vortrag von Johannes Peter.

In diesem Video werden die Möglichkeiten und Grenzen von Apache Solr aufgezeigt, mit Synonymen umzugehen. Darüber hinaus wird eine Lösung für den Umgang mit Mehrwortsynonymen vorgestellt.

 

Search Enhancement Pack - Alle Antworten auf einen Blick

SEARCH & BIG DATA, BERATUNG, SCHULUNG, ENTWICKLUNG, SUPPORT, PUBLISHER SOLUTIONS
MIT APACHE SOLR, LUCENE, ELASTICSEARCH, SMARTLOGIC SEMAPHORE, SHI INFOPILOT