Document Routing in SolrCloud

Von Daniel Wrigley I 28 März 2013
Veröffentlicht in ,

Abstract In Solr 4.1 sind einige Neuerungen und Verbesserungen eingebaut worden.Dieser Beitrag stellt vor, wie man die Platzierung von einem Dokument in einem bestimmten Shard mit Hilfe eines Präfixes in der Dokument-ID steuern kann. Einführung Ab Version 4.1 ist in Solr die Möglichkeit hinzugekommen, indirekt Einfluss darauf zu nehmen, wie bzw. wohin Dokumente indexiert werden.Hierzu […]

Weiterlesen

Einführung in die Geo-Suche mit Solr

Von Markus Klose I 28 März 2013
Veröffentlicht in ,

Neben der reinen Volltext-Suche wird die geografische Suche immer wichtiger. Viele von den Diensten heutzutage sind ortsgebunden, was auch Sinn macht, denn wenn ich Hunger habe und nach einer guten Pizzeria suche, nützt es mir nichts, wenn die Suche mir ein Lokal in Berlin vorschlägt und ich gerade in Augsburg unterwegs bin.Dieser Artikel befasst sich […]

Weiterlesen
Blog der SHI GmbH

SurroundQueryParser

Von Johannes Brucher I 28 März 2013
Veröffentlicht in ,

In Solr 4.0 wurde nicht nur die SolrCloud eingeführt. Es gab auch abseits davon zahlreiche Neuerungen, darunter einige QueryParser. In diesem Beitrag wird nun der SurroundQueryParser vorgestellt, der es ermöglicht Wörter, die im Text nah beieinander stehen, zu matchen. Das bedeutet, er kann alternativ zum eDismax QueryParser mit den Parametern pf und ps benutzt werden. Diese beiden Möglichkeiten werden […]

Weiterlesen
Blog der SHI GmbH

Lots Of Cores / Neuer Artikel der Blogserie “Neuerungen rund um Solr”

Von Johannes Brucher I 28 Februar 2013
Veröffentlicht in ,

Solr unterstützt MultiCore SetUps, d.h. eine Solr Instanz kann mehrere SolrCores gleichzeitig verwalten. Dies bietet viel Flexibilität bei der Nutzung von Solr bzw. der SolrCloud. Aktuell gibt es Bestrebungen hier noch ein paar Verbesserungen, vor allem im Cache Management, zu implementieren, denn momentan müssen erst alle Cores beim Start geladen werden bevor die Solr Instanz […]

Weiterlesen
Blog der SHI GmbH

Tipp – Suchen in der Cloud / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Von Johannes Brucher I 18 Februar 2013
Veröffentlicht in ,

Das Suchen in der SolrCloud unterscheidet sich prinzipiell nicht vom Suchen in einer herkömmlichen Solr Instanz. Die eigentlichen Requests sind nahezu identisch; der Core-Name, der Name des RequestHandler sowie Parameter sind weiterhin Bestandteil des Request. Es gibt im Umgang mit der SolrCloud ein paar spezielle Parameter, die die Suche in der Cloud stark beeinflussen können. […]

Weiterlesen
Blog der SHI GmbH

Tipp – clusterstate.json verstehen / Neuer Artikel der Blogserie “SolrCloud – Tipps, Tricks und Pitfalls”

Von Johannes Brucher I 18 Februar 2013
Veröffentlicht in ,

Wenn man mit der SolrCloud arbeitet, stößt man unweigerlich über die clusterstate.json-Datei. Die clusterstate.json-Datei zeigt den aktuellen Status der SolrCloud und wird vom ZooKeeper erstellt und verwaltet. Dieses JSON-Datenformat kann man wunderbar nutzen, um den Status der SolrCloud mittels eigener Analyse- bzw. Monitoring-Tools auszulesen, um, beispielsweise, herauszufinden, ob alle Knoten in der Cloud noch aktiv […]

Weiterlesen
Blog der SHI GmbH

Parametrisierung des DataImportHandlers

Von Markus Klose I 07 Februar 2013
Veröffentlicht in ,

Wenn man Daten in Solr indexieren möchte, kommt man fast nicht um den DataImportHandler (DIH) herum. Der DIH ist eine zentrale Komponente in Solr, mit der eine Vielzahl von Datenquellen indexiert werden können, z.B. Datenbanken, Feeds oder das lokale Dateisystem. Dieser Artikel soll primär zeigen, wie man den Import von Daten von außen steuern bzw. […]

Weiterlesen

JUGS Vortrag – Enterprise Search mit Apache Solr

Von Daniel Wrigley I 25 September 2012
Veröffentlicht in ,

Am 13.09.2012 durften wir Apache Solr als Suchplattform für Enterprise Search im Rahmen eines Vortrages in Stuttgart bei der dort ansässigen Java User Group (JUGS) vorstellen. In diesem Beitrag möchten wir einige interessante Aspekte des Vortrags aufgreifen und eine Zusammenfassung über die Antworten auf die aufgetauchten Fragen geben. Skalierbarkeit von Solr Hat Solr Grenzen, wenn […]

Weiterlesen

Sprachidentifzierung mit Apache Solr

Von Johannes Brucher I 25 September 2012
Veröffentlicht in ,

Sprachidentifizerung mit Solr zur Indexierungszeit Solr kann Sprachen während der Indexierung erkennen. Dazu benutzt man den langid UpdateRequestProcessor.Hierzu werden zwei Implementierungen angeboten:Das Feature von Tika Sprachen zu identifizieren: https://tika.apache.org/0.10/api/org/apache/tika/language/LanguageIdentifier.htmlLangDetect Sprachidentifizierung basierend auf einer Java Library: https://code.google.com/p/language-detection/ Konfiguration des UpdateRequestProcessors:Der UpdateRequestProcessor wird in der solrconfig.xml konfiguriert. Es muss zumindest ein Feld, welches Grundlage (also Input) der […]

Weiterlesen
Blog der SHI GmbH

Solr für Produktsuche in Online-Shops

Von Daniel Wrigley I 11 Mai 2012
Veröffentlicht in ,

Stand heute Das Thema Suchfunktion in Online-Shops ist nicht gerade neu. Die Shop-Betreiber haben die Bedeutung einer intelligenten und optimierten Produktsuche als „Conversion Engine“ längst erkannt. In der Studie von ibi research , die erst kürzlich veröffentlicht wurde, wird das bestätigt. So kommt die Studie zu dem Ergebnis, dass 70% aller befragten Online-Händler eine optimierte […]

Weiterlesen