Blog der SHI GmbH

Schema vs. Schemaless vs. Managed Schema

Von Markus Klose I 12 Mai 2015
Veröffentlicht in ,

Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]

Weiterlesen
Blog der SHI GmbH

Document Expiration

Von Daniel Wrigley I 20 April 2015
Veröffentlicht in ,

Wie lange „lebt“ ein Dokument? Oder: Wie man ein Ablaufdatum an Inhalte heftet Seit Solr 4.8 gibt es ein Feature, das aktuell noch nicht besonders dokumentiert und sich daher auch noch nicht weiter Verbreitung erfreuen kann: Document Expiration. Mit dieser Funktionalität kann ich Dokumente basierend auf einem Datumsfeld in regelmäßigen Löschvorgängen aus einem Solr Index […]

Weiterlesen
Blog der SHI GmbH

Apache Solr 5.1.0 ist erschienen

Von Patricia Kraft I 20 April 2015
Veröffentlicht in ,

Der Such-Server Apache Solr ist in Version 5.1.0 erschienen. Er beinhaltet 39 neue Features, 40 Bugfixes und 36 Optimierungen der vor kurzem veröffentlichten Version 5.1.Die Bugfixes beheben unter anderem Probleme, die die API oder SolrCloud betreffen.Die vollständige Liste der Verbesserungen und Änderungen kann unter dem folgenden Link gesichtet werden:https://lucene.apache.org/solr/5_1_0/changes/Changes.htmlDie aktuelle Version kann auf der Apache […]

Weiterlesen
Blog der SHI GmbH

Erfahrungsbericht der SHI Solr Schulungen

Von Daniel Fuckner I 16 März 2015
Veröffentlicht in ,

Erfahrungsbericht zur Teilnahme an den Kursen „Solr Unleashed“ und „Solr Under the Hood“ Als neues Mitglied des Consulting-Teams der SHI GmbH habe ich zwischen dem 23.03. – 24.03.2015 am Kurs „Solr Unleashed“ und anschließend zwischen dem 25.03. – 26.03.2015 am Kurs „Solr Under the Hood“ teilgenommen. Das Ziel der Teilnahme am Kurs „Solr Unleashed“ war […]

Weiterlesen
Blog der SHI GmbH

Flexibles Connector-Framework in Solr Integrieren – Lucidworks Fusion macht’s möglich

Von Markus Klose I 15 März 2015
Veröffentlicht in , ,

Eine der großen Herausforderung bei der Umsetzung einer Enterprise-Search ist die Anbindung der unterschiedlichsten Datenquellen. Jede Quelle hat ihre eigenen Schnittstellen, internen Strukturen und Daten bzw. Meta-Daten. Des Weiteren besitzen die Datenquellen eigene Sicherheitsmechanismen um den Zugriff auf die einzelnen Dokumente zu regeln.Möchte man nun eine Enterprise-Search Applikation mit Solr umsetzen steht man vor eben […]

Weiterlesen
Blog der SHI GmbH

Solr Cookbook Third Edition – eine Buchrezension

Von Markus Klose I 10 März 2015
Veröffentlicht in ,

Einstieg in Apache Solr Wie man richtig mit Apache Solr kocht? Diese Frage beantwortet Rafal Kuc in der aktuellen Ausgabe seines Apache Solr Cookbooks. In „Solr Cookbook Third Edition“ beschreibt er typische Probleme bzw. Anwendungsfälle und deren Lösungen. Das Buch richtet sich an Entwickler, die bereits Hintergrundwissen zu Apache Solr mitbringen. Für diejenigen, die noch […]

Weiterlesen
Blog der SHI GmbH

Search Cluster wirklich (ausfall)sicher?

Von Markus Klose I 10 Februar 2015
Veröffentlicht in , ,

Ist Ihr Search Cluster wirklich (ausfall)sicher??? Jepsen beweist es!!! Viele Anbieter und Produkte werben damit, dass große, skalierbare und performante Search Cluster leicht zu erstellen und zu warten sind. Weder mit Apache Solr noch mit Elasticsearch ist dies eine große Herausforderung. Beide Such-Server bieten eine ausgereifte API um neue Collections anzulegen, zu löschen, Aliase zu […]

Weiterlesen

Saved Searches mit Apache Solr

Von Daniel Fuckner I 25 September 2014
Veröffentlicht in ,

Die sogenannten „Saved Searches“ sind eine Suchtechnik, bei der ein Anwender seine Suche „speichern“ kann. Jede Änderung im Index wird mit den Saved Searches abgeglichen. Sobald ein Produkt auf diese Suche passt, wird der Anwender (beispielsweise durch eine E-Mail) benachrichtigt. Dies ermöglicht ein nachträgliches Finden von Produkten, Artikeln etc. Diese Technik lohnt sich vor allem […]

Weiterlesen

Proof of Concept – Semantische Anreicherung Unstrukturierter Inhalte

Von Patricia Kraft I 09 September 2014
Veröffentlicht in ,

Dass Suche mittlerweile mehr ist, als nur das Auffinden von Dokumenten, die ein Suchwort beinhalten, ist längst kein Geheimnis mehr. Ebenso ist hinlänglich bekannt, dass es hierfür Lösungen gibt, die sehr weit ausgereift sind. Dies sind nicht nur Lösungen kommerzieller Natur, sondern auch kostenlose Open Source Varianten, wie Apache Solr, die unübertroffene Skalierbarkeit zeigen. Daher […]

Weiterlesen

SSL-Verwendung mit Apache Solr

Von Markus Klose I 09 September 2014
Veröffentlicht in ,

Bei Apache Solr gibt es grundlegend keine Sicherheitsmechanismen. Dies betrifft sowohl den Zugriff auf den Solr-Server selbst, als auch die einzelnen Dokumente. Natürlich gibt viele bewährte Workarounds hierfür. Beispielsweise kann man den Solr-Server im eigenen Netz so absichern, dass nur bestimmte Ports freigeschaltet werden. Für Dokumentsicherheit kann man ACL Informationen mit im Index abspeichern und […]

Weiterlesen