Blog der SHI GmbH

SolrCloud – Cross Data Center Replication

Von Markus Klose I 09 Februar 2017
Veröffentlicht in , ,

Dieser Blog ist eine kurze Einführung in die CDCR (Cross Data Center Replication) Funktionalität von Solr. Es wird beschrieben, was CDCR ist, was CDCR nicht ist und wann man diese Funktionalität einsetzen kann. Die SolrCloud ist nun schon seit einigen Jahren das Mittel der Wahl, wenn es um eine verteilte Architektur im Zusammenhang mit Apache […]

Weiterlesen
Blog der SHI GmbH

Solr goes Machine Learning! Teil III

Von Daniel Wrigley I 08 Februar 2017
Veröffentlicht in , ,

Mehr als nur eine Suchmaschine – Solr goes Machine Learning! Teil III Nachdem die beiden vorhergehenden Blogs eine Einführung in die Thematik und vorbereitende Maßnahmen behandelt haben, geht es im abschließenden Teil der Blog-Serie um das große Ziel: Mit Hilfe von Streaming Expressions ein Modell zur Erkennung von Spam-Mails zu trainieren und zu validieren und […]

Weiterlesen
Blog der SHI GmbH

Solr goes Machine Learning! Teil II

Von Daniel Wrigley I 26 Januar 2017
Veröffentlicht in , ,

Mehr als nur eine Suchmaschine – Solr goes Machine Learning! Teil II In einem vorherigen Blog wurde eine Einführung in das Thema Klassifikation gegeben, das hiermit mit einem konkreten Use Case fortgeführt wird. Dieser zweite Teil der Blogserie wird die Vorbereitungsmaßnahmen beleuchten, die notwendig sind, um Solr als Klassifikationsmaschine einsetzen zu können. Dieser Blog behandelt […]

Weiterlesen
Blog der SHI GmbH

Solr goes Machine Learning! Teil I

Von Daniel Wrigley I 17 Januar 2017
Veröffentlicht in , ,

Mehr als nur eine Suchmaschine – Solr goes Machine Learning! Teil I Spätestens seit dem letzten Major Release von Solr im April letzten Jahres, der Version 6.0, sind Features und Möglichkeiten eingeführt worden, die nicht mehr unbedingt zum klassischen Repertoire einer Suchmaschine zu zählen sind. Abfragen auf Basis von SQL-Syntax sind hier zu nennen, Graphen-Traversierung […]

Weiterlesen
Blog der SHI GmbH

Apache Solr 6.3 – now available

Von Patricia Kraft I 14 November 2016
Veröffentlicht in , ,

Seit dem 08. November ist Apache Solr in der Version 6.3 erhältlich. Neben diversen Fehlerkorrekturen und Optimierungen haben auch einige neue Features ihren Weg in die Suchmaschine gefunden. Nach initialen Tests zu den neuen Funktionalitäten soll im Folgenden Feedback zu dem neuen ResponseWriter für xlsx-Formate der neuen Facetten-Funktionalität facet.exists=true und der erweiterten SQL-Query-Syntax gegeben werden. […]

Weiterlesen
Blog der SHI GmbH

Cloudera Morphlines – ETL Bibliothek für Apache Solr

Von Markus Klose I 21 September 2016
Veröffentlicht in , ,

Wie bekommt man in einem Big-Data Szenario seine Daten in Apache Solr? Eine gute Frage, denn Apache Solr bringt zwar im Standardumfang die Möglichkeit mit, Daten aus dem Dateisystem zu indexieren, aber Apache Solr kann beispielsweise kein HDFS crawlen. Verschärft wird das Problem noch durch die Tatsache, dass in Big Data Szenarien Daten oft unstrukturiert […]

Weiterlesen
Blog der SHI GmbH

Release der Version 1.0.0 von Apache NiFi

Von Daniel Fuckner I 12 September 2016
Veröffentlicht in ,

Erstmalig in der Geschichte von Apache NiFi ist ein Major Release veröffentlicht worden, sodass ab sofort die Version 1.0.0 zum Download bereitgestellt wird. Im Rahmen erster Tests der neuen Version fallen sofort die Änderungen an der Nutzeroberfläche auf, die nun sehr viel eleganter gestaltet ist. Eine weitere fundamentale Änderung betrifft das Clustermanagement. Während ältere Versionen […]

Weiterlesen
Blog der SHI GmbH

Apache Solr DocTransformer – So einfach lässt sich die Trefferliste aufwerten

Von Markus Klose I 09 September 2016
Veröffentlicht in , ,

Die Qualität einer Suche hängt von der Trefferliste ab. Selbstverständlich erwartet der Anwender das „richtige“ Dokument an erster Stelle. Aber auch die Informationen, die in der Trefferliste je Dokument angeboten werden, sind wichtig. Bisher musste man alle Informationen, die man in der Trefferliste anzeigen möchte, auch im Index ablegen. Dies führt zu einem größeren Index, […]

Weiterlesen
Blog der SHI GmbH

Apache Solr 6.2

Von Markus Klose I 09 September 2016
Veröffentlicht in ,

Veröffentlicht am 09.09.2016 von Markus Klose Vor circa einer Woche, am 25. August 2016, wurde die neue Version 6.2 von Apache Solr veröffentlicht. Enthalten ist wie immer eine Reihe von Verbesserungen, Bugfixes und neuen Features. Eine der Neuerungen im neuen Release ist der Upgrade der Apache Tika Version von 1.7 nach 1.13. Somit unterstützt Apache […]

Weiterlesen
Blog der SHI GmbH

Apache NiFi MiNiFi – Agenten für die Daten-Extraktion

Von Markus Klose I 30 August 2016
Veröffentlicht in , ,

Veröffentlicht am 30.08.2016 von Markus Klose Apache NiFi MiNiFi. Hierbei handelt es sich nicht um einen Tippfehler, sondern um den Namen eines Unterprojektes von „Apache NiFi“, welches am 10.06.2016 in der Version 0.0.1 veröffentlicht worden ist. Mit Apache NiFi MiNiFi werden sogenannte Agenten für die Daten-Extraktion möglich. Agenten sind leichtgewichtige Programme mit der Aufgabe Daten […]

Weiterlesen