Blog der SHI GmbH

Apache Solr Indexe OHNE Re-Indexierung

Von Markus Klose I 07 September 2015
Veröffentlicht in ,

Apache Lucene/Solr Indexe OHNE Re-Indexierung auf die neuste Version bringen Mit jeder neuen Version von Apache Solr gibt es neue tolle Features und Verbesserungen, von denen man gerne profitieren möchte. Oft bedeutet dies, dass man den Index komplett neu aufbauen (re-indexieren) muss. Dieses bei jedem neuen Solr Release durchzuführen ist natürlich nicht praktikabel. So treffen […]

Blog der SHI GmbH

Multiword SpellCheck

Von Daniel Fuckner I 24 August 2015
Veröffentlicht in ,

Multiword SpellCheck in Apache Solr unter Verwendung des Shingle-Filters Ein oftmals auftretendes Problem in Solr ist die Verwendung der SpellCheckComponent (Meinten Sie …) bei der Überprüfung mehrerer aufeinanderfolgender Begriffe, beispielsweise hinsichtlich der Begriffskombination „biig bang theory“.Die meisten Konfigurationen wenden die SpellCheckComponent in Solr auf einzelne Begriffe an. Sofern eine Query mit mehreren Begriffen an Solr […]

Blog der SHI GmbH

Past Solr Highlights

Von Daniel Wrigley I 10 Juli 2015
Veröffentlicht in ,

Die Entwicklung von Open Source Projekten schreitet oftmals rasant voran. Apache Solr bildet hier keine Ausnahme, sondern bestätigt diese Aussage ganz klar mit Release-Zyklen, die oftmals im Bereich von sechs bis acht Wochen liegen. Mit über einem Dutzend Releases in seit Anfang 2014 ist diese These nicht aus der Luft gegriffen, sondern auch mit Fakten […]

Blog der SHI GmbH

Wie neutral ist medienneutral?

Von Daniel Wrigley I 17 Juni 2015
Veröffentlicht in , , ,

„Unser Redaktionssystem verspricht medienneutrale Datenhaltung mittels XML – aber was dabei herauskommt ist in Wahrheit gar nicht medienneutral.“ Solche oder ähnliche Aussagen bekommt man öfter zu hören, sie geben die gelebte praktische Erfahrung in vielen Verlagen wieder.Schon seit vielen Jahren beschäftigen sich die Verlage landauf landab mit den Herausforderungen der sogenannten „Single-Source“-Produktion. Derzeit erhält das […]

Blog der SHI GmbH

Log Visualisierung mit Lucidworks Fusion – Alles unter einem Dach

Von Markus Klose I 28 Mai 2015
Veröffentlicht in , ,

„Daten sind wie Rohöl!“ – Es steckt viel Potenzial in ihnen, aber man muss es erst herausholen.Heutzutage wird für die „Veredlung“ von Daten oft auf Software wie Splunk oder Nagios zurückgegriffen. Mit solchen Tools können Daten, wie beispielsweise Log Dateien, verarbeitet und vor allem visualisiert werden, d.h. mit Diagrammen, Charts usw. können beispielsweise Trends besser […]

Blog der SHI GmbH

Schema vs. Schemaless vs. Managed Schema

Von Markus Klose I 12 Mai 2015
Veröffentlicht in ,

Schema vs. Schemaless vs. Managed Schema – „Was ist was?“ und „Was passt am besten zu meiner Suche?“ Für eine gute Suche ist die Qualität des Indexes extrem wichtig. Die Qualität des Index setzt sich zum einem aus der Datenqualität und zum anderen aus der Verarbeitung der Daten während der Indexierung bzw. Suche zusammen. Diese […]

Blog der SHI GmbH

Ab wann lohnt sich die Investition in ein Fachportal?

Von Andreas Steber I 30 April 2015
Veröffentlicht in , ,

Die Frage nach dem Return on Invest stellt sich jedem Verlag, der sich mit dem Gedanken trägt, ob er vorhandene Printprodukte durch ein Online-Fachportal ergänzen soll. Dabei spielt es keine grundsätzliche Rolle, ob das Printprodukt wie ein Loseblattwerk oder eine Fachzeitschrift laufend aktuelle Inhalte liefert, oder ob es sich um ein regelmäßig durch Neuauflagen aktualisiertes […]

Blog der SHI GmbH

Document Expiration

Von Daniel Wrigley I 20 April 2015
Veröffentlicht in ,

Wie lange „lebt“ ein Dokument? Oder: Wie man ein Ablaufdatum an Inhalte heftet Seit Solr 4.8 gibt es ein Feature, das aktuell noch nicht besonders dokumentiert und sich daher auch noch nicht weiter Verbreitung erfreuen kann: Document Expiration. Mit dieser Funktionalität kann ich Dokumente basierend auf einem Datumsfeld in regelmäßigen Löschvorgängen aus einem Solr Index […]

Blog der SHI GmbH

Apache Solr 5.1.0 ist erschienen

Von Patricia Kraft I 20 April 2015
Veröffentlicht in ,

Der Such-Server Apache Solr ist in Version 5.1.0 erschienen. Er beinhaltet 39 neue Features, 40 Bugfixes und 36 Optimierungen der vor kurzem veröffentlichten Version 5.1.Die Bugfixes beheben unter anderem Probleme, die die API oder SolrCloud betreffen.Die vollständige Liste der Verbesserungen und Änderungen kann unter dem folgenden Link gesichtet werden:https://lucene.apache.org/solr/5_1_0/changes/Changes.htmlDie aktuelle Version kann auf der Apache […]

Blog der SHI GmbH

Verlagsstrategie Diversifizierung – Wege aus der Nischenfalle?

Von Patricia Kraft I 15 April 2015
Veröffentlicht in ,

Lange Zeit haben Fachverlage ihr Heil darin gesucht, ihre Produkte immer spitzer zu vermarkten und noch in die entlegensten Nischen hinein zu entwickeln. Hohe Produktivitätszuwächse durch Automatisierung im Datenworkflow, die Möglichkeiten umfangreicher Zweitverwertungen vorhandener Inhalte und die Durchsetzbarkeit hoher Preise am Markt ermöglichten auch bei geringen Auflagen gute Gewinne. Kalkuliert wurde auf Basis bekannter Druckkosten, […]