Enterprise Search mit Apache Solr – ein Leitfaden für Entscheider – Teil 1
Mit Enterprise Search können Mitarbeiter, Kunden und Partner Informationen unabhängig von der Datenquelle schnell finden und damit smarte Geschäftsentscheidungen treffen. Dabei spielt Open Source Software (OSS) heute eine entscheidende Rolle. Neben Betriebssystemen (z. B. Linux), Datenbanken (z. B. MySQL), Applikationsservern (z. B. JBoss) bietet OSS mit Solr einen Suchserver der Extraklasse an.
Dieser Artikel ist als eine Hilfestellung für die Entscheidungsträger gedacht, die den Einsatz der Open Source Technologie Lucene und Solr in ihrem Unternehmen erwägen.
Einführung
Effizienter und schneller Zugriff auf Geschäftsinformationen versetzt Mitarbeiter in die Lage, intelligente und gewinnbringende Entscheidungen zu treffen. Doch wie bekommt man die steigende Datenflut in den Griff? Unternehmen erzeugen massenhaft Information, können sie aber nicht produktiv nutzen. Die Werkzeuge, die ausgezeichnete Dienste im Web leisten, sind im Unternehmensumfeld nur bedingt sinnvoll einsetzbar. Unternehmensdaten (im Gegensatz zu Webdaten) unterliegen anderen Kriterien:
- Die Popularität eines Dokuments sagt sehr wenig über dessen Bedeutung im Hinblick auf eine bestimmte Fragestellung aus.
- Unternehmensdaten unterliegen der Zugriffkontrolle.
- Unternehmensdaten werden oft unstrukturiert in unterschiedlichen Datensilos (z. B. Alfresco, SharePoint, Datenbanken, freigegebene Laufwerke, etc.) und Formaten abgelegt.
Hier kommen Solr und Lucene aus dem Umfeld der Apache Foundation ins Spiel. Lucene ist eine leistungsfähige Suchbibliothek (search engine). Solr basiert auf Lucene und bringt zusätzliche Services zur Realisierung mächtiger Suchlösungen. Beide Technologien sind nicht nur sehr performant, aber auch skalierbar und benutzen moderne und bewährte Algorithmen zur Relevanzberechnung (relevance ranking). Basierend auf der Anfrage eines Benutzers liefern sie die bestmöglichen Ergebnisse. Dazu müssen Datensilos und Dateiformate wie z. B. Word-, PDF-Dokumente, PPT-Präsentationen oder E-Mails regelmäßig, inkrementell indexiert und die Ergebnisse in Bruchteil einer Sekunden unter der Berücksichtigung der Benutzerrechte geliefert werden. Lucene und insbesondere Solr wurden im Hinblick genau auf diese Unternehmensanforderungen entwickelt.
Ein weiteres immer mehr an Bedeutung gewinnendes Feature ist die so genannte Facettensuche (facetted search) oder Kategorisierung. Hierzu werden bestimmte Felder eines Dokuments im Suchindex zur Bildung von Facetten herangezogen. Sehr gerne wird diese Funktionalität in E-Commerce-Seiten benutzt. Sie trägt zur „Usability“ einer Seite bei und hilft den Kunden oder Interessenten, auf eine einfache Art und Weise Suchergebnisse zu verfeinern.
Für die meisten Teams gehört Entwicklung einer Suchlösung nicht zu täglichen Aufgaben. Eine Enterprise Search Lösung zielt auf die Verarbeitung und Bereitstellung massenhafter, unstrukturierter und sich oft ändernder Daten. Unterstützung durch Experten bei der Optimierung des Index, Relevanz und der Suchgeschwindigkeit kann einen entscheidenden Unterschied bei der Einführung einer Suchlösung in Ihrem Unternehmen ausmachen. Die langjährige Expertise hilft Ihrem Unternehmen, die Open Source Technologie passgenau und optimal auf Ihre Geschäftsanforderungen hin zu integrieren. Und das ohne Lizenzkosten einer proprietären Software.
Aus diesem Grund bieten SHI Elektronische Medien GmbH in Zusammenarbeit mit ihrem Partner LucidImagination (die Erschaffer von Solr) Support, Training und professionelle Consulting Services an. Mit unserer Expertise steht der erfolgreichen Einführung Ihrer Suchlösung nichts mehr im Weg.
Dieser Artikel ist als eine Hilfestellung für die Entscheidungsträger gedacht, die den Einsatz der Open Source Technologie Lucene und Solr in ihrem Unternehmen erwägen. Er beleuchtet folgende Aspekte:
- Mit Open Source Kosten und Risiko senken.
- Warum Search Expertise der Schlüsselfaktor für Ihre erfolgreiche Suchlösung ist.
Vorteile von Open Source
Open Source hat die IT-Landschaft nachhaltig geprägt. Es dringt selbst in die Bereiche vor, die vor gar nicht langer Zeit im festen Griff der Anbieter propriäterer Software waren. Heute sind die meisten Unternehmen mit den frei-verfügbaren Open Source Produkten wie z. B. Linux, MySQL, Apache und SugarCRM vertraut. Die Gründe hierfür liegen klar auf der Hand:
- Niedrigere Kosten
- „Pay at the point of value“
- Transparente Entwicklung
- Keine Herstellerabhängigkeit
- Breites Experten- und Integratorennetzwerk
- Verfügbarkeit diverser Server Level Agreements (SLAs)
- Geringes Gesamtrisiko
Mit rasanter Verbreitung von Solr über alle Marktsegmente gibt es diese Vorteile auch für Enterprise Search Anwendungen. Das wird nachfolgend genauer beleuchtet.
Niedrigere Kosten
Während Anbieter proprietärer Software ihre Investitionen für die Entwicklung wieder hereinholen müssen, gilt dies nicht für die Open Source Software. Zur Entwicklung von Open Source Software benötigt man keine Investitionskosten. Entwicklung durch die Community, Befolgung von Standards, und einfache Anpassung sorgen dafür, dass mehr und mehr Entwickler Open Source aufgreifen. All diese Faktoren tragen zur Kosteneffizienz von Open Source Software bei.
Hohe Kosten für proprietäre Software können deren Einführung in Unternehmen und Organisationen erschweren oder gar unmöglich machen. Im Gegensatz dazu ermutigen die Open Source Communities Nutzung ihrer Software. Jeder kann diese Software herunterladen, ausprobieren und sich aktiv an der Verbesserung beteiligen.
Viele Kunden glauben, dass der Kauf einer Softwarelizenz genüge, um eine Suchlösung zu installieren und zum Laufen zu bringen. In den meisten Fällen jedoch kommen zusätzliche Kosten für die Anpassung und Konfiguration hinzu. Customisation ist unvermeidbar – unabhängig davon, ob es ich um proprietäre oder frei verfügbare Software handelt. Im Falle der Open Source Software gibt es keine Anschaffungskosten. Dieses Budget kann in die Custamisation investiert werden. Genau das macht die Open Source Software günstiger.
"Pay at the Point of Value"
Open Source Software ist frei verfügbar. Jede Organisation und jedes Unternehmen können sie sofort in jeder Phase – angefangen von der Evaluierung bis Produktivnutzung – verwenden. Sieht ein Kunde Mehrwert z. B. im Support oder in einer neuen Funktionalität, dann kann er genau diese Leistungen buchen. Nicht mehr und nicht weniger.
Fortsetzung folgt…..

Newsletter
Anmelden |
