SHI GmbH Augsburg - Ihr Starker Partner für Search & Big Data, Apache Solr, IT Commerce Lösungen

SHI - Migration
SHI - Migration
Steigen Sie jetzt auf die Open Source Plattform Apache Solr oder die professionelle Distribution Lucidworks Fusion um
SHI - Training
SHI - Training
Schneller am Ziel - Search & Big Data Lösungen erfolgreich entwickeln und betreiben.
SHI - Integration
SHI - Integration
Insbesondere Big Data Lösungen sind nur mit Integration zahlreicher Plattformen realisierbar: Apache Solr, Hadoop, Mahout, Stanbol, HBase, ZooKeeper, Pig und viele andere mehr.
SHI - Apache Solr Beratung
SHI - Apache Solr Beratung
Professionelle Beratung rund um Apache Solr - Wir unterstützen Sie vor, während und nach Ihrem Projekt.

Universal AJAX Live Search

Alias

Der Alias ist ein alternativer Name einer Collection innerhalb der SolrCloud. Ein Client kann den Alias nutzen, um Suchen auszuführen oder neue Dokumente zu indexieren. Unter einem Alias können auch mehrere Collections zusammengefasst werden.

AND

Logische Verknüpfung von Suchbegriffen. Der Response enthält nur Dokumente, die alle Suchterme enthalten.

Anfrage URL

Eine URL, mit deren Hilfe eine Anfrage (Suche oder Befehl) an Solr geschickt wird. Siehe Query.

ausloggen

Das Schreiben von relevanten Informationen in eine Logdatei (siehe Log-File), die einen Vorgang in einer Softwarekomponente protokollieren.

Autocommit

Ein automatisch durchgeführter Commit. Der Autocommit kann so eingestellt werden, dass er in festen Zeitintervallen durchgeführt wird, oder bei Erreichen einer Maximalanzahl von neu indexierten Dokumenten.

Autocomplete

Siehe Autosuggest.

Autosuggest

Automatisch generierte Vorschläge, passend zur Benutzereingabe. Diese werden während der Eingabe dem Benutzer präsentiert, womit er bereits vor dem Abschicken seiner Suchanfrage einen Eindruck davon bekommen kann, welche Suchbegriffe zu Ergebnissen führen werden.

Backupserver

Der Backupserver stellt redundant Funktionalitäten zur Verfügung, die im Fall eines Ausfalls des Primärsystems vorübergehend als Ersatz für dieses dienen.

BM25

BM25 ist der Standard-Scoring-Algorithmus seit Apache Solr 6.0.

Boosting

Durch das Boosting erhalten Dokumente eine höhere Gewichtung und erscheinen damit weiter oben in der Trefferliste, wenn sie in den definierten Feldern (siehe Feld) den Suchbegriff enthalten.

Cache

Ein schneller flüchtiger Speicher. Solr legt die Ergebnisse von Suchanfragen im Cache ab, damit eine erneute Suche mit den gleichen Suchbegriffen schneller beantwortet werden kann.

cachen

Das Bereithalten von Daten im Cache für einen schnellen Zugriff.

Charfilter

Eine Solr-Komponente für die zeichenweise Verarbeitung von Texten, wobei einzelne Zeichen hinzugefügt, verändert oder entfernt werden können.

Collection

Die Collection ist eine logische Zusammenfassung mehrere Indexe (Shards) zu einem Gesamtindex.

Commit

Konsolidierung der neu indexierten Daten im Index. Neue Daten werden im Index erst nach einem Commit auffindbar.

compositeId

compositeId ist der Name für einen Routing-Mechanismus innerhalb der SolrCloud. Bei diesem Mechanismus werden die Dokumente basierend auf der Dokument-ID auf die einzelnen Shards einer Collection verteilt.

Core

Siehe SolrCore

Core Switch

Solr kann auf Befehl zwei Cores miteinander vertauschen. Damit kann beispielsweise im laufenden Betrieb ein im Hintergrund vorbereiteter Index den gerade eingesetzten Index schnell ersetzen.

DataImportHandler

Der Data Import Request Handler ist eine Solr-Komponente, die eine konfigurationsgesteuerte Indexierung von Datenbanken oder XML-Daten ermöglicht.

Datencenter

Bereich, Raum, Einrichtung oder Standort einer zentralen Datenverarbeitung.

docValues

docValues ist ein eine Feldeigenschaft im Schema. docValues erlauben ein effizienteres Sortieren, Facettieren etc.

Dokument

Eine nach definierter Datenstruktur angelegte Dateneinheit.

Dynamicfield

Ein dynamisch erzeugtes Feld, das nicht explizit definiert wurde, sondern bei Bedarf während der Indexierung angelegt wird.

Facette

Ein Navigationselement aus einer gruppierten Ergebnismenge. Eine anhand eines Feldes oder auf andere Weise erstellte Facette liefert eine Liste der im Index vorkommenden Begriffe, anhand derer der Benutzer seine Suche verfeinern kann.

Feld

Ein Teil eines Dokuments in Solr. Die Einteilung der Daten in Felder dient der flexiblen Konfiguration und somit der Möglichkeit einer starken Einflussnahme auf die Indexierung und Durchsuchbarkeit.

Feldname

Der Name eines Feldes. Er dient dem eindeutigen Zugriff auf die mit dem Feld assoziierten Datenfragmente.

Filter

Im Query-Kontext: Ein formaler Ausdruck, der eine Gruppe von Dokumenten beschreibt.
Als Komponente passt ein Filter die zu verarbeitenden Daten entsprechend seiner Konfiguration an.

Filterquery

Ein Suchanfrage an Solr, die einen Filter verwendet.

Filterung

Erstellung einer Untermenge aus einer Gesamtmenge, beispielsweise aus allen Hits, mithilfe eines Filters.

GC / Garbage Collection

Dies ist der Prozess innerhalb der JVM, bei der ungenutzte Objekte aus dem Speicher (Heap) entfernt werden.

Grouping

Grouping ist ein Feature in Solr, bei dem die Trefferliste anders dargestellt wird. Bevor die Trefferliste generiert wird, werden alle Dokumente in Gruppen eingeteilt und es werden diese Gruppen in der Trefferliste dargestellt.

Heap

Der Heap ist der Speicherbereich, der von der JVM genutzt wird, um Objekte temporär zu speichern.

Hit

Ein Dokument, das zur Suchanfrage passt.

Highlighting

Optisches Hervorheben von Suchtermen in der Trefferliste. Oft wird auch ein Teil des Dokuments, das vor und nach diesem Term kommt, mit angegeben. So lassen sich auch Keyword-in-Context-Funktionen umsetzen.

HTML

Abkürzung für Hypertext Markup Language, eine textbasierte Auszeichnungssprache zur Strukturierung und Formatierung von Inhalten wie Texten, Bildern und Hyperlinks in Dokumenten.

HTML-Fragment

Ein in sich konsistenter Teil eines HTML-Dokuments (siehe HTML, Dokument), der flexibel und modular verwendet werden kann.

implicit

implicit ist der Name für einen Routing-Mechanismus innerhalb der SolrCloud. Bei diesem Mechanismus werden die Dokumente in dem Shard indexiert, bei dem der Request angekommen ist.

Index

Ansammlung von Schlagwörtern mit Verweisen auf Dokumente, die diese Schlagwörter enthalten.

indexed

indexed ist ein eine Feldeigenschaft im Schema. Nur Felder, bei denen indexed auf true gesetzt ist, können durchsucht werden.

Indexer

Eine Softwarekomponente, die den Indexierungsvorgang durchführt. Siehe Indexieren.

Indexieren

Auslesen, Aufbereiten und Speichern von Daten in Form einer definierten Datenstruktur, für eine schnelle Durchsuchbarkeit der Daten. Das Resultat des Indexierens ist der Index .

JavaScript

Eine Scriptsprache, die hauptsächlich zur Manipulation von Webseiten in Webbrowsern verwendet wird.

JavaScript Library

Eine Ansammlung von Funktionalitäten für bequeme Wiederwendung bei der Erstellung neuer Funktionalitäten mit JavaScript.

Jetty

Jetty ist ein in Java geschriebener Servlet/JSP-Container und Webserver.

JSON

Abkürzung für JavaScript Object Notation. Ein Datenformat für den Datenaustausch zwischen Anwendungen.

JVM

Abkürzung für Java Virtual Machine. Das Betriebssystem läuft dabei mittels einer Virtualisierungssoftware und nicht direkt auf der Hardware (vgl. physischer Server). Es können mehrere virtuelle Maschinen auf einer physischen Maschine betrieben werden.

Keyword-in-Context

Anzeige eines Suchterms mit seinem Context (meist eine fest definierte Zahl an Zeichen vor und nach dem Suchterm).

komplex

zusammengesetzt, ineinandergreifend

Leader

Der Leader ist eine Rolle innerhalb eines Shards. Jeder Shard hat genau einen Leader, der sicherstellt, dass alle Replicas die gleichen Informationen bzw. Dokumente speichert wie der Leader.

Log-File

Eine Datei, die automatisch generierte Protokolleinträge enthält.

Master-Slave

Ein hierarchisches Prinzip der Regelung und Steuerung. Eine Komponente ist der Master, alle anderen sind Slaves und können nur über Interaktion mit dem Master auf die gemeinsame Ressource zugreifen.

More-Like-This

More-Like-This ist ein Feature in Solr, bei dem Solr zu einem gegebenen Dokument weitere, ähnliche Dokumente zu identifizieren versucht. Die Ähnlichkeit basiert hierbei auf den Inhalten der Felder, die hierfür verwendet werden sollen.

Multivalue

Ein Feld in Solr kann als „multivalued“ definiert werden und somit mehrere Werte aufnehmen.

Oberfläche

Eine grafische Oberfläche stellt Informationen dar und ermöglicht die Interaktion des Benutzers mit der Software. Die Darstellung kann für den Einsatzzweck beliebig angepasst werden und erlaubt den Einsatz von Eingabegeräten wie Maus, Touchpad u. a..

OR

Logische Verknüpfung von Suchbegriffen. Der Response enthält Dokumente, die mindestens eines der Suchterme enthalten.

Parameter

Mit einer URL übertragene Zusatzdaten in der Form <Name>= <Wert>.

Phrasen Suche

Die Phrasen Suche ist eine Technik bei der Suche, bei der mehrere Suchbegriffe im Trefferdokument direkt nebeneinander vorkommen müssen.

physischer Server

Das Serverbetriebssystem mit den benötigten Diensten wird direkt auf der Hardware des Servers ausgeführt (vgl. VM).

Ping (Solr)

Eine Funktionalität zur Sicherstellung der Erreichbarkeit eines Solr-Servers.

Pseudo Field

Eine besondere Form eines Feldes, die dynamisch für den Response erzeugt wird und nicht im Index vorkommt.

QTime

Ein Parametername. Der Parameter wird mit dem Response übermittelt und sagt aus, wie lange die Bearbeitung der Suchanfrage gedauert hat.

Query

Eine Suchanfrage an Solr.

QueryParser

Eine Solr-Komponente, die die Suchanfrage auf definierte Weise verarbeitet und ein Query-Objekt zur weiteren Bearbeitung der Suchanfrage erstellt. Der QueryParser ist Teil des RequestHandlers.

Ranking-Algorithmus

Eine definierte Vorgehensweise zur Sortierung der Suchergebnisse nach ihrer Relevanz bezüglich der Suchanfrage.

Replica

Ein Replica ist eine Kopie eines Indexes (Shards). Mehrere Kopien (Replicas) in einem Shard erhöhen die Ausfallsicherheit und den Query-Durchsatz.

Request

Eine Anfrage an Solr, die eine Suchanfrage oder ein Befehl sein kann.

RequestHandler

Eine Solr-Komponente, die den Request entgegennimmt und verarbeitet.

Response

Solrs Antwort auf einen Request. Der Response enthält die zur Suchanfrage passenden Dokumente.

ResponseWriter

Eine Solr-Komponente, die den Response erstellt und somit dessen Format bestimmt.

Score

Der Score ist der vom Scoring-Algorithmus berechnete Wert, um die Dokumente in der Trefferliste in die richtige Reihenfolge zu bringen.

search-based Application

Eine Anwendung mit dem Schwerpunkt auf Suchfunktionalität.

SearchComponent

Eine wiederverwendbare Einheit, die eine bestimmte Funktionalität für die Suche in Solr bereitstellt.

SearchHandler

Ein RequestHandler, der Suchanfragen verarbeitet. Er kann aus mehreren SearchComponenten zusammengesetzt sein, um die benötigte Funktion zu erfüllen.

Segment

Das Segment ist ein Teil innerhalb des Solr/Lucene Indexes. Ein Index kann aus mehreren Segmenten bestehen. Jedes Segment ist quasi ein eigenständiger kleiner Index.

Shard

Ein Shard (Index) ist ein Teil einer Collection. Mehrere Shards innerhalb einer Collection ermöglichen eine höhere Suchperformance, da die Shards parallel durchsucht werden können.

Shop

Siehe Webshop

Skalierung

Die Anpassung einer oder mehrerer Größen an einen neuen Wert bzw. Werte.

Solr

Apache Solr ist eine Suchplattform mit vielfältigen Funktionen, sowohl für die Suche als auch für die Indexierung verschiedenster Daten.

Solr Term-Komponente

Eine SearchComponent für den Zugriff auf einzelne Begriffe aus dem Index.

SolrCloud

SolrCloud ist die Umschreibung für ein verteiltes, ausfallsicheres Setup von Solr. Dieses Setup beinhaltet unter anderem folgende Funktionalitäten: Verteilte Suche bzw. Indexieren, zentrale Verwaltung des Clusters und der Solr Konfigurationen, Failover, Load Balancing uvm.

SolrCore

Ein Index und seine Konfiguration.

SolrJ

SolrJ ist ein in und für Java geschriebener Client. Dieser Client kann genutzt werden, um mit Solr zu kommunizieren.

Sonderzeichen

Ein Zeichen, das weder ein Buchstabe noch eine Zahl ist.

Spacial Search

Die Spacial Search (Geo Suche) ist eine Suchtechnik, bei der räumliche Entfernungen von Orten in die Suche bzw. das Scoring einbezogen werden.


Spellchecking

Spellchecking (Meinten Sie bzw. Did You Mean) ist ein Solr Feature, bei dem alternative (Such)Begriffe ermittelt werden, nachdem eine Suche ausgeführt worden ist. Mit diesem Feature können Tippfehler bei der Suche ermittelt und korrigiert werden.


SQL-Handler

Der SQL-Handler ist eine Schnittstelle in Solr, die SQL Syntax in Lucene Syntax wandelt. Somit können nun Suchen in Solr in SQL Syntax definiert und ausgeführt werden.


stored

stored ist eine Feldeigenschaft im Schema. Nur Felder, bei denen stored auf true gesetzt ist, können in der Trefferliste angezeigt werden


Streaming Expressions

Die Streaming Expressions ist eine Schnittstelle in Apache Solr, die eine parallele Verarbeitung von Aufgaben ermöglicht. Die Funktionalität des SQL Handlers basiert beispielsweise auf den Streaming Expressions.

String

Eine Zeichenkette endlicher Länge aus einem definierten Zeichensatz.

Suchanfrage

Siehe Query

Suchterm

Ein Term in einer Query.

Surround Search

Die Surround Search ist eine Technik bei der Suche - ähnlich der Phrasen Suche -, bei der mehrere Suchbegriffe im Trefferdokument nah beieinander vorkommen müssen.

Synchronisation

Aktualisierung der Slaves mit dem Master (siehe Master-Slave) über eine Replikation des Indexes. Nach Durchführung der Synchronisation haben alle Komponenten die gleichen Daten im Index.

Synonym Filter

Eine Solr-Komponente, die das Auffinden von Dokumenten ermöglicht, die außer zum genauen Suchbegriff auch zu den zugehörigen Synonymen passen.

Teaser-Text

Teil eines Textes, der einen Einblick in den gesamten Text geben soll. Wird auch in Bezalformaten verwendet, indem ein Teaser kostenlos eingesehen werden kann, der gesamte Text aber nur gegen Bezahlung. Auch in der Trefferliste können Teaser in Keyword-in-Context Features eingesetzt werden, denn dort sollen in der Regel keine ganzen Textpassagen, sondern nur Ausschnitte gezeigt werden.

Term

Ein sinnvoller Ausdruck aus syntaktisch korrekt gebildeten Wörtern oder Wortgruppen.

TF/IDF

TF/IDF ist der Standard-Scoring-Algorithmus bis Apache Solr 6.0

Tokenizer

Eine Solr-Komponente für die Zerlegung eines Textes in Wörter, wenn als Trennzeichen ein Leerzeichen benutzt wird. Das Trennzeichen kann allerdings auch aus anderen Zeichen oder einem Regulären Ausdruck bestehen.

Tomcat

Ein Webserver und Servlet-Container, der die Ausführung von in Java geschriebenen Web-Anwendungen ermöglicht.

Treffer

Siehe Hit

Trefferliste

Die Gesamtmenge aller Hits oder eine Untermenge daraus.

Type

Der Datentyp eines Feldes. Neben den Standarddatentypen wie Integer, Double, String oder Boolean können in einem SolrCore auch selbst definierte Datentypen angelegt werden.

UpdateHandler

Eine Solr-Komponente, die die Indexierung von Daten steuert.

UpdateProcessor

UpdateProcessoren sind konfigurierbare Elemente in Solr, die während der Indexierung eine Manipulation des Dokumentes erlauben.

URL

Abkürzung für Uniform Resource Locator. Eine URL dient der Identifizierung und Lokalisierung einer Ressource in einem Computernetzwerk.

Velocity ResponseWriter

Eine Solr-Komponente, die mithilfe von Templates eine Benutzeroberfläche für die Suche erstellt.

VM

Abkürzung für Virtuelle Maschine. Das Betriebssystem läuft dabei mittels einer Virtualisierungssoftware und nicht direkt auf der Hardware (vgl. physischer Server). Es können mehrere virtuelle Maschinen auf einer physischen Maschine betrieben werden.

Webshop

Eine Website als Online-Vertriebsplattform, auf der den Kunden Informationen über die Produkte und die Möglichkeit zum Kauf bereitgestellt werden.

Zookeeper

Apache ZooKeeper ist ein OpenSource Projekt welches verteilte Systeme koordiniert. In der SolrCloud wird ZooKeeper zur Verwaltung der beteiligten Solr Instanzen und zur Verwaltung der Solr Konfigurationen verwendet.

SEARCH & BIG DATA, BERATUNG, SCHULUNG, ENTWICKLUNG, SUPPORT, PUBLISHER SOLUTIONS
MIT APACHE SOLR, LUCENE, ELASTICSEARCH, SMARTLOGIC SEMAPHORE, SHI INFOPILOT