SHI GmbH Augsburg - Ihr Starker Partner für Search & Big Data, Apache Solr, IT Commerce Lösungen

SHI - Support und Service
SHI - Support und Service
Wir sind Dienstleister aus Leidenschaft und verstehen unsere Kunden.
Nach dem Projekt ist vor dem Projekt und individuelle, persönliche
Betreuung stehen bei uns ganz weit oben.
SHI - Individuelle Anwendungen aus Software-Bausteinen
SHI - Individuelle Anwendungen aus Software-Bausteinen
Bei uns bekommen Sie weder Software von der Stange, noch unerprobte Eigenentwicklungen. Wir setzen auf bewährte Open-Source-Technologien und setzen Ihre individuelle Anwendung
aus passenden
Bausteinen zusammen.
SHI - Fast Forward to Success
SHI - Fast Forward to Success
Geschwindigkeit zählt. Bei den Kosten und bei den Erfolgsaussichten.
Bei uns sorgen professionelles Projektmanagement und modulare Entwicklung
für Ihren raschen und effizienten Software-Projekterfolg.
SHI - Beratung  Entwicklung  Consulting
SHI - Beratung Entwicklung Consulting
Wir beraten und unterstützen Sie mit Schulungen, Trainings und Consulting. Von der Strategieberatung bis zur Anwendungsentwicklung helfen wir Ihnen bei der Optimierung Ihrer
Geschäftsprozesse.

Universal AJAX Live Search

This tutorial explains how you can split content of CSV files to be indexed as multiple values in Solr multivalued fields.


Product:

Release    Apache Solr


Problem

You have a CSV file which you want to index into Solr. Some of the columns of the file contain more than one value, but indexing the CSV file reflects these multiple values as one entry in the Solr document’s field. Let the following be your CSV data stored in products.csv:

id,name,categories
1,”Harry Potter”,”book;movie;PC game”

You would like “book”, “movie” and “PC game” to be represented as separate values in the Solr index.

Solution

The solution is to use multivalued=”true” for the field “categories” and tell the indexing update request handler to split the values on a particular symbol (“;” in this example). Using post.jar you can index the CSV file with the following command:

java
-Durl=http://localhost:8983/solr/collection/update/csv
-Dparams="f.categories.split=true&f.categories.separator=;"
-jar post.jar products.csv

This tells Solr a) to split the contents of categories (f.categories.split) and b) that the different values are separated by “;” (f.categories.separator).

Hint: You could also define the additional parameters for the /update/csv handler in solrconfig.xml so you won’t need to add them to every single update command.


Further Recommendation

Get trained
CSV Formatted Index Updates


SEARCH & BIG DATA, BERATUNG, SCHULUNG, ENTWICKLUNG, SUPPORT, PUBLISHER SOLUTIONS
MIT APACHE SOLR, LUCENE, ELASTICSEARCH, SMARTLOGIC SEMAPHORE, SHI INFOPILOT