Einführung

Alfresco ECM ist ein äußerst modulares und erweiterbares Enterprise Content Management System. Es erlaubt sehr weitreichende Anpassungen und Erweiterungen auf nahezu jeder Ebene. Dazu zählt auch die Ebene des UI (User Interface). Für Alfresco können beliebige, auf eigene Bedürfnisse zugeschnittene Oberflächen (Anwendungen) entwickelt werden. Ob es sich dabei um eine Webanwendung, Desktopanwendung oder mobile Anwendung handelt, ist nebensächlich.

In den meisten Fällen jedoch ist eine Eigenentwicklung nicht notwendig. Denn Alfresco wir mit der Webanwendung „Alfresco Share“ (im Folgenden kurz Share bezeichnet) im Standardlieferumfang ausgeliefert. Share  ist  eine eigenständige, moderne und auf eigene Bedürfnisse anpassbare Webanwendung. Sie löst die bis heute in dem Alfresco ECM enthaltene Webanwendung „Alfresco Explorer“  (im Folgenden kurz Explorer bezeichnet) Schritt für Schritt ab und enthält schon heute die meisten aus dem Explorer bekannten Funktionalitäten.

In dieser Beitragsreihe werden die Fähigkeiten von Share beschrieben.

Weiterlesen

Kategorie: Alfresco ECM | Tags: , , , , | Kommentieren

Apache ManifoldCF verwendet in der Binärversion als Datenbank Apache Derby. Dies hat den Vorteil, dass kein separater SQL-Server benötigt wird. Alternativ kann ManifoldCF mit PostgreSQL betrieben werden.
 
Für das anfängliche Ausprobieren von ManifoldCF liefert Apache Derby durchaus ausreichende Performance im kleinen Rahmen, stößt aber schnell an ihre Grenzen, sobald man anfängt mit ManifoldCF ernsthaft zu crawlen. Bei einer Anzahl der Dokumente von etwa 20.000 steigt die Dauer für einen Job-Durchlauf enorm an und in der Logdatei befinden sich dann reihenweise Einträge wie:

[…] (Worker thread '32') - Found a long-running query (145485 ms): [UPDATE hopcount […]

 

An diesem Punkt ist klar, dass kein Weg mehr an PostgreSQL vorbeiführt. Für die Umstellung muss PostgreSQL installiert sein und als Dienst laufen.

In der Datei properties.xml müssen folgende Zeilen innerhalb der configuration-Entität eingetragen werden:

<property name="org.apache.manifoldcf.databaseimplementationclass" value="org.apache.manifoldcf.core.database .DBInterfacePostgreSQL"/>

<property name="org.apache.manifoldcf.dbsuperusername" value="postgres"/>

<property name="org.apache.manifoldcf.dbsuperuserpassword" value="password"/>

 

Natürlich müssen Benutzername und Passwort mit der jeweiligen Konfiguration der installierten PostgreSQL-Datenbank übereinstimmen.

Kategorie: Lucene & Solr, ManifoldCF | Tags: | Kommentieren

Für alle, die verstehen möchten, wie man eine Search Engine programmiert, bietet die Lernplattform www.udacity.com einen kostenfreien Online-Kurs an. Er ist in sieben Abschnitte gegliedert und dauert sieben Wochen an. Der Einstieg ist zu jeder Zeit möglich.

Für den gleichen Personenkreis könnte das Angebot der Stanford University von Interesse sein. Dort wird ein ebenso kostenfreier Online-Kurs zum Thema Natural Language Processing angeboten. Siehe dazu www.coursera.org

Kategorie: Lucene & Solr | Tags: , , , | Kommentieren

Stand heute

Das Thema Suchfunktion in Online-Shops ist nicht gerade neu. Die Shop-Betreiber haben die Bedeutung einer intelligenten und optimierten Produktsuche als „Conversion Engine“ längst erkannt. In der Studie von ibi research [1], die erst kürzlich veröffentlicht wurde, wird das bestätigt. So kommt die Studie zu dem Ergebnis, dass 70% aller befragten Online-Händler eine optimierte Suche als sehr wichtig erachten würden. Aber nur 16%  seien mit der derzeit eingesetzten Suche zufrieden. Zwischen dem Wunsch und Realität klafft also nach wie vor eine bemerkenswert große Lücke. Weiter heißt es: Mehr als der Hälfte der Online-Händler, die derzeit keine optimierte Produktsuche einsetzen, hätten Interesse an einer Suchlösung. Hohe Kosten und die Abhängigkeit vom Hersteller seien dabei  jedoch ein großes Hindernis.

Diese Befürchtungen deuten auf die Unkenntnis über die Existenz einer De-facto-Standard Suchtechnologie aus dem Open Source Bereich. Namentlich geht es um „Apache Solr“. Das ist durchaus verwunderlich, denn immerhin haben unter anderem auch sehr große Online-Shops wie z. B. Immobilienscout24, Sears, ebay Kleinanzeigen oder auch Zappos Solr für sich entdeckt und setzen es sehr erfolgreich ein.

Es gibt also gute Gründe, Solr genauer unter die Lupe zu nehmen.

Weiterlesen

Kategorie: Lucene & Solr, LucidWorks Enterprise | Tags: , , , , , | Kommentieren

Durch die stetig wachsende Popularität von CMIS, ist hier eine kleine Sammlung von nützlichen Queries aufgelistet.

Alle Queries wurden gegen das Repository Alfresco 4.0 getestet. Dabei bezieht sich der Begriff „folder id“ auf die NodeRef eines z.B. Ordners in Alfresco!

 

CMIS Queries:

Alle Dokumente die mit „.doc“ enden (auch z.B. „.docx“ dabei!):

http://<servername:port>/alfresco/service/cmis/query?q=SELECT cmis:name FROM cmis:document WHERE cmis:name LIKE '%25.doc%25'


Alle Dokumente die mit „.doc“ enden („.docx“ nicht dabei!):

http://<servername:port>/alfresco/service/cmis/query?q=SELECT cmis:name FROM cmis:document WHERE cmis:name LIKE '%25.doc'


 

Weiterlesen

Kategorie: Alfresco ECM, Tipps & Tricks | Tags: , , , , , | Kommentieren