Startseite » Allgemein »

Lernfähige Software erleichtert Suchvorgänge

Big-Data-Analyse-Instrumente der Zukunft
Lernfähige Software erleichtert Suchvorgänge

Big Data | Bisherige Softwaretools können sogenannte unstrukturierte Informationen wie PDF-Dokumente oder E-Mails oft nicht analysieren. Das IT-Unternehmen Sinequa bietet eine Plattform, die Daten semantisch analysiert. So erhalten Suchende unternehmensweit schnell für sie relevante Informationen.

Frank ZscheileFreier IT-Fachjournalist, München

Im industriellen Umfeld ist, wenn von Big Data gesprochen wird, zumeist Industrie 4.0 gemeint. Darunter versteht man die IP-basierte Vernetzung selbst kleinster Produktionseinheiten über das Internet, welche permanent Daten liefern, die es zu verarbeiten gilt. Nebenher fallen in jedem Industrieunternehmen auch geschäftliche Daten an, und zwar in einem immer größeren Ausmaß. Um strukturierte Daten, also solche in Tabellen- oder Listenform, zu erschließen, haben Unternehmen in den vergangenen Jahren viel in Business-IT-Systeme wie ERP-, CRM- SCM-Systeme, Business Warehouse und Business Intelligence investiert. Jedoch liegt der weitaus größere Teil geschäftlicher Informationen in unstrukturierter Form vor, also als Office-, PDF-Dokument, Webseite oder als E-Mail. Je unstrukturierter die Daten, desto höher die Anforderungen an die zugrundeliegenden Algorithmen zu deren Auswertung. An ihnen hängt demnach, ob dieser Wissensschatz gehoben und für die Unternehmenssteuerung nutzbar gemacht werden kann.
Logische Zusammenhänge herstellen
Eine moderne „Big-Data-Initiative“ muss daher beide Datenwelten zusammenführen und neben den strukturierten auch unstrukturierte Daten in die Suche und Analyse einschließen. Ermöglicht wird dies etwa durch Techniken der semantischen Analyse und des „Natural Language Processing“ (NLP) oder auch Computerlinguistik. Unter NLP versteht man die Fähigkeit eines Computerprogramms, menschliche Sprache so zu verstehen, wie sie gesprochen oder geschrieben wurde. Durch diese Werkzeuge lässt sich eine Suchanfrage wirklich verstehen und die Bedeutung eines Textes erfassen. So erhält der Suchende Informationen, die über eine ursprüngliche Keyword-Abfrage inhaltlich hinausgehen. Gleichzeitig können Informationen über geschäftsrelevante Filter kategorisiert werden.
Dies hilft dem Anwender, unter allen von der Suchmaschine als relevant angezeigten Ergebnissen die für ihn entscheidenden sofort zu erfassen. Such- und Analysewerkzeuge ohne NLP-Technik werden den heutigen Anforderungen von Unternehmen an Enterprise Search und Big-Data-Analyse nicht mehr gerecht. Der IT-Dienstleister Sinequa hat eine Software entwickelt, die für 20 verschiedene Sprachen, darunter beispielsweise Chinesisch, Japanisch, Koreanisch oder Arabisch semantische Analysen erstellen kann.
Zum Einsatz kommen solche Analyse-Plattformen bevorzugt im Bereich des Enterprise Search, also der organisierten Suche in strukturierten und unstrukturierten Daten innerhalb einer Organisation. NLP geht über bloße Sprachidentifikation, Worttrennung und Text-Extraktion hinaus. Zu den NLP-Aufgaben gehören Techniken wie Satzsegmentierung und -analyse (Parsing), also das Aufteilen von Sätzen in verschiedene Teile, um Beziehungen und Bedeutung zu verstehen. Außerdem wird NLP genutzt für „Deep Analytics“, das heißt die Anwendung von Machine-Learning-Algorithmen zur Kategorisierung von Inhalten, „Named Entity-Extraktion“ – die Identifizierung von Fachbegriffen, Personen-, Firmen- und Produktnamen und Co-Referenzauflösung, also welche Begriffe oder Personen kommen im gleichen Text oder Satz vor.
Konzerne wie Airbus, Astra Zeneca, Siemens oder Total nutzen diese Software bereits für ihre NLP-basierten unternehmensweiten Suchen. So stellt Airbus Defence and Space komplexe Systeme her, zu denen große Mengen an Dokumentation, Spezifikationen, Richtlinien oder Verträge angefertigt werden. Diese liegen in verschiedenen Informationssilos an geographisch verteilten Orten im Unternehmen. Das erschwert, die jeweils gesuchte Information in Echtzeit aufzufinden. Über eigene „Konnektoren“ ist die Sinequa-Software mit diesen Datenquellen verbunden und liefert den Beschäftigten quer durch alle Abteilungen – vom Ingenieurwesen über IT- und Personalabteilung bis zum Finanzsektor – relevante Ergebnisse auf die Suchanfragen.

Was kann die linguistischeAnalyse-Plattform von Sinequa?
Automatische Extraktion von Begriffen und Navigation in begrifflich geordneten und nach Relevanz sortierten Informationen
Text-Mining mit Tagging einzelner Wörter
Erkennung semantischer Zusammenhänge (etwa bei gleichzeitigem Auftreten der Begriffe innerhalb eines Satzes)
Integration von „Unternehmens-Wissen“ in Form von Wörterbüchern, Taxonomien oder Ontologien
Unsere Webinar-Empfehlung
Industrieanzeiger
Titelbild Industrieanzeiger 6
Ausgabe
6.2024
LESEN
ABO
Newsletter

Jetzt unseren Newsletter abonnieren

Webinare & Webcasts

Technisches Wissen aus erster Hand

Whitepaper

Aktuelle Whitepaper aus der Industrie

Unsere Partner

Starke Zeitschrift – starke Partner


Industrie.de Infoservice
Vielen Dank für Ihre Bestellung!
Sie erhalten in Kürze eine Bestätigung per E-Mail.
Von Ihnen ausgesucht:
Weitere Informationen gewünscht?
Einfach neue Dokumente auswählen
und zuletzt Adresse eingeben.
Wie funktioniert der Industrie.de Infoservice?
Zur Hilfeseite »
Ihre Adresse:














Die Konradin Verlag Robert Kohlhammer GmbH erhebt, verarbeitet und nutzt die Daten, die der Nutzer bei der Registrierung zum Industrie.de Infoservice freiwillig zur Verfügung stellt, zum Zwecke der Erfüllung dieses Nutzungsverhältnisses. Der Nutzer erhält damit Zugang zu den Dokumenten des Industrie.de Infoservice.
AGB
datenschutz-online@konradin.de