UdZForschung 1-2019

Abgeschlossene FIR-Forschungsprojekte

Bild 2: Trainings- methode des Vorhersagesystems

Diese Prognosen basieren auf dem sogenannten Self-Enforcing-Network (SEN), welches hier kurz vorgestellt wird. Einige Publikationen 3, 4, 5 bieten einen detaillierten Einblick in die Funktionalität von SEN und beinhalten Angaben zu Anwendungsbereichen, in denen SEN er- folgreich eingesetzt wurde. Das SEN ist ein zweistufiges neuronalesNetzwerk, das von Klüver u. Klüver eingeführt wurde. 6 SEN berechnet die Ähnlichkeit zwischen bereits bekannten Objekten und neuen Objekten. Durch die Bestimmung der Ähnlichkeiten kann SEN zur Kategor isier ung und Clusterung von Objekten verwendet wer- den. 5 Jedes Objekt kann durch numerische Attribute dargestellt werden. Die Werte geben somit an, inwieweit ein Objekt eine bestimmte Eigenschaft hat. Alle bereits bekannten Objekte werden in der soge- nannten semantischenMatrix zusammen- gefasst. Die Spalten dienen zur Darstellung der Attribute und die Zeilen der Matrix ent- halten die einzelnenObjekte. Die Attribute dienen als Eingangsvektoren, sodass das neuronale Netz in der ersten Schicht so viele Neuronen hat wie es Attribute gibt. Für jedes Objekt in der semantischen Matrix existiert ein Ausgangsneuron. Jedes Neuron der Ausgangsschicht ist mit jedem Neuron der Eingangsschicht verbunden. Umdas Netz zu erstellen, werden zunächst die Werte der semantischen Matrix neu kodiert. Die nun normierten Daten der semantischenMatrix, multipliziert mit der Lernrate, entsprechendanndenGewichten der Eingangs- und Ausgangsneuronen. In iterativen Lernschritten werden so die Gewichte weiter angepasst, um das Netz entsprechend den Trainingsdaten anzulernen. Mittels unterschiedlicher Aktivierungsfunktionen, die hier nicht wei- ter erläutertwerden, werdendieNeuronen aktiviert und kategorisieren so die Input- Objekte, indemsie Ähnlichkeiten zwischen

ihnen und den antrainierten Objekten vergleichen und bewerten.

Bild 1 veranschaulicht den Prognoseablauf des Systems.

Zum Training des SENs wurden Logfiles des Unternehmens Ingenieurbüro Schmidt verwendet, die aus dem verwendeten Dokumentenmanagementsystem ex- portiert wurden. Hiermit wurden un- terschiedliche Parameter optimiert, die Korrelationen zwischen Daten vorgeben und damit die Auswirkungen auf die Vorhersage beeinflussen können. Aus den Ergebnissen der Parameteroptimierung wurde eine Simulation über den gesam- ten Datenzeitraum erstellt. Betrachtet man die Ergebnisse genauer, so zeigt sich, dass die Genauigkeit und der Abruf je nach Dokumenttyp variieren. Bild 3 (s. S. 62) zeigt das Ergebnis aufgeschlüsselt nach den am häufigsten verwendeten Dateiendungen: Mit 57 Prozent werden PDF-Dokumente am häufigsten aufgerufen. PDF-Dateien haben eine um 1,4 Prozent bessere Erinnerung als der Durchschnitt. Die Genauigkeit nimmt jedoch um 3,5 Prozentpunkte ab. JPGs sindmit 19 Prozent die amzweithäufigsten angesehenen Dateien. Hier wird eine Recallquote von nur 59 Prozent erreicht. Auch die Genauigkeit von 13 Prozent ist schlechter als der Durchschnitt. DasModell erreicht eine Verbesserung sowohl des Recalls als auch der Präzision der DOC- oder DOCX-, XLS- oder XLSX-Dokumente und DWG-Zeichnungen. Alle Dateiendungen erreichen einen Recall von über 80 Prozent und in einigen Fällen eine Genauigkeit von 40 Prozent.

Jedes Mal, wenn ein Benut zer ein Dokument in das Dokumentenmanage- ment system (DMS) hochlädt , wird ein Ereignis erzeugt. Dieser Upload ist ein Upload auf eine lokale Instanz des Ser vers an einem Standort. Von dor t aus werden alle vorhandenen Dokumente in das Cloud-System gela- den. Aus dem Cloud-System bündelt die Vorhersagemethode die Daten nach den Attributen und gibt die ähnlichsten Daten im Vergleich zu dem neu hochgeladenen aus. Alle Benutzer, die auf die ähnlichen Dokumente zugegriffen haben, werden wahrscheinlich als nächstes auf das neue Dokument zugreifen, weshalb das hoch- geladene Dokument vom DMS auf das lokale Gerät des empfohlenen Benutzers übertragen werden sollte. Zentrales Element dieses Cloud-Systems ist ein selbstverstärkendes Netzwerk. Um das Vorhersage-System zu trainieren, wird eine einfache Methode entwickelt, die in Bild 2 dargestellt ist. Der Trainingsprozess beginnt bei jedem Zugriff eines Benutzers auf eine Datei. Dieses Ereignis veranlasst das System, eine Reihe von Dokumenten vorherzu- sagen, auf die höchstwahrscheinlich als nächstes zugegriffen wird. Wenn der Benutzer auf eine nächste Datei zu- greift, erhält das System eine Belohnung, wenn die Datei Teil der vorhergesagten Menge war. Andernfalls werden die Zugriffsinformationen in einer Datenbank gespeichert, die alle „False-negative- Vorhersagen“ speichert. In regelmäßigen Zyklen nutzt das System die „False- negative-Ereignisse“, um die Parameter des selbstverstärkenden Netzwerks und damit die Vorhersagegenauigkeit zu optimieren.

Der vorgeschlagene Ansatz eines Systems für den proaktivenDatenaustausch könnte

3 s. Klüver 2012 4 s. Klüver 2016a 5 s. Klüver 2016b 6 s. Klüver U. Klüver 2013, S. 518 – 529

57 UdZ – Unternehmen der Zukunft 2/2018 1 9

UdZForschung

Made with FlippingBook flipbook maker