Blogeintrag

Exakt das benötigte Wissen aus hunderttausend Dokumenten

Paul Caspers, CEO

Intelligenz und Wissen

Nobelpreisträger D. Kahneman schreibt zum Begriff Intelligenz, „sie ist auch die Fähigkeit, im Gedächtnis relevantes Material aufzufinden“ (Daniel Kahneman, Schnelles Denken, langsames Denken, 2012, S. 64)…

Nebst unserem Gedächtnis ist Schriftgut in seinen unterschiedlichen Erscheinungsformen von Dokumenten über Bücher bis zu Websites der bedeutendste Speicher von Wissen.

Das Wachstum dokumentierten Wissens nimmt, befeuert durch die fortschreitende Digitalisie-rung explosionsartig zu. Treiber sind zudem die weltweit steigende Anzahl von Menschen und In-stitutionen, die Wissen generieren, die zunehmende Komplexität unserer Gesellschaft infolge technischer Entwicklungen und das damit eingehergehende Ausufern der Regelwerke.

Aber wie im Gedächtnis gespeichertes Wissen wertlos ist, wenn es bei Bedarf nicht selektiv abrufbar ist, nützt uns auch alles digital gespeicherte Wissen einer Organisation nichts, wenn wir nicht die richtigen Informationen für eine anstehende Aufgabe schnell aus den Archiven und Abla-gen extrahieren können.

Man stelle sich einen Mediziner vor, der eine seltene schwere Krankheit bei einem Patienten behandelt. Für eine optimale Strategie sollte er alle entsprechenden Studien der letzten Jahre nach relevanten neuen Erkenntnissen prüfen - angesichts der vielen tausend Publikationen und anderer wartenden Patienten ein aussichtsloses Unterfangen. Oft kann man vorhandenes Wissen nicht nutzen – Zeitdruck und schiere Masse verhindern die eingehende Sichtung des Materials.

Trotz moderner Suchmaschinen und KI-Technologien beklagen fast alle Anwender in Unter-nehmen, wie schwer es sei, relevante Information zu einem Thema zu finden, von Stunden ja Ta-gen Aufwand ist die Rede – und nicht selten werden fehlerhafte Entscheidungen infolge unzu-reichender Wissensfindung beklagt.

In Anlehnung an Kahneman könnte man postulieren: Die Intelligenz einer Organisation hat auch damit zu tun, inwieweit sie in der Lage ist, dokumentiertes Wissen für die Abwicklung von Auf-gaben gezielt abzurufen.

Verborgenes Wissen

Wenn man nach Wissen zu einem Thema recherchiert, sucht man keine Dokumente. Wissen zu einem definierten Sachverhalt findet sich verstreut in vielen Dokumenten, in unterschiedlichen Ablagesystemen und in diversen - nur über zugeordnete Applikationen lesbaren - Formaten.

Kurzum - Wissen ist schwer zugänglich und nur sehr aufwendig recherchierbar.

Wie wird Wissen heute bereitgestellt?

In Dokumenten fortgeschriebenes Wissen wird unabhängig vom System immer in Form einer Liste von Dateinamen (Seitennamen im Falle von Websites/Wikis) bereitgestellt.

Um an das eigentliche Wissen zu gelangen, muss man zunächst das Dokument im richtigen Ab-lagesystem finden und den Inhalt in einer zugehörigen Applikation öffnen.

Das erinnert an das Schaufenster eines Schuhladens, das anstatt der Produkte nur Schachteln mit Aufschriften - etwa „modischer Halbschuh“ - präsentiert.

Wie werden Rechercheanfragen bedient?

Es kommt noch schlimmer. Sobald man mit einer Suchmaschine auf Dokumenten operiert, ist das Ergebnis immer eine Liste von Dokumenten („Schuhschachteln“). Diese Liste wird je nach Sys-tem etwas anders „aufgehübscht“ – ist aber im Wesentlichen immer identisch: Sie besteht aus n Dokumenten und wer zu deren Inhalt vordringen will, muss die Dokumente öffnen und diese mit der zugehörigen Applikation weiter nach dem benötigten Wissen durchforsten.

Abbildung 1: Typische Trefferliste zu einer Suchanfrage

Fazit

Dokumentiertes Wissen in Unternehmen ist allenthalben versteckt, verstreut, eingesperrt, schwer zugänglich und aufwendig zu erschließen.

Der Zugang zu relevantem Wissen dauert für Anwender viel zu lang und ist viel zu kompliziert.

Die Suchzeiten sind enorm und oftmals wird relevantes Wissen nicht gefunden, was rasch zu Fehlern führen kann.

Merkmale eines intelligenten Wissenszugangs

Das wesentliche Kriterien für einen intelligenten und wirksamen Wissenszugang ist, dass zu jeder Suchanfrage alles Wichtige aus der Fülle der Dokumente präzise extrahiert, übersichtlich zu-sammengestellt in einer sofort nutzbaren Antwort in Sekundenschnelle geliefert wird.

Die Zusammenstellungen sind tief verlinkt mit Quellen und verwandten Themen, sodass ein weiteres Eindringen in die Materie an jeder Stelle per Klick möglich ist. Das Wissen ist generell über einen einzigen Zugriffspunkt mit jedem Standard Browser und auf jedem modernen Medium nutzbar.

Unser erwähnter Mediziner würde also nicht mehr mit der langen Liste von kompletten Stu-dien konfrontiert werden, sondern unmittelbar eine Zusammenstellung mit dem gesamten für seinen Patienten wichtigem Wissen erhalten.

Abbildung 2: Auszug aus der Antwort zur Suchanfrage aus in Abb. 1

Die Matrix des Wissens

Mit der konventionellen Verarbeitung und Indexierung von Dokumenten lassen sich solche Ergebnisse nicht erreichen, da die „Auflösung“ zu gering ist.

Um relevante Extrakte identifizieren und zusammenstellen zu können, muss man die Inhalte von Dokumenten in ihre kleinsten Bausteine zerlegen, diese nach thematischen Beziehungen ver-knüpfen, mit vorhandenen und berechenbaren Metadaten kennzeichnen und das Ergebnis in eine mehrdimensionale Matrix eintragen. Jedes Element eines Dokumentes ist einem Gitterknoten in der Matrix zugeordnet und hat damit n Dimensionen.

Diese Matrix ist Basis für den einfachen Wissenszugang und die Beantwortung von Suchanfra-gen.

Der Nutzen

Auf einer Skala der gesellschaftlichen Auswirkungen Künstlicher Intelligenz von „katastrophal bis irrelevant“ werden mögliche Errungenschaften häufig mit Extremen bewertet: Entweder man fürchtet um die Existenz des Menschen oder man tut die Visionen als unrealistisch ab. Die Wahrheit liegt wohl irgendwo dazwischen.

Theum ist bei renommierten Unternehmen und Organisationen bereits weltweit im Einsatz. Die Software ersetzt mit ihren „Antworten auf Fragen“ aber nicht den Menschen. Was sie tut:

  1. Häufig gestellte Fragen werden per Klick stets mit aktuellen Informationen maschinell beant-wortet. Das stellt Ressourcen frei für nicht automatisierbare Aufgaben.
  2. Ein hoher Prozentsatz genereller Suchanfragen wird ebenso unmittelbar vollständig beantwor-tet.
  3. Fachleute erhalten zu komplexen Fragestellungen alle wichtigen Informationen in Bruchteilen von Sekunden. Zwar muss das Ergebnis ggfs. weiter analysiert, gefiltert, ergänzt und bewertet werden, aber das vorhandene Wissen ist als Input sofort verfügbar. Das erspart auch hier Stunden, oftmals Tage auf aufwendiger Recherchearbeit.
  4. Zudem sinkt die Gefahr für Fehler aufgrund übersehener Information. Denn im Gegensatz zum Menschen kann das System tatsächlich alle verarbeiteten Inhalte durchforsten. Relevante Informa-tionen werden damit viel umfänglicher und zuverlässiger gefunden, als das Menschen möglich ist.

Mitarbeiter werden so maßgeschneidert mit benötigten Informationen versorgt. Sie erhalten die Fähigkeit, Wissen jederzeit gezielt abrufen und damit Aufgaben besser und schneller auszufüh-ren zu können. Anstatt Energie mit öder Sucherei zu vergeuden, konzentrieren sie sich auf ihre eigentliche Arbeit.

Software, die alles Wichtige zu anstehenden Aufgaben ad hoc bereitstellt, erspart jeder Orga-nisation tagtäglich unzählige Arbeitsstunden für die Suche nach Wissen und beschleunigt zudem die Geschäftsabläufe.

Einsatzbereiche

Mögliche Einsatzbereiche für die Lösung sind vielfältig. In allen Unternehmenssektoren, in de-nen umfassende Dokumentationen für die Nutzung durch viele Menschen gesammelt, erzeugt und fortgeschrieben werden, bringt die Lösung signifikante Verbesserungen.

Neben offensichtlichen Einsatzfeldern wie Richtlinien, Normen, Verfahren, Dokumentationen, Ratgebern, Projektakten, Fachmitteilungen, Studien - um nur einige zu nennen, gibt es eine Reihe weiterer Anwendungen, die sich nicht auf den ersten Blick erschließen:

  • Lieferant für Sprach-Assistenten und Chat Bots
  • Input für Hilfesysteme
  • 365-Support Anwendungen
  • Erstellen computer-generierter Exzerpte und Bücher
  • Wettbewerbsbeobachtung
  • Virtuelle Assistenten
  • Bereitstellung von Tagungsunterlagen

Erleichternd für eine Nutzung kommt hinzu, dass die Einführung dieser Technologie weder komplexe Projekte noch Änderungen an den bestehenden Systemen erfordert. Man muss Theum einfach nur mitteilen, wo die zu verarbeitenden Inhalte für einen bestimmten Themenkreis liegen.

Quo vadis KI?

Disruptive KI-gestützte Anwendungen erobern zunehmend Bereiche, die bisher gut ausgebil-deten Menschen vorbehalten und damit von der Automation ausgeschlossen waren. Die kom-mende Technik wird die Menschen nicht verdrängen, sondern sie von stupiden Tätigkeiten weiter entlasten. Dabei werden zwar viele Arbeitsplätze wegfallen, aber Menschen auch in die Lage ver-setzt, effizienter und wirksamer zu arbeiten.

Wie bei allen früheren industriellen Umbrüchen wird durch die „digitale Revolution“ mehr Wohlstand produziert werden. Dieser muss nur gerecht und sozial verteilt werden in der Gesellschaft – darüber sollten wir uns Sorgen machen (Vgl. dazu auch R.D. Precht „K.I. Wohin program-mieren wir uns“.). Vielleicht sollte jeder seine eigene KI bekommen?