IBM: Watson und Big Data

Ich habe bereits einen ersten kurzen Artikel verfasst1, in dem einige oberflächliche Gedanken zu IBM und zum Potenzial im Geschäftsmodell niedergeschrieben wurden. Heute möchte ich weitere Quellen bemühen und etwas mehr Wissen über die Richtung, in die sich das Unternehmen transformieren will, recherchieren.

Wie schon erwähnt, der Trend, auf den IBM (und wahrscheinlich auch viele andere) setzen, lautet „Cloud und Big Data“. Unter Cloud bzw. Cloud Computing versteht man vereinfacht gesagt ein riesiges Rechenzentrum mit großen Speicherkapazitäten, in dem Daten sowie Programme abgelegt sind, die dann von externen Terminals, die die konventionellen Rechner, auf denen alles lokal installiert und verfügbar war, ersetzen, aufgerufen werden können. Wikipedia beschreibt Cloud Computing als „Ansatz, abstrahierte IT-Infrastrukturen (z. B. Rechenkapazität, Datenspeicher, Netzwerkkapazitäten oder auch fertige Software) dynamisch an den Bedarf angepasst über ein Netzwerk zur Verfügung zu stellen“.2

Laut einem Dokument des NIST (National Institute of Standard and Technology)3 kann man das Cloud Computing in drei verschiedene Kategorien unterteilen:

  • Software as a Service: Hier wird dem Nutzer eine oder mehrere Applikationen zur Verfügung gestellt, die in der Cloud abgespeichert ist und von verschiedenen Clients über ein Netzwerk (z.B. via Webbrowser) ohne lokale Abspeicherung aufrufbar ist. Der Kunde hat weder Kontrolle über die Infrastruktur, noch über die Applikationen, die auf dieser Infrastruktur verfügbar sind.
  • Platform as a Service: Diese Struktur unterscheidet sich von Software as a Service dadurch, dass der Kunde einen gewissen Einfluss auf die Applikationen nehmen kann. Die Steuerung der Infrastruktur bleibt ihm trotzdem verwehrt.
  • Infrastructure as a Service: Hier stellt der Clouddienstleister nur die Infrastruktur zur Verfügung, der Kunde kann Betriebssysteme, Netzwerkstrukturen, Speicherkapazitäten, etc. beeinflussen.

Der nächste geflügelte Begriff ist wie zuvor erwähnt „Big Data“ und wird von Wikipedia wie folgt definiert: „[Big Data] bezeichnet Daten-Mengen, die zu groß, oder zu komplex sind, oder sich zu schnell ändern, um sie mit händischen und klassischen Methoden der Datenverarbeitung auszuwerten“.4 Mit zunehmender Nutzung von Internet, Social Network und ähnlichen großen Themen gibt es Sekunde für Sekunde mehr Daten. Bereits 2011 war die Wachstumsrate so hoch, dass die globale Datenmenge sich alle zwei Jahre verdoppelt.5 Wenn man Google um aktuellere Studien und Zahlen zu diesem Trend bemüht, kommen ohnehin nur Werte zum Vorschein, die für langsam und schwerfällig denkende Menschen wie mich nicht mehr greifbar sind. Ich habe mich mit der Vereinfachung angefreundet, dass das globale Datenvolumen riesig ist und in ebenso riesigen Schritten weiterwächst.

Die Implikationen, die eine solche banale Erkenntnis beinhaltet, sind unter anderem, dass diese riesigen Datenmengen – vorerst unstrukturiert – irgendwo gespeichert und verfügbar gemacht werden müssen. Hierzu benötigt es immer leistungsfähigere Infrastruktur (Server, Speicherkapazitäten, Energie zum Betrieb, Kühlsysteme, Back up Systeme, Netzwerkanbindungen, Sicherheitssysteme gegen Datendiebstahl, uvm.). Außerdem wird es aufgrund der ständig wachsenden Datenmenge immer wichtiger, eine effiziente Möglichkeit anzubieten, diese unstrukturierten Daten in vertretbarer Zeit zu analysieren und auszuwerten, um sie zu nutzen.

Daten werden zu einem Rohstoff, der mit bestimmten Prozessen be- und verarbeitet werden muss, um sein Potenzial zu entfalten. Wenn ich beispielsweise ämtliche Tweets, die im letzten Jahr über den Nachrichtendienst Twitter kommuniziert wurden, verfügbar hätte, könnte ich damit per se noch nichts anfangen. Es würde sogar ziemlich viel Speicherkapazität verschlingen. Hätte ich aber eine Software, die mir innerhalb kurzer Zeit diese Tweets nach Bedarf auswerten kann, zum Beispiel wie oft in diesen Tweets irgendetwas positives oder negatives über McDonalds mitgeteilt wurde, könnte ich diese Erkenntnis gewinnbringend verkaufen.

Hier kommt der bereits im letzten Artikel über IBM erwähnte Watson ins Spiel. Einer breiteren Bevölkerungsschicht wurde dieses künstliche Superhirn bekannt, als es die Quizshow Jeopardy dominiert hat.6 Das Beachtliche an Watson ist, dass man ihn mit in natürlicher Sprache formulierten Problemstellungen konfrontieren kann und er sehr viele Eigenheiten der menschlichen Sprache mittlerweile gut erfassen kann. Wer die Funktionsweise von Jeopardy kennt und außerdem etwas Verständnis für die Welt der Computer und ihrer Programmierung hat, der kann sich ausmalen, was für eine große Herausforderung das ist. In den letzten Wochen und Monaten habe ich mich immer wieder am Rande mit dem Potenzial dieses Produktes auseinander gesetzt und ich bin schlichtweg fasziniert von den Möglichkeiten.

Eine kommerziell nutzbare Ausprägung von Watson ist beispielsweise Watson Healthcare.7 Ich würde diese Schiene am ehesten als Diagnosehilfe für den medizinischen Bereich beschreiben. Es dürfte ziemlich klar sein, dass Tag für Tag in allen verschiedenen Sparten der Medizin weltweit Unmengen an Forschungsergebnissen, wissenschaftlichen Erkenntnissen, Feldstudien, Therapiefortschritten, Erfahrungsberichten mit Medikamenten, etc. produziert werden. Es liegt auf der Hand, dass selbst der beste Arzt der Welt all diese Informationsflut niemals verarbeiten kann und deshalb in seiner Diagnostik oftmals auf Intuition angewiesen ist. Im Gegensatz dazu ist Watson in der Lage, diese Informationsmengen innerhalb kürzester Zeit zu analysieren. In einem der unten auf youtube genannten Demovideos wurde erwähnt, dass die Analysekapazität von Watson Millionen von Buchseiten pro Sekunde übersteigt und natürlich täglich weiterwächst. Die Idee ist es offenbar, die Diagnose für einen bestimmten Patienten quasi durch Arzt und Watson in Teamwork zu erarbeiten. Der Arzt fragt den Patienten nach seinen Symptomen, Watson analysiert innerhalb kürzester Zeit die gesamte weltweit verfügbare medizinische Literatur, stellt dem Arzt weiterführende Fragen, die dieser abklären kann, erarbeitet Vorschläge für Therapie und weitere Untersuchungen, könnte eventuell vorhandene genetische Veranlagungen mit familiären Daten abgleichen, und so weiter. Wird eine komplexe Diagnose richtig gestellt, lernt Watson dazu, wird effizienter und jeder Arzt auf der Welt, der dieses System nutzt, wird auf diese Erfahrung zugreifen können.

Ein weiterer Ableger, der mich besonders gefesselt hat, ist der Watson Debater.8 Dieses Tool hat den Zweck, zu argumentieren. Der Computer wird mit einer bestimmten Behauptung oder etwas ähnlichem „gefüttert“ und soll unter Zuhilfename des gesamten weltweit verfügbaren Fachwissens Argumente pro und contra dieser Behauptung finden und in natürlicher Sprache formuliert ausgeben. Im zitierten Demovideo wurde dies mit der Frage, ob gewalttätige Computerspiele für Jugendliche verboten werden sollen, oder nicht, vorgezeigt.

Das waren nur zwei von unzähligen Einsatzfeldern und Branchen, die durch diese Technologie revolutioniert werden können. Wenn man sich Gedanken über dieses Konzept macht und versucht, sich vorzustellen, wo es überall kommerziell einsetzbar sein wird, wird einem das Ausmaß erst so richtig bewusst. Man stelle sich beispielsweise einen voll automatisierten IT-Helpdesk vor. Man ruft an (oder schreibt ein Mail), tritt in Kommunikation zu einem Computer, der die menschliche Sprache versteht, schildert ihm das Problem mit einer bestimmten Software und der Computer löst dieses Problem. Im Gegenzug dazu sind konventionelle Helpdesks natürlich auf verlorenem Posten. Wenn im Support eines bestimmten Softwareunternehmens beispielsweise 100 Mitarbeiter als troubleshooter sitzen und Kundenprobleme behandeln, dann haben die 99 anderen Mitarbeiter vorerst überhaupt nichts davon, wenn ein einzelner Mitarbeiter ein neues Problem löst. Erst wenn der Lösungsprozess ordnungsgemäß verarbeitet, den anderen Mitarbeitern kommuniziert und von denen verinnerlicht wurde, hat sich die Kompetenz auf alle anderen verbreitet. Die Effizienz eines konventionellen Helpdesks verbessert sich also – wenn überhaupt – nur langsam, während ein „watsonisierter“ Helpdesk seine Effizienz und seine Lösungskompetenz in Echtzeit steigert. Ähnliche Gedankengänge lassen sich für konventionelle Callcenter, für viele Verwaltungstätigkeiten, für Bereiche in der Rechtswissenschaft, im Forschungsbereich oder auch im Finanzwesen (vor allem für Investmentstrategien, die sehr stark auf quantitativen Methoden beruhen), anstellen.

Zur Konkurrenz von IBM

In den nächsten Wochen will ich dann noch einen ersten Versuch wagen, etwas über mögliche Konkurrenten zu erfahren. Falls ich etwas interessantes herausfinde, werde ich natürlich darüber schreiben. In der Datenanalytik gibt es beispielsweise ein nicht börsenotiertes Unternehmen mit dem Namen SAS.9 In dem zitierten Bericht nennt der CEO von SAS übrigens IBM (und nicht Google oder Amazon) als schärfsten Konkurrenten. Für Watson hat er scheinbar trotzdem nicht besonders viel Bewunderung übrig. Ich bin schon gespannt, ob sich über dieses Unternehmen und seine Produkte etwas recherchieren lässt.

Unabhängig davon bin ich der Meinung, dass – selbst wenn kleinere und unbekanntere Unternehmen derzeit in ihrer Forschung noch weiter wären als IBM, was ich nicht beurteilen kann – letztendlich der Anbieter das Rennen machen wird, der die beste Vernetzung in die IT-Abteilungen dieser Welt hat, und das ist zweifellos IBM. Die Funktionalität einer ständig dazulernenden Analysesoftware wie Watson, die auf „cognitive computing“ basiert, hängt von der Anzahl der Interaktionen und der Nutzer dieser Software ab, da das System mit jeder Interaktion lernt und effizienter wird. Je mehr Ärzte bzw. Krankenhäuser beispielsweise Watson Healthcare nutzen und damit Diagnosen erstellen, desto größer wird die Wissens- und vor allem Erfahrungsbasis, die in diesem System aufgebaut wird. Ein newcomer könnte diesen Erfahrungsschatz niemals in kurzer Zeit reproduzieren und gleich effizient zur Verfügung stellen. Ich denke, dass das Unternehmen IBM hier aufgrund seines bereits vorhandenen weltweiten Kundennetzwerks, seinen Verbindungen vor allem zu den „altmodischeren“ Unternehmen, bei denen die IT mehr ein notwendiges Übel, als die zentrale Mission darstellt, einen unschätzbaren Vorteil hat, wenn es darum geht, diese Produkte auf einer breiten Basis in den Markt einzuführen.

 

1 http://bargain-magazine.com/ibm-und-das-portfolio/

2 http://de.wikipedia.org/wiki/Cloud_Computing

3 http://de.slideshare.net/crossgov/nist-definition-of-cloud-computing-v15

4 http://de.wikipedia.org/wiki/Big_Data

5 http://www.verivox.de/nachrichten/globales-datenvolumen-erreicht-18-zettabyte-in-diesem-jahr-74735.aspx

6 Interessierte können sich beispielsweise auf youtube hier anschauen, wie das damals gelaufen ist: https://www.youtube.com/results?search_query=watson+jeopardy

7 Auch hierzu gibt es auf youtube haufenweise Videos, die in teils ziemlich gut für den Laien verständlichen Art die Funktionsweise dieses tools erklären: https://www.youtube.com/results?search_query=watson+healthcare

8 ein sehr sehenswertes Demovideo auf https://www.youtube.com/watch?v=7g59PJxbGhY

9 http://fazjob.net/ratgeber-und-service/beruf-und-chance/it-und-telekommunikation/122611_Watson-hat-mich-nicht-beeindruckt.html

 

9 Kommentare IBM: Watson und Big Data

  1. Matthias

    Big Data ist ein Thema, wo alle Anbieter von Business Intelligence Lösungen dran sind.

    inkl. Microsoft, Oracle, SAP + die ganzen IT Berater, Accenture, Capgemini etc. In letzter Zeit auch Finanzdienstleister Big 4.

    Den großen Vorteil bei IBM sehe ich, dass sie die komplette Implementierung abdecken, Hardware und die Beratungsleistung abdecken.

    Ich arbeite selbst in dem Bereich, jedoch nur mit SAP

    Reply
  2. Daniel

    @Matthias:
    Hast Du möglicherweise einen besseren Einblick, wie weit die anderen von Dir genannten Unternehmen in diesem Bereich sind? Wenn ja, würden mir Hinweise auf konkrete Produkte sehr weiter helfen, genauso wie Links zu guten Magazinen, Zeitschriften, etc.

    Ich habe jedenfalls noch nichts gefunden, das mir auch nur annähernd so mächtig wie Watson vorgekommen wäre. Wie gesagt, meiner Meinung nach ist der moat bei cognitive computing umso stärker, je größer die userbase ist.

    Reply
    1. Daniel

      Zum Beispiel habe ich nichts Adäquates oder Vergleichbares zum Diagnosetool in Watson Healthcare gefunden. Ich denke, dass es nur sehr schwer möglich ist, für einen Newcomer etwas ähnliches bereitzustellen.

      Das jüngste Indiz dafür, dass Watson die beste Analysetechnik momentan ist, ist meines Erachtens die Kooperation zwischen IBM und Twitter. Letztere hätten sicherlich Zugang zu allen anderen Konkurrenten haben können, haben sich aber für IBM entschieden.

      Reply
      1. Matthias

        Ich bin jetzt kein Experte was Watson anbelangt, aber man sollte vielleicht beachten, dass der Medizin Bereich und vor allem die Ärzte eher als innovationsfeindlich anzusehen sind, was IT und Organisationsveränderungen anbelangt. Soweit ich das sagen kann, befindet man sich bei Watson noch in der Grundlagenforschung.

        Nur als Beispiel, in der Industrie hat man bereits vor 25 Jahren angefangen ERP (SAP, Navision) einzuführen. Im Krankenhausbereich ist das erst in den letzten Jahren ein Thema geworden.

        Daher bis eine solche Technologie Umsätze generiert können noch Dekaden vergehen.

        Reply
        1. Daniel

          Ich habe den medizinischen Bereich nur als Beispiel genommen. Watson wird auf allen möglichen Schienen ausgerollt (Finanzen, Recht, akademische Forschung, Consulting, etc.).

          Abgesehen davon generiert das schon Umsätze, gar nicht so wenig.

    1. Daniel

      Nein, sowas gibt`s bei uns in der Provinz noch nicht :-)

      Ist aber sicher ein großes Thema in den nächsten Jahren. Auch das von Dir angesprochene internet of things.

      Man blickt halt mit einem lachenden und einem weinenden Auge in die Zukunft: einerseits ist es spannend und faszinierend, wie sich die Technik weiterentwickelt, andererseits kommt einem das Grausen, wenn man sich überlegt, wie viel auch von „spezialisierteren“ Berufen bald wegrationalisierbar ist.

      Reply
  3. Matthias

    Ich denke, unsere Generation wird es noch erleben, wie manuelle Arbeit beinahe komplett automatisiert wird.

    Ich hatte beruflich einige Projekte in der Papierindustrie, Werke die früher 4000 Mitarbeiter hatten, werden heute mit einer Belegschaft von 400 Leuten betrieben und der halbe Produktionsbereich und das Lager dürfen gar nicht betreten werden, weil vollautomatisiert

    Der Großteil sind Instandhalter und es ist nur eine Frage der Zeit, bis solche noch relativ sichere Bereich ebenfalls unter Druck kommen.
    Dazu zählt für mich auch der Pflegebereich.

    Umso wichtiger ist es am Kapitalmarkt aktiv zu sein und so an Effizienzgewinnen zu partizipieren.

    Trifft sich der Investmentclub regelmäßig in Graz ? Ab und zu bin ich noch in meiner alten Studienstadt und würde gerne mal vorbeischauen.

    Reply

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *