20 Jahre Google: Einblicke in die Wissenschaft über intelligente Maschinen in Silicon Valley, Paderborn und OWL

03.09.2018

Ein Beitrag von Presseinformation

Vor ziemlich genau 20 Jahren gründeten die beiden US-amerikanischen Studierenden Larry Page und Sergei Brin das Unternehmen Google. Sie legten damit den Grundstein für eine Erfolgsgeschichte, die mittlerweile um viele Kapitel reicher geworden ist. Google ist heute mehr als nur eine Suchmaschine. Als einer der großen Impulsgeber in einer zunehmend digitalisierten Welt widmet sich das Unternehmen Fragen, zu denen auch Wissenschaftlerinnen und Wissenschaftler an der Universität Paderborn forschen.

„Eigentlich fing alles 1996 mit der Entwicklung eines Algorithmus an. Dieser sollte die Relevanz von Internetseiten aufgrund ihres Verlinkungsgrads mit anderen Webseiten bestimmen – der sogenannte PageRank“, erzählt Michaela Geierhos, Professorin für Digitale Kulturwissenschaften an der Universität Paderborn. Am 4. September 1998 wurde das Unternehmen Google Inc. gegründet. In den Folgejahren wuchs es durch diverse Firmenübernahmen rasch an, u. a. mit Diensten wie Google Maps, Gmail, Google Earth, Android und YouTube. Die Suche im Web, so Geierhos, stelle aber nach wie vor das Kerngeschäft von Google dar.

Doch wie genau funktioniert diese Suchmaschine? Wer über Google etwa nach Informationen über die Universität Paderborn sucht, erhält in nur einer halben Sekunde mehr als acht Millionen Treffer. Geierhos: „Die Suchmaschine fungiert wie ein Tor zum Internet, die unvorstellbare große Datenmengen durchforsten muss. Da das nicht erst zur Anfragezeit durch den Informationssuchenden passieren kann, weil sonst die Wartezeiten viel zu lang wären, indiziert die Websuchmaschine Google in bestimmten Zeitintervallen alle online verfügbaren Medien, wie zum Beispiel Text, Bild und Ton. Es entsteht eine Art Schlüsselwortindex, der Internetadressen nach relevanten Begriffen sortiert, die dort vorkommen.“ Dabei finde eine Priorisierung statt, auch Ranking genannt, deren Vorgehensweise offiziell nicht bekannt sei. „Allerdings ist offensichtlich: Je seltener ein Suchbegriff vorkommt, desto charakteristischer ist er für eine Webseite“, betont die Wissenschaftlerin.

Wissenschaftler der Universität Paderborn forschen in Googles Firmenzentrale

Google möchte Nutzerinnen und Nutzern nicht bloß eine große Bandbreite an Informationen bereitstellen, sondern herausfinden, wonach eigentlich gesucht wird. An dieser Stelle kommt „RankBrain“ zum Einsatz. Michaela Geierhos erklärt das folgendermaßen: „RankBrain ist eine künstliche Intelligenz, deren Lernprozess auf Verhaltensmustern in Kombination mit kontextuellen Informationen basiert. Die Aufgabe ist es, nicht nur einzelne Wörter, sondern auch Phrasen und die Intention der Suchenden zu verstehen. Insbesondere Seiten, die einzigartige Inhalte und eine übersichtliche Informationsstruktur aufweisen, profitieren von RankBrain.“

Um die Orientierung in digitalen Sphären zu erleichtern und Technologien wie RankBrain zu beschleunigen, ist kontinuierliche Forschungsarbeit gefragt. Oliver Walter und Jahn Heymann, Wissenschaftler im Fachbereich Nachrichtentechnik an der Universität Paderborn, haben die Forschungsarbeit in Googles Firmenzentrale in Mountain View/Kalifornien (Silicon Valley) bereits hautnah kennengelernt. Dort wirkten sie an unterschiedlichen Projekten mit, die Methoden des sogenannten „Maschinellen Lernens“ verwenden: Walter forschte im experimentellen Bereich der Softwareentwicklung, insbesondere zur Audiosignalverarbeitung. Heymann beschäftigte sich während seines ersten Aufenthalts bei Google im vergangenen Jahr mit robuster automatischer Spracherkennung. In diesem Jahr lag sein Forschungsschwerpunkt auf einer speziellen Technik des „Maschinellen Lernens“.

Maschinen, die lernen können

„Maschinelles Lernen“ ist ein Teilbereich der Künstlichen Intelligenz. Dazu forschen nicht nur Google und andere Unternehmen, sondern auch Wissenschaftler der Universität Paderborn: „Theoretisch betrachtet, gibt es den Wunsch nach Maschinellem Lernen schon so lange wie es Maschinen gibt, die rechnen können. Der Begriff wurde erstmals von dem US-amerikanischen Informatiker Arthur L. Samuel im Jahr 1959 definiert“, erklärt Prof. Dr. Axel-Cyrille Ngonga Ngomo von der Fachgruppe Data Science. „Am besten lässt sich das an Spielen wie Schach und Dame erklären: Wie schreibt man einen Code so auf, dass Computer diese Spiele genauso gut oder sogar besser als Menschen spielen können? Forscher stellten letztlich fest, dass es eigentlich besser ist, wenn der Computer selber lernt, was gute Züge ausmacht“, erzählt der Paderborner Informatiker.

Wie eine Maschine diese Regeln lernt? Indem sie eine Menge an Informationen erhält und anhand dieser lernt, Muster zu erkennen und zu bewerten. So können Computer beispielsweise lernen, Fahrzeuge nach spezifischen Typen zu unterteilen, nachdem ihnen zuvor eine Reihe verschiedener Bilder mit Autos gezeigt wurde. „Dafür muss man eine entsprechende Ähnlichkeitsfunktion definieren oder diese vom Computer lernen lassen“, erklärt Ngonga. Maschinelles Lernen sei insgesamt ein sehr interdisziplinäres Forschungsfeld, so der Wissenschaftler. Dementsprechend gebe es auch bei Google ein „internationales und heterogenes Arbeitsumfeld, in dem Mitarbeiterinnen und Mitarbeiter aus den unterschiedlichsten Fachrichtungen zusammenkommen, wenngleich die meisten von ihnen schwerpunktmäßig aus den Bereichen Informatik, Elektrotechnik und Mathematik stammen“, ergänzt Oliver Walter. Jahn Heymann fügt hinzu: „Google ist mittlerweile in sehr vielen Forschungsgebieten vertreten, weil sich Maschinelles Lernen in fast jedem Bereich vielversprechend anwenden lässt. Dies umfasst zum Beispiel den medizinischen Bereich und die Physik, aber auch kreative Arbeiten wie beispielsweise die Musikproduktion“.

Mensch und Maschine in OWL

Im Bereich des Maschinellen Lernens treibt Google seine Entwicklungen weiter voran, doch auch in Ostwestfalen-Lippe finden Forschungen aus diesem Bereich praktische Anwendung. So spielen in OWL vor allem Intelligente Technische Systeme eine zentrale Rolle: „Ein gutes Beispiel hierfür ist „Predictive Maintenance“, die mittlerweile in allen industriellen Anlagen benötigt wird. Maschinen sammeln Daten darüber, was sie in einer bestimmten Zeit produzieren. Mit den Daten möchte man nun vorhersagen, wann eine Maschine zu reparieren oder zu warten ist und zwar noch bevor sie aufhört zu funktionieren. Das übergeordnete Ziel ist es, dass Menschen und Maschinen besser zusammenarbeiten, weil sie über unterschiedliche Arten von Intelligenz verfügen“, erklärt Axel Ngonga. Dabei werde es immer wichtiger, dass Maschinen den Menschen Erklärungen für ihr Verhalten geben können, da dies derzeit nicht genau festgelegt sei, meint der Informatiker.

Daten schützen, Datenschutz verstehen

Da die intelligenten Maschinen jede Menge Daten sammeln und die EU erst vor wenigen Monaten die Datenschutzgrundverordnung einführte, müsse Maschinelles Lernen neugedacht werden, betont Ngonga. Dies, so ergänzt Michaela Geierhos, sei auch etwas, um das selbst Global Player wie Google nicht herumkämen: „Natürlich muss sich Google wie jedes andere Unternehmen auch an den Datenschutz halten. Für den Umgang damit wird es häufiger kritisiert. Meines Erachtens nach ist das viel größere Problem aber, dass wir einerseits abgestumpft sind, wenn es darum geht, rechtliche Hinweise zu lesen, die meist extrem ausführlich und nicht leicht verständlich geschrieben sind. Andererseits führt die Verknüpfung der zahlreichen Google-Dienste dazu, dass es zwar nur noch eine Vereinbarung gibt, der zugestimmt werden muss, den Nutzern aber vielleicht nicht bewusst ist, was die Folgen der Zusammenführung ihrer Daten sind. Vermutlich ist das Bewusstsein jedes Einzelnen nicht geschärft, solange kein Identitätsdiebstahl, Datenerpressung etc. passieren.“ Technischer Fortschritt und Datenschutz müssen in der Forschung also immer zusammengedacht werden – ob in Kalifornien oder in Ostwestfalen-Lippe.

Text: Kamil Glabica, Stabsstelle Presse und Kommunikation