Künstliche Intelligenz (KI) ist vielfältig einsetzbar. Sprachbasierte KI beispielsweise kann Informationen gezielt personalisiert verbreiten und auch Menschen erreichen, die nicht lesen können. Die Herausforderung dabei: KI kann nur funktionieren, wenn sie mit Hilfe von Daten „gefüttert“ und trainiert wird. Entsprechende Sprachdaten aus afrikanischen und asiatischen Ländern waren bislang Mangelware. Die Initiative „FAIR Forward - Künstliche Intelligenz für alle“ möchte diese Lücke schließen und durch einen fairen und offenen Zugang zu Sprachdaten soziale Ungleichheit reduzieren. In Ruanda gibt es erste Erfolge: Millionen Menschen werden künftig per Chatbot in ihrer lokalen Sprache zum Coronavirus beraten.
“Guten Morgen Alexa, mach’ das Licht an und spiel’ Ed Sheeran“, „Hey Google, bitte stelle den Timer auf zehn Minuten“ – sprachbasierte Künstliche Intelligenz (KI) ist schon lange keine Zukunftsmusik mehr. Dabei ist ihr Potenzial längst nicht ausgeschöpft. Digitale Assistenten, die auf Sprachbefehle reagieren, können auch in der nachhaltigen Entwicklung eingesetzt werden. Die Technologie dafür ist vorhanden. Damit eine Maschine wie ein Mensch reagiert und spricht, muss sie allerdings in der entsprechenden Sprache trainiert werden. Genau diese wichtigen Sprachdaten fehlten bisher für viele Sprachen. Die Daten werden aktuell vorwiegend von großen Unternehmen wie Google oder Amazon gesammelt und verwertet. Lokale Sprachen in Afrika und Asien sind für die Unternehmen weniger relevant und werden daher häufig vernachlässigt.
Als Teil der KI-Strategie der Bundesregierung setzt sich das Projekt “FAIR Forward – Künstliche Intelligenz für alle” dafür ein, dass diese notwendigen Trainingsdaten gesammelt und offen zur Verfügung gestellt werden. So können sie auch für nachhaltige Zwecke nutzbar gemacht werden und das Leben vieler Menschen verbessern. Berücksichtigt werden dabei besonders Sprachen aus afrikanischen und asiatischen Ländern, die bisher in der KI-Entwicklung unterrepräsentiert sind. Das vom Bundesentwicklungsministerium (BMZ) beauftragte globale Projekt, das von der Deutschen Gesellschaft für Internationale Zusammenarbeit (GIZ) GmbH umgesetzt wird, ist derzeit in Ghana, Ruanda, Uganda, Südafrika und Indien aktiv. Dort arbeitet es gemeinsam mit lokalen Unternehmen an der Datensammlung, um dadurch die Entwicklung von digitalen Anwendungen und Produkten wie Sprachassistenten zu fördern.
Barrierefreier Wissenszugang für 12 Millionen Menschen
Aufgrund der fehlenden lokalen Daten sprechen KI-basierte Sprachassistenzen bislang oft nur Sprachen wie Englisch, Französisch oder Deutsch. Aber wie und wo sammelt man andere Sprachen? „FAIR Forward“ unterstützt die Stiftung der Internetfirma „Mozilla“ und ihre Plattform „Common Voice“, auf der man Sprachaufnahmen in seiner Muttersprache „spenden” kann. Auf der Plattform kann jeder Sätze einsprechen, anhören und die richtige Aussprache überprüfen. Inzwischen gibt es Datensätze in 60 Sprachen und auch mehrere tausend Stunden Sprachaufnahmen in afrikanischen Sprachen.
Dieser Erfolg ist vor allem der engen Zusammenarbeit zwischen der GIZ, Mozilla und lokalen Partnern vor Ort zu verdanken, so auch in Ruanda: „Kinyarwanda, unsere Landessprache, hat sich zum am schnellsten wachsenden Datensatz und zweitgrößten Open-Voice-Datensatz weltweit entwickelt. Mit Hilfe von Freiwilligen wurden mehr als 2.000 Stunden aufgezeichnet“, berichtet Audace Niyonkuru, Gründer des Start-ups „Digital Umuganda”. Für Ruanda ist die Entwicklung von sprachbasierter KI besonders wertvoll. Fast 30 Prozent der Einwohner*innen sind Analphabet*innen. Für sie sind Sprachassistenten von besonderer Bedeutung. Durch die gesammelten Sprachdaten in Kinyarwanda, das von über 12 Millionen Menschen gesprochen wird, erhalten künftig alle Einwohner*innen Informationen beispielsweise zu Gesundheit, ohne etwas lesen zu müssen. So können sie sich unter anderem über das Coronavirus informieren.
Der erste sprachbasierte Chatbot steht schon in den Startlöchern: „Mit Hilfe der sprachbasierten KI können Nutzer*innen mit ihren Smartphones oder anderen mobilen Geräten mit dem Bot auf Kinyarwanda kommunizieren, Fragen zu Covid-19 stellen und sich informieren. Dies funktioniert ganz einfach über eine kostenlose Einwahl per Telefon“, erklärt Niyonkuru. Der Chatbot soll zukünftig auch über andere Krankheiten wie Malaria oder HIV aufklären.
Offene Daten fördern lokale Innovationen
Seit November 2020 fördert die GIZ-Initiative „FAIR Forward“ in Zusammenarbeit mit Mozilla, der Universität Makerere in Kampala und weiteren Partnern die Sammlung von Sprachdaten auch in Uganda. Neun weitere indische Sprachen sind für 2021 geplant. Dabei ist die Sprachsammlung erst der Anfang: Offene KI-Trainingsdaten fördern das gesamte lokale Digitalumfeld und Innovationen. Der offene Zugang zu den Daten ermöglicht, dass auch Entwickler*innen aus anderen Regionen darauf zugreifen und die Informationen für regionale Zwecke anpassen können. Denn die gesammelten Daten sind vielseitig einsetzbar: von interaktiver Bürgerbeteiligung über Apps, die Pflanzenarten und Krankheiten bestimmen, bis hin zu Chatbots, die Fragen zu nachhaltiger Landwirtschaft beantworten. Von der offenen Datensammlung kann die digitale Transformation, besonders im globalen Süden, also profitieren und so gleichzeitig zur Demokratisierung von künstlicher Intelligenz beitragen.
Stand: Februar 2021