sharing is caring
ist wirklich so!
Vielen Dank fürs Teilen!
Kluge Köpfe filtern für dich relevante Beiträge aus dem Netz.
Entdecke handverlesene Artikel, Videos und Audios zu deinen Themen.
Kurator'in für: Technologie und Gesellschaft
Das ehemalige Team der WIRED Germany hat mit 1E9 einen inoffiziellen Nachfolger gestartet. Auch bei 1E9 geht es um einen optimistischen, aber dennoch kritischen Blick auf Zukunftstechnologien und ihren Einfluss auf unser Leben: von KI über Blockchain bis zum autonomen Fahren oder Biotechnologie. Garniert wird das mit SciFi und Popkultur.
Neben den Journalistinnen und Journalisten, die für 1E9 arbeiten, kommen auch viele engagierte und fachkundige Mitglieder der 1E9-Community zu Wort. Denn 1E9 soll die interdisziplinäre Debatte über Technologie voranbringen.
Aus Sicht von Mozilla, dem Entwickler des Firefox-Browsers, ist die Welt der Sprachassistenten gerade eher undemokratisch. Denn Alexa von Amazon, Siri von Apple und der Google Assistant dominieren das Feld.
Das Problem? Alle drei Dienste hatten im vergangenen Jahr Skandale, bei denen herauskam, dass selbst intime Aufnahmen von Mitarbeitern abgehört wurden. Außerdem senden alle drei Dienste ihre Sprachsignale an die Server der Tech-Konzerne, weil sie dort verarbeitet werden. Und: Die Unternehmen teilen ihren riesigen Schatz an Audiodaten nicht, was die Sache für Mozilla undemokratisch macht.
Denn das gibt ihnen einen Vorsprung gegenüber unabhängigen Konkurrenten. Ohne validierte Daten funktioniert das maschinelle Lernen nämlich nicht, mit dem die Algorithmen der Sprachassistenten trainiert werden.
Nun kann man von gewinnorientierten Unternehmen kaum erwarten, dass sie ihre Daten einfach zur Verfügung stellen. Deswegen startete Mozilla, das von einer gemeinnützigen Stiftung getragen wird, das Projekt Common Voice - mit dem Ziel, einen Open-Source-Datenpool zu schaffen, aus dem sich jeder bedienen kann. Und zu dem jeder seinen Beitrag leisten kann. Zum einen durch das Einsprechen von Sätzen, zum anderen durch das Abhören, ob bereits "gespendete" Aufnahmen auch wirklich korrekt sind. Dadurch ist bereits jetzt der größte frei verfügbare Audiodatensatz entstanden.
Für Englisch stehen zurzeit 30 Gigabyte beziehungsweise 780 Stunden an validierten Sprachaufnahmen bereit. Für Deutsch sind es neun Gigabyte beziehungsweise 325 Stunden. Es folgen Französisch, Walisisch, Bretonisch oder auch Türkisch. Common Voice ist schon jetzt die größte Open-Source-Datenbank ihrer Art – und sie wächst immer weiter.
Weil aber Trainingsdaten allein noch keine Alexa-Alternative machen, bietet Mozilla auch das Spracherkennungssystem Deep Speech an. Dass lässt sich - mit den entsprechenden Daten - für jede Sprache trainieren und ermöglicht den Bau von Assistenten, die selbst auf schwacher Hardware laufen und keine Daten an einen Server senden müssen.
Mozilla hofft, mit Common Voice und Deep Speech auch Sprachassistenten zum Durchbruch zu verhelfen, die die Privatsphäre schützen. Das Kalkül: Wenn diese eine kritische Menge an Nutzern erreichen, werden auch die großen Anbieter nachrüsten.
Quelle: Wolfgang Kerler 1e9.community
Bleib immer informiert! Hier gibt's den Kanal Technologie und Gesellschaft als Newsletter.
Einfach die Hörempfehlungen unserer Kurator'innen als Feed in deinem Podcatcher abonnieren. Fertig ist das Ohrenglück!
Öffne deinen Podcast Feed in AntennaPod:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Apple Podcasts:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Downcast:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Instacast:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Apple Podcasts:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Podgrasp:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Bitte kopiere die URL und füge sie in deine
Podcast- oder RSS-APP ein.
Wenn du fertig bist,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in gpodder.net:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Öffne deinen Podcast Feed in Pocket Casts:
Wenn alles geklappt hat,
kannst du das Fenster schließen.
Sehr gute idee.
Allerdings "Nun kann man von gewinnorientierten Unternehmen kaum erwarten, dass sie ihre Daten einfach zur Verfügung stellen." ist nicht korrekt: das sind UNSERE Daten. Die der Nutzer Sprecher. Wir lassen sie uns nur bisher einfach ohne echte Gegenleistung wegnehmen.