Klau Dir, was Du brauchst
https://cyforce.in/data-theft/

Klau Dir, was Du brauchst

Gesichtszüge können entgleisen. Und so geschah es der CTO von OpenAI in einem Videointerview mit dem Wall Street Journal.

Mira Murati sah aus, als müsse sie angesichts von Godzilla in ein verschimmeltes Wurstbrötchen beißen.

Der Ausdruck, eine Mischung aus Angst, Ekel und Unglauben, wurde sogleich zu einem „Meme“ und verbreitete sich über das Internet. Er ist mehr als ein Meme. Mira Murati ist vor laufender Kamera beim Klauen erwischt worden, und dieser Augenblick stürzte sie in ein Gefühlswechselbad zwischen Abwehr, Angst und Entrüstung.

Klauen. Genau das hat OpenAI getan. Ebenso wie viele andere Techfirmen, die große Sprachmodelle entwickelt haben. Zum Training braucht man Milliarden von Daten. Die gibt es im Internet, aber viele davon sind urheberrechtlich geschützt. Das hat OpenAI, Google und Meta nicht gestört, wie eine Recherche der New York Times zeigt.

Sie haben sich willentlich und wissentlich über alles hinweggesetzt, was es an Regeln gibt, um die Urheberschaft und das geistige Eigentum an Ideen, Texten, Bildern, Videos oder Kunst zu schützen. 

Weil der Text im Internet zwar unfassbar reichhaltig, aber doch irgendwann zu Ende ist, hat OpenAI unter Leitung von Präsident Greg Brockman eine Spracherkennungstechnologie namens “Whisper” entwickelt, mit der sich die Tonspur von Youtube-Videos in Text verwandeln lässt. Der lässt sich dann wieder an die Sprachmodelle verfüttern, damit sie weiter lernen können. Der Name ist Programm. Was hier geschieht, sollte man lieber nicht mal flüstern. Es ist der größte Bruch der Copyright-Gesetze der Digitalzeit. Und womöglich ist es der Beginn einer Krise in der Entwicklung der Künstlichen Intelligenz. 

Für die trägt nicht nur OpenAI Verantwortung. Google hat kürzlich seine Nutzungsbedingungen angepasst, um es möglich zu machen, die Daten aus öffentlich verfügbaren Google-Docs und Restaurantbewertungen auf Google Maps der KI einzuspeisen. Und warum beschwerte sich niemand bei Google über die diebischen Tendenzen von OpenAi? Weil der Mutterkonzern von YouTube sich selbst an den Videos bediente - und damit womöglich weitreichend gegen das Copyright der Creator verstieß.

Meta erwog, gleich den Verlag Simon & Schuster zu kaufen, der unter anderem JK Rowling verlegt, um alle dort verfügbaren Daten zu Trainingszwecken für die eigenen KI-Modelle zu nutzen. Was Meta von der Idee wieder abgebracht hat? Es hätte zu lange gedauert, mit allen Beteiligten auf dem üblichen Rechts- und Vertragsweg die Lizenzverträge für die Datennutzung auszuhandeln. Also griffen sie einfach mal so zu.

Um das mal ins Leben von Normalsterblichen zu übertragen: Ich gehe einfach in einen Laden und klaue mir alles zusammen, was ich brauche, um beruflich erfolgreich zu sein. Mich an der Kasse anzustellen, hätte wirklich zu lange gedauert. Meine Karriere eilt und geht schließlich vor.

Und jetzt höre ich schon den immer wiederkehrenden Murmeltier-Einwand derjenigen, die überzeugt sind, am besten gedeihe Innovation im regulierungsfreien Raum. Ist da nicht was dran? Hätte Jesus etwa den Bäcker konsultieren sollen, bevor er das Brot brach, oder den Winzer, bevor er den Wein an die Jünger ausschenkte? Wer kann so spießig denken in einem Moment, in dem die Nächstenliebe in die Welt kam?

Hätte Thomas Edison die Tiere fragen sollen, ob sie weiter gemütlich im Dunkeln schlafen wollen, bevor er die Glühlampe erfand?

Der wahre Fortschritt muss seinen Weg bahnen, ungeachtet der kleinteiligen Einwände.

Es lässt sich auch andersherum betrachten. Künstliche Intelligenz hat die Kraft, unsere Wirtschaft und Gesellschaft auf eine neue Zivilisationsstufe zu heben. Sie kann Menschen produktiver und Arbeit lebens- und lohnenswerter machen. Sie erlaubt völlig neue Formen der Kreativität, der Mensch-Maschine Kollaboration. Soll sich all das entfalten können, braucht es ein paar Regeln, die absichern, dass der Mensch ein Teil der Gleichung bleibt.

Die Tech-Konzerne wollen ihn gerne rausrechnen, weil es für sie so einfacher und lukrativer ist. Und weil sich in der Szene des Tech-Akzelerationismus - größer, höher, weiter, und das so schnell wie möglich - inzwischen eine Variante der Überheblichkeit breit macht, die einen schwindelig werden lässt. 

Dabei gäbe es zahlreiche Lösungsmodelle. in Deutschland haben wir die GEMA für die Verwaltung der Musik und die VG Wort für die der Wortrechte, in den USA gibt es das US Copyright Office.

Vorbildlich wäre eine Bemühung, das zentrale Problem der Datennutzung zu Trainingszwecken für Sprachmodelle analog zu lösen: durch so etwas wie die IPAI, die “Institution for the Protection of Copyright in AI”.  

Denn hier geht es um viel. Wer willentlich und wissentlich Gesetze bricht, ja sogar ausdrücklich gegen die eigenen Unternehmensprinzipien verstößt, dabei Urheberschaft ignoriert und nicht mal zu einer Aushandlung bereit ist, unter welchen langfristig tragfähigen Bedingungen man das möglich machen kann, der setzt die neue Zeit aufs Spiel. Eine auf Diebstahl aufgesetzte Gesellschaft ist kein Fortschritt, sie ist ein Rückschritt in die Steinzeit.

Ja es es ist schwierig zu sagen, ob sie nach dem Verständnis von Picasso "kopieren zum replizieren" oder ob sie die Daten kopieren, um "etwas völlig Neues zu schaffen". Kann Software kreativ sein? Oder ist es die kreative Art Software zu erstellen, die eine neue Qualität in der Nutzung der Daten schafft? Haben wir ein neues Kunstwerk als Ergebnis einer Anfrage? Muss jetzt jede Antwort auf kreative Höhe bewertet werden oder beklagt werden, wenn man sich im eigenen Recht verletzt sieht? Diese Fragen haben sich die Firmen vielleicht gestellt. Aber sie haben auch ihre Antwort gefunden und sind erstmal im Markt. Die frei zugänglichen Datenpools sind schon gut verarbeitet. Eine weitere Verarbeitung der gleichen Daten erhöht die Qualität der AI nicht. D.h. die eigenen Daten werden immer wertvoller. Und neue Daten sollte man nicht mehr an die Bots geben.

Elke Antwerpen

Empathie trifft Logik - Die Erfolgsstrategie für effektive und menschliche Führung 🚀 Expertin für analytische Führungskräfte 📈 COACHING - TRAINING - KEYNOTE #Leadership #FutureSkills #EmotionaleIntelligenz #KI

2 Monate

Dr. Miriam Meckel - Es ist alarmierend, wie OpenAI, Google, Meta und Co sich über die Rechte von Kreativen und Urhebern hinwegsetzen, weil der legitime Weg zu umständlich oder langatmig erscheint. Diese Praxis ist nicht nur ethisch fragwürdig, sondern auch gefährlich für die Zukunft von Kreativität und Innovation. Wenn die Rechte von Autoren, Künstlern und Entwicklern systematisch ignoriert werden, untergräbt das das Vertrauen in die Fairness und Integrität der technologischen Entwicklung. Es ist höchste Zeit, dass wir strengere Regulierungen und klare Richtlinien einfordern, die den Schutz geistigen Eigentums garantieren. Kreativität und Innovation dürfen nicht dem Profitstreben geopfert werden.

D‘accord. Ergänzender Fact am Rande. OpenAI hat ja Whisper, ein Speech-to-Text Model OpenSource released. Der einzige Grund zur Entwicklung des Models war, dass neue Textquellen erschlossen werden sollen. Was bietet sich da besser an, als alle YouTube Videos zu transkribieren? Das wird uns noch öfters begegnen, denn die neuen Models brauchen noch mehr Daten. Meine Prognose: der Klau wird weitergehen.

Zum Anzeigen oder Hinzufügen von Kommentaren einloggen

Themen ansehen