I just developed and deployed the first real-time protection for lemmy against CSAM!

Frisbeedude@feddit.de · 2 years ago

I just developed and deployed the first real-time protection for lemmy against CSAM!

EunieIsTheBus@feddit.de · 2 years ago

Bei den ganzen Kinderporno AI Scanner - sei es jetzt dieser, der viel diskutierte auf Apples iPhones oder sonst einer - frage ich mich immer welches Bildmaterial die AI zum Lernen bekommen hat bzw. woher der Dev die Trainingsdaten nimmt.

Badnerland@feddit.de · 2 years ago

Hab letztens eine Erklärung bekommen für ein Modell das das überhaupt nicht brauchen würde, weiß nicht wie dieses hier funktioniert, aber die Erklärung war wie folgt;

Du hast zwei Schritte,

eine erste AI erstellt aus dem Bild eine textuelle Beschreibung
eine zweite AI überprüft die Textbausteine auf Zusammenhang mit CSAM.

So brauchst du keine Trainingsdaten von CSAM, sondern es genügt wenn die erste AI NSFW Bilder erkennen kann und Kinder erkennen kann und das beides als Output geben kann (gibt genügend harmlose Bilder von Kindern und genug NSFW Bilder von Erwachsenen als Trainingsdaten), die zweite muss dann den Zusammenhang auf den Textbausteinen erkennen.

crispy_kilt@feddit.de · 2 years ago

Interessant, danke!

fr0g@feddit.de · 2 years ago

Indem man z.B. eine eigene Lemmy-Instanz betreibt und automatisch damit zugemüllt wird?

Turun@feddit.de · 2 years ago

Es gibt Datensets, mit denen man so was trainieren kann. Zumindest Apple und co können nach genügend Bürokratie dazu Zugriff bekommen.

Aiyub@feddit.de · 2 years ago

Wir haben in der Uni mal ein Forschungsprojekt starten wollen um ne KI zu trainieren die sowas erkennt. War damals in Deutschland nicht möglich.

Deswegen ist man in andere Länder gegangen um dort Daten und Verarbeitung zu trainieren.

Dann kam der nächste Schritt: kann man aus der KI denn wieder entsprechendes Material generieren?

Sind in Deutschland Themen mit denen man ganze Rechtsabteilungen beschäftigen kann.

Und gerade bei Apple gehe ich davon aus, dass Sie einfach in ein entsprechendes Land gehen.

crispy_kilt@feddit.de · 2 years ago

Wie kann das legal sein? Jeglicher Besitz zu jeglichem Zweck solcher Inhalte ist strengstens verboten.

Turun@feddit.de · 2 years ago

@Aiyub@feddit.de meint in Deutschland wäre das gar nicht möglich. Kann auch sein.

Bin da jetzt auch kein Experte ob das in Deutschland wirklich garantiert nicht geht. Aber vom Konzept her, zumindest irgendwo international, messen die Strafverfolgungsbehörden natürlich was im Umlauf ist und es wäre fahrlässig das Material, dass bei Hausdurchsuchungen und co gefunden wird, nicht für genau solche Zwecke zu speichern.
Kann mir auch vorstellen, dass die Behörden nichts rausgeben, aber anbieten so ein neuronales Netz auf sicheren Servern zu trainieren und dann nur die fertig trainierten Model weights für dein neuronales Netz zurückschicken.

Hab auch schon Mal ne Doku gesehen, wo die Journalisten das Thema recherchiert haben und auch ziemlich schnell CSAM gefunden haben. Die haben das mit der Polizei oder so abgesprochen gehabt und einen eigenen Rechner und einen eigenen Raum für diese Recherche vorbehalten. Würden natürlich nicht verklagt deswegen. Für legitime Fälle gilt zum Glück der Sinn des Gesetzes und nicht die wortwörtliche Auslegung.

Aiyub@feddit.de · 2 years ago

Mini-Korrektur: Ich meinte früher war es nicht möglich, mag sich geändert haben.

Ebenfalls haben sich die Ansätze für KIs geändert.

I just developed and deployed the first real-time protection for lemmy against CSAM!

I just developed and deployed the first real-time protection for lemmy against CSAM!

For lemmy admins:

For other fediverse software admins

Divisions by zero

Support