Moin. Was ich schrob: OpenAIs crawler berücksichtigt jetzt offenbar eine robots.txt. Gefühlt find ich es eine gute Idee, das Dingen von meinen Posts fernzuhalten. Meinungen?
Moin. Was ich schrob: OpenAIs crawler berücksichtigt jetzt offenbar eine robots.txt. Gefühlt find ich es eine gute Idee, das Dingen von meinen Posts fernzuhalten. Meinungen?
Nur Gefühl oder hast Du auch irgendeine Begründung für den Vorschlag?
Ja, ich habe aus meinem Reddit-Account ne Menge Zeug gelöscht und nachher erfahren, dass das leider bereits Teil des in GPT-3 verwendeten Datenmodells geworden war, zu dem Zeitpunkt.
Ja, schon klar. Die Frage ist aber: warum möchtest Du das nicht?
Weil ich die Sorge habe, dass ich im Abstand vieler Monate verknüpfbare wenn auch einzeln harmlose Informationen bereitstelle ohne mir dessen selbst bewusst zu sein.
Das tust Du möglicherweise, aber dann sind doch LLM nicht die große Gefahr. Und vor allem solltest Du dann eher überlegen, wie Du mit Deinen eigenen daten umgehst.
Gegenfrage: Brächte es nicht eher eine Begründung, warum eine kommerzielle Firma die von den Usern hier geposteten Inhalte kostenlos für ihre eigenen Produkte abgreifen dürfen sollte ohne auch nur vorher mal zu fragen?