Das Forschungspapier stellt ein neues Lernparadigma vor, das als nicht-feinabstimmbares Lernen bezeichnet wird und darauf abzielt, zu verhindern, dass vortrainierte Modelle für unethische oder illegale Aufgaben feinabgestimmt werden, während ihre ursprüngliche Leistung erhalten bleibt. Der vorgeschlagene SOPHON-Schutzrahmen stärkt vortrainierte Modelle, um einer Feinabstimmung in eingeschränkten Bereichen zu widerstehen, und geht damit auf die Herausforderung des Missbrauchs von vortrainierten Modellen für unangemessene Aufgaben ein. Das Papier umreißt die Ziele der Unversehrtheit und der Nicht-Feinabstimmung, die darauf abzielen, die ursprüngliche Leistung des Modells zu bewahren und einen vergleichbaren oder größeren Aufwand zu betreiben als das Training von Grund auf, wenn es in eingeschränkten Bereichen feinabgestimmt wird. Die Autoren befassen sich mit den Herausforderungen der Gestaltung des Optimierungsrahmens, der Gewährleistung der Robustheit unter unvorhersehbaren Feinabstimmungsstrategien und der Steigerung der Konvergenz der Feinabstimmungsunterdrückung in eingeschränkten Bereichen. Umfangreiche Experimente mit Deep-Learning-Modellen und eingeschränkten Aufgaben bestätigen die Effektivität und Robustheit von SOPHON, wobei die Feinabstimmung in eingeschränkten Domänen einen Overhead verursacht, der vergleichbar oder größer ist als das Training von Grund auf. Zu den Beiträgen des Papiers gehören der Vorschlag des nicht-feinabstimmbaren Lernens, die Entwicklung eines nicht-feinabstimmbaren Lernrahmens und umfangreiche Experimente zur Verifizierung seiner Effektivität und Robustheit. Das Dokument enthält außerdem Hintergrundinformationen zu Deep-Learning-Aufgaben, zum Transfer-Lernen und zu den Schlüsselkomponenten der Feinabstimmung.
>
