OpenAIs Feinabstimmung der Präferenzen: Ein Leitfaden mit Beispielen

Lerne, wie du große Sprachmodelle mit den Präferenzen der Nutzer abgleichen kannst, indem du die Feinabstimmung der Präferenzen und die direkte Präferenzoptimierung von OpenAI nutzt.

Aktualisierte 7. Jan. 2025 · 8 Min. Lesezeit

Präferenz-Feinabstimmung (PFT) ist eine Technik, die seit langem zur Feinabstimmung von LLMs verwendet wird. OpenAI hat sie vor kurzem im Rahmen der 12 Tage des Feature-Rollouts eingeführt.

Zusammen mit der überwachten Feinabstimmung (SFT) und Reinforcement Fine-Tuning (RFT)ist PFT eine weitere Möglichkeit, große Sprachmodelle an die Präferenzen der Nutzer anzupassen.

In diesem Artikel erkläre ich kurz die Feinabstimmung der Präferenzen und zeige dir, wie du sie mit minimalem Aufwand im OpenAI-Entwickler-Dashboard nutzen kannst.

Was ist die Feinabstimmung der OpenAI-Präferenzen?

Während das Ziel der standardmäßigen überwachten Feinabstimmung darin besteht, dass das Modell bei bestimmten Eingaben bestimmte Ergebnisse liefert, liegt der Schwerpunkt bei der Präferenzfeinabstimmung (PFT) darauf, das Modell so zu steuern, dass es die Antworten ausgibt, die wir mögen, und die Antworten zu vermeiden, die wir nicht mögen.

Die direkte Präferenzoptimierung (DPO) Die direkte Präferenzoptimierung (DPO) ist die Standardtechnik in der PFT und hat sich aufgrund ihrer Einfachheit und Effektivität als starkes Ausrichtungsverfahren durchgesetzt.

Anders als Verstärkungslernen durch menschliches Feedback (RLHF)benötigt DPO kein komplexes Belohnungsmodell, um das große Sprachmodell (LLM) auszurichten, sondern behandelt das Ausrichtungsproblem als eine "direkte" Optimierung einer Verlustfunktion. Das macht DPO einfacher zu implementieren und rechnerisch effizienter.

Der Datensatz, der für DPO benötigt wird, enthält wie bei anderen Abgleichsmethoden ein Paar von "bevorzugten" und "nicht bevorzugten" Antworten für eine bestimmte Aufforderung. Im Fall von OpenAIs PFT muss der Datensatz, ähnlich wie bei anderen Feinabstimmungsmethoden, imFormat JSONL vorliegen und die folgende Struktur haben:

{
  "input": {
    "messages": [
      {
        "role": "user",
        "content": "Hello, can you tell me how cold San Francisco is today?"
      }
    ],
    "tools": [],
    "parallel_tool_calls": true
  },
  "preferred_output": [
    {
      "role": "assistant",
      "content": "Today in San Francisco, it is not quite cold as expected. Morning clouds will give away to sunshine, with a high near 68°F (20°C) and a low around 57°F (14°C)."
    }
  ],
  "non_preferred_output": [
    {
      "role": "assistant",
      "content": "It is not particularly cold in San Francisco today."
    }
  ]
}

Die offizielle OpenAI Dokumentation für PFT empfiehlt die Kombination von SFT und PFT zur besseren Abstimmung. Abgleichtechniken wie PFT werden in der Regel nach der Feinabstimmung des Modells auf einem überwachten Datensatz verwendet. Die Kombination von SFT mit PFT gilt als Industriestandard und wird auch von OpenAI befürwortet.

So formatierst du den Datensatz für die Feinabstimmung der Präferenzen

Als Erstes müssen wir sicherstellen, dass unser Datensatz das erforderliche Format für die Feinabstimmung der OpenAI-Einstellungen hat.

Es gibt mehrere Möglichkeiten, einen Präferenzdatensatz zu erstellen. Eine Methode besteht darin, Paare von LLM-Ausgängen mit unterschiedlichen Temperaturen, top_k oder Systemaufforderungen abzurufen und dann einen anderen LLM, vorzugsweise einen leistungsfähigeren, zu verwenden, um einen Ausgang als "bevorzugt" und den anderen als "nicht bevorzugt" auszuwählen.

Für die Demo in diesem Lernprogramm lade ich einen Einstellungsdatensatz von Hugging Face herunter und strukturiere ihn neu. Ich werde verwenden argilla/ultrafeedback-binarized-preferencesverwenden, das ist ein Präferenzdatensatz, aber ich werde nur die ersten 50 Zeilen erhalten.

Ein Beispiel für einen Präferenzdatensatz von Hugging Face.

Ein Python-Skript würde ausreichen, um die Struktur des Datensatzes an die Anforderungen von OpenAI anzupassen, aber du kannst auch einen anderen Ansatz für deine Anwendung wählen.

import datasets
import copy 
import json

instance_structure = {
  "input": {
    "messages": [
      {
        "role": "user",
        "content": ""
      }
    ],
    "tools": [],
    "parallel_tool_calls": True
  },
  "preferred_output": [
    {
      "role": "assistant",
      "content": ""
    }
  ],
  "non_preferred_output": [
    {
      "role": "assistant",
      "content": ""
    }
  ]
}

ds = datasets.load_dataset("argilla/ultrafeedback-binarized-preferences", trust_remote_code=True, split="train")
ds_sample = ds.select(range(50)) #select the first 50 rows
ds_list = []
for sample in ds_sample:
  instance = copy.deepcopy(instance_structure)
  instance["input"]["messages"][0]["content"] = sample["instruction"]
  instance["preferred_output"][0]["content"] = sample["chosen_response"]
  instance["non_preferred_output"][0]["content"] = sample["rejected_response"]
  ds_list.append(instance)
  
with open("preference_dataset.jsonl", 'w') as out:
  for json_line in ds_list:
      jout = json.dumps(json_line) + '\\n'
      out.write(jout)

Achte darauf, dass das Format deines Datensatzes jsonl und nicht json ist. Du wirst wahrscheinlich eine leere Zeile am Ende deiner Datei haben, also stelle sicher, dass du sie entfernst.

Wie man OpenAIs Präferenz-Feinabstimmung durchführt

Wenn du deinen Datensatz vorbereitet hast, kannst du die folgenden Schritte für die Feinabstimmung der Präferenzen ausführen:

Gehe zum Dashboard von OpenAI.
Suche nach dem Abschnitt "Feinabstimmung" und wähle Erstellen um einen neuen Feinabstimmungsauftrag zu erstellen.
Wähle die direkte Präferenzoptimierung als deine Methode zur Feinabstimmung.
Lade deine Trainings- und Validierungsdaten hoch (wenn du welche hast).

In OpenAI kannst du Hyperparameter angeben, aber du kannst sie auch leer lassen, dann entscheidet das System automatisch. Je nach Größe deines Datensatzes kann das Training eine Weile dauern.

Fazit

Die direkte Präferenzoptimierung ist eine nützliche neue Funktion in OpenAIs Werkzeugkasten für die Feinabstimmung, mit der du den Ton und den Stil der Reaktion deines Modells explizit steuern kannst, um sie besser auf die Präferenzen der Nutzer/innen abzustimmen.

Wie bei der Destillation, der verstärkten Feinabstimmung und der überwachten Feinabstimmung von OpenAI besteht dein Hauptbeitrag bei der bevorzugten Feinabstimmung darin, den Datensatz entsprechend dem Format und der Struktur von OpenAI vorzubereiten, und die Tools von OpenAI kümmern sich um den Rest:

Um mehr darüber zu erfahren, empfehle ich diese Ressourcen:

Author

Hesam Sheikh Hassani

Themen

Künstliche Intelligenz

Große Sprachmodelle

OpenAI

Lerne KI mit diesen Kursen!

Kurs

Prompt Engineering mit der OpenAI API

4 Std.

32.4K

Tauche tief in die Prinzipien und Best Practices des Prompt Engineering ein, um leistungsstarke Sprachmodelle wie ChatGPT zur Lösung realer Probleme zu nutzen.

Siehe Details

Kurs starten

Kurs

Entwicklung von KI-Systemen mit der OpenAI API

3 Std.

12.6K

Nutze die OpenAI API, um deine KI-Anwendungen produktionsreif zu machen.

Siehe Details

Kurs starten

Kurs

Fine-Tuning with Llama 3

2 Std.

2.5K

Fine-tune Llama for custom tasks using TorchTune, and learn techniques for efficient fine-tuning such as quantization.

Siehe Details

Kurs starten

Was ist die Feinabstimmung der OpenAI-Präferenzen?

So formatierst du den Datensatz für die Feinabstimmung der Präferenzen

Wie man OpenAIs Präferenz-Feinabstimmung durchführt

Fazit

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Prompt Engineering mit der OpenAI API

Entwicklung von KI-Systemen mit der OpenAI API

Fine-Tuning with Llama 3

Prompt Engineering mit der OpenAI API