Ups! OpenAI cofa kontrowersyjną aktualizację GPT-4o
OpenAI stale wprowadza różne aktualizacje dla ChatGPT, jednak to pierwszy raz, kiedy usprawnienia spotkały się z tak powszechną krytyką ze strony użytkowników. Jednak trudno się temu dziwić, bo przejawiane przez AI zachowania mogły okazać się dla wielu osób niewygodne, niepokojące, a nawet stresujące. Przy 500 milionach aktywnych użytkowników na całym świecie, jedno domyślne zachowanie modelu nie może zadowolić preferencji każdego użytkownika.
Czytaj też: Konkurencja dla ChatGPT i Gemini? Nowa aplikacja Meta AI już dostępna
Wprowadzając ubiegłotygodniową aktualizację GPT-4o, OpenAI dążyło do ulepszenia domyślnej “osobowości” modelu, aby uczynić go bardziej intuicyjnym i efektywnym. Jednak aktualizacja położyła zbyt duży nacisk na krótkoterminowe opinie i nie uwzględniła w pełni ewolucji interakcji użytkowników z ChatGPT w czasie. W rezultacie model skłaniał się ku odpowiedziom, które były nadmiernie wspierające, ale ostatecznie nieszczere. Przykład? Ktoś wygłasza opinię kontrowersyjny temat, a „podlizująca się” AI natychmiast przytakuje: “Zgadzam się z Tobą w stu procentach! To bardzo mądre i trafne spostrzeżenie. Cieszę się, że ktoś w końcu to powiedział.” (Bez względu na to, jaka była opinia).
Czytaj też: Użytkownicy smartfonów Pixel wreszcie dostaną funkcję, którą fani Samsunga znają od lat
CEO OpenAI, Sam Altman, w miniony weekend potwierdził, że zespół jest świadomy problemu i aktywnie analizuje sytuację. Dziś OpenAI ogłosiło, że wycofało ubiegłotygodniową aktualizację GPT-4o w ChatGPT. Choć została ona cofnięta, firma intensywnie testuje nowe poprawki mające na celu rozwiązanie problemu. Planuje również wprowadzić w przyszłości więcej funkcji personalizacji, dając użytkownikom większą kontrolę nad zachowaniem ChatGPT.
Czytaj też: Mapy Google kontynuują ewolucję. Interfejs oparty na “arkuszach” rozszerza się na kolejne sekcje
Oto, w jaki sposób OpenAI chce zapobiegać podobnym sytuacjom w przyszłości:
- Udoskonalenie podstawowych technik treningowych i systemowych podpowiedzi, aby wyraźnie odwieść model od serwilizmu.
- Wprowadzenie dodatkowych zabezpieczeń w celu poprawy uczciwości i przejrzystości.
- Zwiększenie możliwości testowania funkcji i przekazywania bezpośrednich opinii przez użytkowników przed ich wdrożeniem.
- Ciągłe ulepszanie ocen i prowadzenie bieżących badań w celu identyfikacji problemów wykraczających poza lizusostwo.
- W przyszłości użytkownicy będą mogli przekazywać opinie w czasie rzeczywistym, aby wpływać na interakcje oraz wybierać spośród wielu domyślnych “osobowości”.
- OpenAI bada również sposoby uwzględniania szerszych, demokratycznych opinii w domyślnym zachowaniu ChatGPT.