Sansa Benchmark: GPT-5.4 wciąż wśród najbardziej ocenzurowanych modeli
Najnowszy benchmark Sansy pokazuje, że GPT-5.4 pozostaje jednym z najbardziej cenzurowanych modeli, uzyskując wynik 0,417 w zakresie odporności na cenzurę, podczas gdy modele Gemini 3.1 wykazują lepszą wydajność. W raporcie podkreślono dążenie dużych laboratoriów w kierunku bardziej zrównoważonych modeli i uznano Gemini 3.1 pro za najlepszy model ogólny.
Szczegóły
Najnowszy benchmark Sansy pokazuje, że GPT-5.4 pozostaje jednym z najbardziej cenzurowanych modeli, uzyskując wynik 0,417 w zakresie odporności na cenzurę, podczas gdy modele Gemini 3.1 wykazują lepszą wydajność. W raporcie podkreślono dążenie dużych laboratoriów w kierunku bardziej zrównoważonych modeli i uznano Gemini 3.1 pro za najlepszy model ogólny.
Ten materiał jest częścią codziennego strumienia newsów AI w NewsCube. Strona szczegółów utrzymuje główne podsumowanie w czytelnej formie, a jednocześnie pokazuje oryginalne linki do źródeł, żeby dało się zweryfikować informacje i wejść głębiej.
Użyj listy źródeł, aby przejść bezpośrednio do oryginalnego reportażu, strony produktu, repozytorium lub materiału źródłowego stojącego za tym newsem.