OpenAI’nin o3 AI modelinin FrontierMath benchmark’ında yüzde 25’lik başarı oranı elde ettiği iddiası, bağımsız testlerde yüzde 10’a düşerek şeffaflık tartışmalarını alevlendirdi. Şirketin test koşulları, optimize edilmiş model farkları ve sektördeki benchmark güvenilirliği sorgulanırken, OpenAI daha güçlü modellerle ilerlemeyi planlıyor.
Okumaya devam et...
Okumaya devam et...