
Evaluation
OpenAI publiceert veiligheidsrapport voor Deep Research AI-systeem
OpenAI deelt uitgebreide veiligheidsevaluatie van hun nieuwe Deep Research systeem, inclusief externe tests en risicobeoordelingen.
4 min·ongeveer 7 uur geleden
0
Dagelijks verse artikelen over modellen, tools, onderzoek en meer — automatisch samengesteld en gefactcheckt.

OpenAI deelt uitgebreide veiligheidsevaluatie van hun nieuwe Deep Research systeem, inclusief externe tests en risicobeoordelingen.

OpenAI introduceert PaperBench, een nieuwe benchmark om te evalueren hoe goed AI-systemen geavanceerd AI-onderzoek kunnen repliceren.

OpenAI werkt samen met externe experts om geavanceerde AI-systemen te evalueren en veiligheidsmaatregelen te valideren voor meer transparantie.