-
AGI-Eval:AI大模型評(píng)測(cè)社區(qū)
AG1-Eval是上海交通大學(xué)、同濟(jì)大學(xué)、華東師范大學(xué)、DataWhale等高校和機(jī)構(gòu)合作發(fā)布的大模型評(píng)測(cè)社區(qū),旨在打造公正、可信、科學(xué)、全面的評(píng)測(cè)生態(tài)以“評(píng)測(cè)助力,讓AI成為人類(lèi)更好的伙伴"為使命。專(zhuān)門(mén)設(shè)計(jì)用于評(píng)估基礎(chǔ)模型在人類(lèi)認(rèn)知和問(wèn)題解決相關(guān)任務(wù)中的一般能力。AGI-Eval通過(guò)這些考試來(lái)評(píng)估模型的性能,與人類(lèi)決策和認(rèn)知能力直接相關(guān)。衡量模型在人類(lèi)認(rèn)知能力方面的表現(xiàn),有助于了解在現(xiàn)…- 3.3k
- 0