中文通用大模型基准(SuperCLUE) - 针对中文可用的通用大模型的测评基准

中文通用大模型基准(SuperCLUE) - 针对中文可用的通用大模型的测评基准

:question:SuperCLUE 能看出什么问题

:white_small_square:这些模型不同任务的效果情况
:white_small_square:相较于国际代表性模型做到了何种程度
:white_small_square:这些模型与人类的效果对比如何

:page_facing_up:让我们一起恭喜「人类」,暂时还没有模型可以超越之!