中文通用大模型基准(SuperCLUE) - 针对中文可用的通用大模型的测评基准
SuperCLUE 能看出什么问题
这些模型不同任务的效果情况
相较于国际代表性模型做到了何种程度
这些模型与人类的效果对比如何
让我们一起恭喜「人类」,暂时还没有模型可以超越之!
中文通用大模型基准(SuperCLUE) - 针对中文可用的通用大模型的测评基准
SuperCLUE 能看出什么问题
这些模型不同任务的效果情况
相较于国际代表性模型做到了何种程度
这些模型与人类的效果对比如何
让我们一起恭喜「人类」,暂时还没有模型可以超越之!