紧跟其后的 GPT-3.5,Anthropic 的两款 Claude 模型紧随其后,排在了第三和第四的位置上
此次排名中伯克利大学采用了最新的「MT-bench」评价机制,它是一个经过精心设计的基准测试,包含80个高质量的多轮问题,使得此次排名较以往更加准确
紧跟其后的 GPT-3.5,Anthropic 的两款 Claude 模型紧随其后,排在了第三和第四的位置上
此次排名中伯克利大学采用了最新的「MT-bench」评价机制,它是一个经过精心设计的基准测试,包含80个高质量的多轮问题,使得此次排名较以往更加准确