为什么GPT-3.5-turbo-instruct擅长下棋,而其他大模型不行?

当前的大型语言模型(LLMs)在许多任务中表现出色,但几乎都在国际象棋方面表现不佳,唯独GPT-3.5-turbo-instruct例外,能够达到高级业余棋手的水平。GPT-3.5-turbo-instruct的优异表现并非偶然,而是训练数据、模型设计与提示优化的综合结果。