为什么GPT-3.5-turbo-instruct擅长下棋，而其他大模型不行？

当前的大型语言模型（LLMs）在许多任务中表现出色，但几乎都在国际象棋方面表现不佳，唯独GPT-3.5-turbo-instruct例外，能够达到高级业余棋手的水平。GPT-3.5-turbo-instruct的优异表现并非偶然，而是训练数据、模型设计与提示优化的综合结果。