港中大最新研究放了个“大招”:他们开发了一个叫做MathCoder的大模型,数学能力直接在竞赛级“题库”Math上超过GPT-4。
做到这一点靠的就是无缝集成代码的能力——在遇到数学问题时,它不仅能用自然语言推理,还能自动编写和执行代码来建模、推导公式与方程。
08223511-2023-10-08T14:35:28.png

这样的工作方式无疑和强大的GPT-4代码解释器一样。在实际评测中,MathCoder除了超过GPT-4,还顺利在MATH和GSM8K两大数据集上取得了开源LLM中的SOTA(打败了8月份才诞生的WizardMath)

论文地址:https://arxiv.org/abs/2310.03731
来源:https://mp.weixin.qq.com/s/xUbGPXw2U9yhET9lvGFhTg