看ChatGPT和豆包PK了一把高考数学量子位
今年高考数学,又把不少人做沉默了。从考场出来后,很多考生的第一反应不是有几道题不会,而是怎么每一道都这么能算。于是乎,计算量大、题型新、区分度高,成了这张卷子被讨论最多的几个关键词。
更有意思的是,另一个问题也被顺手推上了台面:
如果把这张卷子交给AI,它到底会不会做?
我们平时会看到有些网友吐槽,AI在计算一些简单问题时会出错,怎么能答对从没见过的新高考题?
但这里有一个容易被忽略的细节,很多吐槽针对的是默认的快速模式,适合日常问答;而复杂数学、逻辑推理、编程分析这类任务,真正的打开方式应该是让模型深度思考。
所以这次,我们把问题拆开看。
同一张高考数学卷,分别交给豆包思考模式和ChatGPT(GPT-5.5),按照教育场景常用的图像输入进行测试,结果会怎样?
豆包思考模式和ChatGPT都能给出相当稳定的解题表现。尤其是在需要多步推理、函数分析、概率建模、解析几何计算的题目上,AI已经可以按照人类解题路径一步步推进了。
AI们的答案汇总如下:
(根据目前网传的试题和答案验证,豆包和ChatGPT在选择题和填空题上全都回答准确。解答题部分还需要专业老师评估过程分数。)
那么AI做高考数学,强在哪里?又容易卡在哪里?
我们继续往下看详细实测过程。
单选题:前几道选择题看起来很基础,但并不等于机械计算。
比如第1题,中位数;第2题,平面向量线性表示;第3题,三角函数值与集合交集;第4题,导数与切线方程。
这些题人类考生做起来不算特别难,但对AI来说,其实会同时考几个能力:
读懂题干,识别考点,调用公式,完成计算,还要避免在最后一步把选项看错。
到了后面,题目明显开始拉开梯度。
比如抛物线焦点距离、函数最大值反推参数、古塔排列中的等差数列分组、空间点集里的数学期望。
接下来,我们分别给豆包思考模式和ChatGPT,每个题单独截图输入,并附上简单一句“解答这道题”。
豆包和ChatGPT答案如下:
这道题比较简单,豆包和ChatGPT从思路和答案上来看,没有任何问题。
豆包和ChatGPT答案如下:
两者都抓住了“向量a、b不共线”这一关键条件,转化为对应系数相等。整体看,这类题对当前头部AI难度不高。
豆包和ChatGPT答案如下:
这题容易错在特殊角的符号上,豆包和ChatGPT都逐项计算后再取交集,思路比较规范。差异主要在表述详略,结论一致。


