首页 »

机器人挑战高考数学:22分钟交卷,成绩105分

2019/10/13 23:31:48

机器人挑战高考数学:22分钟交卷,成绩105分

6月7日,高考第一天,在成都高新区天府新谷10栋9层的一个封闭空间里,一位特殊“考生”准备挑战今年全国高考的数学。它就是成都高新区一家企业研制的高考机器人,名叫“AI-MATHS”。

 

作为编外考官,华西都市报-封面新闻记者在现场注意到,“AI-MATHS”被安排在一间完全断网的房间内,并用警戒线围起,黑色的服务器机箱中有11台服务器负责解题。为保证考试公正,考试现场没有人可以操作这些服务器。

 

另据澎湃新闻报道,“AI-MATHS”考试的房间门外贴有“所有设备断网段库”的标识。所谓断网断库意味着,模仿考生封闭环境的闭卷考试;测试复杂逻辑推理能力与联想能力;断绝一切可能的外界支持,包括专家系统库。这也是人工智能技术的核心——断网断库场景下的综合逻辑推理能力。

 

从下午18时28分到19时29分,“AI-MATHS”分别挑战了北京卷文科数学以及全国二卷文科数学的考试,分别用时22分钟和10分钟,得分为105分和100分。尽管和之前预期的110分目标还有差距,但是作为“家长”——成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉介绍,“前几个月的书,这孩子没白读。”

 

“AI-MATHS”之父林辉:这孩子解题容易读题难

 

两次考试具体得分如下:北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;全国卷二选择题55分、填空题20分,解答题25,全卷100分。在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。

 

“家长”林辉说,其实能考到这么多分,已经证明,“这孩子前几个月的书没白读。”但是他也提到了“自家孩子”在答题的一个弱点,“看不懂题。”研发高考机器人最大的难点在于,要让系统准确理解人类语言。“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”

 

高考数学机器人为何会读不懂题目?对于这个问题,林辉打了个比方,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的情况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”

 

实际上,为了“AI-MATHS”迅速克服这解题的弱点,准星云学科研团队此前对“AI-MATHS”已进行了500套试卷、12000道题目的魔鬼式训练。

 

阅卷老师祁祖海:“处于本班学生的中等水平”

 

成都七中林荫校区高级教师祁祖海是负责此次评阅试卷的三名老师之一,他分析,在评卷过程中,“AI-MATHS”所犯错误的题目都有一个共同点:语言文字太多。这表示,高考机器人在自然语言上的理解稍稍欠缺。相反,在理解数学语言上相对容易。

 

根据自身的教学经验,祁祖海认为,一般学生的成绩大约在110分左右,而这次“AI-MATHS”取得的分数,大概处于本班学生的中等水平。但是他坦言,高考机器人的进步空间会很大。如北京考试卷中有一道立体几何的证明题,机器人选择的解题思路与大多数学生选择的不同,却依然解答正确,这在思路上有所创新。

 

而“AI-MATHS”未能完成的题中,有一道概率统计文字题,普通学生需要将自然语言转换成数学题,将图表信息转换成数学信息处理。祁祖海估计,机器人在信息挖掘和语言理解上稍差,相反,在证明题上表现优异。

 

【挑战纪实】数学全国卷10分钟答完,得了100分

 

17时45分,现场工作人员获得北京卷文科数学试题。

 

18时10分许,公证人员进入机房查看路由器和11台服务器运行。之后,专家确认现场符合断网环境。

 

18时15分许,大厅内,技术人员通过二十多台服务器电子版试题导入服务器。

 

18时28分许,数学高考机器人AI-MATHS开始解答北京卷文科数学试题。现场4个大屏幕实时更新解答进度。显示屏左边是数学题目,右边显示解答步骤。

 

18时43分,屏幕切换故障,显示屏中断,但后台仍在解题。

 

18时46分,大屏幕重新显示答题进度。

 

18时50分,数学高考机器人AI-MATHS答题完毕,随即形成答卷,共用时22分钟。

 

18时55分,西财智库首席研究员、斯坦福大学高级访问学者汤继强等专家验证一个空U盘将答卷导出打印。

 

19时02分,AI-MATHS的答卷交给3位高中数学老师评阅批改。三人分别是:成都天府七中一级教师袁婧、成都树德中学宁夏校区高级教师肖兴桂、成都七中林荫校区高级教师祁祖海。为方便计算机阅读,试卷呈现的是LaTeX语言,而阅卷老师因为经过了前期训练,因此能够读懂批改。

 

19时19分,数学高考机器人AI-MATHS开始解答全国二卷数学卷。

 

19时16分,评卷专家宣布AI-MATHS解答北京卷文科数学科目答题结果:选择题满分40分。填空题13、14题不能识别。解答题16、18题完全正确,共得45分。全卷总分105分。

 

19时29分,数学高考机器人AI-MATHS完成全国二卷数学卷。用时10分钟。现场爆发惊叹声。

 

19时35分,试卷打印完毕,移交专家批改。

 

19时45分,现场宣布,数学高考机器人AI-MATHS解答全国二卷数学卷结果:选择题得55分,填空题得20分,简答题得25分。全卷总分100分。