A Dataset for Learning University STEM Courses at Scale and Generating Questions at a Human Level

Iddo Drori; Sarah Zhang; Zad Chin; Reece Shuttleworth; Albert Lu; Linda Chen; Bereket Birbo; Michele He; Pedro Lantigua; Sunny Tran; Gregory Hunter; Bo Feng; Newman Cheng; Roman Wang; Yann Hicke; Saisamrit Surbehera; Arvind Raghavan; Alexander Siemenn; Nikhil Singh; Jayson Lynch; Avi Shporer; Nakul Verma; Tonio Buonassisi; Armando Solar-Lezama

doi:10.1609/aaai.v37i13.27091

Authors

Iddo Drori Massachusetts Institute of Technology Columbia University Boston University
Sarah Zhang Massachusetts Institute of Technology
Zad Chin Harvard University
Reece Shuttleworth Massachusetts Institute of Technology
Albert Lu Massachusetts Institute of Technology
Linda Chen Massachusetts Institute of Technology
Bereket Birbo Massachusetts Institute of Technology
Michele He Massachusetts Institute of Technology
Pedro Lantigua Massachusetts Institute of Technology
Sunny Tran Massachusetts Institute of Technology
Gregory Hunter Columbia University
Bo Feng Columbia University
Newman Cheng Columbia University
Roman Wang Columbia University
Yann Hicke Cornell University
Saisamrit Surbehera Columbia University
Arvind Raghavan Columbia University
Alexander Siemenn Massachusetts Institute of Technology
Nikhil Singh Massachusetts Institute of Technology
Jayson Lynch University of Waterloo
Avi Shporer Massachusetts Institute of Technology
Nakul Verma Columbia University
Tonio Buonassisi Massachusetts Institute of Technology
Armando Solar-Lezama Massachusetts Institute of Technology

DOI:

https://doi.org/10.1609/aaai.v37i13.27091

Keywords:

AI For Education, STEM Courses, Natural Language Processing

Abstract

We present a new dataset for learning to solve, explain, and generate university-level STEM questions from 27 courses across a dozen departments in seven universities. We scale up previous approaches to questions from courses in the departments of Mechanical Engineering, Materials Science and Engineering, Chemistry, Electrical Engineering, Computer Science, Physics, Earth Atmospheric and Planetary Sciences, Economics, Mathematics, Biological Engineering, Data Systems, and Society, and Statistics. We visualize similarities and differences between questions across courses. We demonstrate that a large foundation model is able to generate questions that are as appropriate and at the same difficulty level as human-written questions.

A Dataset for Learning University STEM Courses at Scale and Generating Questions at a Human Level

Authors

DOI:

Keywords:

Abstract

Downloads

Published

How to Cite

Issue

Section

Information