Qcon 2015 见闻之一:猿题库
什么是 ‘猿题库’ ?
初高中刷题利器 - - 猿题库 官网
猿:猿到人的进化 - - QCon
在线教育领域应用 ML
小猿搜题
1 | Photo(手机横屏采集题目)-> Prepare -> Split -> CNN识别 -> NLP纠错 -> 搜索 -> 返回题目 |
Photo
内容多样,模糊图(30%),公式(50%)
Prepare
横屏(转向),黑底白字
Split
公式分词(根号)
CNN 识别
卷积神经网络(Model)、标记数据、自动生成、DL(SGD -> 高斯牛顿)
NLP 纠错
语言模型(e.g, ‘回边形’ -> ‘四边形’)
搜索
分词、inverted-index、排序、Learning to Rank、GBRT
插图匹配
SIFT、高命中
学生能力预测
项目反应理论
IRT -> FTRL
特征
用户(学校 + 地区 + 目标考试)、题目(知识点 + 关键字)、时序(距离目标考试时间)
猿辅导老师推荐
推荐系统
冷启动、Item-base
ML
logistic factorization machine、E&E(挖掘潜力)
未来走向
知识图谱
学生成长之路:题目 + 学生 = 提升后的学生(可量化)
手写识别
手写搜题 + 解答题 + 自动判卷
高考机器
机器自动出题、做题
智能芯片
极短的时间内,将十几年需要学习的知识学习完
最后感谢:猿题库 研究部总监 — 邓澍军 的精彩演讲!