Qcon 2015 见闻之一:猿题库

什么是 ‘猿题库’ ?

 初高中刷题利器 - - 猿题库 官网

 猿:猿到人的进化 - - QCon

 2014 年 7 月,猿题库宣布完成 1500 万美元的 C 轮融资。融资完成后,猿题库的估值达到 1.25 亿美元。至此,公司刚刚成立两年。 - - 网易科技

在线教育领域应用 ML

小猿搜题

  Photo(手机横屏采集题目) -> Prepare -> Split -> CNN识别 -> NLP纠错 -> 搜索 -> 返回题目
             -> 插图匹配 ——————————————————->

  • Photo

    内容多样,模糊图(30%),公式(50%)

  • Prepare

    横屏(转向),黑底白字

  • Split

    公式分词(根号)

  • CNN 识别

    卷积神经网络(Model)、标记数据、自动生成、DL(SGD -> 高斯牛顿)

  • NLP 纠错
    语言模型(e.g. ‘回边形’ -> ‘四边形’)

  • 搜索
    分词、inverted-index、排序、Learning to Rank、GBRT

  • 插图匹配
    SIFT、高命中

学生能力预测

  • 项目反应理论
     IRT -> FTRL

  • 特征
     用户(学校 + 地区 + 目标考试)、题目(知识点 + 关键字)、时序(距离目标考试时间)

猿辅导老师推荐

  • 推荐系统
     冷启动、Item-base

  • ML
     logistic factorization machine、E&E(挖掘潜力)

未来走向

  • 知识图谱
     学生成长之路
    题目 + 学生 = 提升后的学生(可量化)

  • 手写识别
     手写搜题 + 解答题 + 自动判卷

  • 高考机器
     机器自动出题、做题

  • 智能芯片
     极短的时间内,将十几年需要学习的知识学习完

最后感谢:猿题库 研究部总监 — 邓澍军 的精彩演讲!

欢迎加入我们的技术群,一起交流学习

人工智能 (高级)& (进阶)| BigData | 算法