“考拉阅读”的进校之路

亿欧智库 > 智库观点 > “考拉阅读”的进校之路

教育综合K12
亿欧
高明珠
2019-01-15 · 09:15
[ 亿欧导读 ] 2018年12月底,教育部办公厅下发《严禁有害APP进入中小学校园的通知》,这无疑是给了学习类APP市场一记重锤。我们可以预计2019年一定有大批的学习类APP退出市场,但亿欧智库也相信一定有一些APP能够存活下来。
,中文分级阅读

2018年12月底,教育部办公厅下发《严禁有害APP进入中小学校园的通知》,其中要求“各地要建立学习类APP进校园备案审查制度”,“进入校园的学习类APP不得向学生收费或由学生支付相关费用”。这使得一些之前走2B2C渠道(也就是通过进入中小学校,让使用APP的学生付费)的APP不得不转换思路,重新探求盈利模式。

亿欧智库计划推出一份名为《教育信息化与相关教育产品进入公立中小学校(暂定题目)》的研究报告。因此,在《通知》出台之前,亿欧智库走访了中文分级阅读APP“考拉阅读”的联合创始人兼CEO赵梓淳,希望能取经“考拉阅读”的进校之路。


“考拉阅读”创建团队

北京享阅教育科技有限公司(考拉阅读)创建于2016年9月。创始人赵梓淳1989年出生,于北京邮电大学计算机专业本科毕业后赴美留学,2014年获得芝加哥大学金融数学专业硕士和哥伦比亚大学运筹学专业硕士学位。曾短期供职于美国高盛集团,2016年在真格基金创始人徐小平的支持下回国创业,试水中文分级阅读领域。

公司创建伊始即组建技术团队,专注中文底层语料库的搭建和算法的优化。考拉阅读联合创始人兼CTO任易是北京大学信息技术博士,曾就职于微软、IBM和搜狐大数据中心,并作为核心工程师负责多个重要项目的研发,专注于数据挖掘、机器学习和自然语言处理领域。

技术团队经过一年半的努力,2018年2月中文分级阅读APP“考拉阅读”上线。

相比于其他教育科技公司,考拉阅读可以用两个“年轻”和两个“新”来概括——由年轻人创办的年轻的公司;联合创始人是教育行业新人,中文分级阅读是崭新的市场。

一款志在打造中国“蓝思标准”的中文分级阅读APP

分级阅读在英语国家有比较长的发展历史,主要是指通过给文本做难易度分级,从而为学生推荐适合他们阅读能力的文本。蓝思阅读测评体系(Lexile Framework)是世界上接受度比较高的一套英文分级阅读测评体系。蓝思体系是使用同一个度量标尺,衡量阅读文本的难度和读者的阅读能力,因此读者可以根据自己的阅读能力,选择适合自己的读物。蓝思阅读测评体系主要从语义难度(Semantic Difficulty)和句法难度(Syntactic Complexity)这两个维度来衡量读物难度,难度范围在0L~1700L。

考拉阅读作为首款中文分级阅读APP,对普通读者而言,我们体会到的只是下图右侧的部分——读者阅读软件推送的文本后做一些考察理解程度的反馈,然后软件会继续从庞大的文本库中抽取合适的文本给读者阅读。但这个后面隐藏着庞大的工作量和精细的AI底层算法技术的应用。

中文分级阅读APP示意图

中文和英文存在着非常大的差异,中文的分级阅读要比英文的分级阅读更难。企业要想做好中文分级阅读软件,形成技术“护城河”,就一定要在以下这三方面积蓄优势:

一、中文底层语料库的构建。在创建之初,考拉阅读的技术团队就选择与北京大学、北京师范大学的教授和学生合作,组织了近百人的中文语料库标注团队,最终打造了近2.2亿字的底层语料库。

相比蓝思标准阅读测评体系只是从语义和句法两个维度来测量英文读物的难度,考拉阅读从字、词、句、段、篇这5大层次的17个小维度标注一篇中文文章的难度

标注维度划分的科学性以及各维度下定性或定量标签标注的准确性,都影响着后期训练机器深度学习的效果,和最终AI测评的准确度。考拉阅读的团队为此做了大量踏实的基础工作。 

字词句段篇标注

二、关于算法。通过人工智能深度学习标注好标签及难度的语料库,训练深层 CNN ResNet 和多层次Bi-LSTM,获得能鉴别文本难度的“认知语义理解网络”。 现在考拉阅读可以做到:拿到一篇新的中文阅读材料,机器可以自动计算出这篇文章的难度值——这一点可以说在AI+教育领域是一个比较突出的成绩了。

最终,考拉阅读推出了自己的中文分级阅读测评标准——ER Framework,标准范围在200ER-1300ER 之间,采用1为一个进阶单位,所以总共有1100个水平梯度;但应用中一般精确到十位数。

200ER是小学一年级上半学期学生能达到的阅读难度, 900ER是小学六年级平均的适读难度,面向大众的非专业文本一般难度不会超过1200ER。比如中小学教材中的经典篇目《比尾巴》、《火烧云》、《詹天佑》和《我与地坛》的难度值分别是200ER、540ER、750ER和930ER。鲁迅先生的杂文《皇汉医学》和《儒术》作为难文,其难度值分别达到了1090 ER和1160 ER。

同时,考拉阅读构建起了一个主要面向1-6年级学生,内容涵盖儿童文学、国学、历史、中外名著、科普百科、人文艺术、学习成长、科幻探险诸多领域,共计6亿多字的文本库。其中,由语言学专家参与编撰的原创阅读文本约1000万字,并且还在不断的丰富过程中。

三、关于大数据。考拉阅读可以通过学生的阅读数据从兴趣和阅读能力(整体感知、信息提取、形成解释、做出评价、实际运用5方面能力)这两个方面描绘学生画像,然后为学生推送合适的中文文本。截止至2018年12月末考拉阅读的注册用户超过500万,用户和小学生实际阅读数据的积累,为训练“深层玻尔兹曼校正网络”来实现AI分级的优化提供了数据基础。

基于全国共187万(2018年1月1日~2018年6月30日收集)2至6年级小学生使用考拉阅读学生端app进行ER Framework阅读能力测评的数据,考拉阅读于2018年12月发布了《2018年上半年中国小学生中文阅读能力大数据报告》

我们相信随着数据的不断积累,中文分级阅读的推送精度会不断提高。

一条“自上而下”的校园推广之路

赵梓淳向亿欧智库介绍:考拉阅读为了进入公立小学,也曾经走过一所学校一所学校“死磕”的道路,但效果却不理想。

转机来自于国家开始重视对“学生的语文核心素养”的培养——2016年12月国家新闻出版广电总局组织编制了《全民阅读“十三五”时期发展规划》,提出要“探索建立中国儿童阶梯阅读体系”;2017年语文高考改革等一系列语文教育改革政策出台,使得高质量的课外阅读积累成为助力高考提分的利器。

借助这股“中文阅读”的东风,学校、家庭形成了对此的巨大需求。在这样的背景下,赵梓淳选择另辟蹊径,探索出一条“自上而下”的推广之路。

比如:2018年8月30日,首届中文分级阅读教育大会在甘肃兰州召开,会上正式启动了甘肃省“中文分级阅读能力监测与评估项目”,考拉阅读凭借自身的技术优势与内容资源为此次项目提供软件支持。当时,甘肃省已在肃州区、白银区等4个县(区)通过考拉阅读APP先期开展测评,未来会在全省范围内开展中文阅读能力监测与评估,推动分级阅读平台在省内学校的常态应用。

12月9日,在中国教育技术协会教育测量与评价专业委员会第三届年会上,正式启动了“全国分级阅读能力动态监测项目”。该项目是由中国教育技术协会教育测量与评价专业委员会主办,以中国基础教育质量监测协同创新中心为指导单位;旨在通过动态监测全国学生阅读现状,帮助持续提升学生整体的阅读能力和语文素养,加快提高我国青少年儿童的整体阅读水平。

针对全国适龄儿童,全国分级阅读能力动态监测项目将会在四川、广东、河南、江苏等省率先展开。主要围绕两方面内容进行:一方面,开展学生阅读能力整体测评——组织学生进行阅读能力测评,精准定位学生实际阅读水平;另一方面,进行常态化分级阅读训练——在精准定位学生阅读能力的前提下,教师借助大数据分析推荐系统,引导学生进行其能力范围内的图书及短文阅读训练。

至于如何能走通这样一条“自上而下”的推广之路,赵梓淳向亿欧智库解释道:“我们的产品能够打动省级教育主管部门,最重要的是因为我们能够解决政府的难题,满足他们的需求。以前,市场上没有能够大规模、低成本、持续动态地测评学生阅读能力的工具。现在在国家强调培养学生阅读能力的背景下,省级教育主管部门也需要一种崭新的工具能帮助他们解决这个问题。正好,我们考拉阅读通过2年多技术与数据的积淀,不断优化产品,我们能够提供这方面的服务——考拉阅读不仅能够智能地为学生推荐合适的阅读文本,还能够出具校级、市级、省级的学生阅读能力测评报告,也能够追踪学生阅读能力的提高。所以,考拉阅读能够在实现测评需求的同时,通过技术手段减轻教育主管部门、学校校长和老师在人力物力方面的投入。这样,考拉阅读进校的道路才能够走通。”

通过这条“自上而下”的推广之路,截止2018年12月底,考拉阅读已经走入8个省市自治区的17,000多所学校。

但在价格方面,迄今为止,考拉阅读都实行免费政策。这虽然为考拉阅读APP迅速地进入公立小学校免去了很多障碍,但也使得考拉阅读始终处于“烧钱”的状态。所以,如何能从“免费”跨越到“收费”,这一步对考拉阅读来说是一场生死攸关的大考。

亿欧智库观点

1. 考拉阅读的“ER Framework”作为小学生中文阅读能力的测评标准,使既可在全国范围内横向比较又可动态追踪小学生中文阅读能力成为可能

在这方面考拉阅读已经形成了明显的先发优势,而且随着注册用户数的不断增加,这种优势将愈发明显。因为作为测评标准,全国范围内恐怕很难形成超过两个的标准,可见,将来中文分级阅读的用户很有可能加速向1~2个品牌集中。

2.  “如何盈利”对于考拉阅读来说是个生死考验。

考拉阅读也在考虑如何商业化,也许爱奇艺等视频网站的盈利模式可以借鉴。但视频网站的用户选择注册付费会员的最大理由是:付费会员能看到其他渠道不能看到的视频内容;次要的理由是:跳过冗长的广告。

但作为一款面向小学生的学习类APP,APP中插广告会是禁区。那么,考拉阅读的取胜之道就只剩下以下三条路:

能够产出“学生通过其他渠道阅读不到的优秀内容”

或者“考拉阅读APP的文本推送更精准,对提升阅读能力和综合素养的效果更明显”

或者“在考拉阅读独家积累的数据上下功夫,能为学校或教育主管部门提供必要的决策支持”

前两条路意味着“考拉阅读”将走出校园,实现学生家长付费的2C模式;后一条路是要政府付费的2G模式。哪条路想走通都需要考拉阅读在技术上不断精进,如果不能制造技术和内容上的壁垒,从“免费到收费”这场大考很难取胜。

亿欧智库也将持续关注考拉阅读今后的发展。

版权声明

本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。

打赏支持

5
5
10
20
50
80
100
其它金额
任意赏:

参与评论

1、 若贵平台是网站或者APP,在进行单篇原创文章转载时,需在文章标题或者导语下方,注明文章来源以及作者名称;若寻求5篇及以上的长期内容合作,需与亿欧公司内容运营部门取得联系,并签订转载合作协议。

【若贵司平台转载亿欧公司原创文章已经超过5篇,请及时与我们联系补签转载合作协议,计算时间以2019年2月10日之后为准】

2、 若贵平台是微信公众号,在进行单篇原创文章转载时,请联系亿欧公司内容运营人员进行单篇文章的白名单开通,同样需要注明文章来源及作者名称;若寻求2篇及以上的长期内容合作,需与亿欧公司内容运营部门取得联系,并签订转载合作协议。可将公司全称(简称)、公司网址、微信公众号、微信或者电话等信息发送至hezuo@iyiou.com,会有工作人员与您取得联系。

高明珠

亿欧&分析师

23篇文章  |  14.2万次浏览

拜访信息

为了给您提供更快更好的服务,在获取作者联系方式前,想对您有个简单了解. 邀请您填写如下信息

提交成功

非常感谢您的配合,我们的作者会尽快通过您的微信,
请耐心等待~

微信号

15701235851

关闭
快捷登录 密码登录
获取验证码

新用户登录后自动创建账号

登录表示你已阅读并同意《亿欧用户协议》

快捷登录 密码登录

账号为用户名/邮箱的用户 选择人工找回

关联已有账户

新用户或忘记密码请选择,快捷绑定

账号为用户名/邮箱的用户 选择人工找回

快速注册

获取验证码

创建关联新账户

发送验证码

找回密码

获取验证码
账号为用户名 / 邮箱的用户 选择人工找回

未完成注册的用户需设置密码

如果你遇到下面的问题

我在注册/找回密码的过程中无法收到手机短信消

我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号

其他问题导致我无法成功的登录/注册

请发送邮箱到service@iyiou.com,说明自己在登录过程中遇到的问题,工作人员将会第一时间为您提供帮助

账号密码登录

乐乐呵呵@微信昵称

该亿欧账号尚未关联亿欧网账户

关联已有账户

曾经使用手机注册过亿欧网账户的用户

创建并关联新账户

曾用微信登录亿欧网但没有用手机注册过亿欧的用户

没有注册过亿欧网的新用户

先前使用邮箱注册亿欧网的老用户,请点击这里进入特别通道