15岁学生开发阅读应用:算法过滤不重要内容

 
15岁学生开发阅读应用:算法过滤不重要内容
2016-09-24 10:47:44 /故事大全

北京时间1月10日消息,据国外媒体报道,15岁,通常是一名少年刚刚进入人生高中阶段的时候,当同龄人纷纷选择在这个年龄段尽情玩乐的时候,名为泰楠·唐铎普特(Tanay Tandonput)高中生却开发了一款名为“Clipped”的精品阅读应用,并对其所使用的基于自然语言处理的智能算法申请了专利。

日前,唐铎普特抽空接受了美国知名商业杂志《Fast Company》撰稿人大卫·扎克斯(David Zax)的专访。在采访中,唐铎普特透露,最初开发Clipped只是为了帮助自己在学校更好的参与辩论赛,这一工作并没有影响到自己作为普通高中生的生活。除此之外,他还认为“发布产品没有年轻与否之说,更没有年龄限制。”

以下是文章主要内容:

我们曾邀请唐铎普特到现场来参与我们的访问,但由于没有取得学车执照(learner’s permit是美国考驾照的前一步,与国内交规考试的差别就是拿到学车执照的人就可以上路了,不过必须要有驾照的人坐在旁边),因此唐铎普特最终没能成行。对于唐铎普特的难处,我们感到十分理解。因为唐铎普特不仅需要频繁参加学校举办的各种辩论赛、上课、与朋友出行游玩,而且他大部分的业余时间都被花在了自己于年前推出的一款精品阅读应用“Clipped”的开发工作中。

当下新闻阅读类的应用不胜枚举,部分应用的用户体验十分出色,其中就包括大名鼎鼎的新闻聚合社交应用Flipboard。除了Flipboard以外,还有无数的初创公司投身于这个领域,比如Zite、Cir.ca和Summly。不过,由唐铎普特开发的Clipped应用的主打功能却很有意思,那就是自动帮助用户过滤无用内容,然后根据关键信息给出一个简练的内容摘要。用户只需要提交一个文章地址,Clipped就会利用基于自然语言处理的智能算法过滤掉没有太多意义或者不重要的细节内容,通过统计和关键字的组合分析,Clipped能够对信息块的重要度进行排名,并选出那些关联系数最高的句子。然后,Clipped根据分析结果生成内容摘要,最后还会重新读取自动生成的摘要进行分析,以确保选定的信息内容是合理的。然后,该应用才会将最终结果呈现给用户阅读。一般来说,一篇文章经过Clipped过滤之后只会剩下三句话左右。

Clipped对“精简”的理念贯彻的十分彻底,他们甚至在Clipped应用内部内置了一个新闻摘要检索功能。这也就是说,即使被Clipped 精简过的文章内容已经很少了,开发商还是认为其中包含了部分用户不感兴趣的内容,所以Clipped允许用户根据自己的兴趣输入关键词进行检索,也就是让用户对已经精简过的内容再进行一次主动筛选。目前,Clipped已推出Android版和iOS版应用,同时推出了桌面版的浏览器插件,可支持 Safari、Firefox、Chrome和IE浏览器。此外,Clipped还为开发者提供了API,开发者可将Clipped的功能内置到自己的应用中。

唐铎普特坦言,自己对自然语言处理技术非常痴迷,自己最初开发Clipped就是为了让自己在学校的辩论赛中可以以更快的速度阅读到有用信息。所以,当他最初设计Clipped时,就考虑到了要让用户一开启应用就可以立刻看到最重要信息这一方面。不过,唐铎普特也坦言,目前的Clipped还远远称不上完美,仍然有着许多需要提高的地方。

日前,我们有幸采访到了唐铎普特,以下是本次专访主要内容:

扎克斯:你是怎么想到开发Clipped这个点子的?

唐铎普特:我是一名十分热衷于“林肯—道格拉斯”式辩论(The Lincoln-Douglas Debates)的辩手,因此在每次辩论前我都需要进行许多准备工作,这一过程十分冗繁。因此我产生了让一篇文章浓缩成短小精悍短文的想法。去年,我编写出了基于自然语言处理智能算法的第一个版本,然后花了去年一整年的时间对此进行修改。最后,我认为这一算法不仅适用于辩论领域,而且还适用于新闻文章及其他文献的阅读领域。

扎克斯:部分用户反映Clipped的文章精简功能有时并不好用。

唐铎普特:新版Clipped中的自然语言处理智能算法主要针对长度在一页至两页之间的文章,目标文章风格主要是叙述性或信息类,而不是主要针对阐述观点类的文章。不过,目前我正在针对阐述观点类的文章对这一算法进行优化。

在一个普通的上课日中,我在回家后通常会先做3、4个小时的家庭作业,然后同朋友出去玩1、2个小时,最后才回家利用一天中剩余的时间处理Clipped方面的工作。

扎克斯:当你在为自己的辩论赛而开发这一自然语言处理智能算法的时候,你自己是怎么使用这一工具的?

唐铎普特:以前,我通常会快速阅览许多文章,如果我喜欢其中某一篇文章的话会从头开始阅读。比如,在一场普通的辩论赛中,我手头大约会有100份长度在二到三页的文章资料。其中,有部分文章的标题或许十分有吸引力,但在经过Clipped精简后我们通常会发现文章的中心根本不是我们所需要的内容。去年,我曾参加过一场有关“保障动物权利”的辩论,期间我找到一份有关这一话题的文章,但这篇文章的重点是讨论“保障动物权利”哲学方面的意义,但我所需要的是“保障动物权利”在科学方面的根据,比如“有研究发现动物可以和人类一样进行思考”这样的内容。

扎克斯:最近我曾接触过一个19岁和20岁的年轻创业家,但你是我所见过最年轻的创业者。这个月你就将年满16岁,你有去申请“学车驾照”的打算吗?

唐铎普特:还没有,或许我会在这个夏天考虑这方面的事情。

扎克斯:你是不是应该更多的参与高中生的日常活动,比如约会、参加舞会什么的?在高中的时候就将精力投入到Clipped是不是很难?

唐铎普特:从某种意义上来看,Clipped对我来说十分特别,因为它正是我希望在学校实现的目标。不过,我并不认为人们应该纷纷效仿我的做法,我对于教育的重要性深信不疑,而我也肯定会进入大学。在开始这一工作的时候,我并没有抱着要开发一款产品的想法,只是希望能够改善、优化我们辩论团队的准备流程而已。除此之外,我的生活重心仍然是一名普通的高中生,我经常与朋友出去玩、打网球,并参与其他运动。

扎克斯:去年你花了多少时间在Clipped上?

唐铎普特:就像我此前所说的,在一个普通的上课日中,我在回家后通常会先做3、4个小时的家庭作业,然后同朋友出去玩1、2个小时,最后才回家利用一天中剩余的时间处理Clipped的工作。不过,Clipped正式发布前的几周正好是寒假,因此我不需要去上学,所以每天大约可以工作6、7个小时。

扎克斯:你认为,对于产品发布来说,年龄是否会成为一种限制?

唐铎普特:我认为发布产品没有年轻与否之说,只要确保你身边有合适的同伴、并心无杂念,你就可以在任何年龄发布产品。在开发Clipped的过程中,我根本没有在意自己的年龄,也就这么成了。

所属专题:
如果您觉得本文或图片不错,请把它分享给您的朋友吧!

 
故事大全
 
版权所有- © 2012-2015 · 故事大全 SITEMAP站点地图-Foton Auman手机看故事 站点地图-Foton Auman