旷视科技创始团队(旷视科技创始人 三人)
郭一璞假装来自慕尼黑
量子比特报告|公众号QbitAI即将满7岁的旷视科技最近给自己送了一份生日礼物。他在四项顶级计算机视觉比赛中获得冠军:MSCOCO'sDetection(并列)、Panoptic、Keypoints和MapillaryPanoptic。继去年夺得三冠一亚军后,已连续两年成为此项赛事全球表现最好的企业。
比赛结果出炉后,量子位采访了旷视科技参加COCO比赛的团队。
今年COCO很艰难
今年参赛队伍除旷视科技首席科学家、研究院院长孙健外,由去年冠军领队、旷视科技研究院检测组组长余刚博士领衔,十多个同学。有些是实习生。
从5月中旬比赛开始到8月结束,旷视COCO团队用了三个月的时间确定团队分工,确定方向,并逐步优化,再次夺得冠军。
不过,在谈起这四项冠军的成绩时,于刚博士似乎并没有显得特别兴奋。他用两个字来评价今年的比赛:难。
团队成员于长前,博士华中科技大学的学生说,难度很大,有时晚上十点就睡觉,两三点就得下床再做一波实验。
不仅困难重重,旷视的遗憾之一就是算法没有达到内部设定的量化目标。
这个场景很熟悉。这让我想起了一个优等生的故事,他声称自己考试不及格,但结果却是年级第一。
去年夺冠后,旷视科技的目标定得太高,在实际比赛中的表现并没有达到预期。旷视COCO团队实习生、北航大二学生尹斌一告诉量子位,他参与的项目中,团队拆分验证集测试,得分超过80分,但实际挑战集仅得分76分,让大家都得努力把分数提高0.1分、0.1分。
至于出现这样困难的原因,一方面,COCO“已经动不了了”,已经达到了饱和状态;另一方面,算法方面还有很长的路要走,需要更极限的创新来突破现有的技术水平。
庆幸的是,虽然困难重重,但这并不妨碍他们在四项赛事中夺得冠军。
自己的数据集
由于数据难度和标注错误,COCO数据集已经变得越来越饱和。旷视内部开始研究检测任务的后续方向,建立了两个内部数据集。
于刚博士介绍了旷视科技的两个COCO相关数据集:
第一个是CrowdHuman,它包含大量多人重叠的照片,专门用于检测COCO比赛中的每个人。
该数据集已开源,需要的朋友可以获取链接:
第二组数据仍在收集中。旷视的内部名称为COCO++,源于COCO“指鹿为马”的现象。因为COCO只有80个标签,所以很难覆盖世界上的所有东西,所以比如当它看到一只鹿时,因为没有鹿的标签,所以它必须被标签为马。因此,旷视科技正在准备创建一个像COCO++这样的数据集,希望能够覆盖世界上99%的物体,减少出现此类错误的几率。
COCO:中国队对战中国队?
COCO的另一个话题是:包括旷视、商汤、北京邮电、滴滴等,冠军都是中国团队,没有谷歌、Facebook等美国大公司。
于刚博士觉得,这与国内AI发展氛围以及创业公司的特点密不可分。
一方面,国内人工智能热潮正处于风口浪尖,发展氛围较好,资源人力投入充足,政策扶持力度大。国内对于人工智能研究的热情空前高涨。“从人才潜力来看,中国不会比欧美差。我们需要更好的环境、更好的团队氛围来释放人才的潜力,这就是旷视技术研究院一直在做的事情。”
另一方面受益于国内初创企业的资源倾斜。大公司的业务范围很广,涉及的东西也很多。COCO竞赛等项目,单点投资不够集中;而初创公司单点投资则较为集中。一旦决定参加COCO,团队就会齐心协力,比赛过程会更加高效,结果也会自然而然。会比大公司好。
得胜武器:人才培养
COCO这样的比赛最重要的就是人才。
于刚博士也这么认为。他将旷视科技今年的四次冠军归功于人才的培养。
一方面,旷视不断在内部培养新的人才,不断释放人才来支撑比赛阵容;
另一方面,旷视科技一直有着充足的技术积累。每天浏览arXiv分享高质量论文是技术团队内部的必修课,需要分析提炼论文中值得学习的内容,而不是简单地照搬别人的开源成果,让团队作为整体也有所改善。
换句话说,COCO竞赛对旷视科技的价值在于让新人升级。
虽然去年的获奖神器Brain++已经在内部使用,但COCO的结果还没有那么接近商业落地。因此,参与COCO的团队也以实习生为主。就像腾讯互娱新入职的新员工都会玩自己的小游戏一样,比赛对旷视来说更重要的是人才培养,也是旷视人才战略的一部分。
因此,在COCO比赛中,他们采取了以老带新的培养队伍的方式。经验丰富的研究人员指导年轻研究人员并传承他们的经验;青少年也可以在比赛中获得自己的经验和认识,提高知识和认识,产出新的成果。
尹宾一同学对此深有体会。
上学时,尹彬一饱受学校计算、数据集等资源限制,渴望有一个更好的平台。
COCO成立前两个月,当时还是北航研究生一年级的尹斌一刚刚来到旷视实习。当时,他刚刚开始深度学习和计算机视觉领域的学术研究生涯。虽然他擅长编码,但他也有本科学历。在ACM地区比赛中获得银牌,但对算法一窍不通。
随着旷视团队参与COCO,尹斌一逐渐了解了数据、模型、测试等流程,从头到尾理解了整体方法逻辑。现在,他已经能够独立运行程序、训练模型,完成整个过程。
另一位团队成员余长谦已经在旷视实习一年多了。开学季的头几天,他刚刚开始在华中科技大学的博士生涯。
在COCO的工作室里,他不仅见到了心仪已久的大师RossGirshick和何恺明,还上台演讲。他被主办方称赞具有比人类标准更好的地面实况结果,并得到了来自世界各地参赛者的欢呼。
RossGirshick为旷视团队颁奖
研究落地双管齐下
在旷视内部,研究和实施是同步进行的。
实现是实用的,比如在手机上运行AI程序,受限于手机的硬件水平,模型更小,对用户体验的追求更高;
研究是关于探索物理极限,你可以使用尽可能大的模型和大量的硬件。
参加比赛是为了以旧带新,尽快培养更多新秀做出产品;
专攻产品的人也必须参与研究,放眼长远,提高判断能力,培养自己对技术方向的想法,而不仅仅局限于眼前的未来,这样才能寻求更高的成长天花板。他们自己。
这是于刚博士所共有的人才观。
这也体现在COCO团队的组建上。
旷视在组建COCO团队时,首先根据新人的兴趣、爱好和特长进行分组。如果人手不够,他们就会和其他团队协调。未来,COCO的成果还将体现在商业落地上。去年的获奖秘方Brain++已经在内部使用。
能够利用大量的商业资源来推动研究,同时研究成果能够快速反馈到实际应用中。这确实是计算机科学家最好的时代。
实习生:博士,硕士,甚至高中生
旷视科技COCO团队成员余长谦、尹宾一均为实习生。
尹斌一之前也有过在其他科技公司实习的经历,但不是在研究部门,而是在实际的商业实施部门。他的主要工作是写业务代码,没有机会做研究。“搬砖”的意思更强烈了。
在旷视,他可以享受充足的研究资源,随时随地请教专家,并在前辈的推动下快速成长。这是他在其他地方无法获得的巨大收获。
时至今日,他已经成为COCO冠军队的一员,在学校依然保持低调。他还没有告诉他的导师和同学他在校外的成就。
于长谦已经硕士毕业,对科学研究有了更深的认识。他表示,旷视技术研究院满足了他对理想研究院的所有期望:团队氛围很好,周围有很多优秀的人,工作很自由。
而且,像旷视研究院这样的企业研究院的方向与攻读硕士、博士学位并不冲突:都是为了获得优秀的研究成果并公开发表,而且企业研究院也拥有更好的硬件和数据。资源。
前两位是硕士和博士生,但毫不夸张地说,旷视目前在高中就读的实习生不下十人。
第一个高中实习生的名字叫范浩强。他是中国人民大学附属中学的一名高三学生。由于在信息学奥林匹克竞赛中取得优异成绩,他被推荐到清华大学,当时他的信息学教练是旷视科技CTO唐文斌。
唐文斌很欣赏范浩强的才华,向他发出了邀请:
“我要开一家公司,叫旷视科技,你要来吗?”
就这样,高中生范浩强成为旷视科技十大员工之一。清华大学毕业后,他终于成为一名全职员工。
有了范浩强,就会有更多的高中生来旷视实习,就像学长带学弟一样(可惜我还没听说有学弟学妹)。
于刚博士介绍,来到旷视实习的高中生来自全国各地。他们不需要参加高考,或者已经参加过比赛并被推荐。高三与其无所事事,不如来学点东西;或者准备申请国外本科课程,正在实习。如果你有研究成果,会更容易获得国外大学的offer。
留在旷视的实习生转化率非常高。如果他们继续学习,大多数人都能进入好学校。到目前为止,已有三名实习生前往斯坦福大学。
不过,虽然前述实习生均来自名校,但旷视科技并不只有名校学生。
于刚博士表示,主要是看候选人的闪光点,比如是否擅长编码,是否有优秀的学习新知识的能力。如果你有这些亮点,就值得培养。
OneMoreThing
于刚博士还透露,今年旷视冠军模型将在迁移到TensorFlow后开源,预计在今年年底左右。
-超过-
欢迎大家关注我们的专栏:量子比特-知乎专栏
诚意招聘
Qubit正在招聘编辑/记者到北京中关村工作。我们期待有才华、有热情的学子加入我们!相关详情请在量子比特公众号(QbitAI)对话界面回复“招聘”。
量子比特QbitAI·今日头条签约作者
追踪AI技术和产品新进展