依图新加坡办事处开幕典礼,左起:依图科技东南亚及港澳地区总经理、新加坡办事处负责人王琪,新加坡经济发展局信息通信与媒体司长洪振达,依图科技联合创始人林晨曦 新智元报道 作者:闻菲 【新智元导读】1月23日,依图宣布在新加坡设立首个海外办事处,联合创始人林晨曦接受新智元采访,分享了做安防做到国内“绝对No.1”的依图商业化、人才和进军海外市场的思考。林晨曦认为,AI应该与行业结合,做重做深,与其追求千人千面的解决方案,不如深刻思考,找到共通的痛点,正确理解问题。林晨曦还表示依图会进军语音和NLP,在这个领域也做到超越人类水平。 想象你站在列车的站台上,听着远处传来隆隆的声响,你知道列车要来了但还没有来,你听声音觉得列车还很远,但一旦列车到达,稍不注意错过上车的时机,列车就会从你身边呼啸而过,再看,车已经开到离你很远很远。 这是依图科技创始人朱珑对当前AI热潮的看法,AI好比那趟列车,上车的时机稍纵即逝,可能你已经错过还不自知。 依图科技成立于2012年,在国内掀起如今这波深度学习热潮之前,早于很多公司,准确地搭上了AI的列车。简单看一下公司历史: 2013年获得真格基金天使轮融资,2014年获得红杉资本和高榕资本的A轮融资,随后稳步发展。 林晨曦是前阿里云计算资深专家。2005年获得上海交通大学硕士学位。2008年至2012年期间,组建并带领百人以上的优秀工程师团队,搭建了国内最大的拥有自主知识产权的“飞天”(Apsara)分布式云计算操作系统。在加入阿里巴巴集团之前,曾在微软亚洲研究院从事机器学习、计算机视觉、信息检索以及分布式系统方向的研究工作。 现如今,安防是AI落地最佳市场已经成为人之共识,但林晨曦常常会想,如果5年前依图没有做安防,情况是否会不同。“5年前我们做安防的时候,几乎所有的人都不看好,所有的友商都不存在——他们可能做人脸,但他们不做安防。然后今天,几乎所有的人都在说,AI+安防是最大的市场,最现实的市场,然后问我,说依图是怎么看到的?我也蛮奇怪……是不是因为依图坚定不移的一直在做安防,所以大家都跟过来了?” 如今,依图在国内的安防市场,“不客气的说,依图已经是绝对的No.1。”在技术上能够做到10亿人脸数据秒级反馈。此外,进军海外跟其他决策一样,都有时间窗口。“大家可能觉得AI+安防今天很好,说安防是AI公司或者初创公司最该找的战场,但反过来也有可能这个状态已经结束了。” 依图还要进军语音识别和自然语言理解。如今,包括谷歌在内的众多公司都在做语音,做智能音箱,但与图像不同,语音语言方面进展非常缓慢,林晨曦觉得这“令人十分遗憾”。他并不觉得市场巨头林立入场已晚,反而觉得大家都还没有入场,创业公司和年轻人大有可为。 现在,依图的团队有500多人,70%以上是研发团队。林晨曦认为,AI人才拥有想象力是最重要的,依图在招人时看的也是热情和好奇心。 对于未来,林晨曦表示他不喜欢问为什么,而是问为什么不?但至于具体如何实现,他不愿多讲。 “事情没做出来,这些都没法证明,做出来就不用证明了。”林晨曦说:“所以,我们的优势是什么,所有的人都在问这些问题,事情就是这样,你没做出来的时候,他会问你为什么,你做出来就不问了,也没人关心为什么了。” 下面是经过整理的采访实录。 依图已经是国内安防市场绝对的No.1,靠什么? 新智元:AI技术落地最大的难点是什么? 林晨曦:AI落地最大的困难是找到一个对的场景,这个场景要有切实的商业应用的痛点,然后再根据这个场景去找AI技术在后面作为支撑的解决方案。其次,还难在怎么进入这个行业,了解行业的方方面面,这可能是所有人工智能公司都面临的一个困难。依图从2012年开始做,那时深度学习还没有火起来,我们决定做安防,或者说公共安全,最大的原因还是觉得这个领域有非常大的痛点,有非常大的业务的需求。 我们最早做车辆识别系统,然后开始做人脸识别系统。当时在国内会听到非常多著名的案件,那些案件发生的时候,政府已经可以把这些视频拍下来了,但是后面没有分析的软件,只能靠人的肉眼来处理。你知道,如果非得靠人的肉眼的时候,说明这个需求是非常真实的需求,但是当时没有技术来解决这些问题,所以我们就选了这个行业。 我们最先与苏州市政府合作,苏州市政府并不是泛泛地觉得说需要这个东西,而是给了我们非常具体的课题,比如你们做成了什么,就能够解决我们业务上的什么问题。通过这些,让我们真正了解到他们的工作业务中间需要怎么运用这些技术,我们可以如何非常扎实地做出来,去解决实际问题。 新智元:现在做AI+安防的公司也有很多。相比其他的竞争对手,依图的定位有什么不同,优势又是什么? 林晨曦:依图从第一天开始,就觉得AI应该跟行业走在一起,所以我们的业务可能会比较“重”。通过跟行业结合,更能建立起公司的壁垒。现在很多公司都说自己要做“重”,但三年前、五年前没有人说要做重,可能只有依图一家在这样做。 做重要看的,还是AI能够给行业带来什么变化,在什么样的基础环境下能够改造这个行业,而不仅仅是提供个SDK,而是一个端到端的solution。很多人有一个误解,认为做重的可扩展性不高。我不这样认为,因为但凡是痛点,就意味着整个行业都需要。最重要的并不是说给不同的人做出千人千面的solution,而是在整个行业里找到首选,发现最核心的部分,然后AI提供的那部分,以及如何完成solution的闭环。所以,更多是思考,而不是体力的工作。 至于优势,在国内的公共安全市场,可以不客气地讲,依图是绝对的No.1。我们的系统在20多个省公安厅部署,我们在非常多的PK里面都是第一名,包括前一段时间新闻上有播过天津市的PK。去年,公安这个行业内各个地方PK下来,依图绝大多数拿的都是第一。我们的业务也体现了我们的优势,比较贴近实战,不管是静态的还是动态的。 为什么能够取得第一?这跟你跟行业结合得更深,对算法理解得更透彻,可能是极其相关的。真正破案的时候,拿到的数据不见得是那么清楚,不是那么理想的实验室环境,对技术的要求可能就更高。2017年,我们在全世界公开的实战测试集拿了第一。我们也破了非常多案件,一个地市(像苏州这样大),2016年可能破了1000多起。 致力于99.9999%,算法精度能够不断解锁应用场景 新智元:单看技术,现在算法的99.999%能够带来的壁垒有多高? 林晨曦:算法的领先性在于它能在不同的应用解锁不同的需求,大家对这件事情的想象不是很一样。最早依图做公安市场,今天大家常听说的几家人脸识别公司都还没开始做这个市场。那时做公安市场比较多的是更上一波的人脸识别厂家,比如中科院、清华背景的,把实验室的技术拿出来,由厂家包装后卖给公安。那些厂家最早只能做证件照比对,公安虽然也可以用,但真正的难点在于不是证件照的,比如随意拍的或者监控视频的场景。所以,依图在2013年、2014年刚进入这个行业的时候,就是因为精度高,让公安可以有新的用法,用在真正的案件情况下,那这就是一个解锁应用的例子。 2014年左右,依图开始做FaceVideo,视频的比对。最早是在厦门做,我们提出一个叫人像卡口的概念,学习公安场景里的车辆卡口。你可以想象在地铁或高铁,尤其是高铁这样要求实名制、强安全监控的场景,FaceVideo部署上去直接就可以把坏人抓出来。这种场景的困难程度,比照片比对提高几个数量级以上,这又是不同的精度解锁不同的场景的例子。 现在依图大概部署了100多个市,大概是全国的一半(全中国大概是300多个地市)。我们还会积极开拓这个市场。这两年国内的安全市场,刚刚开始理解AI+安防,还有很多地市还没有理解,商业化空间还有很大。 想象力最重要:5年前如果依图没有做安防会怎样? 新智元:我们再来谈谈人才,人才非常关键,理想的AI人才画像是什么样的? 林晨曦:这个市场里面涉及了不同人和不同的角色,有AI的算法工程师,有AI业务中间的人,还有一些传统行业需要拥抱AI的人,对于不同的人情况是不完全一样的。如果是要对行业有用,我觉得理想的AI人才——可能找不到理想的,但是我可以说一下什么是好的,我认为有想象力的是好的,对未来充满想象力是最重要的事情。所以我不会问自己为什么,我会问为什么不让它发生呢? 我对未来有一个想象,但说实话,创业中间最困难的,是你并不知道每一步怎么走才能变成这样。我们能看到未来在哪里,但我们找不到路走过去。所以我们好奇,我们每天都在挣扎思考,那条路径在哪里。我觉得这永远都不会有答案,你也不知道你选的路是不是最好的,即便是走到今天回头去看,你也不知道那条路是不是最对的,历史没有办法做A/B测试。 5年前我们做安防的时候,几乎所有的人都不看好,你说的所有的友商都不存在——他们可能做人脸,但他们不做安防。然后今天,几乎所有的人都在说,AI+安防是最大的市场,目前最现实的市场,然后问我,说依图是怎么找到的,依图是怎么看到的? 我其实也很好奇,假设5年前依图没有选择安防,会不会今天大家根本不会有这个结论?这个因和果其实说不清楚。是不是因为依图坚定不移的一直在做安防,所以大家都跟过来了? 进军语音识别和NLP,也要做到超越人类水平 新智元:依图如何选择人才,又如何与谷歌等公司展开人才竞争? 林晨曦:我们觉得AI时代是一个无与伦比的时代,非常激动人心,所以,首先是要招对这个时代真正有热情,有好奇心的人,更多的时候,其他东西都是可以学习的,最重要的是你对这件事情是不是真的充满热情和好奇心。 选择依图而不是谷歌,实际上是选择start up创业公司,创业公司最大的特点是在一个非常不确定的环境下追求高速增长,加入创业公司你需要更具备冒险性,背后很可能是你能获得更大的机会,更多的成长空间,更多公司对你的信任。我觉得选择创业是一个生活态度的选择。 依图现在500多人,70%以上是研发,目前公司绝大多数的费用也是放在了研发上面。除了计算机视觉,我们还会进入人工智能的其他领域,像NLP、语音识别等等。相对于人脸识别——人脸识别大概在2014年底超过人的水平,但语音识别今天还没有,这是非常遗憾的。 新智元:为什么要做语音识别?有什么商业应用是特别吸引人的吗? 林晨曦:你看这么多家公司都在做智能音箱。 新智元:如果说智能音箱,亚马逊、谷歌、百度这样的公司都在做了,作为创业公司现在入场会不会有点晚? 林晨曦:我觉得都还没开始,不存在入场的问题。 新智元:那依图为什么有信心能够更快、更好地把语音识别做好,乃至做到超过人类水平? 林晨曦:事情没做出来,这些都没法证明,做出来就不用证明了。所以,我们的优势是什么,所有的人都在问这些问题,事情就是这样,你没做出来的时候,他会问你为什么,你做出来就不问了,也没人关心为什么了。 新智元:还是有很多人会关心为什么你能够做得出来,为什么你能够以这样的速度做出来,比如说谷歌推出TPU,很多人惊讶谷歌敢于做专用芯片。 林晨曦:谷歌做TPU很正常,一点都不令人惊讶,如果我们非常理智,不是听外面的声音去盲从,而是独立思考的话,你会非常清楚谷歌在做这些事情。谷歌是一家令人钦佩的公司,也是摆在所有AI公司前面的那个最大的竞争对手。 新智元:那依图想要成为一家怎样的公司? 林晨曦:务实的理想主义者,画面感是这样的:一堆人背着行囊,要脚踏实地爬一座非常高的山。这座山就是理想。我跟Leo(朱珑)对公司的设想有两个层次:首先,我们对AI这件事情充满好奇;同时,我们非常期待聚拢一帮人,使得这个舞台能够承载他们的理想。 让中国的技术走出去,情怀和商业化两方面一体的考虑 新智元:为什么在此时选择进军海外市场,比如这次在新加坡建立办事处,在依图的整个商业布局中占有怎样的地位? 林晨曦:我觉得今天中国的技术是能做到世界领先的,所以我们还是非常有意愿向全世界发出我们自己的声音,这里面除了商业上的原因,还有一部分是人的感情。我们认为我们是非常现实的理想主义者。 做海外市场,我们已经准备两年了。我们是那种明确目标后就会非常坚定走下去的人,所以我们对海外市场有非常大的坚持。海外确实与中国不同,文化不同、语言不同、人种多样……很多困难在现实上都存在,但可能又不是那么重要,不影响我的决策。新加坡是一个文化、语言和民族交融的地方,选择这里开始也有一定的这方面的考虑。从策略上说,我们要做的就是怎么去跨越不同文化、不同语言,包括数据不能共享的问题,我们在这方面还是有优势的。 首先,公共安全是全世界人民都需要,而且是愿意拿出来交流和分享的东西,从这个角度上来讲,跨国家的共性是很强的。比如说任何一个机场,你都会希望它的安检十分完善,并且在此基础上又是非常方便和非常高效的,这个需求就是跨地域普遍存在的。 其次,中国的技术在世界上还是非常靠前的。比如说上海,它实际上是一个世界级别的超大规模都市,我们在上海这样的城市做的公共安全解决方案,很可能就是全世界的一个范例。我们因为参与了这些事情,就更加自信,我们具有国际化的理念、技术、solution。 最后还有我刚才讲的情怀,我们真的觉得应该走出去,让中国的技术影响全世界,同时在这个市场上获得回报,情怀和商业化相当于硬币的两面,两个都重要。国际化可能是一条更困难的路,我不知道大家是不是都会跟上来。此外,任何一件事情都有时间窗口,大家可能觉得AI+安防今天很好,或者说2017年的时候很好,大家说安防是AI公司或者初创公司最该找的战场,但反过来也有可能这个状态已经结束了。
2015年,依图开发的蜻蜓眼系统获得“公安部科技进步奖”,与阿里云合作搭建“贵州公安交警大数据实时作战云平台”,招商银行将依图人脸识别技术推广到全国1500家网点,与浦发银行合作的“人像识别平台及直销银行远程开户视频认证建设项目”投产,实现VTM和手机银行的人脸身份认证。
2016年,完成由云锋基金领投的数千万美元B轮融资,并开始在医疗健康、城市数据大脑等领域的探索和实践,搭建了全球最大的人像系统,覆盖超过18亿人像,为海关总署及中国边检提供人像比对系统。
2017年,完成由高瓴资本集团领投,云锋基金、红杉资本、高榕资本、真格基金跟投的3.8亿元C轮融资。7月,在美国国家标准与技术研究院(NIST)主办的人脸识别测试(FRVT)中获得四项世界第一,也是首次获此殊荣的中国公司。FRVT(Face Recognition Vendor Test)是国际权威人脸识别供应商测试,是全球工业界实际应用的黄金标准。FRVT人脸识别测试集数据来自美国国土安全局的真实业务场景,例如出入境、刑侦过程中收集的大量照片,测试成绩好的技术可以直接用在实战场景。
2018年1月23日,依图宣布在新加坡设立首个海外办事处,依图科技联合创始人林晨曦在接受新智元采访时表示,新加坡办公室是依图拓展海外市场的试验点。实际上,“做海外市场,我们已经准备两年了,”林晨曦说,国际化市场肯定很艰苦,但依图是那种明确目标后就会坚定走下去的人。