Angel Eyes:计算机视觉的梦想编辑本段回目录
编者按:4000 个创业项目, 200次深入交谈 …… 作为一线投资从业者,在与创业项目的接触中,深感创业者的艰辛与伟大。我只是想把尚未成功的那些最平凡的创业者,最真实的创业经历展示给大家。
想象一下,当我们把手机摄像头对准星巴克的图片的时候,就自动会出现星巴克的介绍、产品种类等,当我们把手机摄像头对准一张王菲的照片,可能就会出现王菲在跟你打招呼和唱歌的动画……这一切离我们并不遥远。带着对这一切的好奇和想象,作者访谈了Angel Eyes(天使眼)的CEO喻川。
Angel Eyes是一家什么样的公司?
Angel Eyes是一家计算机视觉算法提供商,提供基于云计算的图像(视频)识别、分析服务。面向应用层开发者、交互设计师授予API(应用程序编程接口)许可,从而大幅度降低计算机视觉技术的应用门槛及成本。除了API以外,我们还将陆续提供一系列SDK(软件开发工具包)、嵌入式方案来满足具体开发需求。
当时的创业初衷是什么?为什么选择这个方向?
项目是去年底启动的,我们做了一个分析照片所对应心情的应用(稍后我们也会开放这个API接口),后来就打算把这些神奇的技术开放出来,所以就成立了公司。
我注意到CV(Computer Vision,计算机视觉)在学术领域已有很多成果,可惜都在论文阶段,严重缺乏商业应用。而对于普通开发者来说,CV的门槛则显得过高。我们希望让CV的学术成果能变成更多具体的、满足大众需求的应用。
人类现在到了与技术一同进化的时代。纯粹的生物进化,人眼可能需要上万年的时间。而我们通过技术,可以让这样的进化进程加快。互联网就让我们彼此能隔空传递思想,CV也会让我们视野更宽广、更强大。
这个是一个技术核心的创业项目,那Angel Eyes在技术方面的实力和积累如何?
这个我想先简单介绍一下CV的领域的一点背景信息。CV领域的技术是不具有普适性的,就是说可能识别人脸的技术不能识别指纹、识别指纹的不能识别图像、识别动作的不能识别物品……
所以谈到技术水平,就需要在一个具体的应用领域来谈。目前我提供的是图片识别的云服务,具体指标的话,在目前我们接触的同行中算是领先的。至于其他识别,目前我们暂时未涉及。
但是,图像识别是CV领域的一项基础。将来我们也会在图像识别的基础上向其他。诸如3D识别、字符识别、动作识别等领域延伸。
从团队方面来说,主要的研发核心是程欣宇副教授,也是联合创始人。CV领域的商业化,需要涉及学术只是以及软件工程两个方面,程老师在这两者上有非常好的结合,这是我们的技术优势。另外科研技术只但谈技术也是不行的,还需有很好的商业模式以及对市场的理解来指导技术研发。否则研发、选型、技术路径风险会很大。我想这也是我们的一个优势,具有商业与技术结合的团队。
既然团队在商业方面也有优势,请介绍一下团队的其他成员吧。
Angeleyes团队于2011年组建,2012年1月成立公司。除了程老师外,团队成员还有我,叫喻川。多次互联网创业经历,长期从事互联网产品设计。
蒋楚麟:运营总监,副研究员,美国SIT 研究生院管理专业理学硕士研究生毕业,多家国际机构管理工作经验,有着多年运营的经验。
廖金华:移动开发工程师,曾独立开发多款移动应用,涵盖社交、移动阅读、移动工具等。
BHADURY ARNAB:研发工程师,印度籍留学生,以优异成绩通过斯坦福人工智能课程考试。
王艳:顾问董事,经济师,通信工程师,北邮硕士研究生毕业,擅长财务管理、战略管理。长期从事企业管理咨询工作。
任海林:研发工程师,在读硕士。
技术的目的是为了更好地应用,那目前图像识别的应用都有哪些?重点的行业和切入点是什么?
几乎所有高校都有模式识别、CV的研究室,但真正能做商业应用或是做出技术创新的极少。目前图像识别主要有两个应用方向:
1.图像检索。我举个我们接触到的一个例子,有个开发者做中国字画的数据库,有500万的图片素材,要让一个专家看一张图就能说出字画的作者、朝代等背景信息是不可能的,这个时候就需要我们的技术来做了。
2.人机交互。现在时普适计算时代的前期,普适计算的特点就是抛弃PC时代的鼠标键盘交互模式。智能手机、平板电脑都没有键盘和鼠标了,如何让这些设备输入信息或者感知现实世界,就需要用到图片识别、语音识别。例如你看到一个电影海报,想订票,现在我们是输入电影的名字,如果订票的APP使用我们的接口,就可以直接拍海报订票了。
一项技术推向大众化的过程也是需要时间的。目前来看,在大众的生活中,这块的技术还没有变得很日常。如果要是变得更加普遍和大众的话,您预计需要多久,这个爆发点在什么时候?
最近当当和京东的手机APP都增加了图像识别的功能,算是一个大众应用了。
另外随着两个技术的普及,CV会有巨大的空间。 一个是无线互联网,一个是移动设备。移动互联网为CV提供了强大的资源库,移动设备的提升为CV的运算需求提供了硬件基础。至于爆发点,我认为应该在2-3年
和国内外的竞争对手相比,Angel Eyes最大的优势在什么地方?
CV之前用于互联网之前主要用于工业生产,也称机器视觉,在国内还是有些公司的,但是在用于互联网领域的目前不多。瑞士公司有一家公司kooaba.com,也是瑞士高校为背景的。在增强现实领域有几家公司,包括高通公司也在做,但是技术源头都是瑞士。
技术上应该是相通的吧,都用于静态图像的识别?那国内这些服务于传统行业的公司把这些技术用于互联网领域呢?
这个还不能单说技术,就像微软做PC操作系统非常成功,但是做手机wm却一塌糊涂。固有思维模式、固有的市场、固有的人际关系等等,可能有时候反而是阻碍。
技术上也会有所差异,例如机器视觉,主要还是做嵌入式系统作为计算载体;而用于互联网,可能就要以云为主了,嵌入式和云的做法是不一样的。
项目是什么时候上线的?目前运营成绩怎么样?有多少开发者?大家的反馈如何?
4月6号上线的,但是没有对外。4月18号算是正式公测,所以到今天差不多10多天。目前已经有68位注册开发者 ,提交了10个实际应用,有识别500强企业Logo的、也联通手机客户端图像识别等等。有些开发者的反馈和需求暂时我们还无法做到,比如识别动物、识别掌纹算命、识别户型图辨别优劣等。
关于商业模式是怎么考虑的?
商业模式是通过云计算平台授予应用开发者API许可,按API的请求量等云资源的消耗计费。公测之后我们将开始收费服务,当然在一定使用量下,我们也是免费的。这样可以帮助一些应用层的创业者,等开发者的应用使用量较大后,我们就会收取费用了。目前来看,需求挺大的。最迫切的是一家澳洲的公司,目前我们已经和他们签署了100万澳元的代理合同。
恭喜!那当公司创立到现在资金方面的问题怎么解决的?有没有外部投资?
资金都是自筹的,因为创始团队都在30-35岁之间了,初期投入主要是创始成员自己的积累。
目前还没有引入过外部投资。我们认可资本的力量和价值,投资人是要实现我们愿景必须借助的力量之一。但是我们希望我们能在商业化上更成熟、市场上更明朗的情况下融资,这也是对投资者负责任的做法。同时我们也希望能找到对技术有深刻理解的投资公司。
公司从创立到现在,遇到的最大问题和挑战是什么?
最大的挑战还是科研成果在商业化转化中的不确定性因素,另外人才也是一个问题。
学术成果是一种实验性的成果,是论证性质的。而商业化,是需要齐备的解决方案,以及苛刻的技术指标的。两者之间是有距离的,我们在这两者之间要做大量的技术创新和商业创新。
至于人才,我们希望在算法方面、分布式云计算方面找到更多的优秀人才。有这方面兴趣的读者,欢迎跟我们联系。
将来Angel Eyes的目标是什么?我是不是可以把Angel Eyes的将来理解成为图像识别领域的讯飞?
对,完全可以,还有国外的Naunce。我希望Angel Eyes能成为一家能改变众多人生活的企业。
关于创业有什么跟大家分享的吗?
我算是连续创业者,至少三次创业了。之前主要做计算机辅助设计,还做过游戏、社交、移动APP等。创业在中国的环境并不是很好,创业者也缺乏很多基本必备的训练,盲目创业风险太大,或者会扭曲创业者的心态。
我也一直在帮助一些新创业者。在本地和创业者会有些不定期交流,给他们分享一些经验和教训,还有一些企业经验方面的各种知识。另外我们办公场地,也可以被一些自由创业者分享。
在我们资金力所能及的地方,也帮助过本地的一个大学生创业团队(做中文版SIRI的)。目前他们正在设立公司,我们支持了几万。早期他们读书时候的开发设备也是我们提供的手机、iPad和苹果的一台MINI。