本篇文章5112字,读完约13分钟
如何赚钱以及如何利用高科技是一个永恒的话题。
这篇文章是由我黑马授权的深蓝出版的。
半个月前,哈默手机会议让全国(包括我母亲)都知道了一家名为iFlytek和语音智能的公司。
我不在那里。据说老罗引进了讯飞输入法,这是哈默的主要合作伙伴讯飞的产品。老罗以极快的速度讲了一篇长课文。讯飞推出的文本版本没有时差,识别结果几乎没有任何偏差,非常完美,现场欢呼雀跃。
讯飞输入法支持19种方言输入。与苹果的siri和微软的cortana相比,讯飞输入法在本地化方面明显具有优势。
讯飞输入法背后的公司叫做科达讯飞,是目前中国最大的智能语音技术提供商。第二天,iFlytek的股价在开盘时达到新高。鉴于自2008年iFlytek上市以来股价表现平平,许多人表示,他们终于到了可以套现的时刻。
除了讯飞,近年来中国还出现了一系列致力于智能语音的创新公司,典型代表有Esprit、Sound Intelligence Technology和云之声。
人工智能时代即将到来,语音技术公司的春天又来了。围绕人工智能的创业团队如雨后春笋般涌现,智能语音技术的应用成为他们开拓市场的首选。几乎每个月都有几个语音互动机器人发布。除了硬件,语音服务平台也迅速建立起来。作为一种输入系统,键盘将停留在最后的时代,人类将使用语言与机器互动。智能家居和汽车已经成为语音行业最集中的领域,第一个爆发市场即将诞生。
然而,如何赚钱以及如何利用高科技是一个永恒的话题。事实上,流行的讯飞输入法、讯飞语言点和讯飞语音云仅占讯飞总收入的3%左右,其收入还不到1000万。另一件从传闻中听到的事情是,IFlytek的年收入超过20亿英镑,其中大部分来自铺设网络电缆和进行教育工程的整合,而不是来自复杂的智能语音技术。
上个月,在深圳举行的一个小型内部智能语音研讨会上,圣智科技创始人Esprit副总裁与来自丰瑞资本和向峰投资的两位关注人工智能的早期投资者讨论了如何利用语音技术赚钱。我碰巧在现场,我认为它非常好,有些段落简直太棒了。所以录音和版权即将到来,我们将与你分享它们。这里可能有你想听到的真相。
深蓝深蓝季节之星
2016.11.11
研讨会嘉宾
智能手机在2012年出现后,短短几年时间,中国涌现出一大批与语音相关的公司,如云之声、Esprit和iFlytek,它们发展非常迅速,很快就进入了公众的视野。这也得益于手机的发展,这使得语音成为手机上的一个重要应用。
在2015年,我们仍然相信声音是一个非常好的投资机会。这有两个原因:第一,虽然人工智能的发展在过去的两三年里在语音技术方面取得了很大的进步,但是我们发现实际的准确率仍然不够高。虽然人们根据实验数据宣传说准确率已经达到95%以上,但实际情况是在实际使用中准确率并不高。
不管算法和技术如何,我们还没有解决很多前端问题。让我给你举个最简单的例子:我们过去讨论的语音识别技术有点像我们如何把它翻译或转化成大脑在听到声音后能够理解的信息。但事实上,我们还没有解决耳朵的问题。如何消除噪音干扰?当很多人在说话时,你怎么能听到你想听到的呢?当距离很远时如何分离声音的方向?如果前端语音/声音交互的许多问题没有解决,整体体验仍然不够好。
第二,从数据来看,苹果语音搜索的使用率其实并不高,因为虽然手机不是键盘,但触摸屏体验还是很好的。未来的发展在于智能硬件:继手机之后,出现了大量的智能终端,包括家庭、车辆、可穿戴设备、机器人等。,这些智能终端上的键盘或手指变得不那么重要和不友好,而声音变得更加友好和重要。
灵声智能后视镜,当司机与机器通讯时,他可以随时中断机器,让他执行其他任务,并让机器暂时做自己想做的事情。它可以解放双手,使驾驶更加安全。
基于以上两点,我们相信语音技术将会有更多的发展和进步。
至于语音技术,我们一直面临一个问题,那就是如何赚钱?科大讯飞赚了20多亿元,其中大部分是铺设网络电缆和做项目工程,但是尖端技术没有赚到钱。
在网上,我们可以提供api赚钱,但是百度是免费的,所以其他人只能免费。当你做应用对接服务时,你会觉得手机上的用户习惯和行为习惯还没有建立起来。所以我想问你对这个非常实际的问题有什么看法。
这个问题很好,也很难回答。对于勇气号,我们现在考虑的是如何烧钱,而不是如何赚钱,这真的很难。
现在,正如你所看到的,从个人电脑和互联网到移动互联网,再到其他,声音可能是同一个方向。作为一种便捷的交互模式,随着智能硬件设备的不断更新,语音可能会取代触摸屏成为一种交互模式。这就是为什么资本和技术都集中在这个领域,这使得人工智能的一个小春天诞生在寒冷的冬天。
目前,我们确实看不清楚赚钱的问题。
但是围绕这个方向,我们可以看到一些总的方向:一是核心技术和产品体验的改进,这是必须要做的。第二,我相信大部分公司将来肯定会有一笔相对较少的技术许可费,虽然这部分费用不足以满足资金需求。
然而,我仍然相信每个人在未来都在探索这种联系,不管是2c还是2b。这条路是曲折的,但方向必须正确。
让我简单介绍一下新加坡淡马锡控股的风投公司香峰投资。它主要集中在消费和技术领域的中期和早期投资,并在人工智能方向投资了Horizon和maxent。下面,我将从投资者的角度简要谈谈一些看法。
要想知道如何赚钱,最重要的是找出需求所在。在阅读了这么多创业项目之后,我们将会思考那些盈利的公司是如何从中国消费生态下产生的。事实上,核心是掌握用户的真正需求,从需求出发,考虑如何制造产品,然后追溯到你的上游,然后到顶层甚至芯片,找出哪里有机会。
首先,在手机方面,有一个作为输入方法的声音的需求,但刚才,每个人都说,这只是一个语音识别技术在手机上提供了一种输入方法,并希望将通过输入法设置一个应用程序来收费。显然,这在今天是不可能的。现在,没有像百度输入法这样的键盘输入应用程序仍然收费。
尽管语音是一种不同的输入方式,但它仍然很难收费,尤其是当老板们已经在这么做的时候。此时,有必要找到一个需求场景,没有其他方案可以与您竞争一个声音可以发挥重要作用的场景。
例如,智能家居中的扬声器就是一个很好的例子:你不能在扬声器上触摸它,并且很难用其他键盘输入它。因此,如果你找到一种与说话者互动的方式,很明显你是最好的,因为没有其他强有力的替代者。
让我们谈谈汽车。事实上,人们在汽车上使用多年的旋钮和按键是一种非常好的人机交互方式。它们不一定比语音输入效率低,但它们是有效的,因为你可以盲目操作。想象一下,当我想更换车内的电台时,我可以不用看中央控制器就能触摸旋钮进行操作,或者方向板上有一个转轮,可以让我调节音量等等。这已经是最好的人机交互模式,但是通过声音增加音量或切换频率可能并不更直接和准确。
然而,车内还有许多旋钮无法解决的其他需求。例如。后排的乘客需要与汽车互动。如今,许多汽车后排都有独立的空调节系统。当乘客觉得后排的温度太低,希望空能调得更高时,目前的情况是司机只能调整后排的the/きӗin。
如果能够做到这一点,一个很好的语音识别阵列工具可以用来区分不同乘客的方向,无论他们是在主驾驶员的左侧还是右侧,副驾驶员还是后排,并根据不同人的语音指令满足他们的需求,从而产生一种新的交互模式。除了空键,还有其他的要求,比如换台,换首歌,等等。
从产业链的上游来看,芯片多年来一直是有利可图的。在语音识别中,语音处理芯片,如iphone使用的卷云逻辑,在语音处理方面做得很好,解决了语音降噪和方向识别的关键问题。以芯片为载体,你可以在传统芯片商业模式的基础上赚钱。
卷云逻辑公司的cs44130可以为整个音频信号链提供芯片,包括模拟或数字输入和扬声器喇叭输出。其精细小巧的设计可以大大简化产品的设计。
向下,在芯片的下游,模块也有机会赚钱,就像今天索尼克科技正在做的那样。如今,产业链中的分工非常精细,所以过去很难有像飞利浦和西门子这样的大公司。核心组件和所有设备的研发,直到最终产品全部由一家公司完成。在分工非常细的情况下,芯片公司不可能生产另一种产品,也很难生产另一种模块。事实上,中间需要的是一个阵列公司:以模块的形式提供产品,不仅仅是制造一个印刷电路板来把芯片放在上面,而是把算法结合在里面,反映附加值。
最后,有机会通过生产一些用户真正使用的产品来赚钱。例如,京东和讯飞也在开发像echo这样的终端产品,一些初创公司以前也做过。然而,有真正机会的创业公司可以开辟一个新的市场领域。就扬声器而言,这是一个由来已久的行业和产品。那么,你能创建一个新的产品表单吗?在这方面,初创企业往往有更大的机会。例如,DJI可以在无人机领域实现今天的产量,因为它已经完全创造了一个新的产品类别。
图为回声点,其场景不是听歌,而是语音助手。
例如,机器人现在没有被广泛使用,但它一定是一种趋势和未来的事情。在家庭场景中,最广泛使用的机器人实际上是清扫机器人。很多人买了一段时间后就不需要使用清扫机器人了。有各种各样的原因,比如不够干净,但也不够聪明。它在清扫,根本没有规划一条路。如果我们现在能添加更多智能的东西,包括语音交互,就有可能成为一个真正的智能机器人。你可以称之为:清扫机器人,来我这里打扫房间。而不是用遥控器操作,或者走过去把它拿起来。当你的声音传递给他时,他会知道你的位置并自动向你的方向移动,这也是一个可以增强用户体验的方向。
为什么你说语音技术不能赚钱?实际上,商业模式并不是一开始就建立起来的。起初,提供云标识是vc的模式,强调公司的品牌影响力。一旦你开了一个免费的洞,之后你就不能再收费了。
现在我们希望先把蛋糕做大,然后我们可以讨论如何分蛋糕。但是现在整个市场还没有上涨,所有从事语音技术的人都在烧钱。
盛智科技的开始有点特别:它是从硬件开始的,你可以看到很多展示的产品,有些是我们授权的,有些是我们自己的,所以我们可以直接从硬件上获得收入。相对而言,我们最初的商业模式非常简单。
图为盛智科技的主要产品方向
但正如我刚才所说,这有问题。仅仅关注硬件不足以吸引公司理解我们的定义。我们很难成为一家大公司。此时,我们对硬件加软件后端的理解与讯飞不同。我们不把语音交互当作一种输入方式,也就是说,我们把它定义为一种类似于其他操作模式的升级。我们将其视为搜索的升级,这意味着语音交互可能成为下一代搜索。我们现在做的是进入现代搜索,有点像以前的浏览器和百度、谷歌等等。也许我说的是升级我们原来的互动模式。
让我们回忆一下,在个人电脑时代,我们更经常使用谷歌和百度。那时,我们必须打开浏览器,输入内容,然后搜索网页。但是在移动互联网时代,当我们使用手机时,我们会发现在手机上,我们很少打开浏览器,打开百度和谷歌,然后搜索内容,至少频率明显比原来在电脑上的频率低很多。现在,我们已经更习惯于打开应用程序。事实上,搜索已经被折叠成应用程序的形式。
我们现在知道谷歌和亚马逊对智能扬声器感兴趣。说到智能扬声器,我们会发现当我们面对一个没有屏幕的扬声器时,你不会进入或打开应用程序,也就是说,你会进一步折叠搜索。作为折叠的结果,你会直接问它,这显然比前两个更有效。事实上,这些都是由人性决定的。人性就是喜欢向简单和高效发展。
此时,我们将发现语音将改变未来搜索的状态:如果今天的孩子适应智能音频的交互模式,他们将经常直接提问,而不是像在个人电脑时代那样打开应用程序或输入大量信息进行搜索。
电影《她》的海报上,电影中的主角爱上了他的智能设备,一个来自语音识别系统的声音。电影预测:在未来,人们不能没有基于语音识别技术的智能系统。
我们现在有一些微薄的收入,但我们如何在未来创造一个更好的方式?对我们来说,它是硬件+芯片,这将在未来产生更好的收入。在移动端有许多接入点和巨头,但这能产生什么样的新商业模式可能仍在探索之中。
如今,许多巨头不必考虑收入,所以他们会尽最大努力做到这一点。对我们来说,我们只能先拥有硬件,然后再添加一种轻量级的方式来维持公司的正常业务运作。然后,下一步是看看,是否如我们所料,语音可以成为下一代搜索门户,甚至有一场入口战,然后形成一个新的商业模式,这可以改变我们的许多行为习惯。这需要各方面去探索和探索,甚至陷入许多深坑。
我相信第一波会有很多公司,因为人们常说第二波公司会做得很好,这在每个时代的发展中都经常发生。我们不敢说任何关于定位的事情。我们只想先为您提供一个完整的解决方案。无论是机器人、智能音响还是汽车,我们都希望能共同开拓这个市场。同时,我们也非常开放和合作。