蒙恬科技创始人兼董事长 蔡义泰博士
“Stay Hungry, Stay Foolish.”这句话连同庞大的苹果帝国、乔布斯传奇,鼓舞了无数心怀改变世界梦想的人们。科技界风起云涌、潮流更迭,2010年Siri为苹果推行,语音识别真正跳入普通人视野;2013年“云”概念推广,“私有云”、“云计算”一时风骚无他。早春三月的北京,我们有幸请到蒙恬科技董事长蔡义泰博士,一同聊聊语音识别、云技术,当然还有蔡博士的蒙恬科技。
蒙恬科技(PenPowerTechnology Ltd.)是一家以“智慧型人机介面”为发展主轴,将既有的手写、语音、光学辨识、名片光学辨识、无线通讯以及安全监控垂直整合,应用于多平台的科技公司。其创始人蔡义泰博士专注手写辨识系统,推出全世界第一套中文手写输入系统,也因此被誉为“中文手写辨识之父”。
传说蒙恬改良毛笔,蒙恬科技也在用自己的技术和理念改造手写领域。不限于此,语音辨识、跨平台整合均在蒙恬力及范围之内。此次蔡博士携蓝牙扫译笔、行动笔记王(MyInk)、語音速記王(ViaTalk)三款蒙恬新产品来京,希望有更多人能够了解这些便携美观且能提升效率的产品。
(Q:元器件交易网 A:蒙恬科技蔡义泰博士)
行动生活 硬件与软件融合
A:你可以看得出来,蒙恬基本上是定位在所谓的识别、辨识领域,比如说像笔记处理。其实行动笔记王(MyInk)这个产品定位是给文字工作者,很方便一个笔记本这样一夹,用配套的笔写字就可以。回去之后笔记也可以辨识,就不用再键入了。这样就很方便,或者有iPhone、iPad直接在上面用很方便,甚至于可以画图。
目前来讲我们推的版本1.0、1.1,主要是把笔记数位化,储存到电脑里面,这个储存的记忆是很多很多的,基本上一个笔记本写完都还可以存储在这里。
Q:行动笔记王的存储量大概是多少?
A:100张A4纸写满。一般用不到这么多,存储后就可以删除了,一百张真的很多,存储量很大,一般的笔记都可以处理。
我们在新的版本未来会做的就是表格,如果说有表格,直接画在纸上,就会产生Word档案或Excel档案,Word里面的表格就会直接呈现出来。表格里面填文字,在Word里面就会出现辨识过的表格。所以你要变成笔记也可以,但是它会变成表格线,直接产生Word档案,可以编辑保存下来。这就是大概在五月初2.0版本会推出功能。这个产品对学生做笔记很有用,商务人士做会议笔记,开会的时候拿个笔记本在这里写就可以了。蓝牙扫译笔的话给学生也是蛮实用的。
Q:蓝牙扫译笔里面是靠压感识别么?
A:这里面有一个摄像头,扫过去的时候就会把里面的内容传到手机上,经过手机上的软件辨识过之后,文字就可以做翻译等。这就是蓝牙扫译笔,通过蓝牙,直接接到USB上也可以使用。
Q:如果没有网络这些功能还可以使用么?
A:没有网络可以做资料输入。比如学生做笔记尤其是研究生,如果说要写论文有一些纸本上的文字,他要摘录其中几段,要引用别人的文章,用这个就很方面。所以也有很多学生在用,出国的话携带也很方便。
再来就是速记王,也是很方便,可以录入资料,用讲的直接输入在电脑里就可以了。
还有即将推出的还没有到国内,名片扫描系统。
家里的PC、公司用
基本上是把名片辨识的结果直接送到华为网盘,可以用档案的方式汇出。进到我们的APP直接拍照同样可以辨识,上传资料。这个是月底会到的新版本。这四个版本比较大的不同是可以通过云端,让跨平台的设备可以互通。用云端的机制,让各式各样的平台可以互通。
所以你可以看出来其实蒙恬做这些产品有几个方向:第一个还是辨识技术,不管是手写还是名片这些,辨识这里还是持续在做一些提高。第二个是云端的计算,我们的东西辨认出来的结果放到云端去,放到云端的好处就是可以同步了,可以跨平台。第三个就是行动,开发这些产品都很行动化属于mobile user,在行动的生活里都可以使用。还有就是软硬的整合,你可以看到我们的产品,都有硬件和软件,尤其是软件就是它的灵魂。硬件的道理很简单,它只是把影像扫描进去了,但是最重要是扫描进去之后要辨识,辨识以后要应用,可以应用它来翻译,这就是我们目前发展的方向。另外一个就是我们在产品的设计上第一个就是无线化,你可以看出来,名片、扫译都是无线的。第二个是脱机化,就是说直接写完的东西就存储进去,不一定要马上接到电脑上去,直接可以晚上回家、回到办公室的时候再把笔记全部放进去。第三个是风格化,整个设计都精巧、有特色,在设计上得了蛮多奖(名片王极致版plus曾荣获2011年reddot产品设计首奖“bestof the best”)。再有就是小巧,这些硬件都小小的,携带方便。跨平台,在Win、MAC、iOS、Android平台都可以使用。还有除了B2C以外也会做B2B。
Workercloud云服务 共享名片信息
A:目前我们还开发了一项叫“Workercloud”,这个产品关键在于,一个企业一个公司业务出去会接触到客户,会跟客户做名片交换。理论上名片属于公司资产,不会随着这个人离开后资讯就不见了。所以在拿到名片之后,扫进去就可以放到公司的server上,这套系统有个软体,加载在公司的私有云,所以这个软件是在公司里面。终端可以用PC、MAC或者扫描器扫进去,也可以用Android、iOS。上传上去后公司的主管可以去看今天拜访了哪些客户,客户的资讯是什么。甚至有些人脉的关系譬如今天公司已经有大批的名片资讯了,今天要去拜访一个新的客户,我们去查这个名字,以前有没有人拜访过。或者同一个公司不同的人有没有拜访过谁,有没有认识他。比如陈先生,我们公司没有人认识他,可是我们知道陈老板很重要,我们可以看看这个公司有没有其他人见过面可以靠他连接,这就是所谓的人脉管理,在”Workercloud”里面都可以呈现出来。目前这个系统在台湾做推广,大概在第二季度会在国内推广。
它也是跨平台,甚至你可以用browser的方式打一个IP上去可以登录到服务器的server端。它还有一些管理,主管可以看,进行管理和标记,这就是所谓的B2B的标准。
Q:您做私有云服务是出于怎样的考量呢?
A:基本上我们公司名片辨识已经做了很多年,我们在海外市场,像美国、欧美地区甚至日本,我们的名片系统卖的都不错,甚至我们在开发阿拉伯文。我们在推广的过程中,除了一般用户也遇到一些企业用户,这些企业用户希望,大家都拿着名片,大家资料没办法共享,你拿名片可以扫到你的电脑里面,自己可以拷贝出来,但这还是属于个人在处理。一些公司问我说可不可以集中,甚至形成一个小Team,几个人的名片分享。名片分享这个想法对我们来说一个公司,它的名片资源是应该共享的,集中在公司的server上的,一年两年三年累计下来资产其实是很可观的。在这种情况下,我们提供终端,提供MAC上iOS上,因为公司的业务有很多不同的手机,我们可以让不同的设备都可以连接得到,成为公司的Database,当然也要公司管理。所谓的管理就是可以设定哪些名片你能看,哪些名片不能看。
Q:那么信息的安全问题呢?
A:任何公司都有所谓的阶层的管理,部门就是组织,各个部门由公司决定谁能看到哪些名片,是由公司管理决策的。整个信息都在私有云上,安全问题当然由防火墙之类。
Q:您认为名片王和现在流行的名片APP竞争力在哪里?
A:如果说名片的使用量不是很大,用手机拍照就可以了。但是名片使用量比较的话,这个你放进去一张一张就这样扫,加上这个扫描是封闭的所以不会受到光线的影响。拍照的话会受到光线会影响到识别的效果,还有识别的扫描的品质。
准确辨识 多项大奖
Q:目前这些产品辨识的准确度大概有多少?
A:目前的辨识准确度大概在98%、99%,都不是问题。因为现在的计算能力都蛮高的,每个设备诶计算能力很高,辨识能力也相应的提高。
我们公司成立在91年,94年投入OCR,就是你用扫描或者拍照的方式,扫描的影像档如何把文字辨识出来。97年投入在语音辨识、生物认证这样。然后在2005年的时候,智能机开始流行,我们就把名片识别放到平台上,软体也和一些智能机厂家像
Q:您刚才也提到蒙恬到过很多设计奖?
A:的确得了很多奖,2013年蓝牙扫译笔得了德国iF产品设计奖,像名片王在日本2011年得了Good Design。全世界三、四个大奖,GoodDesign、iF还有Reddot、G-mark,我们的名片产品得到了Reddot的”the best of the best”。全球十个,我们是其中一个。其他的G-mark,iF奖我们也得过很多个。因为我们从来2002年开始就做大中华以外的产品,就开始做名片机,那时候我们就开始参加国际的大奖。更早时间还有一些,参加国外这种奖很难,把产品送给评审去看,看产品是不是能得这个奖。大部分都送和大公司比较容易得。我们这种小公司还是可以得到这些奖。
语音识别 Google有先天优势
Q:您有听说过做语音识别的科大讯飞公司么?
A:我知道,他们的语音识别也是做的不错的。语音识别这个东西说实话做得也蛮辛苦,不过我稍微讲一下语音识别。像Google有一个最大的优势是,他们截取了全世界网页的内容,他们的优势是可以得到很多很多的语料。我举例子好了,当我念“蔡义泰”三个字的时候,以一个人来讲是不知道是哪三个字。我们中国人,第一个“蔡”应该没问题。“义”呢,义有几个音,四十几个字,光同音字就有很多。“泰”也有几十个字,那凭什么念“蔡义泰”三个字会出现我的名字,它靠的是什么?它猜对的比例很高,靠的是什么猜对的?因为它从全世界的网路里面,资讯、报道把这个音猜出字。因为中文辨识里面同音字很重要,因为音只有1000多个,字有一万多个。比例来讲同音字是比较高的,语音辨识就要解决同音问题,靠的是什么,靠的是好几个音去猜出是哪几个字。比如我说"ZHONGXIAO",可以是"中校",也可以是"忠孝东路"的"忠孝"。单字更难猜。我们解决同音字就要用到语料库。解决语料库的话,Google最厉害,有现成的语料库,而且语料是在不断的变化、追加的。词汇,这一阵子的词汇"来自星星的你",网络可以知道,语音辨识就知道"星星"是什么,不然还以为是动物的"猩猩"。Google是有先天优势的。这是辨识要先天面对的问题,我们的语音辨识要超越Google的话,还真是不容易。它有大量的语料库,而且这个语料库还是一个动态的资产。
我们只是用创新的想法,把语音辨识出来的东西,如何很容易的输入。透过语音线,更简单,不需要做什么特别的东西,直接就可以送出去。
Q:拥有准确识别度的产品很容易替代人,您觉得这个技术可以取代人么?科技可以取代人么?
A:我是觉得科技想取代人不太容易,这是个大问题。我们公司目前的产品还是增加每个使用者的工作效率,让他更方便,更有效率,更容易完成他的工作,节省工作的时间,这是从效率环节来看的。但是你说要取代人,这个还是言之过早,毕竟这些工具上还是要靠人来完成。它只能节省时间,可以储存记录,可以不用担心笔记本会掉。这个是有帮助的,但是还是要人去产生那些资料。它还是一个工具,还是要人去执行,可以节省一些人力倒是真的。一些机械性的还是会取代的。但是一些一般性工作电脑还是不能达到的,电影里可以看到,以我们有生之年应该不会。以电脑的智慧,还是有个极限。
关注我们
公众号:china_tp
微信名称:亚威资讯
显示行业顶级新媒体
扫一扫即可关注我们