您的位置:必威app官方下载 > 世界历史 > 百度搜狗输入法专利大战的背后是新战争的开始

百度搜狗输入法专利大战的背后是新战争的开始

2019-12-01 12:34

2018年4月26日,广州第十届全球移动互联网大会在北京顺利召开。本届GMIC聚焦“人工智能”,将主题定为:“AI”生万物,寓意科学技术要有人文的温度。早前,百度国际旗下的输入法Facemoji将“人文的温度”带入AI技术,在海外又更新并上线了一项最新的人工智能成果——英语语音输入功能。

6月23日,由于早前搜狗所持有的相关专利被国家知识产权局判定大部分无效,经过上海高院三次开庭,搜狗在法院宣判之前,于近期主动撤回此前的亿元天价诉讼,自此,搜狗输入法向百度索赔一亿元侵权费的“亿元天价专利案”暂时告上一段落。不过随后在6月27日,搜狗对外表示搜狗对百度的专利侵权诉讼尚未结束,撤诉原因为专利被裁定部分无效,搜狗目前已就无效部分提起行政诉讼。

在7月3日“Baidu Create2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型,使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。

Facemoji英语语音实时识别词准率达90%以上

按照熟悉此次案件内情的业内人士评价,“搜狗和百度的这场官司已经开庭了三次,如果坚持到宣判,对于搜狗来说可能并不利好,甚至品牌和经济方面的损失会更大,所以选择撤诉是比较明智的做法。”

在7月3日“Baidu Create2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型,使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。

百度国际输入法Facemoji在2016年于美国发布,凭借其前沿的AI技术及有趣的个性化特色,成为美国最受年轻人欢迎的输入法。据统计,该输入法已累积超过千万下载量,现在Google Play平台 。

事实上,搜狗与百度的输入法专利大战由来已久。百度也曾于2016年10月,向北京知识产权法院起诉搜狗侵权,诉称搜狗旗下“搜狗拼音输入法”、“搜狗手机输入法”侵犯了百度输入法多达十项技术专利,要求搜狗赔偿金额共计一亿元,这些官司目前也正在进一步审理中。

图片 1

据了解,Facemoji输入法更新的人工智能英语语音输入功能操作简易快捷。用户只需轻触键盘上的话筒按钮,即可进行英文语音输入。随着用户讲话,语音内容将实时、准确地呈现在手机屏幕上,还能根据断句自动添加标点符号。

百度搜狗为何要围绕着一个“小小的输入法”打得如此不可开交?

2019百度AI开发者大会百度CTO王海峰分享SMLTA模型

此前,百度国际化团队做过一个实验,与美国《艾伦秀》的脱口秀主持人现场进行了一场AI的比拼。当时,主持人Ellen DeGeneres脱口的内容被Facemoji的输入法一字不差实时录入到了手机。而经过百度国际化产品团队的更新迭代,目前Facemoji的英语语音功能又取得了突破,据悉,现其词准率已达到90%以上。

输入法愈发重要的入口生态作用

“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是breakbarrier”,这是百度语音技术部负责人高亮在现场面对百度输入法念出的一段高难度“Rap”,这样一段复杂的中英文混合“Rap”不仅被百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句,百度输入法的语音识别还保持了非常快的速度,边说边上屏,无需等待整句念完便可呈现识别结果。这不仅是输入法行业的重大变革,也代表着未来的人机交互有更多的可能。

百度自研平台开发实践上万小时数据的声学建模

随着输入法在百度、搜狗双方的战略从“工具”逐渐上升到“入口生态”,输入法在他们二位心中的地位也就变得越来越重要。输入法具备从各大平台内置搜索引擎和社交场景中分流的能力,就拿百度输入法来说,通过基于百度搜索框、百度词条、百度知道和百度文库长久以来的内容积累,以及百度糯米、百度外卖对本地O2O的深度渗透,完全有可能构建起一个以输入法为入口的立体场景。

图片 2

据百度技术人员介绍,Facemoji更新的英语语音输入功能完全基于百度自研的深度学习平台进行开发,使用上万小时的语音数据进行模型训练,识别结果快速准确。在声学模型训练过程中,Facemoji借助了百度高性能的汉语模型进行迁移学习,利用百度准确率极高的中文语音识别系统来改善英语识别的准确率。

此外,输入法对于提升用户对于产品、对于搜索的体验也有着巨大的推动作用。智能化的输入法能够快速提升用户的搜索速度和准确率,从而帮助产品增加用户的粘性。

百度语音技术部高亮现场评测百度输入法中英自由说

此次上线的英语识别系统选择三音子作为声学建模单元,采用深层长短时记忆循环神经网络结合连接时序分类的技术构建模型,从而有效利用语音序列前后的相关性提高识别的准确率。

老大老二的市场之争

2019年1月百度输入法上线中英文自由说功能,深受用户喜爱。通过语音识别算法SMLTA模型,百度输入法对中文音节和英文音素混合建模,并基于海量纯中文、纯英文和中英文三类数据进行模型训练,再将中文、英文和中英混合三个语言模型并行解码,融合标点和大小写进行处理。也正是基于以上AI技术支持,百度输入法还可以支持方言自由说,方言与方言、方言与普通话混合输入免切换,精确的识别结果让语音输入不再是“普通话考试”。

据介绍,为了提高识别系统的鲁棒性,百度国际化团队还使用了加噪和速度扰动等数据增强技术对训练数据进行扩充,保证系统在实用场景中的高准确率。另外,该识别系统的词典模块也会定期扩充,覆盖用户输入的新词或专有名词。

百度输入法、搜狗输入法大战背后的真正原因是百度输入法持续攀升的市场份额、百度输入法最高的用户满意度以及百度输入法的智能化创新。

图片 3

Facemoji开发中国特色表情纳入全球emoji标准

今天的输入法市场格局基本呈现出了三大梯队:搜狗输入法和百度输入法处于第一梯队;QQ 输入法和讯飞输入法位于第二梯队,而触宝输入法、谷歌输入法等则属于第三梯队。但在众多输入法玩家中,第一梯队的百度输入法和搜狗输入法竞争尤为激烈。

语音输入日益成为输入法行业新的增长点,百度输入法作为百度AI能力应用落地的重要产品之一,具有天然的语音技术优势。自2019年初,百度输入法公布在线语音识别、离线语音识别、中英自由说、方言自由说四大语音输入功能突破后,技术突破持续深入。目前,离线语音识别准确率已达到在线语音识别效果,效果提升的同时还降低了模型大小,占用更少的内存,离线和在线语音输入之间还可无缝切换。截止目前,百度输入法日均语音请求量峰值已突破6.2亿次,稳坐语音输入法行业头把交椅。

Facemoji自革新推出后,极速占领彰显个性的年轻人市场,除了解放双手直接用语音输入外,个性化和特色设置也是它快速攻占美国年轻市场的主要原因。用户不仅可以选用自定义的个性化图片制作自己专属的键盘皮肤,还可以添加特殊的按钮点击动效,获得广大用户好评。

曾有第三方数据显示,在百度、讯飞、搜狗等国内知名第三方手机输入法中,百度输入法的用户满意度调研多次排在第一。百度输入法通过利用自身强大的人工智能技术,强化技术和内容并达到业界第一,在输入法语音技术、皮肤技术、产品内容上等多个领域都取得了领先优势。

从手写输入到打字输入再到AI输入,百度输入法正在打造融合了语音、AR、视觉、知识图谱、自然语言处理等多项AI技术的“全感官输入”体验,此前百度输入法AI探索版已上线“拍立活”、“秀场”、“凌空手写”等功能,展开了对更多输入场景的探索。百度输入法通过对场景、用户的深度洞察和在技术领域的不断创新,实现在“新交互”“新表达”“新探索”三个方面全面升级,名副其实是行业领先的“AI输入法”。

在使用信息交流中,文字不再是唯一的交流语言,表情符号Emoji更丰富了人们的沟通互动。Facemoji支持超过1,200种表情、贴纸、GIF等,其智能预测功能可基于用户的使用习惯和喜好,针对不同区域不同种族的用户,提供颇具本土特色的Emoji表情预测,帮助用户更好的表达自我。

一、识别“悄悄话”,人工智能语音技术赋能输入法

百度大脑全方位的AI能力正在不断赋能百度输入法,输入法也在变得更聪明、更智能、更懂你的表达,未来的输入法将从手机端延伸到智能家居、车联网等更多场景,让人机交互更加高效自如。通过不断的技术创新和功能升级,百度输入法将为输入法行业提供更多AI创新样本,迎接5G时代的“提速”挑战,引领AI输入法全感官输入时代。

有趣的是,为了结合中国传统特色春节,Facemoji团队亦专门设计了三款趣致而不失传统的中国元素Emoji:“月饼”、“鞭炮”、“红包”。这三款Emoji更获得Unicode的认可并纳入了Unicode 11中。也就是说,我国传统文化元素将在全球大量不同的app和平台中获得广泛应用。

在AI+输入法的落地上,首先备受关注的就是语音输入,起初,大家一致认为语音输入会更便捷、更受到用户青睐,但恰恰弄巧成拙。不论是否隐私,在中国这个到处都是人的拥挤社会里,适合人们选择语音输入的场合少之又少。百度就是从这里入手,首先解决了即将沦为鸡肋的语音输入痛点,创新推出悄悄话识别功能。

百度语音识别技术逐渐脱颖而出 日语识别精度超越谷歌

有研究表明,耳语的语音不经声带振动,由此不存在基频,相应的各次谐波也不会产生。因此,耳语的频谱特性不同于正常语音,要想精准识别还要依靠高难度的技术研发,人工智能恰好派上了用场。通过人工智能的主动学习,在基音检测和谐波分析技术的基础上挑选符合耳语特性的数据,百度输入法拥有了专业的“轻声识别”的训练和开发营地。

百度国际表示,Facemoji未来的发展目标是为全球用户提供更有趣的用户体验、更有效率的产品服务,通过语音输入功能,彻底解放双手。现时,Facemoji输入法支持上百门语言,获得全球超过千万下载量,用户覆盖欧美、拉美、东南亚等地区,远超过同类型产品。

在识别速度方面,通过标注已有的耳语数据,在声学模型上适配这些训练数据,使现有的声学模型能快速适配耳语语音特性。不得不说,这是语音输入一大开创性成果,也使百度输入法有了颠覆输入法界格局的资本。

此外,小编还留意到,百度国际的语音识别技术也拓展到日本市场,其旗下出海的Simeji输入法获得了日本市场的广泛应用,已成为日本最大的第三方输入法,日语语音识别精度已超过谷歌。百度国际认为,语音识别技术是人工智能领域的重要组成部分,百度国际会秉持将”人文的温度”带入人工智能技术,打造真正关怀、了解用户的产品。

二、百度输入法拥有了更高识别准确率

在2017年的博鳌论坛期间,搜狗CEO曾放话称搜狗的语音识别在APP或其他应用场景中都超越了百度,秉承求真务实的精神,网上有网友曝出实测视频。在两部相同手机的聊天、搜索和游戏三个场景下,二者转化速度和准确度差别不大,只是百度输入法的修改次数较低。而在搜索场景中,百度语音识别的正确率更高,识别速度也更快,更加贴合这个快节奏的时代对输入法便捷高效的使用体验要求。

百度的语音识别准确率目前高达97%,超过了正常人的听力水平,语义理解技术支持超56个领域的自定义适配,新一代的深度语音识别系统Deep Speech2更是入选了2016年MIT十大突破性技术。有了人工智能的加持,百度输入法也拥有了更强的识别能力。

三、长文本输入受欢迎,多领域走向领先

今年年初,百度输入法的另一大创新成果——长文本语音输入,在V7.3版本中面世。另有网页应用SwiftScribe在30秒内转换完成了一份时长1分钟的音频文件,其转化效率高出人工速记1.67倍,速记行业转录效率在百度输入法这里得以大幅刷新。

除此之外,百度输入法还率先落地了输入面板上的搜索,并实现了不跳转搜索、单手输入模式等提升使用体验的功能;在输入法与手机通讯录的结合方面,百度也有更具人性化的创新,让语音输入能够识别出通讯录中的人名,继而进行熟识名字的优先转化;在与核心输入相关的领域,位置纠错也是百度独创的核心能力……

四、皮肤加持,熊本熊正版表情也被百度收入囊中

熊本熊有多火,看各大社交、搜索的网络数据就知道,日本的熊本县甚至凭借熊本熊收获了12亿美元经济效益,包括观光和产品销售。百度于16年末拿到熊本熊的授权许可,成为唯一一家拥有熊本熊表情和输入法皮肤的输入法行业授权的公司。

在版权保护以及在内容原创方面的重视态度,也为百度输入法的正面形象大大加分。

搜狗撤诉并不意味着输入法大战结束,新的大战刚刚开始

由此看来,百度输入法在多个领域逐渐展现出的领先优势成为触发百度搜狗输入法专利大战真正的导火索。尤其是在人工智能的加持下,百度输入法取得了行业领先的优势,搜狗的专利撤诉也是意料之中的事情。

百度输入法率先进行技术创新升级、增加语音技术的投入,让搜狗输入法倍感压力,两者之间的战争只会越来越激烈。在市场份额的竞争之后,是基于人工智能技术的大战即将打响。因为,人工智能技术的运用,对于输入法的用户体验起着极为重要的作用,也将会成为这场输入法大战的胜负关键。

在人工智能领域拥有绝对优势的百度,必然将会在这场输入法大战中逐渐占据优势。

笔者认为,一场由人工智能主导的新输入法大战才刚刚打响……

刘旷,以禅道参悟互联网、微信公众号:liukuang110

本文由必威app官方下载发布于世界历史,转载请注明出处:百度搜狗输入法专利大战的背后是新战争的开始

关键词: