`
javawebsoa
  • 浏览: 409940 次
社区版块
存档分类
最新评论

云输入法与传统输入法的整合之道

 
阅读更多

云输入法与传统输入法的整合之道

200911月搜狗高调发布了搜狗云输入法概念产品,一时间很多人都进行试用,有说好的,有说是垃圾,也有说是在炒作云的概念。官方网址:http://pinyin.sogou.com/cloud

什么是搜狗云输入法,官网是这样定义的:

搜狗云输入法是基于搜狗拼音输入法,依托云计算技术的一个概念性输入法产品。与一般输入法最明显的区别在于,完全靠服务器运算,具有更强大语言模型和词库,能大幅提升输入准确率,特别是长句输入准确率。作为演示性的概念产品,目前搜狗云输入法只能在网页上使用。

我试用了之后,颇有感受,以下是我列举的搜狗云输入法概念产品的优缺点。

优点

1、无需安装,直接在浏览器中就可以使用;

2、识别短语及句子准确度相当高,基本上可以识别日常中的主要语法;

3、没有操作系统平台的限制,只和浏览器有关,经过大家测试,主流的浏览器都支持;

4、不存在传统输入法词库升级的问题,词库永远是最新的。

缺点

1、只能在浏览器的网页中使用,浏览器的地址栏也不能使用,其它客户端软件也不支持,如QQ,MSN,WORD等等,而且每次网页刷新后都要重新从收藏栏中打开;

2、需要连接互联网才能使用;

3、输入有一些延迟,和接入互联网网络速率有比较大的关系;

4、每次输入都需要与服务器端交互,非常耗网络带宽;

5、缺少本地自定义词库功能。

总的来说,如官方网站上描述一样,这还只是一个概念级的产品,可以方便地得到用户反馈和建议,了解用户习惯,承担搜狗输入法“创新实验室”的角色,所以不能因为有明显的缺点就认为产品没有价值。

缺点分析

从缺点来分析,云输入法有以下3个致命的地方:

1、完全依赖互联网

2、不能离开浏览器

3、运营成本高

缺点12都很好理解,试用过了一看就知道。关天运营成本我们来分析一下,云输入法的运营成本主要包括:

1、人员成本(研发、运维、服务、管理)

关于人员成本和普通输入法一样,有研发、服务及管理,但还需要增加运维人员。

2、云服务器硬件采购成本

云输入法需要增加服务器硬件采购成本,包括应用服务器、数据库服务器、存储等等。就算采用PC服务器集群体系,这个成本也是相当高的,总体成本和软件的架构及设计算法密切相关,要满足1亿用户纯云输入法的硬件首期投入成本估计不下300万。

3IDC网络带宽租用成本

要满足1亿用户纯云输入法网络带宽估算需要10GB/秒,关于IDC网络带宽流量报价不太好确定,沿海城市比内地有可能高10倍,估计价格在10-150/每月,但是沿海的用户数多,估计10GB带宽的月租费要达到50万元,也就是1年运营云输入法仅带宽成本约600万。

注:纯云输入法使用网络流量带宽的估算数据:

1亿客户使用云输入法

平均每人每天要输入1000个汉字

平均每个汉字平均输入3个英文字母

平均每个按键输入需要使用1KB的网络流量来返回候选字(采用Ajax方式)

根据以上数据可以得出每天总网络流量为100000000*1000*3=300000000000KB=300TB

假设每天文字输入的主要工作时间为上午900到晚上2200,约12小时=12*3600=43200

如果每个时间段的文字输入量比较平均,则可估算云输入法要求网络带宽为300TB/43200=6.9GB/

为了保证文字输入高峰时间网络带宽也能满足要求,估计要求整体网络带宽达到10GB/秒。

云输入法与传统输入法的整合之道

如何整合

1、保留现有的浏览器收藏夹启动的使用方法,同时提供和传统输入法一样客户端输入法的安装软件;

2、正常输入时首先从本地客户端计算候选词,如果没有本地候选词则自动从云输入法服务器返回候选词;

3、设计一个匹配度算法,如果本地计算的候选词匹配度低于一个值时也自动从云输入法服务器返回候选词;

4、客户端云输入法中与服务器的通讯方式不采用Ajax,采用普通Socket的方式,这样可以更灵活,需要的网络流量可以更小;

5、输入时提供快捷键从云输入法服务器返回候选词。

整合后的效果分析

1、提供普通输入法一样的使用体验,解决了只能在浏览器中使用的问题;

2、没有接入互联网时可以和普通输入法一样使用;

3、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此响应速度很快;

4、本地词库没有候选词或匹配度很低会自动从云输入服务器返回候选词,提高输入速度;

5、仍然提供浏览器收藏夹启动的使用方法,或者开发各种主流浏览器的插件,可以在没有安装客户端输入法的情况下使用云输入法,非常适合在刚装好操作系统或者是Linux桌面操作系统上使用;

6、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此服务端配置要求可以比较低,减少硬件成本;

7、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此可以大大减少使用的网络带宽,算法设计好的话服务端1GB/秒的带宽就可以了,减少运营成本;

8、有了本地词库,客户端仍然可以自定义词库;

9、客户端的本地词库可以不需要经常更新,现在的大部分输入法默认每天都更新词库,且老是弹出一个框说更新成功,感觉为我做了很多事的样子,其实我不需要它天天自动更新,就算他天天更新也不需要弹出框来提示,因为这个信息对我来说不仅没有任何用处,而且会打扰我的工作。现在系统中自动更新的软件太多了,比如杀毒软件、360安全卫士、金山词霸、QQ、迅雷、输入法等等。

10、采用整合后的输入法不用担心词库不全了,从云输入法服务器返回的候选词也可以自动存为本地词库,本地词库1个星期或者一个月更新一次就可以了。

搜狗云输入法名字取得吸引眼球,似云非云,因为现在大家对云的概念都不是很清晰,但是当许多云概念产品推出并且产品得到大家认可时,我想也没人会在乎是不是云了。这和2005年时形成的Web2.0概念非常相似。Web2.0强调的是互动,云计算强调的是无限扩展。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics