加入收藏
 设为首页
 联系我们
首 页 | 新闻动态 | 万博网址进不去图片 | 万博网址进不去服务 | 万博网址进不去培训 | 万博网址进不去图书 | 万博网页版手机登陆机 | 公司介绍 | 在线教学 | 留言咨询 | 联系我们
□ 站 内 搜 索 □
请输入查询的关键字:


标题查询 内容查询

  
媒体报道     
职业前景     
新闻动态     
公司公告     
最新公告     

自动滚屏(右键暂停)
非键盘汉字输入技术
发布时间: 2011/3/11 13:20:17 被阅览数: 4072 次
    非键盘输入是相对与传统的键盘输入而言的,旨在突破传统编码技术的更简易便捷的汉字输入方法。目前主要有手写识别(或称笔输入)、语音识别(或称语音输入)和光学字符识别(OCR)等汉字输入技术。
  1.语音识别
  计算机语音识别,简单的说就是让计算机能接收并听懂人的声音。语音识别系统的主要功能一般包括:接收麦克风的语音输入、提取有用信息、通过声音模型及相应的语言模型识别等模块。其核心算法基本包括:话者适应算法、特征提取算法、声音模型及相应的语言模型、搜索算法及匹配算法等。而基于统计的隐含马尔可夫模型(HMM),则可能是目前最为成功的一种语言识别模型和算法了。这种隐含马尔可夫模型的算法是将语音看成是一连串特定状态,它们以某种隐含的关系与语音的特征相关连,通过概率形式表现出来,其输出结果也用概率形式给出。我们目前所能看到的各种性能优良的语音识别系统几乎均采用了这种模型。隐含马尔可夫模型已成为了现代语音识别技术的核心。
    语音识别系统有多种分类方法,如:按照发音方式,分为孤立字发音识别、连续词发音识别和连续语音识别;按照可识别词汇量的多少,分为小词汇量识别、中词汇量识别、大词汇量识别和无限词汇表识别;按照识别对象,分为特定人语音识别和非特定人的语音识别。
    语音识别技术已广泛应用于许多方面,产品设计语音拨号、企业管理、工业控制以及多媒体教学等许多领域。而其替代键盘作为文本输入手段的听写机则是语音识别技术的一个最终成果,它运用语音识别技术将人的自然语言转换成文本进行输入。一个优秀的听写机系统应具有适应非特定人、连续语音及无限词汇的性能,要完全达到这样的目标非常困难,但研究人员正在朝着这一目标努力争取。
    1998年,IBM公司在我国推出的汉语ViaVoice是一个针对汉语普通话的听写机系统,该系统是一个高性能的语音识别系统,它使用户能够以口述方式输入文本而不再受限于仅用键盘输入。用户使用起来非常方便,使得汉字输入的速度大大的提高。ViaVoice听写机系统具有如下主要功能:IBM语音板(语音字处理器)、口音适应程序、IBM ViaVoice 属性设置、词汇表管理器及麦克风设置向导程序。IBM ViaVoice是语音识别系统的核心,可以直接使用,也可以与其他系统配合起来使用。目前汉语语系的语音识别产品的核心技术大多是IBM ViaVoice 内核(如汉王),有些产品甚至直接捆绑了IBM ViaVoice 98软件(如紫光)。
    汉王语音听写输入系统是中国科学院自动化所最新推出的汉字语音识别系统。它是国家863计划科研成果,是汉王笔与IBM的汉字语音识别核心IBM ViaVoice的完美结合。汉王听写系统是以汉字语音识别为基础的文字处理系统,它将声音信号识别为文字,使用者完全脱离键盘录入汉字,开创了一个文字录入的全新天地,是一种简单易学、方便快捷的高性能的非键盘输入系统。该系统还佩带一套手写输入设备(一套手写板和手写笔),当听写中个别字有错误时,可使用它进行修改。汉王在ViaVoice的基础上,融合了学习功能,可让机器在发音不准的情况下读懂所说的话。从识别效果来看,该软件对普通新闻稿的识别率较高(测试达97%),对某些专业性强或者文学性强(如诗歌、散文)的文章识别率较差。
    除上述之外,还有清华的紫光大师以及美国Dragon System公司研制的Dragon NaturallySpeeking 听写机系统等都是具有很强影响力的语音识别系统。Dragon System公司还推出了一些专用听写机系统,如专为医生设计的Naturally Speeking Medical Edition和专为律师设计的NaturallySpeeking Legal Edition系统等。
  2.手写识别
  手写识别又称笔输入,是利用专用的笔在特定的书写平面(与计算机相连的书写板)上写字,利用压敏电磁感应的原理,将笔在书写板上运动轨迹的坐标输入给计算机,计算机运行识别软件,将汉字图形转变成汉字的标准代码,以此完成计算机的汉字录入过程。
    由此可见,手写识别输入系统包括硬件和软件两个组成部分。其硬件一般分为书写笔和书写板。目前,“笔”的类型主要包括:有线、无线;有压感、无压感;有电池、无电池等若干种。像可以感知压力大小和倾斜角的无线电池压感笔,在使用上已接近于真实的笔。书写板又可分为电容式和电磁式两类,其中电容式书写板价格低廉,但其定位精度不高,需要采用特殊的识别算法。而电磁式书写板则正好弥补了上述缺陷,定位精度高,对于连笔字和多笔画字可以更精确地识别。目前市场上性能不错的几款手写识别产品像“紫光绘写大师”、“汉王笔”等,均采用了电磁式手写板技术。
    手写输入的主要核心技术就是识别算法。一个手写输入识别软件应包括笔画采集、笔画轨迹分析、文字特征提取、与特征库比较分析、生成机内汉字编码等功能模块。中文汉字字型复杂,数量繁多,常用字已多达数千,通过汉字识别软件将笔输入的汉字图形识别为文字,可以帮助计算机用户脱离键盘实现高效的汉字录入。
    近两年来,手写识别技术发展很快,各商家都不仅仅将笔作为文字输入设备,而且广泛应用于网上交流、电子发音词典等其他领域,发展前景非常广大。如紫光产品4050A,采用了具有512级压感的无线笔,可以作为文字录入、平面设计等工具。其紫光笔识别软件V3.0提供了学习功能,对于用户的书写习惯可以进行记忆,对于连笔字也能识别。紫光笔还提供了简体、繁体、简繁混合和英文的录入设置,识别效果都不错。除紫光产品之外,中国科学院推出的汉王笔系统,集成了手写输入、语音合成、事务、手记Email、网上笔谈等软件,使用户可方便地构筑一个因特网上的手写办公环境。而台湾蒙恬科技股份有限公司出品的百变小蒙恬V3.5,则是一套操作简便、易学易用的中文输入入门工具,具有单字输入、左右连续输入、全屏连续书写三种书写方式,经过多次测试,都达到了95%以上的识别正确率。
  3.OCR技术
  OCR(Optical Character Recognition 光学符号识别),是指将一份文字稿件以图象形式输入给计算机,计算机取出每个文字的图象,再将其转换成汉字的编码存入计算机,以达到汉字输入的目的。OCR技术解决的是已存在于纸介质上的文字如何被计算机识别并接收的问题。由于是对扫描后的图象文件进行识别处理,所以称为脱机汉字识别系统。从汉王全能阅读机开始,脱机文稿扫描技术从概念上被归类到非键盘输入之中,使得OCR产品自然地加入到非键盘输入市场之中。
    由上述可以看出,OCR技术的核心同手写识别技术一样,也是汉字识别问题。通过建立汉字识别特征库,利用特征比较算法、判别算法等,达到让计算机识别汉字的目的。硬件部分上,目前的光电扫描输入设备有扫描仪、传真机、摄像机等。汉字文稿通过CCD(Charge Coupled Device 电荷藕合器件)将光信号转变为电信号,再转换为数字信号传给计算机,然后通过识别软件对汉字进行识别。
    扫描仪技术的飞速发展,使得扫描仪的性能越来越好,而价格却越来越低,随着“家用扫描仪”的推出,许多用户在购买计算机时,已逐渐将扫描仪作为标准配件来配置。而目前市场上又有很多种类的OCR软件,如清华OCR、尚书办公专家,以及英文的Omnipage、TextBridge等。它们都可以识别多种字体的中英文和多种格式的表格,并且能够进行图文管理。如随Microtek、N-tek扫描仪的销售配送的尚书办公专家,可以识别中文和英文文字,同时兼具图文档案编辑管理功能。OCR技术开辟了更为宽广的输入输出天地。


相关同类新闻:
  • 万博网页版手机登陆无速路
  • 亚伟万博网页版手机登陆实习中应该注意些什么

  •  

     

    郑州博文电脑万博网址进不去服务有限公司  版权所有
    地址:郑州市文化路与东风路(18号)交叉口西100米路北汇宝大厦510室 E-mail:zzbowen@126.com
    TEL:13513892966 QQ:394238923
    技术支持:凯达网络
    豫ICP备05005475号