速录速记网 http://www.sulufans.com
投稿邮箱:sujipx@163.com
当前位置:>> 首页 >> 速录研究 > 电脑速记 > 电脑速记与录音机、语音识别的关系

电脑速记与录音机、语音识别的关系

发布时间:2024/4/20 4:53:29 阅读次数:5490

  (二)电脑速记与语音识别的关系


如今,信息社会的飞速发展,产生了电脑速记技术和语音识别技术。电脑速记技术是传统手写速记和计算机相结合的产物,它可以使语音信息即时转化为电子文本,可以做到“会议毕,文稿出”。语音识别技术是让机器通过识别和理解语音信号而转化为相应文本或命令的高技术。由于语音信息具有连续性、多变性、动态性、瞬时性的特点,造成了语音识别的难度远远不像人们想像的那样简单??对着电脑的麦克风一说,字马上就会出来了。它的识别难度它在于和不同的说话人、不同的说话速度、不同的说话内容以及不同的环境条件有关。 作为中文信息处理的工具,语音识别技术和电脑速记技术都是把稍纵即逝的语音信息转化成文字,但二者的关系除了速记与录音机的不同点相似外,还有以下几点:  
  1、同音字、词处理的问题
  现代汉语中的大量同音字、词一直是中文信息处理电脑化的瓶颈。电脑速记、语音识别在记录语音信息时都会遇到这个难题,关键是记录的准确率。如“以同等xueli考研”是这个“学历”还是这个“学力”;“秘书人员要正确领会领导shouyi”是这个“授意”还是这个“受意”等,即使是语音识别能够完全记录下语音信息,而且能够达到百分之百的准确率,其功能仍然和录音机一样,同样需要人们的后期加工整理,这样花费的时间要比人在当时记录的时候要多得多。因为人在讲话时,往往是口语,从口语到书面语的转化,并不单纯是落成了文字。
  2、人们在理解语言时,可以根据语音之间的停顿、语调、语气等,把声音信息变成转化文字,并实时添加相应的标点符号。语音识别在理解语言时,需要说出标点符号的具体名称,因为机器在理解语言时,需要靠断句来理解的:“王处长冒号您从哪儿来问号另起一自然段空两格今天的政治学习内容是前书名号邓小平理论后书名号”,事实上人说话时是不说出标点符号的具体名称的,这样会很别扭。
  语音识别在理解语言时会遇到字符正确串切分和对句子结构的理解问题。如“美国会考虑战略导弹防御系统”是“美国/会/考虑/战略导弹防御系统”还是“美/国会/考虑/战略导弹防御系统”呢?“他yihuier/jiulai”本来是“他一会儿就来”往往会理解成“他一挥而就来”;“要及时把握……”语音识别就很可能会切分成“药剂师把握……”。电脑速记是由人脑对语言信息进行切分,加入标点符号、分段的。
  3、语音识别软件对语料内容要求严格,需要人们说标准的汉语普通话,如果有方言、口音、土语等识别起来相当难,而且要事先进行发言人口音适应。尽管如此,文秘速记人员如果能够听得懂,一般都能够记录下来,也要求文秘速记人员必须具有广阔的知识面,听得多了,记录的信息也就准确得多了,这也是文秘速记人员往往会比一般人辨别、采集语音信息能力强的原因。如果方言特别重的人讲话,人都听不懂,机器也就更难听懂了。
  4、语音识别只能识别单一的汉语语音信息,对于其他有声信息都会被其认为是噪音而影响其识别的准确率。例如,在正在播放有背景音乐的朗诵词里提取男女对话的汉语信息,转化成文字,麦克风根本无法识别。
  语音识别无法理解和识别交互式有声信息,比如座谈、讨论、会谈等多人发言时,麦克风无法辨识是哪位发言的信息,也不能只记录这位发言人的信息,而把别的发言人的声音信息阻隔在外。电脑速记技术由于是由人来把握,不但可以记录下每个人的发言内容,还可以记录下当时的场景,这样的信息就会很丰富、生动。 
  5、新生事物的出现而产生的新词语以及人名、地名等专业词语,人们可以根据对语音信息的理解,选定具体是哪个字或词。速记技术在记录语言时,可以对同音字(词)进行实时处理,以保证一次性在准确率95%以上,这也是为什么电脑速记的出现,能够得到社会认可的原因,也是速记技术高效率的具体体现。由于汉语词汇的丰富无限性和可扩展性特点,为了提高语音识别的准确率,必须对人名、地名、新词语等专业词语事先限定,把词汇做入电脑语料库里,但是实际操作起来不现实。例如用语音识别记录即将召开的党的十六大代表发言、讨论内容,往往不可能让所有的代表都来事先对麦克风把发言内容说一遍,适应一下口音,把相关词语事先录入进去,这样的话,就变成了现在是开会了。

上一页[1] [2] [3] 下一页

 
返回速录fans首页

上一篇:速录师速记与语音识别实测
下一篇:录音整理,也是一门学问
相关标签:电脑速记与录音机、语音识别的关系,速录师培训,中国速录速记权威网站
相关文章

图文报道