速录速记网 http://sulufans.com
投稿邮箱:sujipx@163.com
当前位置:>> 首页 >> 速录百科 > 速录知识 > 电脑速记、录音机和语音识别的关系

电脑速记、录音机和语音识别的关系

发布时间:2024/5/5 21:49:24 阅读次数:4498
    人的语言表达速度一般为120-180字/分。作为一种符号体系,人手写汉字的速度,一般为30-50字/分,再快就潦草辨认不出了;速记是用简单符号和缩写方法快速记录语言和思维的高效应用技术,它可以同步跟得上人的语言表达速度,做到"笔随音飞,言出字落"。尽管社会的发展,出现了录音机、语音识别等记录语言信息的工具,但他们仍然有各自的功能和特点,不能互相取代:

    (一)手写速记与录音机的关系

    1、应用范围不同 录音机只能记录有声信息,对无声信息则无能为力。速记既可以记录有声信息,又可以记录无声信息,而且可以使有声、无声信息(传导信息、体态语、思维等)书面化,只要有一只笔,几张纸就可以工作。例如:秘书人员应用速记技术在摘抄资料、起草文稿、记事备忘等,快捷、高效。尤其是在某些不准或不便使用录音机的场合,由于汉字记录往往挂一漏万而影响信息的准确性。根据国际惯例,外事会谈、谈判一般不准使用录音机,速记的作用就显得特别重要。

    2、时效性不同 录音机记录有声信息时,只能机械照录,不能进行选择和修改,更不便于查找,是被动的。同时,录音机记录的有声信息转换整理成文字时,仍然需要来回倒带,费时费力。经测试,一小时的录音信息整理成汉字,一般需要3至4小时才能完成;速记技术是由人脑把握信息记录的主动权,记录信息时进行过滤、修改和整理。例如秘书人员用速记记录会议、电话、领导口授时,就可以根据情况对语音信息进行同步的选择和过滤,对一些语病、口头禅等过滤掉,可以删繁就简和修改,可以做到语言信息即时书面化。 录音机记录的交互式有声信息不便于书面化。例如座谈会、交流会、研讨会、论坛等场合,同时会有多个人在说话,录音机记录后在进行书面整理时,由于看不到发言人而很难识别是具体哪一位讲者的信息,从而产生信息混乱的现象。而速记记录因为秘书人员在现场采集,则迎刃而解。

    3、记录的信息量不同 人们在表达语言信息时,往往伴随着的无声信息(眼神、手势、思考)也是需要记录下来的,比如"王经理紧握着客户的手,想了想说……""李处长关切地看着秘书人员,吩咐道……"等信息,"紧握手"、"想了想"、"关切地看"等信息,录音机就无法记录。信息就不够全面、丰满,秘书人员应用速记则可以记录得下来。 人们在表达语言过程中,有时会只说前半句话,后半句往往会出现吞音或干脆就不说了等信息遗漏现象,如果讲者的声音小而听不清时,而记录、采集起来就很难。在会议现场做记录要比听录音带记录,信息来源要丰富得多,记录整理起来轻松得多,文秘速记人员可以借助当时的语境,通过看发言人的神态、口形等去分析、理解而记录补充完整的,使得记录下的语言信息更加丰富、生动。

    (二)电脑速记与语音识别的关系

    如今,信息社会的飞速发展,产生了电脑速记技术和语音识别技术。电脑速记技术是传统手写速记和计算机相结合的产物,它可以使语音信息即时转化为电子文本,可以做到"会议毕,文稿出"。语音识别技术是让机器通过识别和理解语音信号而转化为相应文本或命令的高技术。由于语音信息具有连续性、多变性、动态性、瞬时性的特点,造成了语音识别的难度远远不像人们想像的那样简单--对着电脑的麦克风一说,字马上就会出来了。它的识别难度它在于和不同的说话人、不同的说话速度、不同的说话内容以及不同的环境条件有关。 作为中文信息处理的工具,语音识别技术和电脑速记技术都是把稍纵即逝的语音信息转化成文字,但二者的关系除了速记与录音机的不同点相似外,还有以下几点:

    1、同音字、词处理的问题 现代汉语中的大量同音字、词一直是中文信息处理电脑化的瓶颈。电脑速记、语音识别在记录语音信息时都会遇到这个难题,关键是记录的准确率。如"以同等xueli考研"是这个"学历"还是这个"学力";"秘书人员要正确领会领导shouyi"是这个"授意"还是这个"受意"等,即使是语音识别能够完全记录下语音信息,而且能够达到百分之百的准确率,其功能仍然和录音机一样(二者的关系见上文),同样需要人们的后期加工整理,这样花费的时间要比人在当时记录的时候要多得多。因为人在讲话时,往往是口语,从口语到书面语的转化,并不单纯是落成了文字。

    2、人们在理解语言时,可以根据语音之间的停顿、语调、语气等,把声音信息变成转化文字,并实时添加相应的标点符号。语音识别在理解语言时,需要说出标点符号的具体名称,因为机器在理解语言时,需要靠断句来理解的:"王处长冒号您从哪儿来问号另起一自然段空两格今天的政治学习内容是前书名号邓小平理论后书名号",事实上人说话时是不说出标点符号的具体名称的,这样会很别扭。 语音识别在理解语言时会遇到字符正确串切分和对句子结构的理解问题。如"美国会考虑战略导弹防御系统"是"美国/会/考虑/战略导弹防御系统"还是"美/国会/考虑/战略导弹防御系统"呢?"他yihuier/jiulai"本来是"他一会儿就来"往往会被理解成"他一挥而就来";"要及时把握……"语音识别就很可能会切分成"药剂师把握……"。电脑速记是由人脑对语言信息进行切分,加入标点符号、分段的。

    3、语音识别软件对语料内容要求严格,需要人们说标准的汉语普通话,如果有方言、口音、土语等识别起来相当难,而且要事先进行发言人口音适应。尽管如此,文秘速记人员如果能够听得懂,一般都能够记录下来,也要求文秘速记人员必须具有广阔的知识面,听得多了,记录的信息也就准确得多了,这也是文秘速记人员往往会比一般人辨别、采集语音信息能力强的原因。如果方言特别重的人讲话,人都听不懂,机器也就更难听懂了。

    4、语音识别只能识别单一的汉语语音信息,对于其他有声信息都会被其认为是噪音而影响其识别的准确率。例如,在正在播放有背景音乐的朗诵词里提取男女对话的汉语信息,转化成文字,麦克风根本无法识别。 语音识别无法理解和识别交互式有声信息,比如座谈、讨论、会谈等多人发言时,麦克风无法辨识是哪位发言的信息,也不能只记录这位发言人的信息,而把别的发言人的声音信息阻隔在外。电脑速记技术由于是由人来把握,不但可以记录下每个人的发言内容,还可以记录下当时的场景,这样的信息就会很丰富、生动。

    5、新生事物的出现而产生的新词语以及人名、地名等专业词语,人们可以根据对语音信息的理解,选定具体是哪个字或词。速记技术在记录语言时,可以对同音字(词)进行实时处理,以保证一次性在准确率95%以上,这也是为什么电脑速记的出现,能够得到社会认可的原因,也是速记技术高效率的具体体现。由于汉语词汇的丰富无限性和可扩展性特点,为了提高语音识别的准确率,必须对人名、地名、新词语等专业词语事先限定,把词汇做入电脑语料库里,但是实际*作起来不现实。例如用语音识别记录即将召开的党的十六大代表发言、讨论内容,往往不可能让所有的代表都来事先对麦克风把发言内容说一遍,适应一下口音,把相关词语事先录入进去,这样的话,就变成了现在是开会了。

[1] [2] 下一页

 
返回速录fans首页

上一篇:漫谈手写速记在当今社会上的实用..
下一篇:速录师:高薪源自高素质
相关标签:电脑速记、录音机和语音识别的关系,速录师培训,速录爱好者
相关文章

图文报道