英文全称:Optimal Digital Voice Processor
中文全称:最佳数字语音处理机
基本作用编辑本段回目录
信息抽取是信息处理领域中一种新兴的技术。该技术通过抽取、过滤无关信息,使信息以用户关心的形式得以再组织,实现高效重组,利用计算机进行高效存储并加以利用。按照信息类别,可分为以下几种形式:
信息抽取技术的基本形式
文本特性抽取。文本挖掘是一种智能化的工具。它能够使人们免于陷入信息的汪洋之中,从大量冗余的信息中迅速发现对自己有用的信息;同时,还在一定程度上揭示信息与信息之间的关联,产生出用户以前未曾意识到的有用信息。而传统的信息检索软件所查询的信息可能仅仅从字面上符合查询要求,并不是人们真正需要的信息。
文档群集和分类。捕捉关键术语和概念的特性通常也描绘了文档内容的常规性质。如果给定一组文档,群集技术就会构成一组组主题类似的文档。当存在一组预先定义的类别文档时,文档分类技术就可归纳出区别这些类别的模型。这些模型可以让您根据任何文档的特性,自动将其分类到一个或多个预先定义的类别。
遥感信息抽取与处理。遥感信息抽取是指从遥感图像获取所需信息的基本过程,即根据各专业的特殊要求,运用解译标志和实践经验与知识,从遥感影像上识别目标,定性、定量地抽取出目标的分布、结构、功能等有关信息,并把它表示在地理底图上的过程。对遥感信息抽取处理,一般以物体的光谱特征、几何特征及其它辅助特征为依据进行分类。将这些庞杂的采样抽取信息与已经注册入库的信息特征模板进行一对一的比对,即可实现对遥感图像的识别,从而最终完成地形信息的自动量化过程。
生物特征识别。由于人体特征具有人体所固有的不可复制的惟一性,这一生物密钥无法复制、失窃或被遗忘。而常见的口令、IC卡、条纹码、磁卡或钥匙则存在着丢失、遗忘、复制及被盗用诸多不利因素。因此,生物识别技术是目前最为方便与安全的识别技术。用于识别的生理特征有手形、指纹、脸形、虹膜、视网膜、脉搏、耳廓等,行为特征有签字、声音、按键力度等。基于这些特征,人们已经发展了手形识别、指纹识别、面部识别、发音识别、虹膜识别、签名识别人体生理特征和行为特征来识别身份的技术。生物特征是惟一的人们同识别系统交互进行身份认证时,识别系统获取其特征并与数据库中的特征模板进行比对,以确定是否匹配,从而决定接受或拒绝该人。
在情报处理上招数多多
指挥者正确决策来源于大量正确的情报。在高技术条件下,由于情报获取渠道及获取方式的增加,使得对蕴含在情报信息中浩渺无际的数据整合成为军事情报人员的关注重点。据统计:仅1995年的全球总信息量是1985年的2400倍,现在一天的信息量即相当于1985年全年信息量的十余倍。不加筛选、剔除或一味地追加信息的“量”,往往会引起信息“质”的恶变,使得信息拥有者实际上处在一种无效信息包围的状态。
另外,随着浩如烟海的声像情报的大量涌现,语音识别在情报处理中的应用也日益广泛。据介绍,每个人的声音束、嘴型、喉咙、鼻以及发音肌肉都各不相同,这些有差异的物理特性,决定了每个人声音的独一无二性。由于其口音、停顿、用词或表达习惯不同,因此都有着特定的识别方式。对声音加以记录,并将其转变为声谱或声纹的直观形式,从大量的声音数据资料中,抽取某一个体的特征声音频率曲线,形成可以识别的特征声音信息,是语音识别的目的之所在。如在伊拉克战争中,每当卡塔尔电视台播出萨达姆的讲话录音后,美国中情局的声音识别专家及语言专家即开始对这些录音进行分析,他们首先将录音带中的声音与资料中存储的声音进行对比,辨别出其相似之处及不同之处,这些相似或不同之处涉及呼吸方式、语调的抑扬变化、不寻常的语音习惯以及地方方言等,从而判断出录音信息的真伪。
在目标识别上独具慧眼
近年来,随着高新技术在军事上的广泛应用,传统的战场敌我识别系统已越来越不适应现代的战场环境,战场上误袭误伤事件频繁发生。据有关资料统计,美军在海湾战争中的28起误伤事件中,有11起是由于目标识别错误造成的,占误伤总数的11%。另外据英国《简氏防务周刊》报道,在伊拉克战争中出现的“友军误射”事故要比以前报道数量多三分之一,在“伊拉克自由”行动中英、美两国的友军误射事故达17起。
为了适应数字化战场建设的需要,美军正在研制一种“非协同式”数字化敌我识别系统。它没有询问和应答信号的交互过程,目标的真伪判定己方直接作出。其工作过程是:射手把在瞄准具中直接看到的或经信息处理机抽取的目标特征输入电脑,与目标固有的信息参数相对照,初步作出目标性质的判定;尔后再与数字化信息网作信息交换,作出“敌我”性质的二次识别。此外,以人脸识别、语音识别为代表的生物特征识别技术也已亮相数字化战场,诸如将人脸识别技术应用于数字化士兵的交互通信设备中,进行敌我识别,将语音识别技术应用于对战场武器装备的语音智能控制等。
在生物特征识别上举足轻重
“9·11”恐怖袭击发生以来,如何在机场、车站等公共场所利用高科技手段,迅速而准确地发现并确认可疑分子成了目前世界各国在反恐斗争中普遍关注的问题。将生物特征识别技术引入对恐怖分子的个体打击则是信息抽取技术在这一全新领域的又一应用。如前所述,生物特征识别技术是依靠人体的身体特征来进行验证的一种解决方案。其核心在于如何获取这些生物特征,并将之转换为数字信息,存储于计算机中,并利用可靠的匹配算法来完成验证与识别个人身份。可以想像,将生物特征识别应用于反恐战争准备,建立起恐怖分子的生物特征数据库,必能在对其追踪、识别方面发挥重要作用,使恐怖分子无处遁形。例如有一种虹膜扫描仪,能在30厘米外用不到1秒钟的时间验明人的身份,在试验中已有两百多万次准确识别的惊人记录,甚至对基因完全一样的孪生兄弟,也能可靠地区分开来。鉴于“9·11”的惨痛教训,如今美国联邦调查局已把信息提取研究作为反恐战争中的一项关键技术。他们试图运用包括生物特征识别等信息抽取技术分析软件,搜索大量的数字信息,从中发现与恐怖犯罪行为有关的活动,并计划建立一个数据库,接收来自多个FBI数据库的信息,真正做到将恐怖袭击扼杀于萌芽状态。