首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 音频信息检索理论与技术
内容
目录

前言

第一部分 音频信息检索的发展与理论基础

第1章 绪论

 1.1 信息检索技术的分类及进展

1.1.1 概述

1.1.2 文本信息检索

1.1.3 多媒体信息检索

 1.2 音频信息检索技术的发展

1.2.1 语音文档检索

1.2.2 说话人检索

1.2.3 音乐检索

 1.3 音频信息检索的应用

 1.4 本书的构成

 参考文献

第2章 音频信息检索的基础

 2.1 人类对音频信息的认知机理

2.1.1 听觉的生理基础

2.1.2 听觉的感知机制

2.1.3 听觉特性

 2.2 音频信号的数字处理及特征表示

2.2.1 信号的统计特征

2.2.2 感知特征

 2.3 音频信息检索框架及模型

 2.4 音频信息检索的评价

 参考文献

第二部分 表示级的音频检索

第3章 基于直接匹配的音频样例检索方法

 3.1 基于分段的实时检索方法

3.1.1 片段划分

3.1.2 基于检索窗的检索控制

3.1.3 基于分段的检索方法

3.1.4 快速分段检索方法

 3.2 MPEG-1压缩域模糊分类的检索方法

3.2.1 MPEG音频编码简介

3.2.2 MPEG-1压缩域特征选择和提取

3.2.3基于MPEG-1压缩域模糊分类的检索方法

 参考文献

第4章 基于索引的音频样例检索方法

 4.1 局部敏感哈希索引方法

4.1.1 局部敏感哈希

4.1.2 ρ-稳定分布局部敏感哈希

4.1.3 ρ-稳定分布局部敏感哈希音频索引方法

 4.2 基于局部敏感哈希倒排索引的检索方法

4.2.1 基于局部敏感哈希的倒排索引构造

4.2.2 基于局部敏感哈希倒排索引的搜索

 4.3 基于树与链表混合索引的检索方法

4.3.1 模糊直方图模型

4.3.2 树与链表混合索引构造

4.3.3 基于树与链表混合索引的搜索

4.3.4 时间复杂度分析

 参考文献

第5章 基于GPU通用计算的快速音频样例检索方法

 5.1 通用图形处理器与统一计算设备框架

5.1.1 通用图形处理器

5.1.2 统一计算设备框架

 5.2 检索算法GPU加速的可行性分析

5.2.1 检索算法可移植性分析

5.2.2 检索算法计算特点分析

 5.3 检索算法GPU加速的实现

5.3.1 以线程为粒度的算法实现

5.3.2 以线程块为粒度的算法实现

5.3.3 加速效果比较

 参考文献

第三部分 语义级语音文档检索

第6章 语音文档检索的预处理技术

 6.1 语音文档检索系统的组成

 6.2 检索系统中的预处理技术

6.2.1 连续语音识别

6.2.2 关键词检出

 6.3 语音文档检索的评价指标

 参考文献

第7章 语音文档检索的索引和搜索技术

 7.1 基于关键词检出的检索方法

 7.2 基于语音识别器最优候选的检索方法

7.2.1 基于大词表连续语音识别器最优候选的检索方法

7.2.2 基于子词识别器最优候选的检索方法

 7.3 基于音节网格搜索的检索方法

7.3.1 音节网格的若干定义及性质

7.3.2 基于音节网格搜索的检索方法

7.3.3 索引去冗余方法

7.3.4 检索性能分析

 7.4 基于音节倒排索引的检索方法

7.4.1 倒排索引结构

7.4.2 采用时间匹配机制的检索方法

7.4.3 采用位置匹配机制的检索方法

7.4.4 检索性能分析

 7.5 基于后验概率邻接音节矩阵的检索方法

7.5.1 语音文档的表示

7.5.2 网格的邻接音节后验概率矩阵

7.5.3 语音文档的邻接音节后验概率矩阵

7.5.4 检索方法描述

7.5.5 基于韵律加权的索引修正

7.5.6 检索性能分析

 参考文献

第8章 语音文档检索中的容错技术

 8.1 基于模糊匹配策略的容错方法

 8.2 基于融合策略的容错方法

8.2.1 索引层面的融合

8.2.2 分数层面的融合

 8.3 基于扩充网格的容错方法

8.3.1 算法的基本思想

8.3.2 基于局部路径的简化计算

8.3.3 基于扩充网格的检索精度提高方法

8.3.4 检索性能分析

 8.4 基于词片语言模型的容错方法

8.4.1 词片

8.4.2 基于互信息的词片选择算法

8.4.3 基于词片的语言模型

8.4.4 采用词片识别器的检索方法

 参考文献

第四部分 语义级的说话人检索

第9章 说话人检索

 9.1 说话人分割

 9.2 检索中的说话人识别技术

9.2.1 基于GMM的识别方法

9.2.2 基于GMM-UBM的识别方法

 9.3 直接利用说话人识别实现的检索技术

9.3.1 极低错误接受率的实现

9.3.2 训练语料不充分问题的解决

 9.4 间接利用说话人识别实现的检索技术

9.4.1 锚模型索引方法

9.4.2 GMM模型索引方法

 参考文献

第五部分 语义级的音乐检索

第10章 音乐自动标注

 10.1 音乐声学基础

10.1.1 乐音的感知

10.1.2 音程、音律、音名与音高标准

10.1.3 音乐的要素

 10.2 音乐自动标注方法及存在的问题

 10.3 基于谐波结构信息的音乐标注

10.3.1 基于BP神经网络的起始点检测

10.3.2 基于谐波结构信息的多基频估计方法

 10.4 基于半音域频率系数的歌曲旋律提取

10.4.1 半音域频率系数

10.4.2 基于viterbi方法的旋律提取

 参考文献

第11章 音乐检索

 11.1 哼唱检索

11.1.1 基于规则的哼唱旋律提取

11.1.2 乐曲库的索引方法

11.1.3 旋律匹配

 11.2 拍打检索

11.2.1 特征提取

11.2.2 基于DTW的匹配计算

 11.3 基于色度图的复调音乐检索

11.3.1 色度

11.3.2 色度图

11.3.3 离散色度图和色度特征

11.3.4 基于色度的相关计算与检索

 参考文献

内容推荐

《音频信息检索理论与技术》由韩纪庆、郑铁然、郑贵滨所著,系统地介绍音频信息检索研究的相关理论、技术与方法,以及该学科领域的最新进展。内容包括音频信息检索的基本理论、表示级和语义级的音频信息检索技术等。在表示级的检索中,重点介绍基于直接特征匹配的音频样例检索方法,内容涉及基于分段的实时检索、基于索引的检索,以及基于硬件实现的快速检索。在语义级的检索中,分别介绍语音文档检索、说话人检索、音乐检索等内容。针对语音文档检索,介绍直接利用语音识别最优候选结果的检索、基于音节网格搜索的检索、基于音节倒排索引的检索、基于后验概率邻接音节矩阵的检索,以及语音文档检索中的容错技术。针对说话人检索,介绍直接利用说话人识别进行检索的方法,以及基于说话人索引的间接检索方法。针对音乐检索,介绍音乐语义信息获取方法——音乐自动标注,以及哼唱检索、拍打检索、基于节拍谱的检索等方法。

《音频信息检索理论与技术》可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的研究生教材,也可供该领域的科研及工程技术人员参考。

编辑推荐

《音频信息检索理论与技术》由韩纪庆、郑铁然、郑贵滨所著,分为五部分、共11章,分别介绍音频信息检索的发展与理论基础、表示级的音频检索,以及语义级的语音文档检索、说话人检索和音乐检索。其目的不仅让读者对音频信息检索理论和技术有一个系统的了解,而且努力将本领域的新动态介绍给读者,希望读者能在学术思想上受到启发。

标签
缩略图
书名 音频信息检索理论与技术
副书名
原作名
作者 韩纪庆//郑铁然//郑贵滨
译者
编者
绘者
出版社 科学出版社
商品编码(ISBN) 9787030303721
开本 16开
页数 244
版次 1
装订 平装
字数 307
出版时间 2011-03-01
首版时间 2011-03-01
印刷时间 2011-03-01
正文语种
读者对象 青年(14-20岁),普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类 科学技术-工业科技-电子通讯
图书小类
重量 0.374
CIP核字
中图分类号 TN912.3
丛书名
印张 16
印次 1
出版地 北京
238
168
12
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号
版权提供者
定价
印数 3000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/6 19:18:02