第1章 多媒体系统设计:引言 1
1.1多媒体元素 3
1.2多媒体应用 6
1.2.1文档图像化 7
1.2.2图像处理和图像识别 8
1.2.3全运动数字视频应用 11
1.2.4电子消息 12
1.2.5一个通用的多媒体应用 13
1.3多媒体系统的体系结构 15
1.3.1高分辨率图形显示 17
1.3.2 IMA体系结构框架 17
1.3.3多媒体系统网络体系结构 18
1.3.4联网标准 20
1.4多媒体系统中正在发展的技术 21
1.4.1超媒体文档 22
1.4.2 HDTV和UDTV 23
1.4.3三维技术和全息摄影 24
1.4.4模糊逻辑 25
1.4.5数字信号处理器 26
1.5多媒体系统中的对象定义 27
1.5.1文本 27
1.5.2图像 28
1.5.3音频和语音 29
1.5.4全运动和现场视频 29
1.6.1多媒体系统的文件格式 30
1.6多媒体数据接口标准 30
1.6.2视频处理标准 31
1.6.3微软的AVI 32
1.7数据压缩的需求 33
1.7.1压缩标准 33
1.7.2图像的无损压缩 34
1.7.3照片和视频的有损压缩 35
1.7.4硬件与软件压缩 36
1.8多媒体数据库 37
1.8.1多媒体存储和检索 38
1.8.2多媒体系统的数据库管理系统 39
1.8.3多媒体应用程序的数据库组织 41
1.9小结 42
1.8.4多媒体系统的事务管理 42
1.10练习 43
第2章 压缩和解压缩 44
2.1压缩类型 45
2.1.1无损压缩 46
2.1.2有损压缩 47
2.2二值图像压缩方法 48
2.2.1位包编码(游程编码) 48
2.2.2 CCITT Group3 1-D压缩 49
2.2.3 CCITT Group3 2D压缩 54
2.2.4 CCITT Group4 2D压缩 56
2.3彩色、灰度和静止视频图像压缩 57
2.3.1黑白电视和彩色图像组成 59
2.3.2 JPEG压缩 60
JPEG标准中的定义 61
JPEG组成综述 62
JPEG方法 63
2.3.3离散余弦变换(DCT) 65
量化 66
之字形序列 68
熵编码 68
2.4视频图像压缩 92
2.4.1全运动视频压缩的要求 92
2.4.2 CCITT H.261视频编码算法(P×64) 94
2.4.3 MPEG压缩 95
MPEG编码方法 96
2.4.4运动图片类型 96
宏块 97
运动补偿 98
2.4.5 MPEG-2 99
2.4.6 MPEG-2,“大联盟” 100
2.4.7向量量化 100
2.4.8 Intel的Indeo技术 101
2.4.9苹果公司的Quick Time 102
2.4.10微软的AVI 102
2.4.11 Intel的DVI 102
2.5音频压缩 102
2.5.1自适应差分脉冲编码调制 103
2.6分形压缩 103
2.7小结 104
2.8练习 105
第3章 数据和文件格式标准 106
3.1富文本格式 107
3.2 TIFF文件格式 108
3.2.1 TIFF规范 108
3.2.2 TIFF结构 109
3.2.3 TIFF标记 113
3.2.4关于实现TIFF的问题 117
3.2.5 TIFF类 118
3.3资源文件交换格式(RIFF) 118
3.3.1带有两个子主块的RIFF主块 120
3.3.2表主块 121
3.3.3带有INFO表主块的RIFF波形音频文件格式 121
3.3.4 RIFF MIDI文件格式 123
3.3.5 RIFF DIBS(独立于设备的位图) 124
3.3.6 RIFF调色板文件格式 126
3.3.7 RIFF音频视频交错(AVI)文件格式 127
3.3.8索引主块“idxl” 133
3.3.9 AVI文件的边界条件处理 133
3.4 MIDI文件格式 134
通道消息 135
系统消息 136
3.5静止和运动图像的JPEG DIB文件格式 138
3.5.1 JPEG 静止图像 139
3.5.2 JPEG运动图像 139
带有JPEG DIB的JPEG AVI文件格式 139
3.8 TWAIN 141
3.7 MPEG标准 141
3.6 AVI Indeo文件格式 141
3.8.1 TWAIN规范的目标 142
3.8.2 TWAIN的体系结构 143
3.8.3新的WAVE RIFF文件格式 144
3.8.4设立新的WAVE类型 147
微软ADPCM WAVE类型 148
CCITT标准扩展WAVE类型 150
CVI ADPCM Wave类型 150
Creative实验室ADPCM 151
Dolby实验室AC-2 Wave类型 152
3.10练习 153
3.9小结 153
第4章 多媒体输入/输出技术 155
4.1关键技术问题 155
4.1.1传统输入设备的局限 156
4.1.2显示和编码技术 156
4.1.3分辨率和带宽问题 157
4.1.4多媒体输入和输出设备 157
4.2笔式输入 158
4.2.1笔比鼠标和键盘更优越吗? 159
4.2.2电子笔是如何工作的? 160
电子笔 161
数字化仪 162
笔驱动程序 162
识别器 163
识别上下文管理程序 163
字典 164
显示驱动程序 164
4.3视频图像显示系统 164
4.3.1显示系统要求 164
显示系统技术 166
4.3.2显示性能问题 167
4.3.3视频显示技术标准 167
4.3.4 CRT显示系统 170
显示术语 172
4.3.5平板显示系统 174
4.4打印输出技术 175
4.4.1激光打印技术 176
4.4.2染料升华打印机 177
4.4.3彩色打印机技术问题 178
4.5图像扫描仪 179
4.5.1扫描仪的类型 179
扫描仪格式系数 179
扫描机理和使用问题 180
4.5.2扫描仪的眼睛——电荷耦合器件 181
CCD彩色获取 182
4.5.3图像增强技术 183
4.5.4图像操作 184
4.5.5扫描仪特性 185
4.5.6扫描性能 186
4.6数字语音和音频 186
4.6.1数字音频 186
4.6.2数字语音 187
4.6.3语音识别系统 189
语音识别系统的类型 191
语音识别系统性能 194
语音识别的应用 194
4.6.4乐器数字接口(MIDI) 196
MIDI规范1.0 197
MIDI通信协议 198
4.6.5 MPC规范1.0和2.0 199
4.6.6声音卡体系结构 200
4.7数字相机 203
4.7.1为什么用数字相机? 204
4.8.1视频帧获取卡的体系结构 205
4.8视频图像和动画 205
4.8.2视频和静止图像处理 208
帧内图像处理 210
空间滤波处理 211
帧处理 213
4.8.3图像动画技术 214
4.9全运动视频 216
4.9.1视频摄像机 216
4.9.2全运动视频控制器 217
视频获取卡的体系结构 217
4.9.3全运动视频的性能问题 218
4.10小结 219
4.11练习 220
5.1磁介质技术 221
第5章 存储和检索技术 221
5.1.1硬盘技术和历史 222
5.1.2磁存储密度和等待时间 226
5.1.3磁盘跨接 227
5.1.4 RAID(廉价磁盘的冗余阵列) 228
RAID0层——磁盘划分技术 229
RAID1层——磁盘镜像技术 230
RAID2层——数据位交错技术 231
RAID3层——并行磁盘阵列 233
RAID4层——扇区交错技术 234
RAID5层——块交错技术 235
选择RAID系统的标准 236
磁盘存储在多媒体上的使用 237
适用于AV(音频/视频)的磁驱动器 239
5.2光介质技术 240
5.2.1光存储密度和等待时间 241
5.2.2 CD-ROM 241
CD-ROM的标准 244
5.2.3小型盘(MD) 248
5.2.4 WORM光盘驱动器 249
5.2.5可重写光盘技术 253
磁光技术 253
相变可写式光盘 255
颜料聚合物可写式光盘 255
5.2.6多功能驱动器 256
5.3分层存储管理 256
5.3.1永久与瞬时存储的问题 257
5.3.2光盘库 258
5.3.3分层存储的应用 259
5.4存储系统的高速缓冲存储器管理 260
5.4.1低层次的盘高速缓冲存储 261
5.4.2分层存储系统的高速缓冲存储器结构 265
5.4.3分布式客户机-服务器系统的高速缓冲存储器 268
5.4.4多媒体应用软件如何使用高速缓冲存储器? 269
5.5小结 270
5.6练习 271
6.1专用计算处理器 272
第6章 体系结构与通信 272
6.1.1用户处理芯片 273
6.1.2数字信号处理 273
6.1.3 DSP与传统的体系结构 279
6.2存储系统 279
6.2.1存储器的类型与速度 279
6.2.3存储器的组织 281
6.3多媒体板卡方案 283
6.3.1专用板卡 283
6.4局域网/广域网连接 284
6.4.1以太网 286
6.4.2 FDDI II 287
6.4.3 ISDN(综合业务数字网) 292
6.4.4 Windows的电话接口体系结构 296
6.4.5 ATM 299
6.4.6基于公共网络的广域网 303
6.4.7局域网和广域网设备 305
6.4.8企业级多媒体应用中的局域网和广域网 307
6.5分布式对象模型 308
6.5.1对象连接嵌入(OLE) 308
链接跟踪 311
6.5.2分布式系统对象模型(DSOM) 313
6.5.3公共对象请求代理(CORBA) 313
6.6小结 314
6.7练习 315
第7章 多媒体应用程序设计 316
7.1多媒体应用程序分类 318
7.1.1游戏 319
7.1.2多媒体信息库 319
7.1.3运用机顶系统的交互式电视 319
7.1.4视频/电话会议和超媒体邮件 320
7.1.5共享工作区和运行环境 321
7.1.6业务处理工作流应用程序 322
7.2多媒体系统的类型 323
7.2.1家庭/娱乐系统 324
7.2.2业务系统 324
7.3虚拟现实设计 327
7.3.1人的因素 327
7.3.2多媒体输入和输出 328
7.3.3虚拟现实建模 329
7.3.4虚拟现实设计考虑 330
7.4多媒体系统部件 331
7.4.2多媒体输出系统 332
7.4.3多媒体存储系统 332
7.4.1多媒体输入系统 332
7.5多媒体数据库的组织 334
7.5.1多媒体数据库的特点 335
7.5.2多媒体系统中的数据库管理系统 338
7.6应用程序工作流设计 341
7.6.1文档图像管理系统工作流 341
7.6.2多媒体对象的工作流问题 343
7.7分布式应用程序设计 346
7.7.1网络和通信 347
7.7.2高速缓存管理 348
7.7.3压缩和解压缩 350
7.7.4索引与QC的工作流集成 352
7.7.5注释 353
7.8小结 354
7.9练习 355
第8章 多媒体著作和用户界面 356
8.1多媒体著作系统 357
8.1.1多媒体著作的设计问题 358
8.1.2著作设计方法 361
8.1.3多媒体著作系统的分类 361
8.1.4多源多用户著作系统 365
8.1.5电话著作系统 366
8.2超媒体应用程序设计 368
8.2.1应用程序集成 370
8.2.2通用用户界面和应用程序集成 370
8.2.4分布式数据访问 371
8.2.5超媒体应用程序设计 371
8.2.3数据交换 371
8.2.6信息结构化 372
8.2.7给对象加声音和视频 374
8.3用户界面设计 374
8.3.1应用程序中的导航 375
8.3.2设计用户界面 376
8.3.3多媒体应用程序的专用模拟 376
组织者(organizer)模拟 377
电话模拟 378
听觉用户界面 379
VCR模拟 379
8.3.4音频/视频索引功能 380
8.4信息访问 381
8.5.1图像显示 382
8.5.2音频质量 382
8.5对象显示/播放问题 382
视频帧交错 383
场景变化帧检测 383
8.5.3视频播放的特征 383
视频比例缩放、摇镜头和变焦 384
6.3.2多功能卡 384
8.5.4三维对象显示和虚拟现实 385
8.6小结 386
8.7练习 386
第9章 超媒体消息系统 387
9.1可移动消息传送 387
9.2超媒体消息部件 388
9.2.1文本消息 389
9.2.2 Rich-Text(富文本)消息 390
9.2.3语音消息 390
9.2.4全运动视频管理 391
9.3超媒体链接和嵌入 393
9.3.1超文本文档中的链接 393
9.3.1链接和嵌入:定义 394
9.4创建超媒体消息 395
9.5集成多媒体消息标准 396
9.5.1与厂商无关的消息 396
9.5.2 MAPI支持 398
9.5.4 X.400消息处理服务 399
9.5.3电话API 399
9.5.5 X.500目录系统标准 401
9.5.6 Intetrnet消息 402
9.6集成文档管理 403
9.7小结 404
9.8练习 404
第10章 分布式多媒体系统 405
10.1分布式多媒体系统的组成 405
10.1.1应用软件 407
10.1.2文档存储 407
10.1.3图像和静态视频存储 408
10.1.4音频和全运动视频存储 408
10.1.6部件服务代理 409
10.1.5对象目录服务代理 409
10.1.7服户界面服务代理 410
10.2分布式客户机—服务器操作 410
10.2.1分布式工作组计算中的客户机 411
10.2.2分布式工作组计算中的服务器 412
10.2.3数据库操作 412
10.2.4分布式成组计算中的中间件 413
10.3多媒体对象服务器 413
10.3.1多媒体服务器的类型 414
10.3.2多媒体服务器的大容量存储 416
WORM光盘 417
光盘库 418
10.3.3多媒体对象服务器的网络拓扑结构 418
可重写式光盘 418
10.4多服务器网络拓扑结构 419
10.4.1传统的局域网 420
10.4.2扩展的局域网 420
10.4.3高速局域网 423
10.4.4广域网 424
10.4.5网络性能问题 427
10.5分布式多媒体数据库 427
10.5.1多媒体应用程序的数据库组织 428
10.5.2多媒体系统的事务管理 429
10.5.3将超媒体记录当作对象来管理 431
10.6处理分布式对象 434
10.6.1服务器间的通信 434
10.6.2对象服务器结构 435
10.6.3对象识别 438
10.6.4对象修改管理 440
10.6.5优化对象的网络定位 441
10.6.6对象目录服务 442
10.6.7多媒体对象检索 443
10.6.8数据库复制(replication)技术 445
10.6.9对象转存方案 449
10.6.10优化对象存储 451
10.7小结 452
10.8练习 453
第11章 系统设计:方法与依据 454
11.1基本设计问题 457
11.1.1关键的交付结果 457
11.2.1技术评估 458
11.2确定企业需求 458
11.2.2业务信息模型 459
11.3检验当前的体系结构和可行性 460
11.4性能分析 461
11.4.1性能分析与监测 462
11.4.2设计中影响性能的问题 463
11.5性能设计 464
11.5.1存储管理 464
11.5.2访问管理和存储分布优化 465
11.5.3最大化网络传输 468
11.5.4系统性能管理 469
11.6多媒体系统设计 470
11.6.1系统设计方法 470
11.6.3面向对象多媒体系统 471
11.6.2设计系统对象 471
11.6.4设计对象 472
11.6.5系统设计分析 475
11.7系统可扩展性 476
11.8小结 476
11.9练习 476
第12章 多媒体系统设计实例 478
12.1确定企业需求 479
12.2 IFC的业务模型 479
12.3 IFC的业务信息模型 480
12.3.1应用程序功能需求一览 481
12.3.2客户与经纪人的责任 482
12.3.3应用程序提供的功能 483
12.3.4应用程序数据 486
12.4体系结构建议和技术可行性 488
12.4.1体系结构建议 488
12.4.2存储需求与技术可行性 489
12.5对象建模 492
12.6分析性能需求 492
12.7设计考虑 492
12.8设计存储分布 494
12.9优化网络传输 495
12.10小结 495
12.11练习 495
多媒体术语表 497
参考文献 511