行业新闻

什么是语音芯片|语音芯片的界说

颁布日期：2018-05-22

什么是语音芯片 / Voice IC是什么 / 语音芯片的界说

语音芯片直观的从名称上来看,就是与语音有关的芯片,语音就是存储的电子声音,凡是能发出声音的芯片,就是语音芯片,俗称声音芯片,英文正确些来说应该是Voice IC.

在语音芯片的各人庭中,凭据声音的类型分歧可分为语音IC(Speech IC)和音乐IC(Music IC)两种.这儿应该算是语音芯片有效的分辨步骤.

日常生涯中,语音芯片利用场所和行业分歧,又被各人分为玩具芯片(玩具行业使用的,如AC80E5),门铃芯片(AC8DM32),OTP语音芯片(AC8040),童谣IC(AC8DE12), 童车IC等等.当然这种分类里面她也同时存在着语音IC(Speech ic)和音乐IC(Music IC) .

语音芯片有凭据IC自身的物理结构的多个通路(同时发出多个通路的声音)可分为多种类型:

一, 单通路的:

1, 单通路的语音IC(Speech IC)(这种语音芯片不支持音乐IC音乐存储方式); 常见的语音IC是单通路的语音芯片,AC8020-OTP20秒和AC83E12动物叫声是典型的单通路语音芯片了,

2, 单通路的音乐IC(Music IC),统一单元功夫内只能发出一种音乐的音乐IC, 电子声音文件是只有一个通路的.Mid后缀文件.

常说的单音片,是一种根基的音乐IC,由一按功夫内音符输出的几多,决定了单音片的成效,有64音符多,128音符等等. 单音片利用场所广,价值极其便宜,常见的有单音片有生日欢乐贺卡单音片.典型的有AC8SE07等

严格的说,单通路的音乐IC和单音片的两者结构是不一样的

二, 2通路:

1, 2通路的语音IC, 2通路和多通路的语音芯片,现实利用中语音播放时通常会按划定固定在某一通路内进行声音的播放(等同于单通路),但是这类产品比单通路的语音IC(Speech ic)成本要高,价值会高些,语音芯片厂家在设计时为了平衡产品价值和利用,通常来说,职能支持和声音成效方面城市做得更优良一些.

这种结构也许是由于产品和规划现实利用领域和价值所决定的, 语音芯片输出通常都是单通路的声音输出,支持立体声的产品很少, 要高端一些的产品就要选MP3主控芯片之类的规划了

2, 2通路的音乐芯片, 通俗叫法是双音片(Music With Dual Tone IC), 故名思义,统一单元功夫内二个通路都能够发出音乐的音乐IC. 电子声音源文件通常为.Mid的二通路文件.常见的圣诞系列音乐IC如:AC8DC12.

这里得多补充两句,市面上还有一个叫melody的音乐芯片,她是个什么界说呢?单一的来说,比单音片的成效要好比和弦音乐芯片的成效要差的一种音乐芯片,所以双音片也有被叫成是melody音乐芯片,melody结构应该来说是一种更好的单音片,或者能够说是二倍成效的单音片.

三, 4通路,8通路或以上:

三通路以上的声音.又称为和弦音乐.常说的4和弦音乐IC就是指4通路的音乐IC...

通常多通路的语音芯片都是同时支持音乐IC(Music IC)和语音IC(Speech IC)职能的.

怎么分辨有没集成MCU的语音芯片

先看MCU(Micro Controller Unit)的界说，又称单片微型推算机(Single Chip Microcomputer)，是指随着大规模集成电路的出现及其发展，将推算机的CPU、RAM、ROM、按时数器和多种I/O接口集成在一片芯片上，形成芯片级的推算机。

语音芯片有两种,一种是集成MCU的,如AC4060,AC5080可编程OTP系列,职能比力壮大,从物理结构上单一的说,它集成了RAM(随机存储器和按时计数器等)和ROM两种存储器。而另一种是不集成MCU的,它内部只有一个ROM(不具体运算和随机存储计时器等一些职能),如AC9020,AC8040,AC3030系列芯片,但是价值会相当便宜一些.

单逐一些的说吧,有RAM的OTP语音芯片是集成MCU的,由于RAM随机存储器的个性,让芯片能实现更多复杂的职能。

凭据语音芯片的物理个性的界说:

语音芯片是将语音信号通过声音采样转化为数字信号，存储在芯片的ROM中，再通过电路将ROM中的数字信号还原成语音信号的集成电路。

通例语音芯片的语音信号输出方式有两种：脉冲宽度调造(PWM）输出和数模转换输出（DAC）。

脉冲宽度调造(PWM）输出，是利用微处置器的数字输出来对仿照电路进行节造的一种极度有效的技术。其相对于DAC输出，其特点是利用广、成本低。是玩具行业重要的声音输出利用方式。

数模转换输出(DAC)：通常语音芯片是指单独拥有放音职能的集成电路，内容上是一个DAC过程，而ADC过程资料是由电脑实现，其中蕴含对语音信号的采样、压缩、EQ等处置。

ADC=Analog Digital Change 模数转换

DAC= Digital Analog Change 数模转换

音质的曲直取决于ADC和DAC位数的几多。有的ADC和DAC均为32bit,靠近真人音质。而有的ADC和DAC为16bit，靠近CD音质。而一些通常的DAC为8bit，为通常音质。

灌音芯片蕴含ADC和DAC两个过程，都是由芯片自身实现的，蕴含语音数据的采集、分析、压缩、存储、播放等步骤。

2、语音信号的量化表述：（分类：语音IC 和音乐IC）

a) “语音IC”介绍：

（1）语音信号的量化

采样率（f）、位数（n）、波特率（T）

采样：将语音仿照信号转化成数字信号。

采样率：每秒采样的个数（byte）。

波特率：每秒钟采样的位数(bit)。波特率直接决定音质。Bps: bit per second

采样位数指在二进造前提下的位数。通常在没有出格注明的情况下，声音的采样位数指8位，由00H--FFH，静音定为80H。丽江市环芯半导体有限公司

（2）采样率

耐奎斯特抽样定理：要从抽样信号中无失真地恢复原信号，抽样频率应大于2倍信号高频率。抽样频率幼于2倍频谱高频率时，信号的频谱有混叠。抽样频率大于2倍频谱高频率时，信号的频谱无混叠。

嗓音的频带宽度为20～20K HZ左右，通常的声音或许在3KHZ以下。所以，通常CD取的音质为44.1K和16bit，若是际遇某些出格的声音，如涝祺，音质也有效48K和24bit的情况，但不是主流。

通常在我们处置针对通常语音IC的时辰，采样率高达到16K就够了、措辞声通常取8K（如电话音质）、6K左右。低于6K成效比力差。

在利用单片机的过程中，采样越高，按时器中断速度越快，会影响到其他信号的监控和检测，所以要综合思考。

（3）语音压缩技术。

由于语音数据量重大，对语音数据进行有效压缩是很必要的，可能使我们在有限的ROM空间里录入更多的语音内容。有以下几种方式：

语音分段：将语音中能够沉复的部门截取出来，通过分列组合将内容齐全地回放出来。

语音采样：通常我们使用的喇叭频响曲线在中频部门，较罕用到高频，所以，在喇叭音质能够接受的情况下，适当降低采样频率，达到压缩成效，这种过程是不成逆的，无法恢复原貌，叫有损压缩。

数学压缩：重要是针对采样位数进行压缩，这种方式也是有损压缩。例如，我们时时选取的ADPCM压缩体式，是将语音数据从16bit压缩到4bit，压缩率是4倍。MP3是对数据流进行压缩，涉及到数据预测问题，它的波特率压缩倍率为10倍左右。

通常，以上几种压缩方式都是综合起来使用的。

（4）常用语音体式

PCM体式： Pulse Code Modulation 脉冲编码调造，它将声音仿照信号采样后得到量化后的语音数据，是根基原始的一种语音体式。同它极为类似的还有RAW体式和SND体式。它们都是纯语音体式。

WAV体式：Wave Audio Files 是微软公司开发的一种声音文件体式，也叫波形声音文件，被Windows平台及其利用法式宽泛支持。WAV体式支持很多压缩算法，支持多种音频位数、采样频率和声路，但WAV体式对存储空间需要太大不便于互换和传布。WAV文件里面存放的每一块数据都有自己独立的标识，通过这些标识能够通知用户到底这是什么数据，这些数据蕴含采样频率和位数，单声路(mono)还是立体声(stero)等；沸居镆粜酒琁C

ADPCM体式：是利用对从前的几个抽样致反预测当前输入的样值，并使其拥有自适应的预测职能与现实检测值进行比力，随时对测得的差值自动进行量化级差的处置，使之始终维持与信号同步变动。它合用于语音变动率适中的情况，并且声音回放过程简短。它的利益是对于人声的处置比力真切，通常达到90％以上，已宽泛地利用于电话通讯领域。

MP3体式： Moving Picture Experts Group Audio Layer III，简称为MP3。它是利用 MPEG Audio Layer 3 的技术，采取了名为“感官编码技术”的编码算法：编码时先对音频文件进行频谱分析，而后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散分列，后形成拥有较高压缩比的mp3文件，并使压缩后的文件在回放时可能达到较靠近原音源的声音成效。它的内容是vbr（Variant Bitrate 可变波特率）能够凭据编码的内容动态地选择相宜的波特率，因而编码的了局是在保告白法证了音质的同时又关照了文件的大幼。

mp3压缩率10倍甚至12倍。是初出现的一种高压缩率的语音体式。

Linear Scale体式：凭据声音的变动率大幼，把声音分成若干段，对每段用线性比例进行压缩，但是它的比例是可变的。SUNLINK公司和ALPHA公司的Linear Scale体式为5bit。

Logpcm体式：根基上对整个声音进行线性压缩，将后若干位去掉。这种压缩方式在硬件上很容易实现，但音质比Linear Scale差一些，出格是音量较幼声音比力细腻的情况下成效较差。重要用于pure speech方面。

（b）“音乐IC”介绍：

（1）音乐的通路与音色：

包络（envelope）方波(patch) 通路（channel）

包络：合成音色的一部门，单元功夫内音符输出的变动，常见佑装ADSR”

方波：合成音色的一部门，单元功夫内音符方波电流的变动。（另见三角波等）

通路：在统一功夫内，IC输出的多音符个数，即“单音涝祺”的个数。

PCT：仿照音色的一种，通过采样256个点的涝祺声音来仿照出各个音符的音高。(音色柔和，占空间幼，但不够真实)

FULL WAVE：通过采集一种涝祺声音来仿照各个音符音高。（涝祺声真实，但占用空间大，且采集音色音质要求高）

（2）音乐的压缩：

由于音乐数据量重大，对音乐数据进行有效压缩是很必要的，可能使我们在有限的ROM空间里录入更多的音乐内容。有以下几种方式：

音乐分段：将音乐中能够沉复的部门截取出来，通过分列组合将内容齐全地回放出来。

音色：凭据音乐的饱满水平、需要水平，来确定Full wave，PCT、dual tone的选择，各个音色占用空间分歧，音色质量也分歧。。

数学压缩：重要是针对采样的音色（Full wave）进行压缩，这种方式也是有损压缩，对于要采集的音色进行降采样、处置等减幼采集音色的大。ㄍ镆衾嗟慕ㄒ簦。

（3）常用音乐体式：

MID体式：MIDI(Musical Instrument Digital Interface)涝祺数字接口，是20 世纪80 年代初为解决电声涝祺之间的通讯问题而提出的。MIDI 传输的不是声音信号, 而是音符、节造参数等指令。

WAV体式：（相见语音IC类介绍）采集音色的体式。

3、语音ROM空间的表述

语音芯片为表述的形象化，由语音长度来暗示

a)通常语音芯片以6K采样率为语音长度推算尺度。

b)灌音IC以4K采样率为语音长度推算尺度(以AC6006,AC6009,AC6012为例)。

即：以6k（4k）采样率芯片能够播放的长度。

4、语音芯片的身分

一样种类的芯片成本与芯片的大幼成正比。

a)I/O口的分配和ROM的大。ㄓ镆裘胧┚龆ㄐ酒杀。低秒数语音芯片其I/O口较少。

b)音质提高，采样提高，语音秒数缩短。

音质降低，采样降低，语音秒数变长

c) 语音秒数的推算步骤：M/(n*f)

M---ROM大。╞it） n*f---波特率

实用的推算语音芯片傻瓜推算方式, 音乐IC和语音IC是分歧的哦 : -_-

语音IC的秒数=ROM(bit)除以/10(工业算法尺度)＝Byte(理论上是除以8)/再除以3＝语音芯片的秒数，好比512kbitROM/8/3＝21秒左右,芯片的内部压缩比分歧，秒数长短稍有误差，以上算法是以6K采样率为基准的。

音乐IC的秒数=ROM(bit)除以/除以3＝音乐IC的秒数，好比512kbitROM/3＝210秒左右,芯片的内部压缩比分歧，秒数长短稍有误差。

5、常见声音处置软件:

1）SoundForge , 职能壮大的声音处置软件，上手稍难一些

2）Cooledit，职能壮大的画图声音处置软件，上手容易

3）goldwave，职能壮大的声音处置软件

4）Cakewalk，用于MID音乐文件图形化编纂的处置软件

上一条：几种音频体式的比力没有下一条

有关新闻

导航栏目

公司新闻

行业新闻

科技创新

新闻中心

联系AG真人国际

联系人：李曙光

手机：17266260250

邮箱：Lur@yxin18.com

公司：昭通悦欣电子科技有限公司

地址：昭通市花都区贸易大路334号