صفحه 1:
نوان اراثه : ae
عنوان ار فشرده سازى صوت
ارائه دهنده :
زیر نظر استاد راهنما :
۳ >
صفحه 2:
فشرده سازی صوت
صفحه 3:
كوانتيزه كردن
- فواصل ثابت
- مستقل از دامنه
* غير ذ
7 فواصل متغیر
فواصل در دامته های بالا
صفحه 4:
مدولاسیون داده
به جاى كد کردن دامنه واقعی فقط افزایش یا کاهش را به کمک
Coding: 1 = increasing signal
0 = decreasing signal
ضيه
صفحه 5:
هس۳۳ ۳00
OPPerectiadt POO = OPCO *
* تفاضل دامنه فعلی با دامنه قبلی توسط بیت های
کم
®OPCO *
Ockwive DPPerectd PCO *
- بخش هاى ساكت 2 بيت كمتر
7 بخش های شلوغ بيت بيشتر
صفحه 6:
فشرده سازی به روش »)مرو
حذف بخش های غیر قابل شنود
* تاتیرات ماسکها
7 یک سیگنال با دامنه زیاد سیگنالهای کم دامنه مجاور
خود را ماسک میکند
صفحه 7:
Masking
Threshold
kHz
500 Hz
Masker
صفحه 8:
OPEG 0
فشرده سازی:
۰۶۴۰۳۲۳ ۱۳۸۰۹۶ ,۱۷ ۱۹۲ کیلو بیت درتانیه
* کانالها:
- تك بائد (مم )
- دو بائد مستة
- استريو مشترک مس وول
0 4 >
صفحه 9:
OPEG 0
۰ نرخ نمونه برداری :
- 9602
42۴۴۰۱
2۴۸
* هر نمونه به صورت ۱۶ بیتی
* حداکثر تاخیر در گدگذاری و کدگشایی : ۸۰ میلی
ثانیه
۰ استفاده از لح مطلمروظ) در کوانتیزه کردن
صفحه 10:
Encoder ISO/MPEGIAUDIO
Digital Audio Bitstream
Signal (PCM)
Tine!
Frequency
Mapeina
‘Quantizer
and
Coding
Packing
Psychcacoustic|
Model
Decoder
Digital Audio
Signal (PCM)
ISOMPEG/AUDIO
Bitstream
Frequency!
Reconstruction] Time
Mapping
Frame
Unpacking
ao
صفحه 11:
تاریخچه 0۳۹
CProunkoPer TIestitut *
- موسسه تحقیقاتی ( کشور آلمان )
7 بکارگیری خواص شنوایی انسان برای فشرده سازی
صوت
* استاندارد -۱80»
* حداکتر ضریب فشرده سازی برابر با ۱۲
* 18660 کلیاترا بیانکرده
جزئیات وابسته به نحوه پیاده سازی
جز 44 ۳
صفحه 12:
لایه های صوت در OPEG
bb Crave *
۴ شامل ۳۸۴ نمونه
Said Gub-Bucd PP oy bg 40 این نمونه های
Sto 0.58 lado sub-bucd IC براى هر
صفحه 13:
12 ۰ 12 2
samples: samples samples
2s an di
اک وک و
| samples samples!
8 pres
مدب حب ا با 3 sband filter
Audio / (fw) subband filter 2 12 12 1
samples in بت سر samples!samples samples
Soa Gina ers eS
سبلب بسا
\ 12 12 12
ples’ معا هو samples
subband filt
صفحه 14:
لایه های صوت در 02۳0۶8
* لایه ۱: ماسک کردن فرکانس
<- استفاده از فیلتر MOT
7 بررسی فقط یک فریم
* لایه ۲ : ماسک موقتی
7 سه فریم ( قبلی . فعلی ؛ بعدی )
شبیه سازی شنوایی انسان
5 <>
صفحه 15:
لایه های صوت در 02۳0۶8
* لایه ۳ : ماسک غیرخطی :
- فرکانس ها به باندهایی باپهنای متفاوت تقسیم میشوند
7 کانالهای استریو به صورت تفاضلی کدگذاری میشوند
- فشرده سازی ضرایب به روش هافمن
ع 4 ©
صفحه 16:
* حساسیت کوش انسان
3 16
Threshold in Quiei
3 77
Frequency (klix)
8
40
30
20
te
6
صفحه 17:
58 <>
لایه ۱
ات ماسک فرکانس
- یک سیگنال با فرکانس ,16 (قرکانس ماسک ) تولید میکنیم سپس سیگنالی با فرکانس
نزدیک به آن مثلا ,001 و با شدت کم تولید میکنیم دامنه این فرکانس را به تدریج
افزايش ميدهيم تا شنيده شود
Masking by J kElz tone
80
60
40 ۱ ue
20 Ne yt
0 يا a SS
0 2 4 6 8 10 120 #6
Frequency (عالا)
صفحه 18:
١ لايه
فشرده سازی
* سیگنال اصلی به ۳۲ باند اصلی تقسیم میشود ۰۳۱) ل<)
تواند توسط باتدهای مجاور ماسک شود .
=
Bitstream
4
ourpur
Allocate
Bits
برای هر باند رویه ماسک تعریف میشود که نشان میدهد کدام سطح از
7 Filter in
Ro]. ۱
37") Critical Bands
Compute
لما
Masking
6
صفحه 19:
لایه ۱
الگوریتم :
۱ محاسبه انرژی در هر Sob
۲ _ اگر انرژی آن کمتر از انرژی باند مجاور است آن را کدگذاری
نکن
درغیراینصورت باند را کدگذاری کن
ضرایب را کوانتیزه كن
بر کوانتیزه را به گونه ای انتخاب کن که خطای آن کمتراز
فاکتور ماسک باشد ( هر بیت کوانتیزه معادل 6۰۳ است)
bat
صفحه 20:
مثال
سطوح مربوط به ۱۶ باند ازبین ۲۳۲ باند اول
Band 1 23 4 5 م4 9 10 11 12 13 14 15 6
0۱60 35 20 15 2 3 5 3 1
level 0 81210 6 2
585 <>
صفحه 21:
لابه ۲ - فشرده سازی
۱0 cl
- 0 سم : یکسدایقووک ه ناگهانقطع ميشود
- آزمایش :یک سیگنال قوی مثلا :000 با فرکانس </1۲) پخش میشود همراه با آن
یک سیگنال ضعیف :4*08 با فرکانس 11,۶ 1.106) پخش میکنیم ( این سیگنال
ماسک میشود)
- با قطع سیگنال تست برای مدت زمان مشخضی سیگنال ضعیف نیز شنیده نميشود.
40
test tone
R40
20
SW a 30 Tia 6 500-
delay time (ms)
> 4۹ د
صفحه 22:
لایه ۲ - فشرده سازی
* آزمایش بالا را با فرکانسهای مختلف تکرار میکنیم
level (dB)
Maskigg tone
320007 (under curve)
صفحه 23:
لایه۲- فشرده سازی
مشابه با لایه ۱ از این امکان برای ماسک فریم های
مجاور استفاده میکنیم
* برای سادگی کار فرش میکنیم که این ماسک فقط
میتواند بردی به اندازه یک فریم داشته باشد
صفحه 24:
لایه ۳ - تاثیر ات عاصمه) سوم
دقت تشخیص شنوایی انسان با افزايش فرکانس
کاهش می یابد
در لایه ۱و ۲ طیف فرکانسی به ۳۲ فریم با اندازه
های یکسان تقسیم شد
در لایه سوم فرکانس ها به روش غیرخطی تقسیم
میشوند
به گونه ای که میزان خطای شنوایی در همه باند ها
یکسان باشد
ow 44 جز
صفحه 25:
۳ لایه
Owk *
* بركرفته از نام موص داه 8)
ply Oak SS * با عرض يك باند حياتى 0-1©) ادج1() است
For frequencies < 500 Hz: 1 Bark = f/100.
For frequencies > 500 Hz: 1 Bark = 9+4 log(f/1000)
59 4۹ >
صفحه 26:
لایه ۳ - آستانده های موجود در
باندهای حیاتی
8۶
ول 4 dis ل | 30
2۰ ۶ 500
0 3 10 5
Critica! Band Rate (Bark)
صفحه 27:
لایه ۳
این لایه به سیستم شنوایی انسان نزدیکتراست
چراکه از 0) ها برای تقسیم بندی فرکانس
استفاده میکند
علاوه بر ماسکهای پوششی و موقتی در لایه های ۱ و
۲ در لایه سوم از کدگذاری تفاضلی برای ضرایب و
نیز کدگذاری هافمن جهت فشرده سازی آنها
استفاده ميشود
صفحه 28:
کدگذاری گفتار
* روش های تخصص یافته
* حجم کم
* فرکانسهای گفتار
- هو تاه ۳۴۰ هرتز
۴ کدگذاری پیشگوی خطی LPO
صفحه 29:
صفحه 30:
وجلو 2 حرشفه۷<) مورا
شبیه سازی آناتومی انسان
* اتصال لوله هایی با ضخامت های متفاوت
له
rofl(t]
ات
tubo 4 tubo 2. tubep
ع 4 =
صفحه 31:
وجلو 2 حرشفه۷<) مورا
امواج صوتی توسط تارهای صوتی تولید میشوند
1 اين اموا ج در لوله هایی با ضخامت های مختلف
در هر تغییر قطر بخشی از موج بازگردانده ميشود
میزان این انعکاس توسط ضرایبی تعیین شده است
* بنابراین تولید گفتار وایسته به گوینده فقط با
تعيين این ضرایب امکانپذیر است
5 4۹ >
صفحه 32:
صصح 2 ثرا
سیگنال صوتی oy بخش های کوچکی oy اندازه ۰ ۲
تا »۳ میلی تانیه تقسیم میشود
برای هر فریم [<. تعداد ۳) وزن تعیین میکنیم
[-س]سا.....,[]س,[0]ت۷ _ که [< تقریبا برابر
خواهد بود با :
* اه[ س]ص+....+[صا] مخ[ ]سا
معمولا م بین ۸ تا ۱۴ انتخاب مشود
جز 44 و
صفحه 33:
صصح 2 ثرا
* سیگنال اولیه با سیگنال بازسازی شده مقایسه
ميشود
* اختلاف موجود بین دو سیگنال محاسبه شده
ضرایب اصلاح می شوند
صفحه 34:
wd & شما صله
با تشکر 3 w
بای وی
ینجانب را همراهي Maga دع ۴
0
صفحه 35: