في أي شكل من الأفضل الاستماع إلى الموسيقى. ثلاثة حيتان ضياع
في أي شكل من الأفضل الاستماع إلى الموسيقى. ثلاثة حيتان ضياع
Anonim

إن فهم تنسيقات الصوت الرقمي ليس بالأمر السهل على الإطلاق. بل إنه من الصعب للغاية التوصل إلى نتيجة لا لبس فيها بشأن التنسيق الأفضل للاستماع إلى الموسيقى. إذا نظرت إلى الجدول المقارن لتنسيقات الصوت في ويكيبيديا ، فستبدأ عيناك في التموج بأعمدة الأرقام الصامتة. دعنا نحاول معرفة ما وراء ذلك.

في أي شكل من الأفضل الاستماع إلى الموسيقى. ثلاثة حيتان ضياع
في أي شكل من الأفضل الاستماع إلى الموسيقى. ثلاثة حيتان ضياع

دعنا نحجز على الفور أن المقالة تتحدث فقط عن الخصائص العامة ولن تتضمن بعض التفاصيل. في المستقبل ، ستجري Lifehacker أبحاثها المحايدة. واليوم سنحاول تعميم التجربة المعروفة بالفعل بطريقة أو بأخرى.

هناك تناظرية وشكل.

النظير جيد ، لكنه قصير العمر وغير مريح. لذلك ، فإن الوسائط التناظرية ، على الرغم من ارتفاع مبيعات الفينيل ، لن تعود.

يمكن أن يتكون الصوت الرقمي من ثلاثة أنواع رئيسية:

  • بتنسيق لا يستخدم الضغط ؛
  • بتنسيق يستخدم ضغطًا بدون فقدان البيانات ؛
  • بتنسيق يستخدم ضغطًا مع فقدان البيانات.

للوهلة الأولى ، تعتبر التنسيقات غير المنقوصة أكثر واعدة. ليس هذا هو الحال دائمًا ، حيث سنناقش بمزيد من التفصيل في إحدى المواد التالية. التنسيقات غير المضغوطة لا معنى لها بخلاف تخزين التسجيلات الرئيسية اللازمة لإنشاء محتوى صوتي. من الأسهل استعادتها. لا داعي لتخزين التسجيلات المنزلية والاستماع إليها.

من بين العديد من معلمات الصوت الرقمي ، يجب أن يهتم المستخدم أولاً وقبل كل شيء بتردد أخذ العينات (دقة رقمنة الإشارة التناظرية في الوقت المناسب) ، وعمق البت (دقة الرقمنة في السعة - جهارة الصوت) ، ومعدل البت (مقدار المعلومات الواردة في الملف في الثانية).

اليوم سوف نتحدث عن الضياع.

بالنسبة للصوت المضغوط ، فإن مفهوم النموذج النفسي الصوتي مهم جدًا - أفكار العلماء والمهندسين حول كيفية إدراك الشخص للصوت. تدرك الأذن النطاق الكامل للموجات الصوتية التي تصل إليها. ومع ذلك ، فإن الدماغ يعالج الإشارات.

تتراوح القيمة المرجعية للنطاق المسموع لدى الإنسان من 16 هرتز إلى 20 كيلوهرتز ، لكنه غير قادر على سماع جميع الأصوات الواردة وإدراكها في نفس الوقت.

السمع منفصل وحساسيته السمعية غير خطية.

تعمل النماذج الصوتية النفسية الحديثة على تقييم السمع البشري بدقة وتتحسن باستمرار. في الواقع ، على الرغم من تأكيدات عشاق الموسيقى والموسيقيين وعشاق الصوت ، بالنسبة للأذن المتوسطة غير المدربة ، أصبح المظهر الأولي لـ MP3 بأقصى جودة ممكنة للغاية. هناك استثناءات لا يمكن إلا أن توجد. لكن لا يمكن ملاحظتها دائمًا بسهولة من خلال الاستماع الأعمى.

التنسيقات باستخدام نماذج الضغط النفسي الصوتي

هناك الكثير من هذه التنسيقات لضغط الصوت مع فقد الصوت. الأكثر شيوعًا اليوم هي ما يلي.

OGG (فوربيس)

بشكل عام ، الملف ذو الامتداد *.ogg هو "حاوية": يمكن أن يحتوي على العديد من التسجيلات الصوتية بعلامات وسمات خاصة به. في أغلب الأحيان ، يتم ضغط الملفات المخزنة فيه باستخدام برنامج ترميز Ogg Vorbis ، على الرغم من إمكانية استخدام ملفات أخرى ، بما في ذلك MP3 أو FLAC.

تشمل مزاياها الرئيسية مجموعة واسعة من المعلمات الممكنة أثناء التشفير: يمكن أن يصل معدل أخذ العينات الصوتية إلى كيلوهرتز 192 ، وعمق البت 32 بت. بشكل افتراضي ، يستخدم OGG معدل بت متغير (على الرغم من أن هذا لا يظهر في عرض الخصائص) ، والذي يمكن أن يصل إلى 1000 كيلوبت في الثانية.

MP3

على عكس OGG المجاني ، تم تطوير MP3 من قبل Fraunhofer Society ، وهي جمعية من المعاهد الألمانية للبحوث التطبيقية ، وهو أمر مهم جدًا للصوتيات الحديثة. بالمناسبة ، هذا مكتب محترم للغاية بين عشاق الموسيقى ، لكنهم لا يحبون الاعتراف به. لكن تطوراتهم تراقب عن كثب.

على عكس OGG ، يمكن أن يكون لها معدل بت متغير (VBR) وثابت (CBR). بالمناسبة ، بفضل MP3 تم اكتشاف أنه لا يمكن ترميز كل تسجيل بجودة عالية مع معدل بت متغير (انظر الأسباب أعلاه ، قد تختلف خوارزميات التشفير ونتائجها في هذه الحالة عند ترميز نفس المصدر).

نظرًا لعمرها المتقدم ، فإن MP3 له قيود كبيرة: يمكن أن يكون عمق البت 16-24 بتًا ، ويتم التعبير عن تردد أخذ العينات فقط بقيم منفصلة (8 ، 11 ، 025 ، 12 ، 16 ، 22 ، 05 ، 24 ، 32 ، 44، 1، 48) ، معدل البت يقتصر على 320 كيلو بت في الثانية. بالإضافة إلى ذلك ، في الإصدار العادي من MP3 ، يقتصر عدد القنوات على قناتين.

AAC

نفس أشعل النار ، فقط في الملف الشخصي. تم تطويره أيضًا من قبل جمعية فراونهوفر. فيما بعد ويستخدم نموذجًا نفسيًا صوتيًا مختلفًا أكثر حداثة. تتيح لنا المعلومات المتاحة للجمهور أن نستنتج: نعم ، لقد تمكنوا من تحسين إبداعهم.

حتى مع وجود أبسط الأرقام ، فإن تنسيق AAC هو تنسيق أكثر مرونة. يتراوح عمق البت للملفات التي تم الحصول عليها بمساعدة هذا التطوير من 16 إلى 24 ، كما أن تردد أخذ العينات ، إذا رغبت في ذلك ، سيسمح أيضًا بعدم فقد الصورة الصوتية ويقع في نطاق 8-192 كيلو هرتز. يقترب دفق البيانات عمومًا من التنسيقات غير المفقودة (حتى 512 كيلو بت في الثانية) ، بينما يصل الحد الأقصى لعدد قنوات ملفات AAC إلى 48.

الشكل الذي هو بالتأكيد الأفضل

بالنظر إلى أن AAC هي MP3 أعيد تصورها بعد اثني عشر عامًا ، فإن الخيار لصالحها. إذا رغبت في ذلك ، فمن المنطقي مقارنة MP3 و OGG فقط. دعنا نلقي نظرة على الصور التي التقطها أندري أسبيدوف المحترم من ixbt.com:

1
1

على الرسوم البيانية - قرص صوتي جيد ، OGG مضغوط بمعدل بت متغير 350 كيلو بت في الثانية و MP3 باستخدام Lame. كلما انخفض الرسم البياني ، كلما اقترب الصوت من الصوت الأصلي. لقد اتضح أنها صورة شيقة للغاية. على الرغم من حقيقة أن MP3 قد خفض بوضوح الترددات العالية ، على عكس OGG ، حيث يمكنك رؤية الانسداد أقل من 2 كيلو هرتز.

2
2

لا يتحدث توزيع التردد والوقت للصوت عن أشياء أقل إثارة للاهتمام. عند معدل بت ثابت يبلغ 320 كيلو بت في الثانية ، تكون MP3 مطابقة تقريبًا للتسجيل الأصلي. يبدو أن كل شيء يسير في مكانه الآن. لكن … في الواقع ، كل شيء أكثر إرباكًا.

لماذا استخدام ضياع على الإطلاق عندما يكون هناك ضياع متاح

الفطرة السليمة.

الحقيقة هي أن معظم التسجيلات التناظرية لا تحتوي على كمية المعلومات التي يجب تخزينها بتنسيقات عالية الجودة. لا تنس أن معدل أخذ العينات الأصلي للقرص المضغوط هو 44.1 كيلوهرتز ، والتكمية هي 16 بتة فقط.

توضح الرسوم البيانية السابقة الدقة العالية لنقل MP3 جيدًا. ولكن بالنسبة لشريط كاسيت صوتي ، شريط مغناطيسي (ما لم يكن ، بالطبع ، هذا شريط رئيسي) ، فإن خصائص AudioCD لا يمكن تحقيقها. وبالنسبة لمعدات الاستوديو الشامل ، ظهرت القدرة على تسجيل الصوت التناظري المطابق لـ AudioCD مؤخرًا نسبيًا. لا جدوى من الرقمنة في FLAC (والأكثر من ذلك في WAV) تسجيل حفلة موسيقية أو قرص من عصر ما قبل الرقمي ، خاصة تلك المصنوعة من الوسائط المغناطيسية. لا تحتوي على تلك الأطياف وكمية المعلومات التي يمكن تخزينها بواسطة الحاويات بدون ضغط.

ما الذي تغير اليوم

يقوم مهندس صوت نادر بعمل تسجيل رئيسي رقمي (يتم إعادة إنتاجه بعد ذلك على وسائط مادية) ، باستخدام التقنيات الحديثة على أكمل وجه. لذلك ، فإن احتمال أن يكون مسار 24 بت 16 بت فقط مرتفع للغاية.

يصعب العثور على تسجيل تناظري عالي الجودة على معدات عالية الجودة اليوم - فقط لمحبي هذا الصوت. هذا ، على سبيل المثال ، هو جاك وايت ، الزعيم السابق لـ White Stripes. في الوقت نفسه ، تشير بعض تسجيلاته إلى اختلافات في lo-fi ، ويصبح البحث عن خصائص الصوت الفاحشة للمسار هناك نوعًا من المتعة للذواقة.

إذا كنت تتخيل المصدر المثالي ، فإن الأذن المدربة فقط أو الاستماع على أجهزة صوتية عالية الجودة سيسمح لك بالعثور على ملف مضغوط. وبناءً على هذا بالفعل (وعدم نسيان الإدراك) ، يجدر التوصل إلى الاستنتاج التالي:

يعد AAC ضروريًا وكافيًا للمعدات متوسطة السعر ، وفي حالة عدم وجودها (وفي حالة عدم وجود مصادر يمكن تشفيرها في AAC) - MP3 بمعدل بت ثابت يبلغ 320 كيلو بت في الثانية ، تم إنشاؤه باستخدام برنامج الترميز Lame 3.93 (المفاتيح الموصى بها لـ فك التشفير: -cbr -b320 -q0 -k -ms).

الاستثناءات هي التسجيلات المسجلة أصلاً بجودة عالية ، على سبيل المثال ، مسجلة على DVD-Audio أو SACD أو التسجيلات التي تم جمعها في الأصل بتنسيق DSD (أو تنسيق مشابه) بمعدل بت مرتفع.

على الرغم من ضياع بعض الميزات. وسنخبر عنهم في المرة القادمة.

موصى به: