شنیدن زیر و بمی صوت

زیر و بمی (pitch) و بسامد (frequency) صوت

وقتی صوت خالصی را می‌شنویم هم‌بلندی و هم زیر و بمی آن را ادراک می‌کنیم. همان‌طور که رنگ کیفیت اصلی نور است زیر و بمی نیز کیفیت اصلی صوت است که بر مقیاسی از زیر تا بم در تغییر است. درست همان‌طور که بسامد نور، رنگ را تعیین می‌کند، زیر و بمی نیز با بسامد صوت تعیین می‌شود. به‌تدریج که بسامد افزایش می‌یابد صدا ریزتر می‌شود. همان‌طور که در مورد طول موج نور دیدیم در مورد تمیز بسامدهای متفاوت صوت نیز آدمی از توانائی خوبی برخوردار است. جوانان می‌توانند بسامدهائی بین ۲۰ تا ۲۰۰۰۰ هرتز (سیکل در ثانیه) را بشنوند و کمترین تفاوت محسوس (جِی‌ان‌دی) برای آنان در مورد صوت‌های ۱۰۰ هرتزی کمتر از ۱ هرتز است و برای صوت‌های ۱۰۰۰۰ هرتزی مقدار آن به ۱۰۰ هرتز می‌رسد.


اما چیزی شبیه به آمیزش رنگ‌ها در شنوائی وجود ندارد. وقتی دو یا چند صوت با بسامدهای متفاوت به‌طور همزمان به‌صدا در‌آیند، اگر بسامدهای آنها از هم فاصله کمی داشته باشند، می‌توانیم زیر و بمی هریک از صوت‌ها را بشنویم. وقتی بسامدها به‌هم نزدیک باشند احساس پیچیده‌تری به‌وجود می‌آورند، اما در هر حال به‌عنوان صوت خالص واحدی احساس نمی‌شوند. در مورد دیدرنگ، آگاهی از اینکه آمیختن سه نور مختلف، منتهی به احساس رنگ واحدی می‌شود، فکر وجود سه نوع گیرنده را پیش آورد. فقدان پدیدهٔ مشابهی در مورد صوت به این نکته اشاره دارد که اگر هم گیرنده‌های اختصاصی برای بسامدهای مختلف صوت وجود داشته باشند تعداد آنها باید فوق‌العاده زیاد باشد.

نظریه‌های ادراک زیر و بمی

همانند دیدرنگ، در مورد شنوائی نیز دو نظریه برای تبیین نحوهٔ تبدیل بسامدها به زیر و بمی عرضه شده است.


نظریهٔ اول توسط لرد راترفورد (Lord Rutherford)، فیزیکدان انگلیسی، به‌سال ۱۸۸۶ به‌میان آمد. راترفورد بیان داشت که: الف- هر موج صوتی، تمامی غشاء پایه را به ارتعاش وامی‌دارد، و میزان ارتعاش متناسب با فراوانی صوت است؛ و ب- میزان ارتعاش غشاء پایه، میزان تکانه‌های تارهای عصبی را در عصب شنوائی تعیین می‌کند. بنابراین، صوت ۱۰۰۰ هرتزی موجب می‌شود غشاء پایه ۱۰۰۰ بار در ثانیه به ارتعاش درآید و این نیز سبب می‌گردد تارهای عصبی در عصب شنوائی ۱۰۰۰ تکانه در ثانیه شلیک کنند. مغز نیز این هزار تکانه در ثانیه را به زیر و بمی خاصی تعبیر می‌کند. چون، در این نظریه، زیر و بمی تابع تغییرات صوت برحسب زمان شناخته می‌شود، آن را نظریهٔ زمانی (temporal theory) صوت و گاهی نظریهٔ بسامدی (frequency theory) صوت نامیده‌اند.


فرضیهٔ راترفورد به‌زودی با مشکل بزرگی روبه‌رو شد. بررسی‌ها نشان داد که سرعت شلیک تارهای عصبی حداکثر حدود ۱۰۰۰ تکانه در ثانیه است. پس چگونه زیر و بمی صوتی را که بسامد آن از ۱۰۰۰ هرتز بیشتر است ادراک می‌کنیم؟ ویور (Weaver) (۱۹۴۹) راهی برای نجات نظریهٔ زمانی پیشنهاد کرد. استدلال او این بود که بسامدهای بیش از ۱۰۰۰ هرتز ممکن است توسط چند گروه تار عصبی رمزگردانی شوند، به این ترتیب که هر گروه با سرعتی متفاوت از گروه‌های دیگر شلیک کند. مثلاً اگر گروهی نورون با سرعت ۱۰۰۰ تکانه در ثانیه شلیک کنند و سپس یک‌هزارم ثانیه بعد گروه دیگری نورون‌ها نیز با سرعت ۱۰۰۰ تکانه شروع به شلیک کنند، مجموع سرعت تکانه‌ها برای این دو گروه نورون برابر با ۲۰۰۰ تکانه در ثانیه خواهد بود. تأییدی بر این نظریهٔ زمانی، حاصل این کشف بود که حتی اگر نورون‌ها به تمامی چرخه‌های موج صوتی معینی پاسخ ندهند، الگوی تکانه‌های عصبی در عصب شنوائی از شکل موجی صوت محرک پیروی می‌کند (روز - Rose، براگ - Brugge، آندرسون - Anderson، و هایند - Hind در ۱۹۶۷).


هرچند از بسامد تقریباً ۴۰۰۰ هرتزی به بالا پاسخ تارهای عصبی منطبق بر شکل موجی نیست، با این حال می‌توانیم زیر و بمی را در سطح بسامدهای بسیار بالاتر نیز بشنویم. از این یافته چنین برمی‌آید که لااقل برای بسامدهای صوتی بالا باید نظام دیگری برای رمزگردانی کیفیت زیر و بمی وجود داشته باشد.


نظریهٔ دوم در زمینهٔ ادراک زیر و بمی به سال ۱۶۸۳ برمی‌گردد. در آن سال ژزف گیشار دوورنی (Joseph Guichard Duverney)، کالبدشناس فرانسوی، این نظر را پیش کشید که بسامد صوتی به‌طور مکانیکی به‌کمک پدیدهٔ تشدید (fesonance) به زیر و بمی رمزگردانی می‌شود (گرین - Green و ویر - Wier در ۱۹۸۴). برای درک بیشتر این نظریه بهتر است ابتدا مثالی از تشدید بدهیم. وقتی کنار پیانو به دوشاخهٔ صوتی ضربه‌ای وارد شود، همان زه پیانو که برای بسامد دو شاخهٔ صوتی تنظیم شده است شروع به ارتعاش می‌کند. گفتن اینکه گوش نیز به‌همین ترتیب عمل می‌کند در واقع به این معنی است که گوش ارای ساختاری است شبیه به ساز زهی که قسمت‌های مختلف آن برای بسامدهای مختلف صوت تنظیم شده‌اند، طوری‌که وقتی صوتی با بسامد معینی به گوش می‌رسد قسمت مربوط به آن در ساختار گوش شروع به ارتعاش می‌کند. بعدها اثبات شد که این نظر اصولاً درست است و آن ساختار، غشاء پایه است.


در قرن نوزدهم، هرمان فون هلمهولتس برمبنای نظریهٔ تشدید، نظریهٔ مکانی (place theory) ادراک زیر و بمی را ارائه کرد. برمبنای این نظریه، وقتی مکانی خاص در طول غشاء پایه پاسخ دهد، احساس زیر و بمی معینی را موجب می‌شود. این واقعیت که نقاط متعددی روی غشاء پایه وجود دارند سازگار با این نظر است که در دریافت زیر و بمی، گیرنده‌های متعددی در کار هستند. توجه کنید که نظریهٔ مکانی بر آن نیست که ما به‌وسیلهٔ غشاء پایه می‌شنویم، بلکه اشاره به این دارد که مکان‌هائی از غشاء پایه که بیشتر از مکان‌های دیگر به ارتعاش درمی‌آیند، تعیین می‌کنند که کدام تارهای عصبی فعال شوند، و این نیز به‌نوبهٔ خود تعیین می‌کند که ما چه نوع زیر و بمی را بشنویم. در اینجا با نوعی دستگاه حسی سروکار داریم که در آنها رمزگردانی کیفیت محرک، تابع فعال شدن عصب‌های معینی است.


تا سال ۱۹۴۰ مشخص نبود که غشاء پایه واقعاً چگونه به ارتعاش درمی‌آید. در این زمان گیورگ‌فون بکسی (Georg von B?k?sy) ارتعاش غشاء پایه را از طریق ایجاد سوراخ‌های ریزی در حلزون گوش خوکچه‌های هندی و اجساد انسانی، اندازه گرفت. یافته‌های بکسی به تغییراتی در نظریهٔ مکانی انجامید: غشاء پایه مانند پیانو که زه‌های مجزا دارد عمل نمی‌کند، بلکه بیشتر شبیه ملافه‌ای است که آن را از یک گوشه گرفته تکان دهند. به بیان دقیق‌تر، بِکِسی نشان داد تمام غشاء پایه در پاسخ به بیشتر بسامدها به‌حرکت درمی‌آید، ولی مکان بیشترین حرکت را بسامد صوت خاصی که به‌صدا درآمده تعیین می‌کند. بسامدهای بالا موجب ارتعاش انتهای غشاء پایه می‌شوند و به‌تدریج که بسامد افزایش می‌یابد محل حداکثر ارتعالش در جهت روزنهٔ بیضی تغییر مکان می‌دهد (بکسی، ۱۹۶۰). به‌خاطر این تحقیق و پژوهش‌های دیگر در مورد شنوائی، فون‌بکسی در سال ۱۹۶۱ جایزهٔ نوبل دریافت داشت.


همانند نظریه‌های زمانی، نظریه‌های مکانی نیز بسیاری از پدیده‌های ادراک زیر و بمی را تبیین می‌کنند ولی نه همهٔ آنها را. نارسائی اساسی نظریه‌های مکانی در بررسی صوت‌هائی با بسامدهای پائین نمایان می‌شود. در پاسخ به بسامدهای کمتر از ۵۰ هرتز، تمامی قسمت‌های غشاء پایه تقریباً به یک اندازه به ارتعاش درمی‌آیند، و این بدان معنی است که تمامی گیرنده‌ها فعال می‌شوند، با این نتیجه که تمیز بین بسامدهای کمتر از ۵۰ هرتز غیرممکن می‌شود، در حالی‌که ما عملاً قادر به تمیز بسامدهای پائین‌تر تا حدود ۲۰ هرتزی نیز هستیم.