Yazar: Keith Devlin
4 Nisan 2002, Perşembe
Birçok ebeveynin keşfettiği gibi, internet servis sağlayıcısından gelen kabarık aylık faturaların, genç çocuklarının internetten müzik indirmesiyle yakından bir ilgisi var. Müzik paylaşımının öncüsü Napster'ın mahkeme kararıyla kapatılması, günlük müzik ticaretinde neredeyse hiçbir aksaklığa yol açmadı ve oluşan boşluğu Audiogalaxy, Kazaa, Morpheus ve WinMX gibi hizmetler doldurdu.
Tüm bu faaliyetin özel bir ironisi var. Çevrimiçi müzik endüstrisinin tamamı, o genç müzik hayranlarının çoğunun en sevmediğini iddia edeceği bir okul dersine dayanıyor: matematik. Aslında her gece indirdikleri şey, 200 yıldan daha uzun bir süre önce geliştirilen kalkülüs tabanlı bir teknik kullanılarak hesaplanan sayı akışlarıdır.
19. yüzyılın başlarında, Fransız matematikçi Joseph Fourier, ısının nasıl yayıldığını tanımlamak için bazı matematiksel denklemler geliştirdi. İşte bu aynı denklemler, ses dalgaları da dahil olmak üzere herhangi bir dalga formunu bir sayı dizisi olarak tanımlamak için kullanılabilir. 60'lı yıllarda, R. A. Moog adında bir Amerikalı mühendis, elektronik müzik sentezleyicileri tasarlamak için Fourier'nin matematiğini kullandı.
80'lerde, Japon elektronik şirketi Yamaha, elektronik klavyeli çalgıları piyasaya sürerek müzik endüstrisinde devrim yaratmak için aynı matematiği kullandı. Ve bugün, Fourier'nin denklemleri, MP3 müzik kodlama şemasının temelini oluşturan matematiksel çerçevenin bir parçası olarak yaşamaya devam ediyor. MP3'ün özellikle büyüleyici bir yönü, matematiği insan işitme sisteminin çalışma şekline dair bilgilerle birleştirmesidir. İlk olarak, matematiğe bir göz atalım.
Matematiğin Rolü
Fourier, herhangi bir dalga formunun (ses dalgası dahil) nasıl bileşen sinüs dalgalarına ayrılabileceğini gösterdi. Bunlar, mühendislerin osiloskoplarda ürettiği o mükemmel düzenli dalgalardır. Belirli bir ses dalgasını oluşturmak için birleşen sinüs dalgalarının tam deseni, bir sayı dizisiyle temsil edilebilir.
Bu sayılar, bugün Fourier Dönüşümü olarak bilinen matematiksel bir işlemle orijinal dalgadan hesaplanabilir. Bu şekilde, ses sayılara dönüştürülebilir. Aslında, olay bundan biraz daha fazlasını içeriyor. Fourier Dönüşümü bir dalga üzerinde değil, o dalganın matematiksel bir tanımı üzerinde çalışır. Bu yüzden önce bir dalgayı matematiksel bir tanıma dönüştürmeniz gerekir.
Mühendisler bunu, doğanın yıllar önce hayvanların işitme sistemlerini geliştirirken yaptığı bir hileyi örnek alarak yaparlar. Bir ses dalgası, havadaki bir dalgalanmadan oluşur.
Onu "ses" yapan şey, kulaklarımızın ve daha genel olarak işitme sistemimizin bu hava dalgasını ses olarak yorumlamasıdır. Havanın hareketi, iç kulaktaki bir zarın titreşmesine neden olur ve bu titreşimler beyne akan küçük elektrik akımlarına dönüştürülür. Beynin aslında ses olarak deneyimlediği şey bu elektrik dalgalarıdır.
Bir mikrofon da esasen aynı şekilde çalışır; havadaki bir ses dalgasını bir elektrik sinyaline dönüştürür. Bu elektrik sinyalini bir hoparlöre verirsek, hoparlör orijinal ses dalgasının bir kopyasını yeniden oluşturur. Ancak bu elektrik dalgasıyla başka bir şey daha yapabiliriz: örnekleme (sampling) olarak bilinen bir yöntem kullanarak bir sayı dizisi oluşturabiliriz. En yaygın prosedüre Darbe Kod Modülasyonu (PCM) denir.
Bu yöntem, bir elektrik dalgasını alır ve sinyalin voltajını küçük, sabit aralıklarla belirlenmiş zaman anlarında ölçer. Bir ses CD'si (compact disc) söz konusu olduğunda, örnekleme saniyede 44.100 kez yapılır. Böylece, her bir saniyelik ses girişi için PCM analog-dijital dönüştürücü 44.100 sayı üretir; her biri, örneklendiği andaki voltajın bir ölçümüdür.
Bir CD'de her voltaj 16-bit hassasiyetle ölçülür; yani sistem, 65536 (veya 216) farklı voltaj seviyesini ayırt edebilir. Saniyede 44.100 örnekleme oranı ile 16-bit voltaj ölçümü, herhangi bir sesi, tekrar sese dönüştürüldüğünde insan kulağının orijinalinden ayırt edemeyeceği bir sayı dizisi olarak kodlamak için yeterlidir.
Sıkıştırmanın Sihri
Ne yazık ki, müziği bu şekilde kaydetmek çok fazla depolama kapasitesi gerektirir: her bir dakikalık (stereo kaydedilmiş) müzik için tam olarak 10 megabayt.
Modern CD teknolojisi göz önüne alındığında, bu durum kayıt endüstrisi için sorun teşkil etmez, ancak herkes CD müzik dosyalarını internet üzerinden göndermeye kalksaydı büyük bir sorun yaratırdı. İşte Fourier'nin matematiği ve insan işitme sistemi hakkındaki bilgiler bu noktada devreye giriyor. Bilgisayarı olan herkes, veri dosyalarını sıkıştırabilen algoritmalar olduğunu bilir (PK-ZIP ve Stuffit iyi bilinen iki örnektir). Bu programlar tipik bir metin dosyasına uygulandığında, dosya boyutunu %80'e kadar azaltabilirler. Ancak CD kalitesindeki PCM dosyalarında bu azalma sadece %10 civarındadır.
PCM dosyaları üzerinde çalışmak üzere özel olarak tasarlanmış algoritmalar %60'lık bir azalma sağlamıştır, ancak bu, internet üzerinden müzik paylaşımını desteklemek için yeterli değildir. MP3, orijinal örneklenmiş ses dalgasının birebir yeniden üretilebilmesi için tüm dosyayı sıkıştırma fikrinden vazgeçerek çalışır. Bunun yerine, bilgilerin bir kısmını kasıtlı olarak atar. Böylece, orijinal örneklenmiş ses dalgasında insan işitme sisteminin algılayamadığı her şey atılabilir.
Fark etmeyeceğimiz şekilde atılabilecek pek çok şey vardır. MP3, MPeg3'ün veya daha tam adıyla MPeg - Katman 3'ün kısaltmasıdır. 1992 yılında Alman Frauenhofer Araştırma Enstitüsü tarafından geliştirilen bir endüstri standardı olan MP3, kaynağa bağlı olarak sekiz ila 12 kat arasında değişen, örneklenmiş bir ses dalgasında olağanüstü bir sıkıştırma oranı sağlar. Bu, bir CD'de bir dakikalık yüksek kaliteli müziği kodlamak için gereken 10 MB depolama kapasitesinin, bir bilgisayarın sabit diskindeki 1 MB'lık bir MP3 dosyasına düşürülmesi anlamına gelir.
MP3, frekans aralığını insan kulağının ayrı ayrı duyduğu 32 banda ayırır. Giriş sinyalinin (örneklenmiş dalganın) bu aralıkların her birindeki bileşeni, daha sonra onu 18 ek bileşene ayıran Fourier benzeri bir matematiksel dönüşüme tabi tutulur ve toplamda 576 ayrı frekans bandı oluşturulur. Bu bantların her birinin içinde, insan kulağı tarafından algılanamayan bileşenler kaldırılır.
Ortaya çıkan sinyal daha sonra, bilgisayar bilimcilerinin aşina olduğu bir teknik olan Huffmann kodlaması ile daha da sıkıştırılır. Bu teknik, sık görülen değerleri, daha az görülen değerler için kullanılandan daha kısa kodlarla temsil eder. (Örneğin, bir şarkıdaki 1/10 saniyelik bir sessizliği kodlamak için örneklenmiş dalganın varsayılan 141.120 bitini kullanmak son derece israflı olurdu.)
Sonuç
Tüm bu matematiğin sonucu ne mi?
Bilgisayarı olan herhangi bir genç için klavyede birkaç tuşa basarak elde edilen bedava müzik. (Ebeveynlerinin ay sonunda ödediği internet bağlantı ücretlerini saymazsak.) Tüketici elektroniği mağazalarının her birkaç ayda bir yeni MP3 çalarlar sunması ve milyonlarca PC sahibinin yasa dışı olarak müzik dosyalarını takas etmesiyle (ve ara sıra yasal olarak indirmesiyle), modern müzik endüstrisi her şeyden çok matematiğin üzerine kuruludur. Joseph Fourier'nin, ısı dalgaları üzerine yaptığı orijinal matematiksel analizin günümüzdeki uygulamaları hakkında ne düşüneceği ise kimsenin tahmin edemeyeceği bir konu.
Bu yazını orijinalini https://www.theguardian.com/technology/2002/apr/04/internetnews.maths adresinde bulabilirsiniz.
Dr. Keith Devlin, Yorkshire doğumlu bir matematikçi olup Kaliforniya'daki Stanford Üniversitesi Dil ve Bilgi Çalışmaları Merkezi'nin yönetici direktörüdür. En son kitabı Weidenfeld and Nicolson tarafından yayınlanan "The Maths Gene: Why Everybody Has It But Most People Don't Use It" (Matematik Geni: Neden Herkeste Var Ama Çoğu Kişi Kullanmıyor) adlı eseridir.
Hiç yorum yok:
Yorum Gönder