POLUTEQNEIO KRHTHS - dias.library.tuc.gr

70
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΗΛΕΚΤΡΟΝΙΚWΝ ΜΗΧΑΝΙΚWΝ ΚΑΙ ΜΗΧΑΝΙΚWΝ ΥΠΟΛΟΓΙΣΤWΝ ΕΝΣWΜΑΤWΜΕΝΟ ΣΥΣΤΗΜΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΨΗΦΙΑΚΟΥ ΗΧΟΥ Τριαντάφυλλος Μουρτζανός Επιτροπή Επιβλέπων: Καθηγητής Απόστολος Dόλλας Μέλος Επιτροπής: Καθηγητής Dιονυσιος Πνευmατικάτος Μέλος Επιτροπής: Καθηγητής Μιχάλης Ζερβάκης Χανιά, Οκτώβριος 2016

Transcript of POLUTEQNEIO KRHTHS - dias.library.tuc.gr

ΥΠΟΛΟΓΙΣΤΩΝ
Χανι, Οκτβριος 2016
Περληψη
Στον ψηφιακ χο η πιο διαδεδομνη μορφ αποθκευσης της μουσικς χωρς
συμπεση εναι η cd ποιτητα στα 44.1khz και 16bit.Για αρκετος μουσικφιλους
η ποιτητα του cd δε μπορε να προσφρει τη μγιστη ακουστικ εμπειρα που
μπορε να λβει ο ακροατς και υποστηρζουν την ανωτερτητα των αρχεων
χου υψηλς ανλυσης,μεγαλτερης συχντητας δειγματοληψας δηλαδ και ε-
ρους bit,ανογοντας τσι μια δημσια συζτηση η οποια ξεκνησε στα τλη της
δεκαετας του 90 με την εμφνιση των πρτων μουσικν αρχεων σε ποιτητα
Dvd και συνεχζεται μχρι και σμερα.
Η παροσα διπλωματικ στοχεει στην βελτωση της cd ποιτητας με την
εφαρμογ μαθηματικν μεθδων Interpolation πνω στο αρχικ δειγματολη-
πτημνο σμα χωρς την αλλαγ του ρυθμο δειγματοληψας στε στη συνχεια
να σχεδιαστε μια Hardware υλοποηση η οποα θα το προσφρει αυτ σε πραγ-
ματικ χρνο.Αφο μελετθηκαν οι δυναττητες που χει το ανθρπινο αυτ και
το ρλο που παζει ο τομας της ψυχοακουστικς κατα την ακουστικ εμπει-
ρα,σχεδιστηκαν και μοντελοποιθηκαν δυο μθοδοι Interpolation,η Linear και η Cubic Spline.
Αφου υλοποιθηκαν και μελετθηκε πειραματικ η συμπεριφορα των δυο
μεθδων τσο οπτικ με το φασματογρφημα και τις κυματομορφς τσο και
ακουστικ με την επιλογ μουσικν δειγμτων με διαφορετικ χαρακτηριστι-
κ,αξιολογσαμε τις μεθδους,συγκρναμε τις διαφορς για διαφορετικος ρυθ-
μος δειγματοληψας και αναφραμε τα θετικ και αρνητικ που παρουσιζουν
σε κθε περπτωση.Η μθοδος με το Cubic Spline η οποα εναι και η βασικ
μθοδος για το Interpolation σε αυτ τη διπλωματικ,δωσε ενδιαφρον αποτε-
λσματα σε σγκριση με το αρχικ σμα,εν αντθετα η Linear μθοδος ταν
σχεδν πντα καττερη του αρχικο.
Στη συνχεια προσαρμστηκε η μθοδος μας για τη πιθαν υλοποηση σε
Hardware η οποα και σχεδιστηκε και αξιολογηθηκε.
2
Abstract
In digital sound,the most common format to store music without compress is the cd quality on 44.1Khz sample rate and 16bit depth.For many audio- philes,the cd quality can’t offer the maximum listening experience that the listener can get and they support the superiority of high-resolution audio files.So,a strong debate which started at the end of the 90’s when the first Dvd Quality music files were released is still open to discuss where new arguments appear constantly from both sides.
This thesis diploma aims to improve the standard cd-quality with the application of interpolation mathematical methods on the original .wav file,without resampling the rate so that can be applied in a Hardware im- plementation.Having studied the capabilities of the human ear and the role played by psychoacoustics during the audio experience,two methods of inter- polation were designed and modeled,Linear and Cubic Spline.
Once implemented and experimentally studied the behavior of two meth- ods both visually with spectrogram and waveforms so and the audibility with musical samples selection with different characteristics,we evaluated the methods, we compared the differences for different sampling rates and discussed the positives and negatives that have to each case.The Cubic Spline which is the main interpolation method in this work,gave us interesting results in compare to the original file,while on the other hand the Linear method was almost always worse than the original.
Then our method adjusted for possible implementation in Hardware,which was designed and evaluated.
3
Ευχαριστες
Πρωτστως θα θελα να ευχαριστσω τον επιβλπων καθηγητ μου κ. Α-
πστολο Δλλα για την ευκαιρα που μου δωσε να ασχοληθ με κτι που
με ενδιαφρει ιδιατερα,για τη πρακτικ καθοδγηση κατ την εκπνηση αυ-
τς της διπλωματικς καθς και για τη προσπθεια του για δημιουργα της
σωστς νοοτροπας που πρπει να χει νας μηχανικς,κατα το διστημα που
συνεργαστκαμε.Θα θελα να ευχαριστσω επσης τους καθηγητς Διονυσιο
Πνευματικτο και Μιχλη Ζερβκη που ως μλη της εξεταστικς μου επιτροπς
συμμετχουν στην επιτυχ ολοκλρωση των σπουδν μου.
Ευχαριστ τους φλους και συμφοιτητς μου για λες τις μορφες στιγμς
που περσαμε λα αυτ τα χρνια καθς και για την πνευματικ και πρακτικ
βοθεια που μου παρχαν σε λη τη διαδρομ της φοτησης μου,χωρς αυτος
τα πργματα θα ταν πολ διαφορετικ.
Τελος,θλω να ευχαριστσω την οικογνεια μου που ταν πντα δπλα μου
να με στηρζει,στις καλς και στις δσκολες στιμς και να τους αφιερσω με
λη μου τη καρδι αυτ τη δουλει γιατ το αξζουν.
4
Περιεχμενα
1.3 Συνεισφορα της διπλωματικς . . . . . . . . . . . . . . . . . . 11
1.4 Οργνωση κεφαλαων . . . . . . . . . . . . . . . . . . . . . . . 11
2 Σχετικ ρευνα 12
2.1.1 Αναλογικ και ψηφιακ ηχητικ σμα . . . . . . . . . . 12
2.1.2 Sampling Theory and Nyquist . . . . . . . . . . . . . 12
2.1.3 PCM and Bit Depth . . . . . . . . . . . . . . . . . . . 13
2.1.4 Quantization and Coding . . . . . . . . . . . . . . . . 14
2.1.5 Dithering . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.1 Using Matlab to process sound . . . . . . . . . . . . . 20
2.3.2 Processing sound with fpga . . . . . . . . . . . . . . . 21
3 Ανθρπινο αυτ και ψυχοακουστικ 23
3.1 Ανθρπινο αυτ . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4 Meta-Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4 Μοντελοποηση 30
5.1 Ακουστικ Tests . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.1.1 Interpolation Tests . . . . . . . . . . . . . . . . . . . . 46
5.1.2 Resample Tests . . . . . . . . . . . . . . . . . . . . . . 47
5
5.5 Επαλθευση μοντλου Matlab για λειτουργα σε Hardware . . 52
6 Σχεδαση ενσωματωμνου συστματος 55
6.1 Εισαγωγ στα Εργαλεα . . . . . . . . . . . . . . . . . . . . . 55
6.2 Σχεδαση του συστματος . . . . . . . . . . . . . . . . . . . . 55
6.2.1 Σχεδιασμς συστματος LinearInterpolation . . . . . 55
6.2.2 Σχεδιασμς συστματος CubicSplineInterpolation . . 58
7 Συμπερσματα και μελλοντικη εργασα 65
7.1 Ανασκπηση . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2 Συμπερσματα . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.1 Aliasing and Nyquist . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Data points of the line y are the linear interpolation points . 16
2.3 Floating-Point vs Fixed-Point . . . . . . . . . . . . . . . . . . 22
3.1 Perceived Human Hearing . . . . . . . . . . . . . . . . . . . . 23
3.2 Το ριο του ακουστικο πνου . . . . . . . . . . . . . . . . . . 24
3.3 Κοχλια . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.1 Το μοντλο της Matlab . . . . . . . . . . . . . . . . . . . . . 31
4.2 Journey into Sound waveform . . . . . . . . . . . . . . . . . . 32
4.3 Spectrograms of 44.1Khz and 48Khz of the Original Audio File 33
4.4 Spectrograms of 44.1Khz and 48Khz of the Linear Interpolation 33
4.5 Spectrograms of 44.1Khz and 48Khz of the Cubic Spline . . . 33
4.6 Spectrograms of 66.15khz and 96Khz of the Original Audio . 34
4.7 Spectrograms of 66.15khz and 96Khz of the Linear Interpolation 34
4.8 Spectrograms of 66.15khz and 96Khz of the Cubic Spline . . 35
4.9 Spectrograms of 192Khz Original and Cubic Spline . . . . . . 35
4.10 Metallica-Enter Sandman Dual Channel Waveform . . . . . . 36
4.11 Spectrogram of the Original and of Cubic Spline for whole track 36
4.12 Africa Mono Drum Loop Waveform . . . . . . . . . . . . . . 37
4.13 Waveform of the Mono Sample,Cubic and Original Comparison 38
4.14 Cubic and Linear comparison of the Mono Sample . . . . . . 39
4.15 Waveform of the Stereo Sample,Cubic and Original Comparison 40
4.16 Whole song 64 samples Waveform . . . . . . . . . . . . . . . 41
4.17 Whole song 256 samples Waveform . . . . . . . . . . . . . . . 42
4.18 Cubic Spline and Original Comparison 44.1Khz . . . . . . . . 43
4.19 Cubic Spline and Original Comparison 48Khz . . . . . . . . . 43
4.20 Cubic Spline and Original Comparison 66.15Khz . . . . . . . 44
4.21 Cubic Spline and Original Comparison 96Khz . . . . . . . . . 44
4.22 Cubic Spline and Original Comparison 192Khz . . . . . . . . 45
5.1 Το σστημα εφαρμογς θορβου και στη συνχεια Interpolation στο αρχικ ¨καθαρ’ σμα . . . . . . . . . . . . . . . . . . . . . 48
5.2 Cubic,Linear,Original Noise Waveform . . . . . . . . . . . . . 49
5.3 Επμενο στιγμιτυπο των μεθδων μας μετα την εφαρμογ θο-
ρβου. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.5 4 sample Method Comparison . . . . . . . . . . . . . . . . . . 53
5.6 4 sample Method Comparison 2 . . . . . . . . . . . . . . . . . 54
5.7 4 sample Method Spectrogram . . . . . . . . . . . . . . . . . 54
6.1 Linear Interpolation Simulink Diagram . . . . . . . . . . . . . 57
6.2 Top Level Cubic Spline Interpolation Diagram . . . . . . . . 58
7
8 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ
6.3 The Path of the Sound inside the System . . . . . . . . . . . 60 6.4 HDelta Module . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.5 Sigma Module . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.6 BCD Module . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 6.7 Interpolation Module . . . . . . . . . . . . . . . . . . . . . . . 64
Κατλογος Πινκων
9
1.1 Κνητρο
Τα τελευταα χρνια στο χρο της μουσικς,η ευρεα διδοση του .mp3 ως
πρτυπο ψηφιακς κωδικοποησης χει μεσες συνπειες στο τρπο που αποθη-
κεουμε και αναπαργουμε τον χο μας.Η εξλιξη της τεχνολογας στις συσκευ-
ς αναπαραγωγς καθς και η ανπτυξη της ευρυζωνικτητας σε παγκσμια
κλμακα κατστησαν το Mp3 ως πρτη προτμηση στα ψηφιακ αρχεα χου.
Η επιτυχα του .mp3 ως πρτυπο,βασζεται στο τι δεσμεει αρκετ μικρ
χρο σε δεδομνα απο τις μεσες μεθδους λγω συμπεσης,χρησιμοποιντας
ψυχοακουστικ μοντλα που εξαλεφουν τους χους που δεν μπορε να αντιλη-
φθε το ανθρπινο αυτ.Αυτ χει ως αποτλεσμα να χουμε μεν πολλ περισ-
στερα αρχεα στα μσα αποθκευσης αλλ να χνουμε σε ποιτητα,στω κιαν
εκ πρτης ψης δεν καταλαβανουμε τη διαφορ.Εναι δεδομνο πως με το .mp3 αλλ και με συνδρομητικς υπηρεσες streaming μουσικς τπου Spotify ,πως
χουμε θυσισει την ποιτητα στο βωμ της ευκολας.
Πολλο απαιτητικο ακροατς δεν χουν πειστε για την αξα της ψηφιοπο-
ησης του χου ετε για πρακτικος λγους πως η ποιτητα,ετε ενοτε για
συναισθηματικος.Η βασικ διαμχη μεταξ των υπρμαχων του βινυλου,του
αναλογικο χου δηλαδ ναντι αυτν του cd,εναι η ποιτητα.Οι λτρεις των
δσκων υποστηρζουν πως η “ζεστασι” που βγζει το βινλιο ακογεται κα-
λτερα απο κθε ψηφιακ μορφ,καθς η ποιτητα δε μετριται σε συχντητες
δειγματοληψας και βθος bits ,αλλ κατευθεαν με το ανθρπινο αυτ. Απο
την λλη πλευρ,οι λτρεις της ψηφιακς μορφς αντιτενουν την καθαρτητα
του χου,την συνεχ ρο χωρς ατλειες και “σκρατς” ως επιχειρματα περ
ανωτερτητας σε ποιτητα.
Συνεχς νες συσκευς και πρτυπα,υπσχονται καλτερη ποιτητα και υ-
ψηλ ανλυση στο κοιν,λλα με χαμηλ και λλα με πολ υψηλ κστος.Κατα
κοιν ομολογα η χρση ενς DAC(digital-to-analog converter) κατα την ανα-
παραγωγ των ψηφιακν αρχεων εγγυται καλτερη ποιτητα απο το standard chip μιας ενσωματωμνης κρτας χου σε ναν υπολογιστ η ενς hifi της μα-
ζικς αγορς.Κατα πσο μως μπορε κποιος εναι διατεθειμνος να διαθσει
επιπλον χρματα για κτι που το χει δη
Απο επιστημονικς πλευρς το θετικ με την ψηφιοποηση του αναλογικο
χου,εναι πως με τη μθοδο της δειγματοληψας μπορομε να επεξεργαστομε
κθε κομμτι του χου πως επιθυμομε,ρα αυτ σως μας δσει τη δυνα-
ττητα να αναλσουμε τη ποιτητα του αρχεου και να πειραματισομε πνω σε
αυτ.
1.2 Σκοπς και αντικεμενο της διπλωματικς
Η διπλωματικ εργασα που παρουσιζεται αφορ την ρευνα και την εφαρ-
μογ μαθηματικν μοντλων και συναρτσεων σε αρχεα χου χωρς συμπεση
10
με στχο την βελτωση της ποιτητας,τσο μαθηματικ σο και ακουστικ.Με
τη μελτη των αποτελεσμτων του πειραματικο μοντλου στοχεουμε να δη-
μιουργσουμε να ενσωματωμνο σστημα το οποο επεξεργζεται τον ψηφιακ
χο.
Η ρευνα και το πειραματικ κομμτι γινε σε περιβλλον Matlab και η
προσομοωση του στο Stimulink της Matlab μαζ με το εργαλεο Xilinx.Σκοπς
μας εναι να μελετσουμε τη συμπεριφορ του χου standard ποιτητας cd μσω
τεχνικν resampling και interpolation και να δομε κατα πσο επηρεζεται η
ποιτητα,πως μπορε να την αντιληφθε το γυμν αυτ. Αφο καταλξαμε πως
το ιδανικ μοντλο αριθμητικς ανλυσης πνω στα samples μας εναι το Cubic Spline Interpolation προσομοισαμε τη σχεδαση με σκοπ την ενσωμτωση
της σε μια fpga. Αντιλαμβανμενοι τις τσεις της σγχρονης μουσικς τεχνολογας περι hifi
fidelity χου,μελετμε την αποτελεσματικτητα των προτσεων με υψηλ reso- lution και samplerate σον αφορ την ανθρπινη ακο και πως συμβλει στο
τελικ ποψη περι ποιτητας ο τομας της ψυχοακουστικς.
1.3 Συνεισφορα της διπλωματικς
Μσω αυτς της διπλωματικς,προτενουμε μια μαθηματικ λση για την βελ-
τωση της ποιτητας της μουσικς που θα μποροσε να χρησιμοποιηθε ετε στη
δημιουργα υλικο που θα επεξεργζεται τον χο(κρτα χου,digital converter) ετε στη δημιουργα λογισμικο,νου προτπου ψηφιακο χου η studio effect που θα χρησιμοποιεται απο επαγγελματες ηχολπτες και παραγωγος εως α-
πλος τυπικος ακροατς.
1.4 Οργνωση κεφαλαων
Η δομ της παροσας διπλωματικς εναι η παρακτω:
Στο κεφλαιο 2 γνεται αναφορ στον ψηφιακ χο και τα στοιχεα αυτο
που μελετσαμε κατα την εκπνηση της εργασας.Στη συνχεια γνεται μαθη-
ματικ ανλυση στις μεθδους Interpolation που χρησιμοποιθηκαν και στο
πως γνεται η επεξεργασα χου στη πλατφρμα Matlab αλλ και τι συμβανει
με τον χο σε μια FPGA .
Στο κεφλαιο 3 γνεται ανλυση στο πως αντιλαμβνεται το ανθρπινο αυτ
τον χο και στο ρλο της ψυχοακουστικς σε αυτ.Στη συνχεια γνεται μελτη
των πειραμτων που μελετνε την ακουστικτητα ατμων μσω Blind Tests και
στο πως εξαρτται η προπνηση του αυτιο με την αναγνριση της ποιτητας
του χου.
Στο κεφλαιο 4 αναφρεται η μελτη της μοντελοποησης του πειρμα-
τος,πως αυτ εκπονθηκε σε περιβλλον Matlab μελετντας και αξιολογντας
κυματομορφς και σπεκτρογρμματα με η χωρς την εφαρμογ interpolation και
σε διαφορετικος ρυθμος δειγματοληψας.
Στο κεφλαιο 5 γνεται μια ακουστικ αξιολγηση και πειραματικ επα-
λθευση του μοντλου.
Στο κεφλαιο 6 αναφρεται στο πως το παρον μοντλο μπορε να υλοποιηθε
σε μια FPGA στε να δημιουργηθε να πλρες ενσωματωμνο σστημα και
τους κινδνους και τα προβλματα που μπορον να εμφανισον σε μια ττοια
μοντελοποηση.
και εξγονται συμπερσματα,αναφρονται τα προβλματα που παρουσιστηκαν
κατα την εκπνηση της και προτενονται μελλοντικς επεκτσεις γι αυτν.
Κεφλαιο 2
Σχετικ ρευνα
2.1 Εισαγωγ στον ψηφιακ χο
Ο χος εναι να συνεχς αναλογικ κμα που μεταδδεται στον αρα και γνε-
ται αντιληπτ στον νθρωπο μσω της ασθησης της ακος.Η τεχνολογα χει
καταφρει να συλλβει και να συμπισει τον χο σε ψηφιακ αρχεα.Η μθο-
δος με την οποα χει γνει η αναπαρσταση του αναλογικο χου σε ψηφιακ
εγγυται και την ποιτητα του χου.
2.1.1 Αναλογικ και ψηφιακ ηχητικ σμα
Σαν αναλογικ σμα αντιλαμβανμαστε μια ρουσα πληροφορα που λαμβνει
συνεχς τιμς,συναρτσει του χρνου σε κανονικ και ακαννιστο μοτβο.Ο
χος που ταξιδεει στον αρα και μεταφρει τη διακμανση της πεσης των
μορων του αρα που προκαλονται απο μα ταλντωση(μηχανικ) σε να περιο-
ρισμνο υρος συχνοττων που αντιλαμβνεται το ανθρπινο αυτ,εναι ο ανα-
λογικς χος.Οταν πλλεται η πηγ του χου,στλνει διαφορετικς συχντητες
στον αρα,κθε μια απο τις οποες παργει να κμα.Η ποιτητα του χου ε-
ξαρτται απο το συνδυασμ διαφορετικν συχνοττων σε πολλαπλ κματα.
Στην μουσικ τεχνολογα ως αναλογικ καταγραφ χου ορζουμε την φυσι-
κ αντιπροσπευση του αρχικο σματος που κωδικοποιεται σε να υπστρωμα
πως το αυλκι ενς δσκου βινυλου το μαγνητικ πεδο μια μαγνητοταινας.
Το ψηφιακ σμα εναι η αναπαρσταση του αναλογικο σματος σαν μια
διακριτ ακολουθα απο bits σε να ψηφιακ σστημα.Η αναπαρσταση δεν α-
ποθηκεει λο το αρχικ κμα αλλ σημεα αυτο,καθς “τεμαχζεται” με τη
μθοδο της δειγματοληψας(sampling) και να μσο εππεδο υρους εφαρμζεται
σε κθε δεγμα.Αυτ επιτρπει την υκολη επεξεργασα κθε δεγματος συνε-
πς λου του κματος καθς και την μεωση του χρου που χρειζεται για
την αποθκευση στα επελεγμνα μεδια(cd,dvd,usb).Η συσκευ αναπαραγωγς
διαβζει αυτ τα σημεα και τα ερμηνεει ωστε να δημιουργσει εκ νου να
αναλογικ ηχητικ κμα.
2.1.2 Sampling Theory and Nyquist
Για να μετατραπε να σμα απο αναλογικ σε ψηφιακ πρπει να περσει
απο τα στδια της δειγματοληψας(sampling),της κβντισης(quantization) και
της κωδικοποησης(coding). Το θερημα της δειγματοληψας συνδει συνεχς
σματα στο πεδο του χρνου(αναλογικ) με διακριτ σματα στο πεδο της
συχντητας(ψηφιακ).
Αφο επιλξουμε ναν ρυθμ για τη δειγματοληψα μας(sampling rate) λαμ- βνουμε τμς απο το συνεχς σμα σε δεγματα σε χρονικς στιγμς που ισα-
πχουν μεταξ τους.Η συχντητα δειγματοληψας μας δεχνει πσα δεγματα
λαμβνουμε σε 1 δευτερλεπτο και η απσταση μεταξ δο δειγμτων μας δε-
χνει τη περοδο δειγματοληψας πως επιβεβαινει και ο τπος της συχντητας
12
Fs = 1 Ts .
Ο πιο συχνς και διαδεδομνος ρυθμς δειγματοληψας εναι τα 44.100HZ(CD quality),αυτ διτι σμφωνα με τη Nyquist Sampling Theory του Dr.Nyquist,το sampling rate χρειζεται να υπερβανει το συνολικ ερος του σματος κατα
διπλσια τιμ για αποφγουμε το aliasing.
Figure 2.1: Οταν τα δεγματα πφτουν το να πνω στο λλο με αποτλε-
σμα το τελικ σμα να εναι δυσανγνωστο και να διαφρει απο το αρχικ το
ονομζουμε aliasing.
Ετσι λοιπν,με δεδομνο πως το ανθρπινο αυτ σπνια αντιλαμβνεται
χους νω των 20KHZ ρθαμε στη σμβαση των 44.1khz ,που θεωρητικ μετ
την μετατροπ απο ναν DAC και την αναπαραγωγ των ψηφιακν αρχεων
μουσικς ο νθρωπος θα τα ακοσει χωρς απλειες.
2.1.3 PCM and Bit Depth
Στην μουσικ τεχνολογα,ως PCM(Pulse-code modulation)ορζουμαι την πιο
διαδεδομνη μθοδο με την οποα αναπαρσταται ψηφιακ τα δειγματοληπτημνα
αναλογικ σματα.Η PCM μθοδος χρησιμοποιεται στο σνολο σχεδν της
ψηφιακς αποθκευσης χου χωρς απλειες καθς σε αυτν βασζονται τα
πρτυπα .wav και .aiff.
Τα βασικ στοιχεα που τη χαρακτηρζουν εναι το sampling rate και το
bit depth δηλαδ το πσα bits πληροφορας υπρχουν σε κθε sample. Κθε
sample αποθηκεεται σαν ψηφιακ πληροφορα δηλαδ σαν δυαδικ πληροφορα.
Το bit depth αναπαριστ το πλτος(amplitude) του αναλογικο χου και
μας δεχνει την ανλυση(resolution) του κθε δεγματος.Στη μουσικ τεχνολο-
γα χρησιμοποιομε 16,24 και 32 bit με τα 16bit να εναι και τα πιο συνθη.Οι
14 ΚΕΦΑΛΑΙΟ 2. ΣΧΕΤΙΚΗ ΕΡΕΥΝΑ
τιμς που μπορε να δεκτε το κθε δεγμα εναι το bit depth σαν δναμη του
2.Για 16bit λοιπν χουμε 216=65536 τιμς.
2.1.4 Quantization and Coding
Με το sampling χουμε να σνολο διακριτν τιμν μις ακολουθας απο
πραγματικος αριθμος.Η κβντιση(quantization) μεταφρει αυτος τους αριθ-
μος στο κοντιντερο σημεο απο να προκαθορισμνο πλθος απ διακριτς
στθμες,με τη βοθεια του bit depth,μετρντας το πλτος(amplitude ) της
κυματορφς και βρσκοντας την κοντιντερη τιμ του bit στο πλτος του σημε-
ου απο το sampling.
Με αυτ το τρπο κνουμε το ερος του σματος διακριτ στε το κβα-
ντισμνο σμα να παρνει μνο διακριτς και πεπερασμνες τιμς.Η διαδικασα
της κβντισης σε αντθεση με το sampling(που υπο ορισμνες συνθκες η
πλρη ανακατασκευ του σματος εναι πιθαν) εναι μη αναστρψιμη και χει
σαν αποτλεσμα το χσιμο πληροφορας.
Το κβαντισμνο σμα κωδικοποιεται σε ψηφιακς λξεις ανλογα με το bit depth στε στο τλος να χουμε μια πλρη ψηφιακ πληροφορα στην οποα
αποθηκεουμε τον χο μας.
2.1.5 Dithering
Η κβντιση του σματος μπορε ορισμνες φορς να προκαλσει κποιες α-
πτομες ασυνχειες σε αυτ.Μια τεχνικ αντιμετπισης αυτο του προβλματος
εναι το dithering η αλλις pseudorandom noise quantization.Με το dither- ing,προσθτουμε στο σμα μια μικρ ποστητα ασυσχτιστου λευκο,χαμηλο
επιπδου τυχαου θορβου ακριβς πριν την κβντιση.
Στχος κθε συστματος ψυφιακο χου εναι η εξλειψη κθε εδους παρα-
μρφωσης(disortion) στε το τελικ σμα να εναι γραμμικ.Η χρησιμοποηση
του κατλληλου dither σε κθε μη τετριμμνη(non trivial) διαδικασα μας βοη-
θ να αποφγουμε κθε μη-γραμμικ παραμρφωση που δημιουργε η κβντιση
ως αποτλεσμα των φαινομνων του truncation και του rounding.
Η τεχνικ αυτ ταν διαδεδομνη στα πρτα χρνια των ψηφιακν ηχογρα-
φσεων αλλ χρησιμοποιεται ακμα σμερα για να επανορθσουμε για ναν
κακς ποιτητας DAC(ψηφιακ σε αναλογικ μετατροπα).
2.1.6 Stereophonic Sound
Το cd χρησιμοποιε στερεοφωνικ δικναλο χο.Τα κανλια εναι μεταξ τους
ανεξρτητα και ταν ο χος αναπαργεται απο δο και περισστερα ηχεα(
stereo ακουστικ) δνεται η ψευδασθηση πως ο χος ρχεται απο διφορες
κατευθνσεις.
Για να παραχθε stereo χος,κατα την ηχογρφηση και παραγωγ τοποθε-
τονται δο μικρφωνα για να λβουν τη πηγ χου και στη συνχεια οι χοι
που ελφθησαν θα γνουν mix σε να ηχητικ αρχεο που κποια στοιχεα θα
βρσκονται στο αριστερ κανλι και κποια στο δεξ.
2.1.7 Ultrasonic Sound
Οι χοι τους οποους δε μπορε να αντιληφθε το ανθρπινο αυτ(η ακου-
στικτητα του ανθρπινου αυτιο καλπτεται ενδελεχς στο κεφλαιο 3) γιατ
βρσκονται σε συχντητες μεγαλτερες απο τις ακουστικς δυναττητες του,ονομζονται
Ultrasonic sounds UltraSounds .Οσον αφορ τη μουσικ και για τη ποιτητα
του cd ,δεχμαστε ως ultrasonic κθε χο που δε μπορε να καλψει το cd quality .Οι χοι αυτο φτνουν στο αυτ αλλ αυτ δεν μπορε να δεχθε κποιο
ερθισμα στε να τους αναπαργει.
2.2. INTERPOLATION 15
Tsutomu Ohashi,αναφρεται το Hypersonic effect ,να φαινμενο που ναι μεν
το ανθρπινο αυτ δεν μπορε να αντιληφθον ευσεινδητα τα ultrasounds ,η
απουσα τους απο ναν χο προκαλε φυσιολογικς και ψυχολογικς αντιδρσεις
στον ακροατ.Αν ισχει δηλαδ αυτ το φαινμενο,πρακτικ η επιλογ ενς υ-
ψηλο ρυθμο δειγματοληψας σε μια μουσικ ηχογρφηση,σε συνδυασμ με την
μη αποκοπ και εσοδο στο mastering των υπρηχων δειγμτων,μπορε να προ-
καλσει μια ασθηση πως το τελικ κομμτι χου εναι αντερο ποιοτικ,λγω
του ψυχοακουστικο παργοντα.
στερο απο τον αρχικ αναλογικ χο.Κατα τη δειγματοληψα(sampling)παρνουμε διφορα data points.Με την τεχνικς του interpolation λαμβνουμε καινουρια
data points τα οποα γεμζουν τα δεδομνα που λεπουν απο το ψηφιακ ηχητικ
αρχεο που εξετζουμε.
Μετ τη διαδικασα του sampling,χουμε τα δεγματα και θλουμε να τα
μετατρψουμε πλι σε ναν χο κματος.Αν απλ ενσουμε τα σημεα που εναι
τα δεγματα μεταξυ τους θα προυμε να ηχητικ σμα σαν το αρχικ αλλ με
αρκετ παραμρφωση(disortion).
Για να αποφγουμε την παραμρφωση,χρησιμοποιομε την μθοδο Interpo- lation η οποα εννει τα σημεα ομαλ μσα στο διακριτ σνολο των σημε-
ων που βγλαμε απο το sampling,μιμομενη τη συμπεριφορ μιας ηχητικς
κυματομορφς.Ετσι ανακτομε το αρχικ σμα χωρς απλειες και σφλματα
διασφαλζοντας την αρχικ ποιτητα.
Οσον αφορ τον χο στχος του interpolation εναι στις ακμς του χου
να εφαρμσουμε καμπλες(curve fitting) στε να χουμε μια πιο απαλ και
ομαλ ισθηση του χου.Για να γνει αυτ πρπει να εντοπσουμε μ&s