생생한 음질
MP3 제작 테크닉모든 미디어의 디지털화가 가속되는 가운데 오디오 부분에서도 이런 경향은 무척 빠르게 전해진다. 초기에 아날로그 방식이었던 테이프에서 CD로 넘어갈 때 음반사를 비롯해 많은 사용자들의 저항이 상당히 심했다. 하지만 지금은 테이프보 다는 CD의 판매가 더 많은 실정이며 그 음질은 천지차이다. 이제는 구형 기록 매체인 CD에서 보다 진보된 방식의 MPEG 오디오로 이동하는 중이다. MPEG 오디오에서도 가장 발전된 방식인 MP3는 일반적인 오디오 데이터 저장뿐만 아니라 다양한 통신 수단을 이용해 빠른 속도로 고품질의 음악을 전송할 수 있다. 앞으로 모든 정보는 데이터 라 인을 통해 흐르게 된다. 오디오 데이터 전송의 가장 핵심 분야는 바로 MP3가 될 것이 다.
MP3란
MP3에 대해 이해하기 위해서는 MPEG 오디오에 대한 이해가 앞서야 한다. MPEG 오디오는 기본적으로 60분이나 72분 정도의 CD에 포함된 44.1KHz의 샘플레이트 에 16비트 음의 깊이를 가진 오디오 데이터의 크기를 줄이는 것이 주목적이다. 음의 깊이는 서로 다른 소리의 세기로 8비트일 경우에는 256개의 단계를 가지며 16 비트는 65,536가지로 음의 세기를 표현할 수 있다. 샘플레이트는 1초 동안 나타낼 수 있는 음의 표본(샘플)으로 22KHz는 22,000개의 샘플을 1초에 나타낼 수 있다. 예를 들어 650MB에 해당하는 오디오 데이터가 있을 경우, 크기를 줄일 수 있는 여러 가지 방법이 있다. 가장 고전적인 방법은 여기에 포함된 정보를 줄이는 것이다. 이 데 이터가 16비트로 구성됐을 경우 8비트로 줄이면 데이터는 반으로 줄어들게 된다. 이 경우 역동적인 음을 잃게 되며 잡음이 생긴다. 만일 샘플레이트를 감소시키면 음의 선 명도가 떨어진다. MPEG을 이용할 경우에는 파일 크기는 감소하지만 디지털화된 정보의 양은 그대로이다. 이것은 아주 간단해 보이는 공식이지만 MPEG의 장점을 가장 잘 표현한 것이다. 사람들은 흔히 감소(Reduction)와 압축(Compression)을 혼동한다. 하지만 사용자들은 데이터가 감소된 음악은 원하지 않는다. 만일 사용자가 차를 샀을 경우 움직이기를 바란다. 이것은 가장 기본적인 기능으로 자 동차가 많은 양의 기름을 사용할 경우에는 적은 양의 기름보다 훨씬 강력한 파워를 발 휘한다. 하지만 적은 양의 기름을 사용했더라도 자동차는 움직인다. 적은 양의 기름을 사용하는 자동차라 해도 연소율이 높다면 강력한 파워를 가질 수 있다. 이와 마찬가지 로 MPEG의 경우 작은 크기의 파일이라 해도 여기에 많은 양의 데이터를 담을 수 있다. MPEG의 경우 오디오나 비디오 데이터를 저장하는 데 사용하는데 영상이나 음성에 관 련된 재생을 보다 효율적으로 수행한다. 8시간 분량의 오디오 데이터를 MPEG 방식으 로 압축하면 원음과 동일한 음질로 CD-ROM 1장에 담을 수 있다.
MPEG 오디오 작동원리
MPEG 오디오가 어떤 식으로 정보를 재생하는가는 별로 중요하지 않다. MPEG 오디오는 기본적으로 인간의 인지능력에 기반을 두고 있다. 따라서 인코더는 어떤 정보가 중요 하며 어떤 정보는 빼버릴지를 결정한다. 우리가 어떤 소리를 들을 때 입력된 데이터는 우리의 두뇌를 통해 분석한다. 두뇌는 입력된 소리를 해석하며 부적절한 정보를 여과해 낸다. MPEG 오디오는 이러한 작업을 미리 수행해 버린다. 이것을 ‘인지 코딩(Perceptual Coding)’이라고 부른다. 좀더 기술적으로 설명하면 강한 신호가 발생했을 때 뒤에 있는 약한 신호는 인식하기 힘들다. MPEG 오디오의 코덱은 이런 약한 신호를 제거한다. 이것은 매우 현명한 방법으로 MPEG 오디오를 이용하면 우리의 두뇌에 들어 있는 필터 가 필요없는 정보를 제거할 필요가 없으며 하드디스크 공간이나 인터넷 트래픽을 훨씬 덜 발생시킨다. 만일 사용자가 매우 강한 압축률로 인코딩한다면 MPEG 오디오는 덜 중요한 정보까지 모두 제거해버려 음질이 약간 떨어지지만, 낮은 압축률(192 kbs 이하)을 이용하면 사 용자는 압축하지 않은 원음과 차이를 거의 느끼지 못한다.
MPEG 사용 이유
새로운 기술을 산업에 적용시키는 이유는 무척 간단하다. 같은 수준의 성능에서 가격 경쟁력이 생기기 때문이다. 다음 리스트는 현재 MPEG 오디오 기술이 적용된 곳이다.
◎ 인터넷에서 이용되는 스트리밍 오디오 (매크로미디어 SWA, 오디오액티브)
◎ 디지털 오디오 브로드캐스팅 (Digital Audio Broadcasting - DAB, ADR)
◎ 필립스 DDC
MPEG 오디오는 디지털 미디어 저장장치를 매우 싼값에 소비자에게 제공해준다. 간단한 예로 CD-ROM 드라이브를 이용해 오디오 데이터를 하드디스크 드라이브로 추출한 뒤 MPEG 오디오 방식으로 압축하면 최소 공간을 이용해 주크박스를 제작할 수 있다.
MPEG 오디오 파일(MP3)의 구성
흔히들 사용하는 MP3 파일은 헤더와 CRC, 오디오 데이터, 보조데이터로 구성된다. 헤 더는 32비트의 고정된 필드에 위치하는데 여기에는 레이어와 샘플링 주파수, 남아 있 는 프레임과 같은 정보를 담고 있다. CRC(Error Detection Code)는 선택사항으로 이것의 유무는 헤더에서 정의되며 길이는 16비트이다. 하지만 디지털 오디오 하드디스크 레코딩 시스템에는 사용되지 않는다. 오디오 데이터는 실제로 압축된 데이터를 담고 있는데, 그 길이는 음악에 따라 다르다. 보조 데이터는 사용자가 정의한 구역으로 여기에는 추가적인 정보가 들어가며 크기도 변동적이다.
MP3의 발전
MP3는 MPEG의 발전과 함께 시작됐다. MPEG 오디오 표준은 바이너리 데이터 표준과 디 코딩 전송 방식을 기술하고 있다. 91년 ISO/MPEG 오디오 압축 알고리즘은 업계 표준 으로 정착됐다. 이 표준은 CCETT(Centre Commund’Etudes de Telecommunications et de Telediffusion), 프랑스의 IRT, 독일 그리고 네덜란드의 필립스가 개발했다. MPEG 오디오 표준은 비트 스트림 신택스나 디코더 규격을 정의하고 있다. 이것은 공개 된 아키텍처이기 때문에 지속적으로 성능을 향상시킬 수 있으며 규격을 만족시키는 프 로그램을 쉽게 개발할 수 있다. 이러한 유연성 때문에 MPEG에 기반을 둔 오디오 시스 템은 심리음성학을 이용한 최신 기술을 대부분 사용할 수 있다. 한편으로 디코딩 방식 은 거의 동일하지만 인코딩 방식을 업체에 따라 약간씩 다르다. MPEG 오디오 표준에서는 프레임을 시리얼포트를 통한 바이너리 데이터의 송수신으로 표현한다. 따라서 서로 다른 제조업체에서 만든 시스템이라 해도 MPEG 오디오 파일을 디코딩해서 읽을 수 있다.
MP3의 기술 배경
간단한 오디오 압축 방식
전통적인 무손실 압축방식(허프만, LZW 등)은 일반적으로 오디오 압축에서는 제대로 작동되지 않는다. 그 이유는 이미지 압축과 비슷하다. 현재 다음과 같은 다양한 방식 의 압축알고리즘이 사용되고 있다.
◎ 무음압축(Silence Compression) - 무음부분을 찾아내 압축하는 방식으로 런렝쓰 (Run-Length) 코딩 방식과 비슷하다.
◎ ADPCM(Adaptive Differential Pulse Code Modulation) - CCITT G.721 - 16/32 Kbit/sec, 2개의 연속되는 신호의 차이를 기록한다. 이 방식은 애플컴퓨터에 의해 ACE/MACE라는 이름으로 사용됐다. 압축률을 2:1로 다음번 웨이브의 형태를 예측할 수 있다.
◎ 리니어 프리딕티브 코딩(Linear Predictive Coding, LPC) 음성 시그널에 적합한 방 식으로, 마치 컴퓨터가 이야기하는 것과 같은 하우링 현상이 있다. 전송률은 2.5 Kbits/sec 수준이다.
◎ 코드 익사이티드 리니어 프리딕터(Code Excited Linear Predictor, CELP)는 LPC 기 능에 에러 정정 코드를 삽입한 방식으로 오디오 회의 수준의 음성을 들려준다. 전송률 은 4.8 Kbit/sec 정도이다.
심리음성학
인간의 귀는 20Hz에서 20KHz까지 들을 수 있지만 대부분 2KHz에서 4KHz 구간에서 가 장 민감하며 다이내믹 레인지는 대략 96dB(데시벨) 정도이다. 일반적인 음성일 경우 500Hz에서 2KHz 사이며, 모음이나 베이스 영역은 낮은 진동수를 가지며 자음부분은 높은 진동이 발생한다. 또한 강한 신호음을 듣고 그 신호가 멈추어도 그에 대한 여운 이 얼마 동안 남게 된다. 예를 들면 1KHz에 60dB의 진동음에 1.1KHz에 40dB의 신호 를 더한다면 40dB의 신호는 들리지 않는다.
MPEG 오디오 압축
MPEG-1의 경우 1.5Mbits/sec의 오디오와 비디오 전송률을 가지는데 여기서 비디오는 1.2 Mbits/sec이며 오디오는 0.3 Mbits/sec를 전송한다. 실제로 압축되지 않는 CD오 디오는 44,100 샘플/sec x 16비트/샘플 x 2채널로 1.4Mbits/sec보다 많은 데이터이 다. MPEG-1의 압축률을 2.7에서 24배까지이며 6:1(48KHz에 16비트 스테레오 샘플일 경우 256 kbits/sec) 정도의 압축률일때 전문가도 원음과 구별하지 못할 정도의 최적 음질을 구현할 수 있다. MPEG 오디오는 32, 44.1, 48KHz의 샘플링 프리퀀시를 지원한 다. 현재 1개나 2개의 오디오 채널을 통해 4가지 모드를 지원한다.
1. 모노포닉(Monophonic) - 싱글 오디오 채널
2. 듀얼 모토포닉(Dual-monophonic) - 2개의 독립적인 채널
3. 스테레오 - 비트를 나누어 사용하는 스테레오 채널. 조인트 스테레오 코딩을 사용 하지 않는다.
4. 조인트 스테레오 - 스테레오 채널간에 상관관계를 향상시킨 방식
오디오 압축 알고리즘
오디오 암호화 기술에 있어서 가장 기본이 되는 것은 사람의 귀이다. 불행히도 이것은 완벽한 음향기기는 아니지만 우리가 가진 우수한 도구이다. 사람의 귀가 가진 결점 중 에서 일직선으로 연결돼 있지 않고 정확한 소리의 시작점을 찾지 못한다는 것이 장점 으로 활용되고 있디. 소리의 진원지가 어느 수준 이하가 되면 사람은 듣지 못한다. 개인적인 차이는 있지만 대부분 2 ~ 5KHz 사이에서 가장 민감하게 반응한다. 사무실에서 누군가 큰 목소리로 이야기한다면 어느 누가 이야기하는지 쉽게 파악할 수 있다. 하지만 그 순간 비행기가 지나간다면 전혀 들리지 않게 된다. 또한 비행기가 지나간 뒤에도 그 여운이 남아 잘 들리지 않는다. 이와 같은 현상은 ‘Masked’라고 표현한다. 이 효과는 보편적이며 특히 음악에서 적절하게 사용된다. 오케스트라가 악기를 매우 큰소리로 연주한다면 다른 악기소리는 사람의 귀에 들리지 않는다. 하지만 이 음악를 레코딩한다면 모든 악기소리가 적당히 녹음된다. 그 이유는 녹음기기는 모든 음을 동 일하게 받아들이기 때문이다. 만일 녹음된 음악을 재생해도 사람들은 거기에 포함된 작은 악기소리는 듣지 못한다. CD 등을 사용한 이러한 1차적인 기록은 위의 관점에서 본다면 효율적이지 못하다. 하지만 현재 대부분의 음악 데이터에는 실제 듣지 못하는 데이터가 같이 담겨져 있다. 오디오 압축 알고리즘은 이러한 부분의 데이터를 음의 손 상없이 압축하는 것이다. 이를 수행하기 위해서 먼저 인식 서브밴드 오디오 인코더는 지속적으로 들어오는 오디 오 시그널을 분석하고 위에서 설명한 마스킹커브(큰 소리 때문에 사람들의 귀에 들리 지 않는 작은 소리)를 분석한다. 다음은 이상의 과정과 다음 과정을 간단하게 정리한 것이다.
1. Sub-Band 필터링
포선형(Convoluton) 필터를 이용해 오디오시그널(예를 들면 48kHz 사운드)을 대략 32 개의 중요한 주파수 대역으로 나눈다.
2. 심리 음성학 모델
위에서 설명한 심리 음성학을 이용해 나누어진 근처의 주파수대역에서 들리지 않는 대 역을 가려낸다.
3. 심리 음성학 모델을 이용해 결정한 대역 중에서 가장 강하게 들리는 음의 시작이라 면 여기는 인코딩하지 않는다.
4. 잡음이 아닌 신호 데이터로 충분하게 표현될 수 있는 비트수를 결정한다.
MP3 제작
MP3를 제작하기 위해서는 크게 2가지 과정을 거쳐야 한다. 이는 MP3의 소스가 되는 웨이브 파일 추출과 이를 심리 음성학적인 알고리즘을 이용해 압축하는 과정이다. MPEG 표준에 의하면 MPEG 오디오의 데이터 흐름과 디코딩 규격에 대한 정의만 있기 때 문에 MPEG 압축에는 여러 가지 방식이 사용되고 있다. 여기서는 CD를 이용한 WAV 추 출과 MP3 압축에 대해 알아본다.
원본으로부터 WAV 추출
MP3를 제작하기 위해서는 소스로 사용할 음악파일이 있어야 한다. PC에서는 대표적으 로 WAV 파일을 사용한다. 이 파일은 윈도우 보급 이후 PCM 파일의 표준이 될 만큼 널 리 보급됐다. 초기에는 CD 오디오를 사운드카드를 통해 녹음하는 방식을 사용했지만 이 방식에는 많 은 문제점이 뒤따랐다. 디지털로 녹음된 CD를 아날로그 방식으로 변환해야 했기 때문 에 특별히 디지털/아날로그 컨버터를 사용하지 않는 한 잡음이 생긴다. 물론 초기에 발표된 CD의 경우 녹음 방식을 아날로그로 제작한 제품이 많았지만 시간이 흐르면서 모든 제작과정을 디지털로 처리한 DDD 방식이 주류를 이루었다. 이때쯤 개발된 것인 CD에 오디오 데이터 기록방식을 반대로 적용한 CD-DA 추출 방식이다. 실제로 CD에 오 디오를 기록할 경우에 WAV 파일을 CD 오디오 규격에 맞게 레코딩 프로그램으로 CD에 기록한 것이다. 따라서 이 반대 작업을 하면 CD에 들어 있는 오디오 트랙을 파일로 뽑아낼 수 있게 된다. 이런 원리를 이용해 많은 수의 CD 오디오 추출 프로그램이 개발 됐다. 초기의 CD 오디오 추출은 SCSI 방식의 CD-ROM에서만 가능했다. SCSI 방식의 경우 OS 에 의존적이지 않고 대부분의 OS에서 사용할 수 있도록 RAW 데이터 추출 기능을 가지 고 있었다. 즉 섹터 단위로 데이터를 읽는 기능 외에도 RAW 형태로 데이터를 읽어올 수 있었다. 하지만 AT-BUS나 IDE 방식의 경우 도스나 윈도우 95 등의 OS에 상당히 의 존적이기 때문에 RAW 데이터 읽기 기능이 제대로 지원돼지 못했다. 하지만 최근에 발 표되는 제품들은 RAW 형태로 데이터를 읽어 올 수 있다. 따라서 초기에 CD-DA 추출은 SCSI CD-ROM 드라이브에서만 가능했다. 얼마 지나지 않아 IDE 방식에서도 CD-DA가 가능해졌지만 잡음이 많이 생기는 문제점 을 가지고 있었다. 이를 흔히 지터라고 이야기하는데 데이터를 추출하다가 끈기거나 튀는 현상을 이야기한다. 지터율을 전체 데이터에서 지터현상 때문에 조정해주는 비율 을 말한다. 초기에 생산된 IDE 2배속이나 4배속 제품의 경우 지터율이 너무 높아 WAV 를 추출해도 사용할 수 없을 정도였다. 하지만 8배속 이상에서부터는 제조업체들이 이 부분에 신경쓰면서부터 16배속에서는 SCSI 방식과 별로 차이가 없어졌다. 추출 속 도도 CD-ROM 속도 만큼 향상돼 1배속일 경우 오디오 트랙이 길이(초)만큼 시간이 많 이 걸렸지만 빠른 CD-ROM을 사용하면 순식간이다. 하지만 여전히 고품질의 WAV 추출 을 위해서는 신뢰성 있는 SCSI 방식이 사용되고 있다.
WAV 추출 프로그램
CD로부터 WAV를 추출하는 프로그램으로는 여러 가지가 있지만, 여기서는 대표적으로 많이 사용되는 4가지 프로그램을 살펴본다. 일부 IDE CD-ROM에서는 WAV 추출이 제대 로 안되는 경우가 있으므로 유의하기 바란다.
CDDA 32 0.9b
초기에 많이 사용됐던 프로그램으로 도스 인터페이스를 이용하고 있다. 현재 32비트 버전은 ‘CDDA 32 0.9b’ 버전까지 개발됐으며 3월로 부록 CD에 포함된 프로그램은 셰어웨어이다. 기본적으로 SCSI CD-ROM과 IDE CD-ROM을 지원하며 설치가 무척 복잡한 편이다. 먼저 압축 프로그램을 하드디스크에 폴더를 만들고 압축을 푼다. 이 파일 중 DECDNET.DLL, ENCDNET.DLL, PNC32301.DLL, PNCRT.DLL, RA3214_4.DLL, RA3228_8.DLL, RA32DNET.DLL을 윈도우의 시스템 디렉토리에 복사한다. 그리고 자신의 시스템이 윈도 우 95이면 MSCDEX95.DLL을 MSCDEX32.DLL로 이름을 바꾼다. 만일 윈도우 NT이면 MSCDEXNT.DLL을 MSCDEX32.DLL로 바꿔야 한다. 이상의 작업이 제대로 이루어지지 않았 다면 CDDA32가 제대로 실행되지 않는다. 위의 설치과정을 모두 끝냈다면 CDDAINIT.EXE를 실행시켜 CDDA32를 초기화시킨다. 그 리고 오디오CD가 들어 있는 CD-ROM으로부터 오디오 트랙을 추출하면 된다. CDDA를 이용해서 WAV와 RA(리얼오디오) 파일을 뽑아낼 수 있다. WAV의 경우 CD에 있 는 오디오트랙을 곧바로 추출하면 되지만 RA는 추출한 파일을 각각의 용도에 맞게 압 축을 해야 한다. RA의 파일 규격은 RA_MODES.EXE를 실행하면 13가지의 압축 모드가 나타난다. 이 중 자신이 필요한 용도를 고른다. 가장 원음에 충실하게 압축을 하려면 7번의 듀얼 ISDN 스테레오 모드를 고르면 재생시 원음과 거의 비슷하다. CDDA는 도스 인터페이스를 사용하기 때문에 사용자가 일일이 명령을 넣어야 하는 불 편함이 있다. 하지만 배치파일을 이용해 일괄작업을 수행할 수 있는 장점 또한 있다. CDDA에서 가장 주의해야 될 부분은 여러 개의 CD-ROM을 사용할 경우 어느 CD-ROM으 로부터 데이터를 읽어올지를 결정하는 부분이다. 이것은 ID라는 명령으로 구분되는데 일반적으로 SCSI 일 경우에는 HA는 0이고 ID는 SCSI 장치의 ID이며 LUN은 0으로 설 정하면 된다. 하지만 IDE CD-ROM이 스컨더리 마스터에 연결됐을 경우 HA는 1이 되며 ID는 0이고 LUN도 0으로 설정하면 된다. 만일 ID에 관해 정확한 번호를 모른다면 CDDA의 샘플명령을 내리면 자동으로 CD-ROM을 검색해 ID를 보여준다. CD-ROM이 1개 뿐이라면 ID에 관련된 항목을 적을 필요가 없다.
DIDO
무척 간단한 인터페이스의 이 프로그램은 소스코드를 공개해 다른 사용자가 이를 이용 해 프로그래밍을 할 수 있는 장점을 가지고 있다. 1개의 실행파일로 구성된 DIDO는 실행시키면 곧바로 CD-ROM을 검색해 오디오 트랙을 화면에 보여준다. 이 중에서 원하 는 트랙을 마우스로 클릭하면 트랙에 대한 정보와 여러 가지 설정 사항을 볼 수 있다. 이 프로그램의 특징이라면 강제적으로 오디오 트랙의 시작과 끝을 정해줄 수 있다. 또 한 추출하는 오디오 트랙의 사양을 정할 수 있다. 한 가지 문제점이라면 여러 개의 CD-ROM 드라이브를 사용할 경우 변경이 안된다. CD-DA 추출 속도는 CD-ROM의 속도에 따라 달라진다.
CD Worx
이 프로그램은 윈도우용 프로그램답게 인터페이스가 일반 프로그램과 비슷하다. 윈도 우 95용과 NT용으로 구분돼 있으며 단순한 CD-DA 기능 외에도 사운드 레코딩 기능까 지 포함하고 있다. 이 프로그램은 상당히 하드웨어에 민감하게 반응하며 RAW 리딩을 제대로 지원하지 않는 CD-ROM에서는 제대로 작동되지 않는다. 또한 내장된 지터 코렉 션 기능으로 가끔씩 끊기거나 튀는 음을 제거할 수 있다. CD Worx의 가장 큰 기능으로는 CD-ROM에 있는 데이터가 무엇이든지 헥사 에디터 형 태로 읽어올 수 있다는 점이다. 또한 도움말 파일에는 방대한 양의 CD-ROM 프로그래밍 인터페이스에 대한 자료가 들어 있기 때문에 프로그래머에게 좋은 자료가 될 것이다. CD Worx의 설치는 inf를 이용해 설치한다. Install.inf에 마우스 커서를 놓고 오른 쪽 버튼을 누르면 설치메뉴가 나온다. 이를 이용해 설치하며 제거는 제어판의 추가삭 제를 사용한다. CD-Worx에서 Raw 파일을 읽어오기 위해서는 먼저 메뉴의 툴항목에서 옵션을 선택해 CD-ROM 드라이브를 지정한다. 물론 CD-ROM 드라이브가 한 개라면 옵션을 지정할 필요 가 없다. 그리고 툴메뉴에서 CD-DA 섹터 읽어오기나 CD-ROM 섹터 읽어오기를 선택한다. CD-Worx 빈 바탕에서 오른쪽 버튼을 눌러 읽어오기를 선택해도 된다. 이때 CD-ROM 섹 터 읽어오기는 섹터의 주소를 알아야만 가능하다. CD-DA 섹터 읽어오기에서 원하는 트 랙을 선택하면 데이터를 윈도우의 메모리로 읽어온다. 표현방식은 헥사코드 방식이기 때문에 프로그래머의 경우 데이터 수정이 쉽다. 이 상태에서 파일 메뉴에서 저장을 선택해 WAV로 저장하는 데 시간이 상당히 걸린다. CD-Worx는 그래픽 인터페이스를 가지고 있지만 다른 프로그램에 비해 1번의 작업을 더 거쳐야 하는 번거로움이 있으며 CD-ROM 특성을 많이 받는 문제점을 가지고 있다. 하지만 보다 전문적으로 WAV 파일을 표현해 주기 때문에 전문 프로그래머에게는 유용 한 프로그램일 것이다.
WinDAC 32
여러 개의 CD-ROM을 기본적으로 지원하는 CD-DA 추출 프로그램이다. 특히 각각의 CD- ROM 드라이브를 복사 모드를 설정할 수 있다. 일반 모드와 섹터 동기화 모드, 버스트 복사 모드의 3가지가 있는데 버스트 복사모드가 가장 빠르게 데이터를 읽어 올 수 있 다. 별도의 설치 프로그램 없이 압축을 푼 후 WinDAC32를 실행하면 된다. 프로그램이 실 행되면 모든 CD-ROM 드라이브를 검색해 오디오CD가 들어 있다면 그 트랙을 화면에 표 시한다. 오디오 트랙 추출은 원하는 트랙에 마우스 커서를 가져간 후 오른쪽 버튼을 눌러 ‘Copy Track’을 선택하거나 메뉴의 Action에서 ‘Copy Track’을 선택해 Wav 파일로 복사한다. ‘Copy Range’의 경우 일정한 구간을 복사하는 것으로 섹터 번호를 정하거나 시간을 정해주면 된다. WinDAC 32의 가장 큰 특징은 압축 루틴을 별도로 지정할 수 있다는 점이다. 다른 CD- DA 프로그램은 일반적인 루틴으로 WAV 파일을 생성하지만 WinDAC는 별도의 압축 루틴 을 사용할 수 있기 때문에 WAV 파일 생성시 곧바로 MPEG 압축을 수행할 수 있다. 특히 Fraunhofer IIS의 ‘MPEG 프로듀서’를 설치하면 윈도우 95용 레이어3 압축 코덱을 설치하기 때문에 CD-DA 추출과 동시에 곧바로 압축을 수행할 수 있다. 펜티엄 프로 200에 플렉스터 4.5배속을 이용해 테스트한 결과 0.6배속 속도로 압축을 수행한다. 현재 윈도우 95에서 사용 가능한 압축 코덱은 ‘마이크로소프트 IME ADPCM 코덱’, ‘마이크로소프트 ADPCM 코덱’, ‘마이크로소프트 GSM 6.10 오디오 코덱’, ‘마이크 로소프트 CCITT G.711 A-Law 및 u-Law 코덱’, ‘DSP 그룹 트루스피치 소프트웨 코 덱’, ‘마이크로소프트 네트워크 오디오 코덱’, ‘마이크로소프트 PCM 컨버터’를 기본으로 제공한다.
WAV 압축 프로그램
앞에서 소개한 CD-DA 프로그램을 이용해 WAV를 추출했다면 MPEG 레이어3 형식으로 압 축을 수행한다. 이것은 단순한 압축이 아니고 심리 음성학에 의해 인지할 수 없는 부 분을 제거하는 방식이다. 압축 알고리즘에 대해서는 1부에서 충분한 설명을 했다. MPEG 표준에서 데이터 흐름과 디코딩에 대한 부분만 정했기 때문에 인코딩에 대한 것 은 각 업체마다 약간씩 다르다. 따라서 다른 인코딩 프로그램을 사용하면 디코딩시 음 질에 약간의 차이가 생긴다.
L3ENC/DEC V2.71
프론호퍼에 의해 개발된 이 프로그램은 거의 대부분의 OS를 지원하기 때문에 가장 널 리 사용된다. 현재 도스용 프로그램만 개발됐지만 윈도우 95나 NT에서도 잘 작동한다. 또한 이 프로그램의 기능을 강화시키는 다양한 셸 프로그램이 개발돼 MP3 압축 프로그 램으로 가장 많이 사용되고 있다. L3ENC와 L3DEC의 2개 프로그램으로 구성되는데 L3ENC는 인코딩 프로그램이며, L3DEC 는 MP3 파일을 다른 PCM 파일로 변환시켜 준다. L3ENC는 기존의 MPEG-1 레이어3와 MPEG-2 레이어3를 모두 지원하며 프론호퍼의 MPEG-2.5로 압축할 수 있다. L3ENC를 이용할 경우 MPEG-1 레이어 3와 MPEG-2 레이어 3의 2가지 형태로 MP3를 제 작할 수 있다. 이 둘의 기본적 차이는 서로 다른 샘플링 주파수를 사용한다는 점이다. MPEG-1 레이어 3는 32, 44.1, 48KHz를 사용하며 MPEG-2 레이어 3는 16, 22.05, 24KHz의 샘플링 주파수를 이용한다. 현재 MPEG-2가 MPEG-1에 비해 더 높음 품질의 사운드를 제공한다. L3ENC는 비트레이트의 스위치(-br)에 따라 자동으로 MPEG-1과 MPEG-2를 선택한다.
MPEG 레이어-3 프로듀서
이 프로그램은 L3ENC의 윈도우 95 버전으로 인터페이스를 비롯해 몇가지 기능이 추가 됐다. 여기에는 L3DEC 기능은 빠져 있다. 현재 이 프로그램은 사용으로 판매되기 때문 에 옵티컴(http://www. opticom.de)을 통해 구입해야 한다. MPEG 레이어3 프로듀서의 기본적인 기능은 WAV 파일을 MP3 파일로 압축하는 기능이다. 압축 옵션은 L3ENC와는 달리 무척 간단하기 때문에 쉽게 사용할 수 있다. 먼저 인풋 소스로 사용할 파일을 결정하고 아웃풋 파일 이름을 주면 된다. 아웃풋은 기본적으로 WAV로 결정된다. MPEG 레이어3 프로듀서는 WAV와 MP3의 3가지 포맷으로 아웃풋 파 일을 만들 수 있다. 이에 대한 자세한 설명은 조금 뒤에 하겠다. 아웃풋 파일에 대한 음질은 3가지로 표현되는데 일반적인 음질, 28.8K 모뎀을 위한 우수 품질, ISDN을 위 한 고품위 모드이다. 이들은 인풋 파일에 따라 달라진다. CD에서 추출한 소스 파일일 경우에는 모든 사양 이 가능하다. 또한 최상위 모드인 128KBit/s에 44.1KHz 까지 가능하다. MPEG 레이어 3에서는 최대 19가지의 인코딩 모드를 지원한다. 인코딩 속도는 CPU의 성능에 따라 다양하게 변한다. 일반적으로 펜티엄쨦펜티엄MMX쨦펜티엄 프로쨦펜티엄 II순이며 이 들간에 차이는 상당히 큰편이다. 특히 펜티엄과 펜티엄 프로의 차이는 상당하다. MPEG 레이어-3 프로듀서의 가장 큰 장점이라면 윈도우 95용 압축 코덱을 지원한다는 것이다. 즉 MP3 파일을 윈도우 95에서 매체 재생기를 통해 플레이할 수 있다. 따라서 MP3 파일의 확장자를 WAV로 바꾸면 다른 프로그램에서 바로 사용히 가능해진다.
CDDA 관련 옵션
/T : 트랙번호
/F : 기록할 파일명. WAV와 RA의 두 가지로 나뉜다.
/ID : 어댑터 관련 정보. HA:ID:LUN 형식으로 기록한다.
/O : 복사방지를 무시한다. 대부분의 오디오CD는 복사방지가 된 상태이다.
/P : 오디오 트랙을 플레이한다.
/Q : 오디오 트랙을 읽기 전에 프로그램을 한번 실행한다.
/V : 메시지를 자세히 표시한다.
/NJC : 지터코렉션을 수행하지 않는다.
/FORMAT RA # : RA 포맷으로 파일을 생성한다. #은 RA의 압축 형태
/FORMAT WAV : WAV로 생성한다.
예제
CDDA32 /T 2 /F LSH1.WAV /O /NJC (2번째 트랙을 LSH1.WAV 파일로 만든다)
CDDA32 /T 4 /F LSH2.RA /O /ID 1:2:0 /FORMAT RA 6 (디바이스 1:2:0의 장치에서 4번 째 트랙은 리얼오디오 타입 중에서 듀얼 ISDN 모노 타입으로 인코딩한다. 파일이름은 LSH2.RA이다.
L3ENC의 옵션들
L3ENC [-switch1 [-switch2 [...]]]
L3ENC를 이용해 다음과 같이 13가지 모드로 데이터를 압축할 수 있다. 13가지 모드 는 이 프로그램의 정식 등록 사용자일 경우만 가능하고 일반사용자는 112 Kbit/s와 56 kbit/s, 16kbit/s로 밖에 압축할 수 없다.
: 소스로 사용할 오디오 데이터 파일을 지정한다. 여기에는 WAV와 같은 raw PCM 오디오 데이터 파일을 지정해주면 된다. RIFF/WAVE는 IBM PC에서 주로 사용 하며, 애플에서는 RIFF, 썬에서는 AU 파일이 주로 사용된다.
: 레이어 3를 지원하는 확장자가 MP3인 파일명을 적어준다. 이 파일은 IS11172-3을 지원하는 MPEG-1이나 IS13818-3을 지원하는 MPEG-2, 매우 낮은 비트레 이트를 가지는 프론호퍼의 MPEG 2.5로 표현된다.
-br : 출력 파일의 비트레이트를 설정한다. 기본적으로 10가지의 비트레이트를 가지 며 기본값은 112000 bit/s이다.
-dm : 다운믹스, 스테레오로 만들어진 인풋 파일을 모노로 낮춘다.
-hq : 하이퀄리티. 이 옵션은 인코더가 고품질 오디오 모드로 파일을 생성한다. 이 옵 션을 사용하면 인코딩 속도가 떨어진다.
-crc : CRC 체크. ISO/MPEG의 CRC 체크 기능을 사용한다.
-anc <파일이음> <레이트> : 인코딩시 발생하는 비트스트림에서 발생하는 추가적인 정 보를 기록한다. 레이트는 비트/프레임이다.
-sr : 인풋파일이 Raw PCM 파일일 경우 인코더에 샘플링레이트를 알려준다. WAV나 SND, AIFF 파일은 이 옵션이 필요없다.
-tfs : 인풋파일이 Raw PCM일 경우 프로세싱하기 전에 각각의 16비트를 인풋 샘플로 대체한다. WAV나 SND, AIFF 파일은 이 옵션이 필요없다.
-tfc : 인풋파일이 Raw PCM일 경우 채널의 개수를 알려준다. 1일 경우 모노, 2일 경 우 스테레오이다. WAV나 SND, AIFF 파일은 이 옵션이 필요없다.
-spch : 시그널 타입이 연설(Speech)일 경우 출력을 연설 형태에 최적화시킨다.
L3DEC의 옵션들
L3DEC는 MP3를 다양한 PCM 파일로 만들어주는 디코더이다. 일반 디코더의 경우 MP3 를 플레이하는 수준이지만, 이것을 압축 로직과 반대 로직을 사용해 소스파일로 재생 성한다.
L3DEC [-switch1 [switch2 [...]]]
: 비트스트림 인풋파일. 여기에 사용된 인풋파일은 ISO/IEC IS11172-3이 나 IS13818-3을 지원하는 파일만 가능하다. 디코더는 사용하는 MPEG-1 레이어 3 파일 을 샘플링 주파수나 비트레이트의 변동없이 재생해준다. 또한 MPEG-2 레이어 3의 낮 은 샘플링 주파수도 지원한다. 매우 낮은 비트레이트를 가진 프론호퍼의 MPEG 2.5도 가능하다.
: 오디오 데이터 아웃풋파일. 아웃풋을 사용되는 오디오 데이터는 16비 트의 PCM 데이터이다. 기본 포맷은 raw PCM 데이터로 1개(모노)나 2개(스테레오)의 채널로 구성된다.
-wav : 오디오 데이터 아웃풋으로 마이크로소프트 윈도우에서 사용하는 RIFF/WAV 포맷 을 이용한다.
-snd : 썬이나 넥스트스텝에서 사용하는 SND 포맷으로 파일을 생성한다.
-aiff : 오디오 데이터 파일을 AIFF 포맷으로 만든다.
-aifc : 오디오 데이터 파일을 AIFC 포맷으로 만든다.
-fb : 프레임을 스킵한다. 디코딩이 시작되기 전에 필요한 만큼의 프레임을 지나친다. MPEG-1은 1152개, MPEG-2는 576개의 샘플 데이터를 가진다.
-fn : 지정한 프레임만큼만 디코딩한다.
-sa : 디코딩에 실패한 부분을 다시 검색한다. 일반적으로 디코딩에 실패했을 경우 디 코딩 작업이 멈춘다. 동기화 자료가 틀릴 경우 부분적으로 깨진 비트스트림 파일을 다 시 디코딩할 수 있다.
-h24 : 오디오 데이터 파일을 ascii hex 24비트로 기록한다.
-ign : 에러메시지를 무시한다.
-ff : 다양한 형태의 비트스트림을 허용한다.
-aba, -afh : 사용자가 부가적으로 첨가한 데이터를 디코딩한다.
-sto : PCM 아웃풋 파일은 Stdout으로 저장한다.
-sti : 비트스트림 인풋을 stdin으로 읽는다.
MP3 플레이어
한동안 MP3 플레이어하면 ‘윈플레이 3’를 연상했지만 지금은 대부분 Winamp를 생각 한다. 초기에 프론호프의 강력한 MP3 솔루션으로 윈플레이 3를 사용했지만 훨씬 강력 한 기능의 Winamp가 등장하면서 대부분 프로그램을 옮겼다. 윈플레이는 윈도우 95가 발표된 뒤에도 사용자 지원을 제대로 하지 못해 윈도우 95의 긴 파일을 제대로 지원 하지 못하거나 여러 가지 기능면에서 뒤떨어졌다. 윈엠프는 발표된 지 얼마 되지 않았 지만 화려한 인터페이스와 강력한 기능 덕택에 많은 사용자의 사랑을 받고 있다. 최근 에는 다양한 플러그인들이 개발돼 더욱 많은 사용자를 끌어모으고 있다. 특히 윈플레 이는 셰어웨어였지만 윈엠프는 초기에 프리웨어로 배포했으며 셰어웨어로 바뀐 지금에 도 기능제한은 없다.
Winplay 3
프론호프의 다양한 OS별 MP3 플레이어 중에서 윈도우용으로 개발된 것이다 현재 V2.3 베타 5까지 발표됐다. 윈플레이는 단순하게 MP3를 플레이시켜 주는 기능만 가지고 있 다. 화면에서도 보듯이 간단한 테이프플레이어 수준이다. 지원하는 파일은 MP3와 암 호화 기능을 가지는 MMP, 인터넷을 통해 파일을 들을 수 있는 파일리스트인 M3U를 불 러올 수 있다. 특히 인터넷을 이용해 AOD(Audio On Demand) 기능을 강화시켜서 프록시 서버나 URL을 직접 지정할 수 있다. 파일의 경우 멀티로 여러 개를 지정해 순차적으 로 플레이할 수 있으며 반복 기능이 들어 있다. 옵션을 통해 플레이어의 음질을 조정 할 수 있는데 느린 CPU를 사용할 때는 486으로 지정하면 소리의 끊김이 적어진다. MMP의 경우 MP3 파일을 암호화시켜 MMP 제작자가 제공하는 암호를 입력해야만 플레이 가 가능하다. 이것은 상업적인 목적으로 MP3를 이용할 때 반드시 필요하다.
XAudio
X오디오 역시 윈플레이 수준의 MPEG 오디오 파일 재생 기능을 가진다. 이 프로그램 은 MPEG으로 제작된 대부분의 오디오 파일을 플레이 할 수 있다. MPG, MP1, MP2, MP3 를 지원하며 리스트 기능을 제공한다. 현재 플레이어의 베타버전은 0.9a이며 디코더 버전은 0.8a이다. MP3 컨트롤의 경우 볼륨을 비롯한 밸런스, 스테레오, 묵음 기능을 이용할 수 있다. 디렉토리 구조로 플레이되는 파일을 표현할 수 있으며 한글이름을 제 대로 지원한다.아직 베타버전이라 볼륨 컨트롤 부분에 약간의 버그가 있다.
MAplay
윈플레이 형태의 프로그램으로 MPEG 비디오(DAT, MPG 등) 포맷을 비롯한 AVI, MOV 등 을 플레이할 수 있다. 또한 오디오 CD까지 플레이할 수 있는 등 거의 모든 오디오 관 련 장치를 컨트롤할 수 있다. MAplay의 가장 큰 특징이라면 출력되는 아웃풋 파일을 다양한 형태로 출력할 수 있다 는 점이다. 디코딩한 MP3 데이터를 스피커로 출력할 경우엔 웨이브 맵퍼를 선택한다. 만일 다이렉트 사운드를 이용하고 싶다면 다이렉트사운드 5+를 선택하면 된다. MP3를 웨이브 파일로 만들고 싶다면 PCM 아웃풋을 선택해주면 된다. 이 부분에 대한 설정은 스페셜에 옵션 메뉴의 디코더 아웃풋에서 조정한다. 특히 MP3를 WAV 파일으로 출력하 는 기능은 오디오CD 제작시 아주 유용하다.MAply는 486용과 펜티엄용으로 2가지 프로그램이 있다.
Winamp
현재 가장 많은 사용자를 가지고 있는 프로그램으로 그 성능은 통신망에서 프로그램 다운횟수로 쉽게 알 수 있다. 모든 기능을 설명하려면 현재 할당된 지면으로는 턱없이 부족한 실정이다. 윈앰프의 가장 최신버전은 1.73으로 독자가 이 글을 읽을 때 쯤이 면 이미 새로운 버전이 발표됐을 것이다. 신버전이 발표될 때마다 조금씩 향상된 기능 을 보이는데 초기의 1.0에 비해 지금의 1.73은 많은 부분에서 변화가 있다. 윈엠프 프로그램의 인터페이스에서 어느 부분이든지 빈곳이 없을 정도로 곳곳에 다양 한 기능이 숨어 있다. 시간이 날 때 하나씩 눌러보면 사용법을 익히는 것도 재미있을 것이다.윈엠프가 다른 프로그램에 비해 가장 차이가 나는 것은 비주얼한 부분이다. 특히 MP3 플레이시 보여주는 스펙트럼 어널라이저는 단연 압권이다. 스펙트럼 어널라이저 외에 도 오실로 스코프로 보여줄 수 있으며 어널라이저의 모습도 일반형, 불꽃, 라인으로 교체할 수 있다.아웃풋 디바이스도 웨이브파일로 지정할 수 있으며 고품질 모드를 지원해 훨씬 깨끗한 사운드를 즐길 수 있다. 다만 이 기능을 이용하면 CPU 점유율이 높아지는 문제가 있 다. 실제로 윈엠프의 장점이자 단점인 다양한 기능으로 인해 다른 MP3 플레이어에 비 해 CPU 점유율이 높다.윈엠프의 가장 큰 장점 중의 하나라면 외부의 플러그인을 설치할 수 있다는 점이다. 크게 비주얼라이제이션과 사운드 프로세싱 부분인데 비주얼은 스펙트럼 어널라이저 대 신에 다른 플러그인을 사용할 수 있으며 사운드 프로세싱은 이퀄라이저를 대체할 수 있다. 이미 상당수의 플러그인들이 개발됐으며 비주얼라이제이션은 다이렉트3D를 지 원하거나 3DFX를 지원하는 플러그인까지 개발된 상태이다. 화면상의 프로그램 배치에도 많은 신경을 썼다. 단순하게 좌측하단에 등록하는 기능과 아이콘으로 만들어 등록하는 기능, 긴 막대 형태로 배치하는 등 다양하게 화면에 배치 할 수 있다.
거원 젯오디오
국내에서 개발된 멀티미디어 플레이어로 투카우스를 비롯한 셰어웨어 사이트와 CNET 등지에서 최고의 인기를 누리고 있다. 이번에 배포하는 부록 CD자료는 3.1 버전으로 거의 대부분의 멀티미디어 데이터를 플레이할 수 있다. 현재 영어와 한국어 버전으로 나누어 배포되고 있다. 한국어 버전에서는 설명문을 비롯한 모든 메뉴가 한글화됐다. 영문 버전의 경우에도 그래픽 인터페이스이기 때문에 사용시 별다른 문제점이 없다. 프로그램은 전체적으로 오디오데크 형태로 구성됐다. 리모컨 기능과 본체로 나뉘어진 이 프로그램은 약간은 혼란스러운 느낌을 주지만 기능면에서는 위에서 소개한 어떤 프 로그램보다 강력하다. 특히 현재 사용할 수 있는 거의 대부분의 음악관련 파일을 플레 이할 수 있다.동영상의 경우에도 단순히 AVI나 MOV 외에도 비디오CD 파일과 리얼비디오와 같이 최 근 인터넷상에서 사용되는 파일까지 그 범위가 다양하다. 프로그램의 실행은 앨범을 이용해야 한다. 앨범 기능도 한 개씩 파일을 추가한 방법과 한 개의 폴더, 한 개의 폴더와 하위폴더까지 모두 선택할 수 있어 다른 프로그램에 불 편했던 점들을 말끔히 해소했다. 또한 MP3에 대한 정보를 기록하는 ID3 태그를 편집 하는 프로그램까지 포함한다. ID3 태그는 MP3에 대한 추가정보로 노래제목과 가수, 제작년도나 장르까지 표시할 수 있다. 젯오디오에서는 MP3 플레이도 중 이런 정보를 화면하단에 표시해준다. 젯오디오도 그 기능이 너무 다양해 사용자가 하나씩 사용해보고 익히는 것이 중요하다. 특히 커다란 데크지만 리모컨을 이용해 조정할 수 있기 때문에 리모컨 기능을 제대로 활용하면 굳이 데크를 화면위로 꺼내지 않고도 조정이 가능하다.
MP3 인코더/디코더 테스트
현재 다양한 MP3 인코더가 발표돼 사용자들은 혼란스럽게 만들고 있다. 각자가 최고의 기능을 가졌다고 자부하지만 사용자 입장에서는 믿기가 힘들다. 현재 구할 수 있는 프 로그램을 기본으로 몇가지 테스트를 했다.
테스트 PC 스펙
윈도우 95 OSR2
인텔 펜티엄 166MHz
MSD 어드밴스드 TX 메인보드
32MB SDRAM
인코딩 프로그램
인코딩 프로그램의 가장 중요한 부분은 속도이다. 일반적인 펜티엄 시스템의 경우 1 곡당 보통 10분 이상의 시간이 필요하며 심한 경우에는 1시간 까지 걸리는 경우도 있 다. 따라서 인코딩 루틴을 개선해 빠른 시간에 원하는 품질을 만드는 것이 중요하다. 음질 부분에 대한 테스트는 사람에 따라 약간씩 다르게 느끼기 때문에 속도 테스트만 수행했다.
MP3 Producer (http://www.opticom.de)
Wav2MP3 (http://denial.frontnet.pp.se)
MP3 Compressor (http://holdman.com/mp3hc)
L3-ENC (http://iis.fhg.de)
Mpeg Encoder (http://users.bart.nl/~soloh/)
Xing 2.1 (http://www.xingtech.com)
MPlifier (http://www.tu-harburg.de/~sehs2010)
디코딩 프로그램
디코딩 방식은 MPEG 표준에 명시됐기 때문에 인코딩 방식과는 다르게 모든 프로그램들 이 동일한 디코딩 방식을 사용한다. 디코딩 프로그램에서 중요시 할 부분은 기능과 CPU 점유율이다. 기능은 사용자의 편의성을 얼마나 고려했는지 살펴봐야 한다. CPU 점 유율은 MP3를 플레이할 때 얼마나 적은 양의 CPU를 점유하는가이다. MP3 플레이는 다 른 응용프로그램과는 다르게 지속적으로 CPU를 사용해야 하기 때문에 CPU 점유율이 낮은 프로그램이 시스템 속도 향상에 도움을 준다.
WinPlay3 (http://www.iis.fhg.de/audio)
AudioActive (http://www.audioactive.com)
WinAMP (http://www.winamp.com)
MaPlay (http://www-inst.eeec.berkeley.edu/~ctsay/)
MuseArc (http://www.uni-karlsruhe.de/~ukly)
Xaudio (http://www.mpeg.org/xaudio/)
NAD (http://nad.inept.org)
젯오디오 (http://www.cowon.com)
Unreal Player (http://www.303tek.com/products/unrealplayer/)
MP3 파일을 오디오 CD로 만드는 법
MP3 파일을 CD에 기록하는 방법은 2가지로 나눌 수 있다. MP3 파일 그대로 CD에 담 는 방법이 있는데 과거 몇 개의 동호회에서 MP3를 비롯해 다양한 동영상 파일을 담아 준 적이 있다. 여기에는 650MB의 데이터가 들어 가기 때문에 1곡당 5MB정도로 계산 해도 130곡이 포함된다. 이를 시간으로 환산하면 9시간 분량의 CD음질의 데이터가 포함된다. 하지만 MP3로 담을 경우에는 반드시 컴퓨터를 이용해야 플레이 시킬 수 있 는 단점이 있다. 이를 개선할 수 있는 것이 MP3를 CD오디오 규격에 맞추어 기록하는 방법이다. 즉 MP3를 WAV로 변환한 뒤 윈온CD나 이지CD와 같은 레코딩 프로그램을 이용해 오디오CD로 제작한다.먼저 MP3를 WAV 파일로 변환하는 작업을 수행한다. 이를 위해서 앞에서 설명한 먼저 L3DEC나 Windac, 윈앰프 등을 이용해 MP3를 WAV로 변환한다. 여기에는 CPU 성능에 따라 상당한 시간이 소요된다. 이상의 작업이 모두 끝나면 웨이브 파일을 레코딩 소프 트웨어를 이용해 CD에 기록한다. CD 타입을 오디오로 설정하고 웨이브 파일을 끌어다 레코딩 소프트웨어에 떨어뜨린 뒤 레코딩을 하면 우리가 흔히 사용하는 오디오CD가 된다. 여기서 주의할 점은 반드시 'Close CD'를 선택해야 하며, 되도록 1배속을 이용 해 데이터를 기록하는 것이 좋다. 대부분의 CD 플레이어가 1배속으로 작동하기 때문 에 2배속이나 4배속으로 기록하면 CD가 튀는 현상이 발생한다. 레코딩에 사용할 CD 미디어도 되도록 필립스를 많이 권한다. 그 이유는 다른 회사 제품에 비해 제품이 전 체적으로 안정됐기 때문에 CD 플레이어에서 인식하지 못하는 문제점이 거의 없다