通常、音声を MP3 へ変換するには 2 段階の工程があります。まず音声を WAV フォーマットで録音し、その後 WAV ファイルを MP3 へ変換します。 ひとつのプログラムで両方の処理ができるものもあります。
CD あるいは 直接の音声入力からなど、どのフォーマットから音声をエンコー ドするのかによって、WAV ファイルを作成するために必要となるソフトウェア ツールが決まります。
[ 訳注 : http://www.linux.or.jp/link/media.htmlに関連 するリンクがいくつか載っています。]
音声入力をエンコードしたいのなら、サウンドカードの入力を録音し WAV 形 式で保存するプログラムが必要になります。以下に役に立つソフトウェアを挙 げます(コメントの多くは各アプリケーションの Web ページから頂きました)。
アナログ音声のライン入力からの録音 :
Wavrec は Wavplay の一部として配布され、 ftp://sunsite.unc.edu/pub/Linux/apps/sound/players/ からダウンロードできます。
CD の音声データを WAV フォーマットへ変換することは、CD リッピングとし て知られています :
http://metalab.unc.edu/pub/Linux/apps/sound/cdrom/
インターネット上で「リッパー」として一般に知られている Compact Disc Digital Audio (CDDA) 抽出ツールがあり、Cdparanoia はそのひとつです。こ のアプリケーションは Paranoia ライブラリを用いており、ライブラリが実際 の抽出を行います (Paranoia ライブラリのソースは Cdparanoia と一緒に配 布されています)。Cdparanoia は cdda2wav と同様に、CDROM から音声をデジ タルデータとして直接読み込み、アナログ部分を経ずに WAV や AIFC 形式、 あるいは 16 ビットリニア PCM 形式で記録したりパイプへ渡すなどを行いま す。cdda2wav に比べると、Cdparanoia は非常に低速です。しかし、CD に傷 などがあるために読込みが難しい場合でも、非常に良好なデータを得られます。
http://www.xiph.org/paranoia/index.html
RipEnc は Cdparanoia, cdda2wav, tosha, Bladeenc, 8hz-mp3, l3enc のフロ ントエンドで、ボーンシェルスクリプトです。吸い出す曲の名前を自動的につ けるために、CDDB を利用しています。手動で名前を付けるオプションもあり ます。CD 全体、あるいは特定の曲を吸い出せます。ID3 タグもサポートして います。
http://www.asde.com/~mjparme/index.htm
[訳注 : CDDB には CDDB Inc. と freedb.org の 2 種類があります。 http://www.id3.org/ には ID3 タグの解説が あります。]
RipperX は、GTK を使用した、CD から音声を吸い出して MP3 へエンコードす るプログラムです。Cdparanoia, BladeEnc, XingMp3enc, 8hz-mp3, Lame およ び ISO v2 エンコーダのプラグインがあります。CDDB と ID3 タグもサポート しています。
http://www.digitallabyrinth.com/linux/ripperX/
Grip は GTK ベースの CD プレイヤーであり、CD リッパーと MP3 エンコーダ でもあります。内部に組み込まれた Cdparanoia で CD を吸い出せますし、 (cdda2wav のような)内蔵ではない外部のリッパーも用えます。また、MP3 エ ンコーダのフロントエンドでもあり、CD があれば簡単に MP3 へ変換できます。 CDDB サーバからトラック情報を検索するために、CDDB プロトコルをサポート しています。Grip は DigitalDJ とともに動作し、音楽コレクションの「コン ピュータ化された」統合バージョンを提供します。
[訳注: DigitalDJ は MySQL と連係して ID3 データを蓄積しながら動作 します。]
WAV ファイルを MP3 フォーマットへ変換するためにエンコーダが必要になり ます。
BladeEnc はフリーの MP3 エンコーダです。MpegEnc と同に ISO の圧縮ルー チンをもとにしており、ISO のエンコーダと同等かそれ以上の品質が期待でき ます。MpegEnc との主な違いは外見と速度です。BladeEnc には MpegEnc のよ うな使いやすいインターフェイスがありませんが、3 倍以上高速であり複数の フロントエンド GUI があります。
[ 訳注 : 今となっては、BladeEnc の音質はかなり悪いほうです。音質 は ``Lame'' が優秀で、エンコード速度は「午後のこ〜だ」が高速です。 ]
GNU という名称の偉大な歴史にのっとり、Lame とは ``LAME Ain't an Mp3 Encoder.'' を表しています。Lame は dist10 ISO デモ用ソースへの、GPL に 基づいたパッチになっています。Lame だけでは MP3 を作成できません。Lame 単体ではコンパイルすらできず、動かすためには ISO のソースが必要になり ます。ISO のデモ用ソースは無料で入手できますが、(フリーのエンコーダを 配布することを含み) 商用利用には FhG (ドイツの Fraunhofer Gesellschaft 社)とライセンス契約を結ぶ必要があるでしょう。
「午後のこ〜だ」はインテル x86 CPU 用の非常に高速な MP3 エンコーダです。 LAME ver 3.29beta をもとにしており、PEN@海猫さん、酒居さん、うるりさん、 計さん、滋生さんが最適化を行いました( http://www.web-sites.co.uk/nasm/ にある NASM もダウンロードして コンパイルする必要があります)。
MP3 を再生するには当然プレイヤーが必要です :
このプレイヤーは Windows 95/98/NT での Winamp の大部分の特長を持ってい ます。もちろん、Linux 版でしか使えない特別な機能もあります。
[ 訳注 : X11Amp は登録商標だったので、名前を変更したようです。 外見も音質も美しく、訳者の主観ではこれが最高でしょう。 ]
Xaudio は非常に高速で頑健な、多くのプラットホームで動作するデジタル音 声再生用のソフトウェアです。特に、MPEG オーディオ (MP1, MP2 および MP3) のデコードが対象です。
AlsaPlayer は新しいタイプの PCM 音声プレイヤーです。高度にマルチスレッ ド化してあり、ALSA ライブラリとドライバを使用します。Linux や UNIX の プレイヤーに特有の、非常に面白い特長があります。PCM音声データに由来す る全ての音声メディアをプラグインによって再生できる枠組みの作成を目指し ています。
順方向と逆方向の「両方で」再生速度を制御できる、Linux で最初で唯一 の GPL のプレイヤーです!! MP3 と CD で速度を変えて再生できます:)
http://www.alsa-project.org/~andy/
mpg123 とは何でしょう? 高速でフリーな移植性が高い、UNIX 用の MPEG オー ディオプレイヤーです。MPEG 1.0/2.0 レイヤ 1, 2 とレイヤ 3 (MP3 ファイ ルとして有名です)をサポートしています。Linux, FreeBSD, NetBSD, SunOS, Solaris, IRIX, HP-UX などの様々なプラットホームで動作が確認されていま す。CD と同等の音質 (44 kHz, 16 bit, stereo) で再生するには、Pentium (あるいは高速の 486), SPARCstation10, DEC Alpha などの CPU が必要です。 モノラルあるいは音質が悪い再生(22 kHz や 11 kHz) なら、486 の遅い CPU でも再生できます。
http://dorifer.heim3.tu-clausthal.de/~olli/mpg123/
FreeAmp は拡張性のある、クロスプラットホームのオーディオプレイヤーです。 GPL で非常に高速かつ音質の良い Xing MPEG デコーダを最適化したバージョ ンになります。ユーザが期待している多くの機能や、使いやすいインターフェ イスを提供します。
GQmpeg は MPEG オーディオプレイヤー mpg123 の X のフロントエンドです。 再生リストと複数の再生オプションをサポートしています。GQmpeg で MPEG オーディオ再生するためには、mpg123 バージョン .59o が必要になります。
http://www.geocities.com/SiliconValley/Haven/5235/mpeg-index.html
ストリーミングサーバはイントラネットあるいはインターネットなどのネット ワークを経由する MP3 の「放送」を可能にします。
ようこそ! Icecast は linuxpower.org チームが提供する、MPEG レイヤ 3 オー ディオの放送システムです。Icecast には iceplay と icedir が入っていま す。iceplay はエンコード済みのファイルを Icecast サーバへ送る、再生リ ストの配布プログラムです。
Fluid ストリーミングサーバはネットワークを経由してストリーミングを行う プログラムで、現在は MP3 形式を使用しています。
http://www.subside.com/fluid/ (old site) http://fluid.sourceforge.net/ (new site)
音量の正規化
生音声や古い CD からエンコードすると、音量がばらついていることに気付 くかもしれません。
エンコード後の MP3 の音量を変更するには、Wavnorm を使用して音量の正規 化を行う必要があります。
http://www.zog.net.au/computers/wavnorm/
[訳注 : 正規化とは、ばらついている各音源の最大音量を、 すべての音源について同じ音量にすることです。]
sox はとても使いやすい音声変換ツールです。手に入れることをお勧めします。 Wavnorm を使うのなら必要になります。
ftp://sunsite.unc.edu/pub/Linux/apps/sound/convert/
ミキサープログラムも必要になるかも知れません。 Xmixer は良く働き、多くのディストリビューションに含まれています。
[ 訳注 : Xmms ならミキサーも付いています。 Gnome には gmix が、 KDE には kmix が付属しています。 ]