Az MPEG–1/2 Layer 2-es kódolás fejlesztése a Fraunhofer Intézet Digitális hangátviteli projektjének (DAB) keretében indult. Ezt a projektet az EU finanszírozta az EUREKA kutatási program keretében, mely leginkább EU–147 néven ismert.
Az EU–147 1987-től 1994-ig tartott. 1991-ben két javaslat került ki: Musicam (azaz a Layer II) illetve az ASPEC (amely az MP3-hoz hasonló). Ezek közül a Musicamet vitték tovább az egyszerűsége és hibarezisztenciájának köszönhetően.
Karlheinz Brandenburg, Jürgen Herre valamint munkacsoportjuk a Musicamből és az ASPEC-ből valamint saját ötleteiből alkotta meg az MP3-at azzal a céllal, hogy elérjék azt a minőséget 128 kbps-on, amit az MP2 tudott 192 kbps-on.
Mindkét algoritmust 1992-ben fejezték be az MPEG–1 részeként, az MPEG első munkafázisában, amelyik a ISO/IEC 11172–3-as szabványt eredményezte, melyet 1993-ban publikáltak. Az MPEG–2 munkálatai 1994-ben fejeződtek be és az ISO/IEC 13818–3-as szabványt eredményezték, mely 1995-ben jelent meg.
A veszteséges tömörítés hatékonysága alapvetően a bitsűrűségtől függ, azaz a bit mélységtől és a mintavételezési sűrűségtől. Gyakran használják a CD-k paramétereinek megfelelő bitsűrűséget (44,1 kHz és 2×16 bit), máskor a DAT paramétereit (48 kHz, 2×16 bit).
Karlheinz Brandenburg a Suzanne Vega által szerzett Tom’s Diner című CD-t használta az MP3-as tömörítési algoritmus modellezésekor. A választás oka az album tisztasága és egyszerűsége volt, ami könnyen hallhatóvá tette a tömörítés által okozott változásokat a visszajátszások során.
A Fraunhofer Intézet hivatalos honlapja által közzétett tömörítési arányok és adatsűrűségek az MPEG-1 Layer 1, 2 és 3-hoz:
- Layer 1: 384 kbps, 4:1 arány,
- Layer 2: 192–256 kbps, 6:18:1 arány,
- Layer 3: 112–128 kbps, 10:112:1 arány.
Ezek az adatok nem igazán alkalmazhatóak, mivelhogy:
- a minőség nem csak a formátumtól, de a tömörítő által használt pszichoakusztikai modelltől is függ. A Layer 1-es tömörítők egy nagyon egyszerű modellt használnak, ezért a hű hangzás visszaadásához nagyobb bitsűrűség szükséges;
- a Layer 1 384 kbps-on jobb, mint a Layer 2 192–256 kbps-on;
- a Layer 3 112–128 kbps-on rosszabb, mint a Layer 2 192–256 kbps-on.
Reálisabb arányok:
- Layer 1: 384 kbps – kitűnő,
- Layer 2: 256–320 kbps – kitűnő; 224–256 kbps – igen jó; 192–224 kbps – jó; nem ajánlott 160 kbps alatt használni,
- Layer 3: 224–256 kbps – kitűnő; 192–224 kbps – igen jó; 160–192 – jó; nem ajánlott 128 kbps alatt használni.
Az MP3 formátum algoritmusa hibrid-transzformációt alkalmaz, hogy az idő-beosztásos jelet frekvencia-beosztásos jellé alakítsa:
- 32 sávos többfázisú szűrő;
- 36 vagy 12 beosztású MDCT, méretének megválasztása független az alsávtól; és
- redukciós végfeldolgozás
használatával.