Analogové audiovizuální (AV) vybavení v minulosti využívalo jednosměrné, jednoúčelové a dvoubodové (point-to-point) spojení. Tyto vlastnosti si zachovaly dokonce i digitální AV standardy jako S/PDIF pro přenos digitálně kódovaného zvukového signálu nebo sériové digitální rozhraní (SDI) pro přenos videosignálu. Především u profesionálních a high-endových aplikací má tento model zapojení za následek obrovské a nepřehledné množství kabelů.
Pokusy o řešení tohoto problému se spoléhaly na „vícebodové“ topologie sítí (jako v případě IEEE 1394 (FireWire) a adaptaci technologií (jako jsou „Audio over Ethernet“ a „Audio over IP“) pro standardní počítačové sítě s ethernetovými přepínači.
Výrobci profesionálních, domácích a automobilových AV řešení začali bohužel využívat specializované protokoly, které spolu navzájem nespolupracovaly a nespolupracovaly ani se standardními IT protokoly. Standardní počítačové sítě navíc neposkytují stabilní úroveň kvality, která by zajišťovala přesné mechanismy časování a předvídatelnou či alespoň omezenou latenci.
AVB sítě překonávají tato omezení tím, že přenášejí více audiovizuálních toků přes standardní ethernetové přepínače (tj. MAC mosty) připojené v tzv. hierarchické topologii stromu. AVB zahrnuje protokoly na úrovni vrstvy 2 tak, aby bylo možné zajistit šířku přenosu a prioritizaci síťového provozu. Tím je pro každý tok garantována přesná synchronizace a nízká latence.
Precizní synchronizace několika AV toků je důležitá pro přesný souběh (v čase) videa a přidruženého audia, pro udržení většího počtu digitálně připojených reproduktorů ve fázi (profesionální prostředí vyžaduje přesnost na 1 mikrosekundu), a také proto, aby nedošlo ke zpožděnému doběhu paketů, který by měl za následek přeskakování video snímků (frame dropping) nebo nežádoucí chyby v audio signálu, jako jsou „lupance“ nebo ticho. I to nejhorší možné zpoždění, včetně ukládání do vyrovnávací paměti zdroje a cíle, by mělo být nízké a předvídatelné: Zpoždění uživatelského rozhraní by mělo být okolo 50 ms, aby uživatel vnímal reakci na stisknutí tlačítka jako okamžitou. V případě živého vystoupení nebo práce ve studiu by mělo jít o 2 ms.