Forradalmian új modellünk, amely új értelmet ad az audio szeparáció minőségének. Élvezze a kristálytiszta énekhangot és a precíz hangszerek szeparációját.
A Multi Stem HQ a fejlett Band-Split architektúrán alapul. A hagyományos modellektől eltérően, amelyek a teljes spektrogramot egyetlen képként dolgozzák fel, ez a technológia az audiót több frekvenciasávra osztja.
Ez lehetővé teszi a modell számára, hogy minden frekvenciatartományra külön jellemzőket tanuljon meg – így a basszus mély rezonanciáját a vokál bonyolult harmonikus hangjaitól függetlenül rögzíti. Ennek eredményeként jelentősen csökken a spektrális szivárgás és az artefaktumok.
Ezenkívül az architektúra integrálja a Rotary Position Embeddings (RoPE) technológiát. Ez a matematikai innováció lehetővé teszi a transzformátor számára, hogy a standard abszolút pozícióbeágyazásoknál hatékonyabban megértse az audio jellemzők relatív pozícióját az időben. Ez lehetővé teszi a modell számára, hogy hosszabb zenei frázisok során is megőrizze a koherenciát, biztosítva, hogy az átmeneti hangok, például a dobütések élesek legyenek, a tartott hangok pedig simák.
| Modell | Basszus | Dobok | Inst | Vokálok |
|---|---|---|---|---|
| Többszárú HQ | 10.52 ★ | 13.19 ★ | 19.01 ★ | 12.22 ★ |
| Ének HQ | - | - | 18.21 | 11.53 |
| Hibrid | 8.98 | 10.51 | 14.36 | 8.75 |
* SDR (jel-torzítás arány) dB-ben. Minél magasabb, annál jobb.
Fejlessze munkafolyamatát a jelenleg elérhető leghatékonyabb szeparációs technológiával.
Kezdje el most az elválasztást©2026 VocalRemover. All rights reserved.